Table Of ContentIrasianty Frost
Statistische Test
verfahren, Signifikanz
und pWerte
Allgemeine Prinzipien verstehen
und Ergebnisse angemessen
interpretieren
essentials
WeitereInformationenzudieserReihefindenSieunter
http://www.springer.com/series/13088
essentials liefern aktuelles Wissen in konzentrierter Form. Die Essenz dessen,
woraufesals„State-of-the-Art“indergegenwärtigenFachdiskussionoderinder
Praxisankommt.essentialsinformierenschnell,unkompliziertundverständlich
• alsEinführungineinaktuellesThemaausIhremFachgebiet
• alsEinstiegineinfürSienochunbekanntesThemenfeld
• alsEinblick,umzumThemamitredenzukönnen
Die Bücher in elektronischer und gedruckter Form bringen das Expertenwissen
von Springer-Fachautoren kompakt zur Darstellung. Sie sind besonders für die
Nutzung als eBook auf Tablet-PCs, eBook-Readern und Smartphones geeignet.
essentials:WissensbausteineausdenWirtschafts,Sozial-undGeisteswissenschaf-
ten, aus Technik und Naturwissenschaften sowie aus Medizin, Psychologie und
Gesundheitsberufen.VonrenommiertenAutorenallerSpringer-Verlagsmarken.
Irasianty Frost
Statistische
Testverfahren,
Signifikanz und p-Werte
Allgemeine Prinzipien verstehen
und Ergebnisse angemessen
interpretieren
IrasiantyFrost
HochschuleFresenius,
München,Deutschland
ISSN:2197-6708 ISSN:2197-6716(electronic)
essentials
ISBN:978-3-658-16257-3 ISBN:978-3-658-16258-0(eBook)
DOI10.1007/978-3-658-16258-0
DieDeutscheNationalbibliothekverzeichnetdiesePublikationinderDeutschenNationalbiblio-
grafie;detailliertebibliografischeDatensindimInternetüberhttp://dnb.d-nb.deabrufbar.
SpringerVS
©SpringerFachmedienWiesbadenGmbH2017
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die
nichtausdrücklichvomUrheberrechtsgesetzzugelassenist,bedarfdervorherigenZustimmung
desVerlags.DasgiltinsbesonderefürVervielfältigungen,Bearbeitungen,Übersetzungen,Mikro-
verfilmungenunddieEinspeicherungundVerarbeitunginelektronischenSystemen.
DieWiedergabevonGebrauchsnamen,Handelsnamen,Warenbezeichnungenusw.indiesemWerk
berechtigtauchohnebesondereKennzeichnungnichtzuderAnnahme,dasssolcheNamenim
SinnederWarenzeichen-undMarkenschutz-Gesetzgebungalsfreizubetrachtenwärenunddaher
vonjedermannbenutztwerdendürften.
DerVerlag,dieAutorenunddieHerausgebergehendavonaus,dassdieAngabenundInformatio-
nenindiesemWerkzumZeitpunktderVeröffentlichungvollständigundkorrektsind.Wederder
Verlag,nochdieAutorenoderdieHerausgeberübernehmen,ausdrücklichoderimplizit,Gewähr
fürdenInhaltdesWerkes,etwaigeFehleroderÄußerungen.
GedrucktaufsäurefreiemundchlorfreigebleichtemPapier
SpringerVSistTeilvonSpringerNature
DieeingetrageneGesellschaftistSpringerFachmedienWiesbadenGmbH
DieAnschriftderGesellschaftist:Abraham-Lincoln-Strasse46,65189Wiesbaden,Germany
Was Sie in diesem essential finden können
• Eine verständliche Beschreibung von Grundprinzipien statistischer Testver-
fahren
• DieBedeutungvonSignifikanzundp-Wert
• Fehler1.und2.Artundwiesiezusammenhängen
V
Inhaltsverzeichnis
1 Einleitung..................................................................... 1
2 Grundmodell ................................................................. 3
3 StatistischeTests ............................................................. 9
4 Beispiel:Student-t-Test...................................................... 13
5 WaseinsignifikantesErgebnisNICHTbedeutet......................... 17
6 Waseinp-Wertaussagt ..................................................... 21
7 AlarmohneFeueroderFeuerohneAlarm ............................... 25
8 StatistischeSignifikanz–inhaltlicheRelevanz ........................... 29
9 Fazit ........................................................................... 31
WasSieausdiesemessentialmitnehmenkönnen............................. 35
Literatur .......................................................................... 37
VII
1
Einleitung
Statistische Methoden für die empirische Forschung sind in vielen wissenschaft-
lichen Bereichen nicht mehr wegzudenken. Zu den meisteingesetzten Verfahren
gehörensicherlichstatistischeTests.DieDurchführungistsehreinfach,dietheo-
retischen (mathematischen und philosophischen) Grundlagen sind dagegen kom-
plex. Deswegen ist es nicht verwunderlich, wenn Missverständnisse entstehen
(siehezumBeispielBeck-BornholdtundDubben2001).
Dieses essential versucht, die wichtigsten Grundpfeiler der klassischen Test-
theorie aufzuzeigen und zu erklären. Dabei wird eher heuristisch vorgegangen.
JedochwerdenLeserhierunddamathematischeFormulierungenfinden.DieAuto-
rinverzichtetnichtganzaufdieseformaleDarstellungsart,damancheSachverhalte
nur dadurch deutlich und vor allem verständlich zum Ausdruck gebracht werden
können.DermathematischeAnspruchgehtjedochnichtüberBasiskenntnissehin-
aus.
Die klassische Testtheorie basiert zum größten Teil auf den Arbeiten von
zwei Mathematikern: J. Neyman (1894–1981) und E. S. Pearson (1895–1980).
DeswegennenntmandieklassischeTesttheorieauchdieTesttheorievonNeyman
undPearson.DieselernenStudierendeinderRegelimRahmender(klassischen)
Inferenzstatistikkennen.
Parallel zu dieser Version existiert eine „Urversion“ des Signifikanztests von
R.A. Fisher (1890–1962), einem sehr vielseitig interessierten und produktiven
Wissenschaftler (sechs Bücher und fast 300 Papers; seine drei Hauptwerke Sta-
tisticalMethodsforResearchWorkers,StatisticalMethodsandScientificInference
und The Design of Experiments wurden noch als ein Band bis in die 1990er-
Jahrenachgedruckt).IndemBuchStatisticalMethodsforResearchWorkers,das
1925 zum ersten Mal erschien, erläutert Fisher seine Idee zum Signifikanztest.
Darin wird nur eine Hypothese, die Nullhypothese, berücksichtigt. Neyman und
©SpringerFachmedienWiesbadenGmbH2017 1
I.Frost,StatistischeTestverfahren,Signifikanzundp-Werte,essentials,
DOI10.1007/978-3-658-16258-0_1
2 1 Einleitung
Pearson ergänzen die Nullhypothese um die Alternativhypothese und führen die
Begriffe Fehler 1. und 2. Art sowie kritischer Bereich (oder Ablehnungsbereich)
ein (Neyman und Pearson 1933). Insbesondere geben sie dem satistischen Test-
verfahren ein mathematisches Fundament. Zu diesem gehört unter anderem das
BeurteilungskriteriumfürdenSchlussvonderBeobachtungaufdieGrundgesamt-
heit. Wie gut das Testverfahren ist, wird daran gemessen, wie oft bei häufiger
AnwendungdesVerfahrensderSchlusszueinerrichtigenAussageführt(vgl.Zu2
imAbschn.3).NeymannenntdiesenSchluss„inductivebehavior“(Neyman1938,
ausdemFranzösischenübersetztvonLehmann(2011,S.56)).
Fisher,derdamitkeineswegseinverstandenist,führtkontroverseDiskussionen
mit Neyman und Pearson, die bis ins Persönliche gehen. Wie vehement ihre
Konfrontation war, lässt sich durch Neymans Paper aus dem Jahr 1961 erahnen:
SilverjubileeofmydisputewithFisher.DiegegenseitigepersönlicheAbneigung
meintmanbisheutenochzuspüren,liestmandieBeiträgevonLehmann(1993,
2011); Lenhard (2006); Louçã (2008) oder Nickerson (2000). Dieser äußerst
ungewöhnlicheDisputbeschäftigtvieleFachleuteüberdieJahrzehntehinwegbis
indieGegenwart.DieBeiträgevonAutorenwiezumBeispielBrigg(2012);Haller
und Krauss (2002); Hubbard und Bayarri (2003); Levine et al. (2008); Meehl
(1967);Rozeboom(1960)belegendies.
Nun zum vorliegenden Buch: Den Auftakt bildet eine kompakte Darstellung
der klassischen Testtheorie, die auf dem Konzept des induktiven Verhaltens von
Neyman und Pearson aufgebaut wird. Um den (Wieder-)Einstieg zu erleichtern,
werden zuvor die Grundbegriffe (Zufallsvariablen, Grundgesamtheit, Zufallss-
tichprobe) sowie die Normalverteilung kurz erläutert. Da die Testprinzipien im
Vordergrundstehen,wirdeinsehreinfachesBeipielzumt-Testgewählt.Miteinem
übersichtlichen Datensatz wird der Test konkret durchgerechnet. Im Anschluss
daran, in den Abschnitten vier und fünf, beschäftigen wir uns mit der Frage,
was ein Testergebnis bedeutet und insbesondere, was es nicht bedeutet. Ein Ver-
gleichdesTestprinzipsmitdemPrinzipeinesgerichtlichenIndizienprozessesgibt
eine heuristische Vorstellung davon, wie das Prinzip funktioniert. Kapitel sechs
demonstriert,wiesichderFehler1.undderFehler2.Artgegenseitigbeeinflussen.
DabeiwirdauchhieraufeinemathematischeAusarbeitungverzichtet.Dieexakte
wahrscheinlichkeitstheoretische Behandlung und eine tiefere Diskussion darüber
findetmanbeispielsweiseinFahrmeiretal.(2011)bzw.Rüger(1996).Dassiebte
KapitelsetztsichmiteinemThemaauseinander,dasinderPraxisfürKonfrontation
sorgt: Ist ein statistisch signifikantes Ergebnis auch inhaltlich relevant (in der
medizinischen Forschung: klinisch relevant)? Den Abschluss bildet ein kurzes
Kapitel über weitere Verfahren, die die Statistik anbieten kann. Eine Auswahl
entsprechenderLiteraturliegtbei.
2
Grundmodell
Zufallsvariable
In der Analysis versteht man unter einer (reellwertigen) Funktion f.˘/ eine Vor-
schrift, die jedem Element einer Menge X in eindeutiger Weise eine reelle Zahl
yDf.x/zuordnet.MannenntxundyVariablenoderVeränderliche,weildiesefür
zweibeliebigereelleZahlenstehenundkeinebestimmten,festenWertedarstellen.
GemäßderVorschriftf.˘/ändertsichdieeineGrößegleichzeitigmitderanderen.
Eine Zufallsvariable ist eine meßbare Funktion von der Ergebnismenge (cid:2)
eines Zufallsexperiments in die reellen Zahlen. Beispiel: Aus einer Klasse mit
beispielsweise 30 Schülern werden zufällig fünf Kinder ausgewählt. Man inte-
ressiert sich für ihre Körpergröße. Die zufällige Auswahl der Kinder stellt das
Zufallsexperiment dar, und die Zufallsvariable X ist die Körpergröße der Kinder.
Nehmenwiran,dassAnna,Max,Gero,EliasundChiaraausgewähltwurden.Wir
schreiben(cid:2)DfAnna,Max,Gero,Elias,ChiaragfürdieMengederausgewählten
Kinder.DieZufallsvariableXisteineAbbildungvon(cid:2)indiereellenZahlen:
X W(cid:2)(cid:2)!R
EinkonkreterWertvonX–inderStatistiknenntmandiesenWerteineRealisation
von X – ist zum Beispiel die Körpergröße von Anna: X.Anna/ D 120cm.
AnnasKörpergrößekanngemessenwerden.IndiesemSinneheißtdieAbbildung
meßbar.Dagegenistesunmöglich,AnnasGefühlszustandzumessen.DieVariable
Gefühlszustand ist nicht meßbar. Eine Zufallsvariable ordnet also jedes Ergebnis
einesZufallsexperimentseinerreellenZahlzu.
Wenn in der Analysis eine Funktion mit f;g;h;::: gekennzeichnet wird, ver-
wendenStatistikergroßelateinischeBuchstabenwieX;Y;Z;:::alsBezeichnung
©SpringerFachmedienWiesbadenGmbH2017 3
I.Frost,StatistischeTestverfahren,Signifikanzundp-Werte,essentials,
DOI10.1007/978-3-658-16258-0_2