Table Of ContentSpringer-Lehrbuch
Springer-Verlag
Berlin Heidelberg GmbH
J.
Bortz G. A. Lienert
Kurzgefaßte Statistik
für die klinische Forschung
Ein praktischer Leitfaden
für die Analyse kleiner Stichproben
Mit 11 Abbildungen und 90 Tabellen
sowie zahlreichen Formeln
' Springer
Prof. Dr. ]ürgen Bortz
Fachbereich 11 - Institut für Psychologie der TU Berlin
Franklinstraße 28/29, 10587 Berlin
Prof. Dr. Dr. Dr. h.c. mult. Gustav A. Lienert (Emeritus)
Erziehungswissenschaftliche Fakultät
der Universität Erlangen-Nürnberg
Regensburger Straße 160, 90478 Nürnberg
bis 1974 Medizinische Fakultät der Universität Düsseldorf
Die Deutsche Bibliothek-CIP-Einheitsaufnahme
Kurzgefaßte Statistik für die klinische Forschung: Ein praktischer Leitfaden für die
Analyse kleiner Stichproben/Jürgen Bortz u. Gustav A. Lienert.
ISBN 978-3-662-22079-5 ISBN 978-3-662-22078-8 (eBook)
DOI 10.1007/978-3-662-22078-8
Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbeson
dere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildun
gen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf
anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei
nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder
von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Be
stimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. Septem
ber 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungs
pflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechts
gesetzes.
©Springer-Verlag Berlin Heidelberg 1998
Ursprünglich erschienen bei Springer-V erlag Berlin Heidelberg N ew Yo rk 1998
Softcoverreprint ofthe bardeover 1st edition 1998
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in die
sem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß
solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu
betrachten wären und daher von jedermann benutzt werden dürften.
Umschlaggestaltung: de'blik, Berlin
Umschlagabbildung: Reinhold Löffler, Dinkelsbühl
Herstellung: PRO EDIT GmbH, Heidelberg
Datenkonvertierung: K + V Fotosatz GmbH, Beerfelden
SPIN 10566579 26/3134-5 4 3 2 10 - Gedruckt auf säurefreiem Papier
Vorwort
"Mit welchem statistischen Verfahren kann ich meine Daten aus
werten?" Diese Frage bereitet vielen Diplomanden und Doktoran
den der Medizin und Klinischen Psychologie häufig erhebliche Pro
bleme, deren Lösung oftmals Expertenrat erfordert. Aber auch Ab
solventen eines statistischen Grundkurses können häufig nicht ent
scheiden, ob z. B. ein t-Test eingesetzt werden kann oder ob die un
tersuchte Patientenstichprobe hierfür zu klein ist bzw. den Vertei
lungsanforderungen dieses Tests nicht genügt.
Auswertungsprobleme dieser Art - kleine Stichproben und
Merkmale mit fraglichen Verteilungseigenschaften - sind bei der
Anwendung der in diesem Buch behandelten Verfahren nahezu ir
relevant. Es handelt sich um sog. verteilungsfreie (oder nonparame
trische) Verfahren, die - anders als die "klassischen" oder sog. pa
rametrischen Tests - auch bei kleinen Stichproben und nicht nor
malverteilten Merkmalen eingesetzt werden können. Die Anwen
dung dieser voraussetzungsarmen Verfahren ist denkbar einfach
und in der Regel ohne aufwendiges EDV-Equipment zu bewerkstel
ligen. Einfache Zähloperationen oder Berechnungen, die mühelos
mit einem normalen Taschenrechner erledigt werden können, soll
ten auch mathematisch wenig versierten "Novizen" keine Probleme
bereiten. Zudem enthält das Buch für die meisten verteilungsfreien
Signifikanztests t-Test-analoge Tabellen, die die statistische Hypo
thesenprüfung erheblich erleichtern.
Die "Kurzgefaßte Statistik" hat eine relativ lange Geschichte, die
mit den "Verteilungsfreien Methoden in der Biostatistik" (Lienert,
1962) begann. Die enorme Entwicklung dieser Verfahrensklasse do
kumentiert die 2. Auflage, deren 1. Band (Lienert, 1973) mehr als
doppelt so umfangreich war wie die Erstauflage. Mit dem 2. Band
(Lienert, 1978) war aus den einst handlichen "Verteilungsfreien Me
thoden" ein Mammutwerk von über 2000 Seiten geworden, das ei
nen eigenständigen Tafelband (Lienert, 1975) erforderlich machte
und durch einen Nachtrag mit Hinweisen auf neuere Entwicklun
gen ergänzt wurde (Lienert, 1986). Die ursprüngliche Zielgruppe,
die "Anwender" statistischer Verfahren, waren jedoch zugegebener
maßen mit dieser Informationsflut überfordert, so daß wir be
schlossen, die wichtigsten Verfahren wieder in einem Band zu ver
einen (Bortz, Lienert und Boehnke, 1990). Aber auch dieser 940
Seiten umfassende Band war - so unsere Rückmeldungen aus For
schung und Lehre - letztlich nur für Experten interessant, was
VI Vorwort
schließlich - auch auf Wunsch des Springer-Verlages - zu der nun
vorliegenden Kurzfassung führte.
Die "Kurzgefaßte Statistik" verzichtet - unter Verweis auf Bortz,
Lienert und Boehnke (1990) - fast vollständig auf die mathemati
sche Herleitung der behandelten Verfahren. All diese Testverfahren
werden nach einem einheitlichen Schema vorgestellt: Zunächst wird
kurz erörtert, für welche Art von Fragestellungen das jeweilige Ver
fahren geeignet ist (Zielsetzung). Es folgt eine Beschreibung der
Durchführung des Verfahrens und ein ausführliches Zahlenbeispiel,
in dem Schritt für Schritt - von der Darstellung eines zu überprü
fenden Problems über die Formulierung der Hypothesen bis hin
zur Interpretation der Ergebnisse - die Anwendung des Verfahrens
erklärt wird. Diese leicht nachzuvollziehende, behutsame Erarbei
tung der verteilungsfreien Testverfahren wird - so hoffen wir -
dem anwendungsorientierten Nachwuchswissenschaftler sehr entge
genkommen.
Das Buch vermittelt - auch für autodidaktische Studien - statisti
sche Methoden, die für die klinische Forschung benötigt und für ein
schlägige Publikationen gefordert werden. Es beginnt im 1. Kapitel
mit einer kurzen Darstellung der hypothesenprüfenden Inferenzstati
stik. Die Kapitel 2, 3 und 4 befassen sich mit Verfahren zur Auswer
tung von Häufigkeiten, Rangreihen und Meßwerten und Kapitel 5 be
handelt die Berechnung undüberprüfungvon Zusammenhangsma
ßen (verteilungsfreie Korrelation). Mit Kapitel 6 wird ein gerade
für die klinische Forschung wichtiges Thema aufgegriffen - die
Überprüfung der Übereinstimmung von (Experten-)Urteilen über
Symptome, Diagnosen und die bestmögliche Therapie. Kapitel 7
zeigt, wie man durch Einsatz sequentieller Signifikanztests die Grö
ße der erforderlichen Patientenstichprobe minimieren kann. In Kapi
tel 8 geht es um die verteilungsfreie Analyse von Abfolgen, Zeitreihen
und zeitlichen Verteilungen klinischer Manifestationen, wie Behand
lungswirkungskurven und Anfallsintervallen; das abschließende Ka
pitel9 verweist aufvertiefende Literatur und einige wichtige Neuent
wicklungen im Bereich der verteilungsfreien Statistik. Wichtig ist
noch der Hinweis, daß alle in diesem Buch behandelten Verfahren
samt Indikation am Ende des Buches in einer Überblickstabelle zu
sammengefaßt sind, wodurch die gezielte Suche nach einem pro
blemadäquaten Signifikanztest erleichtert werden soll.
Für fachliche, medizinisch- wie auch statistisch-didaktische Rat
schläge danken wir Herrn Priv.-Doz. Dr. R. Oesterreich, Herrn Dr.
K. Sperber und Herrn K. Leitner. Bei der Überprüfung der Korrek
turabzüge waren Frau D. Bourger, Frau R. Jäger, Herr J. Bretz sowie
Herr K. Weber behilflich und die erforderlichen Schreibarbeiten er
ledigten Frau H. Feige, Frau L. Ottmers (Berlin) sowie Frau
M. Schraft (Nürnberg). Ihnen, sowie Frau Dr. H. Berger und Herrn
K. Schwind, die verlagsseitig die "Kurzgefaßte Statistik" betreuten,
sei ebenfalls herzlich gedankt.
Berlin und Nürnberg, im Januar 1998 ]ürgen Bortz
Gustav A. Lienert
Inhaltsverzeichnis
1 Einführung in die lnferenzstatistik ........... . 1
1.1 Zum Begriff der Wahrscheinlichkeit ............ . 3
1.1.1 Theoretische und empirische Wahrscheinlichkeit .. . 5
1.1.2 Additions- und Multiplikationssatz ............. . 6
1.1.3 Punktwahrscheinlichkeit ..................... . 7
1.1.4 Überschreitungswahrscheinlichkeit ............. . 10
1.1.5 Einseitige und zweiseitige
Überschreitungswahrscheinlichkeit ............. . 12
1.2 Statistische Hypothesenprüfung ............... . 12
1.2.1 Versuchsplanung .......................... . 13
1.2.2 Die statistischen Hypothesen . . . . . . . . . . . . . . . . . . 22
1.2.3 Die Grundstruktur statistischer Hypothesentests .... 26
1.2.4 Exakte und asymptotische Signifikanztests . . . . . . . . 31
1.2.5 Statistische Signifikanz
und klinische Bedeutsamkeit ................. . 39
1.2.6 Verteilungsfreie und parametrische Tests ........ . 46
2 Testmethoden für Häufigkeiten .............. . 51
2.1 Der Vergleich einer beobachteten
Häufigkeitsverteilung von Alternativdaten
mit einer erwarteten Verteilung ............... . 52
2.1.1 Der Binomiahest . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.2 Der Chi-Quadrat-Anpassungstest für Alternativdaten 57
2.2 Eine Stichprobe von Kategorialdaten . . . . . . . . . . . . . 60
2.2.1 Der Multinomialtest . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.2.2 Der Mehrfelder-Chi-Quadrat-Test
( Goodness-of-Fit-Test) ...................... . 64
2.3 Der Vergleich zweier unabhängiger Stichproben
bezüglich eines zweifach gestuften Merkmals ..... . 71
2.3.1 Der Fisher-Yates-Test . . . . . . . . . . . . . . . . . . . . . . . . 72
2.3.2 Der Vierfelder-Chi-Quadrat-Test ............... . 75
2.4 Der Vergleich mehrerer unabhängiger Stichproben
bezüglich eines zwei- oder mehrfach gestuften
Merkmals ................................ . 80
VIII Inhaltsverzeichnis
2.4.1 Der Freeman-Halton-Test . . . . . . . . . . . . . . . . . . . . . 81
2.4.2 Der k x 2-Felder-Chi-Quadrat-Test . . . . . . . . . . . . . . 86
2.4.3 Der k x m-Felder-Chi-Quadrat-Test . . . . . . . . . . . . . . 92
2.4.4 Der Fuchs-Kenett-Ausreißertest (FKA-Test)
als Einfeldertest . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 0
2.5 Der Vergleich abhängiger Stichproben bezüglich
eines zwei- oder mehrfach gestuften Merkmals . . . . . 103
2.5.1 Der Chi-Quadrat-Test von McNemar............. 104
2.5.2 Der Marginalhomogenitätstest von Lehmacher . . . . . 109
2.5.3 Der Symmetrietest von Bowker . . . . . . . . . . . . . . . . . 113
2.5.4 Der Q-Test von Cochran . . . . . . . . . . . . . . . . . . . . . . 117
3 für Rangdat 121
3.1 Der Vergleich zweier unabhängiger Stichproben . . . . 122
3.1.1 Der Mediantest . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.1.2 Der U-Test von Mann-Whitney. . . . . . . . . . . . . . . . . 126
3.1.3 Pretest-Posttest-Pläne für 2 unabhängige
Stichproben (Solomon-Pläne) . . . . . . . . . . . . . . . . . . 136
3.2 Der Vergleich mehrerer unabhängiger
Stichproben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
3.2.1 Die Extension des Mediantests . . . . . . . . . . . . . . . . . 139
3.2.2 Der H-Test von Kruskal & Wallis . . . . . . . . . . . . . . . 142
3.2.3 Der Trendtest von Jonckheere ................. . 149
3.2.4 Pretest-Posttest-Pläne für k unabhängige
Stichproben .............................. . 154
3.3 Der Vergleich zweier abhängiger Stichproben ..... . 158
3.3.1 Der Vorzeichentest ......................... . 160
3.3.2 Der Vorzeichenrangtest von Wilcoxon ........... . 164
3.4 Der Vergleich mehrerer abhängiger Stichproben ... . 172
3.4.1 Die Rangvarianzanalyse von Friedman .......... . 172
3.4.2 Der Trendtest von Page ..................... . 177
3.5 Beurteilung von Verlaufskurven ............... . 181
3.5.1 Der T r Test für den Behandlungs-Kontrollgruppen-
Vergleich ................................ . 181
3.5.2 Der Tz-Test für den Vor-/Nachbehandlungs-
Vergleich ................................ . 185
Testmethoden :e . . . . . . . . . . . . . . . . . 191
4.1 Der Vergleich zweieroder mehrerer Stichproben . . . 192
4.1.1 Fisher-Pitmans-Randomisierungstest
für 2 unabhängige Stichproben . . . . . . . . . . . . . . . . . 192
4.1.2 Fishers Randomisierungstest
für 2 abhängige Stichproben . . . . . . . . . . . . . . . . . . . 195
Inhaltsverzeichnis IX
4.1.3 Mehrstichprobenextensionen . . . . . . . . . . . . . . 19.9 . . .
4.1.4 Der Kolmogoroff-Smirnov-Omnibustest
(KSO-Test) . . . . . . . . . . . . . . . . . . . . . . . . 203. . . . . . . .
4.1.5 Der KSO-Test für "Überlebenskurven" . . . . . . . . . . . 209
4.2 Der Vergleich einer beobachteten Verteilung
von Meßwerten mit einer erwarteten Verteilung . . . . 212
4.2.1 Der Kolmogoroff-Smirnov-Anpassungstest
(KSA-Test) ................................ 213
4.2.2 Der KSA-Test mit Lilliefors-Schranken . . . . . . . . .2 .1 6 .
5 Zusammenhangsmaße und deren Tests . . . . . . 2. 1.9
5.1 Zusammenhangsmaße für Häufigkeitsdaten . . . . . . 2.2 0
5.1.1 Der Phi-Koeffizient . . . . . . . . . . . . . . . . . . . 22.1 . . . . .
5.1.2 Weitere Kennwerte für Vierfeldertafeln . . . . . . . . .2 2. 3.
5.1.3 Cramers Index CI für k x 2- und k x m-Tafeln . . . . .2 29
5.1.4 Der Kontingenzkoeffizient . . . . . . . . . . . . . . . . . . . . 232
5.2 Zusammenhangsmaße für Rangdaten . . . . . . . . . . . . 233
5.2.1 Die Rangkorrelation von Spearman . . . . . . . . . . . . . 234
5.2.2 Die biseriale Rangkorrelation . . . . . . . . . . . . . .2 3. 7 . . .
5.2.3 Die partielle Rangkorrelation . . . . . . . . . . . . . .2 4. 0 . . .
5.2.4 Die multiple Rangkorrelation . . . . . . . . . . . . . .2 4. 3. . .
5.2.5 Die Rangkorrelation von Kendall . . . . . . . . . . . . . 247 . .
5.2.6 Die Zwillingskorrelation von Whitfield . . . . . . . . . . . 259
6 Übereinstimmungsmaße
für subjektive Merkmalsbeurteilungen 265
6.1 Urteilerübereinstimmung bei kategorialen Daten . . . . 266
6.1.1 Der Kappa-Koeffizient von Cohen für 2 Beurteiler . . 267
6.1.2 Der Kappa-Koeffizient von Fleiss
für mehrere Beurteiler . . . . . . . . . . . . . . . . . . .2 7. 0 . . .
6.2 Urteilerübereinstimmung bei Rangdaten . . . . . . . . 2. 76.
6.2.1 Der "weighted kappa"-Koeffizient von Cohen . . . . . 2. 76
6.2.2 Der Konkordanz-Koeffizient von Kendall . . . . . . . . 2. 79
7 Verteilungsfreie Sequentialstatistik . . . . . . . . . 2.8 5. .
7.1 Der sequentielle Binomiahest . . . . . . . . . . . . . . . . . .2 86
7.1.1 Einseitiger Test . . . . . . . . . . . . . . . . . . . . . 2. 8. 7. . . . .
7.1.2 Vorschätzung des Stichprobenumfangs . . . . . . . . . . .2 92
7.2 Der Sequentialtest für die Zufallsmäßigkeit
von Alternativdaten . . . . . . . . . . . . . . . . . . . . . 2.9 .4 . .