Table Of ContentMethoden für die klinische Forschung und diagnostische Praxis
Markus Pospeschill
Rudolf Siegel
Methoden für die
klinische Forschung
und diagnostische
Praxis
Ein Praxisbuch für die Datenauswertung kleiner Stichproben
Markus Pospeschill Rudolf Siegel
Fachrichtung Psychologie Saarbrücken
Universität des Saarlandes Deutschland
Saarbrücken
Deutschland
Ergänzendes Material finden Sie auf springer.com/978-3-662-54725-0
ISBN 978-3-662-54725-0 ISBN 978-3-662-54726-7 (eBook)
https://doi.org/10.1007/978-3-662-54726-7
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;
detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
© Springer-Verlag GmbH Deutschland 2018
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht aus-
drücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das
gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die
Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be-
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürften.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in
diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch
die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des
Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen
und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral.
Planung: Marion Krämer
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier
Springer ist Teil von Springer Nature
Die eingetragene Gesellschaft ist Springer-Verlag GmbH Deutschland
Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
V
Prolog
Dieses Buch fokussiert auf verschiedene Zielgruppen bzw. Anwender: Es soll zunächst kli-
nisch-diagnostischen und mit Einzelfällen (Patienten, Klienten, Einzelprobanden) arbeitenden
Psychologen1 helfen, die angenommene Auswirkung einer Behandlung, Intervention, therapeu-
tischen Maßnahme oder eines Trainings mittels empirischer Methoden überprüfen zu können.
Darüber hinaus soll es insbesondere Psychologen und andere Humanwissenschaftler generell
anleiten und unterstützen, den Effekt eines Treatments oder bestimmter experimenteller Be-
dingungen mit einer wissenschaftlichen Methode zu überprüfen. Schließlich soll es dem Psy-
chodiagnostiker dienen, bei Anwendung psychometrischer Tests angemessene Rückschlüsse
über die Merkmale eines Einzelfalls ziehen und diese korrekt beurteilen zu können.
Während für klassische experimentelle Gruppendesigns gut etablierte Prozeduren existieren,
um mittels einer Zufallsprozedur Probanden in Kontroll- und Experimentalgruppen aufzuteilen
und den Effekt eines Treatments dadurch zu überprüfen, ist dieses Vorgehen im klinisch-diag-
nostischen Kontext häufig nicht anwendbar, da eine ausreichende Zahl von Individuen inner-
halb spezifischer Merkmalskategorien nicht verfügbar ist. Dabei besteht auch keine Lösung
darin, die Merkmale so (breit) zu (re)definieren, dass eine größere Zahl von Individuen zur
Grundgesamtheit gezählt werden kann. Dies erhöht einerseits die Fehlervarianz und reduziert
andererseits die Teststärke; damit bleiben die Auswirkungen einer Maßnahme (der „Effekt“)
häufiger unentdeckt.
Somit sind gerade im klinisch-diagnostischen Kontext Designs gefragt, die mit kleinen bis
sehr kleinen Stichproben oder Einzelfällen sinnvolle Überprüfungen von Maßnahmen und
Interventionen im Sinne statistischer Inferenzen erlauben. Gleiches gilt, wenn exploratorische
Fragestellungen oder Veränderungen über die Zeit überprüft werden sollen. Dieses Buch ist
daher insbesondere auf hierfür passende Untersuchungspläne ausgerichtet und zeigt anhand
von konkreten Beispielen, wie man entsprechende statistische Überprüfungen rechnergestützt
mit IBM SPSS Statistics und R durchführen kann; dazu gibt es als Onlinematerial eine entspre-
chende Bibliothek mit Auswertungsskripten und Beispieldaten.
Neben den klassischen nichtparametrischen Tests für Häufigkeits- oder Rangdaten aus kleineren
Stichproben kommen dabei auch Verfahren für Messwerte wie Permutations- und Randomi-
sierungstests zur Sprache (. Tab 1). Hier besteht die Besonderheit, dass diese Verfahren auch
bei sehr kleinen Stichproben bis hin zu Einzelfällen eingesetzt werden können, um statistische
Rückschlüsse aus erhobenen Personendaten zu ziehen, und dies ohne dabei die Voraussetzungen
parametrischer Tests erfüllen zu müssen, wie z. B. dass Stichproben per Zufall aus einer definier-
ten Grundgesamtheit gezogen wurden. Dabei wird in Vorbereitung solcher statistischen Aus-
wertungen auch gezeigt, wie man anhand deskriptiver Maße und grafischer Darstellungen sich
einen ersten Eindruck von erzielten Veränderungen verschaffen kann. Ferner wird eingehend
in die psychometrische Einzelfalldiagnostik und in die Analyse von Testprofilen eingeführt.
Im Unterschied zu den zuvor genannten statistischen Tests dienen hier zumeist Normdaten als
1 Aus Gründen der besseren Lesbarkeit verwenden wir in diesem Buch im Weiteren überwiegend das generi-
sche Maskulinum. Dies impliziert immer beide Formen, schließt also die weibliche Form mit ein
VI Prolog
Vergleich, so dass in diesem Fall sogar einzelne Testwerte für einen Rückschluss ausreichend
sein können. Abschließend werden Verfahren vorgestellt, mit denen sich Signifikanzaussagen
zu einzelnen statistischen Analysen agglutinieren lassen. Damit ist gemeint, dass Signifikanz-
aussagen zu bereits vorliegenden Daten (man spricht hier auch gerne von Sekundäranalysen)
so zusammengefasst werden, dass eine statistische Gesamtaussage möglich wird.
Zur „Philosophie“ dieses Buches sei noch ein Wort in eigener Sache gestattet: Der mit diesem
Buch verbundene methodische Anspruch gründet auf wissenschaftlichen und methodologi-
schen Reflexionen, auch professionelles psychologisches Handeln zum Forschungsgegenstand
zu erklären. Dazu gehört, dieses Handeln auf wissenschaftlichen Theorien zu gründen und
einer empirischen Überprüfbarkeit zuzuführen. Ein solches Vorgehen ist zunehmend auch
gesundheitspolitisch gefordert, wenn Maßnahmen der Gesundheitsversorgung im Hinblick
auf ihre Effektivität und Kosten legitimiert werden müssen. Schließlich sind es auch ethische
Gründe, die für Behandlungen und Interventionen sorgfältige Vorbereitungen, Begründungen
für ausgewählte Maßnahmen und empirische Überprüfungen ihrer Wirksamkeit erfordern.
Die Autoren danken an dieser Stelle Frau Marion M. Krämer (Senior Editor) für die sofortige
Begeisterung für dieses Buch und Frau Stefanie Adam (Projektmanagerin) für die exzellente
Betreuung und Unterstützung bei der Erstellung des Manuskripts.
Markus Pospeschill und Rudolf Siegel
Saarbrücken, Januar 2017
VII
Prolog
Häufigkeit der Messung Mehrfach Einfach Einfach Zweifach Mehrfach Einfach pro Fall/mehrfach pro Sequenz Einfach Einfach Einfach Einfach Zweifach Mehrfach Einfach
e
n n n b n n
e e e o e e
be prob prob prob chpr prob prob
Art der Stichpro Einzelfall UnabhängigeStichproben UnabhängigeStichproben Abhängige Stich Abhängige Stich Abhängige Stich UnabhängigeStichproben UnabhängigeStichproben Unabhängige Sti UnabhängigeStichproben Abhängige Stich Abhängige Stich UnabhängigeStichproben
Art der Hypothese Veränderungshypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Sequenzhypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Trendhypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese
e e
Anzahl der Merkmale/Gruppen Ein Merkmal/ein Fall Zwei Gruppen Zwei dichotome Merkmal Zwei dichotome Merkmal Ein dichotomes Merkmal Eine Gruppe Zwei oder mehr Gruppen Zwei Gruppen Mehr als zwei Gruppen Mehr als zwei Gruppen Eine Gruppe Eine Gruppe Zwei oder mehr Gruppen
d statistischen Maße Vorausgesetzte Datenqualität Rang- oder metri-sche Daten Kategoriale Daten Kategoriale Daten Häufigkeiten Häufigkeiten Dichotome Daten Rangdaten Rangdaten Rangdaten Rangdaten Rangdaten Rangdaten Metrische Daten
ehandelten Tests un Name des Tests/Maßes Non-Overlap-Maße(verschiedene) Binomialtest Chi-Quadrat-Tests(verschiedene) McNemar-Test Cochran-Test Sequenzentest Mediantest Mann-Whitney-U-Test Kruskall-Wallis-Test Jonckheere-Test Vorzeichentest Friedman-Test Permutationstest nach Fisher und Pitman
b
er
all
Tab. 1 Übersicht . Kategorie Visuell-deskriptive Verfahren Nichtparametrische Tests: Häufigkeiten Nichtparametrische Tests: Rangdaten Nichtparametrische Tests: Messwerte
VIII Prolog
g
Häufigkeit der Messun Einfach Einfach Zweifach Einfach/zweifach Zweifach Zweifach Zweifach Mehrfach Mehrfach Einfach Einfach Zweifach
n n
e e
n n n n b b n
e e e e o o e
be prob prob prob prob chpr chpr prob
Art der Stichpro UnabhängigeStichproben UnabhängigeStichproben Abhängige Stich Un-/abhängige Stichproben Abhängige Stich Abhängige Stich Abhängige Stich Unabhängige Sti Unabhängige Sti UnabhängigeStichproben UnabhängigeStichproben Abhängige Stich
e e e e e e e e
es es es es es es es es
Art der Hypothese Unterschiedshypothese Unterschiedshypothese Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Unterschiedshypothese Unterschiedshypothese Zusammenhangshypoth
Anzahl der Merkmale/Gruppen Zwei Gruppen Zwei Gruppen Eine Gruppe Eine/zwei Gruppe(n) Mehrere Gruppen Eine Gruppe Eine Gruppe Zwei Urteiler Mehr als zwei Urteiler Zwei Gruppen Mehr als zwei Gruppen Eine Gruppe
Vorausgesetzte Datenqualität Ordinale oder metrische Daten Metrische Daten Kategoriale Daten Kategoriale Daten Kategoriale Daten (Dichotomes und) ordinales Merkmal (Dichotomes und) ordinales Merkmal Dichotomes Merkmal Ordinales Urteil Metrische Daten Metrische Daten Metrische Daten
Name des Tests/Maßes Moses-Test KSO-Test Phi-Koeffizient Relatives Risiko Cramers-Index (Biseriales) Spear-mans Rho (Biseriales) Ken-dalls tau Kappa Kendalls W Test für zwei unabhängige Stichproben Test für mehr als zwei unabhängige Stichproben Test auf Korrelation
ng s:
Tab. 1 Fortsetzu. Kategorie Nichtparametrische Tests: Korrelationen Nichtparametrische Tests: Konkordanzen RandomisierungstestStichproben
IX
Prolog
g
Häufigkeit der Messun Mehrfach Mehrfach Mehrfach Einfach Einfach Einfach Zweifach Mehrfach Einfach Einfach Einfach
probe paare
Art der Stich Einzelfall Einzelfall Einzelfall Einzelfall Einzelfall/Fall Einzelfall Einzelfall Einzelfall Stichprobe Stichprobe Stichprobe
Art der Hypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese (Normvergleich) Unterschiedshypothese (Normvergleich) Unterschiedshypothese Unterschieds-/Veränderungshypothese
Anzahl der Merkmale/Gruppen Zwei Phasen Zwei Phasen, eine wiederkehrend Zwei Phasen, beide wiederkehrend Eine Person Eine Person/mehrere Personen Eine Person Eine Person Eine Person Mehrere Fälle Mehrere Fälle Mehrere Fälle
Vorausgesetzte Datenqualität Metrische Daten Metrische Daten Metrische Daten Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test/Referenzwerte Anzahl Signifikanzen Anzahl p-Werte Anzahl p-Werte
Name des Tests/Maßes Test für AB-Design Test für ABA-Design Test für ABAB-Design Konfidenzintervall Kritische Differenz Diagnostische Valenz Reliable Change Index Testprofile(verschiedene) Bestimmung von Signifikanzen Bestimmung von Einzelwahrschein-lichkeiten Bestimmung von z-Werten
ng s: he
setzu gstest ostisc on
ort un gn n v
Tab. 1 F. Kategorie RandomisierEinzelfall Einzelfall-diaPrüfung AgglutinatioEinzeltests
XI
Inhaltsverzeichnis
1 Konzepte methodischer Analysen ..................................................1
1.1 Problematik von Einzelfallstudien ......................................................2
1.1.1 Validität und Randomisierung ............................................................ 2
1.1.2 Wahl des statistischen Tests .............................................................. 4
1.2 Erkenntnistheoretische Überlegungen .................................................4
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Designs für Einzelfälle und kleine Stichproben ...................................7
2.1 Untersuchungsformen .................................................................8
2.1.1 Interventionsstudien ....................................................................8
2.1.2 Diagnostische Untersuchungen .......................................................... 9
2.1.3 Fallstudien .............................................................................11
2.1.4 Feststellung der Wirksamkeit einer Intervention ..........................................13
2.2 Klinisch-diagnostische Designs ........................................................14
2.2.1 Designs ohne Kontrollgruppe ...........................................................14
2.2.2 Kontrollgruppendesigns ................................................................15
2.2.3 Messwiederholungsdesigns .............................................................18
2.2.4 Phasendesigns .........................................................................19
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3 Visuelle Verfahren ..................................................................25
3.1 Visuelle und deskriptive Prüfung ......................................................26
3.2 Non-Overlap-Maße ....................................................................26
3.2.1 PND-Maß (Percentage of Non-overlap Data) .............................................29
3.2.2 PAND-Maß (Percentage of All Non-overlapping Data) .....................................31
3.2.3 PDO2-Maß (Pairwise Data Overlap Squared) ..............................................33
3.2.4 PEM-Maß (Points Exceeding a Median) ...................................................34
3.2.5 PEME-Maß (Points Exceeding a Mean) ...................................................35
3.3 Berechnung von Non-Overlap-Maßen mit R ...........................................37
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4 Nichtparametrische Tests ..........................................................43
4.1 Voraussetzungen der Testanwendung .................................................46
4.2 Effizienz statistischer Tests ............................................................48
4.3 Taxonomie statistischer Verfahren .....................................................49
4.4 Tests für Häufigkeiten .................................................................50
4.4.1 Binomialtest ...........................................................................50
4.4.2 Trendtest ..............................................................................52
4.4.3 Vierfelder-Chi-Quadrat .................................................................53
4.4.4 2×k-Chi-Quadrat .......................................................................55
4.4.5 2×k-Chi-Quadrat mit 2×2-Einzelvergleichen .............................................58