Methoden für die klinische Forschung und diagnostische Praxis Markus Pospeschill Rudolf Siegel Methoden für die klinische Forschung und diagnostische Praxis Ein Praxisbuch für die Datenauswertung kleiner Stichproben Markus Pospeschill Rudolf Siegel Fachrichtung Psychologie Saarbrücken Universität des Saarlandes Deutschland Saarbrücken Deutschland Ergänzendes Material finden Sie auf springer.com/978-3-662-54725-0 ISBN 978-3-662-54725-0 ISBN 978-3-662-54726-7 (eBook) https://doi.org/10.1007/978-3-662-54726-7 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland 2018 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht aus- drücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be- rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung: Marion Krämer Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer ist Teil von Springer Nature Die eingetragene Gesellschaft ist Springer-Verlag GmbH Deutschland Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany V Prolog Dieses Buch fokussiert auf verschiedene Zielgruppen bzw. Anwender: Es soll zunächst kli- nisch-diagnostischen und mit Einzelfällen (Patienten, Klienten, Einzelprobanden) arbeitenden Psychologen1 helfen, die angenommene Auswirkung einer Behandlung, Intervention, therapeu- tischen Maßnahme oder eines Trainings mittels empirischer Methoden überprüfen zu können. Darüber hinaus soll es insbesondere Psychologen und andere Humanwissenschaftler generell anleiten und unterstützen, den Effekt eines Treatments oder bestimmter experimenteller Be- dingungen mit einer wissenschaftlichen Methode zu überprüfen. Schließlich soll es dem Psy- chodiagnostiker dienen, bei Anwendung psychometrischer Tests angemessene Rückschlüsse über die Merkmale eines Einzelfalls ziehen und diese korrekt beurteilen zu können. Während für klassische experimentelle Gruppendesigns gut etablierte Prozeduren existieren, um mittels einer Zufallsprozedur Probanden in Kontroll- und Experimentalgruppen aufzuteilen und den Effekt eines Treatments dadurch zu überprüfen, ist dieses Vorgehen im klinisch-diag- nostischen Kontext häufig nicht anwendbar, da eine ausreichende Zahl von Individuen inner- halb spezifischer Merkmalskategorien nicht verfügbar ist. Dabei besteht auch keine Lösung darin, die Merkmale so (breit) zu (re)definieren, dass eine größere Zahl von Individuen zur Grundgesamtheit gezählt werden kann. Dies erhöht einerseits die Fehlervarianz und reduziert andererseits die Teststärke; damit bleiben die Auswirkungen einer Maßnahme (der „Effekt“) häufiger unentdeckt. Somit sind gerade im klinisch-diagnostischen Kontext Designs gefragt, die mit kleinen bis sehr kleinen Stichproben oder Einzelfällen sinnvolle Überprüfungen von Maßnahmen und Interventionen im Sinne statistischer Inferenzen erlauben. Gleiches gilt, wenn exploratorische Fragestellungen oder Veränderungen über die Zeit überprüft werden sollen. Dieses Buch ist daher insbesondere auf hierfür passende Untersuchungspläne ausgerichtet und zeigt anhand von konkreten Beispielen, wie man entsprechende statistische Überprüfungen rechnergestützt mit IBM SPSS Statistics und R durchführen kann; dazu gibt es als Onlinematerial eine entspre- chende Bibliothek mit Auswertungsskripten und Beispieldaten. Neben den klassischen nichtparametrischen Tests für Häufigkeits- oder Rangdaten aus kleineren Stichproben kommen dabei auch Verfahren für Messwerte wie Permutations- und Randomi- sierungstests zur Sprache (. Tab 1). Hier besteht die Besonderheit, dass diese Verfahren auch bei sehr kleinen Stichproben bis hin zu Einzelfällen eingesetzt werden können, um statistische Rückschlüsse aus erhobenen Personendaten zu ziehen, und dies ohne dabei die Voraussetzungen parametrischer Tests erfüllen zu müssen, wie z. B. dass Stichproben per Zufall aus einer definier- ten Grundgesamtheit gezogen wurden. Dabei wird in Vorbereitung solcher statistischen Aus- wertungen auch gezeigt, wie man anhand deskriptiver Maße und grafischer Darstellungen sich einen ersten Eindruck von erzielten Veränderungen verschaffen kann. Ferner wird eingehend in die psychometrische Einzelfalldiagnostik und in die Analyse von Testprofilen eingeführt. Im Unterschied zu den zuvor genannten statistischen Tests dienen hier zumeist Normdaten als 1 Aus Gründen der besseren Lesbarkeit verwenden wir in diesem Buch im Weiteren überwiegend das generi- sche Maskulinum. Dies impliziert immer beide Formen, schließt also die weibliche Form mit ein VI Prolog Vergleich, so dass in diesem Fall sogar einzelne Testwerte für einen Rückschluss ausreichend sein können. Abschließend werden Verfahren vorgestellt, mit denen sich Signifikanzaussagen zu einzelnen statistischen Analysen agglutinieren lassen. Damit ist gemeint, dass Signifikanz- aussagen zu bereits vorliegenden Daten (man spricht hier auch gerne von Sekundäranalysen) so zusammengefasst werden, dass eine statistische Gesamtaussage möglich wird. Zur „Philosophie“ dieses Buches sei noch ein Wort in eigener Sache gestattet: Der mit diesem Buch verbundene methodische Anspruch gründet auf wissenschaftlichen und methodologi- schen Reflexionen, auch professionelles psychologisches Handeln zum Forschungsgegenstand zu erklären. Dazu gehört, dieses Handeln auf wissenschaftlichen Theorien zu gründen und einer empirischen Überprüfbarkeit zuzuführen. Ein solches Vorgehen ist zunehmend auch gesundheitspolitisch gefordert, wenn Maßnahmen der Gesundheitsversorgung im Hinblick auf ihre Effektivität und Kosten legitimiert werden müssen. Schließlich sind es auch ethische Gründe, die für Behandlungen und Interventionen sorgfältige Vorbereitungen, Begründungen für ausgewählte Maßnahmen und empirische Überprüfungen ihrer Wirksamkeit erfordern. Die Autoren danken an dieser Stelle Frau Marion M. Krämer (Senior Editor) für die sofortige Begeisterung für dieses Buch und Frau Stefanie Adam (Projektmanagerin) für die exzellente Betreuung und Unterstützung bei der Erstellung des Manuskripts. Markus Pospeschill und Rudolf Siegel Saarbrücken, Januar 2017 VII Prolog Häufigkeit der Messung Mehrfach Einfach Einfach Zweifach Mehrfach Einfach pro Fall/mehrfach pro Sequenz Einfach Einfach Einfach Einfach Zweifach Mehrfach Einfach e n n n b n n e e e o e e be prob prob prob chpr prob prob Art der Stichpro Einzelfall UnabhängigeStichproben UnabhängigeStichproben Abhängige Stich Abhängige Stich Abhängige Stich UnabhängigeStichproben UnabhängigeStichproben Unabhängige Sti UnabhängigeStichproben Abhängige Stich Abhängige Stich UnabhängigeStichproben Art der Hypothese Veränderungshypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Sequenzhypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Trendhypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese e e Anzahl der Merkmale/Gruppen Ein Merkmal/ein Fall Zwei Gruppen Zwei dichotome Merkmal Zwei dichotome Merkmal Ein dichotomes Merkmal Eine Gruppe Zwei oder mehr Gruppen Zwei Gruppen Mehr als zwei Gruppen Mehr als zwei Gruppen Eine Gruppe Eine Gruppe Zwei oder mehr Gruppen d statistischen Maße Vorausgesetzte Datenqualität Rang- oder metri-sche Daten Kategoriale Daten Kategoriale Daten Häufigkeiten Häufigkeiten Dichotome Daten Rangdaten Rangdaten Rangdaten Rangdaten Rangdaten Rangdaten Metrische Daten ehandelten Tests un Name des Tests/Maßes Non-Overlap-Maße(verschiedene) Binomialtest Chi-Quadrat-Tests(verschiedene) McNemar-Test Cochran-Test Sequenzentest Mediantest Mann-Whitney-U-Test Kruskall-Wallis-Test Jonckheere-Test Vorzeichentest Friedman-Test Permutationstest nach Fisher und Pitman b er all Tab. 1 Übersicht . Kategorie Visuell-deskriptive Verfahren Nichtparametrische Tests: Häufigkeiten Nichtparametrische Tests: Rangdaten Nichtparametrische Tests: Messwerte VIII Prolog g Häufigkeit der Messun Einfach Einfach Zweifach Einfach/zweifach Zweifach Zweifach Zweifach Mehrfach Mehrfach Einfach Einfach Zweifach n n e e n n n n b b n e e e e o o e be prob prob prob prob chpr chpr prob Art der Stichpro UnabhängigeStichproben UnabhängigeStichproben Abhängige Stich Un-/abhängige Stichproben Abhängige Stich Abhängige Stich Abhängige Stich Unabhängige Sti Unabhängige Sti UnabhängigeStichproben UnabhängigeStichproben Abhängige Stich e e e e e e e e es es es es es es es es Art der Hypothese Unterschiedshypothese Unterschiedshypothese Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Zusammenhangshypoth Unterschiedshypothese Unterschiedshypothese Zusammenhangshypoth Anzahl der Merkmale/Gruppen Zwei Gruppen Zwei Gruppen Eine Gruppe Eine/zwei Gruppe(n) Mehrere Gruppen Eine Gruppe Eine Gruppe Zwei Urteiler Mehr als zwei Urteiler Zwei Gruppen Mehr als zwei Gruppen Eine Gruppe Vorausgesetzte Datenqualität Ordinale oder metrische Daten Metrische Daten Kategoriale Daten Kategoriale Daten Kategoriale Daten (Dichotomes und) ordinales Merkmal (Dichotomes und) ordinales Merkmal Dichotomes Merkmal Ordinales Urteil Metrische Daten Metrische Daten Metrische Daten Name des Tests/Maßes Moses-Test KSO-Test Phi-Koeffizient Relatives Risiko Cramers-Index (Biseriales) Spear-mans Rho (Biseriales) Ken-dalls tau Kappa Kendalls W Test für zwei unabhängige Stichproben Test für mehr als zwei unabhängige Stichproben Test auf Korrelation ng s: Tab. 1 Fortsetzu. Kategorie Nichtparametrische Tests: Korrelationen Nichtparametrische Tests: Konkordanzen RandomisierungstestStichproben IX Prolog g Häufigkeit der Messun Mehrfach Mehrfach Mehrfach Einfach Einfach Einfach Zweifach Mehrfach Einfach Einfach Einfach probe paare Art der Stich Einzelfall Einzelfall Einzelfall Einzelfall Einzelfall/Fall Einzelfall Einzelfall Einzelfall Stichprobe Stichprobe Stichprobe Art der Hypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese Unterschiedshypothese (Normvergleich) Unterschiedshypothese (Normvergleich) Unterschiedshypothese Unterschieds-/Veränderungshypothese Anzahl der Merkmale/Gruppen Zwei Phasen Zwei Phasen, eine wiederkehrend Zwei Phasen, beide wiederkehrend Eine Person Eine Person/mehrere Personen Eine Person Eine Person Eine Person Mehrere Fälle Mehrere Fälle Mehrere Fälle Vorausgesetzte Datenqualität Metrische Daten Metrische Daten Metrische Daten Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test Testwerte/Güte-maße zum Test/Referenzwerte Anzahl Signifikanzen Anzahl p-Werte Anzahl p-Werte Name des Tests/Maßes Test für AB-Design Test für ABA-Design Test für ABAB-Design Konfidenzintervall Kritische Differenz Diagnostische Valenz Reliable Change Index Testprofile(verschiedene) Bestimmung von Signifikanzen Bestimmung von Einzelwahrschein-lichkeiten Bestimmung von z-Werten ng s: he setzu gstest ostisc on ort un gn n v Tab. 1 F. Kategorie RandomisierEinzelfall Einzelfall-diaPrüfung AgglutinatioEinzeltests XI Inhaltsverzeichnis 1 Konzepte methodischer Analysen ..................................................1 1.1 Problematik von Einzelfallstudien ......................................................2 1.1.1 Validität und Randomisierung ............................................................ 2 1.1.2 Wahl des statistischen Tests .............................................................. 4 1.2 Erkenntnistheoretische Überlegungen .................................................4 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2 Designs für Einzelfälle und kleine Stichproben ...................................7 2.1 Untersuchungsformen .................................................................8 2.1.1 Interventionsstudien ....................................................................8 2.1.2 Diagnostische Untersuchungen .......................................................... 9 2.1.3 Fallstudien .............................................................................11 2.1.4 Feststellung der Wirksamkeit einer Intervention ..........................................13 2.2 Klinisch-diagnostische Designs ........................................................14 2.2.1 Designs ohne Kontrollgruppe ...........................................................14 2.2.2 Kontrollgruppendesigns ................................................................15 2.2.3 Messwiederholungsdesigns .............................................................18 2.2.4 Phasendesigns .........................................................................19 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3 Visuelle Verfahren ..................................................................25 3.1 Visuelle und deskriptive Prüfung ......................................................26 3.2 Non-Overlap-Maße ....................................................................26 3.2.1 PND-Maß (Percentage of Non-overlap Data) .............................................29 3.2.2 PAND-Maß (Percentage of All Non-overlapping Data) .....................................31 3.2.3 PDO2-Maß (Pairwise Data Overlap Squared) ..............................................33 3.2.4 PEM-Maß (Points Exceeding a Median) ...................................................34 3.2.5 PEME-Maß (Points Exceeding a Mean) ...................................................35 3.3 Berechnung von Non-Overlap-Maßen mit R ...........................................37 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4 Nichtparametrische Tests ..........................................................43 4.1 Voraussetzungen der Testanwendung .................................................46 4.2 Effizienz statistischer Tests ............................................................48 4.3 Taxonomie statistischer Verfahren .....................................................49 4.4 Tests für Häufigkeiten .................................................................50 4.4.1 Binomialtest ...........................................................................50 4.4.2 Trendtest ..............................................................................52 4.4.3 Vierfelder-Chi-Quadrat .................................................................53 4.4.4 2×k-Chi-Quadrat .......................................................................55 4.4.5 2×k-Chi-Quadrat mit 2×2-Einzelvergleichen .............................................58