ebook img

Datenanalyse mit Mplus: Eine anwendungsorientierte Einführung PDF

287 Pages·7.65 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Datenanalyse mit Mplus: Eine anwendungsorientierte Einführung

Christian Geiser Datenanalyse mit Mplus Christian Geiser Datenanalyse mit Mplus Eine anwendungsorientierte Einführung Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http://dnb.d-nb.de> abrufbar. . . 1. Auflage 2010 Alle Rechte vorbehalten © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2010 Lektorat: Kea S. Brahms VS Verlag für Sozialwissenschaften ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.vs-verlag.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältig ungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinn e der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Druck und buchbinderische Verarbeitung: Ten Brink, Meppel Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in the Netherlands ISBN 978-3-531-16393-2 Inhaltsverzeichnis 5 Inhaltsverzeichnis 50 Vorwort 7 1 Datenaufbereitung in SPSS 11 1.1 Ländereinstellungen 12 1.2 Kodierung fehlender Werte 16 1.3 Abspeichern eines ASCII-Datensatzes für Mplus 21 2 Einlesen von Daten in Mplus 25 2.1 Einlesen von Individualdaten (Rohdaten) 25 2.1.1 Aufbau der basalen Mplus-Syntax und basic-Analyse 26 2.1.2 Mplus-Output zur basic-Analyse 29 2.2 Einlesen von Summary-Daten (Kovarianz- oder Korrelationsmatrizen) 37 3 Lineare Strukturgleichungsmodelle 41 3.1 Was sind lineare Strukturgleichungsmodelle? 41 3.2 Einfache Regressionsanalyse 44 3.3 Regressionsanalyse auf latenter Ebene 55 3.4 Konfirmatorische Faktorenanalyse (CFA) 65 3.4.1 Konfirmatorische Faktorenanalyse 1. Ordnung 65 3.4.2 Konfirmatorische Faktorenanalyse 2. Ordnung 71 3.5 Pfadmodelle und Mediatoranalyse 75 3.5.1 Einführung und manifeste Pfadanalyse 75 3.5.2 Manifeste Pfadanalyse in Mplus 78 3.5.3 Latente Pfadanalyse 85 3.5.4 Latente Pfadanalyse in Mplus 86 4 Strukturgleichungsmodelle der Veränderungsmessung 93 4.1 Latent-State-Analyse 93 4.1.1 LS- versus LST-Modelle 96 4.1.2 Analyse von LS-Modellen in Mplus 96 4.1.3 Modellierung indikatorspezifischer Effekte 99 4.1.4 Überprüfung der Messinvarianz über die Zeit 107 4.2 Latent-State-Trait-Analyse 122 4.3 Autoregressive Modelle 131 4.3.1 Manifeste autoregressive Modelle 132 4.3.2 Latente autoregressive Modelle 138 6 Inhaltsverzeichnis 4.4 Latent-Change-Modelle 151 4.5 Latente Wachstumskurvenmodelle 168 4.5.1 Latente Wachstumskurvenmodelle 1. Ordnung 169 4.5.2 Latente Wachstumskurvenmodelle 2. Ordnung 187 5 Mehrebenenregressionsmodelle 199 5.1 Einführung in die Mehrebenenanalyse 199 5.2 Spezifikation von Mehrebenenmodellen in Mplus 201 5.3 Option twolevel basic 203 5.4 Random-Intercept-Modelle 208 5.4.1 Nullmodell (Intercept-Only-Modell) 208 5.4.2 One-Way-Random-Effects-ANCOVA 212 5.4.3 Means-as-Outcomes-Modell 217 5.5 Random-Intercept-and-Slope-Modelle 222 5.5.1 Random-Coefficient-Regressionsanalyse 223 5.5.2 Intercepts-and-Slopes-as-Outcomes-Modell 227 6 Latent-Class-Analyse 235 6.1 Einführung in die Latent-Class-Analyse (LCA) 235 6.2 Spezifikation von LCA-Modellen in Mplus 238 6.3 Modellgütebeurteilung und Modellvergleiche 260 6.3.1 Absoluter Modellfit 260 6.3.2 Relativer Modellfit 265 6.3.3 Interpretierbarkeit 271 Anhang A: Zentrale Mplus-Befehle 273 Anhang B: Häufige Fehler bei der Mplus-Spezifikation und „Troubleshooting“ 278 Anhang C: Literaturhinweise zu Mplus 281 Literatur 283 Register 289 Vorwort 7 Vorwort Multivariate statistische Auswertungsmethoden – mit oder ohne Verwendung latenter Vari- ablen – werden in den empirischen Sozialwissenschaften zunehmend häufiger eingesetzt. Gilt es doch in vielen Studien Fragestellungen bezüglich komplexer Zusammenhangsstruk- turen zwischen einer Vielzahl von Variablen zu untersuchen. Da es hierbei erwünscht ist, zufällige Messfehlereinflüsse zu berücksichtigen, haben multivariate statistische Verfahren mit latenten Variablen in den letzten Jahrzehnten zunehmende Verbreitung in den Sozial- wissenschaften gefunden. Statistische Modelle mit latenten Variablen ermöglichen es, Mess- fehlereinflüsse in der Analyse explizit zu berücksichtigen und die unerwünschten Effekte von Messfehlern auf statistische Ergebnisse – wie beispielsweise die verzerrte Schätzung von Korrelations- oder Regressionskoeffizienten – zu vermeiden. Warum hat sich der Autor dazu entschlossen, ausgerechnet ein Buch zum Computer- programm Mplus zu schreiben? Mplus ermöglicht die Analyse einer großen Vielzahl unter- schiedlicher multivariater statistischer Modelle und Verfahren – mit und ohne latente Vari- ablen – in einem einzigen Modellierungs-Framework (Muthén, 2002; Muthén & Muthén, 1998-2007; Muthén & Muthén, 2007). Eine Besonderheit ist dabei, dass in Mplus neben Mo- dellen mit kontinuierlichen latenten Variablen („latenten Faktoren“) auch Modelle mit kate- gorialen latenten Variablen (latenten Klassenvariablen) analysiert werden können. Derartige Latent-Class-Modelle (siehe Kapitel 6) lassen sich in Mplus zudem mit dem Ansatz linearer Strukturgleichungsmodelle (siehe Kapitel 3) verbinden (z.B. bei der Analyse sogenannter Growth-Mixture-Modelle, bei denen unterschiedliche „Wachstumstypen“ Gegenstand der Analyse sind). Daneben erweist sich Mplus als sehr flexibel, was die Behandlung von Datensituationen anbetrifft, welche die strengen Annahmen konventioneller Schätzmethoden verletzen. So macht beispielsweise das Maximum-Likelihood-Schätzverfahren zur Schätzung der Modell- größen in linearen Strukturgleichungsmodellen die Annahme der multivariaten Normalver- teilung der Variablen. Außerdem wird vorausgesetzt, dass die Beobachtungseinheiten (in der Regel die befragten oder getesteten Personen) eine Zufallsstichprobe darstellen und vonein- ander unabhängig sind. Die Normalverteilungsannahme ist in den empirischen Sozialwis- senschaften in vielen Fällen nicht haltbar, insbesondere dann nicht, wenn einzelne Items mit lediglich ordinalem Skalenniveau als Indikatoren für latente Faktoren verwendet werden sollen (Finney & DiStefano, 2006). Auch die Annahme der Unabhängigkeit der Beobach- tungseinheiten voneinander ist in vielen Fällen verletzt, etwa dann, wenn die gesammelten Daten eine hierarchische (Mehrebenen-)Struktur aufweisen (vgl. Kapitel 5). Mplus bietet für derartige Fälle eine Vielzahl spezieller robuster Schätzmethoden an, so dass beispielsweise auch ordinale und nicht-normalverteilte Variablen sowie geclusterte (Mehrebenen-)Daten 8 Vorwort korrekt analysiert werden können (diese Themen werden im Fortsetzungsband von Geiser, Crayen & Enders [in Vorbereitung] behandelt). Mplus bietet neben seiner Vielseitigkeit und Flexibilität gegenüber vielen anderen Pro- grammen auch den Vorteil einer hohen Benutzerfreundlichkeit. Zwar handelt es sich bei Mplus um ein vorwiegend syntaxbasiertes Programm, das heißt Modelle und Analysen werden nicht über Menüfunktionen oder Pfaddiagramme spezifiziert, wie dies in anderen Programmen z.T. möglich ist, sondern mit Hilfe einer Befehlssprache. Die Mplus- Befehlssprache zeichnet sich dabei jedoch durch ein hohes Maß an Einfachheit und Klarheit aus. Komplexe Modelle lassen sich durch relativ wenige, leicht zu verstehende Befehle spe- zifizieren, ohne dass der Benutzer beispielsweise Experte in Matrixalgebra sein oder speziel- le Programmiererfahrungen haben muss. Und nicht zuletzt sah sich der Autor auch deshalb motiviert, ein Buch zu Mplus zu schreiben, weil er in zahlreichen Seminaren und Work- shops den steigenden Bedarf der Nutzer an einem grundlegenden Einführungsband zu diesem Programm regelmäßig zu spüren bekommen hat. Das vorliegende Buch liefert eine Einführung in die Datenanalyse mit Mplus sowie in die Theorie und praktische Anwendung von vier in den empirischen Sozialwissenschaften besonders verbreiteten multivariaten Verfahren. Es werden „konventionelle“ lineare Struk- turgleichungsmodelle (Regressions-, konfirmatorische Faktoren- und Pfadanalysen für Querschnittdaten) sowie – aufgrund ihrer zunehmenden Verbreitung in den Sozialwissen- schaften – auch Strukturgleichungsmodelle speziell für die Auswertung von Längsschnitt- daten (von identischen Merkmalsträgern zu mehreren Messgelegenheiten erhobene Daten, Messwiederholungsdaten) und die damit verbundenen zentralen Modellierungsaspekte behandelt. Hierbei wird auf Latent-State-Modelle, Latent-State-Trait-Modelle, manifeste und latente autoregressive Modelle, latente Differenzenmodelle und latente Wachstumskurven- modelle eingegangen. Außerdem behandelt das Buch die Analyse von Mehrebenendaten in Mplus, wobei aus Platzgründen nur Modelle für manifeste Variablen (d.h. Mehrebenenreg- ressionsmodelle) berücksichtigt werden konnten. Im letzten Kapitel wird die Durchführung der klassischen Latent-Class-Analyse in Mplus besprochen. Ziel des vorliegenden Buches ist es, den Leserinnen und Lesern die Benutzung von Mplus von Grund auf in einer praxisorientierten und anwenderfreundlichen Weise nahe zu bringen. Hierzu wird durchgängig mit realen Datenbeispielen gearbeitet, die direkt auf ver- gleichbare eigene Problemstellungen übertragen werden können. Zahlreiche Screenshots und Outputexzerpte führen Schritt für Schritt durch die gezeigten Analysen und die Interpretati- on der Ergebnisse. Eine weitere Hilfe zur Übertragung auf eigene Datenanalysen liefert die Begleit-CD zum Buch, auf welcher sämtliche im Buch besprochenen Datenbeispiele, Mplus- Syntax-Dateien mit den entsprechenden Modellspezifikationen sowie die dazugehörigen Mplus-Output-Dateien enthalten sind. In die Syntaxdateien wurden zahlreiche Kommentare aufgenommen, um den Leserinnen und Lesern den Umgang mit der Syntax zu erleichtern. Viele der verwendeten Datenbeispiele sind auf eine geringe Anzahl von Variablen begrenzt und könnnen daher auch mit der über die Mplus-Homepage frei verfügbaren Demoversion des Programms (siehe http://statmodel.com/demo.shtml) nachgerechnet werden. Das Buch beginnt bei der Frage der Datenaufbereitung und des Datenimports für bzw. in das Programm Mplus. Aufgrund seiner großen Verbreitung (und nicht aufgrund einer etwaigen Präferenz des Autors) wird hierzu die Datenaufbereitung mit Hilfe des allgemeinen Vorwort 9 Statistikprogramms SPSS gezeigt. Das Vorgehen kann jedoch problemlos auf alle gängigen statistischen Programme wie z.B. SAS, STATA, STATISTICA, Systat usw. übertragen werden. Das vorliegende Buch versteht sich nicht als reiner Syntaxguide und stellt keinen Er- satz für, sondern eine Ergänzung zum Mplus User’s Guide (Muthén & Muthén, 1998-2007; http://statmodel.com/ugexcerpts.shtml) dar. Es möchte dem Leser nicht nur zeigen, wie er welches statistische Modell mit Hilfe der Mplus-Syntax spezifizieren kann, sondern auch Hilfestellungen bei der Wahl geeigneter Modellierungsstrategien sowie bei der Interpretati- on der Schätzergebnisse liefern. Zudem soll das Buch dem Anwender helfen, typische, bei der Modellierung komplexer multivariater Daten auftretende Probleme (z.B. die Frage der Messinvarianztestung in Längsschnittuntersuchungen oder das Problem der Vermeidung lokaler Likelihood-Maxima in der Latent-Class-Analyse) zu erkennen und zu lösen. Aus diesem Grund werden die besprochenen statistischen Verfahren sowie aus Sicht des Autors sinnvolle und bewährte Modellierungsstrategien an geeigneten Stellen ebenfalls diskutiert. Bei besonders wichtigen Fragen geben Textboxen nochmals einen Überblick über wichtige Probleme und entsprechende Lösungsstrategien. Trotz der Fokussierung des Bandes auf die praktische Anwendung der einzelnen Ver- fahren und Modelle in Mplus wird in der Einleitung zu jedem Kapitel auch noch einmal in knapper Form auf den theoretischen Hintergrund der statistischen Modelle und Verfahren eingegangen, wobei das Buch natürlich keinen Ersatz für ein Statistik-Lehrbuch sowie die jeweilige Spezialliteratur darstellt. Aus diesem Grund wird zu Beginn eines jeden Kapitels auf zentrale weiterführende Literatur zu dem jeweiligen Verfahren hingewiesen. Auch bei spezifischen Problemstellungen (wie z.B. der Frage nach der Testung von Mediatoreffekten in Kapitel 3.5) wird auf die entsprechende Spezialliteratur verwiesen. Als allgemeines Statis- tik-Lehrbuch, in welchem die Theorie der Mehrzahl der in diesem Buch beschriebenen Ver- fahren im Detail behandelt wird, sei dem Leser das Buch von Eid, Schmitt und Gollwitzer (2010) empfohlen. Die Auswahl der in diesem Buch besprochenen statistischen Verfahren erfolgte subjek- tiv aufgrund der Erfahrungen des Autors aus seiner eigenen Forschungspraxis sowie aus zahlreichen von ihm gehaltenen Workshops, in welchen er einiges über die statistischen „Bedürfnisse“ von Sozialwissenschaftlern (insbesondere Psychologen) gelernt hat (wofür er ausgesprochen dankbar ist). Eine Einführung kann naturgemäß keine erschöpfende Darstel- lung aller relevanten Verfahren und Modellierungsaspekte liefern. Der Autor hofft jedoch, dass es ihm gelungen ist, eine für eine möglichst große Zahl von empirischen Sozialwissen- schaftlern nützliche Auswahl an Modellen und Methoden getroffen zu haben. Komplexere multivariate Auswertungsmethoden und Modellierungsaspekte in Mplus werden im Fort- setzungsband von Geiser et al. (in Vorbereitung) behandelt. Das vorliegende Buch ist entstanden aus den Lehrerfahrungen des Autors in zahlrei- chen Seminaren und Workshops zur angewandten multivariaten Statistik und Datenanalyse mit Mplus. Der Autor ist seinen Studierenden sowie den zahlreichen Workshopteilnehme- rinnen und -teilnehmern sehr dankbar für die umfangreichen Erfahrungen, die er in diesen Veranstaltungen sammeln konnte und das Feedback der Teilnehmerinnen und -teilnehmer. Der Autor dankt außerdem Martin Corth, David Cole und dem Deutschen Zentrum für Altersfragen (DZA) in Berlin für die Überlassung von Beispieldatensätzen, Christopher Marx für die Hilfe bei der Aufbereitung des Datenbeispiels zur Pfadanalyse in Kapitel 3.5 10 Vorwort sowie die Durchführung von Analysen und das Korrekturlesen dieses Kapitels, Claudia Crayen für ihre Hilfe bei der Erstellung von Abbildungen und für Korrekturen sowie Hen- riette Hunold, Anne Janssen, Tanja Kutscher, Maike Luhmann, Natalie Mallach und Tabea Reuter für zahlreiche Korrekturen und hilfreiche Anregungen. Sie alle haben dazu beigetra- gen, das Buch verständlicher und anwenderfreundlicher zu machen und etliche Fehler aus- zumerzen. Für alle verbleibenden Fehler und Schwächen bin ich natürlich allein verantwort- lich. Bitte kontaktieren Sie mich, wenn Sie Fehler entdecken sollten oder Vorschläge zur Verbesserung des Buches machen möchten. Ich wünsche Ihnen viel Erfolg bei der Durch- führung und Veröffentlichung Ihrer eigenen multivariaten Auswertungen mit Mplus. Berlin im Oktober 2009 Christian Geiser

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.