ebook img

Einführung in die Statistik: Für die Sozialwissenschaften PDF

439 Pages·2002·18.442 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Einführung in die Statistik: Für die Sozialwissenschaften

Elmar Klemm Einfiihrung in die Statistik ElmarKlemm Einfuhrung in die Statistik Fur die SozialwissenschaJten Westdeutscher Verlag Die Deutsche Bibliothek - CIP-Einheitsaufnahme Ein Titeldatensatz rur diese Publikation ist bei Der Deutschen Bibliothek erhaltlich 1. Auflage Juli 2002 Aile Rechte vorbehalten © Westdeutscher Verlag GmbH, Wiesbaden 2002 Der Westdeutsche Verlag ist ein Unternehmen der Fachverlagsgruppe BerteismannSpringer. www.westdeutschervlg.de Das Werk einschlieillich aller seiner Teile ist urheberrechtlich geschiitzt. Jede Verwertung aullerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulassig und strafbar. Das gilt insbesondere rur Vervielfaltigungen, Dbersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in dies em Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solehe N~en im Sinne der WarenzeicheQ-und Markenschutz-Gesetzgebung als frei zu betrachten waren und daher von jeder mann benutzt werden dliITten. Umschlagbild: Dr. Elmar Klemm, Diisseldorf Umschlaggestaltung: Horst Dieter Biirkle, Darmstadt Gedruckt auf saurefreiem und chlorfrei gebleichtem Papier ISBN-13 :978-3-53 1-13804-6 e-ISBN-I 3:978-3-322-83376-I DOl: 10.1007/978-3-322-83376-1 INHALTSVERZEICHNIS 1. Einleitung und Begrifflichkeiten .............. ... ........ ...... ... ............................. 11 1.1 Grundgesamtheit, Stichprobe ........................ ....................................... 12 1.2 Untersuchungseinheit, Variable, Merkmalsauspragung ........................ 13 1.3 Yom Erhebungsinstrument zur Datenmatrix ........................................ 14 1.4 Das Skalenniveau der Variablen .......................................................... 15 1.5 Diskrete und stetige Variablen ............................................................. 18 1.6 Abhangige und unabhangige Variablen, Kontrollvariablen ................. 19 TElL I:UNIV ARIATE DESKRIPTIVST AT ISTIK 2. Haufigkeitsverteilungen und ihre grafische Darstellung ........................ 20 2.1 Nominale und ordinale Daten .............................................................. 20 2.2 Intervall-und ratioskalierte Daten ....................................................... 24 3. Ma6zahlen zur Charakterisierung einer Verteilung - Mittelwerte und Streuungsma6e ..................................................... :........ 40 3.1 Mittelwerte .......................................................................................... 41 3.1.1 Der Modus ............................................................................. 41 3.1.1.1 Der Modus fur nominale Daten ........................ ....... 42 3.1.1.2 Modus fur intervall-oder ratioskalierte Daten ........ 42 3.1.1.3 Modus bei klassierten Daten .................................... 43 3.1.2 Der Median .......... .................................................. ................ 45 3.1.2.1 Errechnung des Medians beim Vorliegen einer Wertereihe mit singularen Werten ..... ....... ...... 45 3.1.2.2 Errechnung beim Vorliegen einer klassierten Variablen ............................................... 46 3.1.2.3 Eigenschaft des Medians ......................................... 48 3.1.3 Das arithmetische Mittel ........................................................ 48 3.1.3.1 Errechnung beim Vorliegen der Datenmatrix .......... 49 3.1.3.2 Errechnung beim Vorliegen einer Haufigkeitsverteilung ..................................... 49 3.1.3.3 Das gewichtete arithmetische Mittel.......... .............. 51 3.1.3.4 Eigenschaften des arithmetischen Mittels ................ 51 3.1.4 Das geometrische Mittel ........................................................ 53 3.1.5 Das harmonische Mittel ......................................................... 54 3.1.6 Zum Verhaltnis der einzelnen Mittelwerte ............................. 55 3.2 StreuungsmaBe ..................................................................................... 56 3.2.1 StreuungsmaBe fur nominale Daten ....................................... 56 3.2.1.1 Die variation ratio und Galtungs d .......................... 56 5 3.2.1.2 Der Dispersionsindex D.......................................... 58 3.2.2 Streuungsmal3e fUr metrische Daten ...................................... 60 3.2.2.1 StreuungsmaBe ohne Mittelwertsinformationen ...... 60 3.2.2.2 Mittlere absolute Abweichung yom Median ............ 63 3.2.2.3 Varianz und Standardabweichung ........................... 64 3.2.2.4 Der Variationskoeffizient ........................................ 70 4. Univariate Verfahren der explorativen Datenanalyse ............................ 71 4.1 Order statistics und Tiefenwerte ......................................................... 71 4.2 Verteilungskennwerte der EDA ........................................................... 73 4.3 Einfache grafische Darstellungen von Verteilungen im Rahmen der EDA ................................................................................. 77 4.3.1 Derstem-and-leafplot ........................................................... 77 4.3.2 Der boxp lot ............................................................................ 82 4.3.3 Schatzung empirischer Dichten fUr Histogramme ................. 83 4.4 Robuste MaI3zahlen univariater Verteilungen ........ ................ ....... ....... 88 4.4.1 Der Median der absoluten Abweichung yom Median MAD ........................................................................ 89 4.4.2 Der a-getrimmte Mittelwert .................................................. 90 4.4.3 Das a-winsorisierte Mittel ..................................................•.. 92 4.4.4 Der trimean und der erweiterte Median ................................. 93 TElL II:U NIVARIATE INFERENZSTAT ISTIK 5. Grundlagen der Wahrscheinlichkeitsrechnung ....................................... 95 5.1 Ereignis, Elementarereignis und Wahrscheinlichkeit .......................... 95 5.2 Rechnen mit W ahrscheinlichkeiten ..................................................... 97 5.3 Der Wahrscheinlichkeitsbaum ........................................................... 103 5.4 Kombinatorik, der Binomialkoeffizient ............................................. 104 6. Diskrete Zufallsvariablen: Binomial-und Poissonverteilung ................ 108 6.1 Die Binomialverteilung ..................................................................... 109 6.2 Die Poissonverteilung ........................................................................ 116 7. Stetige Zufallsvariablen, die Normalverteilung ..................................... 123 7.1 Die Normalverteilung ........................................................... "'........... 124 7.2 ApprQ~imationen durch die Normalverteilung .................................. 130 7.3 Testvertellungen ................................................................................ 133 7.3.1 Die x2-Verteilung ................................................................ 133 7.3.2 Die t-Verteilung ................................................................... 134 7.3.3 Die F-Verteilung .................................................................. 136 6 8. Konfidenzintervalle univariater MaBzahlen .......................................... 138 8.1 Konfidenzintervall des arithmetischen Mittels bei bekannter Populationsvarianz ............................................................ 142 8.2 Konfidenzintervall des arithmetischen Mittels bei unbekannter Populationsvarianz ........................................................ 145 8.3 Konfidenzintervall der Populationsvarianz ........................................ 147 8.4 Konfidenzintervall eines Anteilswertes ............................................. 150 8.4.1 Bestimmung der Konfidenzintervalle mittels der Norrnalverteilung ................................................................. 151 8.4.2 Exakte Bestimmung der Konfidenzintervalle ...................... 153 8.5 Konfidenzintervall des Medians ........................................................ 156 8.5.1 Konfidenzintervall und Standardfehler des Medians ........... 157 8.5.2 Verteilungsfreie Konfidenzintervalle des Medians .............. 158 TElL III:STATISTISCHE HYPOTHESEN UND IHRE TESTS 9. Testen von statistischen Hypothesen ....................................................... 163 9.1 Nullhypothese und Altemativhypothese ............................................ 163 9.2 Der Fehler der I. Art, das Signifikanzniveau a.................................. 165 9.3 Der Fehler der II. Art ......................................................................... 169 9.4 Einseitige und zweiseitige Hypothesen .............................................. 172 9.5 Einstichproben-Tests ......................................................................... 175 9.5.1 Tests tiber den Mittelwert J..l einer Norrnalverteilung ........... 175 9.5.2 Test tiber die Varianz einer Norrnalverteilung ................ 178 (52 9.5.3 Test tiber den Anteilswert 7t einer Binomialverteilung ........ 179 10. Zweistichproben-Tests - Mittelwerte und Varianzen ......................... 188 10.1 Tests aufMittelwertsunterschiede unverbundener Stichproben ......... 189 10.1.1 Voraussetzungen und Grundlagen ....................................... 189 10.1.2 Test auf Mittelwertsunterschiede bei bekannten Populationsvarianzen ........... ................................................ 190 10.1.3 Test auf Mittelwertsunterschiede bei unbekannten, jedoch gleichen Populationsvarianzen ................................. 192 10.1.4 Test auf Mittelwertsunterschiede bei unbekannten, ungleichen Populationsvarianzen .................. ............ .......... 196 10.2 Test aufMittelwertsunterschiede verbundener Stichproben .............. 200 10.3 Test auflJIlgleichheit zweier Varianzen, der F-Test ......................... 202 n. Zweistichproben-Tests - Anteilswerte ................... ............................... 206 11.1 Unterschiedstest tiber die Norrnalverteilung ...................................... 206 11.2 Unterschiedstest tiber die exakte Wahrscheinlichkeitsverteilung ...... 209 11.2.1 Die binomiale Differenzverteilung (BD-Verteilung) ........... 210 11.2.2 Der exakte Test fUr die Differenz zweier Anteilswerte ........ 213 7 11.3 DerIrwin-Fisher-Test ........................................................................ 217 12. Anpassungstests ........................................................................................ 221 12.1 Der KoImogorowsche Anpassungstest .............................................. 221 12.2 Lilliefors Test aufNormalverteilung ................................................. 230 12.3 Pearsons Chi-Quadrat-Anpassungstest .............................................. 232 TElL IV: ZUSAMMENHANG ZWISCHEN ZWEI MERKMALEN 13. Zusammenhangsanalyse in Kreuztabellen ............................................. 238 13.1 Kreuztabellen und ihre Darstellung ................................................... 239 13.1.1 Kreuztabelle und gemeinsame Verteilung ........................... 240 13 .1.2 Kreuztabelle und bedingte Verteilung ................ ................. 242 13.2 Pearsons Chi-Quadrat-Test aufUnabhangigkeit ................................ 243 13.3 Pearsons Chi-Quadrat-Test aufHomogenitat .................................... 247 13.4 Chi-Quadrat-Tests fUr spezielle Kontingenztafeln ............................. 249 13.4.1 Die 2xl-Felder-Tafel ........................................................... 249 13.4.2 Die Vierfelder-Tafel ............................................................ 251 13.5 Der Likelihood-Ratio-Chi-Quadrat-Test aufUnabhangigkeit ........... 254 13.6 Der Test aufUnabhangigkeit nach Freeman und-H~llton .................. : 256 13.7 Der Irwin-Fisher-Test ........................................................................ 261 14. Assoziationsma8e fiir nominale Merkmale in Kreuztabellen ............... 262 14.1 Eigenschaften von AssoziationsmaBen ...... ................ .......... .............. 263 14.2 Chi-Quadrat-basierte AssoziationsmaBe in Ixl-Tafeln ...................... 265 14.3 AssoziationsmaBe fUr Vierfelder-Tafeln .................. .......................... 271 14.3.1 Der Phi-Koeffizient ............................................................. 272 14.3.2 Das Kreuzproduktverhaltnis ................................................ 273 14.3.3 Yules Q und Y ..................................................................... 276 14.3.4 Das relative Risiko .............................................................. 279 14.3.5 Die Anteilsdifferenz ............................................................ 282 14.4 PRV-MaBe ......................................................................................... 283 14.4.1 Das Goodman-Kruskalsche 't, die erkUirte Varianz ............. 284 14.4.2 Das PRE-MaB A................................................................... 288 15. Zusammenhangsma8e fiir rangtransformierte Merkmale .......' \ ........... 292 15.1 Die Rangtransformation ..................................................................... 293 15.2 Kenda-l~l-s- -'ta ......................................................................................... 294 15.2.1 Zur deskriptiven Interpretation von 'ta ................................. 299 15.2.2 SignifIkanztests fUr Kendalls 'ta ........................................... 301 15.2.3 Kendalls 't und der a verallgemeinerte Korrelationskoeffizient ............................ 307 15.3 Rangkorrelation bei Rangbindungen: Kendalls'tb ............................. 308 8 15.3.1 Berechnung von 'tb in geordneten Kreuztabellen ................. 311 15.3.2 Signifikanztest fUr -tb ......................................................... 316 15.4 Stuarts 'tc ............................................................................................ 318 15.5 Goodman und Kruskals y ................................................................... 322 16. Zusammenhangsma8e fUr metrisch skalierte Merkmale ...................... 325 16.1 Kovarianz und Korrelation zweier Zufallsvariablen .......................... 325 16.2 Pearsons r .......................................................................................... 330 16.3 Der deskriptive Gebrauch von Pearsons r .......................................... 335 16.3.1 Pearsons r und bivariate AusreiBer ...................................... 336 16.3.2 Kurvilineare Beziehungen und Pearsons r ........................... 337 16.3.3 Pearsons r beim Vorliegen mehrerer Gruppen ..................... 338 16.4 Tests und Konfidenzintervalle fUr den Korrelationskoeffizienten p .. 339 16.4.1 Signifikanztest fUr Pearsons r .............................................. 340 16.4.2 Das Konfidenzintervall fUr p, die Fisher-Z-Transformation ............................................... 341 16.4.3 Vergleich der Korrelationswerte zweier Stichproben .......... 343 17. Einfache Iineare Regression - I ............................................................. 345 17.1 Die Methode der kleinsten Quadrate ................................................. 347 17.2 Die Regressionsgerade in der Grundgesamtheit ................................ 353 17.2.1 Beziehung zwischen 13 und b ............................................... 355 17.2.2 Beziehung zwischen und a............................................... 356 (l 17.2.3 Schfitzung der Varianz der Fehlerterme ............................... 358 17.3 Regression mit normalverteilten Fehlertermen .................................. 359 17.4 Konfidenzintervalle der Regressionskoeffizienten und Tests fUr die Regressionskoeffizienten .............................................. 360 17.4.1 Konfidenzintervall und statistischer Test fUr 13 ..........•...•..••• 361 17.4.2 Konfidenzintervall und statistischer Test fUr 363 (l •••••••••••••••••••• 17.5 Konfidenzintervall der Erwartungswerte von Y und Prognoseintervall einzelner Y -Werte .................................. .......... ..... 365 17.5.1 Das Konfidenzintervall der Erwartungswerte der abhangigen Variablen .......................................................... 366 17.5.2 Das Prognoseintervall fUr einen einzelnen V-Wert ............. 369 18. Einfache Iineare Regression - II ........................................................... 371 18.1 Variationszerlegung und die Regressionsgerade, r ................................................................... das BestimmtheitsmaB 371 18.2 Identifikation einflussreicher Untersuchungseinheiten ...................... 376 18.2.1 Der Einfluss der Untersuchungseinheiten auf die Steigung b ................................................................ 376 y ................. 18.2.2 Der Einfluss der Untersuchungseinheiten auf 378 18.3 Residualanalyse, Uberptiifung der Modellannahmen ........................ 383 9 18.3.1 Ideale Residuenverteilung ................................................... 386 18.3.2 Residuenverteilung bei Nichtlinearitat ................................ 387 18.3.3 Residuenverteilung bei Varianzheterogenitat ...................... 388 18.3.4 Residuenverteilung und AusreiBer ....................................... 389 18.3.5 Priifung der N ormalverteilungsannahme der Residuen ........ 392 Anhang 398 A Standardnormalverteilung z~<t>(z) .................................................. . 398 B Standardnormalverteilung <t>(z)~z ................................................. .. 400 C x2-Verteilung F(x)~x ....................................................................... . 403 D t-Verteilung F(x)~x ........................................................................ .. 406 E F-Verteilung F(x)=0.95~x ............................................................... . 409 F F-Verteilung F(x)=0.975~x ............................................................. . 414 G F-Verteilung F(x)=0.99~x ............................................................... . 419 H Kolmogorows Anpassungstest .......................................................... . 424 I Lilliefors Test aufNormalverteilung ................................................ . 426 J Exakter Test fur Kendalls 'ta ............................................................ .. 428 Literaturverzeichnis .......................................................................................... 430 Stichwort-Register .............................................................................................. 438 10 1. Einleitung und Begrifflichkeiten Fillnt man eine empirische Untersuchung durch - sei es, dass man zufallig ausge wahlte Personen mit einem standardisierten Fragebogen befragt hat, sei es, dass man Zeitungsartikel quantitativ-inhaltsanalytisch ausgewertet hat, oder dass man Beo bachtungsdaten mit einem standardisierten Beobachtungsinstrument gesammelt hat usw. - muss man anschlieBend die erhobenen Daten auswerten. Meist liegt eine so groBe Menge von Informationen vor, die analysiert werden muss, dass Auswertungen zusannnenfassend sein miissen. Fiir die Analyse solcher Infor mationsmengen eignen sich in besonderem MaBe statistische Verfahren. Ziel dieses Buches ist es, einfachere statistische Verfahren ausfiihrlich vorzustellen. Im ersten Teil werden einfache, beschreibende statistische Verfahren fur einzelne Merkmale vorgestellt. Hierbei handelt es sich urn die Erstellung von Haufigkeits verteilungen (Kapitel 2), Berechnung von Mittelwerte und StreuungsmaBen (Kapitel 3) und grundlegende Verfahren der explorativen Datenanalyse (Kapite14). Teil 2 besteht aus einer elementaren Einfiihrung in die Wahrscheinlichkeitsrechnung (Kapitel 5 bis 7) mit anschlieBender Anwendung der Wahrscheinlichkeitsrechnung auf die Berechnung von Vertrauensintervallen (Konfidenzintervallen) fur die statisti schen MaBzahlen aus Teil 1 (Kapitel 8). Im Teil 3 werden die Grundlagen des statistischen Hypothesentestens dargestellt (Kapitel 9) und einfache Anwendungen des statistischen Hypothesentestens erklart: Vergleich von Mittelwerten und Streuungen zweier Stichproben (Kapitel 10), Ver gleich von Anteilswerten zweier Stichproben (Kapitel 11) und Vergleich von Merk malsverteilungen mit theoretisch erwarteten Verteilungen (Kapitel12). 1m abschlieBenden Teil 4 wird ausfiihrlich auf die Untersuchung des Zusammen hangs zwischen zwei Merkmalen eingegangen. Hierbei muss man die Qualitat (Ska lenniveau) der untersuchten Merkmale berUcksichtigen. Der Zusammenhang nominal skalierter Variablen wird in den Kaptiteln 13 und 14 untersucht. Ordinal skalierten Variablen widmet sich das Kapitel15, und auf die Berechnung des Zusammenhangs metrisch skalierter Variablen gehen die Kapitel 16 bis 18 ein. Bevor die statistischen Verfahren jedoch vorgestellt werden, werden in diesem Ka pitel noch einige grundlegende Begriffe erlautert, die gerade auch scho~ teilweise verwendet wurden.l:lierbei handelt es sich urn die Begriffe: • Grundgesamtheit und Stichprobe, • Untersuchungseinheit, Variable und Merkmalsauspragung, • Skalenniveaus der Variablen, • diskrete und stetige Variablen, • abhangige und unabhangige Variablen, Kontrollvariablen. 11

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.