Robert Hafner Statistik für Sozial- und Wirtschaftswissenschaftler Springer-Verlag Wien New York Univ.-Prof. Dipl.-Ing. Dr. Robert Hafner Institut für Angewandte Statistik, ]ohannes-Kepler-Universität, Linz-Auhof, Österreich Das Werk ist urheberrechtlich.geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdmckes, der Ent nahme von Abbildungen, der Funksendung, der Wiedergabe auf photomechanischem oder ähnli chem Wege und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugswei seI' Verwertung, vorbehalten. © 1992 by Springer-Verlag/Wien Gedmckt auf säurefreiem Papier Mit '59 Abbildungen ISBN 978-3-211-82369-9 ISBN 978-3-7091-3420-7 (eBook) DOI 10.1007/978-3-7091-3420-7 Vorwort v Vorwort Dieses Buch ist aus Vorlesungen entstanden, die der Autor in den letzten fünfzehn Jahren vor Studierenden der Sozial-und Wirtschaftswissenschaften ge halten hat. Die Erfahrungen dieser Lehr- und Lernjahre waren für die Reflexion über die Zielsetzung des Buches, die Stoffauswahl und den Stil der Präsentation bestimmend. Das Ziel, soll es erreichbar sein, muß bescheiden gesetzt werden: Der ange hende Sozial- und Betriebswirt soll kein Statistiker werden, er soll aber soweit kommen, daß er mit einem Statistiker vernünftig zusammenarbeiten kann, er soll die Fachsprache des Statistikers und die in dieser Fachsprache formulierten Ergebnisse verstehen, und zwar präzise und kritisch, nicht nur ahnungsweise und gutgläubig. Er soll lernen, welcher Art statistische Fragen und Antworten sind, anders gesagt: was man billig fragen und antworten kann, und womit man sich zufrieden geben muß. Das angestrebte Ziel bestimmt die Stoffauswahl. Möglichst viele multi variate statistische Verfahren aufzunehmen, wäre gänzlich sinnlos. Der Studie rende könnte sie nur wie ein Papagei, ohne jedes Verständnis, auswendig lernen, denn auf die theoretischen Grundlagen einzugehen, wäre aus vielen Gründen unmöglich. Wesentlich vernünftiger ist es, sich auf einfache statistische Frage stellungen zu beschränken und an ihnen die Begriffe der mathematischen Sta tistik sauber, verständlich und mit mathematischen Hilfsmitteln, die auch dem Anfänger zur Verfügung stehen, zu entwickeln. Verständnis, nicht Rezeptwissen ist im Grundsatz immer die Devise, wenn auch manchmal aus dem Zwang des Sachverhaltes von diesem Grundsatz abgewichen wird. Auch der Stil der Darstellung wurde von der Zielsetzung bestimmt. Am Anfang steht zur Motivation immer ein einfaches unmittelbar verständliches Beispiel. Davon ausgehend werden die Begriffe und Methoden entwickelt. Be sonderes Anliegen war dem Autor dabei immer die klare, unmißverständliche sprachliche Formulierung. Gerade in dieser Hinsicht ist sehr viel Erfahrung in das Buch eingeflossen. Es ist keine leichte Aufgabe, mathematisch wenig vorbelasteten Anfängern Statistik zu erklären. Hoffentlich ist es einigermaßen gelungen! An dieser Stelle scheint mir noch ein Wort über statistische Programm pakete angebracht. Gelegentlich wird ja die Meinung vertreten, für Sozial und Wirtschaftswissenschafter, ja überhaupt für Anwender der Statistik genüge es, mit der Handhabung eines der gängigen Statistikpakete (etwa SPSS oder VI Vorwort SAS) vertraut zu sein. Diese Auffassung kann man akzeptieren, wenn Hand habung verständige Handhabung bedeuten sol!. Zur verständigen Handhabung eines Programmpakets, und nur darum kann es gehen, gehört Verstehen der Grundlagen und ein Wissen um die am PC einzugebenden Steuerbefehle. Letz teres ist vergleichsweise einfach zu erwerben, ersetzt aber in keiner Weise das Verständnis der Grundlagen, ohne das die Arbeit am Computer zum sinnlosen Kn()pfchenspiel verkommt. Die von Version zu Version sich ständig ändernden Steuerbefehle eines Programmpaketes zu besprechen, kann daher weder Inhalt f~ines Buches noch einer Vorlesung über Sozial- und Wirtschaftsstatistik sein - dafür gibt es Manuals. Auch vergesse man nicht, daß der Sozial- und Betriebs wirt später im Beruf in aller Regel aufwendigere statistische Untersuchungen nicht selbst ausführen, sondern an Statistiker oder Informatiker delegieren wird. Diesen soll er, wie schon eingangs betont, ein kompetenter Gesprächspartner sein. Ein solcher ist er aber nur, wenn er versteht, was die Fachleute tun, und nicht, wenn er die Steuerbefehle des von ihnen benützten Programmsystems auswendig gelernt hat. Abschließend danke ich meinen bewährten Mitarbeitern Frau R. Janout, Frau Mag. H. Wagner, Herrn Mag. M. Schöfecker und Herrn Mag. H. Wald!. Vor allem Frau Janout verdient für ihre unermüdliche Sorgfalt und Geduld besondere Anerkennung. Linz, im Februar 1992 R.Hafner Inhaltsverzeichnis VII Inhaltsverzeichnis Teil I: Deskriptive Statistik 1. Einführung 1.1 Was ist Statistik? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Datenquellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 Wie geht man bei statistischen Untersuchungen vor? . . . . . . . . . . . . . . . . . . . . 4 1.4 Grundgesamtheit ~ Erhebungseinheit -- Merkmal. . . . . . . . . . . . . . . . . . . . . . 5 2. Eindimensionale Häufigkeitsverteilungen 2.1 Diskrete Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.2 Stetige Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12 3. Zweidimensionale Häufigkeitsverteilungen 3.1 Diskrete Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 17 3.2 Stetige Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22 4. Maßzahlen für eindimensionale Verteilungen 4.1 Metrische Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26 Lageparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26 Streuungsparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30 Der Variationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 33 Momente einer Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 34 Symmetrie und Schiefe einer Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35 Die Wölbung einer Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35 4.2 Ordinale Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36 4.3 Nominale Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 38 5. Maßzahlen für mehrdimensionale Verteilungen 5.1 2-dimensionale metrische Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 42 Der Korrelationskoeffizient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 43 5.2 k-dimensionale metrische Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 45 Vlll In haltsverzeichnis 5.3 Ordinale Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 46 Der Korrelationskoeffizient von Spearman . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 46 Der Korrelationskoeffizient von Kendall ................................ 47 5.4 Nominale Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49 6. Die Lorenzkurve ................................................... , 51 Teil 11: Wahrscheinlichkeitsrechnung 7. Grundbegriffe der Wahrscheinlichkeitsrechnung 7.1 Experimente mit zufälligem Ausgang ................................... 60 7.2 Zufällige Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 64 7.3 Ereignisse........................................................... 65 7.4 Rechnen mit Ereignissen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 68 7.5 Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 69 7.6 Folgerungen aus den Grundaxiomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 72 8. Diskrete Wahrscheinlichkeitsverteilungen 8.1 Dichte und Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 76 Eigenschaften der Dichte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 78 Simulation einer Verteilung mit gegebener Dichte. . . . . . . . . . . . . . . . . . . . . .. 78 Simulation auf dem Computer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 79 Die Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 81 8.2 Die Alternativverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 83 8.3 Die Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 85 8.4 Die hypergeometrische Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 86 8.5 Die Binomial-Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 89 8.6 Die Poisson-Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 92 8.7 Approximationsregeln ....................... ......................... 95 9. Stetige Wahrscheinlichkeitsverteilungen 9.1 Dichte und Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 97 Eigenschaften der Verteilungsfunktion ................................. , 98 Eigenschaften der Dichte ............................................. , 99 9.2 Die stetige Gleichverteilung ........................................... 100 Inhaltsverzeichnis ix 9.3 Die Normalverteilung ................................................. 103 Die Hauptnormalverteilung ........................................... 105 Normalapproximation von Binomial- und Poisson-Verteilung ............. 107 9.4 Die Chi-Quadrat-Verteilung ........................................... 108 9.5 Die Student-Verteilung ............................................... 110 9.6 Die F-Verteilung ..................................................... 112 10. Parameter von Wahrscheinlichkeitsverteilungen 10.1 Der Erwartungswert ................................................. 114 10.2 Fraktile von Wahrscheinlichkeitsverteilungen ........................... 119 10.3 Lage- und Streuungsparameter ....................................... 121 Teil III: Mathematische Statistik 11. Relative Häufigkeiten 11.1 Schätzen relativer Häufigkeiten ....................................... 127 Punktschätzung ..................................................... 128 Bereichschätzung ................................................... 128 11.2 Testen von Hypothesen über relative Häufigkeiten ...................... 136 11.3 Vergleich zweier relativer Häufigkeiten ................................ 140 12. Die Parameter der Normalverteilung 12.1 Der Mittelwert ...................................................... 143 12.2 Die Varianz ......................................................... 148 12.3 Vergleich zweier Normalverteilungen .................................. 152 Vergleich der Mittelwerte ............................................ 152 Vergleich der Varianzen .............................................. 156 13. Verteilungsunabhängige Verfahren 13.1 Schätzen und Testen von Fraktilen .................................... 159 13.2 Statistische Toleranzintervalle ........................................ 163 x Inhaltsverzeichnis 14. Der Chi-Quadrat-Test 14.1 Der Chi-Quadrat-Anpassungstest ..................................... 164 14.2 Der Chi-Quadrat-Homogenitätstest ................................... 168 15. Regressionsrechnung .............................................. 171 Tabellen Tabelle 1: Dichte der hypergeometrischen Verteilung ........................ 185 Tabelle 2: Dichte der Binomial-Verteilung .................................. 186 Tabelle 3: Verteilungsfunktion der Binomial-Verteilung ...................... 187 Tabelle 4: Dichte der Poisson-Verteilung .................................... 188 Tabelle 5: Verteilungsfunktion der Poisson-Verteilung ........................ 189 Tabelle 6: Verteilungsfunktion der Standard-Normalverteilung ................ 190 Tabelle 7: Fraktile der Student-Verteilung .................................. 191 Tabelle 8: Fraktile der Chi-Quadrat-Verteilung .............................. 192 Tabelle 9: Fraktile der F-Verteilung ........................................ 193 Nomogramm zur Bestimmung von Vertrauensschranken für den Anteil p in der Grundgesamtheit ................................... 194 Literatur ............................................................... 195 Sachverzeichnis ........................................................ 197 Teil I Deskriptive Statistik