Robert Hafner Statistik fUr Sozial- und Wirtschaftswissenschaftler Band 1 Lehrbuch Zweite, verbesserte Auflage Springers Kurzlehrbucher der Wirtschaftswissenschaften SpringerWienNe wYork Univ.-Prof. Dipl.-Ing. Dr. Robert Hafner Institut fUr Angewandte Statistik lohannes-Kepler-Univel"SiUIt Linz Linz, Osterreich Das Werk ist urheberrechtlich geschutzt. Die dadurch begrtlndeten Rechte, insbesondere die der Obel"Setzung, des Nachdruckes. der Entnahrne von Abbildungen, der Funksendung, der Wiedergabe auf photornechanischem oJer !thnlichern Wege und der Speicherung in Datenverarbeitungsanlagen, bleiben. auch bei nur auszugsweiser Verwertung, vorbehalten. © 1992 und 2000 Springer-VerlagfWien Reproduktionsfertige Vorlage vom Autor Druck: Novographic Druck G.m.b.H .. A-123D Wien Graphisches Konzept: Ecke Bonk Gedruckt auf saurefreiem. chlorfrei gebleichtem Papier - TCF SPIN 10761137 Mit 58 Abbildungen Die Deutsche Bibliolhek - CIP-Einheitsaufnahme Ein Titeldatensalz fUr diese PubIikalion iSI bei Der Deutschen Bibliolhek erhaltlich. ISSN 0937-6836 ISBN-I3: 978-3-2 [ 1-83455-8 e[SBN-I3:978-3-7091-6777-9 00[: 10. I 007/978-3-7091-6777-9 Vorwort Dieses Buch ist aus Vorlesungen entstanden, die der Autor in den letzten funfzehn J ahren vor Studierenden der Sozial- und Wirtschaftswissenschaften ge halten hat. Die Erfahrungen dieser Lehr- und Lernjahre waren fur die Reflexion uber die Zielsetzung des Buches, die Stoffauswahl und den Stil der Prasentation bestimmend. Das Ziel, solI es erreichbar sein, muB bescheiden gesetzt werden: Der ange hen de Sozial- und Betriebswirt soll kein Statistiker werden, er soll aber soweit kommen, daB er mit einem Statistiker vernunftig zusammenarbeiten kann, er solI die Fachsprache des Statistikers und die in dieser Fachsprache formulierten Ergebnisse verstehen, und zwar prazise und kritisch, nicht nul' ahnungsweise und gutglaubig. Er solI lernen, welcher Art statistische Fragen und Antworten sind, andel's gesagt: was man billig fragen und antworten kann, und womit man sich zufrieden geben muB. Das angestrebte Ziel bestimmt die Stoffauswahl. Moglichst viele multiva riate statistische Verfahren aufzunehmen, ware ganzlich sinnlos. Der Stuclie rende konnte sie nur wie ein Papagei, ohne jedes Verstandnis, auswendig lerrten, denn auf die theoretischen Grundlagen einzugehen, ware aus vielen Grunden unmoglich. \Vesentlich vernunftiger ist es, sich auf einfache statistische Frage stellungen zu beschranken und an ihnen die Begriffe der mathematischen Sta tistik sauber, vershi.ndlich und mit mathematischen Hilfsmitteln, die auch dem Anfanger zur Verfugung stehen, zu entwickeln. Verstandnis, nicht Rezeptwissen ist im Grundsatz immer die Devise, wenn auch manehmal aus dem Zwang des Sachverhaltes von dies em Grundsatz abgewichen wird. Auch der Stil der Darstellung wurde von der Zielsetzung bestimmt. Am Anfang steht zur Motivation immer ein einfaches unmittelbar verstiindliches Beispiel. Davon ausgehend werden die Begriffe und Methoden entwickelt. Be sonderes Anliegen war dem Autor dabei immer die klare, unmiBverstiindliche sprachliche Formulierung. Gerade in dieser Hinsicht ist sehr viel Erfahrung in das Bueh eingeflossen. Es ist keine leichte Aufgabe, lllathematisch wenig vorbe lasteten Anfiingern Statistik zu erklaren. Hoffentlieh ist es einigerlllaBen gelun gen! An dieser Stelle scheint mir noeh ein Wort tiber statistisehe Programlll pakete angebraeht. Gelegentlich wird ja die Meinung vertreten, fiir Sozial- und Wirtschaftswissenschafter, ja tiberhaupt fur Anwender der Statistik gentige es, mi t der Handhabung eines del' g~.ngigen Statistikpakete (etwa SPSS odeI' SAS) vertraut zu sein. Diese Auffassung kann man akzeptieren, wenn Handhabung Vorwort VI verstandige Handhabung bedeuten solI. Zur verstandigen Handhabung eines Programmpakets, und nur darum kann es gehen, gehort Verstehen der Grund lagen und ein Wissen urn die am PC einzugebenden Steuerbefehle. Letzte res ist vergleichsweise einfach zu erwerben, ersetzt aber in keiner Weise das Verstandnis der Grundlagen, ohne das die Arbeit am Computer zum sinnlosen Knopfchenspiel verkommt. Die von Version zu Version sich standig andernden Steuerbefehle eines Programmpaketes zu besprechen, kann daher weder Inhalt eines Buches noch einer Vorlesung iiber Sozial- und Wirtschaftsstatistik sein ~ dafiir gibt es Manuals. Auch vergesse man nicht, daB der Sozial- und Betriebs wirt spater im Beruf in aller Regel aufwendigere statistische Untersuchungen nicht selbst ausfiihren, sondern an Statistiker oder Informatiker delegieren wird. Diesen solI er, wie schon eingangs betont, ein kompetenter Gesprachspartner sein. Ein solcher ist er aber nur, wenn er versteht, was die Fachleute tun, und nicht, wenn er die Steuerbefehle des von ihnen beniitzten Programmsystems auswendig gelernt hat. AbschlieBend danke ich meinen bewahrten Mitarbeitern Frau R. Janout, Frau Mag. H. Wagner, Herrn Mag. M. Schofecker und Herrn Mag. H. Waldl. Vor allem Frau Janout verdient fiir ihre unermiidliche Sorgfalt und Geduld besondere Anerkennung. Linz, im Februar 1992 R. Hafner Vorwort zur 2. Auflage Da sich das Buch in der Lehr- und Lernpraxis sowohl hinsichtlich der Stoff auswahl als auch in der Prasentation bewahrt hat, wurden in der zweiten Auf lage nur geringfiigige Veranderungen vorgenommen: Fehler wurden berichtigt, einige Formulierungen verbessert, die Bilder mit modernen Hilfsmitteln neu ge zeichnet und der Tabellenanhang neu gestaltet. Fiir die sorgfaltige Durchfiihrung dieser Arbeiten danke ich meinen bewahr ten Mitarbeitern Frau R. Janout und Herrn Dr. H. Waldl besonders herzlich. Linz, im April 2000 R. Hafner Inhaltsverzeichnis Teil I: Deskriptive Statistik 1 Einfuhrung 1.1 Was ist Statistik? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Datenquellen.................................................. 4 1.3 Wie geht man bei statistischen Untersuchungen vor? . . . . . . . . . . . . . . 4 1.4 Grundgesamtheit - Erhebungseinheit - Merkmal .. . . . . . . . . . . . . . 5 2 Eindimensionale Hauflgkeitsverteilungen 2.1 Diskrete Merkmale............................................. 9 2.2 Stetige Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12 3 Zweidimensionale Haufigkeitsverteilungen 3.1 Diskrete Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 17 3.2 Stetige Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22 4 MaBzahlen fur eindimensionale Verteilungen 4.1 Metrische Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26 Lageparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26 Streuungsparameter ............................................ 30 Der Variationskoeffizient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 33 Momente einer Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 34 Symmetrie und Schiefe einer Verteilung. . . . . . . . . . . . . . . . . . . . . . . . .. 35 Die Wolbung einer Verteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35 4.2 Ordinale Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36 4.3 Nominale Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 38 5 MaBzahlen fur mehrdimensionale Verteilungen 5.1 2-dimensionale metrische Mer kmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 42 Der Korrelationskoeffizient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 43 5.2 k-dimensionale metrische Merkmale .... . . . . . . . . . . . . . . . . . . . . . . . .. 45 viii Inhaltsverzeichnis 5.3 Ordinale Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 46 Der Korrelationskoeffizient von Spearman. . . . . . . . . . . . . . . . . . . . . . .. 46 Der Korrelationskoeffizient von Kendall ......................... 47 5.4 Nominale Merkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49 6 Die Lorenzkurve. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 51 Teil II: Wahrscheinlichkeitsrechnung 7 Grundbegriffe der Wahrscheinlichkeitsrechnung 7.1 Experimente mit zufiilligem Ausgang ............................ 60 7.2 Zufallige Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 64 7.3 Ereignisse ..................................................... 65 7.4 Rechnen mit Ereignissen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 68 7.5 Wahrscheinlichkeitsverteilungen ................................. 69 7.6 Folgerungen aus den Grundaxiomen ............................. 72 8 Diskrete Wahrscheinlichkeitsverteilungen 8.1 Dichte und Verteilungsfunktion ...... ..... .. .. .. ... . . ..... .. .. .. 76 Eigenschaften der Dichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 78 Simulation einer Verteilung mit gegebener Dichte . . . . . . . . . . . . . . . .. 78 Simulation auf dem Computer. . . ... ... .. . .. .. . . .. . . . ... . . . . . . .. 79 Die Verteilungsfunktion ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 81 8.2 Die Alternativverteilung ........................................ 83 8.3 Die Gleichverteilung ............................................ 85 8.4 Die hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 86 8.5 Die Binomial-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 89 8.6 Die Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 92 8.7 Approximationsregeln .......................................... 95 9 Stetige Wahrscheinlichkeitsverteilungen 9.1 Dichte und Verteilungsfunktion .... .. ....... ... .......... . .. .... 97 Eigenschaften der Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . .. 98 Eigenschaften der Dichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 99 9.2 Die stetige Gleichverteilung .................................... 100 Inhaltsverzeichnis ix 9.3 Die Normalverteilung .......................................... 103 Die Hauptnormalverteilung ..................................... 105 Normalapproximation von Binomial- und Poisson-Verteilung ....... 107 9.4 Die Chi-Quadrat-Verteilung ..................................... 108 9.5 Die Student-Verteilung ......................................... 110 9.6 Die F-Verteilung ............................................... 112 10 Parameter von Wahrscheinlichkeitsverteilungen 10.1 Der Erwartungswert .......................................... 114 10.2 Fraktile von Wahrscheinlichkeitsverteilungen .................... 119 10.3 Lage- und Streuungsparameter ................................. 121 Teil III: Mathelllatische Statistik 11 Relative Hiiufigkeiten 11.1 Schiitzen relativer Hiiufigkeiten ................................. 127 Punktschiitzung .............................................. 128 Bereichschiitzung ............................................. 128 11.2 Testen von Hypothesen ii her relative Hiiufigkeiten ............... 136 11.3 Vergleich zweier relativer Hiiufigkeiten .......................... 140 12 Die Parameter der Normalverteilung 12.1 Der Mittelwert ............................................... 143 12.2 Die Varianz .................................................. 148 12.3 Vergleich zweier Normalverteilungen ............................ 152 Vergleich der Mittelwerte ...................................... 152 Vergleich der Varianzen ....................................... 156 13 Verteilungsunabhiingige Verfahren 13.1 Schiitzen und Testen von Fraktilen ............................. 159 13.2 Statistische Toleranzintervalle .................................. 163 x Inhaltsverzeichnis 14 Der Chi-Quadrat-Test 14.1 Der Chi-Quaclrat-Anpassungstest ............................... 164 14.2 Der Chi-Quaclrat-Homogenitiitstest ............................. 168 15 Regressionsrechnung ......................................... 171 Tabellen Tabelle 1: Dichte cler hypergeometrischen Verteilung .................. 185 Tabelle 2: Dichte cler Binomial-Verteilung ............................ 186 Tabelle 3: Verteilungsfunktion cler Binomial-Verteilung ................ 187 Tabelle 4: Dichte cler Poisson-Verteilung ............................. 188 Tabelle 5: Verteilungsfunktion cler Poisson-Verteilung ................. 189 Tabelle 6: Verteilungsfunktion cler Stanclarcl-Normalverteilung .......... 190 Tabelle 7: Fraktile cler Stuclent-Verteilung ............................ 191 Tabelle 8: Fraktile cler Chi-Quadrat-Verteilung ........................ 192 Tabelle 9: Fraktile cler F-Verteilung .................................. 193 Nomogramm zur Bestimmung von Vertrauensschranken fur clen Anteil p in cler Grunclgesamtheit ............................. 194 Literatur ......................................................... 195 Sachverzeichnis .................................................. 197 Teil I Deskriptive Statistik