Markus Oestreich | Oliver Romberg Keine Panik vor Statistik! Markus Oestreich | Oliver Romberg Keine Panik vor Statistik! Erfolg und Spaß im Horrorfach nichttechnischer Studiengänge STUDIUM Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über <http://dnb.d-nb.de> abrufbar. Dr. Markus Oestreich Geboren 1967 in Herzberg am Harz. 1987 bis 1992 Studium der Technomathematik an der TU Clausthal mit Abschluss zum Dipl.-Math. 1992 bis 1998 wissenschaftlicher Mitarbeiter am Institut für Mechanik der Universität Hannover und 1998* Promotion zum Dr.-Ing. Seit 1998 in der Automobil- industrie tätig, davon ab 2001 in den USA. *am Freitag, dem 13. Dr. Oliver Romberg Geboren 1965 in Bremen (bei Hannover). 1987 bis 1993 Studium des Maschinenbaus mit dem Schwerpunkt Mechanik an der Universität Hannover. 1993 bis 1998 wissenschaftlicher Mitarbeiter am Institut für Mechanik der Universität Hannover und 1998 Promotion zum Dr.-Ing. Seit 1998 in Bremen (bei Hannover) in der Raumfahrt tätig www.dont-panic-with-mechanics.com 1. Auflage 2009 Alle Rechte vorbehalten © Vieweg+Teubner|GWV Fachverlage GmbH, Wiesbaden 2009 Lektorat: Ulrich Sandten | Kerstin Hoffmann Vieweg+Teubner ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung:KünkelLopka Medienentwicklung, Heidelberg © Cartoons: Oliver Romberg, Bremen Druck und buchbinderische Verarbeitung: STRAUSS GMBH, Mörlenbach Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8348-0282-8 Vorwort (wird sowieso nur von 11.7% der Leser beachtet) ... noch ein Buch mit Grundlagen der Statistik? Warum? Auch wenn es doch wirklich schon eine Menge Bu¨cher zu diesem Thema gibt, haben wir uns davon nicht abschrecken lassen! Rein statistisch gesehen hat n¨amlich auf diesem Planeten nur jeder 1242742ste ein Statistik-Buch ganz und ger- ne gelesen und weniger als jeder 6-einhalb Milliardste hat ein solches Buch wirklich verstanden. Und im Versuch, diese Erdstatistik1 zu verbessern, ist es genau das, was dieses Buch so anders“ als die Anderen“ macht. ” ” Die Statistik ist als Teilgebiet der beru¨chtigten Mathematik in vielen Stu- dieng¨angen von A wie Abenteuerp¨adagogik2 bis hin zu Z wie Zytologie schwer gefu¨rchtet! Gerade in vielen nichttechnischen F¨achern, wie Sozial- wissenschaften, Politologie oder Psychologie stellt die Statistik als wichtiges Werkzeug eine unangenehme Hu¨rde fu¨r anderweitig interessierte Studen- tinnen und Studenten dar. Viele beklagen sich: Wenn ich mich fu¨r solche ” Sachen interessieren wu¨rde, h¨atte ich doch Mathe (igitt!) studiert“. Aber der Statistik-Schein muss sein, sonst gibt es keine Magister-Urkunde und stattdessen winkt der Taxi-Schein (schon fru¨her als sonst). Auch in vielen technischen und naturwissenschaftlichen Bereichen3, wo die manchmal selt- sam anmutenden mathematischen Methoden (g¨ahn!) der Statistik Anwen- dung finden, mu¨ssen sich Studierende mit diesem Thema auseinandersetzen. Dabei gilt auch fu¨r die Statistik: Man kann diese theoretische und abstrakte mathematischeDisziplinoftsehrvielanschaulicheralsinvielenLehrbu¨chern darstellen und das Ganze noch mit Humor und Cartoons wu¨rzen. Stati- stik kann auch witzig sein! Mit einer bereits nicht nur statistisch bew¨ahrten unkonventionellen Darstellungsweise analog zu den Bu¨chern Keine Panik ” vor Mechanik!“ und Keine Panik vor Thermodynamik!“ l¨asst sich fu¨r viele ” ein einfacher Zugang zur Statistik finden und eine Bru¨cke zu den ernsteren und theoretischen Lehrbu¨chern fu¨r Experten schlagen. Der Wert anderer Lehrbu¨cher soll dadurch aber nicht gemindert werden! Ganz im Gegenteil, denn auch hier gilt: Die Lektu¨re weiterfu¨hrender, wissenschaftlicher Bu¨cher ist zwingend erforderlich und jedem zu empfehlen, der sich von den soliden 1 Herr Dr. Oestreich weist darauf hin, dass diese Statistik auf dem Planeten Vulcan we- sentlich positiver ausf¨allt. 2 ja, diesen Studiengang gibt es wirklich! 3 deren Vertreter laut statistischen Umfragen im Taxi meist hinten Platz nehmen VI Fundamenten der Statistik und der liebevollen Ausgestaltung der Details u¨berzeugen m¨ochte. Auch in diesem Panik-Buch haben wir keine Zusam- menh¨ange selbst entwickelt und das Rad der Statistik nicht neu erfunden. Wir haben so gesehen den Inhalt des Buches (was die Statistik betrifft) einfach abgekupfert. Als Vorlage diente dabei eine Kombination der in der Literaturliste angegebenen Quellen. Neu ist hingegen die Art und Weise der Darstellung und wir hoffen, sie macht neben einem großen Lerneffekt viel Spaß! Und abschließend noch ein Hinweis: Wenn ihr beim Lesen der nachfolgenden Seiten das ein oder andere Mal den Eindruck habt, dass wir, die beiden Au- toren, uns bei jeder Gelegenheit gegenseitig einen reinwu¨rgen, dann t¨auscht das nicht! Es ist aber mit wenigen Ausnahmen meistens nicht so gemeint!4 Clausthal-Zellerfeld, im August 2008 Dr. Markus Oestreich Bremen, im August 2008 Dr. Oliver Romberg 4 wenngleichHerrDr.Rombergimmernochnichtverstehenkann,wasjemandenzueinem Studium in der abgelegenen Bergregion von Clausthal-Zellerfeld bewegen kann. Inhaltsverzeichnis 1 Erstmal locker bleiben: Es f¨angt ganz einfach an! 1 1.1 Subjektive Wahrscheinlichkeit - oder warum ...? . . . . . 4 1.2 Was Ethik mit Statistik zu tun hat - Pinocchio weiß es . 6 1.3 Was im Weiteren noch so kommt . . . . . . . . . . . . . . 7 2 Keine Taten ohne Daten! 10 2.1 Ein bisschen Fachsimpelei zum Einstieg . . . . . . . . . . 11 2.1.1 Grundgesamtheit . . . . . . . . . . . . . . . . . . . . . 11 2.1.2 Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . 12 2.1.3 Teil- und Vollerhebung . . . . . . . . . . . . . . . . . . 12 2.1.4 Verzerrung, Bias . . . . . . . . . . . . . . . . . . . . . 13 2.1.5 Einzelobjekte und Merkmale . . . . . . . . . . . . . . 14 2.1.6 Prim¨ar- und Sekund¨arstatistik . . . . . . . . . . . . . 16 2.1.7 Erhebungsarten . . . . . . . . . . . . . . . . . . . . . . 17 2.1.7.1 Beobachtung . . . . . . . . . . . . . . . . . . 18 2.1.7.2 Experiment . . . . . . . . . . . . . . . . . . . 18 2.1.7.3 Befragung . . . . . . . . . . . . . . . . . . . 18 2.2 Ohne Daten geht es nicht . . . . . . . . . . . . . . . . . . 19 2.2.1 J¨ager und Sammler - statistische Datenerhebung . . . 19 2.2.2 Charakterisierung von Datentypen und Merkmalen . . 22 2.2.2.1 Qualitative- und quantitative Merkmale . . . 23 2.2.2.2 Skalenniveau . . . . . . . . . . . . . . . . . . 23 2.2.2.3 Diskrete und stetige Merkmale . . . . . . . . 26 3 Kombiniere, Dr. Watson - Kombinatorik 29 3.1 Das 1x1 der Kombinierer . . . . . . . . . . . . . . . . . . 30 3.2 Ne’ Kiste Bier als Urnenmodell . . . . . . . . . . . . . . . 31 3.3 Monstren, Mumien, Permutationen . . . . . . . . . . . . . 34 3.4 Var, Var, Variationen - immer sch¨on der Reihe nach . . . 36 3.4.1 Variationen ohne Wiederholung . . . . . . . . . . . . . 37 3.4.2 Variationen mit Wiederholung . . . . . . . . . . . . . 37 VIII Inhaltsverzeichnis 3.5 Kombinationen - Was drin ist z¨ahlt, nicht wie! . . . . . . 39 3.5.1 Kombinationen ohne Wiederholung . . . . . . . . . . . 39 3.5.2 Kombinationen mit Wiederholung . . . . . . . . . . . 40 3.6 Auf den Punkt gebracht - Zusammenfassung . . . . . . . 42 I BESCHREIBENDE STATISTIK 43 4 Es war einmal ein Merkmal 45 4.1 Von Stichproben (Aua!) zum Dosenstechen . . . . . . . . 46 4.1.1 Stengel-Blatt-Diagramm . . . . . . . . . . . . . . . . . 48 4.2 H¨aufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . . 49 4.2.1 Klasse, hier gehts um Bildung - Klassenbildung . . . . 52 4.2.2 Vom Histogramm und der empirischen Dichte . . . . . 56 4.3 Summenh¨aufigkeiten . . . . . . . . . . . . . . . . . . . . . 59 4.4 Mann, sieht die gut aus - Grafische Darstellung . . . . . . 63 4.4.1 Bis sich die Balken biegen - Balkendiagramm . . . . . 64 4.4.2 Punkt, Punkt, Komma, Strich - Liniendiagramm . . . 65 4.4.3 Und zum Kaffee: Kreis- oder Tortendiagramm . . . . 66 5 Lage und Streuung 69 5.1 Wie ist die Lage? . . . . . . . . . . . . . . . . . . . . . . . 71 5.1.1 Erst mal den Modus festlegen . . . . . . . . . . . . . . 71 5.1.2 Median und Bl¨odian . . . . . . . . . . . . . . . . . . . 72 5.1.3 Latein fu¨r Anf¨anger: Quantile, Quartile, Dezile, ... . . 75 5.1.3.1 Quantile - Mit der Formel zum Erfolg . . . . 77 5.1.3.2 Quantile - Mit der Grafik zum Erfolg . . . . 78 5.1.4 Minimus Maximus . . . . . . . . . . . . . . . . . . . . 80 5.1.5 Ab durch die Mitte, Mittelwert . . . . . . . . . . . . . 81 5.1.5.1 Arithmetischer Mittelwert . . . . . . . . . . 81 5.1.5.2 Gewichteter Mittelwert . . . . . . . . . . . . 83 5.1.5.3 Geometrischer Mittelwert . . . . . . . . . . . 85 5.1.5.4 Harmonischer Mittelwert . . . . . . . . . . . 87 5.1.6 Na, wo liegen sie denn? Vergleich zur Lage . . . . . . 88 5.1.6.1 Grafisch zusammengefasst: Box-Whisker-Plot 90 5.2 Nun noch eine Prise Streuungen . . . . . . . . . . . . . . 92 5.2.1 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . 94 IX 5.2.2 Quartilsabstand . . . . . . . . . . . . . . . . . . . . . 94 5.2.3 Mittlere Abweichung vom Median . . . . . . . . . . . 95 5.2.4 Varianz und Arroganz . . . . . . . . . . . . . . . . . . 96 5.2.5 Standardabweichung . . . . . . . . . . . . . . . . . . . 97 5.2.6 Variationskoeffizient . . . . . . . . . . . . . . . . . . . 100 5.2.7 Na, wie streuen sie denn? Vergleich zur Streuung . . . 101 6 Es war zweimal ein Merkmal 103 6.1 Von Kontinenztabellen und anderen Problemen . . . . . . 104 6.2 Korrelu, Korreli, Korrelation . . . . . . . . . . . . . . . . 109 6.2.1 Der Korrelationskoeffizient von Bravais-Pearson . . . . 112 6.2.2 Der Rangkorrelationskoeffizient von Spearman . . . . 120 6.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . 124 II DIE SACHE MIT DER WAHRSCHEINLICHKEIT 128 7 Vom Rechnen mit dem Zufall 130 7.1 Was ist Zufall? . . . . . . . . . . . . . . . . . . . . . . . . 130 7.1.1 Von Laplace und anderen Zockern . . . . . . . . . . . 133 7.1.2 Empirische Wahrscheinlichkeit . . . . . . . . . . . . . 136 7.1.3 Intuition, Erfahrung, subjektive Wahrscheinlichkeit . . 139 7.2 Das BGB der Wahrscheinlichkeit . . . . . . . . . . . . . . 140 7.2.1 Wir machen Komplemente . . . . . . . . . . . . . . . 141 7.2.2 Mengen aller L¨ander vereinigt Euch! . . . . . . . . . . 142 7.2.3 Nicht mehr als Durchschnitt. . . . . . . . . . . . . . . 143 7.2.4 Disjunkt . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.2.5 Differenzmengen . . . . . . . . . . . . . . . . . . . . . 144 7.3 Mit Wahrscheinlichkeit richtig rechnen . . . . . . . . . . . 144 7.3.1 Additionssatz fu¨r beliebige Ereignisse . . . . . . . . . 144 7.3.2 Wahrhaft wahrscheinlich: Bedingte Wahrscheinlichkeit 147 7.3.3 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . 149 7.3.4 Stochastische Unabh¨angigkeit . . . . . . . . . . . . . . 150 7.3.5 Fu¨r Heißdu¨sen: Das Bayes-Theorem . . . . . . . . . . 152 7.4 Rechnen mit Dosen und Tequila . . . . . . . . . . . . . . 153 X Inhaltsverzeichnis 8 Das A und O der Wahrscheinlichkeitsverteilungen 158 8.1 Von Zufallsvariablen und Ihrer Funktion . . . . . . . . . . 158 8.2 Die Wahrheit, aber bitte diskret! . . . . . . . . . . . . . . 162 8.2.1 Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen 162 8.2.2 Der Weg zur diskreten Verteilungsfunktion . . . . . . 165 8.2.3 Erwartungswert und Varianz bei diskreten Daten . . . 166 8.3 Langsam, aber stetig zur Wahrheit . . . . . . . . . . . . . 170 8.3.1 Wenn die Wahrscheinlichkeitsfunktiondichte stetig ist 171 8.3.2 Stetige Verteilungsfunktion . . . . . . . . . . . . . . . 177 8.3.3 Mittelwert und Varianz bei stetigen Daten . . . . . . . 182 8.4 Wie war das noch mit Erwartungswert und Varianz? . . . 184 9 Im Angebot: Spezielle Verteilungen 185 9.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . 186 9.1.1 Es f¨angt mit Bernoulli an . . . . . . . . . . . . . . . . 186 9.1.2 Ein Bernoulli, zwei Bernoulli, drei ... Binomialverteilung187 9.1.3 Hyper, Hyper, Hypergeometrische Verteilung . . . . . 197 9.1.4 Poisson sans boisson est poison - Poisson Verteilung . 200 9.2 Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . 205 9.2.1 Alles gleich, Gleichverteilung . . . . . . . . . . . . . . 205 9.2.2 Normalverteilung: Die Mutter aller Verteilungen . . . 206 9.2.3 Kennt man eine, kennt man alle: Standardnormalver- teilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 9.2.4 Das Wichtigste auf einer Seite . . . . . . . . . . . . . 218 III BEURTEILENDE STATISTIK 221 10 Parametersch¨atzung, Mr. Spock l¨asst gru¨ßen 223 10.1 Punkt, Punkt, Komma, Intervall . . . . . . . . . . . . . . 223 10.2 Vertrauen ist gut, Konfidenz ist besser . . . . . . . . . . . 228 10.3 Vom Lotto, Sch¨atzen und dem zentralen Grenzwertsatz . 230 10.4 Auf direktem Weg zum Konfidenzintervall . . . . . . . . . 234 10.4.1 Konfidenzintervalle fu¨r Erwartungswerte . . . . . . . . 237 10.4.1.1 Normalverteilte Grundgesamtheit, bekannte Varianz . . . . . . . . . . . . . . . . . . . . . 237 XI 10.4.1.2 NormalverteilteGrundgesamtheit,unbekann- te Varianz . . . . . . . . . . . . . . . . . . . 238 10.4.1.3 Keine Ahnung und große Stichproben . . . . 242 10.4.2 Konfidenzintervall fu¨r die Wahrscheinlichkeit . . . . . 243 10.4.3 Konfidenzintervall fu¨r die Varianz . . . . . . . . . . . 244 10.5 Wie breit h¨atten Sie’s denn gern? . . . . . . . . . . . . . 247 10.6 Und gelernt haben wir ... . . . . . . . . . . . . . . . . . . 249 11 Zum Nachtisch: Hypothesentests 250 11.1 Grundlagen fu¨r Einsteiger . . . . . . . . . . . . . . . . . . 250 11.1.1 Oktoberfest in Mu¨nchen: Ooozopft is’“ . . . . . . . . 252 ” 11.1.2 Und die Hypothese ist, ... . . . . . . . . . . . . . . . . 254 11.1.3 Dann Testen wir doch mal . . . . . . . . . . . . . . . . 259 11.1.4 Wie im wirklichen Leben: Entscheidung und m¨ogliche Fehlentscheidung . . . . . . . . . . . . . . . . 263 11.2 Olli’s Kochstudio: Rezepte zum Testen . . . . . . . . . . . 268 11.2.1 Testen von Mittelwerten . . . . . . . . . . . . . . . . . 269 11.2.2 Normalverteilte Grundgesamtheit, bekannte Varianz . 269 11.2.3 Normalverteilte Grundgesamtheit, unbekannte Varianz 271 11.2.4 Irgendwieverteilte Grundgesamtheit, große Stichprobe 272 11.2.5 Testen von Wahrscheinlichkeiten . . . . . . . . . . . . 274 11.2.6 Testen der Varianz . . . . . . . . . . . . . . . . . . . . 275 11.2.7 Jetzt hat’s sich ausgetestet! . . . . . . . . . . . . . . . 276 12 Ende gut, Alles gut! 277 13 Aufgaben mit L¨osungsweg 278 A Tabellen ohne Ende 314 Literaturverzeichnis 322 Stichwortverzeichnis 324