Keine Panik vor Statistik! Markus Oestreich • Oliver Romberg Keine Panik vor Statistik! Erfolg und Spaß im Horrorfach nichttechnischer Studiengänge 5., aktualisierte Aufl age Dr. Markus Oestreich Dr. Oliver Romberg DeWitt, MI, USA Bremen, Deutschland ISBN 978-3-658-04604-0 ISBN 978-3-658-04605-7 (eBook) DOI 10.1007/978-3-658-04605-7 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografi e; detaillierte bibliografi sche Daten sind im Internet über http://dnb.d-nb.de abrufb ar. Springer Spektrum © Springer Fachmedien Wiesbaden 2008, 2009, 2010, 2012, 2014 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht aus- drücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfi lmungen und die Ein- speicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be- rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürft en. © Cartoons: Oliver Romberg, Bremen Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Springer Spektrum ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.springer-spektrum.de V Vorwort (wird sowieso nur von 11.7% der Leser beachtet) ... noch ein Buch mit Grundlagen der Statistik? Warum? Auch wenn es doch wirklich schon eine Menge Bu¨cher zu diesem Thema gibt, haben wir uns davon nicht abschrecken lassen! Rein statistisch gesehen hat n¨amlich auf diesem Planeten nur jeder 1242742ste ein Statistik-Buch ganz und ger- ne gelesen und weniger als jeder 6-einhalb Milliardste hat ein solches Buch wirklich verstanden. Und im Versuch, diese Erdstatistik1 zu verbessern, ist es genau das, was dieses Buch so anders“ als die Anderen“ macht. ” ” Die Statistik ist als Teilgebiet der beru¨chtigten Mathematik in vielen Stu- dieng¨angen von A wie Abenteuerp¨adagogik2 bis hin zu Z wie Zytologie schwer gefu¨rchtet! Gerade in vielen nichttechnischen F¨achern wie Sozial- wissenschaften, Politologie oder Psychologie stellt die Statistik als wichtiges Werkzeug eine unangenehme Hu¨rde fu¨r anderweitig interessierte Studen- tinnen und Studenten dar. Viele beklagen sich: Wenn ich mich fu¨r solche ” Sachen interessieren wu¨rde, h¨atte ich doch Mathe (igitt!) studiert.“ Aber der Statistik-Schein muss sein, sonst gibt es keine Magister-Urkunde und stattdessen winkt der Taxi-Schein (schon fru¨her als sonst). Auch in vielen technischen und naturwissenschaftlichen Bereichen3, wo die manchmal selt- sam anmutenden mathematischen Methoden (g¨ahn!) der Statistik Anwen- dung finden, mu¨ssen sich Studierende mit diesem Thema auseinandersetzen. Dabei gilt auch fu¨r die Statistik: Man kann diese theoretische und abstrakte mathematischeDisziplinoftsehrvielanschaulicheralsinvielenLehrbu¨chern darstellen und das Ganze noch mit Humor und Cartoons wu¨rzen. Statis- tik kann auch witzig sein! Mit einer bereits nicht nur statistisch bew¨ahrten unkonventionellen Darstellungsweise analog zu den Bu¨chern Keine Panik ” vor Mechanik!“ und Keine Panik vor Thermodynamik!“ l¨asst sich fu¨r viele ” ein einfacher Zugang zur Statistik finden und eine Bru¨cke zu den ernsteren und theoretischen Lehrbu¨chern fu¨r Experten schlagen. Der Wert anderer Lehrbu¨cher soll dadurch aber nicht gemindert werden! Ganz im Gegenteil, denn auch hier gilt: Die Lektu¨re weiterfu¨hrender, wissenschaftlicher Bu¨cher ist zwingend erforderlich und jedem zu empfehlen, der sich von den soliden 1 Herr Dr. Oestreich weist darauf hin, dass diese Statistik auf dem Planeten Vulcan we- sentlich positiver ausf¨allt. 2 ja, diesen Studiengang gibt es wirklich! 3 deren Vertreter laut statistischen Umfragen im Taxi meist hinten Platz nehmen. VI Vorwort Fundamenten der Statistik und der liebevollen Ausgestaltung der Details u¨berzeugen m¨ochte. Auch in diesem Panik-Buch haben wir keine Zusam- menh¨ange selbst entwickelt und das Rad der Statistik nicht neu erfunden. Wir haben so gesehen den Inhalt des Buches (was die Statistik betrifft) einfach abgekupfert. Als Vorlage diente dabei eine Kombination der in der Literaturliste angegebenen Quellen. Neu ist hingegen die Art und Weise der Darstellung und wir hoffen, sie macht neben einem großen Lerneffekt viel Spaß! Wenn Ihr u¨brigens beim Lesen der nachfolgenden Seiten das ein oder andere MaldenEindruckhabt,dasswir,diebeidenAutoren,unsbeijederGelegen- heit gegenseitig einen reinwu¨rgen, dann t¨auscht das nicht! Es ist aber mit wenigen Ausnahmen meistens nicht so gemeint!4 Und abschließend noch etwas, u¨ber das wir uns ganz besonders freuen: Ihr haltet hier nun bereits schon die fu¨nfte Auflage in den H¨anden, in der er- neut einige der - natu¨rlich aus rein p¨adagogischen Gru¨nden urspru¨nglich ab- sichtlich hineinpraktizierten - Fehler korrigiert wurden. Danke, Danke, und nochmals Danke an alle K¨aufer5 dieses Buches, fu¨r das große Interesse und das zahlreiche positive und nu¨tzliche Feedback! Clausthal-Zellerfeld, im Januar 2014 Dr. Markus Oestreich Bremen, im Januar 2014 Dr. Oliver Romberg www.keine-panik-vor-statistik.de www.dont-panic-with-mechanics.com 4 wenngleichHerrDr.Rombergimmernochnichtverstehenkann,wasjemandenzueinem Studium in der abgelegenen Bergregion von Clausthal-Zellerfeld bewegen kann. 5 EsseiandieserStelleausdru¨cklichbetont,dassesdidaktischu¨-ber-hauptnichtsnu¨tzt, sich das Buch nur auszuleihen! Dies haben Studien in den USA(!) eindeutig bewiesen. Inhaltsverzeichnis Inhaltsverzeichnis VII 1 Erst mal locker bleiben: Es f¨angt ganz einfach an! 1 1.1 Subjektive Wahrscheinlichkeit - oder warum ...? . . . . . 4 1.2 Was Ethik mit Statistik zu tun hat - Pinocchio weiß es . 6 1.3 Was im Weiteren noch so kommt . . . . . . . . . . . . . . 7 2 Keine Taten ohne Daten! 10 2.1 Ein bisschen Fachsimpelei zum Einstieg . . . . . . . . . . 11 2.1.1 Grundgesamtheit . . . . . . . . . . . . . . . . . . . . . 11 2.1.2 Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . 12 2.1.3 Teil- und Vollerhebung . . . . . . . . . . . . . . . . . . 12 2.1.4 Verzerrung, Bias . . . . . . . . . . . . . . . . . . . . . 13 2.1.5 Einzelobjekte und Merkmale . . . . . . . . . . . . . . 14 2.1.6 Prim¨ar- und Sekund¨arstatistik . . . . . . . . . . . . . 16 2.1.7 Erhebungsarten . . . . . . . . . . . . . . . . . . . . . . 17 2.1.7.1 Beobachtung . . . . . . . . . . . . . . . . . . 18 2.1.7.2 Experiment . . . . . . . . . . . . . . . . . . . 18 2.1.7.3 Befragung . . . . . . . . . . . . . . . . . . . 18 2.2 Ohne Daten geht es nicht . . . . . . . . . . . . . . . . . . 19 2.2.1 J¨ager und Sammler - Statistische Datenerhebung . . . 19 2.2.2 Charakterisierung von Datentypen und Merkmalen . . 22 2.2.2.1 Qualitative- und quantitative Merkmale . . . 23 2.2.2.2 Skalenniveau . . . . . . . . . . . . . . . . . . 23 2.2.2.3 Diskrete und stetige Merkmale . . . . . . . . 26 3 Kombiniere, Dr. Watson - Kombinatorik 29 3.1 Das 1x1 der Kombinierer . . . . . . . . . . . . . . . . . . 30 3.2 Ne’ Kiste Bier als Urnenmodell . . . . . . . . . . . . . . . 31 3.3 Monstren, Mumien, Permutationen . . . . . . . . . . . . . 34 3.4 Var, Var, Variationen - immer sch¨on der Reihe nach . . . 36 3.4.1 Variationen ohne Wiederholung . . . . . . . . . . . . . 37 VIII Inhaltsverzeichnis 3.4.2 Variationen mit Wiederholung . . . . . . . . . . . . . 37 3.5 Kombinationen - Was drin ist z¨ahlt, nicht wie! . . . . . . 39 3.5.1 Kombinationen ohne Wiederholung . . . . . . . . . . . 39 3.5.2 Kombinationen mit Wiederholung . . . . . . . . . . . 40 3.6 Auf den Punkt gebracht - Zusammenfassung . . . . . . . 42 I BESCHREIBENDE STATISTIK 43 4 Es war einmal ein Merkmal 45 4.1 Von Stichproben (Aua!) zum Dosenstechen . . . . . . . . 46 4.1.1 Stengel-Blatt-Diagramm . . . . . . . . . . . . . . . . . 48 4.2 H¨aufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . . 49 4.2.1 Klasse, hier gehts um Bildung - Klassenbildung . . . . 52 4.2.2 Vom Histogramm und der empirischen Dichte . . . . . 56 4.3 Summenh¨aufigkeiten . . . . . . . . . . . . . . . . . . . . . 59 4.4 Mann, sieht die gut aus - Graphische Darstellung . . . . . 63 4.4.1 Bis sich die Balken biegen - Balkendiagramm . . . . . 64 4.4.2 Punkt, Punkt, Komma, Strich - Liniendiagramm . . . 65 4.4.3 Und zum Kaffee: Kreis- oder Tortendiagramm . . . . 66 5 Lage und Streuung 69 5.1 Wie ist die Lage? . . . . . . . . . . . . . . . . . . . . . . . 71 5.1.1 Erst mal den Modus festlegen . . . . . . . . . . . . . . 71 5.1.2 Median und Bl¨odian . . . . . . . . . . . . . . . . . . . 72 5.1.3 Latein fu¨r Anf¨anger: Quantile, Quartile, Dezile, ... . . 75 5.1.3.1 Quantile - Mit der Formel zum Erfolg . . . . 77 5.1.3.2 Quantile - Mit der Graphik zum Erfolg . . . 78 5.1.4 Minimus Maximus . . . . . . . . . . . . . . . . . . . . 80 5.1.5 Ab durch die Mitte, Mittelwert . . . . . . . . . . . . . 81 5.1.5.1 Arithmetischer Mittelwert . . . . . . . . . . 81 5.1.5.2 Gewichteter Mittelwert . . . . . . . . . . . . 83 5.1.5.3 Geometrischer Mittelwert . . . . . . . . . . . 85 5.1.5.4 Harmonischer Mittelwert . . . . . . . . . . . 87 5.1.6 Na, wo liegen sie denn? Vergleich zur Lage . . . . . . 88 5.1.6.1 Graphischzusammengefasst:Box-Whisker-Plot 90 5.2 Nun noch eine Prise Streuungen . . . . . . . . . . . . . . 92 Inhaltsverzeichnis IX 5.2.1 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . 94 5.2.2 Quartilsabstand . . . . . . . . . . . . . . . . . . . . . 94 5.2.3 Mittlere Abweichung vom Median . . . . . . . . . . . 95 5.2.4 Varianz und Arroganz . . . . . . . . . . . . . . . . . . 96 5.2.5 Standardabweichung . . . . . . . . . . . . . . . . . . . 97 5.2.6 Variationskoeffizient . . . . . . . . . . . . . . . . . . . 100 5.2.7 Na, wie streuen sie denn? Vergleich zur Streuung . . . 101 6 Es war zweimal ein Merkmal 103 6.1 Von Kontinenztabellen und anderen Problemen . . . . . . 104 6.2 Korrelu, Korreli, Korrelation . . . . . . . . . . . . . . . . 109 6.2.1 Der Korrelationskoeffizient von Bravais-Pearson . . . . 112 6.2.2 Der Rangkorrelationskoeffizient von Spearman . . . . 120 6.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . 124 II DIE SACHE MIT DER WAHRSCHEINLICHKEIT 128 7 Vom Rechnen mit dem Zufall 130 7.1 Was ist Zufall? . . . . . . . . . . . . . . . . . . . . . . . . 130 7.1.1 Von Laplace und anderen Zockern . . . . . . . . . . . 133 7.1.2 Empirische Wahrscheinlichkeit . . . . . . . . . . . . . 136 7.1.3 Intuition, Erfahrung, subjektive Wahrscheinlichkeit . . 139 7.2 Das BGB der Wahrscheinlichkeit . . . . . . . . . . . . . . 140 7.2.1 Wir machen Komplemente . . . . . . . . . . . . . . . 141 7.2.2 Mengen aller L¨ander vereinigt Euch! . . . . . . . . . . 142 7.2.3 Nicht mehr als Durchschnitt . . . . . . . . . . . . . . . 143 7.2.4 Disjunkt . . . . . . . . . . . . . . . . . . . . . . . . . . 143 7.2.5 Differenzmengen . . . . . . . . . . . . . . . . . . . . . 144 7.3 Mit Wahrscheinlichkeit richtig rechnen . . . . . . . . . . . 144 7.3.1 Additionssatz fu¨r beliebige Ereignisse . . . . . . . . . 144 7.3.2 Wahrhaft wahrscheinlich: Bedingte Wahrscheinlichkeit 147 7.3.3 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . 149 7.3.4 Stochastische Unabh¨angigkeit . . . . . . . . . . . . . . 150 7.3.5 Fu¨r Heißdu¨sen: Das Bayes-Theorem . . . . . . . . . . 152 7.4 Rechnen mit Dosen und Tequila . . . . . . . . . . . . . . 153 X Inhaltsverzeichnis 8 Das A und O der Wahrscheinlichkeitsverteilungen 158 8.1 Von Zufallsvariablen und ihrer Funktion . . . . . . . . . . 158 8.2 Die Wahrheit, aber bitte diskret! . . . . . . . . . . . . . . 162 8.2.1 Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen 162 8.2.2 Der Weg zur diskreten Verteilungsfunktion . . . . . . 165 8.2.3 Erwartungswert und Varianz bei diskreten Daten . . . 166 8.3 Langsam, aber stetig zur Wahrheit . . . . . . . . . . . . . 170 8.3.1 Wenn die Wahrscheinlichkeitsfunktiondichte stetig ist 171 8.3.2 Stetige Verteilungsfunktion . . . . . . . . . . . . . . . 177 8.3.3 Mittelwert und Varianz bei stetigen Daten . . . . . . . 182 8.4 Wie war das noch mit Erwartungswert und Varianz? . . . 184 9 Im Angebot: Spezielle Verteilungen 185 9.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . 186 9.1.1 Es f¨angt mit Bernoulli an . . . . . . . . . . . . . . . . 186 9.1.2 Ein Bernoulli, zwei Bernoulli, drei ... Binomialverteilung187 9.1.3 Hyper, Hyper, Hypergeometrische Verteilung . . . . . 197 9.1.4 Poisson sans boisson est poison - Poisson Verteilung . 200 9.2 Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . 205 9.2.1 Alles gleich, Gleichverteilung . . . . . . . . . . . . . . 205 9.2.2 Normalverteilung: Die Mutter aller Verteilungen . . . 206 9.2.3 Kennt man eine, kennt man alle: Standardnormalver- teilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 9.3 Das Wichtigste auf einer Seite . . . . . . . . . . . . . . . 218 III BEURTEILENDE STATISTIK 221 10 Parametersch¨atzung, Mr. Spock l¨asst gru¨ßen 223 10.1 Punkt, Punkt, Komma, Intervall . . . . . . . . . . . . . . 223 10.2 Vertrauen ist gut, Konfidenz ist besser . . . . . . . . . . . 228 10.3 Vom Lotto, Sch¨atzen und dem zentralen Grenzwertsatz . 230 10.4 Auf direktem Weg zum Konfidenzintervall . . . . . . . . . 234 10.4.1 Konfidenzintervalle fu¨r Erwartungswerte . . . . . . . . 237 10.4.1.1 Normalverteilte Grundgesamtheit, bekannte Varianz . . . . . . . . . . . . . . . . . . . . . 237