Gerd Fischer Stochastik einmal anders Aus dem Programm ________- --.,. Mathematik Stochastik fur Einsteiger von Norbert Henze Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik von Ulrich Krengel Lineare Algebra von Albrecht Beutelspacher Lineare Algebra von Gerd Fischer Analytische Geometrie von Gerd Fischer Analysis 1-3 von Otto Forster Analysis 1-2 von Ehrhard Behrends vieweg ________________ ~ Gerd Fischer Stochastik einmal anders Parallel geschrieben mit Beispielen und Fakten, vertieft durch ErUiuterungen rII vleweg Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet tiber <http://dnb.ddb.de> abrufbar. Prof. Dr. Gerd Fischer Fakultat flir Mathematik der Technische Universitat Mtinchen 85747 Mtinchen E-Mail: [email protected] 1. Auflage Februar 2005 Aile Rechte vorbehaiten © Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH, Wiesbaden 2005 Lektorat: Ulrike Schmickler-Hirzebruch/ Petra RuBkamp Der Vieweg Verlag ist ein Unternehmen von Springer Science+Business Media. www.vieweg.de Das Werk einschlieBlich aller seiner Teile ist urheberrechtlich geschtitzt. Jede Verwertung auBerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzuHi.ssig und strafbar. Das gilt insbe sondere flir Vervielfiiltigungen, Obersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Umschlaggestaltung: Ulrike Weigel, www.CorporateDesignGroup.de Textbearbeitung: Christoph Eyrich, Berlin Gedruckt auf siiurefreiem und chlorfrei gebleichtem Papier. ISBN-13: 978-3-528-03967-7 e-ISBN-13: 978-3-322-80249-1 001: 10.1007/978-3-322-80249-1 Herrn Hanns Klinger gewidmet Vorwort Dieser Text ist entstanden aus mehreren Vorlesungen flir Studierende mit Mathe matik als Nebenfach und Veranstaltungen zur Lehrerfortbildung an der Heinrich Heine-Universitat Diisseldorf. Sie dienten einer erst en Einflihrung in die Frage stellungen und Methoden der Wahrscheinlichkeitsrechnung und Statistik (kurz Stochastik) sowohl flir Studierende, die solche Techniken in ihrem Fach benoti gen, als auch fiir Lehrer, die sich flir den Unterricht mit den notigen fachlichen Grundlagen vertraut machen wollten. Der Inhalt eines solchen Kurses ist ziemlich kanonisch, auch die meisten Lehr plane fiir die Oberstufe des Gymnasiums wahlen diesen Weg. In Kapitel 1 iiber die Beschreibende Statistik werden erhobene Daten aufbereitet und durchleuch tet. Die behandelten Probleme trifft man im taglichen Leben an, die benotigten mathematischen Hilfsmittel sind zum groi3ten Teil sehr elementar. Dies ist ein idealer Einstieg und eine hervorragende Grundlage flir die Beschaftigung mit den Themen spaterer Kapitel. Kapite12 fiihrt in die Wahrscheinlichkeitsrechnung ein, hier beginnt der Zufall zu regieren. Die in der beschreibenden Statistik gefundenen Rechenregeln filr Haufig keiten sind eine gute Motivation fiir den abstrakten Begriff der Wahrscheinlich keit, die bei Merkmalen erprobten Begriffe finden sich analog bei Zufallsvariablen wieder. Man kann zwar in der Wahrscheinlichkeitsrechnung nicht mehr erreichen, als aus bekannten (oder als bekannt angenommenen) Wahrscheinlichkeiten ande re, noch unbekannte Wahrscheinlichkeiten zu berechnen, aber dabei treten viele iiberraschende Ergebnisse auf. Hohepunkt ist die Normalverteilung, da ist im Hintergrund einige klassische nicht-triviale Analysis im Spiel. In der elementa ren Wahrscheinlichkeitsrechnung betrachtet man nur endliche Ergebnismengen. Zum besseren Verstandnis der Normalverteilung und der Ausgangssituation bei Schatzungen und Tests ist es hilfreich, auch ein wenig iiber unendliche Ergebnis mengen und stetige Verteilungsfunktionen zu wissen. Das wird in sehr kompri mierter Form in Abschnitt 2.9 beschrieben. Wahrend der Inhalt der erst en beiden Kapitel bis auf den begriffiichen Rahmen schon zu Zeit en von GAUSS bekannt war, sind die Kapite13 und 4 iiber Schiitzen und Testen Kinder des 20. Jahrhunderts und stellen dementsprechend deutlich hohere Anforderungen an den Leser. Die Durchfiihrung der Verfahren ist Ge genstand des Grundkurses, an die genaueren mathematischen Hintergriinde wird man sich wohl nur in einem Leistungskurs wagen. Diese Themen gehoren zur sogenannten beurteilenden (oder schliefJenden) Statistik, einer Kombination von beschreibender Statistik mit Wahrscheinlichkeitsrechnung. Wenn man in der be schreibenden Statistik nicht alle Daten erheben kann oder will, so beschrankt man sich auf eine oder mehrere Stichproben, das Ergebnis erlaubt eine Schatzung vi der unbekannten wirklichen Werte. Ftir die GroBe der Abweichung des geschatz ten vom wirklichen Wert kann man nur noch Wahrscheinlichkeiten angeben. Die popularsten Beispiele ftir die dabei auftretenden Probleme sind Umfragen vor Wahlen oder Hochrechnungen am Wahlabend. Eine genauere Kenntnis der Unsi cherheit hatte wohl manche verfrlihte Siegesfeier vermieden, damit aber andrer seits den Unterhaltungswert der Wahlnacht geschmalert. Was tiberall in der Mathematik gilt, ist noch ausgepragter in der Stochastik: Es geht nichts liber markante Beispiele, die geeignet sind, die Anstrengungen in der Theorie zu rechtfertigen. Urn dem Leser dabei moglichst viel Freiheiten zu geben, ist der Text durchgehend parallel geftihrt: links die Beispiele, rechts die Fakten. Und weil Beweise und theoretische Erganzungen nicht von jedermann gleich geliebt sind, gibt es daftir einen Anhang mit Erliiuterungen. Ich hoffe, dass die Leser sich mit diesem Trio anfreunden konnen. Ftir die Verwendung im Unterricht an Gymnasien oder anderen Stellen hat die Teilung des Textes einen besonderen Vorteil: Zu den meisten Beispielen werden Schtiler und Studierende einen leichten Zugang finden. Die systematische mathe matische Darstellung auf den rechten Seiten kann man je nach Interesse mehr oder weniger grtindlich studieren. Zur Ausftihrung der meisten n6tigen Rech nungen gentigt einer der zum Schulgebrauch tiblichen Taschenrechner; ich habe einen "Equation Editor" verwendet, der auch tiber Statistikfunktionen verftigt. Ftir aufwandigere Rechnungen und die Einftigung der vielen Graphiken wurde das Programmpaket MAPLE verwendet. Es ist sicher verwegen, wenn ein absoluter Amateur auf dem Gebiet der Stochas tik wie der Autor einen solchen Text schreibt. Aber er hofft, dass die viele Mtihe, die er gehabt hat, die Grundlagen zu lemen, seine Darstellung ftir Leidensge nossen verstandlicher macht. Ich habe ungeniert aus vielen Quellen gesch6pft: insbesondere den Vorlesungnotizen meiner beiden Dlisseldorfer Kollegen Hanns Klinger und Klaus JanBen (der mich mit unermtidlicher Geduld immer wieder zu Korrekturen und Verbesserungen tiberedet hat), den leider vergriffenen Studien briefen des DIFF [St] und den professionellen Texten von KRENGEL [Kr] und HENZE [He]. Brigitte Kaletha hat einige der Beispiele beigetragen und ausgear beitet, Petra Gemein, Brigitte Singhof, Gabriele SliB und Oliver Wagener haben die TEX-Vorlagen erstellt und die Graphiken produziert. Ihnen allen sei gedankt, ebenso dem Verlag, der es gewagt hat den unzahligen Btichern tiber Stochastik noch ein weiteres hinzuzuftigen. Mtinchen, im Februar 2005 Gerd Fischer Inhaltsverzeichnis 1 Beschreibende Statistik 3 1.1 Individuen und ihre Merkmale 3 1.2 Haufigkeiten.. 7 1.3 Mittelwerte . . . . . . . . . . 15 1.4 StreuungsmaJ3e . . . . . . . . 29 1.5 Vergleich verschiedener Merkmale 37 2 Wahrscheinlichkeitsrechnung 57 2.1 Relative Haufigkeit und Wahrscheinlichkeit . . . . . . . 57 2.2 Gleichverteilung und Zufallsvariable . . . . . . . . . . . 71 2.3 Urnenmodelle und Simulation von Zufallsexperimenten 77 2.4 Binomialverteilung und hypergeometrische Verteilung . 89 2.5 Unabhiingige Ereignisse und bedingte Wahrscheinlichkeiten . 99 2.6 Ubergangswahrscheinlichkeiten und Multinomialverteilung 109 2.7 Erwartungswert, Varianz, Covarianz. . . . . . . . . 123 2.8 Die Gaul3-Verteilung . . . . . . . . . . . . . . . . . 135 2.9 Kontinuierliche Ergebnisse und stetige Verteilungen 165 3 Schatzungen 185 3.1 Punktschiitzungen........ 185 3.2 Maximum-Likelihood-Schiitzer 197 3.3 Intervallschiitzungen . . . . . . 199 4 Testen von Hypothesen 211 4.1 Einseitiger Binomialtest ........... 213 4.2 Zweiseitiger Binomialtest . . . . . . . . . . . 223 4.3 Einseitiger Gaul3-Test bei bekannter Varianz 229 4.4 Zweiseitiger Gaul3-Test bei bekannter Varianz 241 4.5 Tests und Schatzungen ........ 247 4.6 Test bei unbekannter Varianz (t-Test) 251 4.7 Der x2-Test . . . . . . . . . . . . . . . 261 Anhang 279 1.4 Streuungsmal3e . . . . . . . . . . . . . . . . . . . . . . 279 1.5 Vergleich verschiedener Merkmale . . . . . . . . . . . . 283 2.4 Binomialverteilung und hypergeometrische Verteilung . 289 2.5 Unabhangige Ereignisse und bedingte Wahrscheinlichkeiten . 290 2.6 Mehrstufige Experimente, Ubergangswahrscheinlichkeiten und Multinomialverteilung . . . . . 291 2.7 Erwartungswert, Varianz, Covarianz ............ 293 Vlll 2.8 Die GauB-Verteilung . . . . . . . . . . . . . . . . . 302 2.9 Kontinuierliche Ergebnisse und stetige Verteilungen 312 4.6 und 4.7 Die r-Funktion von EULER ....... . 321 Literaturverzeichnis 323 Index 325 Stochastik einmal anders Beispiel (U"ifrugc in d uer Schule) Rill 1~'I!lplC'1 rllr C'III£' \1I'1I~l' AI \"111 111(h\ulllt'll .... I C'III1' SdllllkhL.-,."'o(· 11111 II Sdlilll'rli \\('Idl(' il.h'rklllllll" III C'lIIt'r (!mrrn~(' ,'rhot.,.,· .. "'t'nlC'lI. IlaURI ''011 111"111 ZM't"'k liN jt£,wllu)o('htj'lI Stlllti>!lk /tl! Fllr ('illigI' IIlIh. . 11I'~{'IIfIt· ~1('rklU"lt· g£'lwu \\ Ir IIII~hth(' At""POIJI;lIIlP;t'll 1111 ~lNklllnl All"I,lrf..gIlUg(·1I .\ I C;NIIII'Chl IIIJUlIIlith w{'iblial XJ - (;('''urll'>Jllilr IIfllllrhrh(' Zsthl Xl (:t·llIlrt..·. .u rt ()rt"'llfUIlf' X, ""' t\tlrpNltrn6l' rN:llt· 'z• • hl X.. (;rllllli rilr 11.'11 Ilt'!'>udt dlt'!'.l .... &.~h~t~tl,~·.l..·''- _______. ..J lllll Ihl' AIl.. pn~III1R('1I 1Illllltt·1ttllllst,h IIl'l'oChrPlhl"u III IIIlIth"II, 11111"""11 MI' ""'1111 iO, q utIlIK('VIIi('rl "wliC'1I I)IIh.'1 hit'!C'I "kh lK,'i Mf,.hIlUI '\IIIII, " III ..... ilhl.'II. M w"lwi 0 ~1II1n1l1lkhM IIUlI I M"'c'ihlkh (,1I1""priC'hl 1)f'1 Mublwl X, 1M A N IlUg('bmrhl. odt" lIuth IM'!IoM"t C'II1 j»IS;t'lIdt'.b lutt'n"11i \10'11' A (I' E N 199(1 ~ " $ IO!')',)). !3t.'1 Mui-wal X, kU1II1I'1i dw Hllfirt'I(,IIII,'u <:dltlrJ:..nrh- ,lIIr }\llkur/IlIlK dlln'" IIl1ltirhlhl' :,I.nhle-II !'(M!i.'rl w('rcll"n Dllfur M,lht ('N gl1ll7 "f'r-c:hif'fI\'lIlutlJ1,t' \Iugh('h· k('III'U ZUIIl IWL"PII'I 1011111 IIIfIII (11(' P~tkll7.lIhlrll od(,1 'I{-il(' dn\''01l \'('I'\\'('lId(,1I EUIC' l,.,"""n~ lururulRuoll ('.lllin,h"11 dlC' Elltf('ruulljI,('!I IIIlr \'ull(' KiiUllwtrr Kt'rl!l1- d.'1. vUm\.l"RI'M·tzl till' ErR,oJml:"-.;t' .,1IIt! "UI' "('r..tIIlI'Clt'lI MUll bUill dl!' Orh' 1111111 III dN Ih'dll'lIrolM,I' d(,1 1~1I1 r("rlllllljl, l)('Killllt'nd 11111 (1 r.lt 111'11 Ort ti('r Sdlll!t, III1IU IIwrlt'n'II, U~'I Mf."TI..'"ud X, 1II1~ 1'111.' Mnlwmht·1t '''lrll,l'W'!M'1I \\'I'rdl'II, ,,0. ('III Diluuli>t !I; •• -\ILOjpnlgUIIK ('int· [')('-/1I11II17,,,JII, ..... .,1)('; III ((t'r 1'tn.xl"; hO(IL"ll·ll.!I l'llI(' ~,,(hkUlIlIIllI ~H'II(' :-iulI\'ull ~. . t Lt.1 !III' Mu.&omhl'lt 111111, tiO k01ll1ll1 1I11U1 wll'(ler IIl1ll'iIll'11i illtt'r· \1111 A c Naill'!, IX-i A/f'fb'llli X \ w{'rrlt'll (h ... A III WIJrt('1I 1M' ,'('n.clut'tI(,lIIlfllJ:, M'III, 111\.. .... !'il(- filr rill!' An.!,\\l'rtullIf, "'l'hlt'tlll "N'I)tIl('1 tollid Duhl'r IIIIL.. ... ell!' Fmltl" ~l l'IIIIIIRillunM.'r(,II('1 Wt'rrl(,II, 1'1\\'1\ 11\ 'Ii>IlftllKMI 1II1rg~pillt(,1I 111If1 rllr J('(II' T(,llrrnK(' ('UlI' SkstJI\ 11111 \\l'rlf'1l Z\Io'l'iCh('1I lund 6 \'urgt-gt'!K'1I wl.nlt'li ()CO,. Skn!t'nwt'rt l'1lt!lpm'ht 11111111 d"r ('ochcrulIg 1 H ",. 1/'/('''''11 hi.. . (j ub.(J/1I1 IIIIII'll'''' HI 01(' AlIlwurl kJlnll .hmll Allkn'117.. f '1I p.tN'III'IU'11 I 2 J I " G Nu.hc LIIIII \\'ohnorl -I- - )It.lhu.cllf' Lt"hrt.'r !(~'1111 - r<'Rt'1 11111611\1' LK's MRthf'mntlk IIUHf' f'lI('huIL'>A'ht, A"Kt>hoLf'