ebook img

Statistikk - for universiteter og høgskoler PDF

416 Pages·1999·214.038 MB·Norwegian
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Statistikk - for universiteter og høgskoler

GUNNAR G. LØVÅS Statistikk - for universiteter og høgskoler Universitetsforlaget © Universitetsforlaget AS 1999 ISBN 82-00-12755-9 3. opplag 1999 Det må ikke kopieres fra denne boka i strid med åndsverkloven eller avtaler om kopiering inngått med Kopinor, interesseorgan for rettighetshavere til åndsverk. Kopiering i strid med lov eller avtale kan medføre erstatningsansvar og inndragning, og kan straffes med bøter eller fengsel. Forfatteren har mottatt støtte fra Faglitterært fond. Henvendelser om denne boka kan rettes til: Universitetsforlaget AS Postboks 2959 Tøyen 0608 Oslo Omslag: Anneli Skaar Trykk: Falch Hurtigtrykk A/S, Oslo 1999 11 Forord Jeg har skrevet denne boka fordi jeg synes at statistikk og sannsynlighet sregning er nyttig og spennende, og for at du skal lese den. Du blir herved invitert med på en “reise’’ der vi i fellesskap skal bli kjent med statistikkfagets viktigste temaer. Boka er primært skrevet for deg som ønsker å bruke statistikk som et verktøy i din framtidige arbeidssituasjon. Du kan godt tenke på denne boka som en verktøykasse. Her finnes det mange generelle verktøy (skrujern, hammer og sag) som du helt sikkert får bruk for, og noen spesialverktøy (drill og vinkelsliper). Vi kommer til å bruke mest tid på de generelle verktøyene, men du bør også orientere deg om hvilke spesialverktøy som finnes. Jeg har derfor inkludert beskrivelser av flere spesialverktøy enn det som er vanlig i en innføringsbok. Jeg har valgt å gruppere verktøyene etter hvilke typer oppgaver de er ment å løse. Statistikkfaget inngår som et basisfag i de aller fleste utdanninger på høgskole- og universitetsnivå. Enten du studerer økonomifag, ingeniørfag, fiskerifag eller farmasi, så passer denne boka for deg. De ulike fagdisiplinene vektlegger ulike deler av faget, men basisverktøyene er de samme. Behovet for spesialverktøy vil variere, men uansett hva du studerer, er det stor sannsynlighet for at boka inneholder det verktøyet du trenger. For å gjøre boka lettlest, interessant og underholdende har jeg valgt eksempler fra mange ulike fagområder. I “gamle” lærebøker var ofte forordet fullt av lovprisninger til alle sekretærene som ved hjelp av skrivemaskin hadde tatt hånd om forfatterens håndskrevne manus. Det var også vanlig at bøkene inneholdt en stor mengde tabeller og beregningsformler som kunne være til hjelp når leseren skulle utføre krevende beregninger for hand. Slik er det ikke lenger - verden har forandret seg! Hele denne boka er produsert ved hjelp av min lille, bærbare datamaskin. Det gjelder ikke bare tekst og figurer, men også alle beregningene. Jeg har selv benyttet beregningsprogrammene Excel og Minitab, og forklarer gjennom hele boka hvordan du kan bruke disse programmene til a utføre dine egne beregninger. Etter at datamaskinen ble allment tilgjengelig, har faget endret karakter. Nå er det viktigst at du forstår ideene og vet hvordan de ulike verktøyene kan brukes (og eventuelt misbrukes). Dette kan også være vanskelig, men stiller deg ovenfor andre utfordringer enn de regnetekniske. Etter Reform 94 i den videregående skolen er det mange studenter som allerede kan mye statistikk. Andre studenter har ingen forkunnskaper. Det er også svært variabelt hvor mye matematikk studentene behersker. Det gir store utfordringer til faglærerne, som må komponere et passelig pensum. På sikt vil jeg håpe at flest mulig studenter har kunnskaper som svarer til de to-tre første kapitlene i denne boka. Da blir det mer tid til de nyttige verktøyene i bokas siste del. Et typisk innføringskurs vil fokusere på kapitlene 3 til 6. som utgjør fagets kjerne og presenterer basisverktøyene sannsynlighetsregning, estimering og hypotesetesting. Kapitlene 7 til 10 presenterer noen av spesialverktøyene. Jeg anbefaler at du velger a fordype deg i ett eller to av disse kapitlene, avhengig av dine faglige interesser. I tillegg synes jeg at du bør lese introduksjonen til de andre kapitlene, slik at du vet hvilke spesialverktøy som fins. Boka er såpass omfattende at den også kan brukes til et videregående kurs der man går i dybden på flere av kapitlene 7 til 10. Jeg har skrevet læreboka for å hjelpe deg i møtet med et nytt fag. Dine medstu­ denter og forelesere kan også hjelpe deg, men det er du som må lære faget. Skal du lykkes, må du være villig til å bruke tid og krefter og ikke gi opp første gang du “møter veggen". Diskuter problemene med noen, og les en gang til. Da er det stor sjanse for at du kommer deg videre. Hvis du lykkes, vil du lære hvordan du bør forholde deg til usikker informasjon, hvordan du skal samle inn og analysere data, og hvordan du kan iii ta gode beslutninger. Jeg håper at du vil like bade statistikkfaget og denne boka, og ønsker deg lykke til videre på reisen. Nar denne boka endelig har blitt ferdig, er det mange som fortjener en takk. Mitt første skikkelige møte med statistikkfaget fikk jeg som student ved NTH i Trond­ heim og siden ved Universitetet i Oslo. Jeg vil takke alle mine dyktige og engasjerte faglærere for at de penset meg inn på statistikksporet. Mange av dem har også deltatt i diskusjoner om denne boka, og gitt meg gode ideer til fagvalg og presentasjonsform. Statistikkfaget er utrolig spennende, og helt siden studietiden har jeg gått med en liten forfatter i magen og hatt lyst til å skrive en lærebok. På en mate er det tilfeldig at jeg kom igang med skrivingen, men den positive mottakelsen jeg fikk av forlagsredaktør Geir Tufteland, var utvilsomt med på å sette fart på planene. Han har vært en viktig bidragsyter helt fra første stund, både som inspirator og innpisker når det til tider har vært nødvendig. I prosjektets tidlige fase hadde jeg stor nytte av kommentarer fra John Tyssedal og detaljerte innspill fra Rune Winther, som også bidro i arbeidet med å lage bokas disposisjon. Bjørn Auestad leste gjennom en tidlig versjon av boka og gav meg mange nyttige tilbakemeldinger. Dag Gundersen leste gjennom det komplette manuskriptet med falkeblikk. og han oppdaget en utrolig mengde skrivefeil og unøyaktigheter som nå er rettet opp. Finner du flere feil, så skyld på meg! Boka inneholder mange oppgaver, og de mest spennende er antakelig eksamensoppgavene. Jeg vil rette en stor takk til faglærerne Ingrid Glad, Amir Hashemi, Harald Horten, Gorrn Jacobsen, Dag Nylund, Arild Wikan og Rune Winther som velvillig har latt meg gjengi eksamens­ oppgaver med løsninger fra henholdsvis Universitetet i Oslo og høgskolene i Bergen, Sør-Trøndelag, Agder, Hedmark, Harstad og Stavanger. Mine arbeidsgivere, Statuett og Hålogaland Kraft, fortjener også en takk for å ha lagt forholdene godt til rette for forfattervirksomheten min. Min aller største takk går til mine kjæreste, Randi, Jonas og Håvard, som gir meg mye glede, og hver dag drar meg ut av min bokverden og hjem til middagsgryter, legoklosser og fjellturer. De siste månedene har det riktignok blitt lite av denslags, siden bokprosjektet har tatt og fått rner tid enn noen skulle ha trodd. Jeg gleder meg til å komme hjem igjen, og til å bli en mer spennende mann og far. Harstad, november 1998 Gunnar G. Løvås PS. Hvis du oppdager noen feil eller har andre kommentarer av positiv eller negativ art, vil jeg gjerne høre fra deg. Send en kort melding til [email protected], og jeg vil være deg stor takk skyldig. Alle som gir verdifulle bidrag, kan håpe på hederlig omtale i forordet til neste utgave av boka. D.S. Innhold I Innledning 1 1 Hva er statistikk? 3 1.1 Bokas innhold............................................................................................................. 3 1.1.1 Noen eksempler............................................................................................ 3 1.1.2 Historie.......................................................................................................... 6 1.1.3 Bokas oppbygning..................................................................................... 7 1.2 Noen viktige begreper............................................................................................ 8 1.2.1 Populasjon og utvalg................................................................................. 8 1.2.2 Variasjon....................................................................................................... 10 1.2.3 Variabel ty per................................................................................................ 11 1.3 Modeller • - 12 1.4 Innsamling av data................................................................................................... 13 1.4.1 Problemløsning krever data................................................................... 13 1.4.2 Generelt om datainnsamling.................................................................... 15 1.5 Oppsummering.......................................................................................................... 1” 2 Hva er fakta om utvalget? 19 2.1 Beskrivelse av kategoriske data.......................................................................... 19 2.2 Beskrivelse av diskrete data.................................................................................. 22 2.3 Beskrivelse av kontinuerlige data....................................................................... 24 2.3.1 Frekvenstabell ............................................................................................ 24 2.3.2 Histogram....................................................................................................... 25 2.3.3 Stamme- og bladdiagram....................................................................... 27 2.3.4 Spredningsplott............................................................................................ 27 2.3.5 Tidsserieplott................................................................................................ 28 2.3.6 Generelle diagramtips.............................................................................. 29 2.3.7 Formen på histogrammet ....................................................................... 30 2.4 Sentralmål.................................................................................................................... 31 2.4.1 Modus.............................................................................................................. 32 2.4.2 Median.......................................................................................................... 32 2.4.3 Gjennomsnitt............................................................................................... 33 2.4.4 Sammenligning av modus, median og gjennomsnitt..................... 35 2.5 Spredningsmål.......................................................................................................... 36 2.5.1 Variasjonsbredde........................................................................................ 37 2.5.2 Varians og standardavvik....................................................................... 37 2.5.3 Variasjonskoeffisient................................................................................. 40 2.6 Skjevhet og kurtosis*................................................................................................ 40 2.7 Grupperte data*...................................................................................................... 11 2.8 Statistikk med Excel............................................................................................... 42 2.9 Statistikk med Minitab............................................................................................ 48 3 4 INNHOLD 2.10 Oppsummering.......................................................................................................... 5Q 2.11 Oppgaver.................................................................................................................... 5Q II Sannsynlighetsteori 53 3 Sannsynlighetsregning 55 3.1 Utfallsrom og hendelse............................................................................................ 55 3.2 Sannsynligheten for en hendelse.......................................................................... 58 3.2.1 Uniform sannsynlighetsmodell................................................................ 59 3.2.2 Sannsynlighet basert på relativ frekvens.......................................... 60 3.2.3 Subjektiv sannsynlighet for en hendelse.......................................... 64 3.2.4 Eksempel på tallfesting av sannsynligheter....................................... 65 3.3 Innføring i sannsynlighetsregning....................................................................... 66 3.3.1 Litt mengdelære........................................................................................ 66 3.3.2 Sannsynlighetsregningens aksiomer..................................................... 68 3.3.3 De viktigste regnereglene....................................................................... 69 3.4 Betingede sannsynligheter..................................................................................... 72 3.4.1 Definisjon...................................................................................................... 72 3.4.2 Regler for betingede sannsynligheter.................................................. 74 3.4.3 Litt om Bayes............................................................................................... 77 3.4.4 Hendelsestre ............................................................................................... 79 3.5 Uavhengige hendelser ............................................................................................ 81 3.5.1 Er hendelsene uavhengige? ................................................................... 82 3.5.2 Regler for uavhengige hendelser............................................................ 83 3.6 Telleregler - Kombinatorikk................................................................................. 85 3.6.1 Produktregelen............................................................................................ 86 3.6.2 Urnemodellen............................................................................................... 87 3.6.3 De viktigste tellereglene.......................................................................... 87 3.6.4 Sannsynligheter basert på kombinatorikk ....................................... 91 3.7 Bruk av datamaskin............................................................................................... 94 3.8 Oppsummering.......................................................................................................... 94 3.9 Oppgaver.................................................................................................................... 95 4 Stokastiske variabler 99 4.1 Stokastiske variabler............................................................................................... 99 4.2 Diskrete sannsynlighetsmodeller.......................................................................... 101 4.2.1 Sannsynlighetsfordeling.......................................................................... 101 4.2.2 Forventningsverdi........................................................................................ 106 4.2.3 Varians og standardavvik....................................................................... 111 4.3 Kontinuerlige sannsynlighetsmodeller................................................................ 114 4.4 Flere variabler samtidig........................................................................................ 121 4.4.1 Simultanfordeling........................................................................................ 121 4.4.2 Kovarians og korrelasjon.......................................................................... 123 4.4.3 Uavhengighet............................................................................................... 126 4.4.4 Hendelsestre ............................................................................................... 127 4.5 Oppsummering.......................................................................................................... 128 4.6 Oppgaver.................................................................................................................... 129 INNHOLD 5 5 Vanlige sannsynlighetsmodeller 133 5.1 Innledning.................................................................................................................... 133 5.2 Binomisk modell...................................................................................................... 135 5.3 Hy per geometrisk fordeling..................................................................................... 139 5.4 Geometrisk fordeling............................................................................................... 141 5.5 Poissonfor de lingen................................................................................................... 142 5.6 Eksponentialfordelingen........................................................................................ 146 5.7 Normalfordelingen................................................................................................... 150 5.7.1 Historie.......................................................................................................... 150 5.7.2 Normalfordelingen..................................................................................... 150 5.7.3 Sjekk av normalitet ................................................................................. 156 5.8 Sentralgrenseteoremet............................................................................................ 157 5.9 Andre modeller*...................................................................................................... 162 5.9.1 Kj ikvadr atfor delingen............................................................................. 164 5.9.2 Student t-fordelingen................................................................................. 165 5.9.3 Fisher F-for delingen................................................................................. 166 5.9.4 Multinomisk fordeling............................................................................. 167 5.9.5 Binormalfor de lingen................................................................................. 168 5.10 Bruk av datamaskinen............................................................................................ 170 5.10.1 Excel ............................................................................................................. 170 5.10.2 Minitab.......................................................................................................... 171 5.11 Oppsummering.......................................................................................................... 171 5.12 Oppgaver.................................................................................................................... 171 III Grunnleggende statistikk 175 6 Estimering og hypotesetesting 177 6.1 Et innledningseksempel........................................................................................ 177 6.1.1 Hvilken vraksannsynlighet har det nye utstyret? ......................... 178 6.1.2 Hvor sikkert er estimatet?....................................................................... 179 6.1.3 Er det nye utstyret bedre enn det gamle?....................................... 180 6.1.4 Bør AluProd kjøpe det nye utstyret?................................................. 183 6.2 Punkt estimering...................................................................................................... 183 6.2.1 Basisteori...................................................................................................... 184 6.2.2 Punktestimat for forventningsverdien p.......................................... 186 6.2.3 Punktestimat for standardavviket a................................................. 187 6.2.4 Punktestimat for sannsynligheten p ................................................. 189 6.2.5 Punktestimat for raten Å ...................................................................... 190 6.2.6 Stratifisering*............................................................................................... 190 6.3 Konfidensinter valler ............................................................................................... 191 6.3.1 Teori................................................................................................................. 191 6.3.2 Konfidensintervall for p, når a er kjent (Z-intervall)..................... 193 6.3.3 Konfidensintervall for p når rr er ukjent (T-intervall).................. 194 6.3.4 Konfidensintervall for n.......................................................................... 196 6.3.5 Konfidensintervall for sannsynligheten p.......................................... 197 6.3.6 Konfidensintervall for raten Å............................................................... 201 6.4 Hypotesetesting - metode og teori................................................................... 201 6.4.1 Etablering av modell og formulering av hypotesene..................... 202 6.4.2 Testobservator og forkastingsområdets form................................... 203 6.4.3 Valg av akseptable feilsannsynligheter.............................................. 204 6.4.4 Spesifikasjon av forkast ingsområde og prøvest ør reise.................. 206 G INNHOLD 6.4.5 Testens konklusjon............................................................................. 210 6.4.6 Sammenheng med konfidensintervaller.............................................. 212 6.5 Hypotesetesting i praksis........................................................................................ 212 6.5.1 Hypotesetest av p nar a er kjent (Z-test)....................................... 212 6.5.2 Hypotesetest av p når a er ukjent (T-test) ..................................... 214 6.5.3 Hypotesetest av sannsynligheten p...................................................... 215 6.6 Empirisk fordelingsfunksjon* .............................................................................. 216 6.7 Bruk av datamaskinen.................................................................................... 217 6.7.1 Excel ............................................................................................................. 218 6.7.2 Minitab...................................................................................................... 218 6.8 Oppsummering...................................................................................................... 218 6.9 Oppgaver................................................................................................................. 219 IV Andre anvendelser 223 7 Analyse av sammenhenger 225 7.1 Innledning.......................................................................................................... 225 7.2 Korrelasjon............................................................................................................. 227 7.3 Enkel lineær regresjon........................................................................................ 230 7.3.1 Regresjonsmodellen ................................................................................. 230 7.3.2 Regresjonslinjen........................................................................................ 231 7.3.3 Hvor god er modellen?............................................................................. 233 7.3.4 Noen egenskaper........................................................................................ 234 7.3.5 Er det en sammenheng mellom x og y? .......................................... 235 7.3.6 Hvilken respons kan vi forvente?........................................................ 237 7.3.7 Hvilke observasjoner er sannsynlige?................................................. 237 7.3.8 Kontroll av forutsetningene................................................................... 239 7.3.9 Vektet regresjon*........................................................................................ 240 7.4 Ikke-lineær regresjon............................................................................. 241 7.5 Multippel lineær regresjon................................................................................. 244 7.5.1 Vanlig multippel regresjon...................................................................... 244 7.5.2 Polynomisk regresjon................................................................................. 247 7.6 Tidsrekkeanalyse - prognoser...................................................................... 248 7.6.1 Trend............................................................................................................. 250 7.6.2 Sesongvariasjon........................................................................................... 251 7.6.3 Tilfeldig variasjon .................................................................................... 252 7.6.4 Prognose ...................................................................................................... 253 7.7 Bruk av datamaskinen................................ 9^ 7.7.1 Excel .......................................................................................................... 255 7.7.2 Minitab...................................................................................................... 256 7.8 Oppsummering...................................................................................................... 257 7.9 Oppgaver.......................................................................................................... 257 8 Sammenligning av grupper 263 8.1 Innledning...................................................................................................... 9g3 8.1.1 Hvor mange grupper og hvor mange observasjoner?....................... 264 8.1.2 Randomisering............................................................................. 264 8.1.3 Paring og blokkdeling............................................................................. 264 8.1.4 Klyngeutvalg............................................................................................... 266 8.1.5 Hva slags data har vi?............................................................................... 266 8.2 T-test for to grupper............................................................................................... 267 INNHOLD 7 8.2.1 Litt sammenligningsfilosofi ................................................................... 267 8.2.2 Uparet T-test............................................................................................... 269 8.2.3 Paret T-test................................................................................................... 271 8.2.4 Vurdering av paret og uparet test........................................................ 273 8.3 Variansanalyse for flere grupper.......................................................................... 273 8.3.1 Noen illustrasjoner.................................................................................... 274 8.3.2 Enveis variansanalyse ............................................................................. 275 8.3.3 Samtidige konfidensintervaller............................................................... 277 8.3.4 Kontroll av forutsetninger...................................................................... 278 8.3.5 Toveis variansanalyse*............................................................................. 279 8.3.6 Litt forsøksplanlegging*.......................................................................... 281 8.4 Ikke-parametriske tester........................................................................................ 282 8.4.1 Uparet Mann-Whitney-Wilcoxon-test ............................................. 282 8.4.2 Paret Wilcoxon-test................................................................................. 285 8.4.3 Paret fortegnstest .................................................................................... 286 8.4.4 Kruskal-Wallis’ test av flere grupper* ............................................. 287 8.5 Analyse av kategoriske krysstabeller............................................................... 288 8.5.1 Kjikvadrattest ........................................................................................... 288 8.5.2 Simpsons paradoks.................................................................................... 290 8.5.3 Modelltest...................................................................................................... 291 8.6 Bruk av datamaskinen........................................................................................... 292 8.6.1 Excel ............................................................................................................. 292 8.6.2 Minitab......................................................................................................... 293 8.7 Oppsummering......................................................................................................... 293 8.8 Oppgaver.................................................................................................................... 294 9 Statistisk kvalitetsstyring 299 9.1 Kontrolldiagrammer............................................................................................... 299 9.1.1 Shewhart T-diagram................................................................................. 302 9.1.2 s-diagram for spredning......................................................................... 307 9.1.3 Kombinert T-s-diagram.......................................................................... 308 9.1.4 p-diagram for defektandel...................................................................... 308 9.1.5 Andre kontrolldiagrammer...................................................................... 310 9.2 Kapabilitet................................................................................................................. 311 9.2.1 Toleransegrenser og kapabilitetsindeks............................................. 311 9.2.2 Fortolkning av kapabilitetsindeks........................................................ 313 9.3 Akseptanskontroll .................................................................................................. 315 9.3.1 Kontrollens karakteristikk...................................................................... 316 9.3.2 Akseptanskontroll basert på defektandel.......................................... 317 9.3.3 Akseptanskontroll basert på målinger ............................................. 319 9.4 Bruk av datamaskinen........................................................................................... 321 9.4.1 Excel ............................................................................................................. 321 9.4.2 Minitab......................................................................................................... 321 9.5 Oppsummering......................................................................................................... 322 9.6 Oppgaver.................................................................................................................... 322 10 Simulering 325 10.1 Simulering av tilfeldige tall ................................................................................. 326 10.2 Simulering av en stokastisk variabel ............................................................... 327 10.3 Simulering med datamaskinen............................................................................. 329 10.3.1 Excel ............................................................................................................. 330 10.3.2 Minitab......................................................................................................... 33O 8 INNHOLD 10.3.3 Noen eksempler.......................................................................................... 330 10.4 Simulering av flere stokastiske variabler ........................................................ 331 10.4.1 Uavhengige variabler................................................................................. 333 10.4.2 Avhengige variabler ................................................................................. 333 10.5 Simulering av funksjoner........................................................................................ 335 10.6 Simulering av integral*........................................................................................... 339 10.7 Oppsummering......................................................................................................... 341 10.8 Oppgaver.................................................................................................................... 341 A Eksamensoppgaver 347 B Ekstra bevis 367 B.l Bevis til kapittel 3.................................................................................................. 367 B.2 Bevis til kapittel 4.................................................................................................. 368 B.3 Bevis til kapittel 5.................................................................................................. 369 B.4 Bevis til kapittel 6.................................................................................................. 373 B.5 Bevis til kapittel 7.................................................................................................. 373 B.6 Bevis til kapittel 8.................................................................................................. 375 B.7 Bevis til kapittel 10.................................................................................................. 375 C Litteratur 377 D Fasit 379 E Statistiske tabeller 397 E.l Kumulativ binomisk sannsynlighet................................................................... 398 E.2 Kumulativ poissonfordeling................................................................................. 399 E.3 Kumulativ standardnormalfordeling ............................................................... 400 E.4 t-fordelingens kvantiltabell.................................................................................... 401 E.5 Kjikvadratfordelingens kvantiltabell ............................................................... 402

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.