ebook img

Calcolo delle probabilità e statistica teoria ed esercizi PDF

297 Pages·1997·26.124 MB·Italian
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Calcolo delle probabilità e statistica teoria ed esercizi

Marco Bramanti Calcólo delle Probabilitá e Statistica Teoría ed esercizi PROGeTTOM ÍM LeONARDO BOLOGNA Sommario Prefazione per il docente V 0. Introduzione 1 1. Statistica descrittiva 5 1.1 Tipi di vanabili. Distnbuzioni di frequenza..........................................................5 1.2 Grafici di distribuzioni di frequenza......................................................................9 1.2.1 Istogrammi e diagrammi a barre...............................................................9 1.2.2 Grafici di frequenza cumulativa.............................................................11 1.2.3 Diagrammi'' Stem and leaf....................................................................12 1.3 Indici di posizione, di dispersione e di forma......................................................13 1 4 Calcoto di media e varianza per dati raggruppati. Trasformazione lineare di dati...............................................................................18 1.5 Boxplots.................................................................................................................21 Esercizi....................................................................................................................23 1.6 Analisi comparative, correlazione di variabili....................................................27 1.6.1 Correlazione di variabili. Scatterplots....................................................27 1.6.2 Método dei minimi quadrati. Regressione lineare...............................32 1.6.3 Cambiamenti di scala................................................................................37 1.6.4 Confronto fra gruppi, individuazione di sottogruppi............................42 Esercizi....................................................................................................................47 2. Probabilita 49 2.1 Esperimenti aleatori, eventi elementan e spazio campionario.........................49 2.2 Eventi e operazioni su eventi (per uno spazio campionario discreto)..............49 2.3 Probabilitá di eventi...............................................................................................51 2.3.1 Come si opera con la probabilitá. La defínizione assiomatica............51 2.3.2 Come si assegnano le probabilitá. 1: La probabilitá classica..............54 2.3.3 Come si assegnano le probabilitá. 2: L'idea frequentista di probabilitá.............................................................................................56 2 4 Probabilitá classica e problemi di conteggio: il calcólo combinatorio...........56 2.4.1 Lo schema delle scelte successive e il principio del prodotto delle possibilitá.............................................57 2.4.2 Lo schema delle scelte simultanee e i coefficienti binomiali...............60 2.4.3 Esempi di problemi combinatori; applicazioni del calcólo combinatorio alia probabilitá classica.....................................................64 Esercizi....................................................................................................................66 2.5 Probabilitá condizionata........................................................................................67 2.6 Indipendenza di eventi...........................................................................................74 2.7 Añidabilitá di un sistema.......................................................................................76 Esercizi di ricapitolazione sulla probabilitá......................................................79 3. Variabili aleatoria e modelli probabilistici 85 3 1 Variabili aleatoria discrete....................................................................................85 3.2 II processo di Bernoulli.........................................................................................88 3.3 Le variabili aleatoria legate al processo di Bernoulli............................................89 3.3.1 II processo di Bernoulli con un numero finito di prove......................89 3 .3.2 II processo di Bernoulli illimitato...........................................................92 3.4 Valore atteso di una varíabíle aleatoria..............................................................97 3.4.1 La defmizione di valore atteso..............................................................97 3 .4.2 Le propriété del valore atteso...............................................................99 3 .4.3 Calcólo del valore atteso per le v a. legate al processo di Bernoulli e applicazioni............................................................................................. 101 Esercizi................................................................................................................. 104 3.5. Campionamento, campione casuale, prime nozioni di statistica inferenziale 106 3.5.1 Campionamento, campione casuale, modelli statistic!........................106 3.5.2 Stima di parametrí, stimatori.................................................................108 3 .6 Varianza e covarianza di variabili aleatorie.....................................................110 3.6.1 Varianza...................................................................................................110 3.6.2 Valianza della media campionaria, legge dei grandi numeri, stimatori consistent!...................................115 3.6.3 Covarianza e correlazione.....................................................................117 Esercizi................................................................................................................. 119 3.7 Campionamento senza reimmissione. Legge ipergeometrica........................119 Esercizi................................................................................................................. 123 3.8 II processo di Poisson..........................................................................................123 3.8.1 La legge di Poisson come limite di leggi binomial!............................123 3.8.2 Secondo modo di dedurre la legge di Poisson................................... 128 Esempi ed esercizi di ricapitolazione salle variabili aleatoried iscrete.......131 3.9 Variabili aleatorie continue.................................................................................136 Esercizi................................................................................................................. 146 3.10 Le variabili aleatorie legate al processo di Poisson..........................................146 3.10.1 La legge esponenziale e la legge gamma............................................146 Esercizi................................................................................................................. 152 3.10.2 Analogie tra il processo di Bernoulli e il processo di Poisson. Propriété di assenza di memoria...........................................................154 3.10.3 Tempo di vita di un apparecchio.........................................................155 Esercizi................................................................................................................. 159 3.10.4 La ñmzione di istantaneous failure rate e le leggi di Weibull.........160 Esercizi................................................................................................................. 163 3.11 II modello normale...............................................................................................163 3.11.1 La legge normale e le sue propriété......................................................163 3.11.2 Applicazioni della legge normale..........................................................167 Esercizi................................................................................................................. 170 3.11.3 Verifica della normalité dei dati. Normal-scores plot........................171 3.11.4 II teorema del limite centrale e l'approssimazione normale..............173 Esercizi................................................................................................................. 181 3.12 Moment! e indici di forma per variabili aleatorie..............................................182 4. Statistica inferenziale 187 4.1 Stima puntúale.....................................................................................................187 4.1.1 Stima della media...................................................................................187 4.1.2 Stima della varianza. Varianza campionaria........................................189 Esercizi................................................................................................................. 193 4.2 Campionamento da una popolazione normale. Leggi chi-quadro, di Student, di Fisher.............................................................194 4.3 Stima per intervalli..............................................................................................202 4.3.1 II concetto di intervallo di confidenza. Stima della media di una popolazione normale con varianza nota.. 202 4.3.2 Stima della media di una popolazione normale con varianza incognita...........................................................................207 4.3.3 Stima della media di una popolazione qualsiasi, per grandi campioni................................................................................208 4.3.4 Stima di una frequenza (o proporzione), per grandi campioni........209 Esempi.................................................................................................................211 Esercizi..................................................................................................................215 4.4 Test di ipotesi.......................................................................................................216 4.4.1 Le idee fondamentali sul test di ipotesi. Test sulla media di una popolazione normale, con varianza nota. . . 216 4.4.2 Test t sulla media di una popolazione normale con varianza incognita, o sulla media di una popolazione qualsiasi, per grandi campioni ... 224 4.4.3 Test su una frequenza, per grandi campioni........................................226 Esempi...................................................................................................................227 4.4.4 Test su due medie...................................................................................229 4.4.5 Test su due frequenze............................................................................234 Esempi...................................................................................................................235 Esercizi..................................................................................................................238 4.5 Inferenze sulle varianze di popolazioni normali................................................240 4.5.1 Inferenze su una varianza......................................................................240 4.5.2 Inferenze su due varianze......................................................................244 4.6 II test chi-quadro di adattamento e di indipendenza........................................248 4.6.1 II test chi-quadro di adattamento...........................................................248 4.6.2 II test chi-quadro di indipendenza........................................................264 Esercizi..................................................................................................................270 Esercizi di ricapitolazione sulla statistica inferenziale..................................271 Appendici Appendice A: Domande di verifica.............................................................................277 Appendice B: Approfondimenti e riferimenti bibliografici.......................................282 Appendice C: Divulgazione dell'informazione statistica...........................................285 Tavole.............................................................................................................................287 Introduzione In questo corso tratteremo argomenti che appartengono a tre discipline distinte: • la Statistica Descrittiva; • il Calcolo delle Probabilitá; • la Statistica Inferenziale. Scopo di questa introduzione é dare una prima idea di cosa siano e che relazioni abbiano tra loro queste discipline. Tutti abbiamo un'idea di cosa sia un'indagine statistica, almeno in alcune applicazioni alia vita quotidiana o a problemi tecnico-scientifici. Si pensi ai seguenti esempi: il censimento decennale della popolazione italiana, da parte dell'ISTAT; i sondaggi d'opinione, le previsioni e proiezioni di risultati elettorali; I'ispezione di un campione di pezzi da un lotto numeroso, per avere un controllo della qualitá media di un prodotto; la registrazione sistemática di eventi abbastanza rari, come disastri naturali o casi di malattie, per fare qualche previsione sulla loro frequenza in futuro; la sperimentazione di un nuovo prodotto su un campione di "casi", per valutame le prestazioni (ed eventualmente confrontarle con quelle di un prodotto giá esistente). Ad esempio; si somministra un nuovo fármaco a un gruppo di volontarí; si prova un nuovo fertilizzante agricolo su un certo numero di appezzamenti di terreno; si prova un nuovo carburante su un campione di automezzi, ecc. Tenendo presenti questi e simili esempi, possiamo fare qualche prima riflessione su cosa sia la statistica. Seguendo Topinione di R. A. Fisher, uno dei grandi studiosi di statistica del nostro secolo, la statistica si puó vedere come * (1) lo studio delle popolazionr, (2) lo studio della variazione, (3) lo studio dei metodi di riduzione dei dati. (1) . II significato origínale della parola "Statistica" (studio delle "cose dello Stato") suggerisce che essa abbia a che fare con gli aspetti sociali. In realtá pero, le popolazioni di cui si occupa la statistica non sono solo le popolazioni umane, anzi: le popolazioni studiate sono sempre in un certo senso un'astrazione. Se noi abbiamo le registrazioni delle stature di 1000 studenti, é la popolazione delle stature piuttosto che quella degli studenti che prendiamo in esame. L'idea di popolazione non é applicata solo ad esseri viventi, o a individui materiali. Se un'osservazione, come una semplice misura, é ripetuta indefinitamente, l'aggregato dei risultati é una popolazione di misure. Tali popolazioni sono il particolare campo di studio della Teoría degli Errori, una dei piú antichi e vivad campi di indagine statistica. Ció non ostante, in un certo senso é corretto dire che la statistica é lo studio di popolazioni, o aggregati di individui, piuttosto che di individui singoli Questo va sempre tenuto presente, se non si vuole fraintendere qualunque conclusione tratta con argomenti statistic!. (2) . II concetto di statistica come studio della variazione é l'esito naturale del vedere questa disciplina come lo studio delle popolazioni; una popolazione di individui * I prossimi paragrafi sono una libera sintesi di alcuni passi dcll'introduzionc del libro di R A Fi.sher: "Statistical Methods for Research Workers". 13° ed., Oliver and Boyd, Bdinburgh, London, 1958 Introduzione assolutamente identici sarebbe completamente descritta dalia descrizione di uno qualsiasi di quest! individui, e dal numero di individui. Le popolazíoni che sono oggetto di studio statistico, invece, mostrano sempre in qualche aspetto una variazione interna. II modo piú semplice che il buon senso suggerisce, per descrivere una grandezza che varia all'intemo di una popolazione, é quello di calcolame un valore medio. La media, pero, da sola non basta a descrivere o render ragione della variazione. La statistica, invece, si occupa proprio dello studio della variazione, osservandone l'entitá e le modalitá: queste infatti ci possono insegnare qualcosa di piú sulle caratteristiche del fenómeno in esame. Supponiamo, ad esempio, di misurare con precisione le dimension! di certi pezzi meccanici prodotti da due diverse macchine, A e B. I pezzi dovrebbero essere tutti identici, ma in realtá mostrano piccole variazioni. Puó darsi che le dimension! medie dei pezzi prodotti dalle due macchine coincidano; tuttavia, se i pezzi prodotti dalla macchina A presentano variazioni, rispetto ai valor! medi, maggiori di quelli prodotti dalla macchina B, noi diremo che la macchina B é piú accurata della A. Questo é solo un esempio per mostrare come in molti problem! la variazione sia l'aspetto rilevante. (3). II terzo aspetto sotto cui dobbiamo guardare alio scopo della statistica é introdotto dal bisogno pratico di ridurre il volume di ogni insieme di dati. Ogni ricercatore che abbia effettuato osservazioni metodiche ed estensive é familiäre con l'incalzante necessitá di ridurre i suoi risultati a un volume piú contenuto. Noi vogliamo esprimere tutta Yin/ormazione rilevante contenuta in una massa di dati per mezzo di un numero comparativamente piccolo di valor! numeric!. II numero di informazioni indipendenti fornite dai dati é sólitamente moho piú grande del numero di informazioni che si cercano, e di conseguenza la maggior parte dell'informazione contenuta in ogni corpo di dati é irrilevante. L'obiettivo dei process! statistic! impiegati nella riduzione dei dati é escludere questa informazione irrilevante, e isolare il nocciolo deirinformazione. ^ Sintetizzando: la statistica é lo studio di popolazioni di individui, non di individui singoli; la parola popolazione va intesa in un senso moho astratto, come "aggregato di individui". Una popolazione presenta sempre, dal punto di vista di ció che si vuole osservare, una certa variazione interna, che é significativo studiare. Infine, nella descrizione di una popolazione, abbiamo normalmente a che fare con una massa ingente di dati da cui é utile estrarre Yin/ormazione rilevante. Questo processo di sintesi, o riduzione dei dati, é pure tra gli scopi della statistica. Chiediamoci ora: qual é Y origine della variabilitál Perché 1000 student! non hanno tutti la stessa statura? Perché se 10 sperimentatori eseguono una stessa misura fisica, troveranno probabilmente 10 valori leggermente diversi? Perché l'autobus non passa esattamente ogni 10 minuti, come dovrebbe? Spesso, all'origine della variabilitá, stanno fenomeni aleatori. "Aleatorio" é un fenómeno "govemato dal caso", ossia in cui qualche elemento di casualitá entra in modo essenziale. Questo significa che il fenómeno non é completamente prevedibile a priori, il che, si noti bene, non significa necessariamente che il fenómeno sia totalmente imprevedibile; se estraggo una pallina da un'urna che ne contiene 70 bianche e 30 nere, non sono certo del risultato, ma ho una certa aspettativa II concetto di probabilitá ha a che fare appunto con le opinion! che noi abbiamo circa l'esito dei fenomeni aleatori, incerti. II Calcólo delle Probabilitá, di cui parleremo, é una disciplina che storicamente prende le mosse dai problem! di giochi d'azzardo (ad esempio, quale sia il "prezzo equo" da pagare per una certa scommessa) Qui termina il riferimenlo al libro di Fisher Introduzione 3 e arriva a dare una trattazione matemática dell'incertezza, ossia delle rególe con cui noi attribuiamo un certo grado di fiducia al realizzarsi di un dato evento. Vedremo come in molte situazioni concrete, con qualche ipotesi ragionevole sulla natura del fenómeno aleatorio e qualche informazione quantitativa, saremo in grado di formulare un mode lio probabilistico, in base al quale calcolare la probabilitá di un certo evento. Nell'esempio deH'uma con palline bianche e nere, impareremo come si calcóla la probabilitá che, estraendone 10, ne troviamo esattamente 6 bianche. Un problema in qualche modo inverso a questo é il seguente: se, intervistando un campione di 100 persone alia vigilia di un referendum, in 67 affermano che voteranno "Si", cosa possiamo dire circa la percentuale degli elettori italiani (che sono milioni, non solo i 100 intervistati!) che voteranno "Si"? A rigor di lógica, assolutamente nulla di certo. II problema tipico della Statistica Inferenziale é proprio questo: fare inferenze, cioé asserzioni motivate, circa la popolazione complessiva in esame, a partiré dalle osservazioni fatte su un campione estratto dalla popolazione stessa La statistica inferenziale riguarda dunque le conclusion! che si possono trarre quando si esegue wn'indagine campionaria su una popolazione (cioé osservando solo una parte, non tutti gli individui). Queste conclusion! non saranno "certezze", ma asserzioni formulate con il linguaggio e i metodi (precisi e quaníitativi) del calcólo delle probabilitá. La Statistica Descrittiva si occupa invece deW'analisi dei dati osservati, prescindendo sia da qualsiasi modello probabilistico che descriva il fenómeno soggiacente, sia dal fatto che l'insieme di dati provenga da un campione estratto da una popolazione piú vasta, o coincida invece con la popolazione intera. Obiettivi della statistica descrittiva sono: 1. Eífettuare quella riduzione dei dati di cui si é detto sopra. L'informazione rílevante contenuta nei dati puó essere espressa mediante opportuni grafici o indici numerici che descrivono la distribuzione di una variabile sul gruppo di individui considerati. 2. Eseguire indagini di tipo comparativo: a. confrontare i valor! che una stessa variabile assume su gruppi diversi di individui (es.: statura di maschi e femmine, all'interno di una popolazione fissata); b. cercare relazioni esistenti tra variabili diverse (es.: relazione tra statura e peso, per gli individui di una certa popolazione). 3. Verifícare l'adattamento dei dati empiric! a un modello teórico, o orientare nella formulazione del modello stesso. Le tre discipline a cui abbiamo accennato (calcólo delle probabilitá, statistica inferenziale, statistica descrittiva) hanno quindi strette relazioni reciproche In estrema sintesi, si puó dire che il loro scopo é quello di darci degli strumenti per prendere decisioni in situazioni di incertezza, o dare valutazioni quantitative precise del grado di certezza o incertezza che abbiamo.

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.