paolo baldi calcolo delle probabilità e statistica McGraw-Hill Libri Italia srl Milano • New York • St. Louis • San Francisco • Oklahoma City • Auckland Bogotà • Caracas • Hamburg • Lisboa • London • Madrid • Montreal • New Delhi Paris • San Juan • Sao Paulo • Singapore • Sidney • Tokyo • Toronto Ogni cura è stata posta nella raccolta e nella verifica della documentazione contenuta in questo libro. Tuttavia né l'Autore, né la McGraw-Hill Libri Italia possono assumersi alcuna responsabilità derivante dall'utilizzo della stessa. Lo stesso dicasi per ogni persona o società coinvolta nella creazione, nella produzione e nella distribuzione di questo libro. Copyright @1992 McGraw-Hill Libri Italia piazza Emilia, 5 20129 20129 Milano I diritti di traduzione, di riproduzione, di memorizzazione elettronic,a e di adatta mento totale e parziale con qualsiasi mezzo (compresi i microfilm e le copie fotosta tiche) sono riservati per tutti i paesi. Il testo è stato composto dall'autore in TEX Capo redattore: Massimo Esposti Redattore: Chiara Tartara Hanno collaborato a questo volume: Grafica di copertina: Achilli & Piazza e Associati Stampa: Arti Grafiche Battaia snc, Rozzano (MI) ISBN 88-386-0693-5 2= edizione aprile 1993 Printed in Italy -156i890GBTLLC9E Indice Introduzione Vll 1 Spazi di probabilità 1.1 Fenomeni deterministici e casuali 1 1.2 Spazi di probabilità 2 1.3 Spazi di probabilità uniformi 6 1.4 Proprietà degli spazi di probabilità 7 1.5 Probabilità condizionale, indipendenza 10 1.6 Calcolo combinatorio 15 Esercizi 18 2 Variabili aleatorie discrete 2.1 Variabili aleatorie e loro distribuzioni 21 2.2 Variabili aleatorie discrete 23 2.3 Leggi congiunte, indipendenza 34 2.4 Calcoli con densità 41 2.5 Speranza matematica 47 2.6 Momenti, varianza, covarianza 52 *2.7 Funzioni generatrici 59 *2.8 Somme aleatorie 66 Esercizi 69 3 Variabili aleatorie continue 3.1 Definizioni 73 3.2 Variabili aleatorie assolutamente continue 77 3.3 Densità congiunte, indipendenza 79 3.4 Calcolo di leggi 91 3.5 Leggi normali 97 3.6 Leggi gamma 99 3.7 Speranza matematica, momenti 105 3.8 Speranza condizionale 111 3.9 Funzioni caratteristiche 114 3.10 Generatori aleatori, simulazione 120 3.11 Leggi normali multivariate 122 Esercizi 126 v1 Indice 4 Convergenza e approssimazione 4.1 La legge dei grandi numeri 131 4.2 Convergenza in legge . 135 4.3 Il Teorema Limite Centrale 138 4.4 Approssimazione normale 140 Esercizi 143 5 Catene di Markov 5.1 Definizione e generalità 147 5.2 Calcolo delle leggi congiunte 149 5.3 Classificazione degli stati 152 5.4 Problemi di àssorbimento 155 5.5 Probabilità invarianti 162 5.6 L'algoritmo di Metropolis, simulated annealing 166 5.7 Stati numerabili 169 5.8 Stati numerabili: ricorrenza e transitorietà 175 5.9 Esempi: file d'attesa 181 Esercizi 184 6 Statistica Matematica 6 .1 Modelli statistici 189 *6.2 Stimatori di varianza minima 195 *6.3 Stimatori di massima verosimiglianza 198 *6.4 Stimatori di Bayes 200 6.5 Test 205 6.6 Stima e test per campioni gaussiani 207 6.7 Il test del x2 215 6.8 Un esempio di analisi statistica 217 6.9 Regressione linea.re 220 6.10 Il teorema di Cochran 229 6.11 Regressione multipla 235 6.12 Regressione lineare: predizione 243 6.13 Regressione lineare: l'analisi del modello 248 Esercizi 259 Soluzioni 263 Tavole numeriche 275 Indice Analitico 279 Introduzione Negli ultimi anni è aumentata la richiesta di insegnamenti di Probabilità e Statistica in corsi di laurea diversi da quello di Matematica. Molti di questi hanno in comune due esigenze: la prima è la necessità di servirsi -dei soli strumenti matematici del biennio d'Ingegneria. La seconda è di mettere l'accento su come si usano i risultati teorici per la risoluzione di problemi concreti, piuttosto che sull'approfondimento logico della teoria, che è invece l'atteggiamento tipico del corso di laurea in Matematica. Questo libro si avvale dell'esperienza di alcuni anni nell'insegnamento di Calcolo delle Probabilità e Statistica ( CPS nel gergo degli studenti) per il corso di Laurea in Scienza dell'Informazione, ma può probabilmente essere usato anche per altri corsi ( specialmente nella Facoltà d'Ingegneria, oltre a quelli dei futuri corsi di diploma) che hanno le stesse esigenze. * * * Lo scopo di questi insegnamenti cosiddeùf·•di servizio" è di mettere effet tivamente gli studenti in grado di affrontare i problemi di Calcolo delle Pro babilità e Statistica che incontreranno nel prosieguo del corso di Laurea in cui sono impegna.ti. Ciò implica la necessità di giungere, in un tempo limitato, a svolgere temi relativamente avanzati, e dunque il sacrificio di altri argomenti, pure interessanti. Per questo motivo è stata fatta la scelta di limitare a pochi accenni sbrigativi le questioni rituali dei fondamenti e dell'uso della teoria della misura. I primi 5 capitoli (tranne forse i paragrafi 3.11, 5.7 e 5.8) svolgono un programma adeguato per un corso di 40 ore, specialmente se parte degli esempi sono trattati in un corso di esercitazioni. Il resto del materiale può essere utilizzato per un corso più lungo. Il paragrafo 3.11 (peraltro importante in sè) e le parti scritte in carattere più piccolo sono indispensabili solo se si affrontano le tematiche legate al teorema di Cochran (paragrafo 6.10). Anche i paragrafi che sono segnati nell'indice con un asterisco non sono indispensabili alla comprensione del seguito e possono essere evitati da un viii Introduzione docente che desideri guadagnare tempo per sviluppa.re altri argomenti. Inoltre, volendo, il capitolo 5 (Catene di Markov) può essere affrontato subito dopo il capitolo 2. * * * I L'uso dei calcolatori nelle applicazioni della matematica ha avuto, negli ultimi vent'anni, un grande impulso anche per il Calcolo delle Probabilità e la Statistica e di ciò si è avuto un riflesso anche nell'insegnamento. Da una parte infatti hanno assunto un certo rilievo argomenti come la generazione di numeri a caso e la costruzione di algoritmi di simulazione; in questo testo alcuni spazi sono stati riservati a queste tematiche, che sono spesso collegate a interessanti sviluppi teorici. Dall'altra. l'uso di software specifici e facilmente accessibili permette ora. allo studente di cimenta.re la. propria. formazione in veri problemi di statistica., resi ardui in altri tempi dalla presenza di lunghi, e poco significativi, calcoli ·numerici e dalla difficoltà di accesso ai metodi grafici. Questi strumenti di ela borazione statistica hanno un ruolo importante nel capitolo 6 nel trattamento degli esempi. ~- * *' * Desidero ringraziare tutti i colleghi che con i loro consigli o con la. loro costru.ttiva disapprovazione hanno contribuito alla messa a punto di queste pa gine. In particolare Alberto Frigerio, Giorgio Letta., Federico Marchetti, Mauro Piccioni, Eugenio Regazzini e Marta Sa.nz. Pa.olo Ba.Idi .r-.-Jarz1o9 93 Questo libro è dedicato a Alberto Fr-iger-io 1 Spazi di probabilità 1.1 Fenomeni deterministici e casuali Nei problemi di predizione si incontrano due tipi di situazioni. Se una pallina cade siamo in grado di dire istante per istante quale sarà. la sua posizione e, più in generale, dato un sistema meccanico è sempre possibile teoricamente, se si conoscono le condizioni iniziali, risolvere le equazioni del moto e dire quale sarà. lo stato del sistema ad un assegnato tempo t. S_ei _nveç~v _iene lanciata 1:tfi-a.tQ_onetnao n c'è modo di prevedere su quale faccia cadr_à, il che si esprime dicendo che questo esperimento è aleatorio ( o casuale). Ciò però non significa che in un esperimento casuale non si possa dire niente del risultato: se si estrae una pallina da un 'urna contenente 999 palline bianche e 1 rossa, è chiaro che ci aspettiamo di ottenere come risultato una pallina bianca e che considereremo l'estrazione della pallina rossa come un fatto piuttosto eccezionale. Nei due esempi che seguono vedremo qual è la struttura tipica di un feno meno casuale. Esempio 1.1 Un'urna contiene sei palline numerate da 1 a 6, peraltro iden tiche. Una pallina viene estratta a caso e se ne guarda il numero. I possibili risultati di questa operazione sono i numeri 1, 2, 3, 4, 5, 6. Dire qual è la probabilità di ottenere 1, ad esempio, significa dare una valutazione di quanto facilmente il risultato possa essere 1. Talvolta però si è interessati alla probabi lità di eventi più complessi, come la probabilità di ottenere un numero dispari n = oppure un numero più piccolo(::;) di 4. Se indichiamo con {1,2,3,4,5,6} l'insieme dei possibili risultati, possiamo far corrispondere ad ogni evento un sottoinsieme di n. Ad esempio l'evento "esce un numero dispari" corrisponderà al sottoinsieme {1,3,5} mentre l'evento "esce un numero::; 4" corrisponderà. n al sottoinsieme {1, 2, 3,4}. Questa identificazione tra eventi e sottoinsiemi di permette di trasportare agli eventi le operazioni di U, n e passaggio al comple mentare. Il significato intuitivo di queste operazioni riferite agli eventi è facile: n ,e A e B sono sottoinsiemi di corrispondenti a due eventi allora 2 Capitolo 1 A n B corrisponderà all'evento: "i due eventi associati ad A e B si verificano entrambi"; A U B corrisponderà all'evento: "uno almeno dei due eventi si verifica"; Ac corrisponderà all'evento: "l'evento associato ad A non si verifica". In questa identificazione n sarà "l'evento certo", cioè quello che si verifica certamente, mentre 0 sarà "l'evento impossibile", quello che certamente non si verifica. Una valutazione di probabilità sarà un'applicazione P che ad ogni evento ( ovvero ad ogni sottoinsieme di n) associa un numero reale e vorremo che questo numero sia tanto più grande quanto più l'evento è probabile. Sarà ragionevole richiedere che P goda di un certo numero di proprietà, ad esempio che se A e B sono eventi disgiunti (A n B = 0) allora = + ( 1.1) P(A U B) P(A) P(B) Esempio 1.2 Consideriamo l'istante in cui un certo componente elettronico si guasta e perciò debba essere sostituito. In questo caso l'insieme dei possibili risultati è n = Ill+ e anche in questo caso possiamo mettere in corrispondenza gli eventi di cui vogliamo calcolare la probabilità con dei sottoinsiemi di n. Ad esempio al sottoinsieme [1, 2] corrisponderà l'evento "il componente smette di funzionare in un istante t compreso tra 1 e 2". A differenza dell'esempio precedente ora l'insieme dei possibili risultati, n, contiene una infinità ( con tinua) di elementi e non è opportuno considerare eventi tutti i sottoinsiemi di n, poiché la classe di tutte le parti di m,+è un oggetto scomodo da trattare. n Dobbiamo dunque stabilire quali dei sottoinsiemi di sono eventi. Dato però il significato intuitivo delle operazioni di intersezione, unione e complementare quando riferite agli eventi, sarà opportuno che se A e B sono eventi, allora anche A n B, A U Be Ac lo siano. Infatti gli eventi sono i sottoinsiemi di cui si può calcolare la probabilità ed è opportuno che si possa parlare della proba bilità, ad esempio, che due eventi si verifichino entrambi oppure che un evento non si verifichi. Quindi vorremo che la classe A' degli eventi sia stabile per le operazioni di intersezione, unione e complementare. 1.2 Spazi di probabilità Come è suggerito negli esempi precedenti, nello studio di un fenomeno casuale siamo sempre jn presenza di n a) un insieme (l'insieme dei possibili risultati) b) una famiglia A di sottoinsiemi di n tale che b1) se A, BE A allora A U BE A Spazi di probabilità 3 h2) se A, BE A allora A n BE A h3) se A E A allora Ac E A È chiaro che, per ricorrenza, da b1) si ricava che se Ai, ... , An E A allora LJ~1 Ai E A e analogamente da b2) se A1, ... , An E A allora la loro interse zione è ancora in A. Definizione 1.3 Una famiglia A di parti di un insieme n si dice una CT-algebra ( o tribù) se i) 0,S1EA ii) Se A E A allora Ac E A iii) Se A1, ... , An, ... E A allora 00 iiia) LJA n E A n=l n00 iiib) An' EA n=l Osserviamo che la Definizione 1.3 è ridondante nel senso che la condizione iiib) è conseguenza di ii) e di iiia) grazie alla formula di De Morgan Allo stesso mod9 iiia) è conseguenza di iiib) e ii). Definizione 1.4 Sia. n un insieme, A una CT-algebra di parti di n. Una. pro babilità P è un 'applicazione P: A -+ IR,+ tale che = 1) P(S1) 1 2) Se {An}n è una successione di elementi di A a due a due disgiunti, allora ( a-additività) Definizione 1.5 Chiameremo spazio di probabilità una terna (O, A, P) dove n è un insieme A è una CT-algebrad i pa.rti di O P è una probabilità su A. Come è suggerito dagli esempi, gli spazi di probabilità sono dei modelli mate matici non innaturali di fenomeni non deterministici. Affrontando un problema 4 Capitolo 1 concreto il primo passo consisterà nella costruzione di uno spazio di probabilità adeguato. Questa prima operazione ( modellizzazione) viene effettuata basan dosi su considerazioni empiriche e soggettive, tenendo conto della natura del problema. Ciò significa che in generale, dato un fenomeno aleatorio, non c'è uno spazio di probabilità privilegiato che lo descriva ed è anzi possibile che persone diverse scelgano di studiarlo mediante spazi di probabilità differenti. Nella maggior parte dei problemi trattati in questo libro alcuni concetti fondamentali del Calcolo delle Probabilità ( equiprobabilità, indipendenza, ... ) permetteranno di costruire uno spazio di probabilità "naturale". Anche in questi casi però la costruzione si basa sulla ipotesi, soggettiva anche se spesso ragionevole, che il fenomeno soddisfi a certe proprietà. Si pone quindi il problema di verificare, a. posteriori, la. bontà di uno spazio di probabilità come modello di un dato fenomeno aleatorio. È questo uno dei compiti della Statistica Matematica. Ad esempio, nel ca.so dell'Esempio 1.1 è ragionevole, sulla base della discussione fatta, considerare lo spazio di probabilità dato da n = {1,2,3,4,5,6} A= P(f2) (tutte le parti di f2) Resta da determinare la probabilità P. Ma per la natura del problema, se nell'estrazione non c'è modo di distinguere le palline, è ragionevole supporre che i possibili risultati si verifichino tutti con uguale probabilità, cioè che sia / = = = = = = P({l}) P({2}) P{{3}) P({4}) P({5}) P({6}) p Il numero p risulta dunque determinato da.Ila.r elazione 1 = P(f2) = P({l} U {2} U {3} u {4} U {,5} U {6}) = + + + + + = P({l}) P({2}) P({3}) P({4}) P({.5}) P({6}) = 6p = ¼. cioè p Siamo ora in grado di calcolare la probabilità di tutti gli eventi. = Ad esempio se A {1,3,,5} allora A si può scrivere come unione disgiunta {1} U {3} U {5} e dunque P(A) = P( {1}) + P( {2}) + P( {3}) = ~ e più in generale per un evento A e n sarà P(A) =#A= #A 6 #f2