Appunti del corso "Introduzione ai Processi Aleatori" Indice 1 Probabilit(cid:18)a condizionata a (cid:27) algebre (cid:0) 1.1 Il caso discreto 1.2 Il caso generale 1.3 Distribuzione condizionata 2 Media condizionata a (cid:27) algebre (cid:0) 2.1 De(cid:12)nizione e propriet(cid:18)a 2.2 Distribuzione e media condizionata 3 Processi stocastici 3.1 Distribuzioni (cid:12)nito dimensionali e teorema di esistenza di Kolmogorov 3.1 Un esempio: il moto browniano o processo di Wiener (cid:0) (cid:27) 1 Probabilit(cid:18)a condizionata a algebre 1.1 Il caso discreto Sia ((cid:10); ;P) uno spazio di probabilit(cid:18)a: F (cid:10) spazio campionario; (cid:15) (cid:27) algebra di eventi di (cid:10): (cid:15) F (cid:0) ;(cid:10) , (cid:3) ; 2 F c c se A allora A [A = (cid:10) A], (cid:3) 2 F 2 F (cid:0) 1 se An n allora n=1 An ; (cid:3) f g (cid:26) F [ 2 F P misura di probabilit(cid:18)a su ((cid:10); ): P : [0;1] tale che (cid:15) F F ! P((cid:10)) = 1, (cid:3)(cid:3) 1 1 P( n=1 An) = n=1P(An), se An Am = per ogni n = m ((cid:27) additivit(cid:18)a). (cid:3)(cid:3) [ \ ; 6 (cid:0) P Formula di Bayes: se B , P(B) > 0, 2 F P(A B) P(A B) = \ j P(B) rappresenta la probabilit(cid:18)a del veri(cid:12)carsi dell’evento A nota l’informazione data da B. Si noti che, al variare di A , P(A B) (cid:18)e una misura di probabilita(cid:18). 2 F j Ovviamente, la probabilit(cid:18)a di A condizionata al non veri(cid:12)carsi di B (cid:18)e c c P(A B ) P(A B ) = \c j P(B ) 1 c purch(cid:19)e P(B ) > 0. Ci(cid:18)o signi(cid:12)ca che la probabilit(cid:18)a condizionata cambia a seconda del veri(cid:12)carsi o meno di B. In altre parole, essa dipende dall’osservazione e(cid:11)ettuata, cio(cid:18)e da ! (cid:10), ed il suo valore pu(cid:18)o essere calcolato tramite la formula di Bayes: se 0 < P(B) < 1, 2 essa vale P(A B) se ! B f(!) = j c 2 c (1) ( P(A B ) se ! B j 2 Osservazione 1.1 Ci si potrebbe chiedere quale valore debba essere attribuito alla fun- zione f quando P(B) = 0 oppure P(B) = 1. In realt(cid:18)a, in tal caso la de(cid:12)nizione di f non (cid:18)e "ben posta". Infatti, quando P(B) = 0 l’aver osservato B non d(cid:18)a alcuna informazione riguardo la probabilit(cid:18)a del veri(cid:12)carsi di A, ovvero P(A B). Se invece P(B) = 1, allora c c j P(B ) = 0 e quindi in tal caso (cid:18)e P(A B ) a non essere ben de(cid:12)nita. Ne segue che la j formula (1) (cid:18)e sempre ben de(cid:12)nita a meno di insiemi di probabilita(cid:18) nulla, cio(cid:18)e quasi certa- mente (q.c.). Qualoral’insiemesu cui f non (cid:18)e de(cid:12)nita(cid:18)e non vuoto (cio(cid:18)e P(B) = 0 oppure P(B) = 1, con B = o (cid:10)), su tale insieme il valore di f sar(cid:18)a preso in modo arbitrario. 6 ; Come vedremo in seguito, la (1) de(cid:12)nisce la probabilit(cid:18)a di A condizionata alla c (cid:27) algebra = ;(cid:10);B;B . Si noti che tale probabilit(cid:18)a(cid:18)e una variabile aleatoria (v.a.) (cid:0) G f; g reale, ovvero una funzione reale misurabile: se (IR) denota la (cid:27) algebra di Borel F(cid:0) B (cid:0) su IR, allora f : ((cid:10); ) (IR; (IR)) F ! B (cid:0)1 con f (H) = ! (cid:10) : f(!) H ;per ogni H (IR) f 2 2 g 2 F 2 B c La famiglia di insiemi B;B (cid:18)e una partizione (banale) di (cid:10) e l’idea utilizzata per f g costruire la funzione f de(cid:12)nita in (1) consente di generalizzare il concetto di probabilit(cid:18)a 1 condizionata a (cid:27) algebre generate da partizioni qualsiasi nel modo seguente. (cid:0) Sia Bi i2I una partizione al piu(cid:18) numerabile di (cid:10): f g card(I) card(IN); (cid:15) (cid:20) Bi Bj = per ogni i = j; (cid:15) \ ; 6 i2IBi = (cid:10). (cid:15) [ Sia la (cid:27) algebra generata da Bi i2I. Si dimostra (esercizio!) che (cid:18)e formata da tutte G (cid:0) f g G le possibili unioni degli elementi della partizione: = G : G = i2IGBi;IG I G f [ (cid:26) g 1 Data una famiglia di insiemi di (cid:10), ricordiamo che la (cid:27) algebra generata da , in simboli P (cid:0) P (cid:27)( ), (cid:18)e la piu(cid:18) piccola (cid:27) algebra contenente . Se X denota una variabile aleatoria su ((cid:10); ), ovvero P n n(cid:0) n P n F X : ((cid:10); ) (IR ; (IR )), dove (IR ) denota la (cid:27) algebra di Borel su IR , la (cid:27) algebra generata F ! B B (cid:0) (cid:0) da X, in simboli (cid:27)(X), (cid:18)e la piu(cid:18) piccola (cid:27) algebra di eventi di (cid:10) rispetto alla quale X (cid:18)e misurabile. (cid:0) n Si puo(cid:18) dimostrare che (cid:27)(X) (cid:18)e costituita dalle controimmagini tramite X dei boreliani di IR : (cid:27)(X) = (cid:0)1 n X (H):H (IR ) . f 2B g 2 Fissato A , sia 2 F f(!) = P(A Bi) se ! Bi e P(Bi) > 0 (2) j 2 Posto P(A Bi) = c, con c costante arbitraria, per ogni indice i tale che P(Bi) = 0, la j funzione f diviene de(cid:12)nita per ogni ! (cid:10) e si pu(cid:18)o scrivere in modo equivalente 2 f(!) = P(A Bi)1IBi(!) (3) i2I j X oppure (cid:3) f(!) = P(A Bi (!)) (4) j (cid:3) (cid:3) (cid:3) dove i : (cid:10) I, i (!) (cid:18)e quell’indice (unico!) i I tale che ! Bi (i (!) = i se e solo se ! 2 2 ! Bi). 2 Alla funzione f si puo(cid:18) dare il seguente signi(cid:12)cato. La partizione Bi i2I, o in modo equivalente la (cid:27) algebra , si pu(cid:18)o interpretare f g (cid:0) G come un possibile esperimento; se un osservatore sa quale elemento Bi della partizione contiene ! signi(cid:12)ca allora che conosce il risultato dell’esperimento e f(!) d(cid:18)a quindi la nuova probabilit(cid:18)a dell’evento A nota l’osservazione. Per tale ragione la v.a. f (cid:18)e detta probabilit(cid:18)a di A condizionata alla (cid:27) algebra ed (cid:18)e usualmente denotata con il (cid:0) G simbolo P(A ): jG f(!) = P(A )(!) jG Ovviamente, P(A ) non (cid:18)e univocamente de(cid:12)nita per quei valori di ! appartenenti ad jG insiemi Bi per i qual P(Bi) = 0 e per questo motivo la probabilit(cid:18)a condizionata(cid:18)e de(cid:12)nita q.c. (si veda l’Osservazione 1.1). Esempio 1.2 Sia Nt un processo di Poisson di parametro (cid:21). Fissato t > 0, sia Bi = ! : Nt(!) = i ; i = 0;1;2;::: f g Ovviamente Bi i(cid:21)0 (cid:18)e una partizione di (cid:10). Sia la (cid:27) algebra generata da Bi i(cid:21)0: f g G (cid:0) f g = (cid:27)(B0;B1;B2;:::) = (cid:27)(Nt) G Fissato s < t, calcoliamo P(Ns = k ) per k = 0;1;2;:::, ovvero la probabilit(cid:18)a di jG A = ! : Ns(!) = k condizionata alla (cid:27) algebra . Si noti che, interpretando Nt come f g (cid:0) G il numero di telefonate arrivate ad un centralino (cid:12)no all’istante t, P(Ns = k )(!) (cid:18)e la jG probabilit(cid:18)a che ad un istante (passato) s siano arrivate k telefonate condizionatemente al numero totale di chiamate Nt(!) pervenute al tempo (presente) t. Infatti, dalla (2), P(Ns = k )(!) = P(Ns = k Nt = i) quando Nt(!) = i jG j Poich(cid:19)e Ns Nt per ogni s < t, P(Ns = k Nt = i) = 0 per ogni i < k, dunque (cid:20) j P(Ns = k )(!) = 0 se Nt(!) < k jG 3 Supponiamo ora i k. In tal caso, dalla formula di Bayes, (cid:21) P(Ns = k;Nt = i) P(Ns = k;Nt Ns = i Ns) P(Ns = k Nt = i) = = (cid:0) (cid:0) j P(Nt = i) P(Nt = i) P(Ns = k;Nt Ns = i k) = (cid:0) (cid:0) P(Nt = i) Useremo ora alcune propriet(cid:18)a caratteristiche del processo di Poisson: gli incrementi sono indipendenti: P(Ns = k;Nt Ns = i k) = P(Ns = k)P(Nt (cid:15) (cid:0) (cid:0) (cid:0) Ns = i k); (cid:0) gli incrementi Nt Ns sono v.a. di Poisson di parametro (cid:21)(t s), per ogni s < t: (cid:15) (cid:0) (cid:0) j ((cid:21)(t s)) (cid:0)(cid:21)(t(cid:0)s) P(Nt Ns = j) = (cid:0) e ; j = 0;1;:::; (cid:0) j! per r > 0, Nr (cid:18)e una v.a. di Posson di parametro (cid:21)r: (cid:15) j ((cid:21)r) (cid:0)(cid:21)r P(Nr = j) = e ; j = 0;1;:::; j! Allora, k (i(cid:0)k) ((cid:21)s) (cid:0)(cid:21)s ((cid:21)(t s)) (cid:0)(cid:21)(t(cid:0)s) i! (cid:21)t P(Ns = k Nt = i) = e (cid:0) e ie j k! (cid:1) (i k)! (cid:1) ((cid:21)t) k (cid:0) i(cid:0)k i s s = 1 k t (cid:0) t (cid:18) (cid:19)(cid:18) (cid:19) (cid:18) (cid:19) s che, osserviamo, (cid:18)e una distribuzione binomiale di parametri i e t. Possiamo dunque scrivere che Nt(!) s k s Nt(!)(cid:0)k t 1 t se k 0;1;:::Nt(!) P(Ns = kjG)(!) = 8 (cid:18) k (cid:19)(cid:16) (cid:17) (cid:16) (cid:0) (cid:17) 2 f g (5) >< 0 altrimenti >: 1.2 Il caso generale Diamo qui la de(cid:12)nizione formale di probabilit(cid:18)a condizionata ad una (cid:27) algebra e presen- (cid:0) tiamo alcuni esempi e propriet(cid:18)a che ne conseguono. De(cid:12)nizione 1.3 Sia ((cid:10); ;P) uno spazio di probabilit(cid:18)a, A un evento (cid:12)ssato in e 2 F F G una sotto (cid:27) algebra di . Una versione P(A ) della probabilit(cid:18)a di A condizionata a (cid:0) F jG (cid:18)e una v.a. tale che: G 2 Ovvero, (cid:18)e una (cid:27) algebra di eventi di (cid:10) e . G (cid:0) G (cid:26)F 4 3 (i) P(A ) (cid:18)e misurabile e integrabile; jG G(cid:0) (ii) Per ogni G , 2 G P(A )(!)dP(!)= P(A G) G jG \ Z o, equivalentemente, IE[P(A )1IG] = P(A G) jG \ Occorre subito mostrare l’esistenza di una v.a. che soddis(cid:12) le condizioni richieste e gius- ti(cid:12)care il termine "versione" introdotto nella de(cid:12)nizione precedente. A tale scopo, sia (cid:22) la misura su de(cid:12)nita da G (cid:22)(G) = P(A G); G \ 2 G Se P(G) = 0 allora (cid:22)(G) = 0, cio(cid:18)e (cid:22) (cid:18)e assolutamente continua rispetto a P. Il teorema di 4 Radon{Nicodym assicuraalloral’esistenzadiunafunzionef, misurabilee integrabile, G(cid:0) tale che per ogni G , 2 G f(!)dP(!)= (cid:22)(G) (6) G Z Bastera(cid:18) dunque porre P(A )(!) = f(!). L’unicit(cid:18)a della funzione f che veri(cid:12)ca la (6) 5 jG non (cid:18)e per(cid:18)o assicurata . Ci(cid:18)o signi(cid:12)ca che la probabilit(cid:18)a condizionata P(A ) (cid:18)e unica q.c., jG cio(cid:18)e a meno di insiemi di di probabilit(cid:18)a 0, e per tale ragione si usa il termine "versione" G della probabilit(cid:18)a condizionata, termine che d’ora in poi verr(cid:18)a omesso. Esempio 1.4 Se = ;(cid:10) allora P(A )(!) = P(A) (veri(cid:12)care (i) e (ii)!). G f; g jG Esempio 1.5 Sia A un evento indipendente da , ovvero P(A G) = P(A)P(G) per G \ ogni G . In tal caso, P(A )(!) = P(A). Infatti, ogni funzione costante (cid:18)e misurabile 2 G jG rispetto alla (cid:27) algebra banale ;(cid:10) , dunque rispetto ad ogni (cid:27) algebra. Inoltre, (cid:0) f; g (cid:0) P(A G) = P(A)P(G) = P(A)dP(!) \ G Z sicch(cid:19)e anche (ii) (cid:18)e veri(cid:12)cata. Esempio 1.6 Se in particolare A , allora P(A )(!) = 1IA(!). Infatti, (i) (cid:18)e immedi- 2 G jG ata. Riguardo (ii), basta osservare che P(A G) = dP(!) = 1IA(!)dP(!): \ A\G G Z Z 3 (cid:0)1 Ovvero, per ogni boreliano H di IR, P(A ) (H) = ! : P(A )(!) H . Si noti che, poich(cid:19)e (cid:0)1 jG f jG 2 g2 G P(A )(cid:18)eunav.a., in particolareP(A ) (H) . La misurabilit(cid:18)aesprimedunque la necessita(cid:18)che jG jG 2F G(cid:0) la probabilit(cid:18)a condizionata a debba dipendere solo dagli eventi di . 4 G G (Radon{Nicodym) Sia (cid:23)1 una misura su ((cid:10); ) (cid:12)nita e (cid:27) additiva. Sia (cid:23)2 una misura (o, piu(cid:18) in G (cid:0) generale, una carica o misura con segno) de(cid:12)nita sullo stesso spazio, assolutamente continua rispetto a (cid:23)1. Allora esiste su (cid:10) una funzione f integrabile rispetto a (cid:23)1 tale che (cid:23)2(G) = Gf(!)d(cid:23)1(!) per ogni G . 25G R Se g (cid:18)e una funzione misurabile tale che x : g(x) = 0 (cid:18)e un insieme di P misura nulla, f +g G(cid:0) f 6 g (cid:0) rimane ancora misurabile, integrabile e veri(cid:12)ca la (6). G(cid:0) 5 Esempio 1.7 Sia la (cid:27) algebra generata da una partizione Bi i2I al piu(cid:18) numerabile G (cid:0) f g di (cid:10) e sia A un evento (cid:12)ssato di . Mostriamo che la formula (2), o equivalentemente F (3) e (4), danno e(cid:11)ettivamente la probabilit(cid:18)a di A condizionata a come richiesto dalla G De(cid:12)nizione 1.3. Mostriamo dapprima la misurabilit(cid:18)a. Sia H un boreliano di IR. Dalla (2) segue G(cid:0) che (cid:0)1 ! f (H) se e solo se esiste i I t:c: P(A Bi) H 2 2 j 2 Dunque, (cid:0)1 f (H) = i2JBi; dove J = i I : P(A Bi) H : [ f 2 j 2 g Ricordando che (cid:18)e fatta di tutte le possibili unioni degli elementi della partizione, la G propriet(cid:18)a (i) segue immediatamente. Occorre ora veri(cid:12)care (ii). Calcoliamo dunque IE[f 1IG], dove G = i2IGBi . Dalla [ 2 G rappresentazione (3) possiamo scrivere f(!)1IG(!) = i2IGP(A Bi)1IBi(!), da cui j P IE[f 1IG] = P(A Bi)P(Bi) = P(A Bi) = P(A i2IGBi) = P(A G) i2IG j i2IG \ \[ \ X X Sia Y = (Y1;:::;Yn) un vettore di v.a. reali e sia (cid:27)(Y) (o (cid:27)(Y1;:::;Yn)) la (cid:27) algebra (cid:0) generata da Y: (cid:0)1 n (cid:27)(Y) = (cid:27)(Y1;:::;Yn) = Y (H); H (IR ) f 2 B g n n dove (IR )denotala(cid:27) algebradiBorelsuIR . FissatoA ,siconsiderilaprobabilit(cid:18)a B (cid:0) 2 F P(A (cid:27)(Y))(!) di A condizionata alla (cid:27) algebra (cid:27)(Y). In tal caso, vengono usualmente j (cid:0) utilizzate le notazioni P(A Y)(!) oppure P(A Y1;:::;Yn)(!) j j per sottolineare il fatto che la probabilit(cid:18)a condizionata dipende da ! solo tramite Y(!) = (Y1(!);:::;Yn(!)). Infatti, dalla propriet(cid:18)a (i) della De(cid:12)nizione 1.3, la v.a. P(A (cid:27)(Y))(!) 6 7 j (cid:18)e (cid:27)(Y) misurabile: esiste quindi una funzione boreliana (cid:9) tale che P(A Y)(!) = (cid:9)(Y(!)) j o in modo equivalente, P(A Y1;:::;Yn)(!) = (cid:9)(Y1(!);:::;Yn(!)): j La funzione (cid:9) viene denotata n (cid:9)(y) = P(A Y = y); y IR j 2 maattenzioneanonconfondereP(A Y = y)conlaprobabilit(cid:18)adiAcondizionataall’evento j Y = y (che, osserviamo, in molti casi di interesse (cid:18)e un evento di probabilit(cid:18)a nulla, per f g il quale quindi la probabilita(cid:18) condizionata non (cid:18)e ben de(cid:12)nita, si veda l’Esempio 1.9). 6 Se Z (cid:18)e una v.a. (cid:27)(Y) misurabile allora esiste una funzione (boreliana) tale che Z = (Y). 7 k (cid:0) m (cid:0)1 Una funzione :IR IR (cid:18)e boreliana se (cid:18)e misurabile rispetto alla (cid:27) algebra di Borel: (H) k !m (cid:0) 2 (IR ) per ogni H (IR ). In questo caso, k =n e m=1. B 2B 6 Esempio 1.8 Sia N un processo di Poisson e de(cid:12)niamo = (cid:27)(Nt), per t > 0 (cid:12)ssato. G Dall’Esempio 1.2 segue allora che, per s < t, P(Ns = k )(!) = P(Ns = k Nt)(!) = (cid:9)(Nt(!)); k IN jG j 2 dove (cid:9)(y) = P(Ns = k Nt = y) (cid:18)e data dalla formula (5), i.e. j y s k s y(cid:0)k t 1 t se k 0;1;:::y P(Ns = kjNt = y) = 8 (cid:18)k(cid:19)(cid:16) (cid:17) (cid:16) (cid:0) (cid:17) 2 f g >< 0 altrimenti >: Esempio 1.9 Siano X e Y due v.a. reali assolutamente continue: esiste una funzione di 2 densit(cid:18)a di probabilita(cid:18) pX;Y(x;y) : IR [0;+ ) (misurabile) tale che ! 1 P((X;Y) H) = pX;Y(x;y)dxdy (7) 2 H Z Posto = (cid:27)(Y), cerchiamo la probabilit(cid:18)a dell’evento A = X (cid:0) condizionata a Y, G f 2 g cio(cid:18)e P(X (cid:0) Y)(!) = P(X (cid:0) )(!). De(cid:12)niamo 2 j 2 jG pX;Y(x;y) se pY(y) > 0 pXjY(x y) = 8 pY(y) j >< 0 altrimenti >: dove pY(y) (cid:18)e la densit(cid:18)a marginale della v.a. Y: pY(y) = IRpX;Y(x;y)dx. La funzione pXjY( y) : IR [0;+ ) prende il nome di densit(cid:18)a di XR condizionata a Y, perch(cid:19)e (cid:1)j ! 1 (cid:12)ssato (cid:0) (IR) e posto 2 B (cid:9)(y) = pXjY(x y)dx (8) (cid:0) j Z si ha che P(X (cid:0) Y)(!) = (cid:9)(Y(!)): 2 j Veri(cid:12)chiamo la validit(cid:18)a delle a(cid:11)ermazioni contenute nella De(cid:12)nizione 1.3. La Y misurabilit(cid:18)a (cid:18)e immediata. Infatti (cid:9)(y) : IR [0;+ ) (cid:18)e una funzione mis- (cid:0) ! 1 urabile e quindi (cid:9)(Y(!)) (cid:18)e (cid:27)(Y) misurabile perch(cid:19)e funzione composta di funzioni G (cid:17) (cid:0) misurabili. Per quanto riguarda (ii), occorre mostrare che P( X (cid:0) G) = (cid:9)(Y(!))dP(!) per ogni G (cid:27)(Y) f 2 g\ G 2 Z Poich(cid:19)e gli insiemi G (cid:27)(Y) si possono rappresentare nella forma G = ! : Y(!) (cid:3) 2 f 2 g (cid:17) Y (cid:3) al variare di (cid:3) (IR), utilizzando la legge indotta su IR da Y la condizione su f 2 g 2 B scritta equivale a P( X (cid:0) Y (cid:3) ) P((X;Y) (cid:0) (cid:3) ) = (cid:9)(y)pY(y)dy per ogni (cid:3) (IR) f 2 g\f 2 g (cid:17) 2 (cid:2) g (cid:3) 2 B Z 7 Infatti, dalla (7) (con H = (cid:0) (cid:3)), si ha (cid:2) pX;Y(x;y) P((X;Y) (cid:0) (cid:3)) = pX;Y(x;y)dxdy = pY(y)dxdy = 2 (cid:2) (cid:0)(cid:2)(cid:3) (cid:0)(cid:2)(cid:3) pY(y) Z Z pX;Y(x;y) = dx pY(y)dy = (cid:9)(y)pY(y)dy (cid:3) (cid:0) pY(y) ! (cid:3) Z Z Z In tal caso dunque P(X (cid:0) Y = y) = (cid:0)pXjY(x y)dx (e si noti che P(Y = y) = 0, per 2 j j ogni y!). R Riportiamooraalcune propriet(cid:18)aprincipalidellaprobabilit(cid:18)acondizionataa(cid:27) algebre, (cid:0) che raccoglieremo in un unico Teorema 1.10 Per ogni A, 0 P(A ) 1 q:c: (9) (cid:20) jG (cid:20) Per ogni successione A1;A2;::: numerabile di insiemi disgiunti P ( nAn ) = P(An ) q:c: (10) [ jG n jG X Se A B, (cid:26) P(B A ) = P(B ) P(A ) q:c: (11) (cid:0) jG jG (cid:0) jG Vale la formula di inclusione{esclusione: P ( nAn ) = P(An ) P(An Am )+::: q:c: (12) [ jG n jG (cid:0)n<m \ jG X X Per ogni successione A1;A2;::: numerabile di insiemi tali che, per ogni n, An An+1 (cid:26) lim P(An ) = P ( nAn ) q:c: (13) n!1 jG [ jG Per ogni successione A1;A2;::: numerabile di insiemi tali che, per ogni n, An+1 An (cid:26) lim P(An ) = P ( nAn ) q:c: (14) n!1 jG \ jG Se P(A) = 1 [P(A = 0)], P(A ) = 1 [P(A ) = 0] q:c: (15) jG jG 1.3 Distribuzione condizionata Nel paragrafo precedente abbiamo de(cid:12)nito la probabilit(cid:18)a di un evento (cid:12)ssato A 2 F condizionata ad una (cid:27) algebra . In questa sezione discuteremo l’esistenza di misure di (cid:0) G probabilit(cid:18)a condizionate a (cid:27) algebre, l’esistenza cio(cid:18)e di (cid:0) P(A )(!); per ! (cid:10) (cid:12)ssato; al variare di A jG 2 2 F 8 Supponiamo ad esempio che sia la (cid:27) algebra generata da una partizione B1;B2;::: G (cid:0) f g di (cid:10) e facciamo l’ipotesi che B1 = , P(B1) = 0 e P(Bi) > 0, per ogni i 2. Fissato 6 ; (cid:21) A , una versione di P(A ) (cid:18)e 2 F jG 5 se ! B1 P(A )(!) = 2 jG ( P(A Bi) se ! Bi;i 2 j 2 (cid:21) E(cid:18) facile veri(cid:12)care che, come funzione di A , P(A )(!) (cid:18)e una misura di probabilit(cid:18)a 2 F jG su solo se ! = B1. Non (cid:18)e per(cid:18)o questo un gran danno: P( )(!) (cid:18)e una misura di F 2 (cid:1)jG probabilit(cid:18)a su per ogni ! i(cid:21)2Bi, un insieme che pur non essendo (cid:10) ha almeno F 2 [ probabilit(cid:18)a 1 (in altre parole, in questo esempio P( )(!) esiste a meno di un insieme di (cid:1)jG probabilit(cid:18)a nulla). Inoltre, non (cid:18)e diÆcile modi(cid:12)care la probabilit(cid:18)a su scritta per ottenere una misura di probabilit(cid:18)a su per ogni !: baster(cid:18)a porre F P(A) se ! B1 P(A )(!) = 2 jG ( P(A Bi) se ! Bi;i 2 j 2 (cid:21) In generale per(cid:18)o non (cid:18)e possibile fare un discorso di questo tipo. Infatti, abbiamo visto che P(A )(!) (cid:18)e ben posta ((cid:18)e cio(cid:18)e l’unica funzione di ! che veri(cid:12)ca le condizioni della jG De(cid:12)nizione 1.3) a meno di insiemi di probabilit(cid:18)a nulla: (cid:12)ssato A , esiste un insieme 2 F NA (in generale non vuoto) tale che P(A )(!) (cid:18)e ben posta per ogni ! = NA. Ora, 2 F jG 2 volendo far variare A F, otterremmo che P(A )(!) (cid:18)e ben posta per ogni ! = N 2 jG 2 (cid:17) A2FNA, ovvero P(A )(!) (cid:18)e ben de(cid:12)nita per ! (cid:10) N. Il problema per(cid:18)o (cid:18)e che in [ jG 2 (cid:0) questo modo la probabilita(cid:18) condizionata potrebbe non essere piu(cid:18), come funzione di !, un variabile aleatoria (cosa sulla quale non si transige!). Difatti, l’insieme N de(cid:12)nto sopra potrebbe non appartenere piu(cid:18) alla (cid:27) algebra di riferimento : sappiamo infatti che (cid:18)e (cid:0) F F chiusa sotto unioni numerabilie la cardinalit(cid:18)adi potrebbe non esserlo, cos(cid:18)(cid:16) che N = . F 8 2 F Inoltre, qualora N niente assicura che P(N) = 0 , e dunque P(A )(!) potrebbe 2 F jG non essere de(cid:12)nita su insiemi troppo grandi (di misura non nulla). Potrebbe anche essere 9 N = (cid:10), nel qual caso P(A )(!) non sarebbe de(cid:12)nita per nessun !! jG Il problema appena esposto diviene piu(cid:18) semplice, e con soluzione, quando si vuole studiare la distribuzione di una v.a. X (che in questa trattazione supporremo a valori in IR) condizionata ad una (cid:27) algebra , ovvero quando la misura di probabilit(cid:18)ache si cerca (cid:0) G (cid:18)e data da (cid:22)(H;!) = P(X H )(!); per ! (cid:10) (cid:12)ssato; al variare di H (IR) 2 jG 2 2 B La misura di probabilit(cid:18)a (cid:22)( ;!) su (IR; (IR) (cid:18)e detta distribuzione di X condizionata (cid:1) B a e il teorema che segue ne assicura l’esistenza: G 8 L’unione numerabile di insiemi di probabilit(cid:18)a nulla ha probabilita(cid:18) nulla. Come gi(cid:18)a osservato, N = A2FNA (cid:18)e unione di una quantit(cid:18)a di eventi che potrebbe essere non numerabile, dunque potrebbe avere [ probabilit(cid:18)a positiva. 9 Esistono esempi in letteratura sull’impossibilita(cid:18) di costruire misure di probabilit(cid:18)a condizionate. 9 Teorema 1.11 Esiste una funzione (cid:22)(H;!), per ! (cid:10) e H (IR), tale che 2 2 B (D1) per ogni ! (cid:10) (cid:12)ssato, (cid:22)(H;!) (cid:18)e, al variare di H (IR), una misura di 2 2 B probabilita(cid:18); (D2) per ogni H (IR) (cid:12)ssato, (cid:22)(H;!) (cid:18)e, al variare di ! (cid:10), una versione di 2 B 2 P(X H )(!). 2 jG Esempio 1.12 Sia N un processo di Poisson e t > s > 0 due tempi (cid:12)ssati. Dall’Esempio 1.8 segue allora che la distribuzione di Ns condizionata alla (cid:27) algebra generata da Nt (cid:18)e (cid:0) s discreta e coincide con una distribuzione binomiale di parametri Nt(!) e t: k Nt(!)(cid:0)k Nt(!) s s (cid:22)( k ;!) = P(Ns = k Nt)(!) = 1 ; k = 0;1;:::Nt(!) f g j k t (cid:0) t (cid:18) (cid:19)(cid:18) (cid:19) (cid:18) (cid:19) Esempio 1.13 Sia = (cid:27)(Y) e supponiamo che le v.a. X e Y soddis(cid:12)no le ipotesi G dell’Esempio 1.9. In tal caso, (cid:22)(H;!) = P(X H Y)(!) = pXjY(x y)dx = pXjY(x Y(!))dx 2 j H j y=Y(!) H j Z (cid:12) Z (cid:12) (cid:12) (cid:12) (cid:0) (cid:27) 2 Media condizionata a algebre 2.1 De(cid:12)nizione e propriet(cid:18)a In questo paragrafo, condidereremo per semplicit(cid:18)a v.a. a valori reali. 10 De(cid:12)nizione 2.1 Sia ((cid:10); ;P) uno spazio di probabilit(cid:18)a, X una v.a. integrabile e F G una sotto (cid:27) algebra di . Una versione IE[X ] della media di X condizionata a (cid:18)e una (cid:0) F jG G v.a. tale che: (i) IE[X ] (cid:18)e misurabile e integrabile; jG G(cid:0) (ii) per ogni G , 2 G IE[X ](!)dP(!)= X(!)dP(!) G jG G Z Z o, equivalentemente, IE[IE[X ] 1IG] = IE[X 1IG] jG La de(cid:12)nizione di media condizionata (cid:18)e assai simile a quella di probabilit(cid:18)a condizionata. Ancora una voltaoccorre provare l’esistenza diuna v.a. che veri(cid:12)chi lecondizionirichieste nella de(cid:12)nizione precedente. Utilizzeremo nuovamente il teorema di Radon{Nicodym. De(cid:12)niamo Q(G) = X(!)dP(!); G G 2 G Z 10 Ovvero, E[X ]< . j j 1 10
Description: