Notas de aula de Econometria Aplicada MEST 141 Prof. Daniel Santos Setembro - Novembro 2008 1 Revisªo 1.1 Causalidade A teoria econ(cid:244)mica investiga o comportamento decis(cid:243)rio dos agentes econ(cid:244)micos. Em geral, os modelos produzem rela(cid:231)ıes entre variÆveis determinadas end(cid:243)genamente e outras deter- minadas exogenamente y = g (x ;x ;u ) i i i (cid:3)i i O conteœdo emp(cid:237)rico do modelo acima depende fundamentalmente da disponibilidade de dados. Na nota(cid:231)ªo, y designa a variÆvel end(cid:243)gena ao passo que x, x* e u, as ex(cid:243)genas. Por enquanto, vamos supor que y, x e x* sªo observadas e u, nªo. O efeito causal de uma mudan(cid:231)a de x para x(cid:146)em y Ø de(cid:133)nido por (cid:1)y = g (x ;x ;u ) g (x ;x ;u ) i i 0i (cid:3)i i (cid:0) i i (cid:3)i i , ou seja, o efeito de uma altera(cid:231)ªo em x sobre y, mantendo-se constante as demais variÆveis. Note que em princ(cid:237)pio poder(cid:237)amos ter um efeito diferente para cada indiv(cid:237)duo. 2 di(cid:133)culdades surgem na descri(cid:231)ªo acima, e no fundo originam a maioria dos problemas economØtricos descritos nos livros-texto. A primeira limita(cid:231)ªo Ø que na maioria dos casos, um mesmo indiv(cid:237)duo nªo Ø observado em dois estados distintos, x e x(cid:146). A segunda Ø que Notas de aula de Econometria Aplicada MEST 141 mesmo que observÆssemos um mesmo indiv(cid:237)duo nesses dois estados, nada garante que a variÆvel nªo observada u se manteve constante entre estas medi(cid:231)ıes. Para contornar estes problemas, costuma-se supor que (H1) as fun(cid:231)ıes g (:) sªo do tipo: i g (x ;x ;u ) = (cid:22)(x ;x )+u i i (cid:3)i i i (cid:3)i i , e que (H2) a mØdia de u nªo muda se repartirmos a amostra em diferentes grupos segundo os valores de x (E(u x) = constante). j E((cid:1)y) = E(y x;x ) E(y x;x ) 0 (cid:3) (cid:3) j (cid:0) j = E[(cid:22)(x;x ) x;x ] E[(cid:22)(x;x ) x;x ]+E(u x;x ) E(u x;x ) 0 (cid:3) (cid:3) (cid:3) (cid:3) 0 (cid:3) (cid:3) j (cid:0) j j (cid:0) j = (cid:22)(x;x ) (cid:22)(x;x ) = g (x ;x ;u ) g (x ;x ;u ) 0 (cid:3) (cid:0) (cid:3) i 0i (cid:3)i i (cid:0) i i (cid:3)i i HÆ duas formas de tentar garantir H2: o mØtodo experimental (modelo de Rubin) e o mØtodo "economØtrico" ou estrutural. Na primeira, o pesquisador varia aleatoriamente o n(cid:237)vel de x para x(cid:146)em um subgrupo da popula(cid:231)ªo e mede a varia(cid:231)ªo correspondente em y. Por que isso funciona? Primeiramente, se originalmente t(cid:237)nhamos uma amostra homogŒnea em (x,x*) e a repartimos aleatoriamente em duas, a distribui(cid:231)ªo conjunta de (y,x,x*,u) em ambas deveria ser aproximadamente idŒntica, de modo que se med(cid:237)ssemos as mØdia de y e u em ambas, o resultado deveria ser semelhante. Como por hip(cid:243)tese as variÆveis x,x* e u sªo determinadasforadosistema,umamudan(cid:231)acontroladadexnªodeveriaalteraramØdiadeu. Osproblemasnessecasosªoque(i)raramenteconseguimosrealizartalprocedimentoquando se trata de agentes e variÆveis econ(cid:244)micas, (ii) mesmo que seja poss(cid:237)vel, di(cid:133)cilmente as condi(cid:231)ıes laboratoriais necessÆrias para essa randomiza(cid:231)ªo espelharªo as condi(cid:231)ıes presentes 2 Notas de aula de Econometria Aplicada MEST 141 quando os agentes de fato tomam suas decisıes, (iii) Ø poss(cid:237)vel que u varie com a mudan(cid:231)a de x, se for tambØm end(cid:243)geno ao modelo, ainda que a mudan(cid:231)a em x tenha sido ex(cid:243)gena. Quando a abordagem experimental nªo estÆ dispon(cid:237)vel ou se revela inadequada, a alter- nativa Ø modelar explicitamente a rela(cid:231)ªo entre x e u, e o sucesso da estima(cid:231)ªo dependerÆ crucialmente do realismo das hip(cid:243)teses envolvidas. A hip(cid:243)tese mais comum Ø simplesmente E(u x) = 0 (MQ-O). Alternativamente, pode-se argumentar que exista uma terceira variÆvel j z tal que mudan(cid:231)as em z alterem os valores de x sem alterar os de u (IV). O impacto nesse caso Ø semelhante ao experimental (o experimento pode ser visto como um caso particular de variÆvel instrumental). Uma terceira alternativa Ø aceitar que H2 nªo vale, e modelar explicitamente o comportamento de E(u x;x ) E(u x;x ). A essa solu(cid:231)ªo dÆ-se o nome 0 (cid:3) (cid:3) j (cid:0) j de fun(cid:231)ıes de controle, e em geral envolve uma interpreta(cid:231)ªo r(cid:237)gida do signi(cid:133)cado de u e seu papel na determina(cid:231)ªo do comportamento dos agentes. Nosso exemplo-can(cid:244)nico Ø a determina(cid:231)ªo do efeito causal de um ano a mais de esco- laridade sobre salÆrios. Suponha que nosso modelo te(cid:243)rico proponha que as pessoas vivam T anos, e passem S anos estudando e T-S trabalhando. Diferentes ocupa(cid:231)ıes requerem diferentes n(cid:237)veis de escolaridade e remuneram de forma diferente os trabalhadores1. O valor presente do (cid:135)uxo de renda de um indiv(cid:237)duo Ø, neste caso, T w(S) VP (S) = w(S) e rtdt = e rS e rT (cid:0) (cid:0) (cid:0) r (cid:0) ZS (cid:2) (cid:3) Em equil(cid:237)brio, os diferentes n(cid:237)veis educacionais deveriam proporcionar o mesmo valor presente de renda, o que signi(cid:133)ca que aqueles que estudaram mais precisam ser compensados 1 Sªo hip(cid:243)teses do modelo que nªo hÆ incertezas, que os trabalhadores sªo inicialmente idŒnticos em habili- dades e oportunidades, e que os mercados de crØdito sªo perfeitos. 3 Notas de aula de Econometria Aplicada MEST 141 pelo tempo em que (cid:133)caram sem receber salÆrios: w(S) w(0) e rS e rT = 1 e rT (cid:0) (cid:0) (cid:0) r (cid:0) r (cid:0) (cid:2) (cid:3) (cid:2) (cid:3) 1 e rT (cid:0) lnw(S) = lnw(0)+rS +ln (cid:0) 1 er(T S) (cid:20) (cid:0) (cid:0) (cid:21) lnw(0)+rS, se T for grande (cid:25) Nesse modelo, os indiv(cid:237)duos sªo em princ(cid:237)pio indiferentes entre os diversos n(cid:237)veis de escolaridade, e serªo distribu(cid:237)dos aleatoriamente entre os vÆrios n(cid:237)veis de S, sugerindo uma rela(cid:231)ªo do tipo: lnw = lnw(0)+rS +" i i i " independente de S i i Como o erro da equa(cid:231)ªo acima Ø puramente aleat(cid:243)rio, podemos consistentemente estimar uma regressªo do tipo: lnw = (cid:12) +(cid:12) S +" i 0 1 i i por MQO numa cross-section, e nesse caso a interpreta(cid:231)ªo do coe(cid:133)ciente (cid:12) Ø a de que 0 representaria o (log do) salÆrio de um analfabeto, e (cid:12) o retorno r obtido pelo investimento 1 em educa(cid:231)ªo, que nesse caso tambØm representa o efeito causal de S sobre ln(w). O modelo alternativo Ø um mercado de trabalho onde as (cid:133)rmas usam caracter(cid:237)sticas produtivas dos agentes como insumos para produzir bens, segundo a fun(cid:231)ªo de produ(cid:231)ªo Q = Q(S;x ;u) = exp[b +b S +b u] (cid:3) 0 1 2 4 Notas de aula de Econometria Aplicada MEST 141 Em equil(cid:237)brio, o salÆrio serÆ w = ws +wu = (b +b )Q, o que implica: 1 2 lnw = [b +ln(b +b )]+b S +b u 0 1 2 1 2 = (cid:12) +(cid:12) S +u 0 1 i i Note que enquanto no primeiro modelo o termo " era puramente aleat(cid:243)rio (implicando i em que E(" x) = 0 seja razoÆvel), no segundo, o termo u re(cid:135)ete uma caracter(cid:237)stica nªo i j observÆvel do indiv(cid:237)duo e que pode estar correlacionada com escolaridade (e.g. habilidade). Umterceiromodelo(Mincer,1974)propıeaindaumaterceiraformarelacionandosalÆrios e educa(cid:231)ªo: Seja E = salÆrio potencial no per(cid:237)odo t, w = salÆrio observado, C = investimento em t t t capital humano, k = fra(cid:231)ªo do salÆrio potencial investida, (cid:26) = retorno ao investimento t t realizado em capital humano. C = kE t t E = E +(cid:26) C t+1 t t t = (1+k (cid:26) )E t t t t = 1+k (cid:26) E j j 0 j=0 Y(cid:0) (cid:1) Suponha que na educa(cid:231)ªo formal o investimento em capital humano Ø mÆximo: k = 1, s 5 Notas de aula de Econometria Aplicada MEST 141 e de(cid:133)na (cid:26) = retorno (cid:224) educa(cid:231)ªo e (cid:26) = retorno ao treinamento p(cid:243)s-educa(cid:231)ªo. Entªo23: s 0 t 1 (cid:0) lnE = lnE +sln(1+(cid:26) )+(cid:26) ln(1+(cid:26) k ) t 0 s 0 0 j j=s X t 1 (cid:0) lnE +s(cid:26) +(cid:26) k 0 s 0 j (cid:25) j=s X Finalmente, e supondo que o investimento em aprendizado decresce a uma taxa linear ap(cid:243)s conclu(cid:237)dos os estudos: x k = (cid:20) 1 s+x (cid:0) T (cid:16) (cid:17) (cid:20)(cid:26) (cid:20)(cid:26) lnE lnE +(cid:26) S + (cid:20)(cid:26) + 0 x 0x2 s+x (cid:25) 0 s 0 2T (cid:0) 2T (cid:16) (cid:17) 2 Expandindo ln(x) em Taylor em torno de 1: 1 (x 1)2 (x 1)3 ln(x)=ln(1)+(x 1) (cid:0) + (cid:0) +::: (cid:0) 1 (cid:0) 2 3 a expansªo em 1a ordem fornece a aproxima(cid:231)ªo sugerida (note que ln(1)=0). 3 z = j s (cid:0) x 1 x 1 (cid:0) (cid:0) k = k j s+z j=s z=0 X X x 1 x 1 (cid:0) (cid:20) (cid:0) = (cid:20) 1 z (cid:0) T z=0 z=1 X X (cid:20) (x 1) = (cid:20)x (cid:0) [2+(x 2)1] (cid:0) T 2 (cid:0) (cid:20) (x 1)x = (cid:20)x (cid:0) (cid:0) T 2 6 Notas de aula de Econometria Aplicada MEST 141 e como w = (1 k )E s+x s+x s+x (cid:0) x lnw lnE (cid:20) 1 s+x s+x (cid:25) (cid:0) (cid:0) T (cid:16) (cid:17) (cid:20)(cid:26) (cid:20) (cid:20)(cid:26) = (lnE (cid:20))+(cid:26)S + (cid:20)(cid:26) + 0 + x 0x2 0 (cid:0) 0 2T T (cid:0) 2T (cid:16) (cid:17) = (cid:12) +(cid:12) S +(cid:12) x+(cid:12) x2 0 1 2 3 Note que agora para estimar o efeito de educa(cid:231)ªo sobre salÆrios, Ø preciso incluir tambØm experiŒncia em nossa regressªo. 1.2 Estima(cid:231)ªo 1.2.1 Minimiza(cid:231)ªo de fun(cid:231)ªo perda (ex. MQO) Seja o modelo y = (cid:22)(x ;x )+u , suponha que E(u x) = 0, e de(cid:133)na como perda a fun(cid:231)ªo i i (cid:3)i i j L[u]. Por exemplo, se nossa inten(cid:231)ªo for a de explicar ao mÆximo a varia(cid:231)ªo de y com a varia(cid:231)ªo de x,x*, entªo podemos decidir que L(u) = u2, pois esta fun(cid:231)ªo atinge o m(cid:237)nimo precisamente quando u = 0. Nessa estratØgia, o modelo ideal deverÆ resolver min E(u2) = (cid:22) min E (y (cid:22)(x;x ))2 ; e o modelo estimado, min N (y (cid:22)(x ;x ))2. Note que um (cid:22) (cid:0) (cid:3) (cid:22) i=1 i (cid:0) i (cid:3)i (cid:2) (cid:3) P caso particular de (cid:22)(x ;x ) Ø (cid:22)(x ;x ) = b +b x +b x . Se supor essa forma para a fun(cid:231)ªo i (cid:3)i i (cid:3)i 0 1 i 2 (cid:3)i (cid:22)(x ;x ) for justi(cid:133)cÆvel, entªo a solu(cid:231)ªo serÆ MQO. i (cid:3)i 1.2.2 Maximiza(cid:231)ªo da fun(cid:231)ªo de verossimilhan(cid:231)a Considere o mesmo modelo acima, mas agora suponha que estejamos dispostos a assumir que o termo nªo observado, u, seja distribu(cid:237)do segundo uma fun(cid:231)ªo de densidade de prob- abilidade f (:) e independente de x. Suponha que vocŒ escolheu um valor (cid:12)(cid:3) para ser seu 7 b Notas de aula de Econometria Aplicada MEST 141 estimador. Numa amostra com i = 1;:::;N indiv(cid:237)duos, a probabilidade de que o res(cid:237)duo de um determinado indiv(cid:237)duo venha da distribui(cid:231)ªo f Ø: u = y x (cid:12)(cid:3) (cid:3)i i (cid:0) i Pr(u = ub) = f (u ) b i (cid:3)i (cid:3)i b b Numa amostra aleat(cid:243)ria (onde as realiza(cid:231)ıes de u para diferentes indiv(cid:237)duos sªo in- i dependentes), temos que a probabilidade de que todos os res(cid:237)duos da amostra venham da distribui(cid:231)ªo f (:) Ø: Pr(u = u ;u = u ;:::;u = u ) = Pr(u = u )xPr(u = u )x:::xPr(u = u ) 1 (cid:3)1 2 (cid:3)2 N (cid:3)N 1 (cid:3)1 2 (cid:3)2 N (cid:3)N N N b b b = f (u )b= f (y xb(cid:12)) b i i i (cid:0) i=1 i=1 Y Y A estratØgia aqui Ø escolher o valor de (cid:12) que maximiza a fun(cid:231)ªo acima, pois esse Ø o valor que maximiza a probabilidade de que seus res(cid:237)duos estimados, u , venham de fato da (cid:3)i distribui(cid:231)ªo f. (cid:201) fÆcil mostrar que se uma fun(cid:231)ªo g((cid:12)) atinge seu mÆximo em (cid:12) , entªo a b (cid:3) fun(cid:231)ªo lng((cid:12)) tambØm atinge seu mÆximo em (cid:12) . Como Ø mais fÆcil para os computadores (cid:3) maximizarumasomadoqueumproduto,convenciona-seusarologar(cid:237)tmodaverossimilhan(cid:231)a ao invØs da pr(cid:243)pria verossimilhan(cid:231)a na estima(cid:231)ªo. Um exerc(cid:237)cio interessante Ø mostrar que se nossa hip(cid:243)tese Ø a de que f (u) Ø a densidade MV MQO da distribui(cid:231)ªo normal (ou gaussiana), entªo (cid:12) = (cid:12) . 1.2.3 MØtodo dos momentos b b Suponha novamente que y = x (cid:12)+u , e acrescente as hip(cid:243)teses de que E(u) = 0 e E(xu) = i i i 0. Como o primeiro elemento de x Ø a constante 1, a primeira condi(cid:231)ªo acima Ø simplesmente 8 Notas de aula de Econometria Aplicada MEST 141 E(1 u) = 0, e jÆ estÆ portanto incorporada em E(xu) = 0. Sabemos que um estimador (cid:3) consistente dos momentos populacionais acima Ø o equivalente amostral: N x (y x (cid:12)) = 0 i i i 0 (cid:0) i=1 X que implica em: N x y x x (cid:12) = 0 i i (cid:0) i 0i i=1 X 1 MQO (cid:12) = (x0x)(cid:0) x0y = (cid:12) b Genericamente, o econometrista supıe uma sØrie de hip(cid:243)teses sobre os momentos popu- lacionais dos res(cid:237)duos, e usa os equivalentes amostrais para encontrar o estimador. Suponha no problema acima que ao invØs de E(xu) = 0 fosse suposto que E(u x) = 0. j Ora, primeiramente temos que E(u x) = 0 implica em E(xu) = 0, mas tambØm implica j que para qualquer fun(cid:231)ªo g(x), E(g(x)u) = 0, o que leva em princ(cid:237)pio a uma in(cid:133)nidade de condi(cid:231)ıes sobre momentos amostrais (por exemplo, E(x2u) = 0, E(cos(x)u) = 0, etc). A pergunta Ø entªo, como lidar com esse excesso de condi(cid:231)ıes? A resposta leva ao MØtodo Generalizado dos Momentos, que consiste nos seguintes passos: 1. construir os equivalentes amostrais para cada momento que o analista considere rel- evante. No exemplo do parenteses acima (e considerando apenas uma variÆvel explicativa 9 Notas de aula de Econometria Aplicada MEST 141 x): N E(u) = 0 : (y x (cid:12)) = 0 i i (cid:0) i=1 X N E(xy) = 0 : x (y x (cid:12)) = 0 i i i (cid:0) i=1 X N E x2y = 0 : x2(y x (cid:12)) = 0 i i (cid:0) i i=1 (cid:0) (cid:1) X N E(cos(x)u) = 0 : cos(x )(y x (cid:12)) = 0 i i i (cid:0) i=1 X 2. escolher uma matriz positiva (semi) de(cid:133)nida M, para dar pesos aos J diferentes momentos. Se a matriz for diagonal, o peso de cada condi(cid:231)ªo j na estima(cid:231)ªo (cid:133)nal serÆ dado por m =(m +m +:::+m ). j 1 2 J 3. Empilhar os momentos num vetor N (y x (cid:12)) i=1 i (cid:0) i 2 3 PN x (y x (cid:12)) V = 66 i=1 i i (cid:0) i 77 6 7 6 PN x2(y x (cid:12)) 7 6 i=1 i i (cid:0) i 7 6 7 6 7 6 NP cos(x )(y x (cid:12)) 7 6 i=1 i i (cid:0) i 7 6 7 4 5 P 4. Escolher (cid:12) que minimize o critØrio V MV 0 Nessa estratØgia, qualquer matriz positiva de(cid:133)nida M que o econometrista escolha pro- duzirÆ uma estimativa consistente de (cid:12). HÆ contudo critØrios para escolher de forma (cid:243)tima a matriz M, de modo a minimizar a vari(cid:226)ncia do estimador. Mais importante do que as tecnicalidades Ø convencer e ser convencido de que a hip(cid:243)tese E(u x) = 0 (ou qualquer outra j que seja necessÆria (cid:224) estima(cid:231)ªo) Ø real(cid:237)stica do ponto de vista econ(cid:244)mico. 10
Description: