Fun(cid:24)co~es de Estima(cid:24)c~ao em Modelos de Regress~ao Rinaldo Artes Insper Instituto de Ensino e Pesquisa Denise Aparecida Botter IME - USP 2 . 3 Apresentac¸˜ao Este texto foi desenvolvido a partir do programa da disciplina Func¸˜oes de Estima¸ca˜o Aplicadas a Modelos de Regress˜ao, ministrada, pelos autores, em cursos de p´os-gradua¸c˜ao do Departamento de Estat´ıstica da USP. Trˆes turmas de alunos tomaram contato com parte deste texto; a elas deixamos nossos agradecimentos. Agradecemos tamb´em `a professora Cl´elia Maria de Castro Toloi, pela leitura de parte do manuscrito e pelas oportunas sugest˜oes e corre¸c˜oes. Os erros remanescentes s˜ao de responsabilidade dos autores. Encaramos a presente monografia como um texto em constru¸c˜ao. Pre- tendemos, nos pr´oximos anos, adicionar cap´ıtulos e exemplos que, por uma limita¸ca˜o de tempo, n˜ao puderam ser inclu´ıdos nesta versa˜o. Manteremos no site www.rinaldoa.ibmec.br as atualiza¸co˜es do texto e as inevit´aveis erratas. Agradecemos `a Comiss˜ao Organizadora da 9a Escola de Modelos de Re- gress˜ao pela oportunidade de ministrar esse minicurso. Denise Aparecida Botter ([email protected]) Rinaldo Artes ([email protected]) S˜ao Pedro, fevereiro de 2005 4 Sum´ario 1 Fun¸co˜es de estima¸c˜ao 11 1.1 Fun¸c˜oes de estima¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . 11 1.2 Fun¸c˜ao Escore . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.3 Fun¸c˜ao de estima¸c˜ao ´otima . . . . . . . . . . . . . . . . . . . . 21 1.4 Fun¸c˜ao de estima¸c˜ao linear . . . . . . . . . . . . . . . . . . . . 23 1.5 Equa¸co˜es normais . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.5.1 M´ınimos Quadrados Generalizados . . . . . . . . . . . 26 2 Quase-verossimilhan¸ca 29 2.1 Modelos lineares generalizados . . . . . . . . . . . . . . . . . . 29 2.1.1 Fam´ılia exponencial de distribui¸co˜es . . . . . . . . . . . 29 2.1.2 Modelos lineares generalizados . . . . . . . . . . . . . . 31 2.2 Quase-verossimilhan¸ca - Caso univariado . . . . . . . . . . . . 38 2.2.1 Modelo de regress˜ao . . . . . . . . . . . . . . . . . . . 40 2.2.2 Fun¸c˜ao quase-desvio . . . . . . . . . . . . . . . . . . . 41 2.2.3 Sobre-dispers˜ao . . . . . . . . . . . . . . . . . . . . . . 42 2.3 Quase-verossimilhan¸ca estendida . . . . . . . . . . . . . . . . . 44 2.3.1 Paraˆmetro de dispers˜ao varia´vel . . . . . . . . . . . . . 46 2.4 Caso multivariado . . . . . . . . . . . . . . . . . . . . . . . . . 46 3 Equa¸c˜oes de Estima¸c˜ao Generalizadas 49 3.1 Modelagem da m´edia . . . . . . . . . . . . . . . . . . . . . . . 50 3.1.1 Equa¸co˜es de estima¸ca˜o de independˆencia . . . . . . . . 50 3.1.2 Γ(u ) = Corr(u ) conhecida . . . . . . . . . . . . . . . 52 i i 3.1.3 Γ(u ) desconhecida . . . . . . . . . . . . . . . . . . . . 53 i 3.1.4 Estima¸ca˜o de ϕ−1 . . . . . . . . . . . . . . . . . . . . . 54 3.1.5 Estima¸ca˜o de α . . . . . . . . . . . . . . . . . . . . . . 56 3.1.6 Teste de hip´oteses . . . . . . . . . . . . . . . . . . . . . 57 5 6 3.1.7 Algoritmos de estima¸ca˜o . . . . . . . . . . . . . . . . . 57 3.2 EEG-2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.3 Estudos de simula¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . 59 3.4 Aplica¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.5 T´ecnicas de diagn´ostico . . . . . . . . . . . . . . . . . . . . . . 62 3.5.1 Pontos alavanca, influentes e aberrantes . . . . . . . . 62 3.5.2 Envelope simulado . . . . . . . . . . . . . . . . . . . . 65 4 Equa¸co˜es de Estima¸c˜ao para S´eries Temporais 67 4.1 Nota¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 4.2 Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.2.1 Modelos ARMA . . . . . . . . . . . . . . . . . . . . . . 68 4.2.2 Modelos ARCH . . . . . . . . . . . . . . . . . . . . . . 69 4.3 Modelos tipo ARMA . . . . . . . . . . . . . . . . . . . . . . . 70 4.3.1 Dados de contagem . . . . . . . . . . . . . . . . . . . . 72 4.3.2 Estima¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . 72 4.4 Modelo de Zeger . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.5 Equa¸co˜es de estima¸ca˜o para modelos ARCH . . . . . . . . . . 79 5 Equa¸co˜es de estima¸c˜ao para dados circulares longitudinais 81 5.1 Representa¸ca˜o gr´afica e conceitos b´asicos . . . . . . . . . . . . 82 5.2 Modelos probabil´ısticos . . . . . . . . . . . . . . . . . . . . . . 84 5.2.1 Distribui¸ca˜o uniforme circular . . . . . . . . . . . . . . 85 5.2.2 Distribui¸ca˜o von Mises . . . . . . . . . . . . . . . . . . 85 5.2.3 Distribui¸ca˜o normal arqueada . . . . . . . . . . . . . . 88 5.2.4 Rela¸co˜es entre as distribui¸co˜es uniforme circular, von Mises e normal arqueada . . . . . . . . . . . . . . . . . 88 5.2.5 Aplica¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.3 Modelos de regress˜ao . . . . . . . . . . . . . . . . . . . . . . . 91 5.4 Equa¸co˜es de estima¸ca˜o para dados circulares . . . . . . . . . . 93 5.4.1 Modelagem da m´edia circular . . . . . . . . . . . . . . 94 5.4.2 Modelo para a m´edia circular e para o parˆametro de concentra¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . 97 5.5 Aplica¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.5.1 Constru¸ca˜o do modelo . . . . . . . . . . . . . . . . . . 99 5.5.2 An´alise dos dados . . . . . . . . . . . . . . . . . . . . . 101 7 A Alguns resultados assint´oticos 107 A.1 Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 A.2 Aplica¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 A.3 Demonstra¸c˜oes . . . . . . . . . . . . . . . . . . . . . . . . . . 115 A.3.1 Prova do Teorema 13 . . . . . . . . . . . . . . . . . 115 B Demonstra¸c˜oes - EEG 121 C Fun¸co˜es de Bessel 125 C.1 Derivadas de I , I e A . . . . . . . . . . . . . . . . . . . . . 125 0 1 1 C.2 C´alculo das fun¸c˜oes . . . . . . . . . . . . . . . . . . . . . . . . 126 C.2.1 F´ormulas de recorrˆencia . . . . . . . . . . . . . . . . . 126 C.2.2 Avalia¸ca˜o de I e I . . . . . . . . . . . . . . . . . . . . 126 0 1 C.2.3 Avalia¸ca˜o da fun¸ca˜o inversa de A . . . . . . . . . . . . 127 1 D Resultados adicionais relativos a dados circulares 129 D.1 Intervalos de confian¸ca . . . . . . . . . . . . . . . . . . . . . . 129 D.2 Outros resultados . . . . . . . . . . . . . . . . . . . . . . . . . 130 D.3 Dependˆencia entre varia´veis circulares . . . . . . . . . . . . . . 130 E Complemento da aplica¸c˜ao do Capitulo 5 135 8 . 9 Pref´acio H´a na literatura Estat´ıstica uma grande variedade de t´ecnicas para o tra- tamentodedadoslongitudinaiscomvari´avelrespostagaussiana. Aexistˆencia de uma vers˜ao multivariada da distribui¸c˜ao normal com boas propriedades inferenciais, facilitaoestudodessecaso. Abandonando-seasuposi¸c˜aodenor- malidade da vari´avel resposta, uma s´erie de dificuldades pode surgir devido `a escassez de distribui¸co˜es multivariadas alternativas com tais propriedades1. Dentre as v´arias alternativas de tratamentos para dados longitudinais, duas assumem um papel de destaque. A primeira prevˆe a modelagem pro- babil´ıstica, estipulando, a priori, uma distribui¸c˜ao multivariada de probabi- lidade, adequada `a modelagem dos dados; baseado nessa distribui¸ca˜o, faz-se a inferˆencia sobre os parˆametros do modelo (por exemplo, atrav´es do m´etodo de m´axima verossimilhan¸ca). As dificuldades dessa abordagem est˜ao ligadas `a defini¸ca˜o do modelo probabil´ıstico, ou seja, na gera¸ca˜o de um modelo mul- tivariado que se ajusta aos dados e com parˆametros facilmente estim´aveis e interpreta´veis. A segunda possibilidade baseia-se no uso de fun¸c˜oes de es- tima¸ca˜o 2 para a obten¸c˜ao das estimativas dos parˆametros de interesse de um modelo multivariado que n˜ao ´e, necessariamente, completamente conhecido. Uma fun¸ca˜o de estima¸ca˜o ´e uma fun¸ca˜o mensur´avel dos dados e dos parˆametros de interesse. Neste texto estamos interessados nas fun¸co˜es de estima¸ca˜o que, quando vistas como fun¸c˜oes dos parˆametros, tˆem ra´ızes que s˜ao estimadores dos parˆametros de interesse do modelo. Um ponto impor- tante no estudo dessas fun¸co˜es ´e estabelecer condi¸co˜es que garantam que os estimadores obtidos possuam boas propriedades. Em geral, deseja-se a cons- tru¸ca˜o de estimadores consistentes e com distribui¸c˜ao assint´otica conhecida. O foco deste texto ´e a constru¸c˜ao de fun¸co˜es de estima¸c˜ao para a an´alise 1Em Joe (1997) encontra-se uma s(cid:19)erie de t(cid:19)ecnicas para gera(cid:24)c~ao de distribui(cid:24)c~oes multi- variadas 2ver Godambe (1991) por exemplo 10 de diferentes problemas. O Cap´ıtulo 1 apresenta a teoria geral de fun¸c˜oes de estima¸c˜ao e discute aspectos ligados `a otimalidade e constru¸ca˜o de fun¸c˜oes de estima¸c˜ao. O Cap´ıtulo 2 desenvolve a teoria de quase-verossimilhan¸ca a partir do contexto de fun¸c˜oes de estima¸ca˜o. No Cap´ıtulo 3, s˜ao apresen- tadas as equa¸co˜es de estima¸c˜ao generalizadas e, no 4, t´ecnicas baseadas na teoria das fun¸co˜es de estima¸c˜ao para a estima¸ca˜o de parˆametros de modelos para s´eries temporais. Por fim, no Cap´ıtulo 5 s˜ao desenvolvidas fun¸co˜es de estima¸c˜ao para a an´alise de dados circulares longitudinais.
Description: