MÉTODOS QUANTITATIVOS COM STATA® MÉTODOS QUANTITATIVOS COM STATA® 1ª EDIÇÃO LUIZ PAULO FÁVERO (ORG.) PATRÍCIA BELFIORE RENATA TUROLA TAKAMATSU JANILSON SUZART © 2014, Elsevier Editora Ltda. Todos os direitos reservados e protegidos pela Lei 9.610 de 19/02/98. Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser reproduzida ou transmitida sejam quais forem os meios empregados: eletrônicos, mecânicos, fotográficos, gravação ou quaisquer outros. Copidesque: Edna da Silva Cavalcanti Editoração Eletrônica: Thomson Digital Revisão Gráfica: Lara Alves Elsevier Editora Ltda. Conhecimento sem Fronteiras Rua Sete de Setembro, 111 – 16° andar 20050-006 – Centro – Rio de Janeiro – RJ – Brasil Rua Quintana, 753 – 8° andar 04569-011 – Brooklin – São Paulo – SP Serviço de Atendimento ao Cliente 0800-0265340 [email protected] ISBN: 978-85-352-5157-9 ISBN (versão eletrônica): 978-85-352-5158-6 Nota: Muito zelo e técnica foram empregados na edição desta obra. No entanto, podem ocorrer erros de digitação, impressão ou dúvida conceitual. Em qualquer das hipóteses, solicitamos a comunicação ao nosso Serviço de Atendimento ao Cliente, para que possamos esclarecer ou encaminhar a questão. Nem a editora nem o autor assumem qualquer responsabilidade por eventuais danos ou perdas a pessoas ou bens, originados do uso desta publicação. CIP-BRASIL. CATALOGAÇÃO-NA-FONTE SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ M552 Métodos quantitativos com stata : procedimentos, rotinas e análise de resultados / Luiz Paulo Fávero ... [et al.]. - 1. ed. - Rio de Janeiro : Elsevier, 2014. 23 cm. ISBN 978-85-352-5157-9 1. Tecnologia da informação. 2. Sistemas operacionais (Computadores). 3. Computadores. 4. Informática. 5. Software. 6. Computadores - Equipamento de entrada e saída. I. Fávero, Luiz Paulo. II. Título. 13-03450 CDD: 004 CDU: 004 APRESENTAÇÃO Este livro pode ser considerado resultado de várias discussões e elucubrações, ao longo dos últimos anos, sobre a importância da modelagem aplicada aos mais diversos campos do conhecimento humano. O crescente acúmulo de dados gerados, cada vez com maior frequência, em ambientes acadêmicos e organizacionais vem acompanhado do profundo desenvolvimento computacional e do aprimoramento dos softwares estatísticos e eco- nométricos. Dentro deste contexto, o Stata® é um software com grande capacidade de processamento de enormes bases de dados, além de ser capaz de elaborar os mais diversos testes e modelos apropriados e robustos a cada situação e de acordo com aquilo que o pesquisador e o tomador de decisão desejam. O software Stata® surgiu em 1985. Sua primeira versão, criada por William Gold, era compatível com o sistema operacional DOS. Atualmente, na versão 12, é distribuído e utilizado em mais de 150 países, sendo compatível, por meio do programa Stat/Transfer, com a grande maioria dos softwares que utilizam bases de dados, como Excel, SPSS, SAS, FoxPro, Gauss, LIMDEP, Matlab, Minitab, R, S-PLUS, Statistica, entre outros. Além disso, o Stata® propicia ao usuário utilizar menus automáticos do tipo point-and- click ou aplicar diretamente comandos e programações, dispondo de recursos para atualização automática por meio da Web como quase nenhum outro software. Pos- sibilita, por exemplo, que um pesquisador faça atualizações de procedimentos, comandos e códigos, utilize macros desenvolvidas por outros pesquisadores ao redor do mundo ou trabalhe com bases de dados disponíveis na internet sem que, para tanto, haja algum custo adicional. Neste sentido, é com bastante satisfação que apresento o primeiro livro de Métodos Quantitativos Aplicados por meio do software Stata® publicado em língua portuguesa. O livro está estruturado em nove capítulos, de acordo com o que segue: Capítulo 1: Introdução Capítulo 2: Estatística Descritiva, Tabelas e Gráficos Capítulo 3: Testes de Hipótese e Análise de Variância (ANOVA) Capítulo 4: Regressão Linear Capítulo 5: Avaliação dos Modelos de Regressão Capítulo 6: Regressão Robusta Capítulo 7: Regressão Logística Capítulo 8: Análise de Sobrevivência: Procedimento Kaplan-Meier e Regressão de Cox Capítulo 9: Regressão com Dados em Painel Cada capítulo está estruturado dentro de uma mesma lógica de apresentação, o que, acredito, favorece o processo de aprendizado. A aplicação de exemplos por meio da utilização do Stata® é a linha mestra, e a análise dos outputs gerados possibilita, em função v vi Apresentação da teoria subjacente a cada modelagem ou técnica, um melhor entendimento do que está sendo estudado, uma vez que o passo a passo é detalhado e ilustrado e os outputs são analisados e interpretados sempre com caráter gerencial voltado para a tomada de decisão. Desta maneira, acredito que o livro seja voltado tanto para pesquisadores que, por diferentes razões, se interessam especificamente por modelagem, quanto para aqueles que desejam aprofundar seus conhecimentos por meio da utilização do Stata®. Este livro é recomendado a alunos de graduação e pós-graduação stricto sensu em administração, engenharia, economia, contabilidade, atuária, psicologia, medicina e saúde e demais campos do conhecimento relacionados às ciências humanas, exatas e biomédicas. É destinado também a alunos de cursos de extensão, de pós-graduação lato sensu e MBA´s, profissionais de empresas, consultores e demais pesquisadores que têm, como principal objetivo, o tratamento e a análise de dados estatísticos com vistas à geração de informações e ao aprimoramento do conhecimento por meio da tomada de decisão. Aos pesquisadores que utilizarem este livro, desejo que surjam formulações de ques- tões de pesquisa adequadas e cada vez mais interessantes, que sejam desenvolvidos modelos confiáveis, robustos e úteis à tomada de decisão, que a interpretação dos outputs seja mais amigável e que a utilização do Stata® resulte em importantes e valiosos frutos para novas pesquisas e novos projetos. Aproveito para agradecer a todos que contribuíram para que este livro se tornasse realidade. Expresso aqui os mais sinceros agradecimentos aos professores da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo (FEA/USP), da Universidade Federal do ABC (UFABC), da Fundação Instituto de Pesquisas Contábeis, Atuariais e Financeiras (FIPECAFI), da Universidade Federal de Minas Gerais (UFMG), e da Universidade Federal de São Paulo (UNIFESP), assim como aos profissionais da Montvero Consultoria e Treinamento Ltda., da StataCorp LP (College Station, Texas) e da Editora Elsevier. Por fim, mas não menos importante, enfatizo que sempre serão muito bem-vindas contribuições, críticas e sugestões, a fim de que seja sempre possível incorporar melhorias nesta obra. Luiz Paulo Fávero OS AUTORES LUIZ PAULO FÁVERO é professor livre-docente da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo (FEA/USP) em cursos de graduação, mestrado e doutorado. É graduado em Engenharia Civil pela Escola Politécnica da USP, pós-graduado em Administração pela Fundação Getúlio Vargas (FGV/SP) e obteve os títulos de mestre e doutor em Administração pela FEA/USP. Possui Pós-Doutorado em Econometria Financeira pela Columbia University em Nova York. Participou de cursos de Gestão de Negócios pela Harvard Business School e de Técnicas de Modelagem pela California State University. É professor visitante da Universidade Federal de São Paulo (UNIFESP) e professor em cursos de pós-graduação (especialização e MBA) da FIPECAFI, da FIA e da FIPE. É membro do Board of Directors do Global Business Research Committee. Seus principais interesses de pesquisa situam-se na área de modelagem multivariada, econometria, otimização e estatística aplicada a finanças e economia. É autor dos livros Análise de Dados: Modelagem Multivariada para Tomada de Decisões, Pesquisa Operacional para cursos de Administração, Pesquisa Operacional para cursos de Engenharia, Precificação e Comercialização Hedônica e Mercado Imobiliário e coautor de Contemporary Studies in Economics and Financial Analysis, Trends in International Trade Issues e Finanças no Varejo. Tem publicado artigos em diversos congressos nacionais e internacionais e em periódicos científicos, incluindo Pesquisa Operacional, Revista Brasileira de Estatística, Central European Journal of Operations Research, International Journal of Management, International Journal of Business Research, Global Economy and Finance Journal, Journal of Financial Markets and Derivatives, Global Business and Economics Review, Estudos Econômicos, Contabilidade e Finanças, RAUSP, Produção, Brazilian Business Review, Revista Latinoamericana de Administración, entre outros. PATRÍCIA BELFIORE é professora da Universidade Federal do ABC (UFABC), onde leciona disciplinas de estatística, pesquisa operacional, planejamento e controle de produção e logística para o curso de Engenharia de Gestão. É mestre em Engenharia Elétrica e doutora em Engenharia de Produção pela Escola Politécnica da Universidade de São Paulo (EPUSP). Possui Pós-Doutorado em Pesquisa Operacional e Logística pela Columbia University em Nova York. Participa de diversos projetos de pesquisa e consultoria nas áreas de modelagem, otimização e logística. Lecionou disciplinas de pesquisa operacional, análise multivariada de dados e gestão de operações e logística em cursos de graduação e mestrado no Centro Universitário da FEI e na Escola de Artes, Ciências e Humanidades da Universidade de São Paulo (EACH/USP). Seus principais interesses de pesquisa situam-se na área de modelagem e otimização para tomada de decisões. É autora dos livros Análise de Dados: Modelagem Multivariada para Tomada de Decisões, Pesquisa Operacional para cursos de Administração, Pesquisa Operacional para cursos de Engenharia e Redução de Custos em Logística. Tem publicado artigos em diversos vii viii Os autores congressos nacionais e internacionais e em periódicos científicos, incluindo European Journal of Operational Research, Computers & Industrial Engineering, Central European Journal of Operations Research, International Journal of Management, Gestão & Produção, Produção, Transportes, Estudos Econômicos, REAd, entre outros. RENATA TUROLA TAKAMATSU é professora da Faculdade de Ciências Econômicas da Universidade Federal de Minas Gerais (UFMG). Bacharel em Ciências Contábeis pela UFMG, mestre e doutoranda em Controladoria e Contabilidade pela Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo (FEA/USP). Desenvolve projetos de consultoria e de pesquisa com foco em econometria e modelos multivariados aplicados. Seus principais interesses de pesquisa situam-se nas áreas de métodos quantitativos aplicados a finanças, avaliação de investimentos e teoria de carteiras, mercado financeiro e análise de demonstrações contábeis e financeiras. Tem publicado artigos em diversos congressos nacionais e internacionais e em periódicos científicos, incluindo Modern Economy, Contaduría y Administración, Revista Universo Contábil e Revista Contabilidade Vista e Revista, entre outros. JANILSON ANTONIO DA SILVA SUZART é contador e professor em cursos de pós-graduação. É bacharel em Ciências Contábeis pela Universidade do Estado da Bahia (UNEB), especialista em Auditoria Pública pela UNEB, especialista em Gestão da Administração Pública e especialista em Direito da Administração Pública pela Univer- sidade Castelo Branco/Exército Brasileiro, mestre em Contabilidade pela Universidade Federal da Bahia (UFBA) e doutorando em Controladoria e Contabilidade pela FEA/ USP. Atuou como contador público em diversos órgãos federais. Seus principais interesses de pesquisa situam-se na área de contabilidade e finanças públicas, gestão e políticas pú- blicas, contabilidade societária, sistemas de informação, análise estatística, econometria e modelagem multivariada de dados. Tem publicado artigos em diversos congressos na- cionais e internacionais e em periódicos científicos, incluindo Journal of US-China Public Administration, International Business Research, Journal of Information Systems and Technology Management, Administração Pública e Gestão Social, Contabilidade, Gestão e Governança, Revista Universo Contábil, Revista de Gestão, Finanças e Contabilidade, entre outros. 1 CAPÍTULO Introdução 1.1. VISÃO GERAL DO STATA® O Stata® é um aplicativo estatístico que propicia a criação, a manipulação e o ge- renciamento de bancos de dados, a elaboração de gráficos e as análises estatísticas. Compatível com alguns sistemas operacionais, tais como Windows®, Macintosh® ou Unix®, o programa reúne vantagens como a facilidade de utilização, as funções analíticas pré-programadas para gerenciamento dos dados e a possibilidade de programação por parte dos usuários. Essa última funcionalidade possibilita a adição de novas capacidades ao programa a partir das necessidades detectadas pelos usuários. A maioria das operações pode ser realizada via barra de comandos ou, mais diretamente, por sua digitação direta (HAMILTON, 2009). A primeira versão do programa foi lançada em 1985 e, a partir daí, o software foi sendo desenvolvido no sentido de acompanhar as necessidades de seus usuários, angariando popularidade frente a competidores. O Stata® atualmente é utilizado por bioestatísticos, epidemiologistas, economistas, sociólogos, cientistas políticos, geógrafos, psicólogos, cientistas sociais e outros profissionais de pesquisas que se veem diante da necessidade de analisar os mais variados formatos de dados (PEVALIN; ROBSON, 2009). O programa é capaz de utilizar fontes externas, gerar novas variáveis, combinar conjuntos de dados, sumarizá-los, além de verificar possíveis erros advindos da sua importação e/ou combinação. Além disso, é possível se trabalhar com corte transversal, longitudinal ou ambos, o que auxilia no entendimento de quaisquer aspectos inerentes ao banco de dados (BAUM, 2006). Em termos de estatísticas, o Stata® fornece todas as ferramentas tradicionais de es- tatísticas univariadas, bivariadas e multivariadas, que vão desde as estatísticas descritivas e testes t até one-way e n-way ANOVA, análise de regressão e análise dos componentes principais. Além disso, o Stata® oferece um conjunto muito poderoso de técnicas de análise de variáveis dependentes qualitativas, como as técnicas de regressão probit, logit e logit multinomial. O programa oferece também funcionalidades relacionadas à análise de regressão, como a realização de testes de diagnósticos, previsão, matriz de variância e covariância robusta, além de possibilitar o uso de variáveis instrumentais e métodos como, por exemplo, o estimador dos mínimos quadrados de dois estágios (2SLS – two- stages least squares) e das regressões aparentemente não relacionadas (SUR – seemingly unrelated regressions), dentre outros (BAUM, 2006). Estatísticas especializadas também são abrangidas de forma bastante profunda. O aplicativo inclui comandos específicos para séries temporais (ARCH – autoregressive 1 2 Métodos Quantitativos com Stata® conditional heteroskedasticity, ARIMA – autoregressive integrated moving average, VAR – vector autoregressive, VEC – vector error correction), modelos de simulação e bootstrapping, estimativas de máxima verossimilhança, e mínimos quadrados não lineares. Famílias de comandos fornecem as técnicas principais utilizadas em cada uma das várias categorias: os “xt”, comandos para dados em painel; e os “st”, comandos para dados destinados à análise de sobrevivência. Os gráficos do Stata® têm sido melhorados e aprimorados, possibilitando uma análise exploratória consistente dos dados e sua exportação para publicação e relatórios técnicos em diversas formas disponíveis. Cada aspecto gráfico pode ser programado e personalizado, e novos tipos de gráficos são continuamente desenvolvidos. Em adição, a capacidade de programação implica a possibilidade de geração de uma série de gráficos semelhantes, muito rapidamente (BAUM, 2006). Usuários novos e potenciais do Stata® geralmente se questionam acerca das possíveis vantagens que esse aplicativo possui frente aos seus competidores e, principalmente, suas vantagens frente ao SPSS® (programa estatístico licenciado pela IBM® e largamente utiliza- do no tratamento e na análise de dados). Dentre suas vantagens, pode-se citar a aplicação de comandos mais intuitivos e com uma sintaxe mais simples. A participação de seus usuários também merece destaque, pois colaboram na criação da maior parte dos aplicativos das novas versões. Relacionado a esse ponto, tem-se o fato de que o software é conectado à internet e não há restrições de conteúdo, ou seja, é possível a instalação de novas rotinas que foram elaboradas pelos próprios usuários e que são destinadas à realização de tarefas específicas. As extensões cobrem uma vasta área de aplicação, e a possibilidade de simplesmente procurar um procedimento na internet e instalá-lo rapidamente cons- titui uma vantagem inegável do Stata®. Além disso, o software é particularmente amigável, quando da necessidade de análise de uma base extensa e complexa de dados (PEVALIN; ROBSON, 2009). Portanto, pode-se resumir as vantagens oferecidas pelo Stata® nos tópicos a seguir: • Ampla utilização em pesquisas empíricas de Contabilidade, Administração, Finanças e Economia. • Simplicidade de utilização quando comparado com ferramentas similares, como o “R” e o SAS®. • Sintaxe simples e intuitiva. • Possibilidade de utilização de comandos desenvolvidos por terceiros. • Gerenciamento robusto de grandes bases de dados. O Stata® possui menus e janelas que visam facilitar seu uso, podendo ser empregados quando se realizam procedimentos não familiares. A sintaxe do Stata® é consistente e intuitiva, o que auxilia seus usuários a trabalharem de maneira direta, tornando sim- ples tarefas complexas e repetitivas. Os ícones e os menus, em conjunto com a janela de comandos, podem ser empregados de maneira conjunta, adaptando-se às necessidades enfrentadas pelos usuários durante a utilização do software (Figuras 1.1 e 1.2).