RICARDO TAVARES ANTUNES DE OLIVEIRA Modelagem e simula¸c˜ao computacional da combina¸c˜ao de preditores de s´eries temporais por meio de c´opulas RECIFE-PE FEVEREIRO - 2014 UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRO´-REITORIA DE PESQUISA E PO´S-GRADUAC¸A˜O PROGRAMA DE PO´S-GRADUAC¸A˜O EM INFORMA´TICA APLICADA Modelagem e simula¸c˜ao computacional da combina¸c˜ao de preditores de s´eries temporais por meio de c´opulas Disserta¸ca˜o de mestrado apresentada ao Curso de Po´s-Gradua¸ca˜o em Informa´tica Aplicada da Universidade Federal Rural de Pernambuco, como requisito parcial para obten¸ca˜o do grau de Mestre em Inform´atica Aplicada. A´rea de Concentra¸c˜ao: Modelagem Computacional Orientador: Tiago Alessandro Esp´ınola Ferreira Co-orientador: Paulo Renato Alves Firmino RECIFE-PE FEVEREIRO - 2014 ´ INSERIR FICHA CATALOGRAFICA UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO PRO´-REITORIA DE PESQUISA E PO´S-GRADUAC¸A˜O PROGRAMA DE PO´S-GRADUAC¸A˜O EM INFORMA´TICA APLICADA Modelagem e simula¸c˜ao computacional da combina¸c˜ao de preditores de s´eries temporais por meio de co´pulas Ricardo Tavares Antunes de Oliveira Disserta¸ca˜o julgada adequada para obten¸ca˜o do t´ıtulo de Mestre em Informa´tica Aplicada, defendida e aprovada por unanimidade em 26/02/2014 pela Banca Examinadora. Orientador: ———————————————————————– Prof. DSc. Tiago Alessandro Esp´ınola Ferreira Universidade Federal Rural de Pernambuco Banca Examinadora: ———————————————————————– Prof. DSc. Paulo Renato Alves Firmino Universidade Federal do Cariri ———————————————————————– Prof. DSc. Silvana Boca Negra Universidade Federal Rural de Pernambuco ———————————————————————– Prof. DSc. George Darmiton da Cunha Cavalcanti Universidade Federal de Pernambuco ` A minha querida m˜ae, a` minha fam´ılia, e a todas as pessoas que acreditaram em mim. Agradecimentos Primeiramente e acima de tudo, agrade¸co a DEUS por estar sempre ao meu lado nos momentos bons e ruins, por me proteger, aben¸coar, por iluminar minhas trajeto´rias e prin- cipalmente pelas dificuldades. Agrade¸co o SENHOR por mais essa vit´oria em minha vida. ` A minha querida m˜ae Maria Tavares, por estar ao meu lado me apoiando durante todo o percurso dos meus estudos, dando for¸ca e me encorajando, pois sem seu apoio nada disso seria poss´ıvel ou mesmo faria sentido. ` A toda a minha fam´ılia, pela torcida em favor do meu sucesso, na˜o s´o profissional mas tamb´em como vit´oria pessoal. Em especial pela minha amada vo´ Maria de Lourdes pelas suas ora¸c˜oes e energia positiva, para que pudesse conquistar este humilde sonho. Agrade¸co imensamente ao meu orientador Tiago Alessandro, ser extraordina´rio, de qua- lidades´ımpares, por ser uma referˆencia para mim tanto como pesquisador como ser humano, por confiar e acreditar em mim para desenvolver tal tema. Por todos os ensinamentos, pela paciˆenciaeamizade. Poisseiquesemsuaajudan˜aoseriaposs´ıvelaconclusa˜odestetrabalho. Ao sempre dispon´ıvel Prof. Paulo Firmino, ser fant´astico e pesquisador exemplar, que me orientou desde o in´ıcio deste trabalho. Na˜o existem palavras que podem descrever meus sincerosagradecimentosporterfeitodemimapessoaquemetornei. Tiveoimensoprivil´egio de conhecer e trabalhar com essa pessoa formid´avel. Que fez toda a diferente para conclus˜ao deste trabalho, meu eterno agradecimento. Aos amigos, em especial aqueles que acompanharam de perto as dificuldades e realiza¸co˜es nesse tempo: Allisson Dantas, Anselmo Lacerda, Fillippo R´egis e Tha´ıze Fernandes. Muito obrigado por existirem. Finalmente, meusagradecimentosaosprofessoresecolegasdaUniversidadeFederalRural ` de Pernambuco, pelo ambiente acolhedor e produtivo. A Funda¸ca˜o de Amparo `a Ciˆencia e Tecnologia do Estado de Pernambuco por ter investido em minha formac¸˜ao e ao Programa em Inform´atica Aplicada PPGIA, pelos recursos disponibilizados. Resumo Sob o prisma da Estat´ıstica-Computacional, esta disserta¸c˜ao trata do problema de com- bina¸ca˜o na˜o linear de modelos de previs˜ao de s´eries temporais. Neste contexto, suas princi- pais caracter´ısticas e propriedades b´asicas sa˜o apresentadas. Alguns dos principais m´etodos de previsa˜o de s´eries temporais presentes na literatura sa˜o descritos. As propostas apresen- tadas nesta dissertac¸˜ao sa˜o mostradas por meio de trˆes casos de estudo utilizando um forma- lismo matema´tico conhecido como c´opulas pela sua capacidade de poder medir dependˆencia e combinar modelos de predic¸˜ao sem perca de informac¸˜ao. A combina¸c˜ao dos modelos de previsa˜o ocorre por meio do formalismo matem´atico de co´pulas que apresenta resultados convincentes e motivadores atrav´es de trˆes casos de estudo presentes nesta dissertac¸˜ao. No primeiro ´e apresentado um pequeno caso para combinar as previso˜es dos modelos de pre- visa˜o via co´pula de Gumbel-Hougaard. No segundo caso de estudo ´e proposto um estimador combinado constru´ıdo atrav´es da fun¸ca˜o multivariada n˜ao-param´etrica de Cacoullos para um caso simples de combina¸ca˜o. No terceiro e u´ltimo caso de estudo sa˜o apresentados os principais resultados desta disserta¸c˜ao, em que, ´e realizado um experimento que com- para estimadores combinados constru´ıdos levando em considerac¸˜ao va´rias s´eries temporais e inu´meros modelos de previs˜ao, tal que, sa˜o simuladas diversas situa¸co˜es. Nesse sentido, experimentos computacionais realizados demostram que o estimador combinado constru´ıdo via co´pula obteve melhores resultados quando comparado com os modelos individuais e o m´etodo de combina¸ca˜o linear. i Abstract This dissertation disusses the problem of combining models for time series forecasting. In this context, the main characteristics and basic properties of combined models are pre- sented. Some of the main methods of time series forecasting present in the literature are described. Computational experiments compare diverse copulas-based combined models. First of all, an algorithm is presented to combine predictions of the predictive models via Gumbel-Hougaard copula. In the second case, it is proposed a combined estimator cons- tructed via non parametric Cacoullos multivariate functions. In the third and final case of study, the main results of this dissertation are presented, in which an experiment that compares combined estimators constructed taking into account thousands of time series and numerous forecasting models were simulated. Thus, computational experiments show that the combined estimator constructed via copula obtained better results compared with the individual models and the linear combination method. ii Lista de Figuras 4.1 Arquitetura da abordagem proposta. A abordagem cla´ssica s˜ao os modelos de previsa˜o comuns. A modelagem dos erros prepara os res´ıduos para servir de entrada no procedimento de agrega¸c˜ao onde sa˜o combinados para gerar uma previsa˜o combinada [39]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5.1 A s´erie temporal u representada por (−), os respectivos modelos individuais t ARIMA(X eX )s˜aorepresentadospor(∗)e((cid:52)),eoestimadorcombinado t,1 t,2 Uˆ e SA por ((cid:50) e •). A linha tracejada indica o in´ıcio do horizonte de previs˜ao t (t > 200). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 5.2 A s´erie temporal u representada por (−), os respectivos modelos individuais t ARIMA (X e X ) sa˜o representados por (∗) e ((cid:52)), e o estimador combi- t,1 t,2 nado Uˆ e SA por ((cid:50) e •). Nesta Figura, ´e levado em considera¸ca˜o apenas o t desempenho das previso˜es no per´ıodo (t > 200). . . . . . . . . . . . . . . . . 45 5.3 A s´erie temporal u representada por (−), enquanto (∗) e ((cid:52)) representam t respectivamente os modelos ARIMA individuais X e X , o estimador com- t,1 t,2 binado Uˆ e SA sa˜o ilustrado por ((cid:50) e •). Esta figura leva em considera¸c˜ao t apenas o desempenho dos modelos no per´ıodo onde (t > n). . . . . . . . . . 49 5.4 Paraˆmetro de suaviza¸ca˜o (λ) pelo EQM do estimador combinado. . . . . . . 51 5.5 Ilustra o desempenho do estimador combinado Uˆ∗∗ representado por ((cid:50)) ajus- t tado com o paraˆmetro λ que minimiza sua acura´cia para estimar a s´erie tem- poral u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 t iii 5.6 Desempenho do estimador combinado Uˆ∗ representado por ((cid:50)) ajustado com t o parˆametro λ que maximiza o EQM de Uˆ∗ para estimar a s´erie temporal u . 54 t t iv
Description: