UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS AGRÍCOLAS REGIANE SLONGO FAGUNDES CASCAVEL - PR JANEIRO - 2017 REGIANE SLONGO FAGUNDES DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS AGRÍCOLAS Tese apresentada ao Programa de Pós-Graduação em Engenharia Agrícola da Universidade Estadual do Oeste do Paraná, em cumprimento parcial aos requisitos para a obtenção do título de doutor em Engenharia Agrícola, área de concentração Sistemas Biológicos e Agroindustriais. Orientador: Prof. Dr. Miguel Angel Uribe Opazo Co-orientador: Prof. Dr. Manuel Galea Profa. Dra. Luciana Pagliosa Carvalho Guedes CASCAVEL - PR JANEIRO - 2017 Dados Internacionais de Catalogação-na-Publicação (CIP) F143d Fagundes, Regiane Slongo Distribuição slash multivariada aplicada a dados agrícolas./Regiane Slongo Fagundes. Cascavel,2017. 164p. Orientador: Prof. Dr. Miguel Angel Uribe Opazo Coorientador: Prof. Dr.Manuel Galea Coorientadora: Profª. Drª. Luciana Pagliosa Carvalho Guedes Revisão de normas, português e inglês: Ana Maria Martins Alves Vasconcelos Tese (Doutorado) –Universidade Estadual do Oeste do Paraná, Campus de Cascavel, 2017 Programa de Pós-Graduação Stricto Sensu emEngenharia Agrícola 1. Algoritmo EM. 2.Diagnóstico de influência global e local. 3. Modelagem espacial linear slash. 4. Testes de hipóteses. I. Uribe Opazo, Miguel Angel. II. Galea, Manuel. III.Guedes, Luciana Pagliosa Carvalho. IV.Vasconcelos, Ana Maria Martins Alves. V.Universidade Estadual do Oeste do Paraná. VI. Título. CDD 21.ed. 519.535 630 CIP-NBR 12899 Ficha catalográfica elaborada por Helena Soterio Bejio –CRB 9ª/965 Revisãodeportuguês,inglêsenormasrealizadaporAnaMariaMartinsAlvesVasconcelosem17defevereirode2017. ii BIOGRAFIA RESUMIDA Nome: Regiane Slongo Fagundes Ano de nascimento: 1975 Naturalidade: Cascavel-PR Licenciada em Matemática pela Universidade Estadual do Oeste do Paraná (UNIOESTE) no ano de 1998. Mestre em Engenharia Agrícola pela UNIOESTE no ano de 2006. Atua na área de educação há 23 anos sendo 13 deles dedicados ao ensino superior. Atualmente, é professora assistente da Universidade Tecnológica Federal do Paraná (UTFPR), campus de Toledo. ii Apesar dos nossos defeitos, precisamos enxergar que somos pérolas únicas no teatro da vida e entender que não existem pessoas de sucesso e pessoas fracassadas. O que existem são pessoas que lutam pelos seus sonhos ou desistem deles. [Augusto Cury] iii Ao meu esposo, Jaderson e às minhas filhas amadas, Natália e Julia, dedico com carinho. iv AGRADECIMENTOS Primeiramente a Deus por me oferecer saúde, disposição e discernimento; À Universidade Tecnológica Federal do Paraná (UTFPR) - campus Toledo, por permitir afastamento integral das atividades docentes e, desta forma, possibilitar que fossem desenvolvidas as atividades de pesquisa; Ao Programa de Pós-Graduação em Engenharia Agrícola (PGEAGRI) da UNIOESTE, pela oportunidade da formação acadêmica e à Fundação Araucária pelo auxílio financeiro; Ao meu orientador, Prof. Dr. Miguel Angel Uribe Opazo, pela confiança, atenção e orientação dada ao longo do desenvolvimento deste trabalho; Aos co-orientadores, Prof. Dr. Manuel Galea e Prof. Dra. Luciana Pagliosa Carvalho Guedes, pelos ensinamentos e contribuições. Foi uma honra trabalharmos juntos; Aos docentes do programa de pós-graduação do PGEAGRI, pelos ensinamentos durante o doutorado. À secretaria acadêmica, pelos atendimentos prestados; De forma muito especial, ao meu esposo, Jaderson e às minhas filhas, Natália e Julia, pelo carinho, paciência, compreensão e incentivo. Faltam palavras para expressar o quanto vocês foram importantes nesta caminhada... Amo vocês!; A todos meus familiares, em especial a meu pai e à minha mãe, que nunca mediram esforçosparamepropiciaracessoàeducação. Vocêssãomeuexemplodevidaepersistência; Aos amigos, Denise (tia Dê), Daniela, Elisabeth, Fabiana, Gustavo, Perterson, Rosângela, por compartilharem as alegrias e tristezas durante a elaboração deste trabalho, pelas constantes conversas e pela ajuda no uso do software R e com Latex. Ao Julio Ávila, pelo apoio na implementação das rotinas no R; A todos meus amigos ou pessoas que, de alguma forma, contribuíram na realização deste trabalho. Muito Obrigada!!! v RESUMO DISTRIBUIÇÃO SLASH APLICADA A DADOS AGRÍCOLAS O objetivo deste trabalho foi discutir problemas de inferência estatística multivariada e de modelagem espacial quando as observações são provenientes de uma população contínua, simétrica, com distribuição slash multivariada. Inicialmente, foi realizada uma reparametrização da distribuição slash supondo existência do segundo momento finito, sendo apresentadas algumas propriedades recorrentes. Provaram-se expressões analíticas para a função escore e matriz de informação de Fisher da distribuição reparametrizada. Abordou-se um enfoque para a estimação dos parâmetros por máxima verossimilhança considerando um algoritmo do tipo EM (Esperança-Maximização). Descreveu-se a prova de hipóteses lineares sob o vetor de médias e matriz de covariância com o uso das estatísticas C(α), razão de verossimilhança, Wald e score. Estudos de simulação foram realizados para avaliar a eficiência dos testes estatísticos e do algoritmo EM. Dados relacionados à área agrícola ilustraram a metodologia desenvolvida, sendo aplicado sobre os mesmos os testes de igualdade de médias, esfericidade e equicorrelação. Como ilustração da aplicação da distribuição slash multivariada na área de modelagem estatística, o modelo espacial linear slash, com e sem o uso de covariáveis, foi discutido e proposto. Com o intuito de avaliar a influência das observações no processo de estimação dos parâmetros, discussões relacionadas à análise de diagnóstico, global e local, foram apresentadas. Derivaram-se as curvaturas requeridas no procedimento de influência local para o modelo slash, adequando o esquema de perturbação a distribuição e considerando diferentes esquemas de perturbação. Mapas de variabilidade espacial de atributos químicos do solo e produtividade foram gerados utilizando krigagem com drift externo. Os resultados das simulações e aplicações indicaram que a distribuição slash é uma alternativa robusta quando os dados apresentam alta curtose. Palavras-chave: Algoritmo EM, diagnóstico de influência global e local, modelagem espacial linear slash, testes de hipóteses. vi ABSTRACT MULTIVARIATE SLASH DISTRIBUTION APPLIED TO AGRICULTURAL DATA Thisstudyaimedatadiscussingproblemsofmultivariatestatisticalinferenceandlinearspatial modeling when observations are from a continuous, symmetric population, with multivariate slashdistribution. Firstly,areparametrizationofslashdistributionwasperformed,assumingthe existence of the finite second moment. Thus, some iterant properties were shown. Analytical expressionsweretestedforthescorefunctionandFisherinformationmatrixofreparameterized distribution. Anapproachtoestimatesomeparametersbymaximumlikelihoodwasconsidered based at the EM (Expectation-Maximization) algorithm. Linear hypothesis tests have been described regarding the means vector and the covariance matrix using statistics such as C(α), likelihood ratio, Wald, and score. Studies of simulation were carried out to evaluate the efficiency of the statistical tests and EM algorithm. Data related to the agricultural area illustrated the methodology developed, and the hypothesis tests for equality of means, sphericity and equicorrelation were also applied. A slash linear spatial model, with and without theuseofcovariates,wasproposed. WereDiscussedtheglobalandlocalinfluencediagnostic analysis in order to evaluate the influence of observations on the process of parameters’ estimation. The curvatures required for the local influence procedure and based on the slash model were derived, in which the perturbation scheme has been chosen properly and related tothedifferentperturbationschemes. Spatialvariabilitymapsofchemicalattributesofsoiland yieldweregeneratedbykrigingwithexternaldrift. Finallyresultsofsimulationsandapplications indicatedthattheslashdistributionisarobustalternativewhenthedatapresenthighkurtosis. Keywords: EM algorithm, global and local influence, slash linear spatial model, hypothesis tests. vii
Description: