Universidade Federal do Rio Grande do Norte Centro de Cieˆncias Exatas e da Terra Departamento de Informa´tica e Matema´tica Aplicada Programa de Po´s Graduac¸a˜o em Sistemas e Computac¸a˜o Utiliza¸c˜ao de T´ecnicas de Aprendizado de M´aquina para Predi¸c˜ao de Crises Epil´eticas Kelyson Nunes dos Santos Natal/RN Julho de 2016 Kelyson Nunes dos Santos Disserta¸ca˜odeMestradoapresentadaaoPro- grama de P´os-Graduac¸˜ao em Sistemas e Computa¸ca˜o, vinculado ao Departamento de Informa´tica e Matema´tica Aplicada do Cen- tro de Ciˆencias Exatas e da Terra da Univer- sidade Federal do Rio Grande do Norte como requisito parcial para a obten¸ca˜o do grau de mestre em Sistemas e Computa¸ca˜o. Orientador Prof. Dr. Augusto Jos´e Venaˆncio Neto Universidade Federal do Rio Grande do Norte – UFRN Departamento de Informa´tica e Matema´tica Aplicada – DIMAp Natal/RN Julho de 2016 Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial Especializada do Centro de Ciências Exatas e da Terra – CCET. Santos, Kelyson Nunes dos. Utilização de técnicas de aprendizado de máquina para predição de crises epiléticas / Kelyson Nunes dos Santos. – Natal, RN, 2016. 73 f. : il. Orientador: Augusto José Venâncio Neto. Coorientador: Renan Cipriano Moioli. Dissertação (mestrado) – Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Departamento de Informática e Matemática Aplicada. Programa de Pós-Graduação em Sistemas e Computação. 1. Computação – Dissertação. 2. Predição de eventos – Dissertação. 3. Predição de crises epiléticas – Dissertação. 4. Epilepsia – Dissertação. 5. Comitês de classificadores – Dissertação. I. Venâncio Neto, Augusto José. II. Moioli, Renan Cipriano. III. Título. RN/UF/BSE-CCET CDU 004(043.3) Disserta¸ca˜o de Mestrado sob o t´ıtulo Utiliza¸c˜ao de T´ecnicas de Aprendizado de M´aquina para Predi¸c˜ao de crises Epil´eticas apresentada por Kelyson Nunes dos Santos e aceita pelo Programa de P´os-Graduac¸˜ao em Sistemas e Computa¸ca˜o, vinculado ao Departamento de Informa´tica e Matem´atica Aplicada do Centro de Ciˆencias Exatas e da Terra da Univer- sidade Federal do Rio Grande do Norte, sendo aprovada por todos os membros da banca examinadora abaixo especificada: Prof. Dr. Augusto Jos´e Venaˆncio Neto Orientador Departamento de Inform´atica e Matem´atica Aplicada Universidade Federal do Rio Grande do Norte Dr. Renan Cipriano Moioli Co-orientador Instituto Internacional de Neurociˆencias Edmond e Lily Safra (IIN-ELS) Instituto Santos Dumont (ISD) Prof. Dr. Benjamin Ren´e Callejas Bedregal Examinador Interno Departamento de Inform´atica e Matem´atica Aplicada Universidade Federal do Rio Grande do Norte Dr. Fabr´ıcio Lima Brasil Examinador Externo Instituto Internacional de Neurociˆencias Edmond e Lily Safra (IIN-ELS) Instituto Santos Dumont (ISD) Natal-RN, 28 de julho de 2016. Por que vocˆe est´a assim t˜ao triste, ´o minha alma? Por que est´a assim t˜ao perturbada dentro de mim? Ponha a sua esperan¸ca em Deus! Pois ainda o louvarei; ele ´e o meu Salvador e o meu Deus. Salmo 42:11 (B´ıblia Sagrada) Aos meus pais, os maiores incentivadores. Aos meus irma˜os, suportes incondicionais. Aos meus amigos, de perto e de longe, de hoje ou de ontem. A Tobby, meu primeiro grande ca˜o-panheiro. Agradecimentos Agradecer ´e uma pr´atica que tem sido perdida em um mundo ta˜o ego´ısta e vazio que tem se apresentado a no´s. Mas desde cedo aprendi, em casa, que devemos agradecer por todas as coisas, as que achamos boas e tamb´em pelas ruins. Depois de mais velho, aprendi que esse ensino vem da B´ıblia (1Tessalonicenses 5:18). E por isso escrevo com tanto carinho e dedicac¸˜ao essa parte do trabalho. Os meus pais, Jos´e Carlos e Jos´elia, foram meus primeiros professores e os que por mais tempo se dedicaram a essa tarefa (´ardua, devo dizer, ainda mais me conhecendo): at´e agora, ja´ sa˜o 27 anos e espero que se estendam por muitos outros. Eles sonharam com a conclusa˜o deste trabalho at´e mais do que eu, talvez, e sabem as oportunidades que ele pode abrir, quer pessoais, quer profissionais, quer acadˆemicas. Sem du´vida eles foram (e ainda sa˜o!) os maiores incentivadores durante toda a minha trajeto´ria acadˆemica. A vocˆes, painho e mainha, eu agrade¸co por todos os minuto e segundos investidos em mim, seja trabalhando, me ensinando ou mesmo orando para a Deus por mim. Os meus irma˜os e familiares pro´ximos (cunhadas tamb´em s˜ao fam´ılia!) tamb´em unem suas vozes a essa torcida. As conversas sobre metodologia de pesquisa, m´etodos es- tat´ısticos e valida¸ca˜o de resulestados sempre foram parte de uma fam´ılia de estudantes que, acredito eu, nunca vai perder esse status, mesmo que na˜o estejamos matriculados em algum curso regular. Obrigado, Karlyson e Kivyson, duas das pessoas mais inteligentes e estudiosasqueconhe¸co, portodososmomentosquevocˆesmeajudaramemeincentivaram a n˜ao desistir (e vocˆes sabem que n˜ao foram poucos). Na˜o ta˜o distantes da minha fam´ılia sangu´ınea sa˜o os meus amigos que me ajudam a manter a sanidade neste mundo. Agrade¸co o carinho e motiva¸ca˜o de cada um, seja ao me animar ou mesmo mangando de mim por eu n˜ao estar presente. Sou muito grato a Deus pela vida de cada um de vocˆes e pela compreensa˜o da ausˆencia que, infelizmente, se deu por longos momentos. Em especial, eu gostaria de agradecer aos amigos mais pr´oximos, que me suportaram em ora¸ca˜o e em reclama¸ca˜o, al´em de me dar broncas quando eu n˜ao rendia o necessa´rio. Obrigado, Leonardo, Samuel, Ang´elica, Isabela, Fernanda, Stephanie, Daniel, Yan, Ro- drigo, Luanna, Gustavo, Natha´lia, Jeane, Kalina, Eduarda, Eva, Mitomari, Nayara, Tami- res, Mar´ılia, Edmilson, Andressa, Nathalie, Tha´ıs Burity e tantos outros que, at´e mesmo sem saber, contribu´ıram para que esse trabalho fosse conclu´ıdo, com palavras de aˆnimo ou mesmo emprestando o ouvido para ouvir minhas lamenta¸co˜es. Deixar registrada minha gratida˜o a Raphaela ainda ´e muito pouco, que revisou meu trabalho mais de uma vez e ofereceu contribui¸co˜es valios´ıssimas para as constru¸co˜es tex- tuais. S´o posso pedir que Deus te aben¸coe ainda mais e fa¸ca seu caminho brilhante! Agrade¸co bastante a todos que contribu´ıram para a minha forma¸ca˜o acadˆemica, em especial ao professor Augusto, que aceitou o desafio de orientar um aluno com pouca experiˆencia em pesquisa que queria aprender mais sobre o assunto, al´em de desbravar a ´area de e-Health. Obrigado pela paciˆencia e preocupa¸ca˜o, al´em da ajuda no que foi poss´ıvel. Tamb´em ´e necess´ario agradecer aos professores do Instituto Santos Dumont, princi- palmente ao Renan e ao Fabr´ıcio, excelentes orientadores e pessoas brilhantes que direci- onaram este trabalho. Sa˜o os melhores co-orientadores que eu poderia ter tido. Os meus colegas de pesquisa, mesmo que em outras linhas, tamb´em merecem minha gratida˜o: Fl´avio, Hugo, Douglas, Max e demais, muito obrigado pelas conversas proveito- sas que muito me ajudaram. Queria conseguir, algum dia, retribuir de alguma forma. E tamb´emosamigosquefiznoInstitutodeNeurociˆencia, Camila, Maur´ıcio, Kellyn, J´essica, Ivany, Daniel, Edith e todos os demais que tanto me guiaram nesse mundo maravilhoso que ´e o c´erebro humano. Agrade¸co demais! Aos colegas de trabalho tamb´em tenho muito a agradecer. O incentivo e apoio nos momentos dif´ıceis devem ser ressaltados, bem como o companheirismo no dia-a-dia. Obri- ˆ gado, Rharon, Davi, Angelo, Raphael, Felipe, Jorcyane, Rodrigo, Ju´lio, Dona Ana, Jonas, Jorge, Vicente e todos que tem torcido por mim, desde quando iniciei no IFPB, em Picu´ı, como Rosa, Rubevaˆnia, Rudjane, Em´ılia, Emeline, Morgana, Kelly e Yane. Gostaria de destacar o aux´ılio de Alexandre, coordenador do setor de redes, que montou o ambiente para a execu¸c˜ao dos experimentos e foi de grande ajuda para diminuir o desespero deste candidato a pesquisador. A todos gostaria de agradecer pelo cuidado e pedir desculpas pelos momentos de ausˆencia e mau humor que esse trabalho tamb´em me gerou, devido a`s preocupa¸co˜es por querer fazer tudo da melhor forma poss´ıvel e nem sempre conseguir. E, finalmente, tenho que agradecer `aquele que cria e mant´em a vida, principal objeto de estudo desse trabalho; aquele que sustenta todas as coisas pela palavra do Seu poder; em quem no´s vivemos, nos movemos e existimos; aquele que nos criou e preparou com cuidado cada momento da nossa vida; que me deu a Salva¸ca˜o eterna e incondicional atrav´es do sacrif´ıcio perfeito do Seu u´nico filho, Jesus, o Cristo. Deus, meu principal agradecimento ´e Seu, que me fortaleceu durante todo esse traba- lho e n˜ao me faz surtar com todas as dificuldades que essa vida traz. S´o com vocˆe que a vida faz sentido. Muito obrigado. Autor: Kelyson Nunes dos Santos Orientador: Dr. Augusto Venaˆncio Neto Co-orientador: Dr. Renan Cipriano Moioli Resumo A predic¸˜ao de eventos a partir de dados neurofisiolo´gicos possui muitas varia´veis que de- vem ser analisadas em diferentes momentos, desde a aquisic¸˜ao e registro de dados at´e o p´os-processamento dos mesmos. Assim, a escolha do algoritmo que ir´a processar es- ses dados ´e uma etapa muito importante, pois o tempo de processamento e a acura´cia do resultado sa˜o fatores determinantes para uma ferramenta de aux´ılio de diagno´stico. A tarefa de classifica¸ca˜o e predic¸˜ao tamb´em auxilia no entendimento das intera¸c˜oes re- alizadas pelas redes de c´elulas cerebrais. Este trabalho utiliza t´ecnicas de Aprendizado de Ma´quina Supervisionado com diferentes caracter´ısticas para analisar seu impacto na tarefa de predi¸c˜ao de crises epil´eticas a partir de dados neurofisiolo´gicos em cachorros e propo˜e o uso de comitˆes de classificadores de forma a otimizar o desempenho da tarefa de predi¸ca˜o atrav´es do uso de t´ecnicas de baixo custo computacional. Os dados de EEG em cachorros com epilepsia foram pr´e-processados atrav´es da transformada de Fourier e ape- nas as frequˆencias significantes foram analisadas (de 1 a 30Hz). Foi aplicado um redutor de dimensionalidade e os dados foram submetidos `as t´ecnicas de aprendizado de m´aquina supervisionado. Dois cena´rios foram avaliados: o primeiro utiliza os dados brutos obti- dos na transformada de Fourier, enquanto que o segundo realiza uma transforma¸ca˜o nos dados. A avaliac¸˜ao dos experimentos ocorreu atrav´es da m´etrica de ´area sobre a curva. Os melhores resultados conseguidos foram, para o cen´ario A (a) um comitˆe heterogˆeneo formado por um KNN, uma ´arvore de decisa˜o e um classificador bayesiano, pontuando em 0.703 e (b) uma configura¸ca˜o de ´arvore de decis˜ao com o valor de 0.687, enquanto para o cena´rio B obtiveram a melhor avalia¸ca˜o (a) uma configurac¸˜ao de a´rvore de decis˜ao, com o valor 0.620 e (b) um comitˆe heterogˆeneo composto por um KNN, uma ´arvore de decis˜ao e um classificador bayesiano alcanc¸ando o valor 0.612 de avalia¸ca˜o. Palavras-chave: predi¸c˜ao de eventos, predi¸ca˜o de crises epil´eticas, epilepsia, comitˆes de classificadores. Author: Kelyson Nunes dos Santos Advisor: Augusto Venaˆncio Neto, Ph.D. Co-advisor: Renan Cipriano Moioli, Ph.D. Abstract Eventpredictionfromneurophysiologicaldatahasmanyvariableswhichmustbeanalyzed in different moments, since data acquisition and registry to its post-processing. Hence, choosingthealgorithmthatwillprocessthesedataisaveryimportantstep, forprocessing timeandaccuracyofresultsaredeterminantfactorsforadiagnosisauxiliarytool. Tasksof classification and prediction also help in understanding brain cell’s networks interactions. This work uses Supervised Machine Learning techniques with different features to analyze theirimpactonthetaskofepilepticseizurepredictionfromcanineneurophysiologicaldata and purposes using of ensembles to optimize the performance of event prediction task through computational low-cost techniques. Epileptic dogs’ EEG data were preprocessed throug Fourier transform and only significant frequencies were considered (1 to 30Hz). It was applied a dimensionality reductor and then data was submitted to supervised machine learning techniques. Two scenarios were evaluated: first used raw data resulted from Fourier transform, as the second one transform these data. Algorithms evaluation was made through area under ROC curve (AUC) measure. Best results were to scenario A (a) an heterogeneous ensemble formed by a KNN, a decision tree and a bayesian classifier, scoring 0.7074 and (b) an example of decision tree evaluated in 0.687, and, for scenario B, bestresultswere(a)asetupofdecisiontreewhichobtained0.620and(b)anheterogeneous ensemble composed by a KNN, a decision tree and a bayesian classifier, scoring 0.612. Keywords: event prediction, seizure prediction, epilepsy, ensembles.
Description: