UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E UNIVERSIDADEFEDERALDO RIO GRANDE DO NORTE DA COMPUTAÇÃO Detecção de Desvios Vocais Utilizando Modelos Auto Regressivos e o Algoritmo KNN Winnie de Lima Torres Orientador: Prof. Dr. AldayrDantasdeAraújo Co-orientador: Prof. Dr. AllandeMedeirosMartins Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia ElétricaedaComputaçãodaUFRN(áreade concentração: Automação e Sistemas) como parte dos requisitos para obtenção do título deMestreemCiências. Número de ordem: M519 Natal, RN, janeiro de 2018 UFRN/BibliotecaCentralZilaMamede Catalogaçãodapublicaçãonafonte. Torres,WinniedeLima. Detecçãodedesviosvocaisutilizandomodelosautoregressivoseoalgoritmo KNN/WinniedeLimaTorres-Natal,2018 59f. : il. Dissertação(Mestrado)-UniversidadeFederaldoRioGrandedoNorte. Cen- trodeTecnologia. ProgramadePós-GraduaçãoemEngenhariaElétrica. Orientador: Prof. Dr. AldayrDantasdeAraújo. Co-orientador: AllandeMedeirosMartins 1. Detecção de desvios vocais – Dissertação. 2. Modelos auto regressivos - Dissertação. 3. K-Nearest Neighbor - Dissertação. I. Araújo, Aldayr Dantas de. II.Martins,AllandeMedeiros. III.Título. RN/UF/BCZM CDU628.147.25 Detecção de Desvios Vocais Utilizando Modelos Auto Regressivos e o Algoritmo KNN Winnie de Lima Torres À minha família, com todo meu amor e gratidão, por serem meus exemplos e fazerem tudo por mim ao longo dessa caminhada. Agradecimentos À Deus, pela saúde, paz e sabedoria necessária para o desenvolvimento dos meus planos enatomadadasdecisõesquesurgiramaolongodomeucaminho. Aos meus pais, Raimundo da Costa Torres e Maria Celi de Lima Torres pelo amor, com- preensão,paciência,proteção,apoio,ensinamentos,porconfiaremeacreditarememmim enãomediremesforçosduranteminhajornada. Ao meu orientador, professor Aldayr Dantas de Araújo, sou grata pela oportunidade, pa- ciência,empenhoemmeajudarnosmomentosqueprecisei,pelacompreensãoemrelação àsadversidadesousurpresasquesurgiramnaminhacaminhadaepelocompartilhamento deconhecimentos. Àminhairmã,RayzaTorres,peloapoiodadoetorcidaduranteessesanos. Ao meu namorado, Ícaro Bezerra, pelo estímulo e incentivo para que eu cursasse o mes- trado na UFRN, carinho, pelas trocas de conhecimentos, sugestões, conversas, enorme paciênciaecompreensãonodecorrerdessaetapa. Ao professor, Allan Martins, pelo auxílio prestado e pelos sábios conselhos durante a realizaçãodestetrabalho. Ao professor, Ademar Costa, pela amizade e ensinamentos proporcionados ao longo dos anos. Aosamigosecolegaspelosmomentosdedescontraçãoepelaajudaduranteomestrado. Aosmeusfamiliaresportorcerempelomeusucesso. Resumo Alguns campos da ciência propõem-se a estudar distúrbios no trato vocal a partir de análisessobre padrõesde vibraçãoda voz. Em geral,a importânciadessaspesquisas está na identificação, em uma fase mais específica, de doenças de maior ou menor gravidade, a serem sanadas com terapia vocal ou que requerem maior atenção, gerando inclusive a necessidade de procedimentos cirúrgicos para o seu controle. Embora, já exista na lite- ratura indicações de que o processamento digital de sinais permite diagnosticar, de um modonãoinvasivo,patologiaslaríngeas,comodoençasvocaisqueocasionemedema,nó- dulo e paralisia, não existe definição do método mais indicado e das características, ou parâmetros, mais adequados para detectar a presença de desvios vocais. Sendo assim, nestetrabalhoépropostoumalgoritmoparadetecçãodedesviosvocaispormeiodaaná- lise de sinais de voz. Para a realização deste trabalho, utilizou-se dados constantes no banco de dados Disordered Voice Database, desenvolvido pelo Massachusetts Eye and Ear Infirmary (MEEI), devido sua utilização em pesquisas na área acústica de voz. Fo- ram utilizados 166 sinais contidos nessa base de dados, com sinais de vozes saudáveis e de vozes patológicas afetadas por edema, por nódulo e por paralisia nas pregas vocais. A partir dos sinais de voz, foram gerados modelos Auto Regressivos (AR e ARMA) para representaçãodessessinaise,utilizandoosparâmetrosdosmodelosobtidos,foiutilizado o algoritmo K-Nearest Neighbors (KNN) para a classificação dos sinais analisados. Com ointuitodeanalisaraeficiênciadoalgoritmopropostonesteestudo,osresultadosobtidos desse algoritmo foram comparados com um método de detecção considerando apenas distância euclidiana entre os sinais. Os resultados encontrados apontam que o método propostonestetrabalhoapresentaumbomresultado,gerandoumataxadeacertonaclas- sificaçãoacimade71%(maiorqueos31%apartirdousodadistânciaeuclidiana). Além disso, o método utilizado é de fácil implementação, podendo ser utilizado em hardwa- res mais simples. Logo, essa pesquisa tem potencial para gerar um classificador barato e acessível para a utilização em larga escala por profissionais de saúde, como uma alter- nativa de pré análise não invasiva para detecção de patologias otorrinolaringológicas que afetemavoz. Palavras-chave: Detecção de desvios vocais, modelos auto regressivos, k-nearest neighbor. Abstract Some fields in Science propose to study vocal tract disorders from an analysis about voicevibrationpatterns. Generally,theweightofthoseresearchesisgivenbytheidentifi- cation – in a more specific level – of diseases in different stages of severity, which would beredressedthroughvoicetherapyormeansthatrequiremoreattention,hencegenerating the need of surgical procedures for its control. Although there are evidences in literature that the Digital Signal Processing allows a non-invasive diagnosis of laryngeal patholo- gies, such as vocal cord disorders, which provoke swelling, nodules, and paralyses, there is no definition of any most indicated method, and characteristics or appropriated para- meterstodetectvoicedeviations. Thus,thepresentpaperproposesanalgorithmtodetect vocal deviances through the Voice Signal Analysis. In order to complete this study, it hadbeenuseddatafromtheDisorderedVoiceDatabase,developedbytheMassachusetts EyeandEarInfirmary(MEEI)duetotheirwideuseinresearchesregardingthevoiceand speech. Atotalof166signalsfromthisdatabasewereused,includinghealthyvoicesand pathologic voices affected by swelling, nodule, and vocal fold paralysis. From the voice signals, autoregressive processes of order (AR and ARMA) were generated for a repre- sentation of those signals, and – by using the models’ parameters obtained – it had been used the KNN algorithm for a classification of the signals analyzed. Seeking an analysis of the efficiency of the algorithm proposed in this study, the results obtained from this algorithm were compared to a detection method, which only considers the Euclidian dis- tance between the signals. The results found point that the propositioned method in this work presents a satisfactory result, generating a hit rate on the classification above 71% (morethanthe31%fromtheuseoftheEuclidiandistance). Moreover,themethodusedis easytoimplement,sothatitcanbeusedalongwithsimplerhardware. Consequently,this research has the potential to generate a cheap and accessible sorter for wide-scale use by health care professionals as a non-invasive pre-analysis to detect otorhinolaryngological pathologiesthataffectthevoice. Keywords: Detectionofvocaldeviations,autoregressivemodels,k-nearestneighbor. Sumário Sumário i ListadeFiguras iii ListadeTabelas iv ListadeAbreviaturaseSiglas viii 1 Introdução 1 1.1 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1 ObjetivoGeral . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 ObjetivosEspecíficos . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 OrganizaçãodoTrabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 EstadodaArte 5 3 AnálisedaVoz 13 3.1 ProcessodeProduçãodaVoz . . . . . . . . . . . . . . . . . . . . . . . . 13 3.2 PatologiasdaLaringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2.1 EdemadeReinke . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2.2 NódulosVocais . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.2.3 Paralisia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 IdentificaçãodeSistemas 19 4.1 ModelagemeIdentificaçãodeSistemas . . . . . . . . . . . . . . . . . . 19 4.2 ModelosdeRepresentaçõesdeEquaçõeseSistemas . . . . . . . . . . . . 22 4.3 ModelosAutoRegressivosouSériesTemporais . . . . . . . . . . . . . . 23 4.4 MétododosMínimosQuadrados . . . . . . . . . . . . . . . . . . . . . . 26 4.5 ClassificaçãodeDados . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.5.1 MetodologiaKNN . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Metodologia 30 5.1 BasedeDados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5.2 AnáliseInicialdosSinaisdeVoz . . . . . . . . . . . . . . . . . . . . . . 30 5.3 AlgoritmosdeIdentificação . . . . . . . . . . . . . . . . . . . . . . . . . 32 i 6 Resultados 35 6.1 ResultadosdaAnáliseInicialdosSinaisdeVoz . . . . . . . . . . . . . . 35 6.2 ResultadosdaIdentificação . . . . . . . . . . . . . . . . . . . . . . . . . 37 6.3 ResultadosdaClassificaçãoUtilizandooKNN . . . . . . . . . . . . . . 38 7 ConsideraçõesFinaisePerspectivas 44 Referências 46 A ResultadosdasAnálisesdosSinaisdeVoz 52 A.1 ResultadosdaClassificaçãoUtilizandoaDistânciaEuclidiana . . . . . . 52 A.2 ResultadosdaClassificaçãoKNNcomosSinaisIdentificados . . . . . . 52 B ResultadosdosSinaisNormaisVersusPatológicos 59 B.1 ResultadosdaClassificaçãoUtilizandoaDistânciaEuclidiana . . . . . . 59 B.2 ResultadosdaClassificaçãoKNNcomosSinaisIdentificados . . . . . . 59 Lista de Figuras 3.1 Sistemasenvolvidosnaproduçãodosinaldevoz. . . . . . . . . . . . . . 14 3.2 Modelosimplificadodomecanismodeproduçãodafala. . . . . . . . . . 14 3.3 Edemanaspregasvocais. . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.4 Nódulonaspregasvocais. . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.5 Paralisiaunilateral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.6 Paralisiabilateral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4.1 Princípiosparaaconstruçãodeummodelomatemático. . . . . . . . . . . 20 4.2 Diagramacomprocedimentodeidentificação. . . . . . . . . . . . . . . . 21 4.3 DinâmicadoKNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5.1 Gráficodedispersãodosmodelosdesinaisnoplanoα xα . . . . . . . 33 1 2 5.2 Gráficodedispersãodosmodelosdesinaisnoplanoα xα xα . . . . 34 1 2 3 iii
Description: