ebook img

Detecção de Desvios Vocais Utilizando Modelos Auto Regressivos e o Algoritmo KNN PDF

80 Pages·2017·1.46 MB·Portuguese
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Detecção de Desvios Vocais Utilizando Modelos Auto Regressivos e o Algoritmo KNN

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E UNIVERSIDADEFEDERALDO RIO GRANDE DO NORTE DA COMPUTAÇÃO Detecção de Desvios Vocais Utilizando Modelos Auto Regressivos e o Algoritmo KNN Winnie de Lima Torres Orientador: Prof. Dr. AldayrDantasdeAraújo Co-orientador: Prof. Dr. AllandeMedeirosMartins Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia ElétricaedaComputaçãodaUFRN(áreade concentração: Automação e Sistemas) como parte dos requisitos para obtenção do título deMestreemCiências. Número de ordem: M519 Natal, RN, janeiro de 2018 UFRN/BibliotecaCentralZilaMamede Catalogaçãodapublicaçãonafonte. Torres,WinniedeLima. Detecçãodedesviosvocaisutilizandomodelosautoregressivoseoalgoritmo KNN/WinniedeLimaTorres-Natal,2018 59f. : il. Dissertação(Mestrado)-UniversidadeFederaldoRioGrandedoNorte. Cen- trodeTecnologia. ProgramadePós-GraduaçãoemEngenhariaElétrica. Orientador: Prof. Dr. AldayrDantasdeAraújo. Co-orientador: AllandeMedeirosMartins 1. Detecção de desvios vocais – Dissertação. 2. Modelos auto regressivos - Dissertação. 3. K-Nearest Neighbor - Dissertação. I. Araújo, Aldayr Dantas de. II.Martins,AllandeMedeiros. III.Título. RN/UF/BCZM CDU628.147.25 Detecção de Desvios Vocais Utilizando Modelos Auto Regressivos e o Algoritmo KNN Winnie de Lima Torres À minha família, com todo meu amor e gratidão, por serem meus exemplos e fazerem tudo por mim ao longo dessa caminhada. Agradecimentos À Deus, pela saúde, paz e sabedoria necessária para o desenvolvimento dos meus planos enatomadadasdecisõesquesurgiramaolongodomeucaminho. Aos meus pais, Raimundo da Costa Torres e Maria Celi de Lima Torres pelo amor, com- preensão,paciência,proteção,apoio,ensinamentos,porconfiaremeacreditarememmim enãomediremesforçosduranteminhajornada. Ao meu orientador, professor Aldayr Dantas de Araújo, sou grata pela oportunidade, pa- ciência,empenhoemmeajudarnosmomentosqueprecisei,pelacompreensãoemrelação àsadversidadesousurpresasquesurgiramnaminhacaminhadaepelocompartilhamento deconhecimentos. Àminhairmã,RayzaTorres,peloapoiodadoetorcidaduranteessesanos. Ao meu namorado, Ícaro Bezerra, pelo estímulo e incentivo para que eu cursasse o mes- trado na UFRN, carinho, pelas trocas de conhecimentos, sugestões, conversas, enorme paciênciaecompreensãonodecorrerdessaetapa. Ao professor, Allan Martins, pelo auxílio prestado e pelos sábios conselhos durante a realizaçãodestetrabalho. Ao professor, Ademar Costa, pela amizade e ensinamentos proporcionados ao longo dos anos. Aosamigosecolegaspelosmomentosdedescontraçãoepelaajudaduranteomestrado. Aosmeusfamiliaresportorcerempelomeusucesso. Resumo Alguns campos da ciência propõem-se a estudar distúrbios no trato vocal a partir de análisessobre padrõesde vibraçãoda voz. Em geral,a importânciadessaspesquisas está na identificação, em uma fase mais específica, de doenças de maior ou menor gravidade, a serem sanadas com terapia vocal ou que requerem maior atenção, gerando inclusive a necessidade de procedimentos cirúrgicos para o seu controle. Embora, já exista na lite- ratura indicações de que o processamento digital de sinais permite diagnosticar, de um modonãoinvasivo,patologiaslaríngeas,comodoençasvocaisqueocasionemedema,nó- dulo e paralisia, não existe definição do método mais indicado e das características, ou parâmetros, mais adequados para detectar a presença de desvios vocais. Sendo assim, nestetrabalhoépropostoumalgoritmoparadetecçãodedesviosvocaispormeiodaaná- lise de sinais de voz. Para a realização deste trabalho, utilizou-se dados constantes no banco de dados Disordered Voice Database, desenvolvido pelo Massachusetts Eye and Ear Infirmary (MEEI), devido sua utilização em pesquisas na área acústica de voz. Fo- ram utilizados 166 sinais contidos nessa base de dados, com sinais de vozes saudáveis e de vozes patológicas afetadas por edema, por nódulo e por paralisia nas pregas vocais. A partir dos sinais de voz, foram gerados modelos Auto Regressivos (AR e ARMA) para representaçãodessessinaise,utilizandoosparâmetrosdosmodelosobtidos,foiutilizado o algoritmo K-Nearest Neighbors (KNN) para a classificação dos sinais analisados. Com ointuitodeanalisaraeficiênciadoalgoritmopropostonesteestudo,osresultadosobtidos desse algoritmo foram comparados com um método de detecção considerando apenas distância euclidiana entre os sinais. Os resultados encontrados apontam que o método propostonestetrabalhoapresentaumbomresultado,gerandoumataxadeacertonaclas- sificaçãoacimade71%(maiorqueos31%apartirdousodadistânciaeuclidiana). Além disso, o método utilizado é de fácil implementação, podendo ser utilizado em hardwa- res mais simples. Logo, essa pesquisa tem potencial para gerar um classificador barato e acessível para a utilização em larga escala por profissionais de saúde, como uma alter- nativa de pré análise não invasiva para detecção de patologias otorrinolaringológicas que afetemavoz. Palavras-chave: Detecção de desvios vocais, modelos auto regressivos, k-nearest neighbor. Abstract Some fields in Science propose to study vocal tract disorders from an analysis about voicevibrationpatterns. Generally,theweightofthoseresearchesisgivenbytheidentifi- cation – in a more specific level – of diseases in different stages of severity, which would beredressedthroughvoicetherapyormeansthatrequiremoreattention,hencegenerating the need of surgical procedures for its control. Although there are evidences in literature that the Digital Signal Processing allows a non-invasive diagnosis of laryngeal patholo- gies, such as vocal cord disorders, which provoke swelling, nodules, and paralyses, there is no definition of any most indicated method, and characteristics or appropriated para- meterstodetectvoicedeviations. Thus,thepresentpaperproposesanalgorithmtodetect vocal deviances through the Voice Signal Analysis. In order to complete this study, it hadbeenuseddatafromtheDisorderedVoiceDatabase,developedbytheMassachusetts EyeandEarInfirmary(MEEI)duetotheirwideuseinresearchesregardingthevoiceand speech. Atotalof166signalsfromthisdatabasewereused,includinghealthyvoicesand pathologic voices affected by swelling, nodule, and vocal fold paralysis. From the voice signals, autoregressive processes of order (AR and ARMA) were generated for a repre- sentation of those signals, and – by using the models’ parameters obtained – it had been used the KNN algorithm for a classification of the signals analyzed. Seeking an analysis of the efficiency of the algorithm proposed in this study, the results obtained from this algorithm were compared to a detection method, which only considers the Euclidian dis- tance between the signals. The results found point that the propositioned method in this work presents a satisfactory result, generating a hit rate on the classification above 71% (morethanthe31%fromtheuseoftheEuclidiandistance). Moreover,themethodusedis easytoimplement,sothatitcanbeusedalongwithsimplerhardware. Consequently,this research has the potential to generate a cheap and accessible sorter for wide-scale use by health care professionals as a non-invasive pre-analysis to detect otorhinolaryngological pathologiesthataffectthevoice. Keywords: Detectionofvocaldeviations,autoregressivemodels,k-nearestneighbor. Sumário Sumário i ListadeFiguras iii ListadeTabelas iv ListadeAbreviaturaseSiglas viii 1 Introdução 1 1.1 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1 ObjetivoGeral . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 ObjetivosEspecíficos . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 OrganizaçãodoTrabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2 EstadodaArte 5 3 AnálisedaVoz 13 3.1 ProcessodeProduçãodaVoz . . . . . . . . . . . . . . . . . . . . . . . . 13 3.2 PatologiasdaLaringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2.1 EdemadeReinke . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2.2 NódulosVocais . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.2.3 Paralisia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 IdentificaçãodeSistemas 19 4.1 ModelagemeIdentificaçãodeSistemas . . . . . . . . . . . . . . . . . . 19 4.2 ModelosdeRepresentaçõesdeEquaçõeseSistemas . . . . . . . . . . . . 22 4.3 ModelosAutoRegressivosouSériesTemporais . . . . . . . . . . . . . . 23 4.4 MétododosMínimosQuadrados . . . . . . . . . . . . . . . . . . . . . . 26 4.5 ClassificaçãodeDados . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.5.1 MetodologiaKNN . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Metodologia 30 5.1 BasedeDados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5.2 AnáliseInicialdosSinaisdeVoz . . . . . . . . . . . . . . . . . . . . . . 30 5.3 AlgoritmosdeIdentificação . . . . . . . . . . . . . . . . . . . . . . . . . 32 i 6 Resultados 35 6.1 ResultadosdaAnáliseInicialdosSinaisdeVoz . . . . . . . . . . . . . . 35 6.2 ResultadosdaIdentificação . . . . . . . . . . . . . . . . . . . . . . . . . 37 6.3 ResultadosdaClassificaçãoUtilizandooKNN . . . . . . . . . . . . . . 38 7 ConsideraçõesFinaisePerspectivas 44 Referências 46 A ResultadosdasAnálisesdosSinaisdeVoz 52 A.1 ResultadosdaClassificaçãoUtilizandoaDistânciaEuclidiana . . . . . . 52 A.2 ResultadosdaClassificaçãoKNNcomosSinaisIdentificados . . . . . . 52 B ResultadosdosSinaisNormaisVersusPatológicos 59 B.1 ResultadosdaClassificaçãoUtilizandoaDistânciaEuclidiana . . . . . . 59 B.2 ResultadosdaClassificaçãoKNNcomosSinaisIdentificados . . . . . . 59 Lista de Figuras 3.1 Sistemasenvolvidosnaproduçãodosinaldevoz. . . . . . . . . . . . . . 14 3.2 Modelosimplificadodomecanismodeproduçãodafala. . . . . . . . . . 14 3.3 Edemanaspregasvocais. . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.4 Nódulonaspregasvocais. . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.5 Paralisiaunilateral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.6 Paralisiabilateral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4.1 Princípiosparaaconstruçãodeummodelomatemático. . . . . . . . . . . 20 4.2 Diagramacomprocedimentodeidentificação. . . . . . . . . . . . . . . . 21 4.3 DinâmicadoKNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5.1 Gráficodedispersãodosmodelosdesinaisnoplanoα xα . . . . . . . 33 1 2 5.2 Gráficodedispersãodosmodelosdesinaisnoplanoα xα xα . . . . 34 1 2 3 iii

Description:
tional Journal of Bifurcation and Chaos, v. 10, n. 12, p. 2767–2780, December 2000 streams using p-trees. 6th Pacific-Asia Conference, PAKDD,
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.