UNIVERSIDAD NACIONAL DEL LITORAL Facultad de Ingenier´ıa y Ciencias H´ıdricas Optimizaci´on mediante algoritmos evolutivos a" bl a h de la representaci´on de sen˜ales el d o átic para el reconocimiento autom´atico del habla m o ut a o nt e mi ci Leandro Daniel Vignolo o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para MeTnecsci´oiosnmrIoenmpteiatlrDiidgtOeeanCdacelTiaClOoCosdRmoermleEitqgp´NeuruaiAtsIdNaictocaoGiddsoE´enepmNaaliIr,cEaoSRledan˜IeAaollbeDtseoyncctSoio´irsnatdemo as d Comos e de la ms angorit11. UNIVERSIDAD NACIONAL DEL LITORAL nals, Systemediante alal, may, 20 2011 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor Comisi´on de PosgradPo,aFraajceul“tEadl PdoezIon”g,eSn3i0er0´ı0a,ySaCniteancFiea,sAHr´ıgdernictains,a.Ciudad Universitaria, a" bl a h el d o c áti m o ut a o nt e mi ci o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para d Comos e ms angorit11. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor Doctorado en Ingenier´ıa Menci´on Inteligencia Computacional, Sen˜ales y Sistemas T´ıtulo de la obra: Optimizaci´on mediante algoritmos evolutivos de la representaci´on de sen˜ales para el reconocimiento autom´atico del habla a" bl a h el d o c áti m Autor: Leandro Daniel Vignolo o ut o a Director: Dr. Hugo Leonardo Rufiner nt mie Codirector: Dr. Diego Humberto Milone ci o n o c e el r Lugar: Santa Fe, Argentina mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para PacmpulaagoaqlodanurebteilitrtozmaeasscodoiCse´ocluneoavlnvtvooedelssuic:tttdaoievsr,oiMasl,,arkov, d Comos e coeficientes cepstrales, ms angorit11. reconocimiento robusto del habla. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor a" bl a h el d o c áti m o ut a o nt e mi ci o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para d Comos e ms angorit11. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor Dedicado a Patricia, mi otra mitad. Dedicado a mis padres Angela y Miguel. Dedicado a mis sobrinos Valentino, Giuliano y Delfina. a" bl a h el d o c áti m o ut a o nt e mi ci o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para d Comos e ms angorit11. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor a" bl a h el d o c áti m o ut a o nt e mi ci o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para d Comos e ms angorit11. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor Agradecimientos Quiero expresar mi agradecimiento a mi director, Dr. Leonardo Rufiner, por compartir conmigo su experiencia y permitirme enriquecer esta tesis con sus puntos de vista. En igual medida quiero agradecer a mi co-director Dr. Diego Milone, por darme la posibilidad de conocer el mundo de la investigaci´on, por guiarmealolargodetodoeltrabajoconsumadedicaci´on,porsusvaliososaportes y su apoyo constante. A ambos, Diego y Leonardo, por brindarme su confianza y la oportunidad de trabajar en el sınc(i), por las numerosas discusiones sobre la tesis, y por contribuir en mi formaci´on de manera ejemplar. bla" Tambi´en quiero agradecer al Dr. John Goddard, por haber aportado ideas a h el muy valiosas para el desarrollo de la tesis y los trabajos relacionados con ´esta, d co por hacer posible mi estancia de investigaci´on en la UAM, y por su hospitalidad áti m o y cordialidad durante mi estad´ıa. ut a o Quiero agradecer tambi´en a todos mis compan˜eros del sınc(i) por crear un nt e mi ambiente de trabajo ideal. Particularmente a Leandro Di Persia, por su com- ci o n pan˜erismo y predisposici´on, por brindarme siempre su asistencia, facilitando mi o c e el r aprendizaje y allanando mi camino. A Marcelo, por acompan˜arme en esta carrera mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para yasdcmPcuooiasiCemmtpcsrd´eotuppiseaLcmerradireesearpitnns,c,saassaiLapiien˜c´´ooagmoeeinnr´oorrap,,ainnyscrdypamuoeearodpmzodrdacoeopioryrdss,ltpaetctaDatoruoamamdniemcersaiemagtssbrootluiseara´,esu,edanaCrcp.ayaobaaopuA.nrrrdolimsTonyelaeaasodsijs,qomt,aDasuMrpabremryaliaai´eadmee.tnsnr´ıumMeeastgqsuosihae,,ualrryaiAaF´enıeyadnerfnubuoodcgEdreieeaeiuraarnlnszi.aggc.daeroTlasyano,dadispamMCoeamcebrsTiecagioiore´ieumlmrsniedreaelpege,nlsreyut,pesmio,rpoMsqahroaunadardsixeicueeferii´ırlmesacaoetninajildeleeartisomsaegp,s.nrppiepaeoAcoldmo,oisaer,imppbclssoreliuuaeesrr d Comos e hermanos, Mar´ıa de los A´ngeles y Dami´an, quienes siempre me han brindado su ms angorit11. ayuda incondicional, y a mis sobrinos Delfina, Giuliano y Valentino por alegrarme nals, Systemediante alal, may, 20 cyoantsoudtoesrnmuirsaa.mAigmosi apboureslua aAfencatoy. mi t´ıo H´ector por su carin˜o y sus oraciones, sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor TambistF´eaıannccicuod(lneits)aae:ldoCdeeexnptInrroegsedanerieImrn´ıvaieaysgtCirgaiadecneicc´oiinmaseieHnn´ıStdoern˜iacaallesa,ss,UsSinigsiuvteieemrnsitadesasedinINnsttaiectliuiogcneinoancliedase:Cl Loimtoprua-l vii Consejo Nacional de Investigaciones Cient´ıficas y T´ecnicas Laboratorio de Cibern´etica (Facultad de Ingenier´ıa, Universidad Nacional de Entre R´ıos) DepartamentodeIngenier´ıaEl´ectrica,UnidadIztapalapa,UniversidadAut´ono- ma Metropolitana, M´exico A todos, mi m´as sincero agradecimiento, Leandro Daniel Vignolo bla" Santa Fe, Abril de 2011 a h el d o c áti m o ut a o nt e mi ci o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para d Comos e ms angorit11. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor viii Optimizaci´on mediante algoritmos evolutivos de la representaci´on de sen˜ales para el reconocimiento autom´atico del habla Leandro Daniel Vignolo Director de tesis: Hugo Leonardo Rufiner Co-director de tesis: Diego Humberto Milone Departamento de Inform´atica, 2011 Resumen La dificultad para resolver los problemas asociados al reconocimiento del habla a" bl esta´ dada por las caracter´ısticas de las sen˜ales implicadas, ya que las mismas presentan a h el complejasfuncionesdedensidaddeprobabilidad,sonnoestacionariasygeneralmentese d o átic encuentrancontaminadasconruidosdenaturalezaeintensidadmuydiversa.Esporesto m o quelossistemasdereconocimientoautoma´ticorequierendeunaetapadeprocesamiento ut a o que ponga en evidencia las caracter´ısticas distintivas de cada fonema, permitiendo nt e mi mejorar los resultados. Se considera que el hecho de lograr una representaci´on robusta ci no ante el ruido es de fundamental importancia para facilitar la tarea de reconocimiento. o c el re Existen diferentes t´ecnicas de procesamiento como el ana´lisis espectral por bandas, los mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para mflddapadarpneeaaas´ealr´rctiupaa´clcaoionnrassdrEoniaceoslcsiddlapso´ieoisosronsctedabicpeesodemlnmjeraneeonsipteagecteaisrenaveslednsgrotddeooeoeelnirdracuraidlsecetaetleimlcibs´oeploeeinoslozannsa˜trsarpaoaaladsaielctneeotvociesnmee˜iorlopsaaildicoiulalesdea.trnyedsiaevtvoesocooegadzsleevar.elnoapuaSzescdnate,retoera´ane˜asmdplrraia´eaısoa´lrlsireoprttsmtsosiiteccliccaaoplmedoonsapneiedtzdsyrrelatraeaolrulranaiuhhqedlet.naiulsopabevSro´amyleeiatpcnaie´e.sdtestoodreDieonsrmnmeditdcddoicbihteefielaaaopcqrcesaagamsiumrfirocre,aeaac´,ejmacstcooeoatucrspa´eidaato´urstona´rnıitsmsstitecollroiiipotedczs´mensaaaacurssrrdenailejstuidolsftcaatuuraearielsl´asestirezetaqanmhaaadudpada´oleenaoaess-l d Comos e sencilla. ms angorit11. En los u´ltimos an˜os se han realizado nuevos avances en el desarrollo de t´ecnicas nals, Systemediante alal, may, 20 dlaeienxtrtoradcucci´ocino´ndedecamraocdtiefir´cısatciicoansesroebnuslatafsoraml arudideoc.aMlcuulcahroslosdecoeesfitocsiensetehsacnepbsatrsaaldeos eenn sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor ebpdsesaaecn˜srafaaaolldaneePasledocmebre´anaalcmosscua,toerdloeoloa.fibsdctEleaeieenndnlnoiotdeso,esonmstrdapeciicseattmipareeasssnot.itsscrEe.aamsDldseetaeisocnp,hptsmraeoeoespbdihdobu´eainlabsneqeneustccaeoeooldlbuqnaautrciaoieeno´dpsunsotdua.iimrsrimicilgzaapiadrocbaaircu´´otptsnaeoqnrrdu´ıcseeeitalldirbcaelaaassdnsuecllartouaesdpndheraoaefidcsrleeeetnnprctorlua´easctssuiieiolfitnenicstleaaizpsccaaiio´´oddrnnoae ix el ana´lisis de sen˜ales no estacionarias. Con el procesamiento basado en la descomposi- ci´oncompletadelatransformadapaquetedeonditasseobtieneunconjuntoredundante de coeficientes que representan una sen˜al. Si bien estos coeficientes resultan u´tiles para la clasificacio´n, la gran cantidad de los mismos dificulta la tarea del clasificador. A este problema, que surge cuando se trata con espacios de caracter´ısticas de grandes dimensiones, se lo conoce como maldicio´n de la dimensionalidad: la cantidad de datos necesarios para el entrenamiento crece exponencialmente con la cantidad de dimensio- nes. Es por esto que resulta conveniente encontrar un subconjunto de coeficientes que permita,de la mejor manera posible,identificar las distintas clases que´estas presentan. Para encontrar una representaci´on ma´s apropiada para la clasificacio´n de fonemas se propone, al igual que en el caso anterior, la utilizacio´n de un algoritmo evolutivo. Los resultados obtenidos en la clasificacio´n de distintos conjuntos de fonemas a" abl muestran que ambos m´etodos desarrollados cumplen el objetivo de encontrar una re- h del presentaci´on que permite mejorar el desempen˜o respecto a las parametrizaciones tra- o c áti dicionales. Adem´as, en las pruebas realizadas se consideraron sen˜ales con distintas m uto cantidades de ruido, permitiendo comprobar la robustez de las representaciones opti- a nto mizadas. e mi ci o n o c e el r mputational Intelligence (fich.unl.edu.ar/sinc)volutivos de la representación de señales para d Comos e ms angorit11. nals, Systemediante alal, may, 20 sinc(i) Research Center for SigL. D. Vignolo; "Optimización Universidad Nacional del Litor x
Description: