ebook img

Algoritmos de compresión para secuencias biológicas y su aplicación en árboles filogénicos PDF

116 Pages·2006·2.18 MB·Spanish
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Algoritmos de compresión para secuencias biológicas y su aplicación en árboles filogénicos

Proyecto Fin de Carrera de Ingenier(cid:237)a en InformÆtica Algoritmos de compresi(cid:243)n para secuencias biol(cid:243)gicas y su aplicaci(cid:243)n en Ærboles (cid:28)logØnicos construidos a partir de ADN mitocondrial Pablo Urcola Irache Directora: Elvira Mayordomo CÆmara Departamento de InformÆtica e Ingenier(cid:237)a de Sistemas Centro PolitØcnico Superior Noviembre 2006 Comprimir es comprender Jorge Wagensberg Agradezco a todo el mundo que me ha ayudado o me ha ofrecido su ayuda en algœn momento de la realizaci(cid:243)n de este proyecto su interØs y disposici(cid:243)n. Como œltimo favor les pido que me dejen dedicar este trabajo a mi abuelo. ˝ndice general I Memoria 9 1. Introducci(cid:243)n 11 1.1. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2. Alcance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3. Trabajo previo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.4. Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5. MØtodos, tØcnicas y herramientas . . . . . . . . . . . . . . . . . . . 13 1.6. Contenido de la memoria . . . . . . . . . . . . . . . . . . . . . . . . 13 2. Conceptos previos 15 2.1. Secuencias biol(cid:243)gicas . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.1.1. Formaci(cid:243)n de prote(cid:237)nas . . . . . . . . . . . . . . . . . . . . . 16 2.1.2. Estructura del ADN . . . . . . . . . . . . . . . . . . . . . . 16 2.2. `rboles de (cid:28)logenia . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3. Desarrollo del estudio 19 3.1. Adaptaci(cid:243)n del algoritmo de Lempel-Ziv . . . . . . . . . . . . . . . 19 3.1.1. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.2. AnÆlisis de los algoritmos de compresi(cid:243)n espec(cid:237)(cid:28)cos . . . . . . . . . 20 3.2.1. GenCompress . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.2.2. Pattern Hunter . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2.3. Pattern Hunter II . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2.4. dnaX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 4. Implementaci(cid:243)n del compresor 25 4.1. Especi(cid:28)caci(cid:243)n del algoritmo . . . . . . . . . . . . . . . . . . . . . . 25 4.2. Directivas de diseæo . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.2.1. Sobre los datos . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.2.2. Sobre el uso del algoritmo . . . . . . . . . . . . . . . . . . . 26 4.3. Estructura del algoritmo . . . . . . . . . . . . . . . . . . . . . . . . 26 4.3.1. AnÆlisis de la entrada . . . . . . . . . . . . . . . . . . . . . . 27 1 2 ˝NDICE GENERAL 4.3.2. Selecci(cid:243)n de las repeticiones . . . . . . . . . . . . . . . . . . 28 4.3.3. Codi(cid:28)caci(cid:243)n de la salida . . . . . . . . . . . . . . . . . . . . 29 4.4. Consideraciones generales . . . . . . . . . . . . . . . . . . . . . . . 31 4.5. Interfaz grÆ(cid:28)ca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 5. `rboles (cid:28)logØnicos 35 5.1. CÆlculo de la distancia entre dos secuencias . . . . . . . . . . . . . . 35 5.2. Caracter(cid:237)sticas del compresor . . . . . . . . . . . . . . . . . . . . . 36 5.3. MØtodos de cÆlculo . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 5.4. Herramientas utilizadas . . . . . . . . . . . . . . . . . . . . . . . . . 37 6. Resultados 39 6.1. Resultados del compresor . . . . . . . . . . . . . . . . . . . . . . . . 39 6.1.1. Banco de pruebas . . . . . . . . . . . . . . . . . . . . . . . . 39 6.1.2. AnÆlisis de los resultados . . . . . . . . . . . . . . . . . . . . 40 6.2. Resultados de los Ærboles de (cid:28)logenia . . . . . . . . . . . . . . . . . 43 6.2.1. Correcci(cid:243)n de las pruebas . . . . . . . . . . . . . . . . . . . 44 6.2.2. Ficheros de prueba . . . . . . . . . . . . . . . . . . . . . . . 44 6.2.3. Algoritmos y mØtodos utilizados . . . . . . . . . . . . . . . . 45 6.2.4. Resultados obtenidos . . . . . . . . . . . . . . . . . . . . . . 45 7. Conclusiones 49 7.1. Conclusiones sobre el compresor . . . . . . . . . . . . . . . . . . . . 49 7.2. Conclusiones sobre los Ærboles de (cid:28)logenia . . . . . . . . . . . . . . 50 7.3. Conclusiones personales . . . . . . . . . . . . . . . . . . . . . . . . 51 Bibliograf(cid:237)a 53 II ApØndices 55 A. C(cid:243)digo fuente de la implementaci(cid:243)n 57 A.1. Notas de la distribuci(cid:243)n . . . . . . . . . . . . . . . . . . . . . . . . 57 A.2. ADN (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 A.3. ADN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 A.4. Entrada-Salida de Bits (Cabecera) . . . . . . . . . . . . . . . . . . . 60 A.5. Entrada-Salida de Bits . . . . . . . . . . . . . . . . . . . . . . . . . 63 A.6. `rboles Rojinegros (Cabecera) . . . . . . . . . . . . . . . . . . . . . 67 A.7. `rboles Rojinegros . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 A.8. Cola de prioridades (Cabecera) . . . . . . . . . . . . . . . . . . . . 71 A.9. Cola de prioridades . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 A.10.`rbol de rangos (Cabecera) . . . . . . . . . . . . . . . . . . . . . . 73 ˝NDICE GENERAL 3 A.11.`rbol de rangos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 A.12.Referencias (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . . 77 A.13.Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 A.14.Aut(cid:243)mata (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . . . 80 A.15.Aut(cid:243)mata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 A.16.Codi(cid:28)cador (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . . 84 A.17.Codi(cid:28)cador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 A.18.Decodi(cid:28)cador (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . 88 A.19.Decodi(cid:28)cador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 A.20.Compresor (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . . 90 A.21.Compresor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 A.22.Descompresor (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . 96 A.23.Descompresor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 A.24.Excepciones (Cabecera) . . . . . . . . . . . . . . . . . . . . . . . . 98 A.25.Excepciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 A.26.Ventana de estad(cid:237)sticas (Cabecera) . . . . . . . . . . . . . . . . . . 99 A.27.Ventana de estad(cid:237)sticas . . . . . . . . . . . . . . . . . . . . . . . . . 99 A.28.Ventana principal (Cabecera) . . . . . . . . . . . . . . . . . . . . . 100 A.29.Ventana principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 A.30.Programa principal . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 A.31.Make(cid:28)le . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 4 ˝NDICE GENERAL

Description:
no debería hacer distinciones entre las distintas subcadenas de ADN. 2.2. Árboles de que el propio compresor elija en su ejecución el óptimo.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.