MONOGRAFÍA “TECNOLOGÍAS BIOINFORMÁTICAS PARA EL ANÁLISIS DE SECUENCIAS DE ADN”. LIZETH VANESSA ROZO MURILLO JHENIFER FRANCO SOTO UNIVERSIDAD TECNOLOGICA DE PEREIRA FACULTAD DE INGENIERÍAS PROGRAMA DE INGENIERÍA DE SISTEMAS Y COMPUTACIÓN PEREIRA 2011 MONOGRAFÍA “TECNOLOGÍAS BIOINFORMÁTICAS PARA EL ANÁLISIS DE SECUENCIAS DE ADN”. LIZETH VANESSA ROZO MURILLO JHENIFER FRANCO SOTO Monografía Asesor: Cesar Augusto Meneses Escobar Ingeniero de Sistemas y Computación UNIVERSIDAD TECNOLOGICA DE PEREIRA FACULTAD DE INGENIERÍAS PROGRAMA DE INGENIERÍA DE SISTEMAS Y COMPUTACIÓN PEREIRA 2011 DEDICATORIA Dedicado a todos los Ingenieros de Sistemas y Biólogos que deseen compartir entre ellos conocimientos y unirse para apoyar la investigación Bioinformática, y por supuesto también a nuestros seres amados. AGRADECIMIENTOS Aprovechamos este espacio para testimoniar y reiterar nuestro sincero agradecimiento y gratitud, primeramente a Dios por darnos la inteligencia y la capacidad para concluir esta etapa de nuestras vidas, y a todas las personas que contribuyeron al desarrollo de este proyecto. A nuestros padres, Elías Rozo Salinas y Nubia Murillo López, y Deiber Franco Villada y Liliana Soto Uribe, por su apoyo fiel y su paciencia. ¡Nuestro triunfo es el de ustedes! A nuestros compañeros sentimentales Mauro Mazuela y Diego Fernando Acevedo Rendón, por acompañarnos durante este proceso de formación con su cariño, sus consejos y su ayuda incondicional. A nuestras familias, especialmente a Cristhian Elías Rozo Murillo, Laura Susana Rozo Murillo, Nancy Soto Uribe y Edelmira Uribe Aguirre, por tendernos la mano cuando más lo necesitamos; y así mismo a Marleny Marín, porque sin su apoyo este hubiese sido un camino mucho más fatigoso de recorrer. A nuestro asesor de proyecto, el Ingeniero Carlos Augusto Meneses Escobar y a la Ingeniera Ligia Stella Bustos Ríos por compartir sus conocimientos con nosotras y contribuir al buen desarrollo de este documento. Y finalmente, a todos nuestros compañeros de carrera con quienes compartimos los mejores y los más difíciles momentos de este proceso de crecimiento intelectual y personal. CONTENIDO pág. 1. TÍTULO DEL PROYECTO 8 2. INTRODUCCION 9 3. DEFINICIÓN DEL PROBLEMA 10 4. JUSTIFICACIÓN 11 5. OBJETIVOS 12 5.1 OBJETIVO GENERAL 12 5.2 OBJETIVOS ESPECÍFICOS 12 6. CAPITULO 1. MARCO CONCEPTUAL 13 6.1 ¿QUÉ ES LA BIOINFORMATICA? 13 6.2. OBJETIVOS DE LA BIOINFORMÁTICA 13 6.3 ANÁLISIS DE SECUENCIAS DE ADN 14 6.3.1 Alineación de secuencias de ADN 14 6.4 ALGORITMOS GENÉTICOS 15 6.5 EXPRESIÓN GÉNICA 16 6.6 ANOTACIÓN DEL GENOMA 17 7. CAPITULO 2. ESTADO DEL ARTE 19 7.1 ESTADO DEL ARTE DE LA BIOINFORMÁTICA 19 7.1.1 Reseña histórica de la Bioinformática 19 7.1.2 Alcance de la Bioinformática 20 2 7.1.3 ¿Cómo se puede aplicar la Bioinformática? 21 7.1.4 Nuevo Temas en la Bioinformática 24 7.1.5 Bioinformática en Colombia 24 7.2 GENERALIDADES DEL ALINEAMIENTO DE SECUENCIAS 27 7.2.1 Base evolutiva del Alineamiento de Secuencias 27 7.2.2 Montaje y alineación de secuencias Biológicas 28 7.3 TECNOLOGÍAS COMPUTACIONALES APLICADAS A LA BIOINFORMÁTICA 31 7.3.1 Bases de Datos 31 7.3.2 Bodegas de Datos 46 7.3.3 Minería de Datos 55 7.3.4 Máquinas de aprendizaje en Bioinformática 68 7.3.5 Soft computing 83 7.3.6 MATLAB para Bioinformática 87 7.3.7 Microarrays 91 7.3.8 Biotecnología de Sistemas 97 8. CAPITULO 3. ANÁLISIS DE LAS TECNOLOGÍAS BIOINFORMÁTICAS UTILIZADAS PARA EL ANÁLISIS DE SECUENCIAS DE ADN 99 8.1 BASES DE DATOS 99 8.2 BODEGAS DE DATOS 100 8.3 MINERÍA DE DATOS 100 8.3.1 Minería de texto 101 8.4 MÁQUINAS DE APRENDIZAJE 101 8.5 SOFT COMPUTING 102 8.6 MICROARRAYS 102 9. DISEÑO METODOLÓGICO 104 9.1 HIPÓTESIS 104 9.2 POBLACIÓN 104 9.3 MUESTRA 104 9.4 VARIABLES 104 9.5 INSTRUMENTOS 104 10. CONCLUSIONES 107 11. REFERENCIAS BIBLIOGRÁFICAS 108 LISTA DE TABLAS pág. Tabla 1. Principales Bases de Datos Biológicas disponibles a través de la World Wide Web 33 Tabla 2. Investigaciones existentes sobre bioinformática que han aplicado técnicas de Máquinas de Aprendizaje 71 Tabla 3. Bases de datos de secuencias 98 LISTA DE FIGURAS pág. Figura 1. Crecimiento de los datos en GenBank 22 Figura 2. Formato NCBI GenBank/GenPept que muestra los principales componentes de un árbol de un archivo de secuencia 38 Figura 3. Proceso en Bodegas de Datos 52 1. TITULO Monografía “Tecnologías Bioinformáticas para el Análisis de Secuencias de ADN”. 8
Description: