ebook img

Desarrollo de algoritmos evolutivospara el descubrimiento de relacionesen datos metabólicos PDF

148 Pages·2014·4.98 MB·Spanish
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Desarrollo de algoritmos evolutivospara el descubrimiento de relacionesen datos metabólicos

UNIVERSIDAD NACIONAL DEL LITORAL Desarrollo de algoritmos evolutivos para el descubrimiento de relaciones en datos metabólicos Matias Fernando Gerard FICH FACULTAD DE INGENIERIA Y CIENCIAS HIDRICAS INTEC INSTITUTO DE DESARROLLO TECNOLOGICO PARA LA INDUSTRIA QUIMICA Tesis de Doctorado 2014 UNIVERSIDAD NACIONAL DEL LITORAL Facultad de Ingeniería y Ciencias Hídricas Instituto de Desarrollo Tecnológico para la Industria Química Desarrollo de algoritmos evolutivos para el descubrimiento de relaciones en datos metabólicos Matias Fernando Gerard Tesis remitida al Comité Académico del Doctorado como parte de los requisitos para la obtención del grado de DOCTOR EN INGENIERIA Mención Inteligencia Computacional, Señales y Sistemas de la UNIVERSIDAD NACIONAL DEL LITORAL 2014 Comisión de Posgrado, Facultad de Ingeniería y Ciencias Hídricas, Ciudad Universitaria, Paraje .El Pozo", S3000, Santa Fe, Argentina. A mi esposa e hijas, los soles que iluminan mis días. Agradecimientos Mientras escribo estas líneas, no dejo de recordar a toda la gente que he conocido durante esta etapa. Con muchos de ellos aún continúo trabajando, pero todos han contribuido para que hoy sea la persona que soy. Quiero expresar mi agradecimiento a mi director, Dr. Diego Milone, por compartir conmigo su experiencia y permitirme enriquecer esta tesis con sus puntos de vista. De igual manera, quiero agradecer a mi co-directora Dra. Georgina Stegmayer, por abrirme las puertas al mundo de la investigación y guiarme a lo largo de todo el trabajo con suma dedicación. A ambos, por la oportunidad de trabajar en el sınc(i) y el CIDISI, por las numerosas discu- siones sobre la tesis, y por confiar en mi para llevar adelante este trabajo. Quiero agradecer a todos mis compañeros del sınc(i) y del CIDISI, con quieneshecompartidolindosmomentosdentroyfueradeltrabajo,porcrear un espacio de trabajo ideal. Particularmente quiero agradecer a Leandro Di Persia, por su compañerismo y predisposición para atender cualquier inquie- tud que tuviera. A Leandro Vignolo, por compartir su experiencia y estar dispuesto siempre a brindarme su ayuda. Quiero agradecer a Federico y Car- los, quienes me acompañaron en gran parte de esta tesis, por su amistad y por los gratos momentos compartidos. También les quiero agradecer a Ma- riano, Jorge, Ivanna, Milton, David, Guillermo, Leonardo, César, Marcelo, Guido, Diego, Iván, José, Román, Tomás, Sebastián y Mariela, por su com- pañerismo y amistad. Al Dr. Leonardo Giovanini, con quien he compartido largas charlas, por sus consejos y opinión. A la Dra. María Eugenia Torres, por estar siempre dispuesta a ayudar con sus consejos y sugerencias. Especialmente quiero agradecer a mi esposa, Luisa, por estar siempre a miladoduranteeltranscursodeestaetapa,apoyándomeyalentándomepara seguir adelante en los momentos difíciles. Su apoyo incondicional hizo posi- ble mi dedicación a esta carrera. También agradezco a Antonella y Olivia, que con su ternura y simpatía me han dado fuerzas para seguir adelante. No puedo dejar de agradecer a mis padres, Graciela y Carlos, por su ejemplo, su comprensión y por la ayuda que me han brindado siempre. A mis herma- nos, Hernán y Andrés, quienes siempre me han brindado su apoyo. También agradezco a mi suegra, Adriana, quién también me ha aconsejado y apoyado vii viii Agradecimientos siempre. Finalmente, quisiera extender mi agradecimiento a las siguientes institucio- nes: sınc(i): Centro de Investigación en Señales, Sistemas e Inteligencia Computacional. CIDISI:CentrodeInvestigaciónyDesarrollodeIngenieríaenSistemas de Información. Facultad de Ingeniería y Ciencias Hídricas, Universidad Nacional del Litoral. Facultad Regional Santa Fe, Universidad Tecnológica Nacional. CONICET:ConsejoNacionaldeInvestigacionesCientíficasyTécnicas. Laboratorio de Cibernética (Facultad de Ingeniería, Universidad Na- cional de Entre Ríos). A todos y cada uno de ustedes, mi más sincero agradecimiento, Matias Fernando Gerard Santa Fe, Noviembre de 2013 Resumen En los últimos años, el creciente volumen de datos producidos en experi- mentos biológicos ha llevado a la necesidad de desarrollar nuevas herramien- tas computacionales que sean capaces de manipular y analizar esta informa- ción para extraer conocimiento. En particular, cuando los datos analizados corresponden a compuestos biológicos se sabe que las relaciones entre ellos están determinadas por reacciones bioquímicas y por la interacción que se establece entre las mismas. Estas interacciones son sumamente importantes porque permiten transformar un compuesto particular en otro totalmente diferente mediante secuencias de reacciones que conforman vías metabólicas. Por lo tanto, conocer estas secuencias es esencial para planificar la produc- cióndeuncompuesto,oparaidentificarsiesposiblesintetizaruncompuesto de interés a partir de otro especificado. En esta tesis se propone el desarrollo de dos nuevos algoritmos, basados en la computación evolutiva, que permitan encontrar vías metabólicas que relacionen un conjunto de compuestos. En particular se abordan los proble- mas de búsqueda de caminos lineales y ramificados. Para ambos algoritmos se propone codificar las vías metabólicas en los cromosomas como secuencias de reacciones, donde cada gen es una reacción y la posición en el cromosoma determina el orden en que cada reacción se lleva a cabo. Además, se propo- ne el uso de operadores de variación modificados que utilizan información del cromosoma para mejorar el desempeño de la búsqueda. También se defi- ne una función de aptitud que contempla propiedades características de las cadenas de reacciones, y una nueva estrategia de inicialización para gene- rar cromosomas de tamaño variable que codifiquen secuencias ordenadas de reacciones. Los resultados obtenidos con el algoritmo para la búsqueda de vías me- tabólicas lineales muestran que la nueva estrategia de inicialización mejora significativamente la calidad de los individuos. Ésto combinado con operado- res de cruza y mutación modificados reduce en forma considerable el número degeneracionesrequeridoparaencontrarunasolución.Eldesempeñodeeste ix x Resumen algoritmo fue comparable al del algoritmo clásico de búsqueda en amplitud, empleando tiempos similares de búsqueda. Además, las soluciones encontra- das con el algoritmo propuesto incluyeron a los caminos más cortos y a otros de mayor tamaño, que relacionan los compuestos empleando mecanismos al- ternativos para la síntesis. Una vía metabólica no reportada previamente en la literatura para Arabidopsis thaliana fue encontrada en pruebas realizadas sobre problemas de interés práctico. Esta vía permite relacionar dos com- puestos para los cuales no se conoce hasta el momento un mecanismo para la síntesis de uno de ellos a partir del otro. Los resultados obtenidos para el algoritmo para búsqueda de vías ra- mificadas también muestran una reducción en el número de generaciones requeridas para encontrar una vía metabólica al emplear los operadores mo- dificados y la estrategia de inicialización propuesta. Particularmente, la po- sibilidad de emplear tamaños variables en la inicialización permite evitar el problema de definir el número adecuado de genes para la búsqueda. El algo- ritmo fue capaz de encontrar una amplia variedad de soluciones, con distinto tipo de interconexiones entre las reacciones, en pruebas realizadas emplean- do conjuntos de reacciones de diferente tamaño. Para validar el algoritmo se realizaron pruebas donde se buscó reproducir dos vías metabólicas de refe- rencia. Las búsquedas realizadas permitieron reproducir estas vías en forma total o parcial, generando en este último caso mecanismos alternativos para relacionar los compuestos. En todos los casos, las soluciones encontradas son completamente válidas como vías metabólicas.

Description:
Se basan en la .. gunos AE basan su funcionamiento en este operador y la probabilidades de One-carbon Metabolism in Arabidopsis thaliana.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.