Modelos de computaci(cid:243)n l(cid:243)gica con ADN Autor: Iæaki Sainz de Murieta Fuentes Tutor: Alfonso Rodr(cid:237)guez-Pat(cid:243)n Aradas Universidad PolitØcnica de Madrid - Facultad de InformÆtica Tesis presentada para la obtenci(cid:243)n del t(cid:237)tulo de MÆster de Investigaci(cid:243)n en Inteligencia Arti(cid:28)cial Septiembre 2011 ii iii Resumen La computaci(cid:243)n molecular es una disciplina que se ocupa del diseæo e im- plementaci(cid:243)n de dispositivos para el procesamiento de informaci(cid:243)n sobre un sustrato biol(cid:243)gico, como el Æcido desoxirribonucleico (ADN), el Æcido ribo- nucleico (ARN) o las prote(cid:237)nas. Desde que Watson y Crick descubrieron en los aæos cincuenta la estructura molecular del ADN en forma de doble hØli- ce, se desencadenaron otros descubrimientos como las enzimas que cortan el ADN o la reacci(cid:243)n en cadena de la polimerasa (PCR), contribuyendo mÆs quesigni(cid:28)cativamentealairrupci(cid:243)ndelatecnolog(cid:237)a del ADN recombinante. Gracias a esta tecnolog(cid:237)a y al descenso vertiginoso de los precios de secuen- ciaci(cid:243)n y s(cid:237)ntesis del ADN, la computaci(cid:243)n biomolecular pudo abandonar su concepci(cid:243)n puramente te(cid:243)rica. En 1994, Leonard Adleman logr(cid:243) resol- ver un problema de computaci(cid:243)n NP-completo (El Problema del Camino de Hamilton Dirigido) utilizando œnicamente molØculas de ADN. La gran capacidad de procesamiento en paralelo ofrecida por las tØcnicas del ADN recombinante permiti(cid:243) a Adleman ser capaz de resolver dicho problema en tiempopolin(cid:243)mico,aunqueacostadeunconsumoexponencialdemolØculas de ADN. Utilizando algoritmos similares al de (cid:16)fuerza bruta(cid:17) utilizado por Adleman se logr(cid:243) resolver otros problemas NP-completos (por ejemplo, el de Satisfacibilidad de F(cid:243)rmulas L(cid:243)gicas / SAT). Pronto se comprendi(cid:243) que la computaci(cid:243)n con biomolecular no pod(cid:237)a com- petir en velocidad ni precisi(cid:243)n con los ordenadores de silicio, por lo que su enfoque y objetivos se centraron en la resoluci(cid:243)n de problemas biol(cid:243)gicos con aplicaci(cid:243)n biomØdica, dejando de lado la resoluci(cid:243)n de problemas clÆ- sicos de computaci(cid:243)n. Desde entonces se han propuesto diversos modelos de dispositivos biomoleculares que, de forma aut(cid:243)noma (sin necesidad de un bio-ingenierorealizandooperacionesdelaboratorio),soncapacesdeprocesar comoentradaunsustratobiol(cid:243)gicoyproporcionarunasalidatambiØnenfor- mato biol(cid:243)gico: procesadores que aprovechan la extensi(cid:243)n de la Polimerasa, aut(cid:243)matas que funcionan con enzimas de restricci(cid:243)n o con deoxiribozimas, circuitos de hibridaci(cid:243)n competitiva. Esta tesis presenta un conjunto de modelos de dispositivos de Æcidos nu- cleicos escalables, sensibles al tiempo y energØticamente e(cid:28)cientes, capaces de implementar diversas operaciones de computaci(cid:243)n l(cid:243)gica aprovechando el fen(cid:243)meno de la hibridaci(cid:243)n competitiva del ADN. La capacidad impl(cid:237)cita de estos dispositivos para aplicar reglas de inferencia como modus ponens, modus tollens, resoluci(cid:243)n o el silogismo hipotØtico tiene un gran potencial. Entre otras funciones, permiten representar implicaciones l(cid:243)gicas (o reglas del tipo SI/ENTONCES), como por ejemplo, (cid:16)si se da el s(cid:237)ntoma 1 y el s(cid:237)ntoma 2, entonces estamos ante la enfermedad A(cid:17), o (cid:16)si estamos ante la enfermedad B, entonces deben manifestarse los s(cid:237)ntomas 2 y 3(cid:17). Utilizan- do estos m(cid:243)dulos l(cid:243)gicos como bloques bÆsicos de construcci(cid:243)n, se pretende desarrollar sistemas in vitro basados en sensores de ADN, capaces de traba- jar de manera conjunta para detectar un conjunto de s(cid:237)ntomas de entrada y producir una diagn(cid:243)stico de salida. La reciente publicaci(cid:243)n en la revista Science de un aut(cid:243)mata biomolecular de diagn(cid:243)stico, capaz de tratar las cØlulas cancer(cid:237)genas sin afectar a las cØlulas sanas, es un buen ejemplo de la relevancia cient(cid:237)(cid:28)ca que este tipo de aut(cid:243)matas tienen en la actualidad. AdemÆs de las reciØn mencionadas aplicaciones en el diagn(cid:243)stico in vitro, los modelos presentados tambiØn tienen utilidad en el diseæo de biosensores inteligentes y la construcci(cid:243)n de bases de datos con registros en formato biomolecular que faciliten el anÆlisis gen(cid:243)mico. Elestudiosobreelestadodelacuesti(cid:243)nencomputaci(cid:243)nbiomolecularquese presenta en esta tesis estÆ basado en un art(cid:237)culo recientemente publicado en la revista Current Bioinformatics. Los nuevos dispositivos presentados en la tesis forman parte de una solicitud de patente de la que la UPM es titular, y han sido presentados en congresos internacionales como Unconventional Computation 2010 en Tokio o Synthetic Biology 2010 en Par(cid:237)s. vi Dedicatoria A mi novia Mar(cid:237)a Noel, por su paciencia con mis estudios, por estar siempre a mi lado y hacer de este (cid:16)friki(cid:17) un ser mÆs sensible y humano. A mi familia, por apoyarme en todos los desaf(cid:237)os que me he planteado en la vida. Gracias a ellos siempre serÆ posible una pr(cid:243)xima dedicatoria. A Alfonso, por su tiempo, su apoyo, su gu(cid:237)a y su consejo. Y por ser capaz de contagiarme su pasi(cid:243)n por la ciencia. ii ˝ndice general ˝ndice de Figuras v 1. Introducci(cid:243)n 1 1.1. Computaci(cid:243)n biomolecular y la tecnolog(cid:237)a del ADN recombinante . . . . 1 1.2. El ADN y sus operaciones bÆsicas . . . . . . . . . . . . . . . . . . . . . . 4 1.3. Organizaci(cid:243)n de la memoria . . . . . . . . . . . . . . . . . . . . . . . . . 10 2. Computaci(cid:243)n biomolecular 13 2.1. El algoritmo de Adleman. . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.1.1. De(cid:28)nici(cid:243)n del problema . . . . . . . . . . . . . . . . . . . . . . . 13 2.1.2. Codi(cid:28)caci(cid:243)n y funcionamiento . . . . . . . . . . . . . . . . . . . . 13 2.1.3. Descripci(cid:243)n del algoritmo . . . . . . . . . . . . . . . . . . . . . . 14 2.2. Computaci(cid:243)n aut(cid:243)noma: Whiplash PCR . . . . . . . . . . . . . . . . . . 15 2.3. Autoensamblado del ADN . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.1. Baldosas de Wang . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.2. Bloques de ADN . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.3. ADN como elemento de andamiaje: Origami . . . . . . . . . . . . 18 2.4. Aut(cid:243)matas de ADN basados en enzimas de restricci(cid:243)n: el aut(cid:243)mata de Benenson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.5. Aut(cid:243)matas basados en deoxiribozimas . . . . . . . . . . . . . . . . . . . 20 2.5.1. Puertas l(cid:243)gicas y aut(cid:243)matas . . . . . . . . . . . . . . . . . . . . . 21 2.5.2. Motores moleculares . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.6. Hibridaci(cid:243)n competitiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.7. Computaci(cid:243)n l(cid:243)gica con ADN . . . . . . . . . . . . . . . . . . . . . . . . 27 2.7.1. Introducci(cid:243)n a la l(cid:243)gica proposicional . . . . . . . . . . . . . . . . 27 iii ˝NDICE GENERAL 2.7.2. Inferencia con molØculas de ADN . . . . . . . . . . . . . . . . . . 29 2.8. Computaci(cid:243)n con ARN. . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3. Planteamiento del problema 33 4. Dispositivos de computaci(cid:243)n l(cid:243)gica con ADN 35 4.1. Conceptos bÆsicos de l(cid:243)gica proposicional . . . . . . . . . . . . . . . . . 35 4.2. De la l(cid:243)gica proposicional a dispositivos de ADN . . . . . . . . . . . . . 37 4.3. Codi(cid:28)caci(cid:243)n de las proposiciones . . . . . . . . . . . . . . . . . . . . . . 38 4.4. Dispositivo 1: inferencia con hibridaci(cid:243)n competitiva en un paso . . . . . 39 4.4.1. Funcionamiento bÆsico . . . . . . . . . . . . . . . . . . . . . . . . 40 4.4.2. Funcionamiento iterativo . . . . . . . . . . . . . . . . . . . . . . . 41 4.4.3. Funcionamiento recursivo . . . . . . . . . . . . . . . . . . . . . . 41 4.5. Dispositivo 2: inferencia con hibridaci(cid:243)n competitiva en dos pasos . . . . 44 4.5.1. Funcionamiento bÆsico . . . . . . . . . . . . . . . . . . . . . . . . 45 4.5.2. Funcionamiento iterativo . . . . . . . . . . . . . . . . . . . . . . . 46 4.5.3. Funcionamiento recursivo . . . . . . . . . . . . . . . . . . . . . . 47 4.6. Dispositivo 3: representaci(cid:243)n de clÆusulas l(cid:243)gicas . . . . . . . . . . . . . 49 4.6.1. Resoluci(cid:243)n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 4.6.2. Evaluaci(cid:243)n de f(cid:243)rmulas. . . . . . . . . . . . . . . . . . . . . . . . 51 4.7. Caso de estudio: diagn(cid:243)stico in vitro . . . . . . . . . . . . . . . . . . . . 53 5. AnÆlisis de los resultados 55 5.1. Inferencia con el dispositivo 1 . . . . . . . . . . . . . . . . . . . . . . . . 57 5.2. Inferencia con el dispositivo 2 . . . . . . . . . . . . . . . . . . . . . . . . 58 5.3. Inferencia con el dispositivo 3 . . . . . . . . . . . . . . . . . . . . . . . . 58 6. Conclusiones y futuras l(cid:237)neas de investigaci(cid:243)n 61 Bibliograf(cid:237)a 65 iv
Description: