Table Of ContentModelos de computaci(cid:243)n l(cid:243)gica con
ADN
Autor: Iæaki Sainz de Murieta Fuentes
Tutor: Alfonso Rodr(cid:237)guez-Pat(cid:243)n Aradas
Universidad PolitØcnica de Madrid - Facultad de InformÆtica
Tesis presentada para la obtenci(cid:243)n del t(cid:237)tulo de
MÆster de Investigaci(cid:243)n en Inteligencia Arti(cid:28)cial
Septiembre 2011
ii
iii
Resumen
La computaci(cid:243)n molecular es una disciplina que se ocupa del diseæo e im-
plementaci(cid:243)n de dispositivos para el procesamiento de informaci(cid:243)n sobre un
sustrato biol(cid:243)gico, como el Æcido desoxirribonucleico (ADN), el Æcido ribo-
nucleico (ARN) o las prote(cid:237)nas. Desde que Watson y Crick descubrieron en
los aæos cincuenta la estructura molecular del ADN en forma de doble hØli-
ce, se desencadenaron otros descubrimientos como las enzimas que cortan el
ADN o la reacci(cid:243)n en cadena de la polimerasa (PCR), contribuyendo mÆs
quesigni(cid:28)cativamentealairrupci(cid:243)ndelatecnolog(cid:237)a del ADN recombinante.
Gracias a esta tecnolog(cid:237)a y al descenso vertiginoso de los precios de secuen-
ciaci(cid:243)n y s(cid:237)ntesis del ADN, la computaci(cid:243)n biomolecular pudo abandonar
su concepci(cid:243)n puramente te(cid:243)rica. En 1994, Leonard Adleman logr(cid:243) resol-
ver un problema de computaci(cid:243)n NP-completo (El Problema del Camino
de Hamilton Dirigido) utilizando œnicamente molØculas de ADN. La gran
capacidad de procesamiento en paralelo ofrecida por las tØcnicas del ADN
recombinante permiti(cid:243) a Adleman ser capaz de resolver dicho problema en
tiempopolin(cid:243)mico,aunqueacostadeunconsumoexponencialdemolØculas
de ADN. Utilizando algoritmos similares al de (cid:16)fuerza bruta(cid:17) utilizado por
Adleman se logr(cid:243) resolver otros problemas NP-completos (por ejemplo, el
de Satisfacibilidad de F(cid:243)rmulas L(cid:243)gicas / SAT).
Pronto se comprendi(cid:243) que la computaci(cid:243)n con biomolecular no pod(cid:237)a com-
petir en velocidad ni precisi(cid:243)n con los ordenadores de silicio, por lo que su
enfoque y objetivos se centraron en la resoluci(cid:243)n de problemas biol(cid:243)gicos
con aplicaci(cid:243)n biomØdica, dejando de lado la resoluci(cid:243)n de problemas clÆ-
sicos de computaci(cid:243)n. Desde entonces se han propuesto diversos modelos
de dispositivos biomoleculares que, de forma aut(cid:243)noma (sin necesidad de un
bio-ingenierorealizandooperacionesdelaboratorio),soncapacesdeprocesar
comoentradaunsustratobiol(cid:243)gicoyproporcionarunasalidatambiØnenfor-
mato biol(cid:243)gico: procesadores que aprovechan la extensi(cid:243)n de la Polimerasa,
aut(cid:243)matas que funcionan con enzimas de restricci(cid:243)n o con deoxiribozimas,
circuitos de hibridaci(cid:243)n competitiva.
Esta tesis presenta un conjunto de modelos de dispositivos de Æcidos nu-
cleicos escalables, sensibles al tiempo y energØticamente e(cid:28)cientes, capaces
de implementar diversas operaciones de computaci(cid:243)n l(cid:243)gica aprovechando
el fen(cid:243)meno de la hibridaci(cid:243)n competitiva del ADN. La capacidad impl(cid:237)cita
de estos dispositivos para aplicar reglas de inferencia como modus ponens,
modus tollens, resoluci(cid:243)n o el silogismo hipotØtico tiene un gran potencial.
Entre otras funciones, permiten representar implicaciones l(cid:243)gicas (o reglas
del tipo SI/ENTONCES), como por ejemplo, (cid:16)si se da el s(cid:237)ntoma 1 y el
s(cid:237)ntoma 2, entonces estamos ante la enfermedad A(cid:17), o (cid:16)si estamos ante la
enfermedad B, entonces deben manifestarse los s(cid:237)ntomas 2 y 3(cid:17). Utilizan-
do estos m(cid:243)dulos l(cid:243)gicos como bloques bÆsicos de construcci(cid:243)n, se pretende
desarrollar sistemas in vitro basados en sensores de ADN, capaces de traba-
jar de manera conjunta para detectar un conjunto de s(cid:237)ntomas de entrada
y producir una diagn(cid:243)stico de salida. La reciente publicaci(cid:243)n en la revista
Science de un aut(cid:243)mata biomolecular de diagn(cid:243)stico, capaz de tratar las
cØlulas cancer(cid:237)genas sin afectar a las cØlulas sanas, es un buen ejemplo de la
relevancia cient(cid:237)(cid:28)ca que este tipo de aut(cid:243)matas tienen en la actualidad.
AdemÆs de las reciØn mencionadas aplicaciones en el diagn(cid:243)stico in vitro,
los modelos presentados tambiØn tienen utilidad en el diseæo de biosensores
inteligentes y la construcci(cid:243)n de bases de datos con registros en formato
biomolecular que faciliten el anÆlisis gen(cid:243)mico.
Elestudiosobreelestadodelacuesti(cid:243)nencomputaci(cid:243)nbiomolecularquese
presenta en esta tesis estÆ basado en un art(cid:237)culo recientemente publicado en
la revista Current Bioinformatics. Los nuevos dispositivos presentados en la
tesis forman parte de una solicitud de patente de la que la UPM es titular,
y han sido presentados en congresos internacionales como Unconventional
Computation 2010 en Tokio o Synthetic Biology 2010 en Par(cid:237)s.
vi
Dedicatoria
A mi novia Mar(cid:237)a Noel, por su paciencia con mis estudios, por estar siempre
a mi lado y hacer de este (cid:16)friki(cid:17) un ser mÆs sensible y humano.
A mi familia, por apoyarme en todos los desaf(cid:237)os que me he planteado en la
vida. Gracias a ellos siempre serÆ posible una pr(cid:243)xima dedicatoria.
A Alfonso, por su tiempo, su apoyo, su gu(cid:237)a y su consejo. Y por ser capaz
de contagiarme su pasi(cid:243)n por la ciencia.
ii
˝ndice general
˝ndice de Figuras v
1. Introducci(cid:243)n 1
1.1. Computaci(cid:243)n biomolecular y la tecnolog(cid:237)a del ADN recombinante . . . . 1
1.2. El ADN y sus operaciones bÆsicas . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Organizaci(cid:243)n de la memoria . . . . . . . . . . . . . . . . . . . . . . . . . 10
2. Computaci(cid:243)n biomolecular 13
2.1. El algoritmo de Adleman. . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.1. De(cid:28)nici(cid:243)n del problema . . . . . . . . . . . . . . . . . . . . . . . 13
2.1.2. Codi(cid:28)caci(cid:243)n y funcionamiento . . . . . . . . . . . . . . . . . . . . 13
2.1.3. Descripci(cid:243)n del algoritmo . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Computaci(cid:243)n aut(cid:243)noma: Whiplash PCR . . . . . . . . . . . . . . . . . . 15
2.3. Autoensamblado del ADN . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.1. Baldosas de Wang . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.2. Bloques de ADN . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.3. ADN como elemento de andamiaje: Origami . . . . . . . . . . . . 18
2.4. Aut(cid:243)matas de ADN basados en enzimas de restricci(cid:243)n: el aut(cid:243)mata de
Benenson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5. Aut(cid:243)matas basados en deoxiribozimas . . . . . . . . . . . . . . . . . . . 20
2.5.1. Puertas l(cid:243)gicas y aut(cid:243)matas . . . . . . . . . . . . . . . . . . . . . 21
2.5.2. Motores moleculares . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.6. Hibridaci(cid:243)n competitiva . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.7. Computaci(cid:243)n l(cid:243)gica con ADN . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7.1. Introducci(cid:243)n a la l(cid:243)gica proposicional . . . . . . . . . . . . . . . . 27
iii
˝NDICE GENERAL
2.7.2. Inferencia con molØculas de ADN . . . . . . . . . . . . . . . . . . 29
2.8. Computaci(cid:243)n con ARN. . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3. Planteamiento del problema 33
4. Dispositivos de computaci(cid:243)n l(cid:243)gica con ADN 35
4.1. Conceptos bÆsicos de l(cid:243)gica proposicional . . . . . . . . . . . . . . . . . 35
4.2. De la l(cid:243)gica proposicional a dispositivos de ADN . . . . . . . . . . . . . 37
4.3. Codi(cid:28)caci(cid:243)n de las proposiciones . . . . . . . . . . . . . . . . . . . . . . 38
4.4. Dispositivo 1: inferencia con hibridaci(cid:243)n competitiva en un paso . . . . . 39
4.4.1. Funcionamiento bÆsico . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4.2. Funcionamiento iterativo . . . . . . . . . . . . . . . . . . . . . . . 41
4.4.3. Funcionamiento recursivo . . . . . . . . . . . . . . . . . . . . . . 41
4.5. Dispositivo 2: inferencia con hibridaci(cid:243)n competitiva en dos pasos . . . . 44
4.5.1. Funcionamiento bÆsico . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5.2. Funcionamiento iterativo . . . . . . . . . . . . . . . . . . . . . . . 46
4.5.3. Funcionamiento recursivo . . . . . . . . . . . . . . . . . . . . . . 47
4.6. Dispositivo 3: representaci(cid:243)n de clÆusulas l(cid:243)gicas . . . . . . . . . . . . . 49
4.6.1. Resoluci(cid:243)n. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.6.2. Evaluaci(cid:243)n de f(cid:243)rmulas. . . . . . . . . . . . . . . . . . . . . . . . 51
4.7. Caso de estudio: diagn(cid:243)stico in vitro . . . . . . . . . . . . . . . . . . . . 53
5. AnÆlisis de los resultados 55
5.1. Inferencia con el dispositivo 1 . . . . . . . . . . . . . . . . . . . . . . . . 57
5.2. Inferencia con el dispositivo 2 . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3. Inferencia con el dispositivo 3 . . . . . . . . . . . . . . . . . . . . . . . . 58
6. Conclusiones y futuras l(cid:237)neas de investigaci(cid:243)n 61
Bibliograf(cid:237)a 65
iv
Description:ciación y síntesis del ADN, la computación biomolecular pudo abandonar desarrollar sistemas in vitro basados en sensores de ADN, capaces de