RNARNA� Está presente tanto en
las células procariotas como en las eucariotas.
� Pares de bases canónicas◦ A/U
◦ G/C
◦ G/U (par inestable)◦ G/U (par inestable)
� Algunas funciones:◦ Dirige la parte intermedia
de la síntesis de proteínas
◦ Catálisis
◦ Regulan la expresión genética
Estructura Estructura secundaria del RNAsecundaria del RNA
� Se puede ver como un paso intermedio hacia una estructura en 3D
� Doble cadena de RNA formada por el plegamiento de una molécula simpleplegamiento de una molécula simple
Estructura terciaria del RNAEstructura terciaria del RNA
� Hace referencia a la organización que tienen los elementos de la estructura secundaria en el espacio.
� Es el resultado del apilamiento de bases y � Es el resultado del apilamiento de bases y de los enlaces por puente de hidrógeno entre diferentes partes de la molécula.
Predicción de la estructura del RNAPredicción de la estructura del RNA
� El modelado de la estructura de RNA en 2D sirve para la construcción de bases de datos de moléculas de RNA
◦ Formas similares, roles similares◦ Formas similares, roles similares
� Muchos métodos usan programación dinámica
� La molécula se pliega sobre si misma
Predicción de la estructura de RNAPredicción de la estructura de RNA
� Se buscan palíndromos
� Estructuras energéticamente estables
Algoritmo de Nussinov
Hallar las estructura secundaria que maximice el numero de bases pareadas.
Encuentra la mejor estructura para los inputs i,j intentando una de las siguientes 4 posibilidades:
AlgoritmoRecursivo
Objetivo
- Agregar el par i, j sobre la mejor estructura i+1,j-1- Agregar i sin aparear a la mejor estructura i+1,j- Agregar i sin aparear a la mejor estructura i+1,j- Agregar j sin aparear a la mejor estructura i,j-1- Combinar las dos estructuras optimas i,k y k+1,j
i+1 i-1
ji+1
par i,j i no pareada
j-1i
j no pareada
ik k+1
k
bifurcación
Algoritmo de Nussinov
Sea S una secuencia de RNA de tamaño L.Se define una matriz γ L x L de folding correspondiente a la secuencia S.Se establece una función δ(xi, xj) = 1, si xi y xj se pueden parear y δ(xi, xj) = 0, en caso contrario.
Inicialización:
γ (i, i-1) = 0, i= 2...L
γ (i, i) = 0, i= 1...Lγ (i, i) = 0, i= 1...L
Llenado:
For i=1...L-1, j=i+1...L
Traceback
Inicialización: Push (1,L) en el stackRecursión: Repetir hasta que el stack este vacío
pop(i,j)if i > j continuarelse if γ (i+1, j) = γ (i, j) push (i+1, j)else if γ (i, j-1) = γ (i, j) push (i, j-1)else if γ (i+1, j-1)+ δ ij = γ (i, j):else if γ (i+1, j-1)+ δ ij = γ (i, j):
registrar i, j como apareamientopush (i+1, j-1)
else for k= i+1 to j-1: if γ (i,k)+ γ(k+1,j)= γ (i,j):push (k+1,j)push (i,k)break
G G G A A A U C C
G
EjemploInicialización:
γ (i, i-1) = 0, i= 2...Lγ (i, i) = 0, i= 1...L
G G G A A A U C C
G 0
i
j G
G
G
A
A
A
U
C
C
G 0
G 0 0
G 0 0
A 0 0
A 0 0
A 0 0
U 0 0
C 0 0
C 0 0
j
EjemploLlenado: For i=1...L-1, j=i+1...L
G G G A A A U C C
G 0
G G G A A A U C C
G 0 0 0 0 0 0 1 2 3
i
j G 0
G 0 0
G 0 0
A 0 0
A 0 0
A 0 0
U 0 0
C 0 0
C 0 0
G 0 0 0 0 0 0 1 2 3
G 0 0 0 0 0 0 1 2 3
G 0 0 0 0 0 1 2 2
A 0 0 0 0 1 1 1
A 0 0 0 1 1 1
A 0 0 1 1 1
U 0 0 0 0
C 0 0 0
C 0 0
j
EjemploTraceback:
G G G A A A U C C
G 0
G G G A A A U C C
G 0 0 0 0 0 0 1 2 3
pop(i,j)if i > j continuarelse if γ (i+1, j) = γ (i, j) push (i+1, j)else if γ (i, j-1) = γ (i, j) push (i, j-1)else if γ (i+1, j-1)+ δ ij = γ (i, j):
registrar i, j como apareamientopush (i+1, j-1)
else for k= i+1 to j-1: if γ (i,k)+ γ(k+1,j)= γ (i,j):push (k+1,j)push (i,k); break
G G G A A A U C C
G 0 0 0 0 0 0 1 2 3
i
j G 0
G 0 0
G 0 0
A 0 0
A 0 0
A 0 0
U 0 0
C 0 0
C 0 0
G 0 0 0 0 0 0 1 2 3
G 0 0 0 0 0 0 1 2 3
G 0 0 0 0 0 1 2 2
A 0 0 0 0 1 1 1
A 0 0 0 1 1 1
A 0 0 1 1 1
U 0 0 0 0
C 0 0 0
C 0 0
G 0 0 0 0 0 0 1 2 3
G 0 0 0 0 0 0 1 2 3
G 0 0 0 0 0 1 2 2
A 0 0 0 0 1 1 1
A 0 0 0 1 1 1
A 0 0 1 1 1
U 0 0 0 0
C 0 0 0
C 0 0
j
G C
G C
A U
A A
G
Desventajas de Desventajas de NussinovNussinov
• Este método asume que la mejor estructura es la que contiene una mayor cantidad de bases pareadas.
• No necesariamente entrega la estructura más estable.
• Hay muchas combinaciones posibles de apareamiento, • Hay muchas combinaciones posibles de apareamiento, pero Nussinov detecta generalmente sólo una variante.
• No se considera apilamiento de bases pareadas => Diferencias en estructura y estabilidad de hélices.
• No se considera tamaño de loops internos.
Solución: Minimizar energía libreSolución: Minimizar energía libre� Por Ley de la termodinámica, sólo una estructura secundaria
es estable, normalmente, la que optimice la energía libre.
� Energía libre
G = H - TS
� Entalpía: por apareamiento de bases
� Entropía: desorden en regiones no apareadas
G = H - TS
G: Energía LibreH: Entalpía (energía que puede generar trabajo)T: Temperatura Absoluta (Kelvin)S: Entropía (medida de desorden)
Solución: Minimizar energía libreSolución: Minimizar energía libre
� Usualmente, se mide la diferencia
� Lo que se mide → energía en loops,
∆G = ∆H - T∆S
� Lo que se mide → energía en loops, stacks y otros elementos de estructura secundaria más pequeños
� Energía libre total = sumatoria
Algoritmo de Algoritmo de ZukerZuker: Definiciones: Definiciones
Tipos de ciclosTipos de ciclos
� H - Hairpin Loop
� I – Interior Loop
� B – Bulge
� M – Multiple Loopo Multiloop
Stacking Multiloop
Algoritmo de Algoritmo de ZukerZuker: Definiciones: Definiciones
Contribuciones de energíaContribuciones de energía
� Cada tipo de estructura (ciclo) tiene una contribución de energía diferente.
◦ El cálculo de la contribución del multiloop es muy costoso.◦ Se usa una versión simplificada de la contribución, que
considera contribución del cierre del loop, número de hélices y número de bases no pareadas dentro del loop.
Problema de minimización de Problema de minimización de energía libre de energía libre de ZukerZuker
� INPUT: secuencia S de RNA
� OUTPUT: estructura secundaria RNA de S de mínima energía libre
� Hace una comparación entre las posibles estructuras secundarias obtenidas.
� Solución eficiente → Programación Dinámicamediante ecuaciones recursivas
Problema de minimización de Problema de minimización de energía libre de energía libre de ZukerZuker
Se determina la energía asociada
dividiendo la estructura resultante.
Matriz WMatriz W
� W(i + 1,j) y W(i,j - 1) cuando i y j no � W(i + 1,j) y W(i,j - 1) cuando i y j no están pareados
� V(i,j) cuando i y j están pareados
� El último, están preados pero no necesariamente entre si
Matriz VMatriz V
� eh: energía de la horquilla� eh: energía de la horquilla
� es: energía del stack
� VBI: energía del bucle interno
� VM: energía del multiloop
Matriz VBIMatriz VBI
� Se ven todas las combinaciones que pueden producir un bucle interno para un i’ y j’ que este entre i y ji’ y j’ que este entre i y j
Matriz VMMatriz VM
� Se ven las diferentes formas de separar un multiloop en dos partes, agregando un valor “a” de cierre del loopvalor “a” de cierre del loop
Algoritmo de Algoritmo de ZukerZuker
� El tiempo de Zuker esta en
� Si se quisiera hacer con estructuras terciarias, sería un problema de programación dinámica multidimensional programación dinámica multidimensional y con 3 matrices
◦ Impracticable
� El traceback es como Nussinov
TareaTarea
� ¿Que significa que los métodos de predicción de estructuras de RNA busquen palíndromos, como la minimización de energía libre afecta estos minimización de energía libre afecta estos resultados?
� Enviar a [email protected]