Download - prediccion estructura RNAamoreira/bio10/RNA.pdf · Estructura terciaria del RNA Hace referencia a la organización que tienen los elementos de la estructura secundaria en el espacio.

Estructura de RNAEstructura de RNADarío CanalesIgnacio Salas

Oscar Yañez

RNARNA� Está presente tanto en

las células procariotas como en las eucariotas.

� Pares de bases canónicas◦ A/U

◦ G/C

◦ G/U (par inestable)◦ G/U (par inestable)

� Algunas funciones:◦ Dirige la parte intermedia

de la síntesis de proteínas

◦ Catálisis

◦ Regulan la expresión genética

Estructura Estructura secundaria del RNAsecundaria del RNA

� Se puede ver como un paso intermedio hacia una estructura en 3D

� Doble cadena de RNA formada por el plegamiento de una molécula simpleplegamiento de una molécula simple

Estructura terciaria del RNAEstructura terciaria del RNA

� Hace referencia a la organización que tienen los elementos de la estructura secundaria en el espacio.

� Es el resultado del apilamiento de bases y � Es el resultado del apilamiento de bases y de los enlaces por puente de hidrógeno entre diferentes partes de la molécula.

Predicción de la estructura del RNAPredicción de la estructura del RNA

� El modelado de la estructura de RNA en 2D sirve para la construcción de bases de datos de moléculas de RNA

◦ Formas similares, roles similares◦ Formas similares, roles similares

� Muchos métodos usan programación dinámica

� La molécula se pliega sobre si misma

Predicción de la estructura de RNAPredicción de la estructura de RNA

� Se buscan palíndromos

� Estructuras energéticamente estables

Algoritmo de Nussinov

Hallar las estructura secundaria que maximice el numero de bases pareadas.

Encuentra la mejor estructura para los inputs i,j intentando una de las siguientes 4 posibilidades:

AlgoritmoRecursivo

Objetivo

- Agregar el par i, j sobre la mejor estructura i+1,j-1- Agregar i sin aparear a la mejor estructura i+1,j- Agregar i sin aparear a la mejor estructura i+1,j- Agregar j sin aparear a la mejor estructura i,j-1- Combinar las dos estructuras optimas i,k y k+1,j

i+1 i-1

ji+1

par i,j i no pareada

j-1i

j no pareada

ik k+1

k

bifurcación

Algoritmo de Nussinov

Sea S una secuencia de RNA de tamaño L.Se define una matriz γ L x L de folding correspondiente a la secuencia S.Se establece una función δ(xi, xj) = 1, si xi y xj se pueden parear y δ(xi, xj) = 0, en caso contrario.

Inicialización:

γ (i, i-1) = 0, i= 2...L

γ (i, i) = 0, i= 1...Lγ (i, i) = 0, i= 1...L

Llenado:

For i=1...L-1, j=i+1...L

Traceback

Inicialización: Push (1,L) en el stackRecursión: Repetir hasta que el stack este vacío

pop(i,j)if i > j continuarelse if γ (i+1, j) = γ (i, j) push (i+1, j)else if γ (i, j-1) = γ (i, j) push (i, j-1)else if γ (i+1, j-1)+ δ ij = γ (i, j):else if γ (i+1, j-1)+ δ ij = γ (i, j):

registrar i, j como apareamientopush (i+1, j-1)

else for k= i+1 to j-1: if γ (i,k)+ γ(k+1,j)= γ (i,j):push (k+1,j)push (i,k)break

G G G A A A U C C

G

EjemploInicialización:

γ (i, i-1) = 0, i= 2...Lγ (i, i) = 0, i= 1...L

G G G A A A U C C

G 0

i

j G

G

G

A

A

A

U

C

C

G 0

G 0 0

G 0 0

A 0 0

A 0 0

A 0 0

U 0 0

C 0 0

C 0 0

j

EjemploLlenado: For i=1...L-1, j=i+1...L

G G G A A A U C C

G 0

G G G A A A U C C

G 0 0 0 0 0 0 1 2 3

i

j G 0

G 0 0

G 0 0

A 0 0

A 0 0

A 0 0

U 0 0

C 0 0

C 0 0

G 0 0 0 0 0 0 1 2 3

G 0 0 0 0 0 0 1 2 3

G 0 0 0 0 0 1 2 2

A 0 0 0 0 1 1 1

A 0 0 0 1 1 1

A 0 0 1 1 1

U 0 0 0 0

C 0 0 0

C 0 0

j

EjemploTraceback:

G G G A A A U C C

G 0

G G G A A A U C C

G 0 0 0 0 0 0 1 2 3

pop(i,j)if i > j continuarelse if γ (i+1, j) = γ (i, j) push (i+1, j)else if γ (i, j-1) = γ (i, j) push (i, j-1)else if γ (i+1, j-1)+ δ ij = γ (i, j):

registrar i, j como apareamientopush (i+1, j-1)

else for k= i+1 to j-1: if γ (i,k)+ γ(k+1,j)= γ (i,j):push (k+1,j)push (i,k); break

G G G A A A U C C

G 0 0 0 0 0 0 1 2 3

i

j G 0

G 0 0

G 0 0

A 0 0

A 0 0

A 0 0

U 0 0

C 0 0

C 0 0

G 0 0 0 0 0 0 1 2 3

G 0 0 0 0 0 0 1 2 3

G 0 0 0 0 0 1 2 2

A 0 0 0 0 1 1 1

A 0 0 0 1 1 1

A 0 0 1 1 1

U 0 0 0 0

C 0 0 0

C 0 0

G 0 0 0 0 0 0 1 2 3

G 0 0 0 0 0 0 1 2 3

G 0 0 0 0 0 1 2 2

A 0 0 0 0 1 1 1

A 0 0 0 1 1 1

A 0 0 1 1 1

U 0 0 0 0

C 0 0 0

C 0 0

j

G C

G C

A U

A A

G

Desventajas de Desventajas de NussinovNussinov

• Este método asume que la mejor estructura es la que contiene una mayor cantidad de bases pareadas.

• No necesariamente entrega la estructura más estable.

• Hay muchas combinaciones posibles de apareamiento, • Hay muchas combinaciones posibles de apareamiento, pero Nussinov detecta generalmente sólo una variante.

• No se considera apilamiento de bases pareadas => Diferencias en estructura y estabilidad de hélices.

• No se considera tamaño de loops internos.

Solución: Minimizar energía libreSolución: Minimizar energía libre� Por Ley de la termodinámica, sólo una estructura secundaria

es estable, normalmente, la que optimice la energía libre.

� Energía libre

G = H - TS

� Entalpía: por apareamiento de bases

� Entropía: desorden en regiones no apareadas

G = H - TS

G: Energía LibreH: Entalpía (energía que puede generar trabajo)T: Temperatura Absoluta (Kelvin)S: Entropía (medida de desorden)

Solución: Minimizar energía libreSolución: Minimizar energía libre

� Usualmente, se mide la diferencia

� Lo que se mide → energía en loops,

∆G = ∆H - T∆S

� Lo que se mide → energía en loops, stacks y otros elementos de estructura secundaria más pequeños

� Energía libre total = sumatoria

Algoritmo de Algoritmo de ZukerZuker: Definiciones: Definiciones

Tipos de ciclosTipos de ciclos

� H - Hairpin Loop

� I – Interior Loop

� B – Bulge

� M – Multiple Loopo Multiloop

Stacking Multiloop

Algoritmo de Algoritmo de ZukerZuker: Definiciones: Definiciones

Contribuciones de energíaContribuciones de energía

� Cada tipo de estructura (ciclo) tiene una contribución de energía diferente.

◦ El cálculo de la contribución del multiloop es muy costoso.◦ Se usa una versión simplificada de la contribución, que

considera contribución del cierre del loop, número de hélices y número de bases no pareadas dentro del loop.

EjemploEjemplo

Problema de minimización de Problema de minimización de energía libre de energía libre de ZukerZuker

� INPUT: secuencia S de RNA

� OUTPUT: estructura secundaria RNA de S de mínima energía libre

� Hace una comparación entre las posibles estructuras secundarias obtenidas.

� Solución eficiente → Programación Dinámicamediante ecuaciones recursivas

Problema de minimización de Problema de minimización de energía libre de energía libre de ZukerZuker

Se determina la energía asociada

dividiendo la estructura resultante.

Matriz WMatriz W

� W(i + 1,j) y W(i,j - 1) cuando i y j no � W(i + 1,j) y W(i,j - 1) cuando i y j no están pareados

� V(i,j) cuando i y j están pareados

� El último, están preados pero no necesariamente entre si

Matriz VMatriz V

� eh: energía de la horquilla� eh: energía de la horquilla

� es: energía del stack

� VBI: energía del bucle interno

� VM: energía del multiloop

Matriz VBIMatriz VBI

� Se ven todas las combinaciones que pueden producir un bucle interno para un i’ y j’ que este entre i y ji’ y j’ que este entre i y j

Matriz VMMatriz VM

� Se ven las diferentes formas de separar un multiloop en dos partes, agregando un valor “a” de cierre del loopvalor “a” de cierre del loop

Algoritmo de Algoritmo de ZukerZuker

� El tiempo de Zuker esta en

� Si se quisiera hacer con estructuras terciarias, sería un problema de programación dinámica multidimensional programación dinámica multidimensional y con 3 matrices

◦ Impracticable

� El traceback es como Nussinov

TareaTarea

� ¿Que significa que los métodos de predicción de estructuras de RNA busquen palíndromos, como la minimización de energía libre afecta estos minimización de energía libre afecta estos resultados?

� Enviar a [email protected]