Post on 12-Mar-2015
Procesamiento Digital de Imágenes y recostrucción tridimensional de imágenes de ME.
Modelaje Molecular de estructuras usando datos de cris- talografía por RX, RMN o por Difracción de Electrónes. Precisión: RX > RMN > DE (Dif. RX/RMN~0,75 - 1,5 A)
Mecánica Molecular para entender y predecir el compor- tamiento macroscópico de biomoléculas. Movimientos a nivel atómico o molecular para describir procesos en el tiempo
Ajuste de estructuras cristalográficas a mapas 3D obteni- dos por ME (Tinción Negativa o Congelado Hidratado)
1) Subjetivo (a la superficie)2) Objetivo (a las densidades)
Structural ProteomicsProteoma: abarca todas las proteínas expresadas por el genoma.
Proteómica: estudio del proteoma de un tipo celular o organismo completo
Proteómica Estructural: determinación de la estructura 3-dimensional del proteoma
Métodos experimentales para la caracterización estructural de complejos moleculares
From words to literaturein structural proteomicsAndrej Sali, Robert Glaeser, Thomas Earnes & Wolfgang BaumeisterNATURE, 422:216-225, 13 march 2003
Filamentos gruesos teñidos negativamentenegativamente
Filamentos gruesos teñidos negativamentenegativamente
Reconstrucción Tridimensional
Reconstrucción Tridimensional
Modelo molecular del filamento gruesoModelo molecular del filamento grueso
Estructura atómica del S1
Estructura atómica del S1
Herramientas Bioinformáticas
•Bases de Datos•Proteinas•ácidos nucleicos•estructuras
•Comparación de secuencias nucleotídicas•Alineamientos•Identificación de genes•Distancia genética•Arboles filogenéticos
•Predicciónes:•Estructura Secundaria (hélices, plegamientos, lazos)•Interacciones de proteinas•Estructuras 3D (CASP/CAFASP)
•Visualización Molecular•Modelaje Molecuar
•Por Homologías•Dinámica Molecular•Ajuste o Docking
Bancos de Datos Biológicos• Es una colección organizada que almacena datos estructurales, funcionales y genéticos
de proteínas y secuencias de genes.<National Center for Biotechnology Information ( http://www.ncbi.nlm.nih.gov )>
Clasificación:
• Bases de Datos de Acidos Nucléicos:
– Genome Web (http://www.hgmp.mrc.ac.uk/GenomeWeb/); EMBL; GenBank
• Bases de Datos de Proteinas:
– Swiss-Prot (http://www.ebi.ac.uk/swissprot/); PIR; PROSITE; SBASE.
• Bases de datos de Estructuras Macromoleculares (http://www.ebi.ac.uk/msd/)
• Otras Bases de Datos:
– Brookhaven Protein Data Bank (http://rcsb.rutgers.edu/ ); LiMB; OMIM; REBASE; etc.
Bioinformática
El Brookhaven Protein Databank contiene la estructura tridimensional de proteinas determinadas por cristalografía de rayos-X o análisis por NMR.
El Banco también contiene estructuras tridimensionales de otras macromoléculas como DNA, RNA y varios complejos moleculares.
Comparación de Secuencias
Alineamiento de Secuencias Nucleotídicas:Procedimiento mediante el cual se organizan dos o mas secuencias con la
finalidad de medir el grado de homología entre ellas.
Formatos:• Fasta, PIR, ClustalW, EMBL, Genebank, Swiss-Prot, etc.Programas:• Clustal, JalView, etc.Web Sites:• BLAST (http://www.ncbi.nlm.nih.gov/blast/bl2seq/bl2.html)• Embl-ebi clustal (http://www.ebi.ac.uk/clustalw/)
El resultado de un alineamiento indica la cantidad de bases que se conservan y las que no son conservadas, ya sea por sustitusión (mutaciones) o por procesos de insersión o eliminación (indels)
S1 G A T A C A
S2 T A T T A C A
Homología:Evolutivamente, dos secuencias similares son homólogas si provienen de un ancestro común.
Si provienen de ancestros no relacionadas se consideran homópasias.
S1 G A T A C A | |S2 T A T T A C A
S1 G A T - A C A | | | | |S2 T A T T A C A
Predicciones• Estructura Secundaria (hélices, plegamientos, lazos)
– JPRed http://www.compbio.dundee.ac.uk/%7Ewww-jpred/submit.html
– Predictor Protein Server http://www.embl-heidelberg.de/predictprotein/predictprotein.htmll
• Interacciones intra-proteicas– Métodos basados en la estructura (Ajuste de estructuras)
– Métodos basados en la secuencia (Mutaciones correlacionadas, Similaridad de árboles filogenéticos)
– Métodos Híbridos
• Estructuras 3D (CASP/CAFASP Critical Assessment Structure Prediction/CA Full Automated SP)
– El objetivo de los experimentos CASP/CAFASP es evaluar el progreso en la predicción de estructuras 3D a partir de la secuencia proteica.
– Estado actual:• La calidad del alineamiento no concuerda bien con la identidad de la secuencia
• Se obtienen mejores resultados en regiones biologicamente importantes que con toda la proteina
• El modelaje de los lazos sigue siendo un problema
• Se esperan mejoras a medida que crezcan las bases de datos
Modelaje Molecular
Construcción-Ensamblaje de moléculas para ajustar los datos estructurales provenientes de:
• Cristalografía de Rayos-X• Resonancia Magnética Nuclear (NMR)• Microscopía Electrónica (Crio-ME, Tomo. E., Cristal. E., Inmuno-ME) • Modelaje por Homologías• Flourescent Resonance Energy Transfer (FRET)• Cross-linking, Purificación por afinidad y Espectroscopía de masas• Dispersión de luz, Rayos-X & neutrones (scattering)
Concentrándose en moléculas biológicas, especialmente proteínas, inicialmente generadas a mano, ahora utilizando métodos computacionales, interactivos u objetivos (BIOLOGIA COMPUTACIONAL)
Modelaje Molecular = molecular graphics (Visualización) + Química Computacional
Es un término general que abarca un amplio rango de técnicas de visualización (molecular graphics) y química computacional, usadas para construir, mostrar, manipular, simular y analizar estructuras moleculares y calcular las propiedades de éstas
1) Visualización Molecular (Molecular Graphics) Visualización de moléculas cuya estructura ha sido determinada.
•Presentación de la molécula en diversos estilos (líneas, tubos, cintas, etc.)•Movimientos interactivos•Visualizar las cadenas polipeptídicas, localización de subunidades e interfaces•Localizar dominios, sitios catalíticos o lugares de unión de ligandos•Apreciar Cambios Conformacionales
2) Construcción y Ensamblaje de moléculas Construyendo sobre lo conocido y prediciendo nuevas estructuras
•Construcción de pequeñas moléculas a partir de fragmentos•Construcción de cadenas polipeptídicas (definir la estuctura secundaria)•Construcción de proteinas a partir de fragmentos•Construcción de grandes arreglos supramoleculares con simetría
Modelaje Molecular
Visualización Molecular
Visualización Molecular
Programas para visualización:•Rasmol, Mage (Workstations)
Raswin, KineMage (PC)•Molscript•Raster3D•Weblab
Programas para visualización y análisis:•Mole•“O”•Swiss PDB Viewer•Insight
Visualización Molecular
Archivo PDB:El resultado de una determinación estructural es un archivo pdb (Protein Data Base).
Formato PDB: (ver ejemplo)• Encabezado con información sobre la molécula, ej.: especie, condición de cristalización.• Referencias• Información sobre la sequencia•Formato en la parte principal:
•ATOM atom number atom type residue residue number x y z coordinatesNota: el tipo de átomo siempre comienza con el elemento
•N es el átomo nitrógeno del péptido•C es el átomo carbono del péptido •O es el átomo oxygen del péptido •CA es el átomo de C alfa•CB es el átomo de C beta•Otros átomos en la mólecula
Ej. HN es hidrógeno unido al péptido N• Heteroatomos de ligandos no-protéicos.
Cálculo de la Energía Potencial (minimización de energía) y Dinámica Molecular• Utiliza la mecánica Newtoniana para calcular la energía potencial de los
átomos, las fuerzas sobre ellos y los movimientos resultantes.
Se utiliza para:• Mejoramiento de los modelos
Optimiza la estructura en prueba eliminando distorsiones y choques estéricos encontrando la mejorconformación.
• Explora movimientos moleculares (ej: donde se pliega una proteina )
Mecánica Molecular
Mecánica QuánticaUtiliza la mecánica Quántica para calcular la energía de los átomos (electrones y
núcleo).
Se utiliza para:• Cálculo de Dinámica Molecular de pequeñas moléculas• Es complementaria a los cálculos de Mecánica Molecular
Longitud de enlace (bond length)
• Los enlaces de comportan como resortes con una longitud de equilibrio que depende del tipo de enlace. Aumento o disminución de la longitud de equilibrio requiere de una mayor energía
Angulo de enlace (bond angle)
• Se comportan como resortes con un ángulo de equilibrio
Angulo de torsión (torsion angle)
• La rotación puede ocurrir sobre un enlace A-B-C-D pero la energía dependedel ángulo de torsión generado por los ángulos CD & AB vistos desde BC.
Interacciones de van der Waals
• Las interacciones de atracción/repulsión entre átomos dependen fuerte-mente de la distancia, así que estan son despreciables por encima de 15 A.
Interacciones Electrostaticas
• Todos los átomos tienen carga parcial (C=O-C CP+; átomo de O CP-)
• Dos átomos con la misma carga se repelen, con la misma carga se atraen
• En muchos casos de moléculas con grupos neutrales, dos átomos adyacentes tienen cargas opuestas y se comportan como dipolos, en estos casos la energía potencial decae a 1/r3
• Decae menos rápidamente que para las interacciones de van der Waals interactions y puede ser despreciable a 30 A.
Energía Potencial
Cut off• El cálculo de las interacciones entre átomos no enlazados toma mucho tiempo de
computación, así que es necesario limitar la distancias sobre las cuales se asume que las interacciones son despreciables.
Grupos de Potenciales (potential atom types)
Para reducir la complejidad de los cálculos los átomos son agrupados por tipos.– Todos los H en el metano son iguales a los H en el etano– El O en un grupo C=O es diferente del O en un grupo C-O-H. Pero los átomos
de O en los alcoles son similares.
Energía Potencial
La Energía Potencial es el resultado de la suma de todas las contribuciones:
(6) Los puentes de hidrógeno usualmente son calculados dentro de las interacciones electrostáticas pero ocasionalmente se añade un pequeño término extra
• Cálculo de como deben moverse los átomos para minimizar el total de energía Potencial.
• Al mínimo de energía, las fuerzas sobre cada átomo deben ser cero.
• Optimización de la estructura para evitar deformaciones y choques estéricos.
• Sin embargo, generalmente se encuentra el mínimo local mas que el global. Las barreras energéticas no pueden ser superadas, aun cuando pudiera encontrarse un menor estado energético.
• La energía potencial depende de muchos parámetros, existen varios métodos para hacer el cálculo mas razonable:
– Steepest descents
– Conjugate gradients
Minimización de la Energía
Minimización de la Energía
Minimización de la Energía (métodos)
“Line Search” “Steepest descents” “Conjugate gradients”
• La minimización de la Energía Potencial alcanza unmínimo local, no necesariamente el mínimo global.
• La Dinámica Molecular puede ser usada para simular los movimientos térmicos de una estructura en función del tiempo, usando las fuerzas que actúan sobre los átomos para producir ese movimiento (dándole energía térmica a una molécula se puede explorar los cambios conformacionales y sobrepasar las barreras energéticas).
• Partiendo de la estructura de Mecánica Molecular, conociendo las fuerzas sobre los átomos y su masa, se puede calcular la aceleración (F=M*A) y las velocidades para obtener las nuevas posiciones de los átomos en períodos de tiempo my cortos (1 fsec=10-15 sec).
• Este proceso se repite miles de veces generando trayectorias
• La elevación de la temperatura están directamente relacionadas con mayores velocidades y con cambios conformacionales que permitan superar barreras energéticas y alcanzar comfiguraciones mas estables.
• Usos:– a) Para explorar movimientos atómicos locales – b) Para sobrepasar barreras energéticas y encontrar mejores estructuras
Dinámica Molecular
Efecto del Agua:• Las proteínas están rodeadas por agua. Las cadenas laterales sobre la
superficie interactúan con el agua. De tal forma que modelar proteínas sin la presencia de agua no es realista.
• Pero computacionalmente es muy intensivo y requiere de calcular un gran número de posisiones e interacciones.
• En la práctica las proteinas se rodean de una muy fina capa de agua para hacer los cálculos.
Dinámica Molecular
Molecular dynamics simulations of biomoleculasMartin Karplus & Andrew McCammonNATURE, 9 (9):646-652 (788), september, 2002
The server set of ICGEBnet has been expanded with a new server, “exon”, bringing more computing power for current and new bioinformatics services (e.g. DNAtools, Protein tools/SBASE);• version 7.0 of the SBASE protein domain library has been released (http://www.icgeb.trieste.it/sbase ), equipped with a completely renewed and enriched suite of support programmes, written by Janos Murvai for the new server environment;• DNA sequence analysis servers (DNAtools at http: www.icgeb.trieste.it/dna/ ), predicting sequence dependent structural features such as bendability and static curvature, have been upgraded and moved onto the new web server by Kristian Vlahovicek.
Biocomputación en el ICGEBBiocomputación en el ICGEB
Dinámica Molecular y modelaje.Dinámica Molecular y modelaje.VMD: Visual Molecular Dynamics VMD: Visual Molecular Dynamics ((http://www.ks.uiuc.edu/Research/vmd/))
NAMD: Scalable Molecular Dynamics NAMD: Scalable Molecular Dynamics
((http://www.ks.uiuc.edu/Research/namd/))
Grupo de Biofísica Teórica, Universidad de Chicago, Grupo de Biofísica Teórica, Universidad de Chicago, Urbana-Champaign. Urbana-Champaign. NIH Resource for Macromolecular NIH Resource for Macromolecular
Modeling and BioinformaticsModeling and Bioinformatics
((http://www.ks.uiuc.edu/))
Centro de Biología Estructural Bloomsbury. Univ. Londres:Centro de Biología Estructural Bloomsbury. Univ. Londres:
http://www.bcsb.lon.ac.uk/
Grupo de Cristalografía de Rayos-X:
http://www.biochem.ucl.ac.uk/bsm/xtal/index.html
Clasificación de la Estructura de Proteínas:Clasificación de la Estructura de Proteínas:
http://www.biochem.ucl.ac.uk/bsm/cath_new/index.html
Grupo de Biofísica Molecular:Grupo de Biofísica Molecular:
http://www.biochem.ucl.ac.uk/bsm/biophysics/
Grupo de Estructura y Modelaje:Grupo de Estructura y Modelaje:
http://www.biochem.ucl.ac.uk/bsm/biocomp/index.html
Centro de Modelaje Molecular. Universidad de Pennsylvania: Centro de Modelaje Molecular. Universidad de Pennsylvania: CM3D Software
http://www.cmm.upenn.edu/
Ajuste de estructuras cristalográficas a mapas 3D obtenidos por ME •Procesamiento Digital de Imágenes de Microscopía Electrónica•Reconstrucción tridimensional de Imágenes (Mapa 3D)•Visualización del mapas de densidad (contornos, secciones y superficie)•Generación de modelos y sus mapas de densidad•Filtraje pasa bajo para equiparar la resolución de los modelos a la reconstucción•Alineamiento y superposición de los modelos y la reconstrucción•Refinamiento iterativo de los modelos
Docking
Ajuste de la estructura cristalográgica de la actina y la miosina Ajuste de la estructura cristalográgica de la actina y la miosina al mapa 3D del complejo actomiosinaal mapa 3D del complejo actomiosinaME Actomiosina: Rayment; Milligan & WhittakerCristalo. Rx de G-actina: KabschMoledo F-actina: Homes, LorenzCristalo. Rx de S1: Rayment
• Una vez obtenida la reconstrucción o mapa tridimensional, queremos explicarlo en términos de la estructura atómica de la molécula
• Podemos hacer el ajuste con la molécula rígida o permitiendo cierta flexibilidad
Ajuste de Modelos a la Reconstucción
Mapas tridimensionales
• Un mapa de densidad es una descripción de la densidad de proteinas en 3 dimensiones (una imagen 3d)
• Puede ser una serie de (Z) archivos cada uno representando una sección (M x N) o un solo archivo que representa un volumen (M x N x Z)
• Estos pueden ser mostrados como:
– a) una serie de secciones
– b) gráficos de contorno
– c) vistas de superficie
Ajuste de Modelos a la Reconstucción
abc
Estructura Cristalográfica
• La molécula puede estar representada por tan solo los carbones alfa o por todos los átomos de cada residuo de la proteina (coordenadas atómicas)
• Generalmente es un archivo con formato PDB
• Estos pueden ser mostrados como:
– a) líneas
– b) vistas de superficie
– c) bolas y bastones
Ajuste de Modelos a la Reconstucción
a b c
Ajuste Automático
• Para el ajuste objetivo se debe parametrizar el modelo, osea describir el modelo entérminos numéricos (un número de variables finitas)
• Usualmente las variables definen orientación, radio y cualquier flexibilidad interna (manteniendo fijas las distancias entre moléculas)
• Los modelos generados se transforman en densidades y se busca el mejor ajuste entre el mapa y el (los) modelo(s).
Ajuste de Modelos a la Reconstucción
Ajuste Manual• El ajuste se realiza interactivamente “a ojo”.• Se selecciona un nivel de contorno que incluya un volumen equivalente al de la molécula y
se posiciona ésta dentro del contorno.• Ventajas: Simple, rápido y se usa como primera aproximación al problema• Desventaja: No usa los rasgos estructurales de mas alta densidad
• El modelo se genera colocando una molécula en cada posición correspondiente en la hélice (radio, rotación y ángulos).
• Se calcula un mapa de densidad para cada modelo.
• Alineación del modelo y de la reconstrucción (comparando proyecciones longitudinales y transversales).
• Se comparan los volúmenes (densidades) del modelo alineado y la reconstrucción (calculando el coeficiente de correlación cruzada).
Cálculo de los Mapas 3D de los Modelos
• Se busca obtener el modelo con el mejor puntaje
• Solo dos métodos pueden ser usados para encontrar el mínimo (máximo) de una función con mas de una variable, si no se está disponible el gradiente:
– (1) Método Powells
– (2) Método Downhill Simplex
• Un “simplex” es un poliedro en un espacio n-dimensional, una dimensión para cada parámetro que define el modelo.
• Para dos dimensiones el “simplex” es un triángulo, para tres dimensiones es un tetraedro (n+1 vértices), etc.
Refinamiento de los Modelos
• Se comienza haciendo un modelo por ajuste manual.• Se hacen n modelos permitiendo que cada parámetro
cambie en pequeños incrementos ej.: radio cada 5 Å, ángulos cada 5°.
• Se ordenan de mayor a menor los puntajes obtenidos para cada modelo.
Método Downhill Simplex
• El método de downhill simplex solo encuentra el mínimo local, de tal forma que el mejor modelo puede no ser probado nunca.
• La Simulación de Templado es el equivalente a proporcionar energía térmica al sistema para sobrepasar las barreras energéticas.
Simulación de templado (Simulated annealing)
Reconstrucción
Modelo
Mapas de superficie de la reconstrucción y del mejor modelo de los filamentos de miosina de Tarántula
Demostración (Insight II):•Construcción de pequeñas moléculas (anillo pentabenzénico)•Diferentes tipos de visualización•Optimización (minimización de energía potencial) •Lectura de molécula en formato PDB•Superposisión de estructuras•Alineamiento•Docking
Modelaje Molecular