Introduccion a la bioinfo.

39
Introducción a la Bioinformática Introducción a la Bioinformática

Transcript of Introduccion a la bioinfo.

Page 1: Introduccion a la bioinfo.

Introducción a la BioinformáticaIntroducción a la Bioinformática

Centro de BioinformáticaCentro de BioinformáticaInstituto de BiotecnologíaInstituto de Biotecnología

Universidad Nacional de ColombiaUniversidad Nacional de Colombia

Andrés M. PinzónAndrés M. PinzóncPhD - Universidad de los AndescPhD - Universidad de los Andes

Page 2: Introduccion a la bioinfo.

7'000.000 de habitantes

Capital Mundial del Libro 2007

2600m sobre el nivel del mar

Page 3: Introduccion a la bioinfo.
Page 4: Introduccion a la bioinfo.
Page 5: Introduccion a la bioinfo.

““Actualmente en Biología el número de datos es Actualmente en Biología el número de datos es mucho mayor a la capacidad de análisis del mucho mayor a la capacidad de análisis del

investigador”.investigador”.

1958 Primera secuencia de una proteína (insulina. Sanger, Premio Nobel)1

1975 Primera secuencia de ADN (fago PHI-X174 Sanger, Nobel 1980 )

1 http://www.genetics.org/cgi/content/full/162/2/527

1986 desarrollo de PCR

... ... inicio de la era genómica!!inicio de la era genómica!!

Page 6: Introduccion a la bioinfo.

BD para las ciencias de la vidaBD para las ciencias de la vida

● DNADNA● ProteínasProteínas● GenómicasGenómicas● Dominios/familias protéicas Dominios/familias protéicas ● Mutación/polimorfismoMutación/polimorfismo● Proteómica (2D gel, MS)Proteómica (2D gel, MS)● 3D estructura3D estructura● MetabolismoMetabolismo● BibliografíaBibliografía● SNPs, ESTs, Microsatélites, etc..SNPs, ESTs, Microsatélites, etc..●

Page 7: Introduccion a la bioinfo.

Algunas estadísticasAlgunas estadísticas

● Más de 1000 bases de datos● Generalmente accesibles vía WEB

● Biohunt: http://www.expasy.org/BioHunt/● Amos’ links: www.expasy.ch/alinks.html

● Tamaño variable: 100Kb a 100Gb● DNA (EMBL): > 68 Gb (comprimida!)● 80,591,891 entradas.● 146,595,277,574 nucleótidos.

Page 8: Introduccion a la bioinfo.

Crecimiento de la base datos EMBL en gigabases.

Page 9: Introduccion a la bioinfo.

Crecimiento de la base datos EMBL en millones de entradas.

Page 10: Introduccion a la bioinfo.

Sin embargo...

Tenemos las secuencias pero...

¿Como podemos saber qué partes de ese DNA controlan los diversos procesos químicos de la vida?

Conocemos la función y estructura de algunas proteínas pero...

Cómo determinamos nuevas funciones? Como predecir la conformación espacial de una proteína, basados únicamente en su secuencia?

Entendemos el código genético pero...

Como encontrar nuevas palabras significativas que podamos añadir al diccionario del DNA?

Page 11: Introduccion a la bioinfo.

BIOINFORMÁTICABIOINFORMÁTICA

Biología ComputacionalAplicación de técnicas analíticas y cuantitativas para el modelamiento de sistemas biológicos.

"La bioinformática comprende los métodos matemáticos, estadísticos y computacionales que pretenden solucionar problemas biológicos usando secuencias de ADN y aminoácidos e información relacionada". Fredj Tekaia - Instituto Pasteur

“La bioinformática es el estudio de la información biológica desde su almacenamiento en el genoma hasta la obtención de los productos génicos en la célula” esto involucra la creación y desarrollo de tecnologías informáticas y computacionales para la resolución de problemas en biología molecular”.

Stanford Center for Profesional Development, 2002

Page 12: Introduccion a la bioinfo.

Uso de técnicas computacionales, Uso de técnicas computacionales, matemáticas y estadísticas para el matemáticas y estadísticas para el

análisis, interpretación y análisis, interpretación y generacióngeneración de datos biológicos. de datos biológicos.

Nuestra definición...Nuestra definición...

CARACTERISTICAS:● INTERDISCIPLINA Y COLABORACIÓN

ENTRE GRUPOS.● INTEROPERATIVIDAD E

INTERDEPENDENCIA DE LOS DATOS.● FORMACIÓN DE REDES.

Page 13: Introduccion a la bioinfo.

● Quienes?Quienes?● Para qué?Para qué?● Qué?Qué?● Cómo?Cómo?

Page 14: Introduccion a la bioinfo.

¿Qué personas pueden hacer Bioinformática?¿Qué personas pueden hacer Bioinformática?

Necesario: Conocimiento y entendimiento del Dogma Central de la Biología

molecular. Conocimiento en Biología Molecular (bioquímica, biología molecular,

biofísica molecular).

Muuuuuuuuuuy recomendado: Conocimiento en el manejo de sistemas de cómputo.

Recomendado: Manejo básico de linea de comandos en ambientes UNIX

(GNU/Linux).

Muy deseable: Experiencia con algún lenguaje de programación.

Page 15: Introduccion a la bioinfo.

¿Qué se busca con el uso de ¿Qué se busca con el uso de la Bioinformática?la Bioinformática?

“Profundizar en nuestro entendimiento acerca de los

organismos vivos y sus relaciones, partiendo desde el

genoma que les codifica”.

Page 16: Introduccion a la bioinfo.

Genómica comparativa. Análisis de DNA (ORFs, Contenidos GC, etc). Recuperación de secuencias. Ensamblaje de secuencias. Predicción de estructuras protéicas. Visualización de estructuras protéicas. Microarreglos. PCR. Filogenia. Educación.

Los análisis potenciales en el campo de la Los análisis potenciales en el campo de la Biología molecular son tan diversos como la Biología molecular son tan diversos como la

vida misma.vida misma.

La bioinformática provee algoritmos, bases de La bioinformática provee algoritmos, bases de datos, interfaces y herramientas estadísticas para datos, interfaces y herramientas estadísticas para

resolver nuestras preguntas!resolver nuestras preguntas!

Page 17: Introduccion a la bioinfo.

Bioinformática y “ómicas”Bioinformática y “ómicas”

➢Genómica: Estudia el genoma de los organimos. Uso sistemático de la información genómica y su asociación con otros datos.➢Transcriptómica: transcriptoma es el conjunto de todos los mRNAs (o transcriptos), dado un conjunto de condiciones externas. El genoma es fijo (ok, existe polimorfismo genético!) el transcriptoma varia dependiendo del contexto.➢Proteómica: es el estudio a gran escala de las proteínas, particularmente su estructura y función.➢Metabolómica: estudia el conjunto completo de metabolitos (intermediarios metabólicos, hormonas, metabolitos secundarios etc.) encontrados en una muestra biológica, por ejemplo un organismo.

Page 18: Introduccion a la bioinfo.

Genómica comparativaGenómica comparativa

Alineamiento de genes de diferentes especies buscando Alineamiento de genes de diferentes especies buscando secuencias en común.secuencias en común.

➔Relaciones evolutivas.➔Clasificación de familias de genes.➔Tiempos de divergencia.

Page 19: Introduccion a la bioinfo.

Genómica comparativaGenómica comparativa

Page 20: Introduccion a la bioinfo.

Alineamiento de genes de iguales especies Alineamiento de genes de iguales especies buscando regiones en común.buscando regiones en común.

➔Identificación de polimorfismos.➔Medicamentos personalizados (farmacogenética/farmacogenómica).➔Tratamiento de enfermedades a nivel genético.

Genómica comparativaGenómica comparativa

Mismas herramientas ... preguntas diferentes!

Page 21: Introduccion a la bioinfo.
Page 22: Introduccion a la bioinfo.

Genómica funcionalGenómica funcional

¿Qué genes se expresan, dónde, cuando, ¿Qué genes se expresan, dónde, cuando, función?función?

MicroarreglosMicroarreglos

Page 23: Introduccion a la bioinfo.

Alineamiento de secuenciasAlineamiento de secuencias

Page 24: Introduccion a la bioinfo.

Recuperación de secuenciasRecuperación de secuencias

Page 25: Introduccion a la bioinfo.

http://www.ncbi.nlm.nih.gov/http://www.ncbi.nlm.nih.gov/

Page 26: Introduccion a la bioinfo.

http://www.ebi.ac.uk/embl/http://www.ebi.ac.uk/embl/

Page 27: Introduccion a la bioinfo.

http://srs.ibun.unal.edu.co:8080/srs81/http://srs.ibun.unal.edu.co:8080/srs81/

Page 28: Introduccion a la bioinfo.

Visualización de estructuras protéicasVisualización de estructuras protéicas

¿Visualización o predicción?¿Visualización o predicción?

GARLIGARLICC

Page 29: Introduccion a la bioinfo.

MLDTNMKTQLKAYLEKLTKPVELIATLDDSAKSAEIKELLTKPVELIATLDDSAEIKELLSAIAMLKSAEIKELLAEIKELLLKAYLEKLTKPMLDTNMKTQLKKSAEIKELLKSAEIKELL

Cristalografía de

Rayos X

● Modelamiento homólogo (modelamiento comparativo).● Métodos Ab initio (ej. campos de fuerza)

Predicción 2D

¿Predicción o ¿Predicción o determinación?determinación?

Page 30: Introduccion a la bioinfo.

Análisis FilogenéticosAnálisis Filogenéticos

Evolución molecular de familias de proteínas

Creación de árboles taxonómicos

Reconstrucción evolutiva de rutas metabólicas.

- QuickTree: Reconstrucción de árboles filogenéticos.- Phylip (Phylogenie Inference Package).-Mavric (Python): Manipulación y visualización de árboles.- PAUP.

Page 31: Introduccion a la bioinfo.

Ensamblaje de SecuenciasEnsamblaje de Secuencias

Page 32: Introduccion a la bioinfo.

Nuestra BioinformáticaNuestra Bioinformática

http://bioinf.ibun.unal.edu.cohttp://bioinf.ibun.unal.edu.co

Page 33: Introduccion a la bioinfo.
Page 34: Introduccion a la bioinfo.

Biodiversidad y BioinformáticaBiodiversidad y Bioinformática

Page 35: Introduccion a la bioinfo.

33308 especies registradas.413983 registros en Uniprot.Corresponden a: 11779 (35.4%).

11212 registros en EMBL.

Biodiversidad y BioinformáticaBiodiversidad y Bioinformática

Page 36: Introduccion a la bioinfo.
Page 37: Introduccion a la bioinfo.

Microsatellites in Phytophtora ESTs: Survey, transferability and Microsatellites in Phytophtora ESTs: Survey, transferability and association with pathogenesis related genesassociation with pathogenesis related genes

Búsqueda e identificación de nuevos candidatos a vacuna Búsqueda e identificación de nuevos candidatos a vacuna contra la Malaria producida por contra la Malaria producida por Plasmodium vivaxPlasmodium vivax..

Búsqueda de dominios específicos para la clase Hexápoda Búsqueda de dominios específicos para la clase Hexápoda (Phylum Artrópoda).(Phylum Artrópoda).

Modelo para la identificación de genes para Betalactamasas Modelo para la identificación de genes para Betalactamasas de espectro extendido.de espectro extendido.

Sequence Retrieve System Federation.Sequence Retrieve System Federation.

Algunos de nuestros proyectos...Algunos de nuestros proyectos...

Page 38: Introduccion a la bioinfo.
Page 39: Introduccion a la bioinfo.

...Preguntas?...Preguntas?