Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

37
DESARROLLO E IMPLEMENTACIÓN DE UNA PLATAFORMA BIOINFORMÁTICA PARA ANÁLISIS RNA-SEQ BASADA EN GALAXY Autores: Cristian Alejandro Rojas Luis Miguel Gutierrez Dirigido por: M.Sc Nelson Enrique Vera

description

Presentación sustentación trabajo de grado

Transcript of Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Page 1: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

DESARROLLO E IMPLEMENTACIÓN DE UNA PLATAFORMA BIOINFORMÁTICA

PARA ANÁLISIS RNA-SEQ BASADA EN GALAXY

Autores: Cristian Alejandro Rojas Luis Miguel Gutierrez

Dirigido por: M.Sc Nelson Enrique Vera

Page 2: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Agenda❏ Introducción❏ Formulación del problema❏ Metodología❏ Resultados❏ Conclusiones❏ Trabajos futuros

Page 3: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

INTRODUCCIÓN

Page 4: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Convenio IGUN-CECAD

Page 5: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Artículos GeneradosIGUN

❏ The Transcriptome of the Caribbean Reef-building Coral Diploria strigosa Reveals a Highly Complex Immune Repertoire.

❏ THE TRANSCRIPTOME OF Hydractinia symbiolongicarpus REVEALS A COMPLEX IMMUNE SYSTEM.

U. Distrital❏ Automatic BLAST for Massive Sequencing - ABMS, Proceedings of the

2nd Colombian Congress on Computational Biology and Bioinformatics (CCBCOL).

❏ MAFA: A web based software to automate functional annotation of genomes and transcriptomes. Tecnura.

Page 6: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Ponencias

❏ LACCEI 2013, Cancún-México, Automatic BLAST for Massive Sequencing - ABMS

❏ CCBCOL 2013, Manizales-Colombia, Presentation and Evaluation of ABMS (Automatic Blast for Massive Sequencing)

❏ IWBBIO 2014, Granada-España, Massive Automatic Functional Annotation MAFA

Page 7: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

FORMULACIÓN DEL PROBLEMA

Page 8: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Evolución de la secuenciaciónMétodo de Sanger: Secuenciación por Dideoxinucleótidos

NGS - Next Generation Sequencing: High-throughput sequencing

Datos tomados de: http://www.the-scientist.com/?articles.view/articleNo/15939/title/DNA-Sequencing-Industry-Sets-its-Sights-on-the-Future/

U$2400 por1M bases

U$0.05 - U$0.15 Por 1M bases

Hasta 52.5 Kbases por corrida

Hasta 600 Gbases por corrida

Page 9: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

RNA-Seq

Aplicaciones clínicas y biomédicas.Facilitar estudio de otros organismos.

Datos tomados de: http://www.rna-seqblog.com/rna-seq-library-prep-introduction/

El RNA-Seq es un poderoso método de descubrimiento, perfilamiento y cuantificación de transcritos de ARN.

Page 10: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Principales dificultades de un análisis RNA-Seq

Page 11: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Principales dificultades de un análisis RNA-Seq

❏ Se requiere de computación de alto desempeño para su ejecución.

❏ Herramientas no amigables para el usuario.❏ Formatos de entrada y salida confusos para un

usuario final.❏ El usuario debe saber e integrar etapas del

proceso.

Page 12: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Formulación del problema

¿Cómo diseñar y desarrollar una herramienta que integre, automatice y facilite el análisis de

de datos transcriptómicos?

Page 13: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Justificación

Nuevas áreas de investigaciónFortalece estudio de mecanismos de respuesta inmune en varios organismos.

Page 14: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Objetivo generalDesarrollar una plataforma bioinformática basada en Galaxy orientada al análisis de datos RNA-Seq de acuerdo a las necesidades del Grupo de Inmunología Evolutiva (GIE) del Instituto de Genética de la Universidad Nacional (IGUN), haciendo uso del Centro de Cómputo de Alto Desempeño de la Universidad Distrital (CECAD).

Page 15: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Objetivos específicos❏ Estudiar los procesos que hacen parte de un análisis RNA-

Seq.❏ Diseñar un pipeline que automatice los procesos

normalmente usados en un análisis RNA-Seq.❏ Integrar herramientas bioinformáticas requeridas para

realizar un análisis RNA-Seq.❏ Desplegar en producción la plataforma desarrollada en un

servidor del CECAD para el público en general y así fortalecer la imagen de investigación de la Universidad Distrital.

Page 16: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

METODOLOGÍAEstudio de

requerimientos

Diseño de arquitectura y selección de herramientas

Implementación, configuración, personalización e integración de herramientas a la plataforma

Acondicionamiento de infraestructura

DocumentaciónEvaluación

Procesos necesarios para RNA-Seq y requerimientos de la plataforma

Listado de herramientas a integrar

Equipo con herramientas instaladas

Plataforma funcional

Documentación técnica y de usuario

Satisfacción de requerimientos y cuadro comparativo.

Page 17: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Análisis de requerimientos❏ Reuniones con los investigadores del IGUN.❏ Se evidenciaron las siguientes necesidades principales:

❏ Soporte de todos los procesos de análisis transcriptómico.

❏ Interfaz de usuario amigable.❏ Contar con gestión de usuarios.

Page 18: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Selección de herramientas❏ Búsqueda de herramientas bioinformáticas disponibles

para cada proceso. Revisión de bibliotecas digitales (Pubmed), journals y foros dedicados a bioinformática.

❏ Selección de herramientas por su aceptación en la comunidad científica.

❏ Búsqueda de plataforma base que permitiera la solución del problema formulado.

Page 19: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

RESULTADOS

Page 20: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Flujo de trabajo

Page 21: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Arquitectura general

Page 22: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de preprocesamiento

Page 23: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de preprocesamiento

Page 24: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de mapeo

Page 25: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de Mapeo

Page 26: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de ensamblaje

Page 27: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de ensamblaje

Page 28: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de anotación

Page 29: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de anotación

Page 30: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de expresión diferencial

Page 31: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de expresión diferencial

Page 32: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de estimación de abundancia

Page 33: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Módulo de estimación de abundancia

Page 34: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Utilidades

● Samtools○ Organización, mezcla, indexación.

● CummeRbund○ Acceso, exploración, graficación.

● EMBOSS: Transeq○ Traduce secuencias a péptidos

Page 36: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Trabajos futuros

● Escalabilidad horizontal○ Sistema distribuido

● Herramientas ○ Aprendizaje de máquina

Page 37: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Conclusiones● Se logró diseñar un pipeline que automatiza los procesos que hacen parte

de un análisis RNA-Seq, a partir del estudio de dichos procesos.

● Se desarrolló y puso en producción un software que Integra herramientas bioinformáticas requeridas para realizar un análisis RNA-Seq.

● Se encontraron posibles trabajos futuros para mejorar la eficiencia de la plataforma y ampliar el área de trabajo en bioinformática.