de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/...
Transcript of de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/...
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS
2019
BIMESTRE
11
Nombre del Cuso: FUNDAMENTOS DE BIOINFORMÁTICA Y BIOCOMPUTACIÓN MOLECULAR Código: BBMB101 Créditos: 2.5
Escuela: ESTUDIOS DE POSTGRADO Especialidad a la que pertenece:
Bioinformática y Biocomputación molecular
médica.Docentes: ERWIN CALGUA
Edificio: T-3 Sección: A Salón del curso: AULA VIRTUAL Horario del
curso:08:00 am a 2:00 pm
Horas por semana del curso: 6 horas presenciales por sección
Bimestre: 1 Período: 23 de febrero al 27 de abril de 2019
1. DESCRIPCIÓN DEL CURSO
El curso de bioinformática pretende brindar a los alumnos los conceptos fundamentales en las herramientas bioinformáticas básicas para utilizar bases de datos biológicas/biomédicas y el empleo de distintos paquetes de software para procesar y analizar secuencias de nucleótidos (ADN, ARN) y estructuras de proteínas. Así como brindar una introducción a la programación aplicada a las Ciencias Biológicas en RStudio y VStudio para el análisis de datos biológicos (Desarrollo de sistemas).
2. OBJETIVOS
GENERAL
Que el alumno:
Obtenga los conocimientos necesarios para emplear las herramientas fundamentales para el análisis de datos ómicos y biología computacional.
ESPECÍFICOSQue el estudiante:
• Conozca las bases de datos y programas ya existentes, para el análisis de distintas secuencias biológicas.
• Aplique los conocimientos en bioinformática adquiridos en distintos proyectos de investigación de perfil ómico.
• Obtenga las herramientas básicas para la programación en bioinformática en Rstudio y Visual Studio.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS
2019
BIMESTRE
12
3. COMPETENCIAS TERMINALES
Al finalizar el curso el estudiante desarrolla las siguientes competencias: Comprender, conocer y dominar los fundamentos de la Bioinformática y Bases de datos
biológicas. Demostrar una actitud de respeto y tolerancia en la propuesta de una nueva mentalidad,
abierta, democrática y eminentemente participativa, hacia el trabajo multidisciplinario para las tecnologías convertentes como la Bioinformática.
4. CONTENIDO TEMÁTICO DEL CURSO
Unidad Tema
IIntroducción a la Bioinformática yBiocomputación, BiologíaComputacional.
II Bases de datos Primarias (Biológicas/Biomédicas)
III Bases de datos Secundarias y mixtas.IV Análisis de secuencias biológicas.
V Análisis Bioinformático de formatos yGenomas (Bacteriales y Humanos)
VIAnálisis Bioinformático de datos High-Throughput de NGS y microarreglos(MicroArrays).
VII Bionformática estructural de proteínas
VIII Introducción al R y RStudio.VIX RStudio IX RStudio IIXI RStudio IIIXII RStudio IVXIII RStudio VXIV RStudio VIXV RStudio VIIXVI Galaxy IXVII Galaxy IIXVIII VStudio
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS
2019
BIMESTRE
13
5. CRONOGRAMA DE ACTIVIDADES
Sesi
ón
Fech
a
Objetivo de la sesión Contenidos a desarrollar Actividad Evaluación
Sesi
ón N
o.1
Fech
a: m
arzo
23
de 2
019
Abordar el tema: I al VII
I Introducción a la Bioinformática yBiocomputación, BiologíaComputacional. Definición, conceptos,variables, tipos de datos, tecnologías NGS,secuenciación de genomas y exomas,microarrays, espectrometría de masas,aplicaciones en la clínica. Elementos desecuencias genéticas y proteínas.
II Bases de datos Primarias (Biológicas/Biomédicas)Ingeniería de Software y BD (SQL). Flujos deinformación biológica. Definición de bases dedatos primarias. Visión histórica de lacreación de las mismas. Protocolos y gestiónBDB. Funcionamiento de las Bases dedatos: índices, campos, métodos debúsqueda. Bases de datos de proteínas.Bases de datos de ADN. Bases de datos devariantes genómicas. Ejemplos de bases dedatos primarias: Genebank, EMBL, Swiss-Prot, TrEMBL, PDB.
III Bases de datos Secundarias y mixtas.Definición de bases de datos secundarias.Construcción de bases de secundarias. Elproblema de los falsos positivos/negativos.Modelos ocultos de Markov. Ejemplos debases de Datos secundarias: Pfam, Gene-Ontology, UniProt, PRINTS, GO, ProSIte.Algoritmos, complejidad y heurísticas.Diseño y mantenimiento de bases de Datossecundarias. Bases de rutas metabólicas,Bases de datos de Biología de Sistemas. ej:Reactome, HGMD, SNPs-Nota: Se realizará una práctica general delas principales bases de datosbioinformáticas (primarias, secundarias yterciarias).
IV Análisis de secuencias biológicas.Análisis de secuencias en ADN yARN.Introducción de probabilidad yestadística. Alineamiento global por pares.Alineamiento Local y Múltiple. Generación deMatrices de score (BLOSUM, PAM). Dot-Plot. Programación dinámica. Programas dealineamiento: BLAST. FASTA/ FASTQ.Búsquedas en bases de datos por similitud yhomología de secuencia. Patrones desecuencias y perfiles. Dendogramas yFilogenia molecular. PSI-BLAST, PHIBLAST,Mega-Blast.
V Análisis Bioinformático de formatos y
Conferencia/Clase Magistral
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS
2019
BIMESTRE
14
Genomas (Bacteriales y Humanos)Análisis de los formatos de informaciónbiológica. Ensamblado y anotación defuncional, molecular y estructural degenomas, predicción de genes, Bidireccionalbest Hits y Iterative predictive Blast. Base dedatos de Genomas. Mapeo físico yreferencial de genes. Uso de GenomeBrowsers (NCBI), Ensembl y Galaxy (webservers). Comparación de Genomas(Genómica comparativa y evolutiva).
VI Análisis Bioinformático de datos High-Troughput de NGS y microarreglos(MicroArrays).Introducción al NGS. Computación biológica.Sistemas de Secuenciación masiva (NGS oMPS). Elementos y funcionamiento de unNGS: Reads, converturas y ensamblaje.Introducción a los MicroArrays, Análisisestadístico de significancia de los datos,Análisis de expresión y diferencial porMicroArrays, definición de estado metabólico(expresoma, proteoma y metaboloma),MicroArrays específicos sobre splicingalternativo (exon arrays, splicing sensitivearrays), MicroArrays de Glicómica. Eje:BABELOMICS (Sistemas Web).
VII Bionformática estructural de proteínasRepaso de Estructura de Proteínas.Predicción de estructura secundaria, DSSP.Métodos de resolución de proteínas, Análisisbioinformático de estructuras, alineamientoestructural. Predicción de estructuraterciaria. Threading. Modelado comparativo.Métodos ab-initio. Búsqueda de motivosestructurales.
Sesi
ón N
o.2
Fech
a: 3
0 m
arzo
30
de 2
019
Abordar el tema: VII al XVIII
VIII Introducción al R y RStudio. Entorno UNIX.Programación en RStudio y VStudio.
IX RStudio I: Comandos, Variables,Operadores, vectores y tipos de datos enbioinformática.
X Rstudio II: Librerías, módulos y funciones.
XI Rstudio III: Matrices, tipos de archivos,exportación de datos biológicos a Rstudio.
XII Rstudio IV: Generación de gráficos:HEATMAP de datos de expresión génicos.
XIII Rstudio V: Análisis de datos genéticos.Frecuencias, estructuras, ciclados.
XIV Rstudio VI: Análisis de datos ensecuenciación masiva. Extracción de datosde NGS y análisis de calidad.
XV RStudio VII: Preparación de archivos paraensamblaje genómico. Filtros y cortesmediante umbrales.
XVI GALAXY I: Transformación de formatosNGS.
XVII GALAXY II: Calidad y filtrado NGS.
XVIII Fundamentos de V Studio en genética
Conferencia/Clase magistral
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS
2019
BIMESTRE
15
(prácticas diversas).Ejemplo de Nano- biotecnología molecular.
XIX PROYECTO FINAL
6. NOTA DE PROMOCIÓN Y EVALUACIÓN DEL RENDIMIENTO ACADÉMICO
La nota de promoción es de 70 puntos en una escala de 0 a 100 puntos, de acuerdo con el Reglamento del sistema de Estudios de Postgrado de la USAC. La asistencia debe ser de al menosel 85%. La zona es de 70 puntos y la evaluación final es de 30 puntos, no hay exámenes de recuperación.
Clases magistrales: Proyecto final. 100%.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS
2019
BIMESTRE
16
7. BIBLIOGRAFÍA
Orozco A. Informática Biomédica en Costa Rica. 2015. Programa de la Sociedad de la Información y el Conocimiento (PROSIC). Editorial Lil, pp. 333-367.
Orozco A. Nanotecnología y Tic en Costa Rica. 2014. Programa de la Sociedad de la Información y el Conocimiento (PROSIC). Editorial Lil, pp. 235-279.
Orozco A. Bioinformática en Costa Rica. 2013. Programa de la Sociedad de la Información y el Conocimiento (PROSIC). Editorial Lil, pp. 229-253.
Solano A, Alfaro V, Cruz C & Orozco A. 2018. Visualization Portal of Genetic Variation (VizGVar): A Tool for Interactive Visualization of SNPs and Somatic Mutations in Exons, Genes and Protein domains. Bioinformatics 34(6), pp. 1048-1049.
Orozco A & Valverde C, J. 2015. Diseño de sistemas bioinformáticos y nanotecnología molecular médica, Revista Digital Universitaria UNAM 16(9), pp. 10.