Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

29
Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

Transcript of Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Page 1: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Bases De Datos En Biología Computacional

Cristian S. Rocha28 de Mayo del 2002

Page 2: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

¿Qué Es Una Base De Datos?

- Objetivos:- Almacenar datos organizados de alguna manera para su

eventual consulta.

- Operaciones básicas:- Ingresar.- Eliminar.- Consultar.

- Propiedades:- Finita.- Organización restringida desde la creación.- Consultas limitadas a la información almacenada.

Page 3: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Ventajas

• Fácil acceso a la información.

• Fuerza la organización de los datos.

• Automatización de operaciones.

Page 4: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Datos Biológicos

• Bibliografía.• Nucleótidos.• Proteínas.• Genoma.• Estructuras.• Alineamientos.• Organismos.• Genes.

• Expresión.• Dominios.• Mapas.• Mutaciones.• Repeticiones.• Anatomía.• ???

Page 5: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Características

• Alta complejidad.

• Gran cantidad y variabilidad de la información.

• Interpretaciones múltiples.

• Consultas impredecibles.

Page 6: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Inserción

• Supone consulta a futuro.

• Supone alguna relación con la BD.

• Formato restringido.

Page 7: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Eliminación

• Nunca se volverá a consultar.

• No se pierde relaciones de interés.

• Mantiene consistencia de la BD.

Page 8: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Consulta

• Formulario o lenguaje de consulta.

• Exacta o inexacta.

• Presentación.

• Tiempo de respuesta.

Page 9: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Tipos

• Analíticas.

• Operacionales.

Page 10: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Bases de datos analíticas

• Optimizada para consultas.

• Los datos están confirmados.

• La información no esta actualizada continuamente.

Page 11: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Bases de datos operacionales

• Optimizadas para la inserción de datos.

• Los datos provienen de un proceso automático o repetitivo, pueden traer error.

• Es información actualizada.

Page 12: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

• Planas.

• Jerárquicas.

• Redes.

• Relaciónales.

• Orientada a objetos.

• Base de objetos.

• Especializadas.

Modelos

Page 13: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Organización

• Centralizada.

• Distribuida.

• Mixta.

Page 14: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Motores De Base De Datos

• Soporte para el diseño y operación de la base de datos.– Diseño: definición de la base de datos y sus

propiedades.– Operación: manejo de la base de datos. Manejo

de los datos.

Page 15: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.
Page 16: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Estado Del Arte

NCBI

EMBL

DDBJ

Tipo: Operacional.Modelo: Relacional.Organización: Centralizada.

Tipo: Analítica.Modelo: Mixtas.

Organización: Distribuida.

Page 17: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Transparencia E Integración

• Transparencia.– El usuario no debe conocer la implementación

de la base de datos.– Para el usuario debe existir una única base de

datos.

• Integración.– Las herramientas deben interactuar con las

consultas de manera transparente.

Page 18: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Limitaciones

• Nadie conoce cual es la mejor implementación.

• Definición de un estándar.

• Problemas políticos.

Page 19: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

MySQL

Base De Datos Local

BDBioPerl

InternetInternet

SQLGUI HTML

HTMLXML

FASTAEtc..

Page 20: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Motores De Base de Datos

• Relaciónales (SQL).– Postgres, mysql, oracle.

• Jerárquicas.– Acedb.

• Especializadas.– Blast.

Page 21: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Ventajas & Limitaciones

• Las consultas están limitadas a la información requerida.

• Las modificaciones solo afectan a la base de datos local.

• No se puede operar directamente sobre la información de la base de datos.

• Las consultas son 100% especializadas.• No existe una única solución.

Page 22: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Bioperl (www.bioperl.org)

• Extensión del lenguaje de programación perl para:– Manejo de secuencias genómicas.– Manejo de diferentes formatos de información.– Intercomunicación de motores de bases de

datos especializadas.

Page 23: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Acedb (www.acedb.org)

• Base datos orientada a objetos con organización jerárquica.

• Especializada para genómas.

• Integra herramientas de visualización.

• Apis a java, perl y C.

Page 24: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Blast (NCBI)

• Motor de base de datos de secuencias de genómicas.

• Archivos planos.

• La inteligencia esta concentrada en los índices.

Page 25: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Roles (1/2)

• Usuarios.– Consultar.– Ingresar datos.

• Analista.– Relevar la información a almacenar.– Diseñar un modelo consistente al problema

planteado.

Page 26: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Roles (2/2)

• Administrador del sistema.– Mantener el sistema funcionando.

• Administrador de la base de datos.– Mantener el motor de base de datos estable.

• Curador.– Clasificar, publicar y chequear la validez de los

datos.

Page 27: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Herramientas de Diseño

• Diagramas Entidad Relación.

• UML.

Page 28: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.

Conclusiones

• No existe una única solución para almacenar datos biológicos.

• Es necesario aprender lenguajes de programación y de consulta.

• Mantener una base de datos biológica necesita mantenimiento constante o la responsabilidad de los usuarios.

Page 29: Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002.