Bases De Datos En Biología Computacional

Post on 19-Mar-2016

58 views 0 download

description

Bases De Datos En Biología Computacional. Cristian S. Rocha 28 de Mayo del 2002. ¿Qué Es Una Base De Datos?. Objetivos: Almacenar datos organizados de alguna manera para su eventual consulta. Operaciones básicas: Ingresar. Eliminar. Consultar. Propiedades: Finita. - PowerPoint PPT Presentation

Transcript of Bases De Datos En Biología Computacional

Bases De Datos En Biología Computacional

Cristian S. Rocha28 de Mayo del 2002

¿Qué Es Una Base De Datos?- Objetivos:

- Almacenar datos organizados de alguna manera para su eventual consulta.

- Operaciones básicas:- Ingresar.- Eliminar.- Consultar.

- Propiedades:- Finita.- Organización restringida desde la creación.- Consultas limitadas a la información almacenada.

Ventajas

• Fácil acceso a la información.• Fuerza la organización de los datos.• Automatización de operaciones.

Datos Biológicos

• Bibliografía.• Nucleótidos.• Proteínas.• Genoma.• Estructuras.• Alineamientos.• Organismos.• Genes.

• Expresión.• Dominios.• Mapas.• Mutaciones.• Repeticiones.• Anatomía.• ???

Características

• Alta complejidad.• Gran cantidad y variabilidad de la

información.• Interpretaciones múltiples.• Consultas impredecibles.

Inserción

• Supone consulta a futuro.• Supone alguna relación con la BD.• Formato restringido.

Eliminación

• Nunca se volverá a consultar.• No se pierde relaciones de interés.• Mantiene consistencia de la BD.

Consulta

• Formulario o lenguaje de consulta.• Exacta o inexacta.• Presentación.• Tiempo de respuesta.

Tipos

• Analíticas.• Operacionales.

Bases de datos analíticas

• Optimizada para consultas.• Los datos están confirmados.• La información no esta actualizada

continuamente.

Bases de datos operacionales

• Optimizadas para la inserción de datos.• Los datos provienen de un proceso

automático o repetitivo, pueden traer error.• Es información actualizada.

• Planas.• Jerárquicas.• Redes.• Relaciónales.• Orientada a objetos.• Base de objetos.• Especializadas.

Modelos

Organización

• Centralizada.• Distribuida.• Mixta.

Motores De Base De Datos

• Soporte para el diseño y operación de la base de datos.– Diseño: definición de la base de datos y sus

propiedades.– Operación: manejo de la base de datos. Manejo

de los datos.

Estado Del Arte

NCBI

EMBL

DDBJ

Tipo: Operacional.Modelo: Relacional.Organización: Centralizada.

Tipo: Analítica.Modelo: Mixtas.

Organización: Distribuida.

Transparencia E Integración

• Transparencia.– El usuario no debe conocer la implementación

de la base de datos.– Para el usuario debe existir una única base de

datos.• Integración.

– Las herramientas deben interactuar con las consultas de manera transparente.

Limitaciones

• Nadie conoce cual es la mejor implementación.

• Definición de un estándar.• Problemas políticos.

MySQL

Base De Datos Local

BDBioPerl

Internet

SQLGUI HTML

HTMLXML

FASTAEtc..

Motores De Base de Datos

• Relaciónales (SQL).– Postgres, mysql, oracle.

• Jerárquicas.– Acedb.

• Especializadas.– Blast.

Ventajas & Limitaciones

• Las consultas están limitadas a la información requerida.

• Las modificaciones solo afectan a la base de datos local.

• No se puede operar directamente sobre la información de la base de datos.

• Las consultas son 100% especializadas.• No existe una única solución.

Bioperl (www.bioperl.org)

• Extensión del lenguaje de programación perl para:– Manejo de secuencias genómicas.– Manejo de diferentes formatos de información.– Intercomunicación de motores de bases de

datos especializadas.

Acedb (www.acedb.org)

• Base datos orientada a objetos con organización jerárquica.

• Especializada para genómas.• Integra herramientas de visualización.• Apis a java, perl y C.

Blast (NCBI)

• Motor de base de datos de secuencias de genómicas.

• Archivos planos.• La inteligencia esta concentrada en los

índices.

Roles (1/2)

• Usuarios.– Consultar.– Ingresar datos.

• Analista.– Relevar la información a almacenar.– Diseñar un modelo consistente al problema

planteado.

Roles (2/2)

• Administrador del sistema.– Mantener el sistema funcionando.

• Administrador de la base de datos.– Mantener el motor de base de datos estable.

• Curador.– Clasificar, publicar y chequear la validez de los

datos.

Herramientas de Diseño

• Diagramas Entidad Relación.• UML.

Conclusiones

• No existe una única solución para almacenar datos biológicos.

• Es necesario aprender lenguajes de programación y de consulta.

• Mantener una base de datos biológica necesita mantenimiento constante o la responsabilidad de los usuarios.