Bases De Datos En Biología Computacional

29
Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002

description

Bases De Datos En Biología Computacional. Cristian S. Rocha 28 de Mayo del 2002. ¿Qué Es Una Base De Datos?. Objetivos: Almacenar datos organizados de alguna manera para su eventual consulta. Operaciones básicas: Ingresar. Eliminar. Consultar. Propiedades: Finita. - PowerPoint PPT Presentation

Transcript of Bases De Datos En Biología Computacional

Page 1: Bases De Datos En Biología Computacional

Bases De Datos En Biología Computacional

Cristian S. Rocha28 de Mayo del 2002

Page 2: Bases De Datos En Biología Computacional

¿Qué Es Una Base De Datos?- Objetivos:

- Almacenar datos organizados de alguna manera para su eventual consulta.

- Operaciones básicas:- Ingresar.- Eliminar.- Consultar.

- Propiedades:- Finita.- Organización restringida desde la creación.- Consultas limitadas a la información almacenada.

Page 3: Bases De Datos En Biología Computacional

Ventajas

• Fácil acceso a la información.• Fuerza la organización de los datos.• Automatización de operaciones.

Page 4: Bases De Datos En Biología Computacional

Datos Biológicos

• Bibliografía.• Nucleótidos.• Proteínas.• Genoma.• Estructuras.• Alineamientos.• Organismos.• Genes.

• Expresión.• Dominios.• Mapas.• Mutaciones.• Repeticiones.• Anatomía.• ???

Page 5: Bases De Datos En Biología Computacional

Características

• Alta complejidad.• Gran cantidad y variabilidad de la

información.• Interpretaciones múltiples.• Consultas impredecibles.

Page 6: Bases De Datos En Biología Computacional

Inserción

• Supone consulta a futuro.• Supone alguna relación con la BD.• Formato restringido.

Page 7: Bases De Datos En Biología Computacional

Eliminación

• Nunca se volverá a consultar.• No se pierde relaciones de interés.• Mantiene consistencia de la BD.

Page 8: Bases De Datos En Biología Computacional

Consulta

• Formulario o lenguaje de consulta.• Exacta o inexacta.• Presentación.• Tiempo de respuesta.

Page 9: Bases De Datos En Biología Computacional

Tipos

• Analíticas.• Operacionales.

Page 10: Bases De Datos En Biología Computacional

Bases de datos analíticas

• Optimizada para consultas.• Los datos están confirmados.• La información no esta actualizada

continuamente.

Page 11: Bases De Datos En Biología Computacional

Bases de datos operacionales

• Optimizadas para la inserción de datos.• Los datos provienen de un proceso

automático o repetitivo, pueden traer error.• Es información actualizada.

Page 12: Bases De Datos En Biología Computacional

• Planas.• Jerárquicas.• Redes.• Relaciónales.• Orientada a objetos.• Base de objetos.• Especializadas.

Modelos

Page 13: Bases De Datos En Biología Computacional

Organización

• Centralizada.• Distribuida.• Mixta.

Page 14: Bases De Datos En Biología Computacional

Motores De Base De Datos

• Soporte para el diseño y operación de la base de datos.– Diseño: definición de la base de datos y sus

propiedades.– Operación: manejo de la base de datos. Manejo

de los datos.

Page 15: Bases De Datos En Biología Computacional
Page 16: Bases De Datos En Biología Computacional

Estado Del Arte

NCBI

EMBL

DDBJ

Tipo: Operacional.Modelo: Relacional.Organización: Centralizada.

Tipo: Analítica.Modelo: Mixtas.

Organización: Distribuida.

Page 17: Bases De Datos En Biología Computacional

Transparencia E Integración

• Transparencia.– El usuario no debe conocer la implementación

de la base de datos.– Para el usuario debe existir una única base de

datos.• Integración.

– Las herramientas deben interactuar con las consultas de manera transparente.

Page 18: Bases De Datos En Biología Computacional

Limitaciones

• Nadie conoce cual es la mejor implementación.

• Definición de un estándar.• Problemas políticos.

Page 19: Bases De Datos En Biología Computacional

MySQL

Base De Datos Local

BDBioPerl

Internet

SQLGUI HTML

HTMLXML

FASTAEtc..

Page 20: Bases De Datos En Biología Computacional

Motores De Base de Datos

• Relaciónales (SQL).– Postgres, mysql, oracle.

• Jerárquicas.– Acedb.

• Especializadas.– Blast.

Page 21: Bases De Datos En Biología Computacional

Ventajas & Limitaciones

• Las consultas están limitadas a la información requerida.

• Las modificaciones solo afectan a la base de datos local.

• No se puede operar directamente sobre la información de la base de datos.

• Las consultas son 100% especializadas.• No existe una única solución.

Page 22: Bases De Datos En Biología Computacional

Bioperl (www.bioperl.org)

• Extensión del lenguaje de programación perl para:– Manejo de secuencias genómicas.– Manejo de diferentes formatos de información.– Intercomunicación de motores de bases de

datos especializadas.

Page 23: Bases De Datos En Biología Computacional

Acedb (www.acedb.org)

• Base datos orientada a objetos con organización jerárquica.

• Especializada para genómas.• Integra herramientas de visualización.• Apis a java, perl y C.

Page 24: Bases De Datos En Biología Computacional

Blast (NCBI)

• Motor de base de datos de secuencias de genómicas.

• Archivos planos.• La inteligencia esta concentrada en los

índices.

Page 25: Bases De Datos En Biología Computacional

Roles (1/2)

• Usuarios.– Consultar.– Ingresar datos.

• Analista.– Relevar la información a almacenar.– Diseñar un modelo consistente al problema

planteado.

Page 26: Bases De Datos En Biología Computacional

Roles (2/2)

• Administrador del sistema.– Mantener el sistema funcionando.

• Administrador de la base de datos.– Mantener el motor de base de datos estable.

• Curador.– Clasificar, publicar y chequear la validez de los

datos.

Page 27: Bases De Datos En Biología Computacional

Herramientas de Diseño

• Diagramas Entidad Relación.• UML.

Page 28: Bases De Datos En Biología Computacional

Conclusiones

• No existe una única solución para almacenar datos biológicos.

• Es necesario aprender lenguajes de programación y de consulta.

• Mantener una base de datos biológica necesita mantenimiento constante o la responsabilidad de los usuarios.

Page 29: Bases De Datos En Biología Computacional