Capitulo 8 Fundamentos de Administracion de Base de Datos

22
 UNIVERSIDAD DE COST A RICA

Transcript of Capitulo 8 Fundamentos de Administracion de Base de Datos

UNIVERSIDAD DE COSTA RICA

UNIVERSIDAD DE COSTA RICACapitulo 8

Capitulo 8 Fundamentos de la administracin de bases de datos

ESTRUCTURACIN DE LA INFORMACIN

ARCHIVOS CONVENCIONALES O PLANOS

Dependencia de datos-programas La redundancia de los datos La integridad de los datos

BASES DE DATOS Definicin: Una serie de datos organizados y relacionados entre s, los cuales son recolectados y explotados por los sistemas de informacin de una empresa. Componentes de las bases de datos

Datos Hardware

-Software -Usuarios

VENTAJAS DEL USO DE BASES DE DATOS Globalizacin de la informacin Eliminacin de informacin redundante

Eliminacin de informacin incongruente Permite compartir informacin

Permite mantener la integridad de la informacin Independencia de datos

SISTEMA MANEJADOR DE BASES DE DATOS (DBMS) DBMS: Es un conjunto de programas que se encargan de manejar la creacin y todos los accesos a las bases de datos. Se compone de cuatro mdulos bsicos:El DDL: Lenguaje de definicin de datos El DML: Lenguaje de manipulacin de datos

SQL: Lenguaje de consulta

EL ADMINISTRADOR DE BASE DE DATOS (DBA) DBA: Es la persona encargada de definir y controlar las bases de datos corporativas y dar asesora a usuarios en general

FUNCIONES DEL DBA Asesorar en la adquisicin del DBMS Definir la informacin de las bases de datos corporativas Mantener la comunicacin con el proveedor del DBMS Disear las estructuras de almacenamiento Atencin de usuarios y programadores Definir estndares

Tipos de bases de datos Veremos una descripcin de cada una de estas formas o alternativas para disear una base de datos

Vale la pena mencionar que el sistema relacional, por las ventajas que presenta es la mas utilizada en las organizaciones:

Modelo jerrquico de Base de datos

Este es un modelo de datos que se utilizo mucho debido, principalmente el anuncio que hizo la compaa IBM en 1964 de su producto de base de datos llamado IMS (Information Management Systems) con base en un esquema jerrquico para la representacin de la informacin.

La forma de esquematizar la informacin se realiza a travs de representaciones jerrquicas o relaciones de padre/hijo, de manera similar a la estructura de un rbol

Modelo jerrquico Inconvenientes del modelos jerrquico A pesar de que el modelo es muy fcil de entender y comunicar en la actualidad las organizaciones estn dejado de usarlo debido a que presenta una serie de inconvenientes: Todo hijo debe tener necesariamente un padre, lo que dificulta dar de alta a un hijo si no conocemos los datos del padre La representacin de la informacin donde se requieran relaciones de mucho a muchos tiende a complicarse, de tal forma que si un hijo llega a tener dos o mas padres, la informacin de este hijo debe almacenarse en varios lugares diferentes de la base de datos, lo cual depende de cada uno de los padre, esto puede verse caramente en una relacin maestro alumnos, donde un maestro tiene varios alumnos, pero un alumno tiene varios maestros, uno para cada clase. En este caso, si la informacin estuviera representada en forma jerrquica, donde el padre es el maestro y el alumno el hijo, la informacin del alumno tendra que duplicarse para cada uno de los maestros Esta situacin puede generar infamacin incoherente, de tal manera que si se desea modificar los datos generales del alumno, se debe recorrer todos los maestros que tienen bajo su estructura al alumno en cuestin y hacer los cambios a sus datos Otra dificultad que representa este modelo es respecto a las bajas, de tal manera, si se desea dar de baja a un padre, ello implicara dar de baja a todos, y cada uno de sus hijos

Modelo de red

Este modelo permite la representacin de mucho a muchos, de manera talque que cualquier registro dentro d la base de datos puede tener varias ocurrencias superiores a l. No hay que olvidar que esta era una de la limitantes del modelo anterior A pesar de las desventajas descritas en el modelo jerrquico, estas desaparecen en el modelo de red Sus principal desventajas reside en la dificultad para crear y dar mantenimiento a la base de datos

Modelo relacional Este modelo es el que se esta utilizando cada vez con mas frecuencia, debido a las ventajas que ofrece sobre los dos modelos mencionados anteriormente, entre ellas el fcil entendimiento por parte de los usuarios que no tienen conocimientos profundos sobre sistemas de bases a datos En este modelo toda la informacin se representa a travs de arreglos bidimensionales o tablas

Modelo relacional Por lo general, el usuario de base de datos relacionales tiene conocimiento de las tablas que estn definidas y su interaccin con la informacin en la base de datos se reduce a operaciones lgicas que se efectan con las diferentes tablas Estas operaciones son: Seleccionar renglones de alguna tabla (Select) Seleccionar columnas de alguna tabla (Project) Unir o juntar varias tablas (Joint)

Modelo orientado a objetos Al existir la necesidad de almacenar y administrar datos de tipo imgenes, video y voz, han surgido lenguajes con dicha capacidad, las cuales requieren del soporte de bases de datos con esta caractersticas De ah surgen los DBMS orientados a objetos en ingles OODBMS (Object Oriented Data Base Management System) Las bases de datos orientadas a objetos son muy eficaces en sistemas que usan componentes de multimedia, como los sistemas geogrficos, as como las aplicaciones CAD (Computer Aided Design) y CAM (Computer Aided Manufacturing) El uso de los OODBMS se ha incrementado debido a que pueden administrar componentes multimedia que se usan en las aplicaciones de WEB, con lo cual se han desarrollado productos comerciales que son DBMS hbridos, es decir n DBMS relacional orientado a objetos

Bases de datos distribuidas Muchas organizaciones que se encuentran dispersas geogrficamente necesitan compartir informacin Para ello sirven las bases de datos distribuidas, las cuales no estn almacenadas en un solo lugar fsico y se comunican por enlaces de comunicaciones a travs de una red de computadores dispersos geogrficamente Esta bases de datos cada vez utilizan mas las arquitecturas cliente/servidor Los principales problemas que presenta las bases de datos distribuidas se refieren a la duplicidad de datos y a su integridad al momento de realizar actualizaciones de los mismo, adems, el control de la informacin puede constituir una desventaja debido a que se encuentran diseminadas de diferentes localidades geogrficas

Bases de datos distribuidas Existen dos modalidades para crea bases de datos distribuidas. Una opcin es fragmentar la base de datos y la otra es la repica de la base de datos La fragmentacin consiste en instalar en cada computadora solo la parte de la base de datos que se utilizara con mas frecuencia en la zona geogrfica, mientras que el resto de los datos debern ser transportados por la red en caso necesario.

La modalidad de replica consiste en realizar una copia total de la base de datos e instalarla en cada una de las computadoras de la organizacin

OTROS CONCEPTOS DE BASES DE DATOS

Data Warehouse Es un conjunto de datos integrados con orientacin hacia una materia, que varan con el tiempo, los cuales apoyan el proceso de toma de decisiones de una administracin Se dice que un data Warehousing (almacn de datos) es almacenamiento de los datos con fines estratgicos de negocio, concepto muy opuesto al de base de datos operativas La importancia reside en que son fuente de materia prima selecta en los sistemas de apoyo pata la toma de decisin DSS (Decision Support Systems)

OTROS CONCEPTOS DE BASES DE DATOS

Data Warehouse Principales caractersticas de un Data Warehouse son: Datos organizados con orientacin hacia entidades, por ejemplo producto, cliente, en vez de estar orientada a proceso Se crean y disean fuera de las bases de las bases de datos operacionales Una vez que los datos son almacenados no cambian y el almacn de datos puede tener un tiempo de vida de 10 aos Normalmente la nicas operaciones sobe las bases de datos se reducen a captura de datos y acceso a los mismos

Data Mining (Minera de Datos) La Minera de Datos auxilia a los usuarios para procesar las vastas reservas de datos y las insospechadas relaciones, por ejemplo, las relaciones entre productos y clientes o patrones de compra de los clientes La meta es descubrir relaciones estratgicas competitivas Las herramientas de minera de datos son esenciales para comprender el comportamiento de los clientes Las herramientas de minera de datos se clasifican en: Anlisis estadstico o de datos, utilizado para detectar patrones no usuales de datos Descubrimiento de conocimientos, Consiste en extraer de los datos informacin no implcita, no trivial, que no se conoca y es potencialmente til Otros, como sistemas de informacin geogrfica. Los sistemas de visualizacin geogrfica relacionan los datos del data Warehouse en diferentes ubicaciones fsicas con representaciones geogrficas

Data Marts De hecho es un pequeo data Warehouse, creado por una determinada cantidad de usuarios de una rea de una empresa Se trata de un subconjunto de un almacn de datos para un propsito definido Un Data Mart, tiene la funcin de apoyar a los sistemas de toma de decisiones Algunos de los cuestionamientos que se deben solucionar cuando la empresa cuenta con tecnologas de apoyo, como data Warehouse y el Data Mart, son las siguientes: Quienes son mis clientes?, Dnde se ubican?, Qu compran?, Qu los caracteriza?, Cuales las lneas de productos son mas rentables?, Qu productos son mis 10 mejores?, Qu productos son lo mas vendidos en este mes?, Cmo van mis avances respecto a lo planificado?, Donde se encuentran el 80% de mis ventas?, etctera

TENDENCIAS FUTURAS Incremento del uso de bases de datos

Uso mayor de bases de datos distribuidas Las bases de datos orientadas hacia objetos se incrementar Existir mayor uso de los SQL