HA-2094 Bases de datos documentales LECCION 02 Jorge Arias Guía de clase
description
Transcript of HA-2094 Bases de datos documentales LECCION 02 Jorge Arias Guía de clase
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
Guía de clase
Unidad 1. Introducción a la Teoría de Sistemas
Sistemas aplicables a la Archivística
Elementos de un Sistema electrónico de Gestión documental
Unidad 2. Introducción a la teoría de bases de datos y su aplicación en las normativas archivísticas
Generalidades de Sistemas Gestores y Bases de datos
Prueba de asimilación No. 1
Salida.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Elementos de un Sistema electrónico de Gestión documental
1. La base de datos
Es el elemento más importante pues el aprovechamiento que se le pueda dar al sistema depende de la calidad de su ccontenido
El contenido de la base de puede incluir:
• información de documentos• Documentos completos• Metadatos de documentos• Información de administración del sistema• Información de seguridad
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Elementos de un Sistema electrónico de Gestión documental
2. Dispositivos especializados de hardware
• Escaneres y dispositivos de Digitalización: Los documentos originales, una vez preparados, son transformados en documentos digitales, los cuales serán guardados o almacenados.
• Servidores: Contienen la información previamente digitalizada. Los usuarios finales se conectaran a un servidor para poder acceder a dicha información, para su modificación o revisión.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Elementos de un Sistema electrónico de Gestión documental
3. Dispositivos especializados de software
• Gestores documentales: Programas de apoyo al proceso de gestión de la documentación que se maneja.
• Existen soluciones informáticas para : - la gestión documental - administración de archivos digitales - para administración de bibliotecas de diversa índole.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Elementos de un Sistema electrónico de Gestión documental
4. Dispositivos especializados de red
• Por medio de las redes los usuarios podrán acceder a la información que se encuentra en los servidores.
• Las redes pueden ser locales, aunque también se puede acceder a la información por Internet
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Elementos de un Sistema electrónico de Gestión documental
5. Usuarios del Sistema
• Personas que se registran en el sistema como usuarios
• Personas que acceden a la información a través de una cuenta de Usuario •El acceso a los documentos y su consulta electrónica se hace de acuerdo a los niveles de seguridad asignados a cada usuario registrado
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Elementos de un Sistema electrónico de Gestión documental
6. Administradores del Sistema
• que es el encargado del control de :
- La producción digitalización de los documentos - Su codificación e indexan en la base de datos del servidor - La identificación de ls ubicación física del documento original - La asignación, a cada documento lógico de las claves de acceso - Que los documentos digitalizados se almacenen en su correspondiente fichero
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
1. Introducción a la teoría de sistemas
Sistemas aplicables a la archivística
Ejemplos de Sistemas electrónico de Gestión documental
1. DocShare Gestión Documental, Sistema de Gestión Documental2. Bitcubo, Software de Gestion Documental y del conocimiento3. Innova Systems, Lider en Gestion Documental4. Docunet, Software de Gestion Documental5. OrfeoGPL, Software de Gestion Documental libre bajo licencia GPL6. Yerbabuena Software, Gestión Documental Inteligente y Open Source7. Documany, Gestión Documental Colaborativa para PYMEs8. Axentria, Gestión Documental (Montevideo - Uruguay)9. Semantica DMS, Sistema de Gestión Documental 10. Sistema ATHENTO 11. Sistema DOKMEE12. Sistema ICA-ATOM 13. Roda (Repositorio de Objetos Digitales Auténticos)
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Sistemas de gestión de base de datos
Los sistemas de gestión de bases de datos SGBD (en inglés database management system,abreviado DBMS) son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan. Por medio de estos se hace gestión de manera clara, sencilla y ordenada del conjunto de datos que posteriormente se convertirán en información relevante para una organización
Generalidades de Sistemas Gestores y Bases de datos
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
Objetivos que deben cumplir los SGBD
Abstracción de la información. Los SGBD ahorran a los usuarios detalles acerca del almacenamiento físico de los datos. Da lo mismo si una base de datos ocupa uno o cientos de archivos, este hecho se hace transparente al usuario. Así, se definen varios niveles de abstracción.
Independencia. La independencia de los datos consiste en la capacidad de modificar el esquema (físico o lógico) de una base de datos sin tener que realizar cambios en las aplicaciones que se sirven de ella.
Consistencia. En aquellos casos en los que no se ha logrado eliminar la redundancia, será necesario vigilar que aquella información que aparece repetida se actualice de forma coherente, es decir, que todos los datos repetidos se actualicen de forma simultánea. Por otra parte, la base de datos representa una realidad determinada que tiene determinadas condiciones, por ejemplo que los menores de edad no pueden tener licencia de conducir. El sistema no debería aceptar datos de un conductor menor de edad. En los SGBD existen herramientas que facilitan la programación de este tipo de condiciones
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
Otros objetivos que deben cumplir los SGBD Seguridad. La información almacenada en una base de datos puede llegar
a tener un gran valor. Los SGBD deben garantizar que esta información se encuentra segura de permisos a usuarios y grupos de usuarios, que permiten otorgar diversas categorías de permisos.
Manejo de transacciones. Una transacción es un programa que se ejecuta como una sola operación. Esto quiere decir que luego de una ejecución en la que se produce una falla es el mismo que se obtendría si el programa no se hubiera ejecutado. Los SGBD proveen mecanismos para programar las modificaciones de los datos de una forma mucho más simple que si no se dispusiera de ellos.
Tiempo de respuesta. Lógicamente, es deseable minimizar el tiempo que el SGBD tarda en darnos la información solicitada y en almacenar los cambios realizados
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
Tipos de Bases de datos Según la variabilidad de los datos almacenados
Bases de datos estáticas Bases de datos dinámicas
Según el contenido
Bases de datos bibliográficas Bases de datos de texto completo Directorios Bases de datos o "bibliotecas" de información química o biológica
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
Modelos de bases de datos
Bases de datos jerárquicasBase de datos de redBases de datos transaccionalesBases de datos relacionalesBases de datos multidimensionalesBases de datos orientadas a objetosBases de datos documentalesBases de datos deductivas
Gestión de bases de datos distribuida
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
Los sistemas de gestión de base de datos con soporte SQL más utilizados son, por orden
alfabético:
• DB2• Firebird• Informix• Interbase• MySQL• Oracle• PostgreSQL• SQLite• SQL Server• Sybase ASE
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
Los sistemas de gestión de base de datos con soporte SQL más utilizados son, por ordenalfabético:
DB2: es una marca comercial, propiedad de IBM, bajo la cual se comercializa un sistema de gestión de base de
datos. Es un motor de base de datos relacional que integra XML de manera nativa, lo que IBM ha llamado pureXML, que permite almacenar documentos completos dentro del tipo de datos xml para realizar
operaciones y búsquedas de manera jerárquica dentro de éste, e integrarlo con búsquedas relacionales.
Firebird: es un sistema de administración de base de datos relacional (o RDBMS) (Lenguaje consultas: SQL) de código abierto, basado en la versión 6 de Interbase, cuyo código fue liberado por Borland en 2000. Su
código fue reescrito de C a C++. El proyecto se desarrolla activamente, el 18 de abril de 2008 fue liberada la versión 2.1 y el 26 de diciembre de 2009 fue liberada la versión 2.5.0 RC1.
Informix: es una familia de productos RDBMS de IBM, adquirida en 2001 a una compañía (también llamada Informix o Informix Software) cuyos orígenes se remontan a 1980.
Interbase: es un Sistema de Administración y gestion de Base de Datos Relacionales (RDBMS) desarrollado y comercializado por la compañía Borland Software Corporation y actualmente desarrollado por su ex-filial CodeGear. Interbase se destaca de otros DBMS's por su bajo consumo de recursos, su casi nula necesidad de administración y su arquitectura multi-generacional. InterBase corre en plataformas Linux, Microsoft Windows
y Solaris
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
MySQL: es un sistema de gestión de base de datos relacional, multihilo y multiusuario con más de seis millones de instalaciones. MySQL AB —desde enero de 2008 una subsidiaria de Sun Microsystems y ésta a su vez de Oracle Corporation desde abril de 2009— desarrolla MySQL como software libre en un esquema de licenciamiento dual. Por un lado se ofrece bajo la GNU GPL para cualquier uso compatible con esta licencia, pero para aquellas empresas que quieran incorporarlo en productos privativos deben comprar a la empresa una licencia específica que les permita este uso. Está desarrollado en su mayor parte en ANSI C.
Oracle : es un sistema de gestión de base de datos relacional, desarrollado por Oracle Corporation. Se considera a Oracle como uno de los sistemas de bases de datos más completos destacando: soporte de transacciones, estabilidad, escalabilidad y soporte multiplataforma. Su dominio en el mercado de servidores empresariales ha sido casi total hasta hace poco, recientemente sufre la competencia del
Microsoft SQL Server de Microsoft y de la oferta de otros RDBMS con licencia libre como PostgreSQL, MySql o
Firebird. Las últimas versiones de Oracle han sido certificadas para poder trabajar bajo GNU/Linux
PostgreSQL: es un sistema de gestión de base de datos relacional orientada a objetos y libre, publicado bajo la
licencia BSD. Como muchos otros proyectos de código abierto, el desarrollo de PostgreSQL no es manejado por
una sola empresa sino que es dirigido por una comunidad de desarrolladores y organizaciones comerciales las
cuales trabajan en su desarrollo. Dicha comunidad es denominada el PGDG (PostgreSQL Global Development
Group).
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Generalidades de Sistemas Gestores y Bases de datos
SQLite: es un sistema de gestión de bases de datos relacional compatible con ACID, contenida en una relativamente pequeña biblioteca en C. SQLite es un proyecto de dominio público creado por D. Richard Hipp. A diferencia de los sistema de gestión de bases de datos cliente-servidor, el motor de SQLite no es un proceso independiente con el que el programa principal se comunica. En lugar de eso, la biblioteca SQLite se enlaza con el programa pasando a ser parte integral del mismo. El programa utiliza la funcionalidad de SQLite a través de llamadas simples a subrutinas y funciones. Esto reduce la latencia en el acceso a la base de datos, debido a que las llamadas a funciones son más eficientes que la comunicación entre procesos. El conjunto de la base de datos (definiciones, tablas, índices, y los propios datos), son guardados como un sólo fichero estándar en la máquina host. Este diseño simple se logra bloqueando todo el fichero de base de datos al principio de cada transacción
Microsoft SQL Server: es un sistema para la gestión de bases de datos producido por Microsoft basado en el modelo relacional. Sus lenguajes para consultas son T-SQL y ANSI SQL. Microsoft SQL Server constituye la alternativa de Microsoft a otros potentes sistemas gestores de bases de datos como son Oracle, Sybase ASE, PostgreSQL, Interbase, Firebird o MySQL.
Sybase ASE: Adaptive Server Enterprise (ASE) es el motor de bases de datos (RDBMS) insignia de la compañía Sybase. ASE es un sistema de gestión de datos, altamente escalable, de alto rendimiento, con soporte a grandes volúmenes de datos, transacciones y usuarios, y de bajo costo
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticai. Diferentes formas de representación física de archivos de datos
a. DEFINICIONES
¿ Que son datos ?
Dato: es una representación simbólica (numérica, alfabética, algorítmica etc.) que describe un atributo o característica de alguna entidad
¿ Que es información ?
Información: un conjunto de datos relacionados que proporcionan un significado o sentido a algo.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
PREGUNTA ¿ Qué entendemos por Archivos de Datos?
Podríamos definir los archivos de datos como: cualquier elemento de información
que tiene algún significado y que está almacenado en un espacio dentro de un
computador y a los cuales accedemos por medio del nombre que les damos.
Dentro de este significado se podrían mencionar como ejemplos:
Un documento de word Una hoja de excel Una presentación en power point Un dibujo hecho en paint Un texto con algún sentido editado en cualquier procesador como el bloc de
notas
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística¿ Qué es una base de Datos?
¿ Una hoja de Excel es una base de Datos?
En realidad, una hoja de excel u otro conjunto de datos similar, con estructura, contenido y significado, es un archivo de datos.
Un Archivo de datos es un conjunto de elementos de información relacionados entre si y que fueron definidos por su creador.
Los archivos de datos pueden ser:- Numéricos - Alfabéticos - Binarios - de formato libre (archivos txt)
- con formato estructurado (como las hojas de excel)
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaDesde el punto de vista de su representación física, un archivo de datos es
una secuencia de bits, bytes, líneas o registros cuyo significado es definido por el
creador del archivo y por el usuario.
El archivo de datos se puede manipular como una unidad mediante operaciones
tales como:
- Abrir - Cerrar -Crear - Destruir -copiar - renombrar - listar
Los elementos de información individuales que conforman un archivo de
datos se pueden manipular con acciones tales como:
- Leer - Escribir - Modificar - Eliminar
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaLos archivos de datos pueden caracterizarse por su: Volatilidad, Actividad y
Tamaño.
Volatilidad : Se refiere a la frecuencia con la que se inserta o elimina información.
Actividad: Se refiere al porcentaje de los elementos de información de un archivo
al que se tuvo acceso en un periodo de tiempo dado.
Tamaño: Se refiere a la cantidad de información que conforma el archivo.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Los archivos de datos se caracterizan por su estado, en Físicos y lógicos
Archivo de datos Físico: La información vista desde la perspectiva de hardware. Ejemplos: el archivo X está formado por los sectores 3, 10 y 15 del disco duro del computador. el archivo Y formado por es la secuencia de bytes localizados en la RAM en el
bloque 0A703h:03000h al 0A703h:04200h.
Archivo de datos Lógico: Constituido por datos cuyo significado esta definido
por el usuario. Generalmente, un archivo lógico se representa de manera
formateada o tabular
Ejemplo:
el archivo Y es la información de 1000 artículos, cada uno con su código,
descripción y precio.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaCONCEPTO DE ORGANIZACIÓN DE ARCHIVOS.
Se refiere a las diferentes maneras en las en que puede ser organizada y accedida la información en estos
Dado que hay 2 niveles de visión de los archivos (Archivo de datos físico y archivo de datos lógico), se puede hablar también de 2 aspectos de organización de archivos: Organización de archivos físicos y de archivos lógicos.
Organicación de Archivos lógicos: Se refiere a la organización desde el punto de vista lógico. Por ejemplo, para acceso secuencial, acceso directo, indexado,
Organicación de Archivos físicos: Se refiere a la administración de archivos desde la perspectiva física, particularmente la organización del almacenamiento en disco a nivel de pistas y sectores.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaORGANIZACIÓN FISICA DE LOS ARCHIVOS
Para entender de mejor manera la organización física de los archivos se deben conocer 2 aspectos importantes:
la asignación de espacio libre asignación de espacio de almacenamiento al archivo.
La asignación de espacio a un archivo, depende de la manera en que el Sistema Operativo de los equipos controla los lugares del disco que no están siendo ocupados.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaCONTROL DEL ESPACIO LIBRE
Para la administración y el control del espacio libre los sistemas operativos
utilizan diferentes métodos teóricos:
Vector de Bits Listas Ligadas Por Agrupacion Por Contador
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Vector de bits
Se tiene un arreglo de bits, el número de bits que tiene,representa cada sector del disco, o sea que si los sectores 10y 11 están ocupados su representacion será:
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Lista ligada
Existe una cabecera en la que se tiene la direccion del primer sector vacio, esesector a su vez, tiene un apuntador al siguiente bloque, y así sucesivamente hastaque se encuentre una marca indicando que ya no hay espacio libre.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaPor agrupacion
Es similar a la lista ligada, solo que en este se tiene por cada sector, un grupo
de apuntadores a varios espacios vacios, al final de cada bloque se tiene un
apuntador a otro grupo de apuntadores.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Por contador
Aqui, por cada conjunto de bloques contiguos que estén vacios, se tiene un
apuntador a un número de inicio y el tamaño del grupo de sectores vacios.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaASIGNACIÓN DE ESPACIO A ARCHIVOS DE DATOS
Se refiere a la forma en que un Sistema Operativo controla los lugares del disco ocupados por cada archivo
El S. O. controla básicamente la identificación del archivo, sector de inicio y sector final.
Para el control del espacio ocupado en disco se utilizanr los métodos teóricos:
Asignación Contigua Asignación Ligada Asignación indexada.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Asignación contigua : consiste en asignar el espacio en disco de tal manera que
las direcciones de todos los bloques correspondientes a un archivo definen un
orden lineal
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Asignación contigua
VENTAJAS
La cabeza de lectura no se mueve demasiado en la lectura de un archivo.
DESVENTAJAS
Produce fragmentación externa.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Asignación ligada: En este método, cada archivo es una lista ligada de bloques de disco.
En el directorio hay un puntero al bloque de inicio y un puntero al bloque final para cada
archivo.
En cada uno de los bloques donde se encuentra un archivo hay un punyero al siguiente
bloque de la lista.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
Asignación ligada
VENTAJAS:
•No produce fragmentación externa.
DESVENTAJAS:
•La cabeza de lectura se puede mover demasiado en la lectura de un archivo. •Si una liga se pierde, se perderá el archivo completo. •Es ineficiente para la implementación de archivos directos. •Se necesita un campo extra para el apuntador.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaAsignación indexada
La asignación ligada resuelve problemas de fragmentación externa, sin embargo, la asignación ligada no soporta eficientemente el acceso directo a los archivos. La asignación indexada resuelve este problema poniendo todos los apuntadores en una sola localidad: El bloque índice.
Cada archivo tiene su bloque índice, El cual es un arreglo de direcciones de bloques de disco.
La i-ésima entrada en el bloque índice apunta al i-ésimo bloque que conforma el archivo. En el directorio se controla la dirección del bloque índice de cada archivo.
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivística
HA-2094 Bases de datos documentales LECCION 02
Jorge Arias
2. Introducción a la teoría de bases de datos y su aplicación en la normativa archivísticaVENTAJAS:
No produce fragmentación externa Eficiente para la implementación de archivos directos
DESVENTAJAS
Existe desperdicio cuando hay archivos pequeños Desbordamiento de bloque índice. (Solución: creación de un esquema ligado; el ultimo
bloque índice apunta a otro índice)