OLAP

5
OLAP La explotación del Data Warehouse mediante información de gestión, se fundamenta básicamente en los niveles agrupados o calculados de información. La información de gestión se co mpone de conceptos de información y coeficientes de gestión, que los cuadros directivos de la empresa pueden consul ta r se n la s dimensiones de negocio que se definan. Dichas dimensiones de negocio se estructuran a su vez en distintos niveles de detalle (por ejemplo, la dimensión geográfica puede constar de los niveles nacional, provincial, ayuntamientos y sección censal). Este tipo de sistemas ha existido desde hace tiempo, en el mundo de la informática bajo distintas denominaciones. Su realización fuera del entorno del Data Warehouse, puede repercutir sobre estos sist emas en una mayor rigidez, dificult ad de actu alizac ión y mantenimiento, malo s tiempo s de respue st a, incoherenc ia s de la in fo rmac n, fa lta del dato agregado, etc. Los sistemas de soporte a la decisión usando tecnologías de Data Wárehouse, se llaman sistemas OLAP (siglas de On Line Analyt ical Processing). En general, estos sistema s OLAP deben: Soportar requerimientos complejos de análisis Analizar datos desde diferentes perspectivas Soportar análisis complejos contra un volumen ingente de datos OLAP Es una solución utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objeti vo es agilizar la consulta de grandes cantidades de dato s. Para ello utiliza estructuras multidimensionales (o Cubo s OLAP ) que contienen da to s resumi do s de gr an de s Bases de Datos o Sistem as Tra nsa cci ona les (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares. La propuesta de Codd consistía en realizar una disposición de los datos en vectores par a permitir un análisis rápido. Estos vectores son llamados cubos. Disponer los datos en cubos evita una limitación de las bases de datos relacionales, que no son muy adecuadas para el análisis de instantáneas de grandes cantidades de datos. Las bases de datos relacional es son más adecuado s para regi st rar dato s pro venientes de trans acciones (conocido como OLTP o procesamiento de

Transcript of OLAP

5/14/2018 OLAP - slidepdf.com

http://slidepdf.com/reader/full/olap5571ff8649795991699d7653 1/5

 

OLAP

La explotación del Data Warehouse mediante información de gestión, se fundamenta

básicamente en los niveles agrupados o calculados de información.

La información de gestión se compone de conceptos de información y

coeficientes de gestión, que los cuadros directivos de la empresa puedenconsultar según las dimensiones de negocio que se definan.

Dichas dimensiones de negocio se estructuran a su vez en distintos niveles dedetalle (por ejemplo, la dimensión geográfica puede constar de los niveles nacional,

provincial, ayuntamientos y sección censal).

Este tipo de sistemas ha existido desde hace tiempo, en el mundo de la informática

bajo distintas denominaciones.

Su realización fuera del entorno del Data Warehouse, puede repercutir sobre

estos sistemas en una mayor rigidez, dificultad de actualización y mantenimiento,malos tiempos de respuesta, incoherencias de la información, falta del dato

agregado, etc.

Los sistemas de soporte a la decisión usando tecnologías de Data Wárehouse, se

llaman sistemas OLAP (siglas de On Line Analytical Processing). En general,estos sistemas OLAP deben:

• Soportar requerimientos complejos de análisis

• Analizar datos desde diferentes perspectivas

• Soportar análisis complejos contra un volumen ingente de datos

OLAP Es una solución utilizada en el campo de la llamada Inteligencia empresarial (oBusiness Intelligence) cuyo objetivo es agilizar la consulta de grandescantidades de datos. Para ello utiliza estructuras multidimensionales (o CubosOLAP) que contienen datos resumidos de grandes Bases de Datos o Sistemas

Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing,informes de dirección, minería de datos y áreas similares.

La propuesta de Codd consistía en realizar una disposición de los datos en vectorespara permitir un análisis rápido. Estos vectores son llamados cubos. Disponer los

datos en cubos evita una limitación de las bases de datos relacionales, que no sonmuy adecuadas para el análisis de instantáneas de grandes cantidades de datos. Las

bases de datos relacionales son más adecuados para registrar datosprovenientes de transacciones (conocido como OLTP o procesamiento de

5/14/2018 OLAP - slidepdf.com

http://slidepdf.com/reader/full/olap5571ff8649795991699d7653 2/5

 

transacciones en línea). Aunque existen muchas herramientas de generación de

informes para bases de datos relacionales, estas son lentas cuando debe explorarsetoda la base de datos.

Nos referimos a cubos OLAP cuando hablamos de bases de datos multidimensionales,

en l as cua les e l a lmacenamiento f í si co de los datos se real i za en

vec to re s multidimensionales.  Los cubos OLAP se pueden considerar como una

ampliación de las dos dimensiones de una hoja de cálculo. Por ejemplo, una

empresa podría analizar algunos datos financieros por producto, por período de

tiempo, por ciudad, por tipo de ingresos y de gastos, y mediante la comparación de

los datos reales con un presupuesto. Estos parámetros en función de los cuales

se analizan los datos se conocen como dimensiones. Para acceder a los datos sólo

es necesario indexarlos a partir de los valores de las dimensiones o ejes.

El almacenar físicamente los datos de esta forma tiene sus pros y suscontras. Por ejemplo, en estas bases de datos las consultas de selección son muyrápidas (de hecho, casi en tiempo real). Pero uno de los problemas másgrandes de esta forma de almacenamiento es que una vez poblada la base de

datos ésta no puede recibir cambios en su estructura. Para ello sería necesariorediseñar el cubo.

En un sistema OLAP puede haber más de tres dimensiones, por lo que a los cubosOLAP también reciben el nombre de hipercubos. Las herramientas comerciales OLAP

tienen diferentes métodos de creación y vinculación de estos cubos o hipercubos(véase Tipos de OLAP en el artículo sobre OLAP).

La razón de usar OLAP para las consultas es la Velocidad de respuesta. Una

base de datos relacional almacena entidades en tablas discretas si han sidonormalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas

consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas,aunque peor desde el punto de vista operativo, es una base de-datosmultidimensional.

La principal característica que potencia a OLAP, es que es lo más rápido a lahora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP

que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE.

5/14/2018 OLAP - slidepdf.com

http://slidepdf.com/reader/full/olap5571ff8649795991699d7653 3/5

 

Funcionalidad

En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP(también llamado cubo multidimensional o hipercubo). Se compone de hechos

numéricos llamados medidas que se clasifican por dimensiones. El cubo demetadatos es típicamente creado a partir de un esquema en estrella o copo denieve, esquema de las tablas en una base de datos relaciona¡. Las medidas seobtienen de los registros de una tabla de hechos y las dimensiones se derivan de la

dimensión de los cuadros.

La funcionalidad de los sistemas OLAP se caracteriza por ser un análisis

multidimensional de datos corporativos, que soportan los análisis del usuario yunas posibilidades de navegación, seleccionando la información a obtener.

Normalmente este tipo de selecciones se ve reflejada en la visualización de laestructura multidimensional, en unos campos de selección que nos permitan

elegir el nivel de agregación Jerarquía) de la dimensión, y/o la elección de undato en concreto, la visualización de los atributos del sujeto, frente a una(s)

dimensiones en modo tabla, pudiendo con ello realizar, entre otras las siguientesacciones:

• Rotar (Swap): ;alterar las filas por columnas (permutar dos

dimensiones de análisis)

•Bajar (bown): ;bajar el n ivel de visualización en las f ilas a una

 jerarquía inferior

Detallar (Drilldown): ;informar para una fila en concreto, de datos a un nivel

inferior

• Expandir (Expand): ;id. anterior sin perder la información a nivel

superior para éste y el resto de los valores

• Colapsar (Collapse): ;operación inversa de la anterior.

Existen dos arquitecturas diferentes para los sistemas OLAP: OLAPmultidimensional (MOLAP) y OLAP relacionales (ROLAP).

Tipos de sistemas OLAP

Tradicionalmente, los sistemas OLAP se clasifican según las siguientes

categorías:

5/14/2018 OLAP - slidepdf.com

http://slidepdf.com/reader/full/olap5571ff8649795991699d7653 4/5

 

ROLAP

Implementación OLAP que almacena los datos en un motor relacional. Típicamente,

los datos son detallados, evitando las agregaciones y las tablas se encuentrannormalizadas. Los esquemas más comunes sobre los que se trabaja son estrella

ó copo de nieve, aunque es posible trabajar sobre cualquier base de datosrelaciona¡. La arquitectura está compuesta por un servidor de banco de datosrelaciona) y el motor OLAP se encuentra en un servidor dedicado. La principalventaja de esta arquitectura es que permite el análisis de una enorme cantidad de

datos.

La arquitectura ROLAP, accede a los datos almacenados en un Data Warehouse paraproporcionar los análisis OLAP. La premisa de los sistemas ROLAP es quelas capacidades OLAP se soportan mejor contra las bases de datos relacionales.

MOLAP

Esta implementación OLAP almacena los datos en una base de datos

multidimensional. Para optimizar los tiempos de respuesta, el resumen de lainformación es usualmente calculado por adelantado. Estos valores precalculados o

agregaciones son la base de las ganancias de desempeño de este sistema.

Algunos sistemas utilizan técnicas de compresión de datos para disminuir elespacio de almacenamiento en disco debido a los valores precalculados.

La arquitectura MOLAP usa unas bases de datos multidimensionales paraproporcionar el análisis, su principal premisa es que el OLAP está mejorimplantado almacenando los datos multidimensionalmente. Por el contrario, la

arquitectura ROLAP cree que las capacidades OLAP están perfectamenteimplantadas sobre bases de datos relacionales

Un sistema MOLAP usa una base de datos propietaria multidimensional, en la que la

i nf or ma ci ón s e a lma ce na m ul ti di me ns io na lme nt e, p ar a s ervisua l izada multidimensionalmente.

HOLAP (Hybrid OLAP)

Almacena algunos datos en un motor relacional y otros en una base de

datos multidimensional.

Comparación

ROLAP vs.

HOLAP

5/14/2018 OLAP - slidepdf.com

http://slidepdf.com/reader/full/olap5571ff8649795991699d7653 5/5

 

Cuando se comparan las dos arquitecturas, se,. pueden realizar las siguientes

observaciones: •

• El ROLAP delega la negociación entre tiempo de respuesta y el proceso batch

al diseño del sistema. Mientras, el MOLAP, suele requerir que sus bases de

datos se precompilen para conseguir un rendimiento aceptable enlas consultas, incrementando, por tantolos requerimientos batch.

• Los sistemas con alta volatilidad de los datos (aquellos en los que

cambian las reglas de agregación y consolidación), requieren unaarquitectura que pueda realizar esta consolidación ad-hoc. Los

sistemas ROLAP soportan bien esta consolidación dinámica, mientras quelos MOLAP están más orientados hacia consolidaciones batch.

• Los ROLAP pueden crecer hasta un gran número de dimensiones, mientrasque los MOLAP generalmente son adecuados para diez o menos dimensiones.

Los ROLAP soportan análisis OLAP contra grandes volúmenes dedatos e lementa les, mientras que los MOLAP se comportanrazonablemente en volúmenes más reducidos (menos de 5 Gb)

Por ello, y resumiendo, el ROLAP es una arquitectura flexible y general, que crece

para dar soporte a amplios requerimientos OLAP. El MOLAP es una soluciónparticular, adecuada para soluciones departamentales con unos volúmenes de

información y número de dimensiones más modestos.

Comparación

general

Otros tipos

Los siguientes acrónimos a veces también se utilizan, aunque no son sistemastan generalizados como los anteriores:

• WOLAP o Web OLAP: OLAP basado u orientado para la web.

• DOLAP o Desktop OLAP: OLAP de escritorio• RTOLAP o Real Time OLAP: OLAP en tiempo real

• SOLAP o Spatial OLAP: OLAP espacial