Post on 14-Feb-2018
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 1/52
Data Warehouse
28/09/15
TOPICOS ESPECIALES DE INGENIERIA
1
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 2/52
Definiciones de DataWarehouse
Un Data Warehouse es un conjunto integrado de bases dedatos, con orientación temática, que están diseñadospara el apoyo a la Toma de Decisiones, y donde cadaunidad de datos es relevante en algn momento deltiempo
!ill "# $nmon
%una copia de las transacciones de datos espec&ficamenteestructurada para la consulta y el análisis' o%la unión detodos los Data marts de una entidad'
(alph )imball
'*o considero al DW como algo que provee dos beneficiosempresariales reales+ $ntegración y cceso de datos# DWelimina una gran cantidad de datos intiles y nodeseados, como tambi-n el procesamiento desde elambiente operacional clásico.
/usan 0sterfeldt2
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 3/52
0bjetivos
"acer la información de la organi1ación accesible
"acer a la información de la organi1ación consistente
2ontrolar el acceso efectivo a los datos 3enerar información de manera fle4ible
/ervir de ayuda a la toma de decisiones
3
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 4/52
5n resumen
Un Data Warehouse tiene como objetivo almacenar yproveer a la 0rgani1ación de información relevante y atiempo
4
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 5/52
$mportancia del Data
Warehouse Mejorar la Entrega de Información:#
Mejorar el Proceso de Toma de Decisiones
Impacto Positivo sobre los Procesos Empresariales
5
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 6/52
pensar antes de implementar
un Data Warehouse 6a amplitud7 el nmero de diferentes temas y puntos de foco
8uentes que proveerán datos brutos#
6os medios por los cuales los datos se transportan de las
aplicaciones fuente y son cargados al Data Warehouse# 6as reglas de negocio que se aplican a la data en bruto para
producir activos de datos de alta calidad#
6as bases de datos receptoras, en la que estos activos de datosserán almacenados#
6os activos de datos7 los elementos, el nivel de detalle de cada
elemento, y cuánta historia se ha mantenido, por ejemplo# 6a $nteligencia de negocio
"erramientas de nivel usuario para acceder a los activos de datos#
6a arquitectura y complejidad en general del entorno#
6
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 7/52
5mpresas que usan DT
W(5"0U/5 (oyal ban9 of canada
:aypal
;<
2oca=2ola 2ompany
>eri1on
8ord <otor 2ompany
"erramientas de nivel usuario para acceder a los activos de datos#
6a arquitectura y complejidad en general del entorno#
7
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 8/52
8
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 9/52
:roductos ?suites@ de DT
W(5"0U/5 y !$ $!< 2ognos
http+AABBB=C#ibm#comAsoftBareAdataAcognosA
Teradatahttp+AABBB#teradata#com
0racle "yperion
http+AABBB#oracle#comAhyperionAinde4#html
<icro/trategy
http+AABBB#strategy#com
//
http+AABBB#sas#com
9
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 10/52
2aracter&sticas de un Data
Warehouse 0rientado a un tema
dministra grandes cantidades de información
3uarda información en diversos medios dealmacenamiento
2omprende mltiples versiones de uno ?o varios@esquema de base de datos
2ondensa y agrega información
$ntegra y asocia información de muchas fuentes
10
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 11/52
Diferencias entre un sistema de
Data Warehouse y aplicacionestradicionalesSISTEMAS TRADICI!A"ES DATA#ARE$%SE
•:redomina la actuali1ación#•ctividad operativa ?d&a a d&a@#•:roceso puntual#
•5stabilidad#•Datos desagregados#•Dato actual#•(espuesta de la transaccióninmediata#•5structura relacional#
•Usuarios de perfiles bajos#•54plotación de la informaciónrelacionada con operatividad decada aplicación
•:redomina la consulta•nálisis y decisión estrat-gica#•:roceso masivo#
•Dinamismo#•Eiveles de detalleAagregación#•Dato histórico#•(espuesta masiva•5structura <ultidimensional•Usuarios de perfiles altos#
•54plotación de informacióninterna y e4terna relacionada conel negocio#
11
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 12/52
<etodolog&as de Diseño de
Data Warehouse <etodolog&a de $nmon ?Top F !ottom@
12
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 13/52
<etodolog&a de )imball?!ottom=up@
13
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 14/52
<etodolog&a agil para laimplementación de un dB
14
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 15/52
Page 15
rquitectura de un DataWarehouse
15
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 16/52
Production
systems
Other sources
CR
!i""ing
Acti#ationsystems
Other D!s$
%i"es
ETL
Data&arehouse
OLAPcu'es
!usiness(sers
)uerying *Re+ortingtoo"s
Ac,uisition Storage -
Archi#ing
Restitution
Datamarts
8lujo de Datos de un DW
16
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 17/52
Page 1.
• !ase de datos o+eraciona" - Ni#e" de 'ase de datose/terno0
• Ni#e" de acceso a "os datos• Ni#e" de organiaci2n de datos• Ni#e" de data 3arehouse• Ni#e" de acceso a "a in4ormaci2n• Ni#e" de gesti2n de +roceso
rquitectura de un DataWarehouse
17
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 18/52
Page 1
!ase de datos o+eraciona" - Ni#e" de 'ase de datose/terno 6%uentes de datos7Los sistemas o+eraciona"es +rocesan datos +ara a+oyar"as necesidades o+eraciona"es cr8ticas9 ta"es como
ERPs9 SCs9 tam'i:n se +rocesa in4ormaci2n de 4uentesde datos e/ternas9 ta"es como de "a internet9 INEI9 !CRP0
Ni#e" de acceso a "os datos
Es res+onsa'"e de "a inter4aces entre "as herramientasde acceso a "a in4ormaci2n y "as 'ases de datoso+eraciona"es0 En a"gunos casos9 esto es todo "o ,ue unusuario 4ina" necesita +ara rea"iar estas inter4ases seuti"ia e" S)L 6Standar )uery Lengua;e7
5lementos de la rq# De un DW
18
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 19/52
Ni#e" de organiaci2n de datosE" com+onente 4ina" de "a ar,uitectura data &arehouse
es "a organiaci2n de "os datos9 inc"uye todos "os+rocesos necesarios como se"eccionar9 editar9 resumir9com'inar y cargar datos en e" de+2sito y acceder a "ain4ormaci2n desde 'ases de datos o+eraciona"es y-oe/ternas
Ni#e" de data 3arehouse
En un data &arehouse 48sico9 e" a"macena;e de data+rocesada9 inc"uso en 4orma redundante
5lementos de la rq# De un DW
19
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 20/52
Ni#e" de acceso a "a in4ormaci2nEste ni#e" se inc"uye e" hard3are y so4t3are
in#o"ucrados en re+resentar y +ro#eer de in4ormaci2n a"usuario 4ina" norma"mente usa d8a a d8a0 Por e;em+"o<
E/ce"9 Lotus 1=>=?9 %ocus9 Access9 SAS9 etc0
Ni#e" de gesti2n de +rocesoE" ni#e" de gesti2n de +rocesos tiene ,ue #er con "a
+rogramaci2n de di#ersas tareas ,ue de'en rea"iarse+ara construir y mantener actua"iado e" data 3arehousey "a in4ormaci2n de" directorio de datos0
5lementos de la rq# De un DW
20
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 21/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
& 'ACTRES E! "A P"A!I'ICACI! DE %! DATA #ARE$%SE
5stablecer una asociación de usuarios, gestión y grupos
2onstruir prototipos rápida y frecuentemente
$mplementación incremental
(eportar activamente y publicar los casos e4itosos
21
%ase 1< Organiaci2n
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 22/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
( ESTRATE)IAS PARA E" DESARR"" DE %! DATA #ARE$%SE
22
@)ui:n es e" auditorio
@CuB" es e" a"cance
@)u: ti+o de data 3arehousede'er8a construirse
1ra0< Esta'"ecer un am'iente data 3arehouse #irtua"0
>da0< Construir una co+ia de "os datos o+eraciona"es desde un sistema
o+eraciona" nico y +osi'i"itar a" data 3arehouse de una serie deherramientas de acceso a "a in4ormaci2n0
?ra0< %ina"mente9 "a estrategia data 3arehousing 2+tima es se"eccionar e"nmero de usuarios 'asados en e" #a"or de "a em+resa y hacer un anB"isis desus +untos9 +reguntas y necesidades de acceso a datos0
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 23/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
23
? ESTRATEGIAS PARA EL DISEFO DE (N DATA &AREO(SE
1ra0 < Los usuarios de "os data 3arehousesusua"mente no conocen mucho so're susre,uerimientos y necesidades como "osusuarios o+eraciona"es0
>da0< E" diseHo de un data 3arehouse9 con4recuencia in#o"ucra "o ,ue se +iensa ent:rminos mBs am+"ios y con conce+tos de"negocio mBs di48ci"es de de4inir ,ue en e"diseHo de un sistema o+eraciona"0 A" res+ecto9un data 3arehouse estB 'astante cerca aReingenier8a de "os Procesos de" Negocio6!usiness Process Reengineering70
?ra0< %ina"mente9 "a estrategia de diseHo idea"+ara un data 3arehousing es genera"mente dea4uera hacia adentro 6outside=in7 a di4erenciade arri'a hacia a'a;o 6to+=do3n70
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 24/52
:(0*52T0 D5 56!0(2$0E D5UE DT W(5"0U/5
24
ESTRATEGIAS PARA LA GESTION DE (N DATA &AREO(SE
1ra0< (n data 3arehouse es una in#ersi2n 'uena s2"o si "osusuarios 4ina"es rea"mente +ueden conseguir in4ormaci2n #ita"mBs rB+ida y mBs 'arata de "o ,ue o'tienen con "a tecno"og8aactua"0
>da0< La administraci2n de'e reconocer ,ue e" mantenimientode "a estructura de" data 3arehouse es tan cr8tico como e"mantenimiento de cua",uier otra a+"icaci2n de misi2n=cr8tica0
?ra0< La gesti2n de'e com+render tam'i:n ,ue si se em'arcanso're un +rograma data 3arehousing9 se crearBn nue#asdemandas so're sus sistemas o+eraciona"es9 ,ue son<Demandas +ara me;orar datosDemandas +ara una data consistenteDemandas +ara di4erentes ti+os de datos9 etc0
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 25/52
:(0*52T0 D5 56!0(2$0E D5UE DT W(5"0U/5
25
Se ha reconocido "os 'ene4icios de"+rocesamiento ana"8tico en "8nea 6On LineAna"ytica" Processing = OLAP79 mBs a""B de
"as Breas tradiciona"es de marJeting y4inanas0E" crecimiento de "a com+utaci2n
c"iente-ser#idor9 ha creado ser#idores dehard3are y so4t3are mBs +oderosos yso4isticados ,ue nunca0 Los ser#idores de
hoy com+iten con "as main4rames de ayer yo4recen ar,uitecturas de memoriatecno"2gicamente su+eriores9 +rocesadoresde a"ta #e"ocidad y ca+acidades dea"macenamiento masi#as0
%ase >< Desarro""o
10 @POR)(E CONSTR(IR !LO)(ES DE DATA &AREO(SE
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 26/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
26
> CONSIDERACIONES PREKIAS AL DESARROLLO DE (N DATA &AREO(SE
ay muchas maneras +aradesarro""ar data 3arehousescomo tantas organiacionese/isten0 Sin em'argo9 hay unnmero de dimensiones
di4erentes ,ue necesitan serconsideradas<
A"cance de un data3arehouse
Redundancia de datos
Ti+o de usuario 4ina"
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 27/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
27
? ELEENTOS CLAKES PARA EL DESARROLLO DE (N DATA &AREO(SE
Si se escoge incorrectamente9 e" data 3arehouse se con#ierte en unagran em+resa con +ro'"emas di48ci"es de tra'a;ar en su entorno9 costoso+ara arreg"ar y di48ci" de ;usti4icar0
Para conseguir ,ue "a im+"ementaci2n de" de+2sito tenga un inicioe/itoso9 se necesita en4ocar hacia tres '"o,ues c"a#es de construcci2n<
Ar,uitectura tota" de" de+2sito Ar,uitecturas de" ser#idor Sistemas de Gesti2n de !ase de Dato
ay muchas maneras +ara desarro""ar data 3arehouses como tantasorganiaciones e/isten0 Sin em'argo9 hay un nmero de dimensionesdi4erentes ,ue necesitan ser consideradas<
A"cance de un data 3arehouse Redundancia de datos
Ti+o de usuario 4ina"
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 28/52
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 29/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
29
5 %ACTORES DECISIKOS PARA DECIDIR EL DESARROLLO DE (N DATA &AREO(SE
La data sucia es un serio +e"igro +ara e" :/ito de un+royecto de data 3arehouse0 De+endiendo de"a"cance de" +ro'"ema9 sim+"emente +odr8a no ser+osi'"e dirigir"o rB+idamente y a'aratar"o0Los +rinci+a"es 4actores son<- E" tiem+o ,ue toma "a +rogramaci2n interna- E" costo de "as herramientas
Los gerentes de +royectos de Data &arehousenecesitan e#a"uar e" +ro'"ema con rea"ismo9 "osrecursos internos dis+oni'"es +ara distri'uir"os y
se"eccionar "a so"uci2n ,ue se ada+te a "a +"ani""a y+resu+uesto de" +royecto9 o modi4icar "a +"ani""a y e"+resu+uesto +ara so"ucionar e" +ro'"ema0
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 30/52
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 31/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
31
> ESTRATEGIAS PARA EL PROCESO DE IPLEENTACION
Identi4icar e" +ro'"ema en e" cua" e" usoestrat:gico de "a in4ormaci2n deta""ada9+ermita conseguir una so"uci2n +aragenerar una #enta;a com+etiti#a o unahorro de costos0
De4inir e" mode"o "2gico de datos aim+"ementar +ara reso"#er e" +ro'"ema+"anteado0
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 32/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
32
? ESTRATEGIAS EN LA IPLEENTACION De4inir e" me;or diseHo 48sico +ara e" mode"o de datos0 E" diseHo 48sico de'e estar
orientado a generar 'uen rendimiento en e" +rocesamiento de consu"tas9 a di4erencia de"mode"o "2gico ,ue estB orientado a" usuario y a "a 4aci"idad de consu"ta0
De4inir "os +rocesos de e/tracci2n9 4i"tro9 trans4ormaci2n de in4ormaci2n y carga de datos,ue se de'en im+"ementar +ara +o'"ar ese mode"o de datos0
De4inir "os +rocesos de administraci2n de "a in4ormaci2n ,ue +ermanece en e" data
3arehouse De4inir "as 4ormas de consu"tas a "a in4ormaci2n de" data 3arehouse ,ue se "e
+ro+orcionarB a" usuario0 Para :sto9 de'e considerarse "a necesidad de reso"#er un+ro'"ema y "a +otencia de consu"ta0
Com+"etar e" mode"o de consu"ta 'ase9 re"ati#o a" Brea se"eccionada0 Im+"ementar "os +rocesos estrat:gicos de" Brea de tra'a;o9 es decir9 im+"ementar
herramientas es+ecia"iadas de scoring9 herramientas es+ecia"iadas +ara inducci2n deconocimiento 6Data ining79 etc0 Com+"etar "as Breas de inter:s9 en 4orma simi"ar a "o descrito anteriormente0
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 33/52
:(0*52T0 D5 56!0(2$0E D5UE DT W(5"0U/5
33
@)u: c"ases de costos e/cedieron e"+resu+uesto en mBs de" 1M en cada uno de"os 1> meses +asados
@Se aumentaron "os +resu+uestos en mBs de5M +ara cua",uier Brea dentro de "os "timos1 meses
@C2mo es+eci4icar "as c"ases de gasto entredi4erentes de+artamentos @Entre di#isiones@A tra#:s de "as regiones geogrB4icas
@C2mo tener mBrgenes de o+eraci2n so're"os dos "timos aHos en cada Brea denegocio Donde han disminuido "osmBrgenes9 @se han incrementado "os costos
%ASE < EKAL(ACION
1 EKAL(ACION DE RENDIIENTO DE LA INKERSION
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 34/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
34
CASO PRACTICO
En un estudio encargado +or > #endedores y consu"tores9 se encontr2 unRetorno Promedio Tota" de "a in#ersi2n 6Return On In#estment=ROI7 de1M0Tam'i:n9 se e/c"uyeron "os +royectos 4racasados9 as8 como "ose;ecutados e/ce+ciona"mente9 tanto 'uenos como ma"os0
2.2 MillonesCosto promedio
>0? AHosPer8odo de reem'o"so +romedio
1MROI mediano
5??MROI +romedio de" mode"o com+"ementario de datos
?>>MROI +romedio de" +royecto mBs grande
1MROI +romedio tota"
CA!IOS DE KALOR
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 35/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
35
101 COSTOS !ENE%ICIOS
Costos preliminares P"ani4icaci2n DiseHo ode"amiento -Ingenier8a de
In4ormaci2n
Costos iniciales P"ata4orma de hard3are So4t3are de 'ase de datos
Costos en procesamiento antenimiento de datos Desarro""o de a+"icaciones Ca+acitaci2n y so+orte
Beneficios Tácticos Im+resi2n y emisi2n de re+orte
reducido Demanda reducida +ara consu"tas de
c"ientes- Entrega mBs rB+ida de in4ormaci2n a "os
usuarios
Beneficios Estratégicos (Potencialidad) A+"icaciones y herramientas de
acceso +ara "os usuarios 4ina"es
Decisiones con mayor in4ormaci2n Toma de decisiones mBs rB+ida Ca+acidad de so+orte a "a
in4ormaci2n organiaciona"
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 36/52
:(0*52T0 D5 56!0(2$0E D5 UE DTW(5"0U/5
36
> !ENE%ICIOS A O!TENER
Para "a Em+resaE" data 3arehouse hace "o +osi'"e +or a+ro#echar e" #a"or
+otencia" enorme de "os recursos de in4ormaci2n de "aem+resa y #o"#er ese #a"or +otencia" en #a"or #erdadero0
Para "os (suarios
E" data 3arehouse e/tiende e" a"cance de "a in4ormaci2n+ara ,ue +uedan accesar directamente en "8nea9 "o ,ue a "a#e contri'uye en su ca+acidad +ara o+erar con mayore4ecti#idad "as tareas rutinarias o no0
Para "a Organiaci2n en Tecno"og8as de In4ormaci2n
E" data 3arehouse enri,uece "as ca+acidades de" usuarioautosu4iciente y hace "o 4acti'"e +ara o4recer nue#osser#icios a "os usuarios9 sin inter4erir con "as a+"icacionescotidianas de +roducci2n
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 37/52
$mportante+ 5l <odelo de Datos
Es e" mode"o +or e" cua" se diseHa e" es,uema de 4uncionamiento de "a!ase de Datos ,ue +ro#ee a" Data &arehouse0
E/isten #arios en4o,ues en este sentido<
%B'rica de in4ormaci2n cor+orati#a 6CI%7< inc"uyen ODS9 data 3arehouse y data
marts9 ;unto con otras #arias inter4aces de a+"icaciones y e" am'iente o+eraciona"94ue desarro""ada +or !i"" Inmon9 C"audia Imho449 y Ryan Sousa
Es,uema en estre""a< Este m:todo re+"ica "as estructuras mu"tidimensiona"es dehechos y dimensiones9 +ero usa ta'"as de RD!S9 es+ec84icamente ta'"as dehechos y ta'"as de dimensiones0 Se de;an de "ado "as reg"as de norma"iaci2n de'ase de datos y se +onen "os datos donde tienen mBs sentido
Data #au"t 6Ar,uitectura de mode"ado 4undaciona" comn =C%IA7<Esta es una ar,uitectura de integraci2n de datos ,ue contiene una 'ase de datosorientada a" deta""e ,ue contiene un con;unto de ta'"as norma"iadas nicamenteen"aadas ,ue so+ortan una o mBs Breas 4unciona"es de "as ta'"as de negocio conta'"as sat:"ites +ara rastrear cam'ios hist2ricos0 Este en4o,ue h8'rido rene "o
me;or de" cruce entre "a tercera 4orma norma" 6?N%7
37
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 38/52
Page ?
DATA #ARE$%SE *S +D
PERACI!A"(so de !ase de DatosO+eraciona"es
(so deData &arehouse
uchos usuarios concurrentes Pocos usuarios concurrentes
Consu"tas +rede4inidas y
actua"ia'"es
Consu"tas com+"e;as9
4recuentementeno antici+adas0
Cantidades +e,ueHas de datosresumidas0
Cantidades grandes de datosresumidas0
Re,uerimientos de res+uestainmediata
Re,uerimientos de res+uesta nocr8ticos
38
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 39/52
<odelo de 5strella
39
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 40/52
54tracción, Transformación y 2arga 54tracción
<ultiples 8uentes 0rientadas a trabajo !atch + cagas de estos sistemas son más fuertes cuando los sistemas de
producción tienen poca carga
2onectvidad a diferentes tecnolog&as, diferentes manejadores de !Ds
Transformación
<anipulación de data compleja
(eunión de diferentes fuentes $mplementación de reglas de negocio
6impiado, ordenado, eliminación de duplicidades
0ptimi1ado para el desempeño y para grandes volmenes
2arga
2argar la data en tablas de hechos y dimensiones :roduce un historial en archivos o en la !D para tra1abilidad
0tros
2ontrola los flujos de ejecución+ maneja las dependencias entre tareas, control deejecución, gestión de errores, registros históricos#
40
5jemplos de transformación
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 41/52
5jemplos de transformación
Transformación de !squeda difusa
!usca valores en las tablas usando criterios difusos
5jemplo+ :ara un campo de te4to la data puede contener muchas variantes de la misma palabra?'friend., 'a friend., 'freind., etc@# 6a lógica difusa puede ayudar a reunir las variantes#
Transformación de dimensiones de cambio lento
yuda a manejar la actuali1ación de una dimensión de cambio lento
5jemplo + la información sobre los consumidores cambia constantemente, pero queremos una historia deestos
2ambio de dirección no queremos el valor anteiror ?reempla1o@
Un cambio en el valor >T GduplicamosH la entrada del consumidor agregando los datos adicionales ?para propósitosfinancieros@
41
Clave s,stit,ta
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 42/52
2ontrol de la 5jecución
6os datos son muy sensibles, la calidad de los reportesdepende la calidad de estos
2argar un Data Warehouse puede implicar reglas
complejas de e4tracción, transformación y carga 6os usuarios del negocio no confiarán en un DW si no
conf&an en su carga
42
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 43/52
5jemplos de paquetes en 5T6 8lujo de control y flujo de datos
43
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 44/52
<iddleBare
/on $nstancias intermedias a la carga y al acceso que sirvenpara verificar la calidad y fiabilidad de la data
5stación de transformación interina+ un área en la cual gruposde datos e4tra&dos de alguna de las fuentes pasan por unproceso de transformación antes de moverse hacia la base dedatos del almac-n#
5stación de aseguramiento de la calidad+ Un área en la cualgrupos de datos pasan por un conjunto de intensas revisionesde aseguramiento de la calidad antes de pasar hacia elalmac-n de datos#
44
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 45/52
<iddleBare ?I@
45
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 46/52
Sol,ción: crear almacenes de datos especiali-ados por .rea/ 0,e
reciben los datos desde el almac1n centrali-ado/ estos almacenes seconocen como Data Marts2
46
•Pro'"ema< a" crecer e" D&0 E" rendimiento de "as consu"tas decae y e" mode"ocentra"iado de;a de ser o+timo0
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 47/52
Toma de decisiones
• (n Datamart es una 'ase dedatos de+artamenta"9es+ecia"iada en e"a"macenamiento de "os datos
de un Brea de negocio
es+ec84ica0
• Se caracteria +or dis+oner "aestructura 2+tima de datos +araana"iar "a in4ormaci2n a"deta""e desde todas "as
+ers+ecti#as ,ue a4ecten a "os+rocesos de dichode+artamento0
DATAART
47
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 48/52
48
Data <art
:uede ser alimentado desde los datos de un
DW", o integrar por si mismo un compendio dedistintas fuentes de información#
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 49/52
Data Warehouses Vs. Data Marts
Data art
De+artamenta"
(n so"o tema
Pocos
1 G!
eses
Data artData
&arehouse
Pro+iedad
A"cance
Tema
%uente de datos
TamaHo 6t8+ico7
Tiem+o de im+"ementaci2n
Data &arehouse
Em+resaria"
"ti+"es
uchas
1 G! to Q 1 T!
eses a aHos
49
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 50/52
Su objetivo es agilizar la consulta e granes cantiaes e
atos! "aracteriza la #r$uitectura necesaria %ara lai&%le&entaci'n e un siste&a e a(ua en la to&a e
ecisiones! )a consultas son %ocas %ero son &u(
consu&ioras e tie&%o *%ueen correr +oras, las
actualizaciones son &enos .recuentes (/o la res%uesta a la
consulta no e%ene el +ec+o e tener actualizaa la basee atos!
So+orte anB"isis mu"tidimensiona" y+rocesamiento ana"8tico en "8nea6OLAP7
50
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 51/52
• Soporte an.lisis m,ltidimensional 3
procesamiento anal4tico en l4nea?"AP@
Los atos son clasi.icaos en i.erentes
i&ensiones ( %ueen ser vistas unas con otras en
i.erentes co&binaciones %ara obtener i.erentesanlisis e los atos $ue contienen!
)os suarios %ueen .or&ular consultas co&%lejas
arreglar atos en un re%orte ca&biar e atosresu&ios a atos etallados#
2(2T5($/T$2/
51
7/23/2019 datawarehouse ppt 01
http://slidepdf.com/reader/full/datawarehouse-ppt-01 52/52
ROLAP (Relational OLAP) MOLAP (multidimensionalOLAP)
Almacena los datos en un motor
relacional
Almacena los datos en una base de
datos multidimensional
Muchas dimensiones Diez o menos dimensiones
Soportan analisis OLAP contragrandes volumenens de datos
Se comportan razonablemente envolumenes de datos mas reducidos
(menos de 5b)!erramienta "le#ible $ general Soluci%n particular con vol&menes
de in"ormaci%n $ numero dedimensiones mas modestos
C"asi4icaci2n segn e" ti+o de motor en e",ue est:n a"macenados "os datos<
52