Sei sulla pagina 1di 10

UNIVERSIDAD METROPOLITANA CARRERA: INGENIERA DE SISTEMAS ASIGNATURA: DATA WAREHOUSE ASIGNATURA: Ing.

MARIBEL ANAGUANO TEMA: Caractersticas b sicas !e "n !ata#are$%"se Di&erencias entre base !e !at%s %'eraci%na( ) "n !ata#are$%"se NOMBRES: L"is Ba* n +, !e n%-ie.bre !e( /0+1

DATAWAREHOUSE
Para poder hablar de las caractersticas de un datawarehouse es necesario saber primeramente que es qu! es lo que hace" un datawarehouse es una base de datos corporati#a que se caracteri$a por inte%rar depurar in&ormaci'n de una o m(s &uentes distintas" para lue%o procesarla permitiendo su an(lisis desde in&inidad de puntos de #ista con %randes #elocidades de respuesta) *on la creaci'n de un datawarehouse podemos implantar una soluci'n completa &iable de +usiness ,ntelli%ence) -a #enta.a principal de este tipo de bases de datos radica en las estructuras en las que se almacena la in&ormaci'n /modelos de tablas en estrella" en copo de nie#e" cubos relacionales))) etc0) Este tipo de persistencia de la in&ormaci'n es homo%!nea &iable" permite la consulta el tratamiento .erarqui$ado de la misma) +ill ,nmon &ue quien uso el t!rmino de datawarehouse por primera #e$ el cual haciendo una traducci'n literal del t!rmino nos dice que es como un almac!n de datos" pero ha esto cabe recalcar que un datawarehouse es mucho m(s que eso" dentro de sus principales caractersticas tenemos1 INTEGRADO: los datos almacenados en el datawarehouse deben inte%rarse en una estructura consistente" por lo que las inconsistencias e2istentes entre los di#ersos sistemas operacionales deben ser eliminadas) -a in&ormaci'n suele estructurarse tambi!n en distintos ni#eles de detalle para adecuarse a las distintas necesidades de los usuarios) TEMTICO1 s'lo los datos necesarios para el proceso de %eneraci'n del conocimiento del ne%ocio se inte%ran desde el entorno operacional) -os datos se or%ani$an por temas para &acilitar su acceso entendimiento por parte de los usuarios &inales) Por e.emplo" todos los datos sobre clientes pueden ser consolidados en una 3nica tabla del datawarehouse) De esta &orma" las peticiones de in&ormaci'n sobre clientes ser(n m(s &(ciles de responder dado que toda la in&ormaci'n reside en el mismo lu%ar) HISTRICO: el tiempo es parte implcita de la in&ormaci'n contenida en un datawarehouse) En los sistemas operacionales" los datos siempre re&le.an el estado de la acti#idad del ne%ocio en el momento presente) Por el contrario" la in&ormaci'n almacenada en el datawarehouse sir#e" entre otras cosas" para reali$ar an(lisis de tendencias) Por lo tanto" el datawarehouse se car%a con los distintos #alores que toma una #ariable en el tiempo para permitir comparaciones)

NO VOLTIL: el almac!n de in&ormaci'n de un datawarehouse e2iste para ser ledo" pero no modi&icado) -a in&ormaci'n es por tanto permanente" si%ni&icando la actuali$aci'n del datawarehouse la incorporaci'n de los 3ltimos #alores que tomaron las distintas #ariables contenidas en !l sin nin%3n tipo de acci'n sobre lo que a e2ista) Otra caracterstica del datawarehouse es que contiene metadatos" es decir" datos sobre los datos) -os metadatos permiten saber la procedencia de la in&ormaci'n" su periodicidad de re&resco" su &iabilidad" &orma de c(lculo))) etc) -os metadatos ser(n los que permiten simpli&icar automati$ar la obtenci'n de la in&ormaci'n desde los sistemas operacionales a los sistemas in&ormacionales) -os ob.eti#os que deben cumplir los metadatos" se%3n el colecti#o al que #a diri%ido" son1 Dar soporte al usuario &inal" a ud(ndole a acceder al datawarehouse con su propio len%ua.e de ne%ocio" indicando qu! in&ormaci'n ha qu! si%ni&icado tiene) A udar a construir consultas" in&ormes an(lisis" mediante herramientas de +usiness ,ntelli%ence como DSS" E,S o *4,)

Dar soporte a los responsables t!cnicos del datawarehouse en aspectos de auditora" %esti'n de la in&ormaci'n hist'rica" administraci'n del datawarehouse" elaboraci'n de pro%ramas de e2tracci'n de la in&ormaci'n" especi&icaci'n de las inter&aces para la realimentaci'n a los sistemas operacionales de los resultados obtenidos))) etc)

Por 3ltimo" destacar que para comprender nte%ramente el concepto de datawarehouse" es importante entender cu(l es el proceso de construcci'n del mismo" denominado ET- /E2tracci'n" Trans&ormaci'n *ar%a0" a partir de los sistemas operaciones de una compa5a1

E2tracci'n1 obtenci'n de in&ormaci'n de las distintas &uentes tanto internas como e2ternas)

Trans&ormaci'n1 &iltrado" limpie$a" a%rupaci'n de la in&ormaci'n)

depuraci'n"

homo%enei$aci'n

*ar%a1 or%ani$aci'n de datos)

actuali$aci'n de los datos

los metadatos en la base

Datawarehouse

datamarts

Una de las cla#es del !2ito en la construcci'n de un datawarehouse es el desarrollo de &orma %radual" seleccionando a un departamento usuario como piloto e2pandiendo pro%resi#amente el almac!n de datos a los dem(s usuarios) Por ello es importante ele%ir este usuario inicial o piloto" siendo importante que sea un departamento con pocos usuarios" en el que la necesidad de este tipo de sistemas es mu alta se pueda obtener medir resultados a corto pla$o) Principales aportaciones de un datawarehouse Proporciona una herramienta para la toma de decisiones en cualquier (rea &uncional" bas(ndose en in&ormaci'n inte%rada %lobal del ne%ocio)

6acilita la aplicaci'n de t!cnicas estadsticas de an(lisis modeli$aci'n para encontrar relaciones ocultas entre los datos del almac!n7 obteniendo un #alor a5adido para el ne%ocio de dicha in&ormaci'n)

Proporciona la capacidad de aprender de los datos del pasado predecir situaciones &uturas en di#ersos escenarios)

de

Simpli&ica dentro de la empresa la implantaci'n de sistemas de %esti'n inte%ral de la relaci'n con el cliente)

Supone una optimi$aci'n tecnol'%ica econ'mica en entornos de *entro de ,n&ormaci'n" estadstica o de %eneraci'n de in&ormes con retornos de la in#ersi'n espectaculares)

*uando una compa5a tiene monta5as de datos no puede lle%ar a ellos adecuadamente) 8ada enloquece m(s a los e.ecuti#os que dos personas presentando el mismo resultado de operaci'n pero con di&erentes n3meros" en este caso lo que buscan es #er la in&ormaci'n pero desde di&erentes (n%ulos" mostrando 3nicamente lo que es importante para tomar una decisi'n en la empresa" &inalmente los e.ecuti#os saben que ha datos que nunca ser(n con&iables" por lo que pre&ieren que se e#iten en los reportes e.ecuti#os) Debemos tener en cuenta que uno de los #alores m(s importantes de una or%ani$aci'n es la in&ormaci'n) Estos #alores normalmente son %uardados por la or%ani$aci'n de dos &ormas1 -os sistemas operacionales de re%istros 9 el Data Warehouse -os sistemas operacionales de re%istros es donde los datos son depositados Data WareHouse es de donde se e2traen eso datos) el

-os ob.eti#os &undamentales de un Data WareHouse son1 Hace que la in&ormaci'n de la or%ani$aci'n sea accesible1 los contenidos del Data WareHouse son entendibles na#e%ables" el acceso a ellos son caracteri$ado por el r(pido desempe5o) Estos requerimientos no tienen &ronteras tampoco limites &i.os) *uando hablamos de entendible si%ni&ica" que los ni#eles de la in&ormaci'n sean correctos ob#ios) 9

8a#e%ables si%ni&ica el reconocer el destino en la pantalla lle%ar a donde queramos con solo un clic) R(pido desempe5o si%ni&ica" cero tiempo de espera) Todo lo dem(s es un compromiso por consi%uiente al%o que queremos me.orar)

Hacer que la in&ormaci'n de la or%ani$aci'n sea consistente1 la in&ormaci'n de una parte de la or%ani$aci'n puede hacerse coincidir con la in&ormaci'n de la otra parte de la or%ani$aci'n) Si dos medidas de la or%ani$aci'n tienen el mismo nombre" entonces deben si%ni&icar la misma cosa) 9 a la in#ersa" si dos medidas no si%ni&ican la misma cosa" entonces son etiquetados di&erentes) ,n&ormaci'n consistente si%ni&ica" in&ormaci'n de alta calidad) Si%ni&ica que toda la in&ormaci'n es contabili$ada completada) Todo lo dem(s es un compromiso por consi%uiente al%o que queremos me.orar)

Es in&ormaci'n adaptable el(stica1 el Data WareHouse esta dise5ado para cambios continuos) *uando se le hacen nue#as pre%untas al Data WareHouse" los datos e2istentes las tecnolo%as no cambian ni se corrompen) *uando se a%re%an datos nue#os al Data WareHouse" los datos e2istentes las tecnolo%as tampoco cambian ni se corrompen) El dise5o de Data 4arts separados que hacen al Data WareHouse" deben ser distribuidos e incrementados) Todo lo dem(s es un compromiso por consi%uiente al%o que queremos me.orar)

Es un se%uro baluarte que prote%e los #alores de la in&ormaci'n1 el Data WareHouse no solamente controla el acceso e&ecti#o a los datos" si no que da a los due5os de la in&ormaci'n %ran #isibilidad en el uso abusos de los datos" a3n despu!s de haber de.ado el Data WareHouse) Todo lo dem(s es un compromiso por consi%uiente al%o que queremos me.orar)

Es la &undaci'n de la toma de decisiones1 el Data WareHouse tiene los datos correctos para soportar la toma de decisiones) Solo ha una salida #erdadera del Data WareHouse1 las decisiones que son hechas despu!s de que el Data WareHouse ha a presentado las e#idencias) -a ori%inal etiqueta que preside el Data WareHouse si%ue siendo la me.or

descripci'n de lo que queremos construir1 un sistema de soporte a las decisiones) -os elementos b(sicos de un Data WareHouse Sistema fuente1 sistemas operacionales de re%istros donde sus &unciones son capturar las transacciones del ne%ocio) A los sistemas &uentes tambi!n se le conoce como -e%ac S stem) rea de trfi ! de dat!s: es un (rea de almacenamiento %rupo de procesos" que limpian trans&orman" combinan" remo#er los duplicados" %uardan" archi#an preparan los datos &uente para ser usados en el Data WareHouse) Ser"id!r de #resenta i$n: la maquina &sica ob.eti#o en donde los datos del Data WareHouse son or%ani$ados almacenados para queries directos por los usuarios &inales" reportes otras aplicaciones) M!de%! dimensi!na%: una disciplina espec&ica para el modelado de datos que es una alternati#a para los modelos de entidad : relaci'n) &r! es!s de ne'! i!s: un coherente %rupo de acti#idades de ne%ocio que hacen sentido a los usuarios del ne%ocio del Data WareHouse) Data Mart: un sub%rupo l'%ico del Data WareHouse completo)

Data (areH!use: b3squedas &uentes de datos de la empresa) 9 es la uni'n de todos los data marts que la constitu en) A%ma enamient! !#era i!na% de dat!s: es el punto de inte%raci'n por los sistemas operacionales) Es el acceso al soporte de decisiones por los e.ecuti#os) OLA&: acti#idad %eneral de b3squedas para presentaci'n de te2to n3meros del Data WareHouse" tambi!n un estilo dimensional especi&ico de b3squedas presentaci'n de in&ormaci'n que es e.empli&icada por #endedores de O-AP) ROLA&: un %rupo de inter&ases de usuarios aplicaciones que le dan a la base de datos relacional un estilo dimensional) MOLA&: un %rupo de inter&ases de usuarios" aplicaciones propietarios de tecnolo%a de bases de datos que tienen un &uerte estilo dimensional)

A#%i a i!nes #ara usuari!s fina%es: una colecci'n de herramientas que hacen los queries" anali$an presentan la in&ormaci'n ob.eti#o para el soporte de las necesidades del ne%ocio) Herramientas de a Data WareHouse) es! a dat!s #!r usuari!s fina%es 1 un cliente de

Ad H! )uer* T!!%: un tipo especi&ico de herramientas de acceso a datos por usuarios &inales que in#ita al usuario a &ormas sus propios queries manipulando directamente las tablas relacionales sus uniones) M!de%ad! de a#%i a i!nes: un so&isticado tipo de cliente de Data WareHouse con capacidades analticas que trans&orma o di%iere las salidas del Data WareHouse) Meta Data: toda la in&ormaci'n en el ambiente del Data WareHouse que no son as mismo los datos actuales)

-os procesos b(sicos del Data WareHouse /ET-0 E+tra i$n: este es el primer paso de obtener la in&ormaci'n hacia el ambiente del Data WareHouse) Transf!rma i$n: una #e$ que la in&ormaci'n es e2trada hacia el (rea de tra&ico de datos" ha posibles paso de trans&ormaci'n como7 limpie$a de la in&ormaci'n" tirar la basura que no nos sir#e" seleccionar 3nicamente los campos necesarios para el Data WareHouse" combinar &uentes de datos" haci!ndolas coincidir por los #alores de las lla#es" creando nue#as %%a"es #ara ada re'istr! de una dimensi$n, Car'a: al &inal del proceso de trans&ormaci'n" los datos est(n en &orma para ser car%ados) DI-ERENCIAS ENTRE .ASE DE DATOS O&ERACIONAL / 0N DATA(AREHO0SE En un Data Warehouse se almacena toda la in&ormaci'n de inter!s para una or%ani$aci'n que lue%o queramos anali$ar" mientras que" en una base de datos operacional se almacenan todas las transacciones de la or%ani$aci'n" tanto datos 3tiles como no 3tiles)

;amos a #er en qu! se di&erencian una base de datos operacional de un Data Warehouse1 Aspectos Objetivo Proceso Actividad Rendimiento Explotacin Volatilidad Usuarios Or ani!acin "ranularidad #ori!onte histrico Perspectiva Volumen de datos ) ) BD operacional De tipo operativo (operaciones del da a da) De transacciones. Repetitivo y conocido. Predomina la actualizacin Importancia del tiempo de respuesta de la transaccin instantnea Explotacin de la in ormacin relacionada con la operativa de cada aplicacin Actualiza"le %suarios de per iles medios o "a&os Estructura normalmente relacional Datos !enerales desa!re!ados$ al detalle () a *) das Importancia del dato actual Pe/ue-o0medio. Del orden del 1" a 2". Data Warehouse Anlisis y toma de decisiones De consultas masivas. Puntual y no conocido. Predomina la consulta Importancia de la respuesta masiva. Explotacin de toda la in ormacin interna y externa relacionada con el ne!ocio #ar!a$ pero no actualizacin %suarios de per iles altos 'isin multidimensional Datos en distintos niveles de detalle y a!re!acin + a ,) a-os Importancia del dato .istrico 1edio0!rande. Del orden del 2" a 3".

CONCL0SIONES: con este traba.o de in#esti%aci'n podemos darnos cuenta que un DATAWAREHOUSE" es un sistema con herramientas mu so&isticadas que nos permiten interactuar con di&erentes or%enes de datos sacar reportes con datos reales actuales" depurando as los datos o in&ormaci'n que no se necesita" a mi parecer &iltra per&ectamente la in&ormaci'n de acuerdo a los requerimientos de la empresa

RECOMENDACIONES: como recomendaci'n puedo decir que para elaborar un DATAWAREHOUSE debemos conocer tener en cuenta sus caractersticas b(sicas entender su &uncionamiento para poder sacar el ma or pro#echo posible de esta %ran herramienta)

.i1%i!'raf2a: -audon <eneth *)" -audon =ane P) " Sistemas de ,n&ormaci'n >erencial /?@ ed)0 4!2ico" Pearson Educaci'n" /ABBC0 http1DDwww)dwin&ocenter)or%Dcase&or)html http1DDdatawarehouse)ittoolbo2)comD Ralph <imball" -aua Ree#es" 4ar% Ross" Warren ))))The Data WareHouse -i&ec cle ToolEit Wile Edition http1DDwww)sinne2us)comDbusinessFintelli%enceDdatawarehouse)asp2 http1DDanabui%ues)comDABGBDBGDGCDdataHwarehouseH HlasHbasesHdeHdatosH operacionalesD http1DDwww)mono%ra&ias)comDtraba.osGIDdataHwarehouseDdataH warehouse)shtmlJi2$$AEda6GDb2