Sei sulla pagina 1di 26

UNIVERSIDAD TECNLOGICA DEL PER

FACULTAD DE INGENIERA DE SISTEMAS

______________________________________________________
DESARROLLO E IMPLEMENTACIN DE UN DATA WAREHOUSE
ORIENTADO A MEJORAR LA TOMA DE DECISIONES Y LA
GESTIN EN EMPRESAS TEXTILES DE LA ZONA GAMARRA
______________________________________________________

Edson Andr Huangal Silva

PROFESOR: Ing. Hermes Exaltacin Abanto Flores

Lima, 09 de junio del 2015


INDICE

2
3

Planteamiento del Problema


2 Definicin del Problema.3
3 Formulacin del Problema....3
1.2.1 Problema General...3
1.2.2 Problemas especficos...4
1.3 Objetivos.....4
1.3.1 Objetivo General.4
1.3.2 Objetivos Especficos.4
1.4 Justificacin e importancia...4
1.5 Alcances y limitaciones.4
1.5.1 Alcances..4
1.5.2 Limitaciones....5
Marco Terico - Conceptual
2.2 Antecedentes.5
2.3 Marco conceptual.6
Marco Metodolgico
3.2 Metodologa.11
3.2.1 Etapa: Organizacin...11
3.2.2 Etapa: Desarrollo....14
3.2.3 Etapa: Implementacin..16
3.2.4 Etapa: Evaluacin..17
3.3 Herramientas...18
3.4 Tcnica.22
Gestin del proyecto
4.2 Cronograma25
4.3 Presupuesto....27

Bibliografa.28
Glosario de trminos28

[2]

1. Planteamiento del Problema


1.1. Definicin del Problema
La tecnologa a nivel mundial avanza a pasos agigantados, es por ello
que la toma de decisiones y la buena gestin es de vital importancia
para la supervivencia de empresa. Gerentes y administradores
requieren conocer y disponer de informacin exacta, precisa, real y
completa para que sus decisiones posibiliten el crecimiento de su
organizacin.
El desconocimiento que existe en las empresas textiles de la zona
Gamarra sobre la utilizacin de herramientas que ayuden en la toma de
decisiones y la buena gestin a nivel gerencial, hace que pierdan
tiempo y dinero, y ms an el no contar con almacenes de datos que
les permita analizar la problemtica que existe en la misma y tomar sus
decisiones de manera ptima para que la empresa a su cargo vaya
creciendo en el mercado.
Hoy en da las en las empresas textiles generan enormes cantidades de
datos que no son analizados ni gestionados correctamente, un gran
porcentaje de esos datos no contribuyen a la toma de decisiones
empresariales ya que para poder usarlo primero hay que llevarlo a que
sea informacin til para los usuarios.
Actualmente las empresas textiles que estn en el corazn Gamarra
cuentan con pequeos sistemas de informacin que almacenan datos.
Un 65% de empresas textiles en la zona de Gamarra usa un sistema y
en conjunto una base de datos cuyo diseo est orientado al
almacenamiento pero no a la consulta ni a la explotacin de la
informacin almacenada. Percatndome de eso noto que los gerentes y
administradores necesitan cada vez una mayor cantidad de reportes;
as mismo que los trabajadores de las empresas textiles puedan
analizar la informacin desde una forma histrica y actual, adems de
ello que tengan como finalidad poder predecir algunos eventos futuros.
Por ese motivo es necesario la elaboracin de un data warehouse para
ayudar a mejorar la toma de decisiones y la gestin en las empresas
textiles de la zona de Gamarra.
1.2. Formulacin del Problema
4.3.1 Problema General
Es posible elaborar un data warehouse para ayudar a mejorar la
toma de decisiones y la gestin de empresas textiles de la zona
de Gamarra?

[3]

4.3.2 Problemas Especficos


-

Se puede realizar un estudio de procesos data warehouse


en las empresas textiles de la zona de Gamarra?
Se puede realizar una implementacin de data warehouse
en la empresas textiles de Gamarra?

4.4 Objetivos
4.4.1 Objetivo General
Elaborar un data warehouse para ayudar a mejorar la toma de
decisiones y la gestin de empresas textiles de la zona de
Gamarra.

4.4.2 Objetivos Especficos


- Realizar un estudio de procesos para que nos ayude a
optimizar los procesos en las empresas textiles de la zona de
Gamarra.
- Realizar una implementacin de un data warehouse en las
empresas textiles de la zona de Gamarra.
4.5 Justificacin e importancia
La realizacin del presente proyecto se justifica para mejorar la toma de
decisiones y la gestin en las empresas textiles en las zonas de
Gamarra.
La ventaja de utilizar un data warehouse como herramienta para el
soporte de una empresa son muchas como por ejemplo: el
departamento de ventas de la empresa textil puede hacer la consulta
de informacin sin tener que depender de personal tcnico (ya sea
algn analista de sistemas o algn programador), tambin en este
departamento se podr examinar informacin desde distintos puntos de
vista de forma en que se pueda interpretar en base a su criterio.
La investigacin es de gran utilidad ya que especficamente las
empresas textiles de la zona de Gamarra, adems se podr generar
reportes desde una forma histrica y actual. Tambin se podr llegar a
predecir eventos futuros para que se puedan tomar mejores decisiones
y gestionar de forma correcta la empresa textil.
Esta investigacin causa alto impacto ya que da una profunda
transformacin en el manejo de datos e informacin para las empresas
textiles de la zona de Gamarra. A su vez puede servir para que otras
empresas textiles de otras zonas puedan llevar la misma regla de
negocio.
4.6 Alcances y limitaciones
4.6.1 Alcances
El alcance depende del tipo de empresa, es decir, el tamao y
aplicativo que tenga la empresa a las cuales les voy a brindar el

[4]

servicio. Depender tambin de las cuan estructurado sea la


empresa al cual le voy a brindar el servicio.
4.6.2 Limitaciones
- Informalidad
- Falta de documentacin de los sistemas
- Falta de informacin de los aplicativos que esten en
produccin de las empresas
2. Marco Terico - Conceptual
2.1. Antecedentes
Falcn Rodrguez, Neris, Desarrollo de una solucin de
Inteligencia de Negocios en el manejo de estadsticas de control en
la venta de repuestos de la empresa Talleres Ambamazda S.A. de la
ciudad de Ambato.
- Metodologa
Se utiliz la metodologa Ralph Kimball para este tipo de
negocios porque se acoge a los requerimientos generales
definidos por parte de la empresa y se puede extraer los
datos de las ventas de manera eficaz, obteniendo resultados
exitosos al momento del anlisis de los datos desde
perspectivas diferentes a nivel gerencial.
-

Conclusin
Con los indicadores claves de rendimiento definidos por la
empresa se examina la informacin de las ventas, la misma
puede basar sus anlisis de informacin en la informacin al
detalle y actualizada que presenta la solucin QlikView.

Villanueva Ojeda, lvaro. Anlisis, diseo e implementacin de un


Datawarehouse de soporte de decisiones para un hospital del
sistema de salud pblico.
- Metodologa
Se bas en 5 etapas:
o Etapa 1. Adquirir conocimientos de base: datos
histricos, entrevistas.
o Etapa 2. Anlisis de informacin y construccin del
sistema legado (en base a sistemas operacionales ya
existentes).
o Etapa 3. Diseo conceptual multidimensional, en esta
etapa se elige la herramienta de diseo a usar para
representar el diseo conceptual del modelo de datos
del Data Warehouse.
o Etapa 4. Diseo lgico multidimensional,
o Etapa 5. Construccin del prototipo de carga y
refresque del Data Warehouse.
- Conclusin
[5]

El trabajo de tesis presenta una solucin que los hospitales


pueden implementar para satisfacer sus necesidades de
gestin, anlisis y toma de decisiones. Otorga un panorama
de lo que est sucediendo en el hospital y presenta esta
informacin en lnea.
2.2. Marco conceptual
2.2.1. Definicin de la toma de decisiones
La toma de decisiones es el proceso de identificacin de un
problema u oportunidad y la seleccin de una alternativa de
accin entre varias existentes, es una actividad diligente clave en
todo tipo de organizacin.
2.2.2. Proceso de la toma de decisiones
Debido a la inestabilidad de los ambientes y el riesgo de actuar
sin contar con los elementos necesarios, los directivos de las
organizaciones necesitan manipular grandes volmenes de datos,
convertirlos en informacin y generar el conocimiento necesario
para cumplir con los objetivos propuestos.
Cabe resaltar que el proceso de la toma de decisiones abarca
cuatro funciones administrativas importantes como planeacin,
organizacin, direccin y control.
-

Planeacin
Seleccin de misiones y objetivos as como de las acciones
para cumplirlas. Esto implica Toma de decisin.
Cules son los objetivos de la organizacin, a largo plazo?
Qu estrategias son mejores para lograr este objetivo?

Organizacin
Establecimiento de la estructura que desempean los
individuos dentro de la organizacin.
Cunta centralizacin debe existir en la organizacin?

Direccin
Esta funcin requiere que los administradores influyan en los
individuos para el cumplimiento de las metas
organizacionales y grupales.
Cmo manejo a un grupo de trabajadores que parecen tener
una motivacin baja?

Control
Es la medicin y correccin del desempeo individual y
organizacional de manera tal que se puedan lograr los
planes.

2.2.3. Etapas de la toma de decisiones


[6]

Existen 6 etapas de la toma de decisiones que son importantes


tomar en cuenta a la hora de identificar el problema que presentan
las empresas.
Las etapas de la toma de decisiones son:
- Identificacin y diagnstico del problema
- Generacin de soluciones alternativas
- Seleccin de la mejor alternativa
- Evaluacin de alternativas
- Evaluacin de la decisin
- Implantacin de la decisin
2.2.4. Sistema de Soporte de Decisin (DSS)
Un Sistema de Soporte a la Decisin (DSS) es una herramienta
de Business Intelligence enfocada al anlisis de los datos de una
organizacin.
En principio, puede parecer que el anlisis de datos es un proceso
sencillo, y fcil de conseguir mediante una aplicacin hecha a
medida o un ERP sofisticado.
Los sistemas de soporte a la decisin tienen caractersticas que
se detallan a continuacin:
-

Informes dinmicos, flexibles e interactivos: De manera


que el usuario no tenga que ceirse a los listados
predefinidos que se configuraron en el momento de la
implantacin, y que no siempre responden a sus dudas
reales.

No requiere conocimientos tcnicos: Un usuario no tcnico


puede crear nuevos grficos e informes y navegar entre ellos,
haciendo drag&drop o drill through. Por tanto, para examinar
la informacin disponible o crear nuevas mtricas no es
imprescindible buscar auxilio en el departamento de
informtica.

Rapidez en el tiempo de respuesta: Ya que la base de


datos subyacente suele ser un data warehouse corporativo o
un Datamart, con modelos de datos en estrella o copo de
nieve. Este tipo de bases de datos estn optimizadas para el
anlisis de grandes volmenes de informacin.

Integracin entre todos los sistemas/departamentos de la


compaa: El proceso de ETL previo a la implantacin de un
Sistema de Soporte a la Decisin garantiza la calidad y la
integracin de los datos entre las diferentes unidades de la
empresa. Existe lo que se llama: integridad referencial
absoluta.

[7]

Cada usuario dispone de informacin adecuada a su


perfil: No se trata de que todo el mundo tenga acceso a toda
la informacin, sino de que tenga acceso a la informacin que
necesita para que su trabajo sea lo ms eficiente posible.

Disponibilidad de informacin histrica: En estos sistemas


est a la orden del da comparar los datos actuales con
informacin de otros perodos histricos de la compaa, con
el fin de analizar tendencias, fijar la evolucin de parmetros
de negocio... etc.

2.2.5. Gestin empresarial


Es el proceso de planificar, organizar, ejecutar y evaluar una
empresa, lo que se traduce como una necesidad para la
supervivencia y la competitividad de las pequeas y medianas
empresas a mediano y largo plazo.
2.2.6. Herramientas para la gestin
La gestin, al igual que muchas otras funciones dentro de la
empresa, se basa en cuatro herramientas que son:
-

Plan de negocios
Estructura del negocio
Contabilidad
Lista de comprobacin

A continuacin se describen brevemente cada una de las


anteriores herramientas, para su fcil comprensin y asimilacin:
-

Plan de negocios: Un plan de negocios es una serie de


actividades relacionadas entre s para el comienzo o
desarrollo de una empresa o proyecto con un sistema de
planeacin tendiente alcanzar metas determinadas. El plan
define las etapas de desarrollo de un proyecto de empresa y
es una gua que facilita la creacin o el crecimiento de la
misma.

Estructura del negocio: La estructura de negocios se refiere


directamente a las responsabilidades que le corresponden a
cada persona dentro de una empresa y los tipos y estructuras
de negocios que se establecen regularmente, tales como:
propiedad individual , sociedades, limitada y corporaciones.

Contabilidad: El uso de la contabilidad dentro de la gestin


es muy importante, es por eso que el gestor, deber tener
altos conocimientos de contabilidad, para poder llevar a cabo
sus funciones como gestor.

[8]

Lista de comprobacin: Esta herramienta elaborada en


forma de cuestionario por la Agencia Federal para el
Desarrollo de la Pequea Empresa es una gua, que sirve
para ayudarle a preparar un plan de negocios completo y
para determinar si sus ideas se pueden realizar, y as
convertir sus sueos es realidades.

2.2.7. Data warehouse


Un Data warehouse es una base de datos corporativa que se
caracteriza por integrar y depurar informacin de una o ms
fuentes distintas, para luego procesarla permitiendo su anlisis
desde infinidad de perspectivas y con grandes velocidades de
respuesta. La creacin de un Data warehouse representa en la
mayora de las ocasiones el primer paso, desde el punto de vista
tcnico, para implantar una solucin completa y fiable de
Inteligencia de Negocios.
2.2.8. Procesos bsicos del data warehouse
- Extraccin: Es el primer paso de obtener informacin hacia el
ambiente del Data Warehouse. Consiste en extraer los datos
desde los sistemas de origen. Cada sistema separado puede
usar una organizacin diferente de los datos o formatos
distintos. La extraccin convierte los datos a un formato
preparado para iniciar el proceso de transformacin.
-

Transformacin: Luego de que la informacin fue extrada, se


pueden realizar diferentes pasos de transformacin, como
puede ser: limpieza de la informacin, botar a la basura lo que
consideramos innecesario, seleccionar campos especficos
que consideremos necesarios para el Data Warehouse,
realizar combinaciones fuentes de datos, etc.

Carga: Al final del proceso de transformacin, los datos estn


en forma para ser cargados. Dependiendo de los
requerimientos de la organizacin, este proceso puede
abarcar una amplia variedad de acciones diferentes.

2.2.9. Planificacin del proyecto


Busca identificar la definicin y el alcance del proyecto de Data
Warehouse, las justificaciones del negocio y evaluaciones de
factibilidad. Se focaliza sobre recursos, perfiles, tareas,
duraciones y secuencialidad.
Es independiente al negocio y sus requerimientos. Esta etapa
identifica el escenario del proyecto para saber dnde surge la
necesidad del Data Warehouse.
[9]

2.2.10. SQL (Structured Query Language)


Lenguaje de interrogacin normalizado para bases de datos
relacionales. El SQL es un lenguaje de alto nivel, no procedural,
normalizado, que permite la consulta y actualizacin de los datos de
BD relacionales. Se ha convertido en el estndar para acceder a BD
relacionales. La primera versin se aprob como norma ISO en 1987
y la segunda, conocida como SQL2 y vigente actualmente, en 1992.
Actualmente se trabaja en la norma SQL3 que soportar bases de
datos orientadas a objeto y bases de datos activas. El SQL facilita un
lenguaje de definicin de datos y un lenguaje de manipulacin de
datos. Adems, incluye una interface que permite el acceso y
manipulacin de la BD a usuarios finales.
2.2.11.
Teradata
El Sistema de Gestin de Base de Datos Relacional (RDBMS)
Teradata de NCR, es una base de datos relacional paralela de
soporte de decisiones muy poderosa para data warehousing. Con el
servidor basado en el soporte para UNIX SVR4 y Microsoft
Windows NT, Teradata ofrece soporte a las empresas para la
escalabilidad desde gigabytes a terabytes, petabytes y ms.
2.2.12.
Sistema de informacin (SI)
Conjunto de elementos fsicos, lgicos, de comunicacin, datos y
personal que, interrelacionados, permiten el almacenamiento,
transmisin y proceso de la informacin.
2.2.13.
Sistema de gestin de base de datos (SGBD)
Software que controla la organizacin, almacenamiento,
recuperacin, seguridad e integridad de los datos en una base de
datos. Acepta pedidos de datos desde un programa de aplicacin y
le ordena al sistema operativo transferir los datos apropiados.
2.2.14.
Red neuronal artificial
Son abstracciones ms o menos complejas que tratan de emular el
funcionamiento de las redes neuronales del cerebro humano. La
mayora de las veces son modelos tericos que se plasman en
programas de ordenador y unas pocas modelos sobre silicio para
aprovechar la velocidad de proceso paralelo de estas arquitecturas.
2.2.15.
Diccionario de datos
Descripcin lgica de los datos para el usuario. Rene la
informacin sobre los datos almacenados en la BD (descripciones,
significado, estructuras, consideraciones de seguridad, edicin y
uso de las aplicaciones, etc.).
[10]

2.2.16.
Directorio de datos
Es un subsistema del sistema de gestin de base de datos que
describe dnde y cmo se almacenan los datos en la BD (modo de
acceso y caractersticas fsicas de los mismos).

3. Marco Metodolgico
3.1. Metodologa
3.1.1. Etapa: Organizacin
3.1.1.1. Elaborar factores en la planificacin de un data warehouse
- Establecer una asociacin de usuarios, gestin y grupos
Es esencial involucrar tanto a los usuarios como a la gestin
para asegurar que el data warehouse contenga informacin
que satisfaga los requerimientos de la empresa.
-

Seleccionar una aplicacin piloto con una alta probabilidad de


xito.
Una aplicacin piloto de alcance limitado, con un reembolso
medible para los usuarios y la gestin, establecer el data
warehouse como una tecnologa clave para la empresa.

Construir prototipos rpida y frecuentemente


La nica manera para asegurar que el data warehouse rena
las necesidades de los usuarios, es hacer el prototipo a lo
largo del proceso de implementacin y an ms all, as
como agregar los nuevos datos y/o los modelos en forma
permanente.

Construir prototipos rpida y frecuentemente


La nica manera para asegurar que el data warehouse rena
las necesidades de los usuarios, es hacer el prototipo a lo
largo del proceso de implementacin y an ms all, as
como agregar los nuevos datos y/o los modelos en forma
permanente.

Planificar la implementacin incremental


La implementacin incremental reduce riesgos y asegura que
el tamao del proyecto permanezca manejable en cada fase.

Reportar activamente y publicar los casos exitosos


La retroalimentacin de los usuarios ofrece una excelente
oportunidad para publicar los hechos exitosos dentro de una
organizacin. La publicidad interna sobre cmo el data
warehouse ha ayudado a los usuarios a operar ms
[11]

efectivamente puede apoyar la construccin del data


warehouse a lo largo de una empresa.
3.1.1.2. Elaborar estrategias para el desarrollo del data warehouse
- Establecer un ambiente "data warehouse virtual", el cual
puede ser creado por:
Instalacin de un conjunto de facilidades para acceso a
datos, directorio de datos y gestin de proceso.
-

Construir una copia de los datos operacionales desde un


sistema operacional nico y posibilitar al data warehouse de
una serie de herramientas de acceso a la informacin.
Esta estrategia tiene la ventaja de ser simple y rpida.

Seleccionar la estrategia data warehousing ptima es


seleccionar el nmero de usuarios basados en el valor de la
empresa y hacer un anlisis de sus puntos, preguntas y
necesidades de acceso a datos.

3.1.1.3. Elaborar estrategias para el diseo del data warehouse


- Los usuarios de los data warehouse usualmente no conocen
mucho sobre sus requerimientos y necesidades como los
usuarios operacionales.
-

El diseo de un data warehouse, con frecuencia involucra lo


que se piensa en trminos ms amplios y con conceptos del
negocio ms difciles de definir que en el diseo de un
sistema operacional. Al respecto, un data warehouse est
bastante cerca de Reingeniera de los Procesos del Negocio
(Business Process Reengineering).

Finalmente, la estrategia de diseo ideal para un data


warehousing es generalmente de afuera hacia adentro
(outside-in) a diferencia de arriba hacia abajo (top-down).

3.1.1.4. Elaborar estrategias para la gestin de un data warehouse


- Un data warehouse es una inversin buena slo si los
usuarios finales realmente pueden conseguir informacin vital
ms rpida y ms barata de lo que obtienen con la tecnologa
actual.
- La administracin debe reconocer que el mantenimiento de la
estructura del data warehouse es tan crtico como el
mantenimiento de cualquier otra aplicacin de misin-crtica.
-

La gestin debe comprender tambin que si se embarcan


sobre un programa data warehousing, se crearn nuevas
[12]

demandas sobre sus sistemas operacionales, que son


demandas para mejorar datos o para una data consistente
3.1.1.5. Evaluar la redundancia de datos
- Data Warehouse "Virtual" o "Point to Point"
Una estrategia de data warehouse virtual, significa que los
usuarios finales pueden tener acceso a bases de datos
operacionales directamente, usando cualquier herramienta
que posibilite "la red de acceso de datos".
-

Data Warehouse "Centrales"


El concepto de data warehouse centrales es el concepto
inicial que se tiene del data warehouse. Es una nica base de
datos fsica, que contiene todos los datos para un rea
funcional especfica, departamento, divisin o empresa.

Data Warehouse Distribuidos


Los data warehouse distribuidos son aquellos en los cuales
ciertos componentes del depsito se distribuyen a travs de
un nmero de bases de datos fsicas diferentes.

3.1.1.6. Definir los tipos de usuarios finales


De la misma forma que hay una gran cantidad de maneras
para organizar un data warehouse, es importante notar que
tambin hay una gama cada vez ms amplia de usuarios
finales.
En general, se puede considerar tres grandes categoras:
- Ejecutivos y gerentes
- "Power users" o "Buzo de Informacin" (analistas
financieros y de negocios, ingenieros, etc.)
- Usuarios de soporte (de oficina, administrativos, etc.)

3.1.2. Etapa: Desarrollo


3.1.2.1. Disear la arquitectura
3.1.2.1.1.
Elaborar arquitectura del deposito
- Un plan para almacenar los datos de su compaa, que
podra obtenerse desde fuentes mltiples internas y externas,
es consolidar la base de datos en un data warehouse
integrado. El enfoque consolidado proporciona eficiencia
tanto en la potencia de procesamiento como en los costos de
soporte.
- La arquitectura global distribuye informacin por funcin, con
datos financieros sobre un servidor en un sitio, los datos de
comercializacin en otro y los datos de fabricacin en un
tercer lugar.
[13]

Una arquitectura por niveles almacena datos altamente


resumidos sobre una estacin de trabajo del usuario, con
resmenes ms detallados en un segundo servidor y la
informacin ms detallada en un tercero.

3.1.2.1.2.
Elaborar arquitectura del servidor
- Servidores de un solo procesador
Los servidores de un slo procesador son los ms fciles de
administrar, pero ofrecen limitada potencia de procesamiento
y escalabilidad. Adems, un servidor slo presenta un nico
punto de falla, limitando la disponibilidad garantizada del
depsito.
- Multiprocesamiento simtrico
Las mquinas de multiprocesamiento simtrico (Symmetric
MultiProcessing - SMP) aumentan mediante la adicin de
procesadores que comparten la memoria interna de los
servidores y los dispositivos de almacenamiento de disco.
- Procesamiento en paralelo masivo
Una mquina de procesamiento en paralelo masivo
(Massively Parallel Processing - MPP), conecta un
conjunto de procesadores por medio de un enlace de
banda ancha y de alta velocidad. Cada nodo es un
servidor, completo con su propio procesador
(posiblemente SMP) y memoria interna. Para optimizar
una arquitectura MPP, las aplicaciones deben ser
"paralelizadas" es decir, diseadas para operar por
separado, en partes paralelas.
- Acceso de memoria no uniforme
La dificultad de mover aplicaciones y los DBMS a
agrupaciones o ambientes realmente paralelos ha
conducido a nuevas y recientes arquitecturas, tales como
el acceso de memoria no uniforme
3.1.2.2. Elaborar sistemas de gestin de bases de datos
Los data warehouse (conjuntamente con los sistemas de
soporte de decisin [Decision Support Systems - DSS] y las
aplicaciones cliente/servidor), fueron los primeros xitos para el
DBMS relacional (Relational Data Base Management Systems
- RDBMS).
Los RDBMS son muy flexibles cuando se usan con una
estructura de datos normalizada.
La performance de los RDBMS tradicionales es mejor para
consultas basadas en claves ("Encuentre cuenta de cliente
#2015") que para consultas basadas en el contenido
("Encuentre a todos los clientes que hayan comprado cualquier
producto de la empresa en los ltimos seis meses a un precio
mayor de S/. 35).
[14]

3.1.2.3. Definir combinacin de la arquitectura con el sistema de


gestin de base de datos
Para seleccionar la combinacin correcta de la arquitectura del
servidor y el DBMS, primero es necesario comprender los
requerimientos comerciales de su compaa, su poblacin de
usuarios y las habilidades del personal de soporte.
Las implementaciones de los data warehouse varan
apreciablemente de acuerdo al rea. Las otras
implementaciones renen datos a travs de toda la empresa
para soportar una variedad de grupos de usuarios y funciones.
Por regla general, a mayor rea del depsito, se requiere
mayor potencia y funcionalidad del servidor y el DBMS.
Los modelos de uso de los data warehouse son tambin un
factor. Las consultas y vistas de reportes pre estructuradas
frecuentemente satisfacen a los usuarios informticos,
mientras que hay menos demandas sobre el DBMS y la
potencia de procesamiento del servidor. El anlisis complejo,
que es tpico de los ambientes de decisin-soporte, requiere
ms poder y flexibilidad de todos los componentes del servidor.
Las bsquedas masivas de grandes data warehouse favorecen
el paralelismo en el DBMS y el servidor.
3.1.2.4. Hacer limpieza de los datos
- Analizar sus datos corporativos para descubrir inexactitudes,
anomalas y otros problemas.
- Transformar los datos para asegurar que sean precisos y
coherentes.
- Asegurar la integridad referencial, que es la capacidad del
data warehouse, para identificar correctamente al instante
cada objeto del negocio, tales como un producto, un cliente o
un empleado.
- Validar los datos que usa la aplicacin del data warehouse
para realizar las consultas de prueba.
- Producir la metadata, una descripcin del tipo de datos,
formato y el significado relacionado al negocio de cada
campo.
- Finalmente, viene el paso crucial de la documentacin del
proceso completo para que se pueda ampliar, modificar y
arreglar los datos en el futuro con ms facilidad.
3.1.2.5. Definir tipos de limpieza de datos
- Limpieza de datos moderada, El software de gestin del data
warehouse puede ser suficiente para limpiar y validar segn
sus propsitos.
- Limpieza de datos intensa, las empresas textiles de la zona
de Gamarra podran adoptar un enfoque top-down, en la que
los gerentes proponen las reglas para limpiar los datos.
[15]

3.1.2.6. Definir factores decisivos para decidir el desarrollo de un


data warehouse
La data sucia es un serio peligro para el xito de un proyecto
de data warehouse. Dependiendo del alcance del problema,
simplemente podra no ser posible dirigirlo rpidamente y
abaratarlo.
Los principales factores son:
El tiempo que toma la programacin interna
El costo de las herramientas
Los gerentes de proyectos de Data Warehouse necesitan
evaluar el problema con realismo, los recursos internos
disponibles para distribuirlos y seleccionar la solucin que se
adapte a la planilla y presupuesto del proyecto, o modificar la
planilla y el presupuesto para solucionar el problema.
3.1.3. Etapa: Implementacin
3.1.3.1. Definir elementos a considerar en la implementacin
- Proyecto Total o Proyecto en Fases
Es ms viable el desarrollo de un proyecto en fases que
produzcan resultados a corto plazo que el desarrollo de un
proyecto que entregue resultados al trmino de varios aos.
Por ello, el proyecto debe estar centrado en un rea o un
proceso.
- Modelo lgico de datos
El modelo lgico de datos debe tener un alcance ms alto y
cubrir todas las reas de inters, as como los procesos ms
estratgicos de cada una de ellas.
- Proyecto Especializado o Proyecto Base
Decidir sobre qu tipo de proyecto, es algo complicado. Un
proyecto especializado soporta directamente un proceso
especfico, por ejemplo: retencin de clientes.
3.1.3.2.
-

Planear estrategias para el proceso de implementacin

Identificar el problema en el cual el uso estratgico de la


informacin detallada, permita conseguir una solucin para
generar una ventaja competitiva o un ahorro de costos.
Definir el modelo lgico de datos a implementar para resolver
el problema planteado.
Reunir los datos para poblar ese modelo lgico de datos.
Tomar iniciativas de complementacin de informacin para
asegurar la calidad de los datos requeridos para poblar el
modelo de datos.

3.1.3.3. Plantear estrategias en la implementacin


- Definir el mejor diseo fsico para el modelo de datos. El
diseo fsico debe estar orientado a generar buen rendimiento
[16]

en el procesamiento de consultas, a diferencia del modelo


lgico que est orientado al usuario y a la facilidad de
consulta.
Definir los procesos de extraccin, filtro, transformacin de
informacin y carga de datos que se deben implementar para
poblar ese modelo de datos.
Definir los procesos de administracin de la informacin que
permanece en el data warehouse
Definir las formas de consultas a la informacin del data
warehouse que se le proporcionar al usuario.
Completar el modelo de consulta base, relativo al rea
seleccionada.
Implementar los procesos estratgicos del rea de trabajo, es
decir, implementar herramientas especializadas de scoring,
herramientas especializadas para induccin de conocimiento
(Data Mining), etc.
Completar las reas de inters, en forma similar a lo descrito
anteriormente.

3.1.4. Etapa: Evaluacin


3.1.4.1. Evaluar de rendimiento de la inversin
Cuando se evalan los costos, el usuario del data warehouse
puede no tener el contenido de los costos en mente, pero las
preguntas mnimas que puede comenzar a hacerse son las
siguientes:
1. Qu clases de costos excedieron el presupuesto en ms
del 10% en cada uno de los 12 meses pasados?
2. Cmo especificar las clases de gasto entre diferentes
departamentos de la empresa?
3. Se han incrementado los costos?

3.2. Herramienta

[17]

Cuestionario: Es el mtodo que utiliza un instrumento o


formulario impreso, destinado a obtener respuestas sobre el
problema en estudio. El Cuestionario se aplic a los
trabajadores de la empresa Estrategia y Solucin
Confeccin Textil y contuvo preguntas abiertas y cerradas,
para obtener informacin bsica relacionada al tema de
investigacin.

Herramientas de reporting: son para usuarios de diferentes


departamentos que necesitan explotar en su trabajo diario
una informacin concreta.

Herramientas de consulta y reporte: Existe una gran cantidad


de poderosas herramientas de consulta y reporte en el
mercado. Algunos proveedores ofrecen productos que
permiten tener ms control sobre qu procesamiento de
consulta es hecho en el cliente y qu procesamiento en el
servidor.
Las ms simples de estas herramientas son productos de
reporte y consultas bsicas.
Se usara Microsoft Access, programa para tener acceso a la
informacin de una base de datos, las herramientas de
consulta al igual que la mayora de herramientas visuales, le
permiten apuntar y dar un clic a los mens y botones para
especificar los elementos de datos, condiciones, criterios de
agrupacin y otros atributos de una solicitud de informacin.

Sistemas de informacin ejecutivos


Las herramientas de sistemas de informacin ejecutivos
(Executive Information Systems - EIS), proporcionan medios
sumamente fciles de usar para consulta y anlisis de la
informacin confiable. Generalmente se disean para el
usuario que necesita conseguir los datos rpidamente, pero
quiere utilizar el menor tiempo posible para comprender el
uso de la herramienta.
Tambin, permiten a los desarrolladores de sistemas colocar
el contexto del negocio alrededor de informacin diversa. Se
usara el BOARD (Pragma Inform)

Herramientas dataminig
Datamining es una categora de herramientas de anlisis
open-end. En lugar de hacer preguntas, se toma estas
[18]

herramientas y se pregunta algo "interesante", una tendencia


o una agrupacin peculiar, por ejemplo. El proceso de
datamining extrae los conocimientos guardados o informacin
predictiva desde el data warehouse sin requerir pedidos o
preguntas especficas.
Las herramientas Mining usan algunas de las tcnicas de
computacin ms avanzadas como:
o Redes neuronales
o Deteccin de desviacin
o Modelamiento predictivo
o Programacin gentica
-

Sistema de gestin de base de datos (SGBD)


Estos software proporcionan procesamiento en paralelo y/o
algo fuera de los aspectos ordinarios, que puedan ser
especialmente interesantes para la gente de desarrollo de
data warehouse y de sistemas de soporte de decisiones.
Se usara Mysql, ya que es open source.

Si el coste de estas licencias es una barrera importante, sobre


todo para las pymes, una opcin interesante es la de la
utilizacin de herramientas de Open Source, que no tienen
coste en cuanto a licencia. Tampoco hay que olvidarse que
las licencias de software no tienen por qu representar el
mayor gasto en la implantacin de un sistema de Data
Warehouse.

3.3. Tcnica
Una vez recolectada la informacin necesaria se procedi al anlisis
respectivo de la misma, ya que esta es la parte fundamental de la
investigacin
Para el procesamiento de la informacin obtenida se realizan las
siguientes actividades:
-

Organizar los datos que se obtendrn en la recoleccin de la


informacin para ver los posibles datos duplicados,
incoherencias, etc.
Jerarquizar los datos que permitirn una clasificacin que
responda a los procesos de procesamiento y toma de
decisiones de la empresa.
Analizar el proceso de toma de decisiones de la empresa.
Determinar los datos e informacin utilizados en la toma de
decisiones.

[19]

Establecer los requerimientos para construir el sistema de


toma de decisiones.

Para la obtencin de la informacin necesaria para conocer las


necesidades que existen en la empresa Estrategia y Solucin
Confeccin Textil, se us lo siguiente:
Entrevista: Es la comunicacin establecida entre el investigador y el
sujeto de estudio a fin de obtener respuestas verbales a las
interrogantes planteadas sobre el problema propuesto.
Encuesta: Este mtodo consiste en obtener informacin de los sujetos
de estudio, proporcionada por ellos mismos, sobre opiniones, actitud
eso sugerencias
Tambin se debe de seguir los siguientes pasos para hacer el
Datawarehouse:
-

Staging es una duplicidad evidente. Son los mismos datos


que el sistema de origen. Es necesario justificarlo: Es
temporal, es fcil duplicarlo, y evita que los procesos de
carga del DWH (que pueden llegar a ser largos) afecten
negativamente al operacional.

Modelo normalizado es el modelo de datos DRY por


excelencia. En un modelo 3NF, cada dato est una y solo una
vez. Si hemos aceptado que necesitamos un DWH, y
queremos una nica fuente de la verdad, y somos buenos
discpulos de DRY, hemos de defender a capa y espada el
modelo normalizado.

Modelo dimensional es un mal necesario. En el estado actual


de la tcnica, y con el volumen de informacin que gestionan
las empresas, el modelo normalizado no cubre los
requerimientos que justifican la existencia del DWH (facilidad
de uso y tiempos de respuesta, fundamentalmente). En el
mejor de los mundos posibles, las rbitas de los planetas
seran circunferencias perfectas.

En los procesos de aprovisionamiento (ETL), tambin es necesario


reflexionar si seguimos o no el principio DRY (Dont repeat yourself).
En este caso, es fcil ver que los tres procesos de carga propuestos
son ortogonales y distintos. Cumplen funciones distintas y siguen
estrategias distintas. En esta ETL no estamos duplicando nada:

Extraccin: Al extraer los datos desde la fuente hasta la


staging, estamos movindolos a una base de datos distinta,
tal vez en otra tecnologa o en otra ubicacin fsica. El nico
[20]

punto que se accede a las fuentes es aqu. Si se requiere


cambiar el proceso o la estrategia de extraccin, solo se debe
modificar este cdigo.
-

Transformacin: El proceso desde la staging al modelo


normalizado es probablemente el ms complejo. En este
punto, y solo en este punto, conformamos las dimensiones,
integramos las distintas fuentes, limpiamos o seleccionamos
los datos, guardamos la historia de las SCD, etc.

Carga del modelo dimensional: En el proceso final, cargamos


las tablas que sern accedidas por la capa de presentacin.
Para minimizar el trabajo, y para optimizar el rendimiento,
cargamos solo la informacin que razonablemente necesitar
el usuario. Las estrategias de carga que seguiremos sern
muy distintas a las anteriores (no nos hemos de preocupar de
crear la historia de las SCD, podemos usar estrategias de
recarga completas, no hemos de controlar la calidad del dato
de origen, etc.).

4. Gestin del proyecto


4.1. Cronograma

[21]

[22]

61

60

59

58

53

49

48

47

44

37

36

35

25

24

23

19

18

4.2. Presupuesto

EQUIPOS Y
MATERIALES
LAPTOP
IMPRESORA

COSTO
S/.
999
200

CANTIDAD

3
1

[23]

TOTAL
S/.
2997
200

vie 24/07/15
vie 24/07/15

DEFINIR TIPOS DE USUARIOS FINALES


1 da

vie 04/09/1
lu
5n 07/09/15
mar
jue 10/09/15
08/09/15

DEFINIRTIPOSDELIMPIEZADEDATOS
2das

DEFINIR FACTORES DECISIVOS PARA3 das


DECIDIR EL DESARROLLO DE UN DATA
WAREHOUSE

vie
jue 01/10/15
25/09/15

PLANTEAR ESTRATEGIAS EN LA
IMPLEMENTACION
vie 02/10/15
vie 23/10/15
mi 01/07/15
mi 01/07/15

vie 02/10/1
v5
ie 23/10/15

0 das

EVALUAR RENDIMIENTO DE LA INVERSION


15 das

FIN

15das

ETAPA: EVALUACION

vie
jue 24/09/15
18/09/15

PLANTEARESTRATEGIASPARA EL 5das
PROCESODEIMPLEMENTACION
5 das

vie
jue 17/09/15
11/09/15

DEFINIRELEMENTOSA CONSIDERAR
5E
dN
as
LAIMPLEMENTACION

vie 11/09/1
jue
5 01/10/15

jue 27/08/1
ju
5e 03/09/15

6das

HACERLIMPIEZADELOSDATOS

15das

mi
mi
19/08/15 26/08/15

ETAPA: IMPLEMENTACION

vie
mar
14/08/15 18/08/15

lun 27/07/1
ju
5e 13/08/15

DEFINIR COMBINACION DE LA
6 das
ARQUITECTURA CON EL SISTEMA DE
GESTION DE LA BASE DE DATOS

14das

ELABORAR SISTEMA DE GESTION DE3BASE


das
DE DATOS

DISEARLA ARQUITECTURA

lun27/07/1
ju
5e 10/09/15

mar 21/07/1
jue
5 23/07/15

EVALUARREDUNDANCIADEDATOS
3das
34das

jue
lun 20/07/15
16/07/15

DEFINIR ESTRATEGIAS PARA LA GESTION


3 das
DE UN DATA WAREHOUSE

ETAPA: DESARROLLO

13/07/15 15/07/15

DISEO DELDATAWAREHOUSE

01/ 07

HOJAS BOND
LAPICEROS
MEMORIA USB
LIBRO DE
TOMA DE
DECISIONES
LIBRO DE ALTA
GESTION
LIBRO DE
CREACION DE
UN DATA
WAREHOUSE

PERSONAL
PROGRAMA
DOR
ANALISTA
GESTOR DE
BASE DE
DATOS

16
3
20
150

1
6
3
1

16
18
60
150

130

130

165

165

TOTAL

3736

COSTO
S/. HORA
15

CANTIDAD
(HORAS/DIA)
2

NUMERO
PERSONAL
1

TOTAL
S/. DIA
30

20
25

4
5

1
1

80
125

SERVICIOS Y
MOVILIDAD
MOVILIDAD
REFRIGERIO

COSTO
S/. /DIA
5
8

NUMERO
PERSONAL
3
3

TOTAL
S/. /DIA
15
24

Bibliografa
o B. Emily, "Toma de Decisiones-Introduccin de Minera de Datos
como soporte a la toma de decisiones empresariales", Mayo
2005. [En lnea]. Available:
[24]

http://www.elprisma.com/apuntes/administrcion_de_empresas/tom
adedecisionesintro/default4.asp. [ltimo acceso: 18 Junio 2013].
o B. Mary, "Mejora en la Toma de Decisiones Administrativas para
la Empresa Digital", Junio 2005. [En lnea]. Available:
http://www.el
prisma.com/apuntes/administracion_de_empresas/tomadecisione
s/default2.asp. [ltimo acceso: 20 Noviembre 2013].
o S. A Corua, Sistema de Soporte a la Decisin, 10 Junio 2012.
[En lnea]. Available:
http://www.sinnexus.com/business_intelligence/sistemas_soporte
_decisiones.aspx. [ltimo acceso: 16 Julio 2014].
o E. Rodrguez, "Minera de datos como soporte a la Toma de
Decisiones Empresariales", Mayo 2008. [En lnea]. Available:
http://www.scielo.org.ve/scielo.php?pid=S101215872007000100008&script=sci_arttex/. [ltimo acceso: 18
Noviembre 2013].

Glosario de trminos
o ETL.- (Extract-Transform-Load) Es el proceso que organiza el
flujo de los datos entre diferentes sistemas en una organizacin y
aporta los mtodos y herramientas necesarias para mover datos
desde mltiples fuentes a un almacn de datos, reformatearlos,
limpiarlos y cargarlos en otra base de datos, datamart o bodega
de datos. ETL forma parte de la Inteligencia Empresarial
(Business Intelligence), tambin llamado Gestin de los Datos
(Data Management).
o DWH.- (Datawarehouse) Un Datawarehouse es una base de
datos corporativa que se caracteriza por integrar y depurar
informacin de una o ms fuentes distintas, para luego procesarla
permitiendo su anlisis desde infinidad de perspectivas y con
grandes velocidades de respuesta. La creacin de un
Datawarehouse representa en la mayora de las ocasiones el
primer paso, desde el punto de vista tcnico, para implantar una
solucin completa y fiable de Business Intelligence.
o DATO.- Los datos son la mnima unidad semntica, y se
corresponden con elementos primarios de informacin que por s
solos son irrelevantes como apoyo a la toma de decisiones.
Tambin se pueden ver como un conjunto discreto de valores,
[25]

que no dicen nada sobre el porqu de las cosas y no son


orientativos para la accin.
o DSS.- (Sistemas de Soporte a la Decisin) Es una herramienta de
Business Intelligence enfocada al anlisis de los datos de una
organizacin.
o BI (Business Intelligence) Es la habilidad para transformar los
datos en informacin, y la informacin en conocimiento, de forma
que se pueda optimizar el proceso de toma de decisiones en los
negocios.

[26]

Potrebbero piacerti anche