Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCIÓN
1.1 Realidad Problemática
En Europa el sistema universitario inicia sus reformas a partir de los 90, se hizo
común escuchar a lingüistas, abogados, docentes, ingenieros hablar con
naturalidad sobre auditorías, evaluaciones, acreditaciones, autoevaluación,
clima organizacional, indicadores, estándares, etc. El enriquecimiento léxico es
un claro indicador de cambios.
1
puedan definir una estrategia integrada en el marco de un proceso de
modernización.
2
actualmente cuenta con nueve carreras como son: Administración en Turismo y
Hotelería, Arquitectura, Contabilidad, Derecho, Ingeniería Civil, Ingeniería de
Sistemas, Ingeniería Mecánica y Psicología. Existen 2,200 alumnos, 90
trabajadores, entre docentes y administrativos, a tiempo completo y 140
docentes a tiempo parcial.
3
Dada la situación de la competencia actual, es necesario que las organizaciones
conduzcan sus esfuerzos a la obtención del conocimiento basado en el manejo
de la información.
4
inconsistentes. Para solucionar este problema se deberá realizar un
proceso de Data Quality & Clearing para asegurar que todos los valores en
un conjunto de datos sean consistentes y correctamente registrados. Las
herramientas de limpieza de datos ayudan y facilitan este proceso de
mantenimiento de la información.
Reporting: construcción de consultas avanzadas, distribución y
visualización de información. Con estas herramientas de reportes
orientadas al usuario final se pretende mejorar la obtención de información
mejorando el área de sistemas al disminuir una capa intermedia entre
complejidad técnica y usuario final. Adicionalmente, estas herramientas
incorporan facilidades en la distribución de los reportes e información.
Minería de Datos (Datamining): las herramientas de Data Mining, entre
otras funciones, pueden responder a preguntas que tradicionalmente llevan
demasiado tiempo para poder ser resueltas. Estas herramientas exploran
las bases de datos en busca de patrones ocultos, tendencias y
comportamientos encontrando información predecible que un experto no
puede llegar a encontrar fácilmente.
Mantenimiento de Metadatos: estas herramientas ayudan a mantener la
información y documentación relativa a las estructuras de datos de los
sistemas transaccionales (como el sistema Académico), los procesos de
transformación (procesos ETL, extracción, transformación y carga) y las
estructuras de fuentes de datos finales (Datawarehouse y datamart) junto
a todas las transformaciones asociadas a estas bases de datos.
Entre otras facilidades, proveen la detección de cambios en las bases
transaccionales y muestran el impacto en todos los componentes que
dependen o están asociados a la fuente de datos origen.
Tableros de Control: estas Herramientas facilitan la construcción de las
funcionalidades. Con herramientas especializadas se facilita el trabajo de
la Dirección de Sistemas y del Usuario. Entre los beneficios podemos
nombrar que los usuarios obtienen más independencia para obtener la
información deseada, se permite la captura de datos desde el
Datawarehouse, se puede permitir a los usuarios analizar datos y obtener
5
resultados inmediatos, se permite fácil acceso y navegación a través de
todo el modelo de datos del Datawarehouse, se permite a los usuarios
cambiar los requerimientos y definiciones en cualquier momento y
fundamentalmente de muy bajo costo de operación para la Dirección de
Sistemas. Todo esto garantizando que la información está más
consolidada, integrada y consistente ya que se pueden utilizar facilidades
de limpieza de datos para mejorar la calidad de los datos.
6
1.3 Teorías relacionadas al tema
1.3.1 Inteligencia de Negocios
1.3.2 Datawarehouse
De acuerdo con (Latan South, 2005), el término Datawarehouse fue acuñado por
Bill Inmon a principios de la década de los ´90 y lo definió de la siguiente manera
(dada la popularidad e importancia de esta definición preferimos no traducirla
completamente): “Un Datawarehouse es una colección de datos subject-
oriented, integrated, time-variant y non-volatile para ayudar al proceso de toma
de decisiones gerenciales”.
7
Por nuestro lado, podemos decir que un Datawarehouse es una base de datos
orientada al análisis de la información histórica contenida en ella. Dependiendo
las necesidades de análisis de la organización puede almacenarse desde unos
meses hasta varios años de información. El modelo que soporta la información
que contiene se encuentra diseñado, estructurado e implementado con la
finalidad y propósito del análisis y navegación de los datos. Se entiende por
navegación o drilling de los datos, la posibilidad de ver información
correspondiente a diferentes contextos o entornos, por ejemplo, analizar las
ventas anuales y poder “abrirlas” por sucursal, después analizar en más en
detalle una sucursal para ver cómo se discriminan las ventas por cada producto,
etc. (Latan South, 2005).
8
El Datawarehouse se construye pensado en que tenga una gran capacidad para
obtener reportes que involucren el procesamiento de enormes cantidades de
información y en el menor tiempo posible.
Orientado al tema:
9
Las aplicaciones están relacionadas con el diseño de la base de datos y del
proceso. En data warehousing se enfoca el modelamiento de datos y el
diseño de la base de datos. El diseño del proceso (en su forma clásica) no
es separado de este ambiente.
Integrado
10
crear aplicaciones inconsistentes. Se muestra algunas de las diferencias
más importantes en las formas en que se diseñan las aplicaciones.
11
operacional. En éstos, la información se requiere al momento de accesar. En
otras palabras, en el ambiente operacional, cuando usted accesa a una
unidad de información, usted espera que los valores requeridos se obtengan
a partir del momento de acceso.
No volátil:
12
De acuerdo con (Latan South, 2005), otra consecuencia de la simplicidad de
la operación del Datawarehouse está en la tecnología subyacente, utilizada
para correr los datos en el depósito. Teniendo que soportar la actualización
de registro por registro en modo on-line (como es frecuente en el caso del
procesamiento operacional) requiere que la tecnología tenga un fundamento
muy complejo debajo de una fachada de simplicidad.
13
Datos ligeramente resumidos.- La data ligeramente resumida es aquella que
proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual.
Este nivel del datawarehouse casi siempre se almacena en disco. Los puntos
en los que se basa el diseñador para construirlo son:
Que la unidad de tiempo se encuentre sobre la esquematización hecha.
Qué contenidos (atributos) tendrá la data ligeramente resumida.
Datos completamente resumidos.- El siguiente nivel de datos encontrado en
el data warehouse es el de los datos completamente resumidos. Estos datos
son compactos y fácilmente accesibles (Barreto Stein, 2006).
14
Como define (Rojas Figueroa, 2010), el Datawarehouse forma parte de una
solución de inteligencia de negocios, pero constituye además su abanderado
principal cuando se implementa con los cubos OLAP.
En los clientes (Quiénes)- tal vez los de tipo de están adquiriendo los montos
pensados.
En los productos (¿Qué?)- hay muchos reclamos por algunos de ellos.
Los canales de distribución (¿Cómo?)- la competencia deja el producto en la
puerta de la casa del cliente.
Tiempo (¿Cuándo?)- no estamos comercializando algunos productos que
tradicionalmente se venden en ciertas épocas del año.
15
Cuando respondemos a estas preguntas nos remitimos a los Sistemas de
Soporte de Decisiones, donde el Datawarehouse sobre OLAP cubre todas estas
respuestas (Barreto Stein, 2006).
Bill Inmon.
Ralph Kimball.
En la Figura 54. Ciclo de vida que propone Kimball en su libro The Data
Warehouse LifeCycle Toolkit de 1998 (Anexo1).
16
a. Planeamiento.
c. Diseño
d. Construcción
e. Despliegue
A continuación, tenemos los puntos que desarrollaremos por cada fase: Figura
55. ROAD MAP. Fases. (Anexo3)
En vista de los comentarios y sugerencias que nos hicieron, via mail y por chat,
sobre la posibilidad de la creación de nuevo conocimiento, se ha creído
conveniente introducir el tema Data Mining (DM) como una posibilidad de
creación de conocimiento en las organizaciones. Luego de esto entraremos de
lleno al desarrollo metodológico de nuestra solución de inteligencia de negocios
(Goicochea, 2010).
Programa Actual:
Pero ¿Qué es el Data Mining?. ¿Cómo esta tecnología puede resolver los
problemas diarios de las organizaciones? ¿Cuál es el ciclo de vida de un DM?
17
datos, el resultado de esta colección de datos es que las organizaciones tienen
“datos ricos” pero “pobre conocimiento”.
Imagine los datos de una tabla relacional, como se muestran en la Figura 57.
Tabla de Clientes, conteniendo información de clientes. (Anexo3)
Una de las metas a encontrar podría ser: ¿A qué cliente o grupo de clientes le
puedo dar un préstamo con un nivel de riesgo Bueno?
Podríamos escribir una consulta para buscar cuantos con tipo de Empleo
dependiente hay y cuantos no. El impacto de la edad seria otra variable a tener
en cuenta o tal vez en función a su nivel de ingresos o deuda que tenía y
seguramente tendríamos que escribir miles de consultas cuando queramos
combinarlas algunas o todas a la vez, imagine si existiera más columnas a usar
y algunas columnas sean valores numéricos como los ingresos mensuales.
18
Se imagina llegar a la respuesta de: los clientes con tipo de empleado
Dependiente que tengan un nivel de deuda bajo y que tengan más de 40 años
son los que representan menos riesgo de deuda.
19
En general el DM busca descubrir y evaluar patrones y tendencias con miras a
presentar un nuevo conocimiento de la organización. Figura 59. Datos que usa
Data Mining (Anexo 4).
Ciclo de un Proyecto en DM
Los datos del negocio podrían estar en muchos sistemas. Para tener una idea,
en Microsoft, existen cientos de Base de Datos y algo de 70 Data WareHouse.
La data limpia y transformada es el insumo vital para el DM, por lo que solo
considerar la data relevante.
Una vez que la data está limpia y las variables a usar transformadas, podemos
empezar a construir modelos comprendiendo la meta que percibe el proyecto de
Data Mining para luego ejecutar el tipo de tarea de DM. La idea es entender a
los analistas del negocio que conocimiento intentan descubrir. En el caso de
postulantes a la universidad, por ejemplo: quienes serán los que tendrán más
éxito en su vida universitaria.
20
Aplicados los algoritmos necesarios con sus respectivos parámetros. La idea es
evaluar e identificar el significado de los patrones encontradas y elegir el modelo
a seguir.
Paso 5: Reportear.
Paso 6: Predicción.
Business Intelligence
21
manera no lo sería. De ahí la importancia en el soporte a la toma de decisiones,
y no solo a nivel estratégico, sino a nivel táctico como operacional (Latan South,
2005).
Tomaremos como base el ciclo de vida de los Data Warehouses definido por
Ralph Kimball. El marco presentado por Ralph Kimball con el nombre de
Business Dimensional Lifecycle (Kimball, y otros, 2008).
Como afirma (Kimball, y otros, 2008), (BDL) ilustra las diferentes etapas por las
que debe pasar todo proceso de Data Warehousing. Este enfoque de
implementación de Datawarehouses. El diagrama ilustra la secuencialidad de
tareas de alto nivel requeridas para el efectivo diseño, desarrollo e
implementación de Datawarehouses. El diagrama muestra una vista general del
mapa de ruta de un proyecto en el cual cada rectángulo es un mojón que nos
indica dónde estamos parados, por dónde pasamos y hacia dónde debemos
dirigirnos.
Es importante aclarar, como lo hacen los autores, que el BDL no intenta reflejar
un proyecto en término de tiempos y plazos. Como se puede notar cada
rectángulo del diagrama tiene el mismo ancho, con la excepción del
gerenciamiento del proyecto. Cualquiera que haya pasado por algún proyecto de
Data Warehousing sabe que la magnitud de recursos y tiempo requerido para
22
cada rectángulo del ciclo de vida no es igual. El BDL se focaliza en
secuencialidad y concurrencia no en tiempos y plazos.
A continuación, pasaremos de describir cada una de las etapas del BDL (Ciclo
de vida dimensional del negocio) (Kimball, y otros, 2008).
23
3. Modelado Dimensional: La definición de los requerimientos del negocio
determina los datos necesarios para cumplir los requerimientos analíticos de
los usuarios. Se comienza con una matriz donde se determina la
dimensionalidad de cada indicador y luego se especifican los diferentes
grados de detalle (atributos) dentro de cada concepto del negocio
(dimensión), como así también la granularidad de cada indicador (variable o
métrica) y las diferentes jerarquías que dan forma al modelo dimensional del
negocio (BDM) o mapa dimensional.
24
procede con la instalación y prueba de los mismos en un ambiente integrado
de data warehousing.
25
1.3.8 El Proceso de Toma de Decisiones
3. Evaluar las opciones: cuales son los pro y contras de cada una.
Toma de Decisiones:
26
constantemente qué se hace, quien lo hace y cuándo, dónde e incluso como se
hará. Sin embargo, la toma de decisiones es sólo un paso de la planeación ya
que forma la parte esencial de los procesos que se siguen para elaboración de
los objetivos o metas trazadas a seguir. Rara vez se puede juzgar sólo un curso
de acción, porque prácticamente cada decisión tiene que estar engranada con
otros planes.
1. Elaboración de premisas
2. Identificación de alternativas
1. En primer lugar, como nadie puede tomar decisiones que afecten el pasado,
las decisiones tienen que operar para el futuro.
27
2. Es difícil reconocer todas las alternativas que se pudieran seguir para
alcanzar una meta; esto es cierto cuando en especial la toma de decisiones
incluye oportunidades de hacer algo que no se ha hecho antes. Es más, en
la mayor parte de los casos no se pueden analizar todas las alternativas e
incluso con las técnicas analíticas y las computadoras masa modernas
disponibles.
Evaluación de Alternativas
1. Factores Cuantitativos.
2. Factores Cualitativos.
28
Las decisiones no programadas se usan para situaciones no programadas,
nuevas y mal definidas, de naturaleza no repetitivas. Ej.: el lanzamiento de la
computadora Macintosh por Apple Computer.
29
Una cosa es cierta los árboles de decisión y técnicas similares de decisión
reubican criterios amplios con un centro de atención sobre los elementos
importantes de una decisión, hacen resaltar premisas que con frecuencia
están escondidas y muestran el proceso de razonamiento mediante el cual
se toman las decisiones bajo incertidumbre.
Creatividad e Innovación
Proceso Creativo
30
Los sistemas de apoyo a las decisiones (SAD) usan computadoras para el
facilitar el proceso de toma de decisiones de tareas semiestructuradas.
Los gerentes para solucionar sus problemas toman en cuenta los diversos
elementos del ambiente del sistema no significan que renuncien a su papel como
tomadores de decisiones. Alguien tiene que seleccionar un curso de acción entre
diversas alternativas, tomando en cuenta los acontecimientos y fuerzas en el
ambiente de una decisión.
31
Así, en cada decisión que se toma, siempre se podrá pensar en que no se tiene
toda la información requerida; sin embargo, al llegar al límite de tiempo, se
deberá llegar a una decisión. Esto implica necesariamente que al verdadero
objetivo de un sistema de apoyo a las decisiones sea proporcionar la mayor
cantidad de información relevante en el menor tiempo posible, con el fin de
decidir lo más adecuado.
Característica Especificas
Interactividad
32
Tipos de decisiones
Frecuencia de uso
Variedad de usuarios
Puede ser utilizada por usuarios de diferentes áreas funcionales como ventas,
producción, administración, finanzas y recurso humanos.
Flexibilidad
Desarrollo
Interacción ambiental
Comunicación Interorganizacional
33
Simplicidad
Menores costos
Muy baja dependencia de personas que se encuentran fuera del control del
tomador de decisiones.
Por otro lado, los inconvenientes de esta forma de implantar los Sistemas de
Apoyo a las Decisiones son:
34
El proceso de la toma de decisiones puede resumirse a través de diferentes
pasos o etapas, los cuales suelen presentarse en forma similar en la mayoría de
los casos; estos se mencionan de los casos; estos se mencionan a continuación:
Identificación de restricciones
Evaluación de alternativas
Decisiones repetitivas
Decidir los pagos de los proveedores que serán propuestos debido a una baja
inesperada del flujo de efectivo.
Decisiones no repetitivas
35
Esta categoría de decisiones se presenta en los niveles más altos de la
organización y se caracteriza por un considerable grado de incertidumbre.
Cambio de una materia prima de mayor costo, pero con mayor rendimiento.
Por otro lado, las decisiones repetitivas y no repetitivas pueden ser clasificadas
de acuerdo con el número de participantes durante el proceso:
Decisiones independientes
Decisiones Secuenciales
36
Decisiones Simultáneas
Según (Soto, 2010), una de las características que poseen los Sistemas de
Apoyo a las Decisiones es la facilidad de que un usuario, sin tener amplios
conocimientos de sistemas computacionales, pueda desarrollar sus propios
modelos de decisión.
Las herramientas de software son aquellas que permiten al usuario generar sus
propias aplicaciones, manipular su información particular y, en general,
interactuar con el Sistemas de Apoyo a las Decisiones. Estas herramientas o
módulos funcionales, serán comentados brevemente a continuación.
Manejo de modelos
37
Otra de las facilidades de los Sistemas de Apoyo a las Decisiones permite a los
usuarios desarrollar sus propios modelos de decisión. Esto implica la posibilidad
de manejar entrada, procesamiento, almacenamiento y salida de información.
En este sentido, el usuario diseña sus propios formatos de entrada y salida, así
como la estructura del almacenamiento de información y las funciones del
procesamiento, de tal forma que el sistema se puede encontrar en una
permanente evolución, a través de los cambios que periódicamente se van
integrando a la aplicación. Esta forma de desarrollo, denominada prototipo, es
diferente al proceso tradicional del desarrollo de un típico sistema transaccional.
En este último, el usuario tiene que definir de antemano todos los requerimientos
de sus sistemas de aplicación durante la fase de análisis, antes de iniciar la fase
de diseño (Soto, 2010).
38
Con este proceso se demostró que es posible medir la cantidad de información
disponible en los datos y qué porción de la misma podrá utilizarse para resolver
los problemas de la dependencia en estudio.
Los servicios que brinda la universidad ahora son más oportunos y eficientes, los
beneficiados no es solo la comunidad universitaria, sino el conjunto de la
sociedad donde oferta sus servicios. Desde esta lógica, los resultados óptimos
de la investigación generan cambios estratégicos que desarrolla una
organización más flexible y dinámica, con el apoyo de las tecnologías para la
toma de decisiones, redunda en los beneficiarios directos –estudiantes actuales-
y los beneficiarios potenciales constituidos por el total de la población
sanmartinense que tiene la posibilidad de acceder a los servicios educativos que
se ofertan.
39
1.6 Hipótesis
1.7 Objetivos
40
II. MÉTODO
X O1
--------------------------------
O2
Donde:
2.2.1 Variables
41
operacional para ayudar a tomar decisiones en un análisis de base de datos
con información confiable a las personas correctas en un tiempo oportuno.
b. Toma de Decisiones. Es la encargada de conducir a la empresa a un
futuro deseado, lo que implica que la misma debe influir directamente en el
cumplimiento de los objetivos establecidos, y esta dirección que tomará la
decisión debe contar con toda la información necesaria para que las
decisiones correspondientes puedan ser tomadas precisamente con
respecto a la actitud y postura que la que facilite la toma de decisiones
estratégica asumirá ante cualquier situación.
42
b. Toma de Decisiones. Está delimitada por el tipo de acciones que
caracterizan la forma de hacer y de entender las organizaciones, teniendo
como eje permanente el cambio, encausados hacia los objetivos
estratégicos de la organización.
2.2.2 Indicadores
43
Para determinar la muestra de estudio se aplicó un muestro no probabilístico
basado en los criterios asumidos en la investigación según (Hernández, y otros,
2010), donde se requiere trabajar con un grupo sobre quien se aplicó la variable
para la toma de decisiones, quedando la muestra representada por un conjunto
de funcionarios y administrativos de la Facultad de Ingeniería que suman la
cantidad de 5 usuarios.
FUENTE/
TECNICAS INSTRUMENTOS
INFORMANTES
Funcionarios,
Encuesta Cuestionario Docentes y
Administrativos
Funcionarios,
Entrevista Guía de entrevista Docentes y
Administrativos
44
2.6 Aspectos éticos
45