Sei sulla pagina 1di 5

Alumno: Diego Patricio Amendaño Zambrano Código: ECMDETI1144901

País: Ecuador

Tema: Business Inteligencie y Gestión documental

¿Cuáles fueron las acciones realizadas por el equipo de trabajo para cumplir
el primer paso de la metodología CRIS-DM?

Utilizaron técnicas de Clustering para la detección de anomalías con el fin de


obtener un listado de clientes que presenten datos atípicos.

La oficina de fraudes dispone de personal que revisa físicamente los medidores de


los clientes caso a caso, con el fin de detectar posibles anomalías.

¿Cuáles fueron las acciones realizadas por el equipo de trabajo para


comprender la naturaleza de los datos involucrados en el negocio?

Realizar una serie de reuniones con la Gerencia de Clientes. Los administrativos,


presentaron al equipo del proyecto los problemas detectados por la oficina de
fraude, los que fueron estudiados con el fin de buscar alternativas de solución.

Explique el proceso utilizado para acometer la preparación de los datos en la


organización.

La preparación de los datos en la organización se dio a través del análisis del


modelo de base de datos relacional del sistema de información de la empresa. Éste
mantiene información del consumo mensual de uso de agua potable y alcantarillado
de cada cliente que utiliza estos servicios. Diseñando un Almacén de Datos (AD)
que se alimente de las bases de datos transaccionales a través de un proceso de
extracción de datos previamente definido llamado ETL. Los datos son almacenados
en un repositorio que consiste en hechos y dimensiones representados a través de
un esquema en estrella. La tabla de hechos almacena los indicadores a medir y las
dimensiones representan los criterios de análisis. Cuando se mantiene una
estructura de un AD, pero adaptada sóloa un sector de la empresa, o para un fin
concreto, se utiliza un Data Mart que es parte del AD completo.

Mencione qué etapa le sigue a la preparación de los datos y de qué modo fue
realizada por el equipo de trabajo.
El modelo de detección de anomalías de Clementine, entrega como resultado
grupos de datos con características similares, los cuales son llamados grupos
homólogos del modelo.

Los registros anómalos encontrados deben ser contrastados con la información


histórica de casos de fraude que almacena la empresa, con el fin de verificar que la
información entregada por el software sea la correcta. En cada iteración, es
necesario introducir nuevos parámetros o modificar algunos ya existentes para
realizar un nuevo análisis. Es así que para K-means se utilizó un índice de
anomalías de 0.5, 1 y 2. Para el caso de EM se configura la cantidad máxima de
iteraciones, que es 100.

¿Cuáles fueron los algoritmos utilizados?

K-means,COBWEB y EM.

¿De qué forma se logró garantizar la fase de evaluación en el proyecto?

Con la contrastación de la información histórica de casos de fraude que almacena la


empresa, con el fin de verificar que la información entregada por el software sea la
correcta.

Explique brevemente la fase de implementación del proyecto.

El proyecto de MD aplicado en la empresa Aguas Araucanía S.A que permitan


localizar y estudiar comportamientos anómalos sobre conjuntos de datos, para
poder así identificar posibles fraudes en clientes que hacen uso indebido de los
servicios se implementó de la siguiente manera.

La implementación a traves de la metodología CRISP-MD. Que propone un ciclo de


vida que consiste en 6 etapas desplazándose de adelante hacia atrás, la empresa
implemento:

 Reuniones con la Gerencia de Cliente para comprender el negocio. El


equipo propone utilizar técnicas de Clustering para la detección de
anomalías con el fin de obtener un listado de clientes que presenten datos
atípicos.
 Realizaron el modelo de la base de datos, diseñando un almacén de Datos,
que se alimenta de la Extracción de datos utilizando un Data Mart.
 Se utilizó Clementine un modelo de detección de anomalías, entregando
información sobre la cantidad de grupos procesados.
 Generar grupos homólogos.
 Verificar que la información entregada por el software sea correcta.
 Finalmente se implementó el sistema de detección de anomalías en el
servidor de la empresa.
 CASO PRACTICO TI016
 Alumno: ARLIN GONZALEZ SANTOS
 Código de usuario: CODDMBA2744610
 Asignatura: TI016
 Fecha: 05/06/2019


 1. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para cumplir el
primer paso de la metodología CRIS-DM?
Acciones realizadas. Responsable. Metodología.
El equipo propone utilizar Equipo de trabajo. CRISP-DM
técnicas de Clustering para la
detección de anomalías con el
fin de obtener un listado de
clientes que presenten datos
atípicos.
Disponer de personal que Equipo de trabajo. CRISP-DM
revisa físicamente los
medidores de los clientes caso
a caso, con el fin de detectar
posibles anomalías.
Inspecciona y selecciona una Equipo de trabajo. CRISP-DM
determinada ruta (subsector),
la que es revisada por
completo. Este proceso es
lento y no asegura la detección
oportuna de las posibles
anomalías, dado que no
siempre es fácil detectarlos.


 2. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para comprender la
naturaleza de los datos involucrados en el negocio?
Acciones realizadas. Responsable. Metodología.
Reunirse (varias veces) y Equipo de trabajo. CRISP-DM
presentarse con la Gerencia de
clientes y el nivel directivo de
Aguas Araucanía S.A.
Conocer los problemas que se Equipo de trabajo. CRISP-DM
venían presentando y
estudiados buscando solución
por la oficina de fraude.
Proponer la utilización de la Equipo de trabajo. CRISP-DM
técnica de Clustering para la
detección de anomalías e
identificación de clientes
atípicos.


 3. Explique el proceso utilizado para acometer la preparación de los datos en la
organización.
 Diseñar un Almacén de Datos (AD).
 Utilizar o aplicar un Data Mart que es parte del AD. (Contiene información específica
sobre los consumos históricos de agua potable y alcantarillado de la región, ya que son
datos que dispone la empresa.)
 Hacer equipo con el personal técnico de la empresa para adquirir los datos
históricos de los consumos facturados desde el inicio del funcionamiento de dicho sistema
de facturación.
 Aplicar el modelo de detección de anomalías Clementine, este arroja como resultado
grupos de datos con características similares, los cuales son llamados grupos homólogos
del modelo.
 Aplicación de un proceso de extracción de datos llamado ETL.
 4. Mencione qué etapa le sigue a la preparación de los datos y de qué modo fue
realizada por el equipo de trabajo.
 En la segunda etapa, fue necesario Analizar el modelo de base de datos relacional del
sistema de información de la empresa, específicamente aquellas entidades que tienen
relación con el proceso de facturación.
 Esta etapa conto con el apoyo del personal especializado de la empresa, revisar
documentación de la base de datos, revisar nombres de atributos y el diccionario de
datos.
 5. ¿Cuáles fueron los algoritmos utilizados?
 Fue necesario Aplicar algoritmos como: K-means, COBWEB y EM.
 6. ¿De qué forma se logró garantizar la fase de evaluación en el proyecto?
 La minería de datos es una herramienta tecnológica muy útil hoy en día, pero no deja de
ser relevante la calidad de los datos suministrados para aplicar las herramientas, como:
AD, metodología CRISPDM, DM, ETL, Clementine Client esta última resulto idónea para
lograr garantizar la fase de evaluación del proyecto debido a los algoritmos eficaces que
tiene en detección de anomalías o fraudes y en este caso perdidas económicas para la
empresa.
 Vale la pena resaltar el compromiso en este caso el personal de la empresa, su disposición
para ayudar a suministrar datos de calidad en el desarrollo del proyecto.
 7. Explique brevemente la fase de implementación del proyecto.

 El proyecto parte de la necesidad apremiante por resolver las perdidas ocasionadas en los
fraudes cometidos por los usuarios del sistema de aguas y alcantarillado Araucanía S.A.
 Primera fase gerencia y nivel directivo se apropian del asunto, 2 fase la preparación de los
datos, y aplicación de la metodología CRISPDM, 3 fase análisis de los resultados
obtenidos, por último la evaluación a satisfacción del proceso. Como principal resultado,
el sistema permitió a la empresa reducir, en forma considerable, el tiempo de búsqueda
de los posibles fraudes.

 Cabe anotar que este tipo de sistemas tecnológicos facilitan el sostenimiento de las
empresas, ayudan a su crecimiento, minimiza los fraudes, disminuye costos, y tiempo en
la solución de un problema. Cooperan en la toma d decisiones acertadas.

Potrebbero piacerti anche