Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estamos en la era de la
calidad, y es esta la que
nos dar una ventaja
competitiva, en un mundo
globalizado
Aunque
En cualquier proceso de calidad
Calidad
Tiempo
3
Agenda
Conclusiones y recomendaciones
por
un
departamento
de
codificacin
that
makes
data
appropriate
for
specific
use.
www.wikipedia.org
8
Qu es la calidad de datos?
La Calidad de Datos no slo se refiere a la
ausencia de defectos:
Los datos deben proporcionar una visin
nica
Debe estar correctamente relacionada
interrelacionada con todas las fuentes
10
Impactos de Negocio
Riesgo en el cumplimiento normativas
Sistema de gestin del riesgo
Sistema de integracin del riesgo
Riesgo en la inversin
Riesgo competitivo
Deteccin del fraude
Riesgos legales (LOPD)
Otros riesgos
Mayor
Riesgo
Cobro ineficiente
Mala relacin con el cliente
Prdida de oportunidades
Aumento de costes
Incremento
de Costes
Prdida ingresos
Baja confianza
Falta de credibilidad
Temor en toma decisiones
Menor predictabilidad
11
Forecasting incorrecto
Reporting ineficiente
Deteccin y correccin
Prevencin
Reingeniera de procesos
Penalizaciones
Sobrepagos
Recursos incrementados
Retrasos
Cargas de trabajo
Tiempos de proceso
12
13
14
15
17
Costes de Gestin
Incumplimiento de normativas
Regulaciones
Leyes: La calidad de datos es uno de los pilares fundamentales
para el cumplimiento de la LOPD
18
DWH
19
20
DWH-BI
Through 2007, more than 50 percent of data warehouse projects
will have limited acceptance, or will be outright failures, as a
result of a lack of attention to data quality issues Gartner
La toma de decisiones basada en datos incorrectos puede generar
decisiones incorrectas.
Concepto: Calidad de la Informacin
Beneficios de la Calidad de Datos:
21
Cuadros de Mando
Calidad de Datos
Cliente
Runtime
Runtime
Servidor
Aplicaciones
Bases de Datos
Repositorio
Realtime /
SOA
Soluciones
integracin
Diccionarios
22
Acceso
A cualquier
sistema, por
lotes o en
tiempo real
Perfilado
Buscar y
perfilar
cualquier tipo
de datos de
cualquier
fuente
Calidad
Integracin Entrega
Validar, corregir
y estandarizar,
relacionar datos
de todo tipo
Transformar y
conciliar datos
de todo tipo
Desarrollo y gestin
23
Fuentes
de datos
Integracin
de datos
Almacena- Inteligencia
miento
24
Reporting
Calidad
Aplicacin
Reporting
Servidor DQ
Visin nica
del cliente
o producto
Data
Warehouse
BBDD
Calidad de Datos
Front End Y
Aplicacin X
Data Mart
Carga
Conciliacin fuentes
Lgica difusa
Scorecarding
Limpieza
Enriquecimiento
Operational
Data Store
Transformacin
Extraccin
Finanzas
Datos no
estructurados
Sistemas
externos
Etc
25
Eficacia
del
Contacto
Localizar
Localizar relaciones
relaciones
entre
entre registros,
registros, como
como
desduplicacin,
desduplicacin,
relacin
relacin de
de dos
dos o
o ms
ms
tablas,
deteccin
tablas, deteccin de
de
unidades
unidades familiares
familiares o
o
corporativas,
corporativas,
Identificacin
de relaciones
Calidad
Calidad de
de Datos
Datos para
para
cualquier
rea
cualquier rea
incluyendo
incluyendo finanzas,
finanzas,
control
control de
de gestin
gestin yy
produccin
produccin
Calidad de
Datos
General
Perfilado,
Perfilado, medicin
medicin yy
cuantificacin
cuantificacin del
del
impacto
impacto de
de la
la calidad
calidad
de
de datos,
datos, adems
adems de
de
su
seguimiento
su seguimiento yy
monitorizacin
monitorizacin
Anlisis de
Calidad de
Datos
(perfilado)
26
Acceder
Auditar
Data Experts /
Owners definen
iniciativas de
correccin
27
Data Experts
/ Owners
validan
informes
Destinos
implementar las
reglas
2
4
Entregar
Auditar para
conocer
3
6
Limpiar
Informes
Definir reglas
de negocio
para:
Conformidad
Consistencia
Normalizacin
Desduplicacin
Matching
Perfilado de
Datos
Datos
Mejora de datos
Limpieza de Datos
28
Perfilado de datos
29
Perfilado de Estructura
30
Perfilado de Contenido
31
Descubrir
Proyecto de
descubrimiento
Limpiar
Limpieza
Monitorizacin
Integrar
Integracin
Entregar
Implantacin
Validacin
Nivel
Actividad
Perfilado
Tipo de
Actividad
P.
Estructura
32
P.P.
Estructura
Estructura
Analista
Roles
P.
Contenido
Data Steward
Desarrollador
ETL
Operaciones TI
Existencia
Conformidad
33
Consistencia
Precisin
Duplicados
Integridad
EXISTENCIA
34
CONFORMIDAD
CONSISTENCIA
DUPLICACION
INTEGRIDAD
PRECISION
EXISTENCIA
35
CONFORMIDAD
CONSISTENCIA
PRECISION
DUPLICACION
INTEGRIDAD
EXISTENCIA
36
CONFORMIDAD
CONSISTENCIA
PRECISION
DUPLICACION
INTEGRIDAD
Capacidades de Reporting
Para el perfilado es fundamental una solucin de
reporting
37
38
39
Ttulo: Ingeniero
Nombre: Jos
1 Apellido: Rodrguez
2 Apellido: Silva
40
Estandarizacin
La estandarizacin es la adecuacin de un
dato a un formato esperado.
Por ejemplo, el NIF siguiente:
5428846
41
Correccin
La correccin consiste en el reemplazo de un
elemento errneo por uno correcto
Por ejemplo, la direccin siguiente:
Calle Tumaco 14, 28010 Madrid
42
Enriquecimiento
El enriquecimiento consiste en la adicin de
datos que no existan
Por ejemplo, el nombre siguiente:
Jose Mara Gomez Hurtado
Sexo: Varn
43
Matching
44
Pre-Grouping
45
Cdig
o
Nombre
Group
Key
Juan Gutierrez
G36
Juan Manuel
Gutierez
G36
Juana Gutierrez
Gomez
G36
Luis Fernandez
F16
Luis Alberto
Frenandez
F16
Luis Fernandes
F16
Luis Fernandez
Gomez
F16
Matching Determinstico
Razn Social
CIF
LABORATORIOS EVA
ESPAOLA SL
CCC
Direccin
08070271716
SAN LUIS 90
EVA
46
90
SANT LLUIS
EVA
3116311
SANT LLUIS
{}
Telfono
Poblacin
Barcelona
933116311
933116311
Razn Social
CIF
CCC
Direccin
Telfono
Poblacin
EVA
ESPAOLA,S.L
B0809357
7
08010271716
SANT LLUIS 9
933116311
Barcelona
SI coincide(Razn) y coindice(calle) y
coincide(telfono) y
noesdistinto(CIF) entonces: Match
positivo
Matching Probabilstico
Razn Social
CIF
LABORATORIOS EVA
ESPAOLA SL
CCC
Direccin
08070271716
SAN LUIS 90
EVA
80%
{}
47
SANT LLUIS
90
100%
50%
92%
SANT LLUIS
EBA
Telfono
3116311
Poblacin
Barcelona
933116311
100%
100%
933116311
Razn Social
CIF
CCC
Direccin
Telfono
Poblacin
EBA
ESPAOLA,S.L
B0809357
7
08010271716
SANT LLUIS 9
933116311
Barcelona
92
%
SI media
ponderada>90%
entonces match
positivo
Consolidacin
48
Mtodos de consolidacin
Registro
Superviviente
Mejor Registro
49
Un proceso iterativo
Matching
Perfilado de
Datos
Datos
Mejora de datos
Limpieza de Datos
50
51
52
Entorno Financiero
Entornos de Marketing
Identificacin
de relaciones
Eficiencia
del contacto
Low
53
High
High
Calidad Datos
General
Low
EDQM
Low
High
Anlisis
Calidad Datos
Low
Conclusiones y recomendaciones
54
Resumen
En resumen:
La Calidad de Datos es fundamental para
cualquier compaa
Ahorro de costes
Eficiencia
Cumplimiento de la Ley
Existe la tecnologa y la metodologa para
corregir la mala Calidad de Datos
Calidad e Integracin: una Solucin
Corporativa
55
56
57
Tecnologa
Metodologa
Apoyo
58
Apoyo
Cual es la mejor forma de lograr el apoyo para un
proyecto de Calidad de Datos?
Divulgacin interna, principalmente a las unidades de
negocio, tecnologa y a direccin
Auditora de Calidad de Datos:
Anlisis y medicin de los problemas de Calidad
de Datos de la Compaa
Conclusiones de los problemas de Calidad de
Datos
Propuesta de soluciones
Anlisis del ROI
59
Metodologa
Tecnologa
La tecnologa es fundamental para la resolucin de
problemas de Calidad de Datos.
En la eleccin de la tecnologa deben exigirse los
siguientes requisitos:
Combinacin con una plataforma de integracin de
datos: acceso universal a los datos
Tratamiento de cualquier tipo de datos. No slo
nombres y direcciones.
Solucin de reporting, scorecarding y monitorizacin
Orientado a negocio
61
2000
62
2001
2002
2003
2004
2005
2006
2007
2008
Resistencia al cambio
No veo que
tengamos
problemas en
los datos
Escptico
63
No es mi
responsabilida
d
Desentendido
Catastrofista
64