Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Minera de Datos
Presentado por:
Daniela Anbal
Kevin Lpez
Mara Jos Plaza
Presentado a:
Ingeniero Johan Mardini
Definicin de KDD
Novedoso. Aportes de
informacin desconocida
Potencialmente til.
Beneficioso para el usuario
Clasificacin Prediccin
Descripcin
Clustering
de clases
Anlisis de
series a travs
del tiempo
Aplicaciones de la minera de datos
CRISP-DM SEMMA
(Cross Industry Standard (Sample, Explore, Modify,
Process for Data Mining) Model, Assess)
La agrupacin es la tarea de
segmentar una poblacin
heterognea en mas de un
subgrupo homogneo. En este
no hay clases predefinidas ni
ejemplos. Los registros se
agrupan sobre la base de auto-
similitud. Corresponde al usuario
determinar cual es el significado
para conectar a los grupos
resultantes.
Principales tcnicas de Minera de Datos
Podar el rbol
Identificar y eliminar ramas que
reflejen ruido o valores atpicos
Reglas de asociacin Sus componentes
son:
Premisa Conclusin
Resultado
Distancia eucldea
Estas son empleadas por los
diferentes algoritmos, los
cuales son muy influyentes en
la forma en que el algoritmo Distancia de Minkowski
realiza el clusters. Entre las
mas utilizadas se citan las
siguientes:
Distancia de Mahalanobis
Algoritmos de clustering