Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
M1. FUNDAMENTOS DE
MINERA DE DATOS
http://www.cs.waikato.ac.nz/ml/weka/
Bibliografa
Bibliografa Minera de Datos con WEKA
Introduccin a WEKA
Introduccin a WEKA
WEKA es una recopilacin de algoritmos para
aprendizaje automtico y herramientas de
preprocesamiento de datos.
Adems proporciona soporte para todo el proceso
experimental: evaluacin, preparacin y
visualizacin de datos y resultados.
WEKA contiene mtodos de clasificacin, regresin,
clustering y reglas de asociacin
Introduccin a WEKA
Maneras de Interaccin:
Introduccin a WEKA
Explorer
Cargar Datos
Soporta
ficheros en
formato ARFF,
CSV, Excel y
conexin jdbc
con BDs.
Introduccin a WEKA
Formato ARFF
@RELATION iris
@ATTRIBUTE
@ATTRIBUTE
@ATTRIBUTE
@ATTRIBUTE
@ATTRIBUTE
sepallength
sepalwidth
petallength
petalwidth
class
REAL
REAL
REAL
REAL
{Iris-setosa,Iris-versicolor,Iris-virginica}
@DATA
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
5.2,2.7,3.9,1.4,Iris-versicolor
5.0,2.0,3.5,1.0,Iris-versicolor
7.2,3.6,6.1,2.5,Iris-virginica
6.5,3.2,5.1,2.0,Iris-virginica
Introduccin a WEKA
Explorer
Construir un
rbol de
decisin
Visualizar
resultados de
la ejecucin
Introduccin a WEKA
Explorer
Formas de
comprobar
resultados (test):
Solo entrenar
Usar un conjunto
de test especfico
k-cfv
Particion
determinada
10
Introduccin a WEKA
Explorer
Visualizacin
de Datos
Botn
derecho
Atributos vs.
Atributos
Detalle
11
Introduccin a WEKA
Explorer
Visualizacin
de Resultados
y modelos
Botn
derecho
12
Introduccin a WEKA
Explorando Explorer
(algoritmos ms conocidos)
Clasificacin
Introduccin a WEKA
Explorando Explorer
(algoritmos ms conocidos)
Clustering
SimpleKMeans: Algoritmo k-Medias
Asociacin
PredictiveApriori: A priori con orden segn acierto
predictivo.
14
Introduccin a WEKA
Knowledge Flow
15
Introduccin a WEKA
Knowledge Flow:
16
Introduccin a WEKA
Knowledge Flow:
17
Introduccin a WEKA
Knowledge Flow:
18
Introduccin a WEKA
Knowledge Flow:
19
Introduccin a WEKA
Knowledge Flow:
20
Introduccin a WEKA
Knowledge Flow:
21
Introduccin a WEKA
Knowledge Flow:
Introduccin a WEKA
Knowledge Flow:
23
Introduccin a WEKA
Knowledge Flow
Visualizacin
(componentes ms tiles)
Evaluacin
24
Preprocesamiento en WEKA
WEKA contiene mtodos de preprocesamiento para
tratar valores perdidos, transformar datos,
discretizar y seleccionar caractersticas e instancias
Todos estos mtodos estn en el apartado Filters.
La seleccin de caractersticas la trata aparte.
WEKA no contiene mtodos de seleccin de
instancias, pero pueden simularse.
25
Preprocesamiento en WEKA
Filters
(algoritmos ms conocidos)
Add: Aade un nuevo atributo
AddCluster: aade un atributo nominal para representar
clusters
AddNoise: Cambia un porcentaje de valores de un atributo
Remove: Borra atributos
RemoveType: Borra atributos de un tipo (nominal, real,)
Utilidades
Preprocesamiento en WEKA
Filters
(algoritmos ms conocidos)
Normalize: Escalado de atributos numricos a un intervalo
NominalToBinary: Transforma valores nominales a binarios
Transformaciones
Tratamiento
de valores
perdidos
27
Preprocesamiento en WEKA
Ejemplo de Transformacin
Normalizado
Filters
Unsupervised
Atribute
Normalize
28
29
30
Evaluador de
subconjuntos
Mtodos de
bsqueda
32
Evaluadores
de atributos
simples
34
35
Ejemplo 1
36
Ejemplo 1
37
Ejemplo 2
38
Ejemplo 2
CNN
ENN
39
Ejercicios
40
Ejercicios
41
http://sci2s.ugr.es
Gracias !!!
42