Sei sulla pagina 1di 19

Análisis de Datos

ACI777
Segundo semestre 2018

Escuela de Ingenieria Informática


Facultad de Ingeniería y Negocios
Campus Santiago Centro

Marzo 2017
Introducción a ML

Análisis de Datos - Sem 02-2018 2


Introducción a ML
• Tres tipos de aprendizajes

• Inferencia de una función


Supervisado • Entrenamiento con datos etiquetados
• Clasificación y regresión

• Inferencia de la estructura de datos no


No supervisado etiquetados

• Interacción con un entorno (medioambiente)


Reforzado dinámico

Análisis de Datos - Sem 02-2018 3


Introducción a ML
• Ejemplo AS Nº día Exterior Temperatura Humedad Viento Juega

Clasificación 1
2
soleado
soleado
alta
alta
alta
alta
débil
fuerte
no
no
3 nublado alta alta débil sí
4 lluvioso media alta débil sí
5 lluvioso fría normal débil sí
6 lluvioso fría normal fuerte no
7 nublado fría normal fuerte sí
8 soleado media alta débil no
9 soleado fría normal débil sí
Exterior ∈ {soleado, nublado, lluvioso} 10 lluvioso media normal débil sí
11 soleado media normal fuerte sí
Temperatura ∈ {alta, media, fría} 12 nublado media alta fuerte sí
13 nublado alta normal débil sí
Humedad ∈ {alta, normal}
14 lluvioso media alta fuerte no
Viento ∈ {débil, fuerte}

Juega ∈ {sí, no}


{a1, a2, a3, …, an} à c
15 soleado alta alta fuerte ?
Análisis de Datos - Sem 02-2018 4
Introducción a ML

• ¿Cuantas clases existen en el


reconocimiento de números de patentes?

Análisis de Datos - Sem 02-2018 5


Introducción a ML

• Ejemplo AS
Regresión
¿Cuánto ganaré/perderé en los
$$$$

próximos 3 meses en mi AFP?


F(t) à vt

• ARIMA
Tiempo
• SVM
• RN real estimación
Análisis de Datos - Sem 02-2018 6
Introducción a ML
• Ejemplo ANS
Segmentación o clustering

Peso y altura de n personas Posible segmentación con K=2 clústeres.

Análisis de Datos - Sem 02-2018 7


Introducción a ML
• Ejemplo ANS
Recomendación colaborativa

Análisis de Datos - Sem 02-2018 8


Introducción a ML

• Ejemplo ANS
Reducción de dimensionalidad

Análisis de Datos - Sem 02-2018 9


Introducción a ML
• Ejemplos AR

Análisis de Datos - Sem 02-2018 10


Introducción a ML
Variables discretas

Clasificación Clustering

Aprendizaje Aprendizaje
Supervisado No supervisado

Reducción de
Regresión
dimensionalidad

Variables contínuas

Análisis de Datos - Sem 02-2018 11


Análisis de Datos - Sem 02-2018 12
Introducción ML

Análisis de Datos - Sem 02-2018 13


Carácterísticas y selección
Clasificación

• Encontrar mecanismo para clasificar únicamente


a partir de las propiedades de los datos.
• Clasificar nuevas observaciones se basa
únicamente en las propiedades de los datos.
• Algunas técnicas:
– Arboles de decisión
– k-NN Nearest Neighbour
– SVM
– Redes neuronales

Análisis de Datos - Sem 02-2018 15


Árboles de decisión

exterior
soleado lluvioso
nublado

humedad sí (4) viento


normal alta fuerte
débil

sí (2) no (3)
sí (3) no (2)

if ((exterior=='soleado') && (humedad=='normal')) {juega='sí';}


if ((exterior=='soleado') && (humedad!='normal')) {juega='no';}
if (exterior=='nublado') {juega='yes';}
if ((exterior=='lluvioso') && (viento=='fuerte')) {juega='no'}
if ((exterior='lluvioso’) && (viento='débil')) {juega='sí';}

Análisis de Datos - Sem 02-2018 16


Árboles de decisión

Análisis de Datos - Sem 02-2018 17


Árboles de decisión

• Entropía de Shannon y GI

Análisis de Datos - Sem 02-2018 18


Árboles de decisión

• Ganancia de Información
(information gain, IG)

Análisis de Datos - Sem 02-2018 19

Potrebbero piacerti anche