Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Learning:
-Unsupervised = exploratory. Cuando no se sabe si hay patrones interesantes sobre
un dataset y se quiere analizar.
-Supervised = predictive. Cuando se tiene una hipótesis y se trata de probarla. En
general, cuando faltan datos de un dataset, con este aprendizaje supervisado es
posible completarlo.
Cluster: región de alta densidad separada por una región de baja densidad
Densidad: número de puntos por medida de distancia.
Standarization: Tener los dos ejes para calcular los clusters en la misma escala.
Para estandarizar:
Punto normalizado = (punto - media)/desviación standard
ALGORITMOS SUPERVISADOS
Se tienen 'labels' para los datos, basados en alguna determinada propiedad. La idea
es conocer el 'label' de un nuevo dato a agregar al dataset.
Supervisado: Se toman los datos y los labels, se agregan nuevos datos y se trata de
predecir qué label le corresponderá a cada uno.
bias VS variance = para encontrar el K adecuado
-Support Vector Machine (SVM): Se dibuja una línea (hiperplano) que divida los
puntos (instancias). La línea óptima se llama 'maximum margin classifier' y es la
que tiene la máxima distancia entre ambos grupos de puntos. Para cada test
instance, sólo se evalúa si se encuentra de un lado o del otro lado de la línea. La
limitación es que los datos no son "separables" linealmente. La idea es que la
línea divisoria no sea necesariamente recta. Tampoco sirven cuando hay más de una
clasificacion (clases) de datos, ya que sólo puede dividir los datos en 2 grupos.
Es muy costoso computacionalmente entrenar un clasificador SVM.
Es conveniente aplicar SVM cuando:
-no hay muchos datos para entrenar el clasificador
-los datos tienen una interpretación geométrica (por ejemplo, procesar imágenes)
-se necesita mucha precisión
-Decision trees: El esfuerzo está en reconocer los patrones de decisión que van a
abrir las ramas del árbol. Se necesita encontrar los features correctos. Existen
técnicas para seleccionar o construir features.