Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Clasicador KNN
Alejandro Medina Universidad de Talca
alejandro.medina.n@gmail.com Abstract
Un clasicador KNN (K-nearest neighbours) que signica los "k vecinos ms cercanos" obtiene las clases de las muestras ms cercanas con lo cual denir la clase a la cual pertenece el elemtno de la consulta.
I. Introducin
El clasicador KNN es un clasicador fcil de implementar ya que requiere de un algoritmo bsico como lo es KNN, en el cual se basa para realizar las clasicaciones.[1]. Para los datos de los individuos el *.arff ha quedado de la siguiente forma: @relation whatever @attribute altura numeric @attribute peso numeric @attribute edad numeric @attribute genero {F,M} @data 163 , 62 , 29 , F 175 , 81 , 27 , M 165 , 70 , 35 , F Para los datos de iris el *.arff ha quedado de la siguiente forma: @relation person @attribute sepallength numeric @attribute sepalwidth numeric @attribute petallength numeric @attribute petalwidth numeric @attribute class {ise,ive,ivi} @data 5.1,3.5,1.4,0.2,ise 4.9,3.0,1.4,0.2,ise 4.7,3.2,1.3,0.2,ise
Octubre 2013
En el Caso 1, el elemento de la consulta(en verde) obtiene sus K = 5 elementos ms cercanos, los cuales pertenecen a solo una clase, con lo cual el elemento sera clasicado con la clase resultante de la votacin
Cuando se realiza una consulta de KNN pueden suceder 2 casos, para el ejemplo utilizaremos un K = 5, las formas de las guras determinan a que clase corresponde el elemento.
En el Caso 2, el elemento de la consulta obtiene sus K = 5 elementos ms cercanos, pero el elemento de la consulta se encuentra en una zona donde existe una disputa entre las dos clases. Cuando sucede esto el resultado de la votacin ser entrecho, pero determinar la clase del elemento de consulta. Para obtener la certeza, se debe calcular una matriz de confusin. El tamao de la ma-
Caso 1: 2
Octubre 2013
triz de confusin la determinar el numero de clases posibles, por ejemplo si las clases son 2, la matriz ser de 2x2. La matriz en su diagonal tendr los aciertos, los cuales nos permitiran estimar la certeza de la respuesta. A medida que se ejecuta el algoritmo el fold de pruebas cambiar de posicin y se volvera a ejecutar el algoritmo, llenando asi gradualmente la matriz de confusin.
V. Resultados Finales
Los resultados obtenidos con los datos recolectados, son los siguientes Para el dataset de personas con la siguiente matriz de confusin:
Se ha separado el dataset en 10 partes de las cuales constantemente 9 estaran para entrenamiento y 1 para pruebas
4 http://www.oracle.com/technetwork/es/java/javase/downloads/index.html 5 https://netbeans.org/
Octubre 2013
encuentre Clasicador.jar. Total Aciertos: 141 Total de Datos: 150 calculoCerteza: 94.0 % Luego para la ejecucin del programa se escribe el siguiente comando: java -jar Clasicador.jar 1 /ruta/al/archivo/*.arff
References
[1] Documentacin KNN: DJJF MMM I? ADK AI ??M>=OAI @ ?A ?E= ?? @ ?I J'I
H=? A ?
=L=IA % @ ?I =FE
@ ?I