Sei sulla pagina 1di 18

Tcnicas de Minera de Datos.

Caso de Estudio: Mapas de


Kohonen


Julio de 2013
INTRODUCCION


La tecnologa moderna permite la creacin de grandes
almacenes de datos (crudos) que requieren ser explorados en
bsqueda de informacin refinada (conocimiento). Desarrollar
agentes que permitan procesar estos grandes volmenes de
datos y convertirlos en conocimiento til para la toma de
decisiones (inteligencia), constituye un reto colosal.
MINERIA DE DATOS
El descubrimiento de conocimiento en bases de datos de
informacin cientfica puede ser entendido como un proceso
que implica la realizacin de una secuencia bsica de tareas:
Comprensin del campo de aplicacin
Adquisicin y seleccin de ficheros.
Preprocesamiento de ficheros.
Minera de Datos de resultados.
Visualizacin e interpretacin de resultados.
Evaluacin y reporte de resultados.

TECNICAS DE MINERIA DE DATOS
Las tcnicas de minera de datos persiguen el descubrimiento
automtico del conocimiento contenido en la informacin
almacenada de modo ordenado en grandes bases de datos. La
clasificacin inicial de las tcnicas de minera de datos distingue
entre tcnicas predictivas, en las que las variables pueden
clasificarse inicialmente en dependientes e independientes;
tcnicas descriptivas, en las que todas las variables tienen
inicialmente el mismo estatus y tcnicas auxiliares.

TECNICAS DE MINERIA DE DATOS
MAPAS DE KOHONEN
El objetivo de Kohonen era demostrar que un estmulo externo
(informacin de entrada) por s solo, suponiendo una estructura
propia y una descripcin funcional del comportamiento de la
red, era suficiente para forzar la formacin de mapas topolgicos
de las informaciones recibidas del exterior.

El modelo tiene dos variantes:
LVQ (learning vector quantization)
TPM o SOM (topologic preserving map, o self organizing
map).

ARQUITECTURA LVQ
Entre las neuronas de la capa de salida existen conexiones
laterales de inhibicin (peso negativo) implcitas. Cada una de
estas neuronas va a tener cierta influencia sobre sus vecinas. El
valor que se asigne a los pesos de las
conexiones feedforward entre las capas de entrada y salida
durante el proceso de aprendizaje de la red va a depender
precisamente de esta interaccin lateral.

ARQUITECTURA SOM
La red auto-organizada debe descubrir rasgos comunes,
regularidades, correlaciones o categoras en los datos de
entrada, e incorporarlos a su estructura interna de conexiones.
Se dice, por tanto, que las neuronas deben auto-organizarse en
funcin de los estmulos (datos) procedentes del exterior.

En el aprendizaje competitivo las neuronas compiten unas con
otras con el fin de llevar a cabo una tarea dada. Se pretende que
cuando se presente a la red un patrn de entrada, slo una de
las neuronas de salida (o un grupo de vecinas) se active.
ARQUITECTURA SOM
Por tanto, las neuronas compiten por activarse, quedando
finalmente una como neurona vencedora y anulada el resto, que
son forzadas a sus valores de respuesta mnimos.

El objetivo de este aprendizaje es categorizar los datos que se
introducen en la red. Se clasifican valores similares en la misma
categora y, por tanto, deben activar la misma neurona de salida.

Las clases o categoras deben ser creadas por la propia red,
puesto que se trata de un aprendizaje no supervisado, a travs
de las correlaciones entre los datos de entrada.

ARQUITECTURA SOM

ARQUITECTURA SOM
El Mapa de Kohonen, SOM (self-organizing map, mapa auto
organizativo) o SOFM (self-organizing feature map, mapa auto
organizado de caractersticas) se usa para diferentes
aplicaciones:
Clustering.
Visualizacin.
Clasificacin.
Interpolacin de una funcin.
Cuantizacin vectorial.

FUNCIONAMIENTO DE LA RED DE KOHONEN
El funcionamiento es relativamente simple. Cuando se presenta
a la entrada una informacin Ek, cada una de las M neuronas de
la capa de salida la recibe a travs de la
conexiones feedforward con pesos wji. Tambin estas neuronas
reciben las correspondientes entradas debidas a las conexiones
laterales con el resto de las neuronas de salida y cuya influencia
depender de la distancia a la que se encuentren.

Se trata de una red de tipo competitivo, ya que al presentar una
entrada Ek la red evoluciona a una situacin estable en la que se
activa una neurona de salida, la vencedora.

APRENDIZAJE DE LA RED DE KOHONEN
Durante la etapa de entrenamiento, se presenta a la red un
conjunto de informaciones de entrada para que sta establezca,
en funcin de la semejanza entre los datos, las diferentes
categoras (una por neurona de salida) que servirn durante la
fase de funcionamiento para realizar clasificaciones de nuevos
datos que se presenten a la red. Los valores finales de los pesos
de las conexiones entre cada neurona de la capa de salida con
las de entrada se correspondern con los valores de los
componentes del vector de aprendizaje que consigue activar la
neurona correspondiente.

APLICACIONES
Reconocimiento de voz.

Reconocimiento de texto manuscrito.

Resolucin de problemas de optimizacin.

VENTAJAS



Relacin con los mtodos de cuantificacin vectorial.
Capaces de preservar la topologa del espacio de datos.
Proyeccin bidimensional para la visualizacin de los datos.

INCONVENIENTES


Lentitud en el aprendizaje.
Predefine la topologa de la red.
En algunos casos puede ser incapaz de adaptarse a las
caractersticas del problema.

EJEMPLO
CONCLUSIONES


Los mapas auto organizados de Kohonen, son una tcnica no
supervisada de la minera de datos, la cual permite predecir y
clasificar elementos a travs de sus caractersticas. Es usada en la
computacin neuronal, y est caracterizada por tener un lento
aprendizaje.

Potrebbero piacerti anche