La tecnologa moderna permite la creacin de grandes almacenes de datos (crudos) que requieren ser explorados en bsqueda de informacin refinada (conocimiento). Desarrollar agentes que permitan procesar estos grandes volmenes de datos y convertirlos en conocimiento til para la toma de decisiones (inteligencia), constituye un reto colosal. MINERIA DE DATOS El descubrimiento de conocimiento en bases de datos de informacin cientfica puede ser entendido como un proceso que implica la realizacin de una secuencia bsica de tareas: Comprensin del campo de aplicacin Adquisicin y seleccin de ficheros. Preprocesamiento de ficheros. Minera de Datos de resultados. Visualizacin e interpretacin de resultados. Evaluacin y reporte de resultados.
TECNICAS DE MINERIA DE DATOS Las tcnicas de minera de datos persiguen el descubrimiento automtico del conocimiento contenido en la informacin almacenada de modo ordenado en grandes bases de datos. La clasificacin inicial de las tcnicas de minera de datos distingue entre tcnicas predictivas, en las que las variables pueden clasificarse inicialmente en dependientes e independientes; tcnicas descriptivas, en las que todas las variables tienen inicialmente el mismo estatus y tcnicas auxiliares.
TECNICAS DE MINERIA DE DATOS MAPAS DE KOHONEN El objetivo de Kohonen era demostrar que un estmulo externo (informacin de entrada) por s solo, suponiendo una estructura propia y una descripcin funcional del comportamiento de la red, era suficiente para forzar la formacin de mapas topolgicos de las informaciones recibidas del exterior.
El modelo tiene dos variantes: LVQ (learning vector quantization) TPM o SOM (topologic preserving map, o self organizing map).
ARQUITECTURA LVQ Entre las neuronas de la capa de salida existen conexiones laterales de inhibicin (peso negativo) implcitas. Cada una de estas neuronas va a tener cierta influencia sobre sus vecinas. El valor que se asigne a los pesos de las conexiones feedforward entre las capas de entrada y salida durante el proceso de aprendizaje de la red va a depender precisamente de esta interaccin lateral.
ARQUITECTURA SOM La red auto-organizada debe descubrir rasgos comunes, regularidades, correlaciones o categoras en los datos de entrada, e incorporarlos a su estructura interna de conexiones. Se dice, por tanto, que las neuronas deben auto-organizarse en funcin de los estmulos (datos) procedentes del exterior.
En el aprendizaje competitivo las neuronas compiten unas con otras con el fin de llevar a cabo una tarea dada. Se pretende que cuando se presente a la red un patrn de entrada, slo una de las neuronas de salida (o un grupo de vecinas) se active. ARQUITECTURA SOM Por tanto, las neuronas compiten por activarse, quedando finalmente una como neurona vencedora y anulada el resto, que son forzadas a sus valores de respuesta mnimos.
El objetivo de este aprendizaje es categorizar los datos que se introducen en la red. Se clasifican valores similares en la misma categora y, por tanto, deben activar la misma neurona de salida.
Las clases o categoras deben ser creadas por la propia red, puesto que se trata de un aprendizaje no supervisado, a travs de las correlaciones entre los datos de entrada.
ARQUITECTURA SOM
ARQUITECTURA SOM El Mapa de Kohonen, SOM (self-organizing map, mapa auto organizativo) o SOFM (self-organizing feature map, mapa auto organizado de caractersticas) se usa para diferentes aplicaciones: Clustering. Visualizacin. Clasificacin. Interpolacin de una funcin. Cuantizacin vectorial.
FUNCIONAMIENTO DE LA RED DE KOHONEN El funcionamiento es relativamente simple. Cuando se presenta a la entrada una informacin Ek, cada una de las M neuronas de la capa de salida la recibe a travs de la conexiones feedforward con pesos wji. Tambin estas neuronas reciben las correspondientes entradas debidas a las conexiones laterales con el resto de las neuronas de salida y cuya influencia depender de la distancia a la que se encuentren.
Se trata de una red de tipo competitivo, ya que al presentar una entrada Ek la red evoluciona a una situacin estable en la que se activa una neurona de salida, la vencedora.
APRENDIZAJE DE LA RED DE KOHONEN Durante la etapa de entrenamiento, se presenta a la red un conjunto de informaciones de entrada para que sta establezca, en funcin de la semejanza entre los datos, las diferentes categoras (una por neurona de salida) que servirn durante la fase de funcionamiento para realizar clasificaciones de nuevos datos que se presenten a la red. Los valores finales de los pesos de las conexiones entre cada neurona de la capa de salida con las de entrada se correspondern con los valores de los componentes del vector de aprendizaje que consigue activar la neurona correspondiente.
APLICACIONES Reconocimiento de voz.
Reconocimiento de texto manuscrito.
Resolucin de problemas de optimizacin.
VENTAJAS
Relacin con los mtodos de cuantificacin vectorial. Capaces de preservar la topologa del espacio de datos. Proyeccin bidimensional para la visualizacin de los datos.
INCONVENIENTES
Lentitud en el aprendizaje. Predefine la topologa de la red. En algunos casos puede ser incapaz de adaptarse a las caractersticas del problema.
EJEMPLO CONCLUSIONES
Los mapas auto organizados de Kohonen, son una tcnica no supervisada de la minera de datos, la cual permite predecir y clasificar elementos a travs de sus caractersticas. Es usada en la computacin neuronal, y est caracterizada por tener un lento aprendizaje.