Aprendizaje Supervisado

Aprendizaje supervisado - Wikipedia, la enciclopedia libre https://es.wikipedia.
org/wiki/Aprendizaje_supervisado
Aprendizaje supervisado
De Wikipedia, la enciclopedia libre
En aprendizaje automtico y minera de datos, el aprendizaje supervisado es una tcnica para deducir una
funcin a partir de datos de entrenamiento. Los datos de entrenamiento consisten de pares de objetos
(normalmente vectores): una componente del par son los datos de entrada y el otro, los resultados deseados. La
salida de la funcin puede ser un valor numrico (como en los problemas de regresin) o una etiqueta de clase
(como en los de clasificacin). El objetivo del aprendizaje supervisado es el de crear una funcin capaz de
predecir el valor correspondiente a cualquier objeto de entrada vlida despus de haber visto una serie de
ejemplos, los datos de entrenamiento. Para ello, tiene que generalizar a partir de los datos presentados a las
situaciones no vistas previamente.
En esto difiere del aprendizaje no supervisado.
ndice
1 Informacin general
2 Minimizacin del riesgo emprico
3 Aprendizaje Activo
3.1 Definiciones
3.2 Hiperplano marginal mnima
3.3 Mxima curiosidad
4 Enfoques y algoritmos
5 Aplicaciones
6 Cuestiones generales
7 Notas
8 Referencias
9 Enlaces externos
Informacin general
El aprendizaje supervisado puede generar modelos de dos tipos. Por lo general, genera una funcin que
transforma los datos de entrada en los resultados deseados.
Con el fin de resolver un determinado problema de aprendizaje supervisado (por ejemplo, aprender a reconocer
la escritura) uno tiene que considerar varios pasos:
1. Determinar el tipo de ejemplos de entrenamiento. Antes de hacer cualquier otra cosa, hay que decidir qu
tipo de datos se va a utilizar para entrenar el modelo. Por ejemplo, podra ser un nico carcter a mano,
una palabra completa escrita a mano, o toda una lnea de escritura a mano.
2. Reunir un conjunto de entrenamiento. El conjunto de necesidades de formacin a las caractersticas
propias del uso del mundo real de la funcin. Por lo tanto, un conjunto de objetos de entrada que se
recopila y salidas correspondientes se recogen tambin, ya sea humana o de los expertos a partir de
mediciones.
3. Determinar la funcin de ingreso de la representacin de la funcin aprendido. La precisin de la funcin
1 de 6 10/7/17 23:21
Aprendizaje supervisado - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Aprendizaje_supervisado
aprendida depende en gran medida de cmo el objeto de entrada est representado. Normalmente, el
objeto de entrada se transforma en un vector de caractersticas, que contiene una serie de caractersticas
que son descriptivos del objeto. El nmero de caractersticas no debe ser demasiado grande, a causa de la
maldicin de la dimensionalidad, pero debe ser lo suficientemente grande como para predecir con
precisin la salida.
4. Determinar la estructura de la funcin adecuada para resolver y el problema y la tcnica de aprendizaje
correspondiente. Por ejemplo, se podra optar por utilizar red neuronal artificial o un rbol de decisin.
5. Completar el diseo. El ingeniero a continuacin, ejecuta el algoritmo de aprendizaje en el conjunto de la
formacin obtenida. Parmetros del algoritmo de aprendizaje puede ser ajustado mediante la
optimizacin de rendimiento en un subconjunto de ellas (llamado conjunto de validacin) del conjunto
de entrenamiento, o por medio de la validacin cruzada. Despus del ajuste de parmetros y de
aprendizaje, el desempeo del algoritmo se puede medir utilizando un conjunto de pruebas independiente
del de entrenamiento.
Otro trmino para el aprendizaje supervisado es la clasificacin. Una amplia gama de clasificadores estn
disponibles, cada uno con sus fortalezas y debilidades. Clasificador rendimiento depende en gran medida de las
caractersticas de los datos que deben clasificarse. No hay una clasificacin nica que funciona mejor en todos
los problemas dados, lo que tambin se conoce como el No hay almuerzo gratis teorema. Diversas pruebas
empricas se han realizado para comparar el rendimiento del clasificador y para encontrar las caractersticas de
los datos que determinan el rendimiento del clasificador. La determinacin de un clasificador adecuado para un
problema dado, sin embargo an ms un arte que una ciencia.
Los clasificadores ms utilizados son las redes neuronales, como el (perceptrn multicapa); las mquinas de
vectores de soporte; el algoritmo de los K-vecinos ms cercanos, los modelos de mixturas; el clasificador
bayesiano ingenuo; los rboles de decisin y las funciones de base radial.
Minimizacin del riesgo emprico

El objetivo del aprendizaje supervisado es encontrar una funcin g, dado un conjunto de puntos de la forma (x,
g(x)).
Se supone que el conjunto de puntos para los que el comportamiento de los g es conocido es una muestra de
variables aleatorias independientes idnticamente distribuidas de acuerdo con una distribucin de probabilidad
desconocida p. Por otra parte, se considera una funcin de prdida L:
donde Y es el codominio de g, y L es una funcin mapas en el nmero no negativo real s (nuevas restricciones
pueden ser colocados enL) . La cantidad L(z,y) es la prdida sufrida en la prediccin de z , como el valor de g
cuando su valor verdadero es y.
El riesgo asociado con una funcin f es la esperanza de la funcin de prdida:
Si la distribucin de probabilidad p es discreta se puede reescribir la frmula anterior usando una integral en
lugar de un sumatorio..
Ahora el objetivo es encontrar una funcin f* entre una subclase fijo de funciones para las que el riesgoR( f *)
2 de 6 10/7/17 23:21
es mnima .
Sin embargo, dado el comportamiento de los g generalmente solo es conocido por un conjunto finito de puntos
(x1, y1), ..., (xnyn), uno slo puede aproximar el verdadero riesgo, por ejemplo con el riesgo emprico:
Seleccin de la funcin f* que minimiza el riesgo emprico se conoce como el principio de minimizacin
emprica de riesgos. Teora estadstica de aprendizaje investiga bajo qu condiciones la minimizacin del
riesgo emprico es admisible y lo bien que las aproximaciones se puede esperar que sea.
Aprendizaje Activo
Hay situaciones en las que los datos sin etiqueta es abundante, pero los datos de etiquetado es caro. En esta
situacin, el algoritmo de aprendizaje de manera activa la consulta del usuario / profesor para las etiquetas. Este
tipo de aprendizaje supervisado iterativo se llama aprendizaje activo. Dado que el estudiante elige los ejemplos,
el nmero de ejemplos para aprender un concepto a menudo pueden ser mucho menores que el nmero
requerido en el aprendizaje supervisado normal. Con este enfoque se corre el riesgo de que el algoritmo puede
centrarse en importancia ni como ejemplos vlidos.
El aprendizaje activo puede ser especialmente til en problemas de investigacin biolgica, como ingeniera de
protenas, donde unas pocas protenas han sido descubiertos con una cierta funcin interesante y se quiere
determinar cul de las muchas posibles mutantes que el prximo que tendr un.1
Definiciones
Que es el conjunto total de todos los datos en cuestin. Por ejemplo, en un problema de ingeniera de
protenas, se incluyen todas las protenas que se sabe que tienen una determinada actividad interesante y
todas las protenas adicionales que uno podra querer poner a prueba para esa actividad.
Durante cada iteracin, , se divide en tres subgrupos:
1. : Puntos cuya etiqueta es conocida

2. : Puntos cuya etiqueta es desconocida
3. : Un subconjunto de escogido para ser etiquetado
La mayora de las investigaciones actuales en el aprendizaje activo implica que el mejor mtodo para elegir los
puntos de datos para .
Hiperplano marginal mnima

Algunos de los algoritmos de aprendizaje activo se basan en mquinas de vector soporte y aprovechar la
estructura de la SVM para determinar qu puntos de datos a la etiqueta. Estos mtodos suelen calcular el
margen, , de cada dato sin etiqueta en y tratar como una distancia n-dimensional a partir de ese
dato a la separacin de hiperplano.
mtodos mnima marginal Hiperplano suponer que los datos con> los ms pequeos son las que el SVM es
3 de 6 10/7/17 23:21
ms seguro acerca de, por lo que debe ser colocado en se etiqueten . Otros mtodos similares, como
mximo marginal Hiperplano, elija los datos con> el mayor . mtodos de relaciones de intercambio elegir
una combinacin de la menor y la mayor s.
Mxima curiosidad
Otro mtodo de aprendizaje activo, que normalmente se entera de un conjunto de datos con menos ejemplos de
mnima Hiperplano marginal, pero es ms intensivo en cmputo y slo para los clasificadores discreto es
mxima curiosidad.2
curiosidad mxima tiene en cada uno sin etiqueta de referencia en y asume todas las etiquetas posibles
ese dato pueda tener. Este dato supone con cada clase se aade a y luego el nuevo cruz
validados. Se supone que cuando el dato es emparejado con su etiqueta correcta, la exactitud de validacin
cruzada (o correlacin coeficiente) de mejorar ms. El dato con la precisin que ms ha mejorado se
coloca en se etiqueten.
Enfoques y algoritmos
Analtica de aprendizaje
Las redes neuronales
Backpropagation
Aumentar
Estadstica bayesiana
Razonamiento basado en casos
rbol de decisin de aprendizaje
Inductivo lgica de programacin
Gaussiana de regresin proceso
ncleo
Aprendizaje Autmatas
La longitud del mensaje mnima (rbol de decisiones s, grficos de decisin, etc)
Naive bayes clasificador
vecino ms cercano Algoritmo
Probablemente aproximadamente correcto aprendizaje (PAC) de aprendizaje
Rizado establecen las normas, una metodologa de adquisicin de conocimientos
[[Simblico de aprendizaje automtico] algoritmos]
[[Subsimblico aprendizaje automtico] algoritmos]
Mquina de vector de apoyo s
[[Al azar forestales | Aleatorio] Bosques]
Los conjuntos de clasificadores
Clasificacin ordinal
Pre-procesamiento de datos
Bases de datos Manejo desequilibrada
Estadstica de aprendizaje relacional
Aplicaciones
4 de 6 10/7/17 23:21
Bioinformtica
Quimioinformtica
Cuantitativas estructura-actividad
Base de datos de marketing
Reconocimiento de escritura
Recuperacin de informacin
Aprender a rango
Reconocimiento de objetos en de visin por computador
El reconocimiento ptico de caracteres
Spam deteccin
Reconocimiento de patrones
De reconocimiento de voz
Previsin estados financieros fraudulentos
Cuestiones generales
Teora del aprendizaje computacional
Sesgo inductivo
Overfitting (aprendizaje automtico)
(Sin calibrar) probabilidades pertenencia a una clase
Versin espacio s
Notas
1. Danziger, SA, Swamidass, SJ, Zeng, J., escasez, LR, Lu, P., Chen, JH, Cheng, J., Hoang, vicepresidente de Saigo,
H., Luo, R ., Baldi, P., Brachmann, RK y el censo funcional Lathrop, RH de secuencia de espacios mutacin: el
ejemplo de mutantes de p53 cncer de rescate', (2006)IEEE / ACM transacciones en la biologa computacional y
bioinformtica,3, 114-125.
2. Danziger, SA, Zeng, J., Wang , Y., Brachmann, RK y Lathrop, RH Elegir dnde mirar en un espacio siguiente
secuencia de mutacin: Aprendizaje Activo de mutantes de p53 informativo del cncer de rescate,(2007)
Bioinformtica,, '23 (13 104-114). [1] (http://bioinformatics.oxfordjournals.org/cgi/reprint/23/13/i104.pdf)
Referencias
S. Kotsiantis, supervisado Aprendizaje Automtico: Una Revisin de la Clasificacin de las tcnicas de
Informtica Diario 31 (2007) 249-268 (http://www.informatica.si/PDF/31-3/11_Kotsiantis% 20 -%%%
20Supervised 20Machine 20Learning 20% -% 20A% 20de% ... 20Review pdf).
Lise Getoor y Taskar Ben: Introduccinaestadstica de relacin de aprendizaje, MIT Press, 2007
Enlaces externos
mquina varias implementaciones de algoritmos de aprendizaje supervisado en Ruby
(http://ai4r.rubyforge.org)
Obtenido de https://es.wikipedia.org/w/index.php?title=Aprendizaje_supervisado&oldid=99056024
5 de 6 10/7/17 23:21
Categoras: Aprendizaje automtico Minera de datos
Se edit esta pgina por ltima vez el 11 may 2017 a las 15:21.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; pueden
aplicarse clusulas adicionales. Al usar este sitio, usted acepta nuestros trminos de uso y nuestra poltica
de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de
lucro.
6 de 6 10/7/17 23:21

Aprendizaje Supervisado

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Aprendizaje Supervisado

Caricato da

Copyright:

Formati disponibili

Aprendizaje supervisado - Wikipedia, la enciclopedia libre https://es.wikipedia.

En esto difiere del aprendizaje no supervisado.

Minimizacin del riesgo emprico

El riesgo asociado con una funcin f es la esperanza de la funcin de prdida:

Durante cada iteracin, , se divide en tres subgrupos:

1. : Puntos cuya etiqueta es conocida

Hiperplano marginal mnima

Categoras: Aprendizaje automtico Minera de datos

Potrebbero piacerti anche