Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
En esta seccin se presentan las ecuaciones de probabilidad usadas por el clasificador Naive
Bayes, para el clculo de la hiptesis ms probable, y la aplicacin de estas en la generacin de un
listado de predicciones o recomendaciones, para contenidos multimedia. Sea x un ejemplo que
puede ser clasificado dentro de v categoras, y sea x descrito por n caractersticas: a1,a2,..,an, el
clasificador de Naive Bayes busca encontrar la hiptesis ms probable que describa al ejemplo x, a
partir de la siguiente formula probabilstica [22,33,34], ver (1):
Vnj arg max P (vj) P (ai | vj)
(1)
En (1) Vnj es la probabilidad de que conocidas las n caractersticas que describen al ejemplo x,
stas pertenezcan a la categora vj; vj es cada una de las categoras V dentro de las que se puede
clasificar el ejemplo x. La probabilidad de P(ai|vj) est definida en general por (2) [22,33,34]:
P( ai | vj) nc n
(2)
En (2), nc es el nmero de veces que ocurre la caracterstica ai en la categora vj, mientras que n
es el nmero de casos totales de la categora vj. En caso de que nc sea igual a cero, se puede
usar de la m-estimacin o estimacin de Laplace [22,33,34], ver (3):
P (ai | vj) nc 1 / nc k
(3)
En (3), n es el nmero de casos totales con categora vj, nc es el nmero de veces que se da la
caracterstica ai en la categora vj, k es el nmero de valores diferentes que toma la caracterstica
ai. As, el clasificador de Naive Bayes puede ser usado para predecir la posible categora de un
caso x a partir de un conjunto de casos ocurridos, lo cual puede ser aplicado para la generacin de
recomendaciones en escenarios de contenidos multimedia [22,23].
A modo de ejemplo de aplicacin del clasificador de Naive Bayes, en la Tabla 1 se presenta el
catlogo de una tienda de pelculas, en el que un conjunto de contenidos multimedia han sido
valorados. Cada pelcula puede ser calificada dentro de 3 posibles valores (vj): v={1,2,3}. As
mismo, cada pelcula tiene 2 caractersticas (an) que la describen: a={Genero, Ao}.
TABLA I
EJEMPLO CLASIFICADOR NAIVE BAYES
Muestra
1
Gnero
Accin
Ao
2001
Valoracin
1
Drama
2005
Accin
2002
Comedia
2012
Comedia
2002
Si a partir de los datos de la Tabla 1, se desea predecir la posible calificacin de una pelcula cuyo
Gnero sea Accin y cuyo ao sea 2005, se realiza el clculo de las siguientes expresiones de
probabilidad (usando (1), (2) y (3)):
P(1)P(Accin|1)P(2005|1)=(0.4)(1)(0.5)=0.2
P(2)P(Accin|2)P(2005|2)=(0.4)(0.33)(0.5)=0.07
P(3)P(Accin|3)P(2005|3)=(0.2)(0.5)(0.5)=0.05