Sei sulla pagina 1di 2

Algoritmo de Naive-Bayes

En esta seccin se presentan las ecuaciones de probabilidad usadas por el clasificador Naive
Bayes, para el clculo de la hiptesis ms probable, y la aplicacin de estas en la generacin de un
listado de predicciones o recomendaciones, para contenidos multimedia. Sea x un ejemplo que
puede ser clasificado dentro de v categoras, y sea x descrito por n caractersticas: a1,a2,..,an, el
clasificador de Naive Bayes busca encontrar la hiptesis ms probable que describa al ejemplo x, a
partir de la siguiente formula probabilstica [22,33,34], ver (1):
Vnj arg max P (vj) P (ai | vj)

(1)

En (1) Vnj es la probabilidad de que conocidas las n caractersticas que describen al ejemplo x,
stas pertenezcan a la categora vj; vj es cada una de las categoras V dentro de las que se puede
clasificar el ejemplo x. La probabilidad de P(ai|vj) est definida en general por (2) [22,33,34]:

P( ai | vj) nc n

(2)

En (2), nc es el nmero de veces que ocurre la caracterstica ai en la categora vj, mientras que n
es el nmero de casos totales de la categora vj. En caso de que nc sea igual a cero, se puede
usar de la m-estimacin o estimacin de Laplace [22,33,34], ver (3):
P (ai | vj) nc 1 / nc k

(3)

En (3), n es el nmero de casos totales con categora vj, nc es el nmero de veces que se da la
caracterstica ai en la categora vj, k es el nmero de valores diferentes que toma la caracterstica
ai. As, el clasificador de Naive Bayes puede ser usado para predecir la posible categora de un
caso x a partir de un conjunto de casos ocurridos, lo cual puede ser aplicado para la generacin de
recomendaciones en escenarios de contenidos multimedia [22,23].
A modo de ejemplo de aplicacin del clasificador de Naive Bayes, en la Tabla 1 se presenta el
catlogo de una tienda de pelculas, en el que un conjunto de contenidos multimedia han sido
valorados. Cada pelcula puede ser calificada dentro de 3 posibles valores (vj): v={1,2,3}. As
mismo, cada pelcula tiene 2 caractersticas (an) que la describen: a={Genero, Ao}.
TABLA I
EJEMPLO CLASIFICADOR NAIVE BAYES
Muestra
1

Gnero
Accin

Ao
2001

Valoracin
1

Drama

2005

Accin

2002

Comedia

2012

Comedia

2002

Si a partir de los datos de la Tabla 1, se desea predecir la posible calificacin de una pelcula cuyo
Gnero sea Accin y cuyo ao sea 2005, se realiza el clculo de las siguientes expresiones de
probabilidad (usando (1), (2) y (3)):

P(1)P(Accin|1)P(2005|1)=(0.4)(1)(0.5)=0.2
P(2)P(Accin|2)P(2005|2)=(0.4)(0.33)(0.5)=0.07
P(3)P(Accin|3)P(2005|3)=(0.2)(0.5)(0.5)=0.05

De acuerdo a lo anterior, se obtiene que la expresin con la probabilidad ms alta es P(1)=0.2, lo


que indica que de acuerdo al historial de la Tabla 1, la valoracin ms probable para una pelcula
nueva con gnero sea Accin y ao 2005 es 1. As, se puede observar que el clasificador de
Naive Bayes puede ser adaptado a otros escenarios basados en el uso de contenidos multimedia,
como es el caso de las comunidades acadmicas virtuales de TDi. En el presente trabajo, este
clasificador fue usado para predecir la valoracin de un contenido que no ha sido visualizado por
una comunidad.