Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TRANSACCIONES
Productos comprados por los clientes de un supermercado en los ltimos das:
transaccin 1
Nmero de transacciones = 9
2
TID 1 2 3 4 5 6 7 8 9
A 1 0 0 1 1 0 1 1 1
B C 1 0 1 0 1 1 1 0 0 1 1 1 0 1 1 1 1 1
D 0 1 0 1 0 0 0 0 0
E 1 0 0 0 0 0 0 1 0
TID 1 2 3 4 5 6 7 8 9
A 1 0 0 1 1 0 1 1 1
B C 1 0 1 0 1 1 1 0 0 1 1 1 0 1 1 1 1 1
D 0 1 0 1 0 0 0 0 0
E 1 0 0 0 0 0 0 1 0
Frecuencia D = 2
Frecuencia E = 2
DEFINICIONES Item: atributo=valor Usualmente los atributos son convertidos a binario por cada valor, ejemplo: producto= A es representado simplemente como A.
Itemset I: Subconjunto de posibles atributos o valores (items) Ejemplo: I = {A, B , E} (el orden no es importante) Transaccin: (TID, itemset) TID es el identificador de la transaccin.
6
REGLAS DE ASOCIACION
Reglas de Association : Si Itemset1 Itemset2
Itemset1 Itemset2= y Itemset2 . Si las transacciones de la base de datos incluyen Itemset1 entonces tambien incluyen a Itemset2. Ejemplos:
Un atributo objetivo. Varios atributos objetivo. Clases especficas en Aplicable en algunos todos los casos. casos. Medida: tasa de error Medida: Soporte, del clasificador. Confianza.
Nmero de transacciones=10
11
Confianza:
conf (manzanadulcera) = sop (manzanadulcera) / sop (manzanas)= 0.3 / 0.4 = 0.75 conf (manzana papa) = ? conf (manzana tomate) = ?
12
SOLUCION:
1. Generar reglas a partir de {A, B, E}. 2. Determinar el soporte y confianza de cada regla. 3. Evaluar reglas segn condicin.
14
15
16
Si B, E A sop=2/9 = 22%
18
PROBLEMA
Dado un conjunto de transacciones, generar todas las reglas de asociacion de tal forma que tenga un soporte y confianza menor a minsup y minconf respectivamente (estos valores son definidos por el analista).
19
20
ALGORITMO A PRIORI
Fue propuesto por Agrawal & Srikant en 1994. Idea: usar un itemset L de k atributos para generar un itemset de k+1 atributos.
Si {A,B} es un itemset frecuente entonces {A} y {B} son tambien itemsets frecuentes.
L con mayor
21
ALGORITMO A PRIORI
PASO 1: Generar todas los itemsets L con un elemento. Usar estos para generar los de 2 elementos, y asi sucesivamente. Se toman todos los posibles pares cuyo soporte sea mayor a minsup (permite ir eliminando posibles combinaciones ya que no todas se tienen que considerar).
22
ALGORITMO A PRIORI
PASO 2: Por cada itemset frecuente L encontrado Por cada subconjunto J de L Determinar todas las reglas de asociacin de la forma: Si L- J J Seleccionar aquellas cuya confianza sea mayor minconf
23
//---------- Clculo del soporte para cada candidato-----------for all transaccciones t D do begin Ct = subset (Ck, t) // candidatos en la transaccion t for all candidatos c Ct do c.cont++ // contador asociado a c end //----------------------------------------------------------------------------//---------------------------Evaluar--------------------------------------Lk = {c Ct | c.cont minsup} // condicin de soporte //----------------------------------------------------------------------------end
Return k Lk
24
minsop=1
C1
conj. atrib soporte
L1
conj. Atrib soporte
Explora D
2 3 3 1 3
1 2 1 2 3 2
Evaluar
2 3 3 3
{1 2} {1 3} {1 5} {2 3} {2 5} {3 5}
resultado
25
L2
C2
{1 3} {2 3} {2 5} {3 5}
2 2 3 2
Evaluar
{1 2} {1 3} {1 5} {2 3} {2 5} {3 5}
conj. atrib
Explora D
C3 itemset {2 3 5}
Explora D
L3 itemset sup {2 3 5} 2
GENERACION DE REGLAS
Reglas a partir de { 2, 3, 5}:
2 => 3, 5 2, 3 => 5 2, 5 => 3 3 => 2, 5 3, 5 => 2 5 => 2, 3
Que reglas son vlidas ? Suponiedo un nivel de confianza del 70% que reglas cumplen la condicin ?
26
(1)
Usando la data weather . Sirve para determinar si se puede jugar golf en una cancha dada unas condiciones climticas determinadas
27
(2)
28
(3)
maxsup 29
(4)
30
USANDO WEKA :
31
USANDO WEKA :
Generando reglas con soporte > 1 y confianza 100%
Regla de Asociacin 1 2 3 4 ... 58 Humidity=Normal Windy=False Temperature=Cool Outlook=Overcast Temperature=Cold Play=Yes ... Outlook=Sunny Temperature=Hot Play=Yes Humidity=Normal Play=Yes Humidity=Normal ... Humidity=High
Sop. 4 4 4 3 ... 2
OTROS ALGORITMOS
Mejoras del Algoritmo A Priori: Algoritmo AprioriTid Algoritmo AprioriHybrid
33
APLICACIONES
Supermercados Ventas Biologia Deteccin de trafico en la red Medicina
34