Data Mining
*
www.unibo.it
Analisi delle associazioni
(Association Rules AR)
Introduzione
Punto di partenza
• Data base di transizioni (comportamenti)
• Prodotto acquistato: Item
• Insieme di item: itemset
• Ciascuna transazione è una lista di item quindi Itemset
contenente un certo numero di item
Obiettivo:
• Tutte le regole che metteno in relazione la presenza di un
insieme di item con la presenza di un altro insieme di item
Item
biscotti, cereali, frutta, latte,…
Itemset
{latte}, {latte, frutta}…
1-itemset {latte}
2-itemset {latte, frutta}
3-itemset {latte, frutta, biscotti}
insieme di comportamenti:
transazioni d’acquisto
Riepilogo
Terminologia
Frequenza dell’itemset I =
Numero di volte in cui si presenta I I numero delle transazioni
Esempio
Punto di partenza
• Data base di transizioni (comportameni)
• Ciascuna transazione è una lista di item acquistati
Obiettivo:
• Tutte le regole che metteno in relazione la presenza di un
insieme di item (itemset) con la presenza di un altro insieme di
item
Support
Confidence
Support e confidence
Esempio
Transazione Item
1 a,b,c
2 a,c
3 a,d
4 b,e,f
Support e confidence
Scegliamo per support e confident dei valori soglia
min_sup min_conf
(min_sup=0,5)
Generazione di regole a partire da
frequent itemsets
Se
una regola R1 ha confidence insufficiente
conf(R1) <min_conf
Allora
Tutte le regole che hanno come antecedente un subset
dell’antecedente di R1 hanno
confidence <min_conf
Esempio
R2: {c d} =>{a b}
conf(R2)=supp( {a b c d}/sup({c d})
Conf(R2)<min_conf
Esempio
Qualità di una regola
Misura simmetrica
Un esempio
Analisi multidimensionale
Analisi multidimensionale
Legame tra AR e AR multidimensionale
Pro e contro
Analisi delle associazioni
Come esempio…