Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Abstract
Quali sono le linee guida che consentono di poter svolgere proficuamente unattivit di analisi
quantitativa orientata alle problematiche di business? Quali le caratteristiche e quali le competenze
necessarie per estrarre ricchezza informativa dai vasti e complessi database aziendali? In che misura una
corretta metodologia, supportata da unadeguata scatola degli attrezzi inserita in un ambiente software
dedicato e di facile accesso, possono portare consistenti vantaggi economici?
In termini generali, ci che distingue lattivit di Data Mining dallanalisi statistica comunemente intesa
non solamente la mole di dati su cui vengono effettuate le elaborazioni, cos come nemmeno la
disponibilit di un numero rilevante di tecniche, quanto lorientamento verso le
esigenze aziendali e la possibilit di operare in un ambiente predisposto per lintegrazione di contributi
tecnici e conoscenze di business: fare Data Mining significa seguire una metodologia che va dalla
definizione della problematica allimplementazione di regole decisionali economicamente misurabili.
Realizzare progetti di Data Mining significa anche organizzare un efficace team di lavoro tenuto conto
delle diverse risorse ed esigenze aziendali: quelle dei sistemi informativi, del marketing centrale e della
rete commerciale.
Nella presentazione verranno illustrati i presupposti e gli aspetti organizzativi di questa problematica, la
metodologia SEMMA e Enterprise Miner.
I dati a
decisionali.
supporto
dei
processi
Il Data Mining.
Il Data Mining un processo, non il mero
l'utilizzo di un algoritmo (Cabena, 1997).
SAS Institute definisce il Data Mining come il
processo di selezione, esplorazione, e
modellazione di grandi masse di dati per scoprire
relazioni non note allo scopo di ottenere un
vantaggio di business.
Unefficace attivit di Data Mining coinvolge tre
diverse figure in grado di interagire tra loro:
L'infrastruttura tecnologica
Gli strumenti di Data Mining
La metodologia SEMMA
La metodologia SEMMA.
L'infrastruttura tecnologica
I pi comuni riguardano:
La
metodologia
SEMMA
nellambito
dellattivit di Data Mining percorre le fasi
indicate nel precedente paragrafo:
Sample (Il campionamento): valgono le stesse
considerazioni esposte precedentemente.
Explore (Le analisi preliminari): l'esplorazione
dei dati serve per rilevare su quale sotto insieme
di attributi pi opportuno lavorare. La
visualizzazione grafica dei dati fornisce
strumenti intuitivi per professionisti del business,
mentre le tecniche statistiche di esplorazione
offrono informazioni aggiuntive per gli
specialisti.
Modify (Le analisi preliminari): le intuizioni
ottenute con l'esplorazione permettono agli
analisti di raggruppare e trasformare i dati per
ulteriori esplorazioni e analisi.
Model (La costruzione del modello): le diverse
tecniche di Data Mining: reti neuronali, modelli
basati su alberi e le tecniche statistiche vengono
utilizzate per scoprire relazioni all'interno dei
dati.
Assess (La scelta del modello): indica quali
modelli producono i risultati migliori o pi
appropriati. Vengono fornite anche indicazioni
su come i risultati devono comunicati al
management e sulla base di questa discussione
iterare nuovamente lintero processo.
Conclusioni.
Per fruire pienamente dei risultati del Data
Mining, questi devono essere presentati,
comunicati e condivisi con le aree aziendali che
ne trarranno i maggiori benefici. I risultati,
quindi, devono essere inseriti in un contesto di
"produzione" dove sia possibile misurarne la