Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
IBM
Produzione e vendita di Hardware mainframe midrange - UNIX e proprietari personal Sviluppo e ricerca Software di base Sviluppo e ricerca Software applicativo Societ di servizi e consulenza - la pi grande al mondo nel mondo dell'Informatica
Page 2
Page 3
Data Mining esce dalla fase visionari per entrare negli ambiti di produzione Lo sviluppo dell'Hardware diventa frenetico La disponibilit di HW potente di basso livello: rende obsoleti procedimenti legati ad ambienti di tipo host rende necessarie interfaccie semplici rende gradevoli visualizzazioni grafiche dei risultati
Page 4
Problemi - 1995
La disponibilit di tools diversi, sviluppati indipendentemente dai vari laboratori, permette di risolvere problemi complessi Lo sviluppo indipendente dei tools non permette di unificare i formati di controllo, di alimentazione dati e di memorizzazione dei risultati
Page 5
Risposta
Page 6
Page 8
Prediction
Back Propagation e Radial Basis Function
Serie Temporali
Page 10
Oggi
Page 12
Query Query Tools Tools Reporting Tools Tools Operational Operational Purchased Purchased Reporting Data Data Spreadsheets Data Data Spreadsheets File File Managers Managers
3m 3m
MultiMultidimensional dimensional Analysis Analysis OLAP Knowledge OLAP Knowledge Discovery Discovery
Extract, Extract, clean, clean, transform, transform, load load Web Web Transactions Transactions
Page 13
End-to-end integrated platform to develop & deploy custom analytic solutions Componentized architecture Shared Tooling & Metadata Shared Run-time Infrastructure New ETL Web-based embedded analytics Enhanced OLAP, Data Mining
ETL
Mining
OLAP
Disponibilit di tools per lesplorazione dei dati, per mostrare le statistiche e le distribuzioni dei dati.
Page 15
Segmentazione
Costruisce una vista della tabella iniziale con I seguenti campi aggiuntivi
- CLUSTERID, QUALITY, CONFIDENCE
Page 16
Page 17
Page 18
Page 19
Intelligent Miner Family Strategy Ingloba funzioni analitiche avanzate nellinterfaccia DB2/SQL permettendo applicazioni (DB2) che integrano funzioni di data mining Usa standard per linteroperabilit : SQL/MM API, PMML models Easy Mining procedure basate su DB2 facilemntte integrabili in applicazioni utenti e terze parti Supporto business partners con strumenti di sviluppo e APIs semplificate Execution Applicazioni DB2 sviluppate da Business Partners utilizzanti le APIs; MicroStrategy, Cognos, SAS, SPSS, a altre Easy Mining stato abilitat in un MS Excel add-in sample Nuovi algoritmi verranno inseriti nelle versioni future di IM
Page 20
Interactive flow editor: Stepwise execution All SQL operators can be reused in the mining context
to embedded applications
Page 21 Copyright IBM Corporation 2003
Page 22
Esempi applicativi
The IBM Center for Business Optimization tackles complex business and government problems, using IBM's industry expertise, advanced mathematical research, deep computing, sophisticated software, data analytics and optimization techniques to improve bottom-line performance and operational efficiency.
Page 24
Page 25
Page 26
CELM describes customer transition dynamics across value/loyalty states using advanced Stochastic Control algorithms
CELM models customer lifecycle dynamics (trajectories) and provides optimal campaign planning and scheduling over variable time horizons. In particular, it addresses the following question: what are the optimal targeting policies (i.e. sequences of actions) which maximize Customer Value & Loyalty over a given time horizon? IBM Zurich Research Laboratory:
Markov Chain Modeling produces the future state transition diagram if customers continue to be targeted as usual (using usual policies) (gray arrows in figure). Markov Decision Processes (MDP) Modeling produce optimal future targeting policies to maximize likelihood of customers moving to better value/loyalty states for a given time horizon (light blue arrows in figure)
Campaign E
Loyal Customer
Campaign A
Potentially Valuable
Campaign C
Repeater
One Timer Campaign B
Repeater
Defector
Repeater Defector
Bargain Hunter
Campaign D
Present
Future
Eero Ahola, Finnair Senior VP Strategy and Business Development reported in a N.Y. Times interview (Jan. 25th/04) the pilot results that Finnair has been able to achieve: Reduced marketing costs by 20% improved response rates by 10%
Page 27
Il progetto
Sviluppare un modello di analisi standard dei Clienti in portafoglio (di una compagnia assicurativa) affinabile nel tempo in grado di attribuire in via preventiva ad ogni Cliente una probabilit di abbandono della Compagnia, in modo da poter attivare piani di azione sistematici sui Clienti che la compagnia intende trattenere.
Page 29
La metodologia
Lapproccio prevede due tipi di analisi: una di tipo convenzionale, per la verifica delle correlazioni tra dati e evento abbandono del cliente, allo scopo di identificare e qualificare i Segnali Deboli dellavvenimento del fenomeno Cliente Perso una di tipo data mining, quindi concettualmente inferenziale, per la ricerca di profili di clientela e/o di eventi in funzione di correlazioni latenti e non prevedibili
Risulta critica la fase di preparazione dei dati, che comprende il trattamento dei missing values e degli outliers e la creazione di nuove variabili basate su tecniche di riduzione, trasformazione del contenuto informativo e eventuale sampling.
Page 30
Dati
Anagrafica Auto Vita R.E. Sinistri
Page 31
5% 1% 4% 3%
CLIENTI
21% 59%
VITA VITA + AUTO VITA + RAMI VARI 7% AUTO + RAMI VARI + VITA
Page 32
Segnali deboli
I segnali deboli che si ritiene opportuno tracciare sono i seguenti: periodo intercorso dallultima manifestazione di volont positiva (ultimo rinnovo,nuovo contratto per tipologia, variazione di polizza con variazione premio) numero di prodotti posseduti (numero di bisogni coperti) periodo intercorso da ultimo sinistro esistenza sinistri senza seguito e periodo intercorso da avvenimento sinistri liquidati segni di disaffezione (riscatto/riduzione/mancato rinnovo polizza auto) segni di difficolt economica (riscatto, riduzione,mancato pagamento di polizze esistenti; non si ritiene un segnale significativo la riduzione delle garanzie ARD nellauto essendo legate spesso ad una percezione del rischio legata allinvecchiamento dellautomezzo)
Page 33
Polizza Persa
tempo t1 tempo t2
Lav Positiva
tempo t1
tempo t2
Page 34
Lesistenza di almeno un contratto attivo al mese T-1 (mese antecedente) and un numero di contratti attivi al mese T pari a 0 and attualmente non ha nessun contratto attivo
Page 35
Page 36
Metodologie utilizzate
Alberi di Classificazione
Per avere un primo modello di predizione Per identificare le variabili pi significative
Modelli Predittivi
Per definire i modelli di predizione
VARIABILI CANDIDATE
STATISTICHE UNIVARIATE
ALBERI DI CLASS.
MODELLI PREDITTIVI
Page 37
Attivi Persi
Page 38