Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
OBIETTIVI
Lorenzo Sarti
Sfruttare il patrimonio dei dati operativi per estrarre le informazioni utili nel processo decisionale i f i i tili l d i i l Superare i limiti dei primi strumenti di supporto alle decisioni
Reporting tra livelli aziendali
Staticit e lentezza difficolt e pesantezza delliter di realizzazione
Fogli di calcolo
scarsa controllabilit dei dati e di come sono stati importati proliferazione di fogli di calcolo personali non possono trattare grandi quantit di informazione
2
SISTEMA INFORMAZIONALE
Lorenzo Sarti
TERMINOLOGIA
Lorenzo Sarti
Data Mining
Strumenti e tecniche per lestrarre informazioni nascoste dai dati
Business Intelligence
Attivit di estrazione di informazione dai dati di business generati dai processi operativi aziendali
Knowledge Management
Trattamento informatizzato della conoscenza aziendale in senso ampio (anche da basi di dati non strutturate)
5
Finalit
Fornire il substrato informativo per la conoscenza dellazienda dell azienda Descrivere il passato, aiutare ad identificare i problemi Suggerire i cambiamenti da apportare, fornire anticipazioni su scenari futuri
Struttura
Dati articolati intorno a soggetti di cui si vuol conoscere lapporto alla vita aziendale
Utenza
Decisori, manager con visione e conoscenza ampia dellazienda
richiedono strumenti di uso intuitivo che li seguano nei processi decisionali
6
Storicit Arco temporale coperto molto pi esteso di quello operazionale. Pu arrivare anche a 10 anni Mantenimento delle informazioni sullevoluzione storica dei soggetti di interesse Dettaglio o Granularit Disponibilit di livelli diversi di aggregazione Il grado minimo di aggregazione dei dati nel data warehouse corrisponde ad un fatto elementare
la granularit del data warehouse minima quando ogni fatto corrisponde ad un solo evento origine Pi comunemente ha gi un certo livello di aggregazione.
Esempio, attivit di acquisto di un oggetto da parte di un cliente su un giorno 7
Multidimensionalit
Accesso alle i f A ll informazioni tramite ennuple di coordinate i i i l di Sistemi informazionali hanno di solito alta dimensionalit se confrontati con i sistemi operazionali
Accesso
Accesso interattivo in sola lettura Aggiornamenti dei dati sporadici Aggiornamenti fatti solo in momenti in cui lattivit interattiva nulla
Temporalit
Accessibilit
Grado di facilit duso e velocit di risposta
Flessibilit e sintesi
Capacit del modello di assecondare lutente nellarticolare richieste, aggregare dati e mettere in relazione misure secondo criteri di selezione non prefissati
Completezza
Capacit del sistema informazionale di rappresentare tutti gli eventi importanti per le analisi
Si riferisce sia al modello sia alle istanze dei dati memorizzati
Il processo di analisi centrato sui soggetti Descrizione e confronto di soggetti attraverso l misura D i i f t tti tt la i degli eventi cui questi partecipano
un evento pu essere in relazione con diversi soggetti un soggetto pu partecipare a pi eventi
Spazio delle informazioni come insieme di matrici multidimensionali Ogni matrice rappresenta un tipo di evento Ogni l O i elemento della matrice rappresenta un singolo evento t d ll t i t i l t descritto da un insieme di coordinate Ogni coordinata rappresenta un soggetto per le analisi da condurre su quella tipologia di evento
10
11
Data cube
con gli assi si indicano le istanze delle dimensioni le celle contengono la misura del fatto
L Luogo
Maggio Aprile Febbraio Gennaio Milano Roma Siena Firenze
Quantit
Quantit(Luogo,Categoria,Periodo)
Radio
12
FATTI
Lorenzo Sarti
Fatto Evento che accade nell ambito dell attivit e che si ha interesse a nellambito dellattivit misurare (es.: le vendite, i reclami, le spedizioni) Caratteristiche del fatto Dimensioni che lo collocano nel tempo e nello spazio aziendale. Spesso ha gi un certo livello di aggregazione.
Esempio, attivit di acquisto di un oggetto da parte di un cliente su un giorno
Misure che lo quantificano Informazioni descrittive Identificazione univoca d l f Id ifi i i del fatto e d ll misure tramite lennupla di delle i i l l coordinate Fatto : (dimensione1, ... dimensioneN) Misura: (dimensione1, dimensioneN).Misura
13
MISURE
Lorenzo Sarti
Misura Caratteristica numerica del fatto che ne descrive aspetti quantitativi rilevanti per lanalisi Ogni fatto pu avere pi misure Esempio vendita: numero elementi venduti e valore totale della vendita Le misure possono essere Effettive, memorizzate sulla base di dati Calcolate run-time utilizzando i valori delle misure effettive Implicite, indicano la presenza (o lassenza) di un fatto
14
AGGREGABILIT
Lorenzo Sarti
Dai fatti elementari si possono derivare fatti sintetici, quando non si considerano una o pi coordinate Le misure dei fatti sintetici sono ottenute aggregando le misure dei fatti elementari tramite opportuni operatori Somma, media, max, min, ecc. Per ogni coppia (misura, dimensione) possono essere definiti operatori di aggregazione diversi Una misura pu essere non aggregabile lungo una dimensione U ope ato e Un operatore pu essere utilizzato per aggregare lungo alcune esse e ut ato pe agg ega e u go a cu e dimensioni e non lungo altre
15
AGGREGABILIT
Lorenzo Sarti
Aggregabilit Possibilit P ibili di usare un operatore di aggregazione su una i misura Operatore Somma di solito il default Additivit Possibilit di usare loperatore di aggregazione Somma su una misura
16
AGGREGABILIT: ESEMPIO
Lorenzo Sarti
Articolo PP1007015 PP1007015 VA1010 Pannello di Polistirolo 100x70x1,5 Pannello di Polistirolo 100x70x1,5 Vite in acciaio 10mmx1 PP1007015 PP1007015 VA1010 Pannello di Polistirolo 100x70x1,5 Pannello di Polistirolo 100x70x1,5 Vite in acciaio 10mmx1
24002
110 0 23870
La misura Giacenza
Additiva rispetto alla dimensione deposito Non additiva rispetto alla dimensione tempo Non aggregabile rispetto alla dimensione Articolo
17
Di alcuni fatti lunica cosa che interessa misurare che si siano verificati i i ifi ti
Valutazione della presenza Valutazione della frequenza
Conteggio 3 2 0
Operatori booleani
Presenza = True Assenza = False
18
DIMENSIONI
Lorenzo Sarti
Dimensione
Soggetto a cui si vuole rapportare i fatti di analisi
19
GERARCHIE
Lorenzo Sarti
Gerarchia
Insieme di attributi ( tt ib ti dimensionali) collegati I i tt ib ti (attributi di i li) ll ti gerarchicamente ad una dimensione
Lanalisi dei fatti di un cubo pu essere condotta attraverso viste che utilizzano attributi dimensionali
20
10
GERARCHIE: ESEMPIO
Lorenzo Sarti Sistemi Informativi per la Gestione Aziend dale - 2009/2010
21
Data warehouse
Magazzino unico, completo e consistente unico dellinformazione aziendale Contiene dati articolati attorno a tutti i fatti di interesse aziendale (tutti i possibili ipercubi) Pu raggiungere dimensioni estremamente elevate
22
11
Data mart: Data warehouse tematico, derivato dal data warehouse aziendale
Comprende i soli fatti che riguardano una certa area dindagine Estensione temporale ridotta Granularit dei fatti minore
Data Warehouse
DM Qualit
DM Personale
DM Vendite
12