Sei sulla pagina 1di 4

SCHEMA STATISTICA ECONOMICA

LEZIONE 1

 Definizione Business Intelligence


 I 4 strumenti di BI

 Data mining – definizione (3 punti principali: processo, fine e


scopo)

 Linea di evoluzione degli strumenti di BI (criteri della linea)

 Data mining//statistica applicata (3)

 Fasi processo di data mining (7 – DOASEVI)

 Applicazioni (5)

 Ambiti/settori in cui si è diffuso

LEZIONE 2

 Organizzazione dei dati – creazione database valido


 3 esempi di database

 Data warehouse (4 caratteristiche)


Trasformazione

 Data mart
Archivio – gestione rapporti
Estrazione

 Classificazione dei dati

 Tipologia di variabili

 Matrice dei dati

 Principali strumenti analisi esplorativa univariata


Rappresentazioni + indici

 Indice di variabilità

 Indice di eterogeneità – situazioni

 Analisi esplorativa bivariata


Caso generale
Variabili quantitative

LEZIONE 3-4

 Definizione R (3)

LEZIONE 6
 Modelli locali
Esempi

 Mba – obiettivo
Cosa fa

 Obiettivo —> presupposti

 Odds ratio
Intervallo

 Regole associative (3)


Forma
Associazione – misure

 Algoritmo a priori (soglia t)


Fasi (6)

 Valutazione regole associative (regole compl-odds)

LEZIONE 8-9

 Regole sequenziali (6)

LEZIONE 10

 Cluster analysis – definizione, obiettivo


Campi in cui si è diffusa

 Idea alla base


Compiti ricercatore (3 regole procedura senso)
Classificazione vera/falsa?

 Proprietà distanza (4)

 Matrice delle distanze

 Distanza euclidea: definizione, limite (influenza da singola


differenza elevata), soluzione

 Indici di similarità proprietà (3)


Esempi (3)

 Scelte per fare una cluster analysis (4)vmiv

 Dendogramma
Tipi di metodi (2)

 Fasi algoritmo agglomerativo (5)

 Scopo definire dissimilaritá gruppi:


Metodi basati sulla matrice delle distanze (3) legami
Metodi basati anche sulla matrice dei dati (2)

 Misure bontà di classificazione scomposizione T


 Algoritmo metodi NON gerarchici
Fasi (3)

 Algoritmo delle k-medie (3) semi distanza ripeto

LEZIONE 11

 Silhouette analysis

LEZIONE 13

 Assunzioni modelli lineari vs modelli lineari generalizzati (3)

 Componenti GLM (3)

 Modello di regressione logistica


Applicazioni

 Obiettivi (2) individuare e stimare

 Variabile dipendente dicotomica

 Distribuzione di Bernoulli

 Come far dipendere pigreco (probabilità)dalle variabili


indipendenti (x) – funzione prenditore lineare

 Trasformazione modello – fasi (2)

 Effetti sulla probabilità di successo (2)

 Metodo stima dei coefficienti

 Test di ipotesi

 Bontà di adattamento

LEZIONE 15

 Alberi decisionali
Classe – tipologie – procedura

 Procedura
 Output

 Vantaggi (2)
 Svantaggi (2)

 Confronto cluster (3)

 Algoritmi diversi

 Impurità
Alberi di regressione
Alberi di classificazione (3)
 Valutazione albero

 Potatura

 Critica

 Metodo cross validation

LEZIONE 17-18

 Curva ROC

 Matrice di confusione

 VP VN FP FN

 Performance curva