Sei sulla pagina 1di 64

20149: Metodi Quantitativi per il Management - lezione 1

Struttura della lezione


Struttura del corso, approccio didattico e testi Valutazione e scadenze Parte I: Statistica Manageriale Usare i dati nel management Perch? Dati e fonti Il CD allegato al testo, la macro KStat e le statistiche descrittive di base

Struttura del corso


Contenuti Parte I: Statistica manageriale Introduzione, ripasso di statistica Regressione lineare e non lineare Cenni allanalisi delle serie storiche Parte II: Modelli matematici per il management decisionmaking Modelli e problemi di decision analysis Fondamenti di ottimizzazione

Testi
Parte I: Klibanoff, P., Sandroni, A., Moselle, B. and Saraniti, B., Statistica per Manager, EGEA, 2010. Parte II: Dispense preparate dai docenti. Lucidi, learning space

Approccio didattico
Metodi quantitativi case-based. Discussione di casi. Uso di Excel Nei giorni delle esercitazioni al computer You are welcome to bring your own laptop

Valutazione e scadenze
Tutte le informazioni sono dettagliate nel syllabus disponibile sulla pagina e-learning del corso.

Parte I Statistica manageriale

Perch?
Essere in grado di utilizzare alcuni strumenti statistici nel management (anche uso maturo di Excel) Essere in grado di comprendere meglio ci che si pu/non si pu fare, cogliere le necessit e comprendere meglio risultati di consulenze, tecnici, ecc. Comprendere meglio la stampa (soprattutto specializzata) e la ricerca

Dati e fonti
Vi sono diverse fonti, gi a disposizione oppure da raccogliere ad hoc. Spesso occorre analizzare la disponibilit effettiva e la necessit di raccogliere nuovi dati

Quali?

Lapproccio progettuale: quali dati?


I dati che si possono utilizzare per lanalisi sono riconducibili a due categorie. Dati Interni:
gi esistenti: nessun costo, ben conosciuti, sotto controllo, facilmente aggiornabili, non sempre esaustivi raccolti ad hoc: a volte costosi, sotto controllo, facilmente aggiornabili, necessitano di tempi dattesa la prima volta

Dati Esterni:
gi esistenti: poco costosi, non completamente sotto controllo, aggiornabili secondo intervalli di tempo non governati raccolti ad hoc: molto costosi, mirati al raggiungimento di uno scopo informativo, non aggiornabili se non ripetendo la ricerca, necessit di risorse esterne

10

Lapproccio progettuale: dati e fonti

Sperimentali

Osservazionali

Micro

Macro
11

Dati sperimentali
Si costruisce un esperimento per manipolare sotto il proprio controllo diretto una variabile Approccio particolarmente diffuso in medicina. Tipico esempio di variabile nel management: packaging dei prodotti. Qual il packaging pi efficace? Disegno sperimentale: lassegnazione del valore della variabile casuale (es. attraverso lestrazione di un numero casuale)

12

Dati sperimentali
Es. Google e Yahoo! Qual il formato ottimale della pagina iniziale? Es. Qual la collocazione ideale della finestra di ricerca? Qual la lunghezza ideale degli ads? Dato il numero elevatissimo di contatti ai siti, relativamente semplice condurre esperimenti su configurazioni diverse assegnando casualmente a utenti diversi configurazioni diverse, con una risposta quasi immediata (clicks)

13

Dati sperimentali

14

Dati osservazionali
Non possiamo controllare direttamente le variabili oggetto di indagine In alcuni casi sono effettivamente dati (lammontare di informazioni raccolto non modificabile) In altri casi possiamo decidere le informazioni da raccogliere (quali variabili) tra quelle esistenti o possibili In altri casi ancora dobbiamo decidere se raccogliere i dati (e dunque anche quali)

15

Dati osservazionali
Dati micro (dati raccolti su unit simili a quelle che mi interessano) Singoli lavoratori Singole imprese Singoli prodotti Singoli studenti Tipologia Dati esaustivi o censuari (es. Sistema informativo aziendale completo, censimento) Dati campionari raccolte informazioni su un campione della popolazione (es. pezzi nel processo produttivo, individui e/o famiglie)

16

Dati osservazionali

Osservazionali

Micro

Esaustivi

Campionari
17

Indagini campionarie (sondaggi)


Particolare tipo di raccolta di dati osservazionali campionari. Tipicamente mediante questionario
Self-administered interview. Questionario da compilare individualmente, senza aiuto di un intervistatore Classica (PAPI: Paper Aided Personal Interviewing): questionario su carta somministrato di persona da un intervistatore a un intervistato CAPI: Computer Aided Personal Interviewing: questionario su computer somministrato di persona da un intervistatore a un intervistato CATI: Computer Aided Telephone Interviewing: questionario su computer somministrato telefonicamente da un intervistatore a un intervistato

18

Indagini campionarie (sondaggi)


Particolare tipo di raccolta di dati osservazionali campionari. Tipicamente mediante questionario CAWI: Computer Aided Web Interviewing: questionario da compilare via web In Italia sondaggi al pubblico regolati da AGCOM (Autorit per le Garanzie nelle Comunicazioni): http://www.agcom.it/sondaggi/sondaggi_index.htm Informazioni su web per singoli sondaggi

19

Indagini campionarie (sondaggi)

20

Indagini campionarie (sondaggi)

21

Indagini campionarie (sondaggi)

22

Indagini campionarie (sondaggi)

23

Dati osservazionali macro


Informazioni su unit cui non si riconoscono (tipicamente) caratteristiche decisionali: ad es. paesi

24

Lapproccio progettuale: dati e fonti


Altra classificazione (temporale) Tempo cruciale per illuminare su relazioni causaeffetto (pietra miliare ad es. nellevidence-based management) Dati sezionali (su un solo istante del tempo, su pi soggetti) Serie storiche (tipicamente su un soggetto o un numero basso di soggetti, in pi istanti del tempo) Longitudinali (su molti soggetti, pi istanti del tempo)

25

CD Allegato
Useremo un approccio computer intensive. Uso di dataset Focus su Excel

26

La macro Excel KStat


Nel CD allegato al volume KSMS trovate: Dati relativi agli esempi per ciascun capitolo e per i casi allegati Una macro Excel appositamente scritta (che potete conservare anche dopo): KStat (sviluppata originariamente alla Kellogg School of Management

N.B.: impostare il punto . come separatore dei decimali

27

La macro Excel KStat

28

La macro Excel KStat


Occorre consentire lattivazione delle macro

29

La macro Excel KStat


La prima riga contiene il NOME (Etichetta) delle variabili. Le righe successive i dati (formato standard: CASIxVARIABILI) Si possono copiare e incollare i dati, oppure importarli (Statistics Import data File) Es. da Chapter 1 copiare e incollare EESample.xls Possiamo ottenere le statistiche descrittive standard con Statistics Univariate Statistics Di default le otteniamo per tutte le variabili presenti nel dataset

30

La macro Excel KStat

31

Capitolo 1

32

Double E
EE una delle pi grandi catene di negozi che vendono elettronica al dettaglio negli USA EE ha il sospetto che le principali ragioni per il calo dei profitti siano la diminuita qualit dei servizi e lincremento della competizione Useremo la probabilit per capire e cercare di porre rimedio ai problemi della EE

33

Distribuzioni di probabilit

Diverse variabili con cui la EE ha a che fare sono quantit che fluttuano Vendite Prodotti resi Prodotti acquistati da un cliente Tempo speso da un commesso con un cliente Ecc Un modo per riassumere queste fluttuazioni utilizzare una distribuzione di probabilit

34

Distribuzioni di probabilit

Una distribuzione di probabilit ci permette di calcolare la probabilit che una variabile assuma valori in un determinato intervallo

Esempi: La probabilit che le vendite siano tra 10000 e 50000 La probabilit che un cliente acquisti 2 prodotti

35

Distribuzioni di probabilit: tipi


Le distribuzioni di probabilit possono essere: Discrete: assumono solo determinati valori Continue: assumono tutti i valori possibili in un determinato intervallo Esempi: Il numero di prodotti che un cliente acquista (0,1,2,3,..) segue una distribuzione di probabilit discreta Le vendite giornaliere di EE seguono una distribuzione di probabilit continua (tutti i valori possibili non inferiori a 0)

36

Distribuzioni continue
Questarea rappresenta la probabilit che le vendite giornaliere siano comprese tra 20,000 e 30,000 $

37

Caratteristiche importanti delle distribuzioni


Media: Valor medio o valore atteso di una distribuzione. Solitamente indicato con Varianza: Misura di dispersione (e volatilit). Solitamente indicata con 2 Deviazione Standard o Standard deviation: misura di dispersione (e volatilit), radice quadrata della varianza Solitamente indicata con

38

Proporzioni
Alcune variabili possono assumere solo due valori Impiegato Maschio/Femmina Votanti Approvano/Respingono Cliente compra qualcosa/non compra nulla

La proporzione di clienti che acquistano qualcosa dopo essere entrati in negozio ha caratteristiche specifiche

39

Proporzioni

Se 45 clienti su 100 acquistano almeno un prodotto Diciamo che p = 0.45 la proporzione di clienti che acquistano almeno un prodotto Si tratta sempre della media, ma quando la variabile di partenza assume solo due valori, si chiama solitamente proporzione Distribuzione di probabilit Bernoulli: se una variabile ha una proporzione pari a p si pu mostrare che la sua varianza p(1-p), e la sua standard deviation dunque

p(1 p)

40

Distribuzione Normale

La distribuzione forse pi comune in statistica la Normale Vi sono infinite distribuzioni Normali, al variare di due parametri: La media La deviazione standard (o la varianza) La Normale Standardizzata ha una media nulla e una deviazione standard pari a 1

41

La distribuzione normale
N.b. larea sottesa alla curva (funzione di densit) pari a 1 per tutte le distribuzioni di probabilit

42

Simmetria della Normale


Larea di questa met 0.50 Anche questa

43

Tre distribuzioni normali


=0 =1 =1 =1

=0 =2

-4

-3

-2

-1

4
44

Il numero di prodotti per cliente


Approssimativamente, una Normale con =10, =4 (idea: valori minori di zero hanno probabilit bassissima)
0.12 0.1 0.08 0.06 0.04 0.02

Probabilit che il numero medio di prodotti sia maggiore di 14

A
0 -5 0 5 10 15 20 25

Scrivere =1-normdist(14,10,4,true) in Excel restituisce la probabilit (nella versione italiana =1-distrib.norm(14,10,4,vero))

45

Uso di Excel
Insert >>Function>>NORMDIST

46

Uso di Excel (versione italiana)


Inserisci >>Funzione>>DISTRIB.NORM

47

Uso di Excel (continua)


La funzione fornisce larea a SINISTRA (distribuzione cumulata o funzione di ripartizione) del valore inserito come X Nel nostro caso (X=14) larea pari 0.841 Vogliamo misurare A, larea a DESTRA di X Quindi (poich larea complessiva pari a 1), A =1 - 0.841 ovvero A = 0.159

48

Distribuzione Normale cumulata inversa


Una Normale con =10, =4

0.12 0.1 0.08 0.06 0.04 0.02


Area= 0.3

0 0

Per quale x ho unarea alla sinistra di x pari a 0.3? Usare la funzione NORMINV (INV.NORM)
49

NORMINV

Insert >> Function >> NORMINV

50

INV.NORM

Inserisci >> Funzione >> INV.NORM


51

Distribuzione Normale Cumulata Inversa


Una Normale con =10, =4
0.12 0.1 0.08 0.06 0.04 0.02 0 0

Area = 0.3 7.902

Larea alla sinistra equivale a 0.30 per x=7.902 il 30% dei clienti meno importanti (redditivi) acquista un numero di prodotti minore o uguale a 7.902
52

Normale Standardizzata
=0 =1

Se X una Normale, z = (X- )/ la Normale Standardizzata

La Normale Standardizzata (=0 e =1) ha un ruolo centrale nella statistica applicata. Ogni Normale pu essere trasformata, sottraendo la media e dividendo per la deviazione standard, in una Normale Standardizzata
53

Uso di Excel

Vi sono funzioni Excel simili alle precedenti per la Normale Standardizzata ovviamente non necessario specificare media e deviazione standard. In alternativa si possono usare le funzioni precedenti specificando ( =0, =1) Le funzioni dirette sono:
NORMSDIST(z) -- in ITA: DISTRIB.NORM.ST(z) NORMSINV(prob) -- in ITA: INV.NORM.ST(prob)

54

Normale Standardizzata in Excel

Area alla sinistra di -0.75 per una Normale Standardizzata

55

Normale Standardizzata in Excel

Area alla sinistra di -0.75 per una Normale Standardizzata

56

Normale Standardizzata Inversa in Excel

Valore di z per cui la probabilit alla sinistra di z pari a.2266

57

Normale Standardizzata Inversa in Excel

Valore di z per cui la probabilit alla sinistra di z pari a.2266

58

La distribuzione t

Unaltra distribuzione fondamentale per lanalisi dei dati la t di Student (in realt una famiglia di distribuzioni) Somiglia alla Normale Standardizzata: simmetrica ma ha code (alla sinistra e alla destra) pi spesse La distribuzione t ha un parametro chiamato numero gradi di libert (g.l., in inglese number of degrees of freedom o d.f.) Allaumentare dei gradi di libert la distribuzione t tende alla Normale Standard

59

Distribuzioni t al variare dei g.l. (d.f.)

60

Excel: La distribuzione t

Funzione TDIST con tre input


X (vogliamo trovare larea alla DESTRA di X) Deg_freedom Tails (1 trova larea alla DESTRA di X, 2 trova il doppio di tale area)

X devessere positivo
61

Excel: La distribuzione t

62

Excel: La distribuzione t inversa

Funzione TINV con due input


Probability Deg_freedom

Restituisce il valore t che lascia alla propria DESTRA met della probabilit richiesta, quando i gradi di libert sono quelli specificati
63

Excel: La distribuzione t inversa

64