Sei sulla pagina 1di 23

Corsi di Laurea Triennali di

Economia

INFORMAZIONI GENERALI STRUTTURA DEL CORSO

Prof.ssa Roberta Paroli

ORARIO DEL CORSO:


lun. 15.3015.30-18.30 - aula Manzoni (G022) giov. 13.3013.30-15.30 - aula Manzoni (G022)

Corso di STATISTICA I

(gruppo A-Cl)

a.a. 2009/2010
Statistica I - a.a.2009/10 - Prof. Paroli

ESERCITAZIONI: dott.ssa Marta Nai Ruscone ????????

Statistica I - a.a.2009/10 - Prof. Paroli

RICEVIMENTO MARTEDI 10:30 12:30 Dipartimento di Scienze Statistiche via Necchi 9 I piano e-mail: roberta.paroli@unicatt.it

TESTI Gli appunti di lezioni ed esercitazioni sono fondamentali


Il materiale delle lezioni disponibile su Blackboard.
TEORIA Frosini B.V. (2001) Metodi Statistici: teoria e applicazioni economiche e

sociali, Carocci, Roma


Santamaria L. (2006) Statistica descrittiva: applicazioni di carattere economico e aziendale, Vita e Pensiero Pacini B. e Raggi M. (2006) Statistica per lanalisi operativa dei dati Carocci, Roma
3
Statistica I - a.a.2009/10 - Prof. Paroli

aula virtuale: www.unicatt.it/docenti/paroli


Statistica I - a.a.2009/10 - Prof. Paroli

ESAME
ESERCIZI

solo i testi

ESAME: ESAME: scritto esercizi di calcolo e teorici


orale domande di teoria Durata della prova: 1h 30

Sono scaricabili da Blackboard:

I testi desame degli a.a. 2008/2009 - 2007/2008 2006/2007 - 2005/2006 2004/2005 - 2003/2004 2002/2003 - 2001/2002 2000/2001 con soluzioni per gli a.a. 2001/2002 a.a. 2002/2003 a.a. 2003/2004
Statistica I - a.a.2009/10 - Prof. Paroli

estese

con soluzioni sintetiche per gli a.a. 2000/2001 a.a. 2004/2005 a.a. 2005/2006 a.a. 2006/2007
5

Sono previste le prove intermedie


Ammissione alle prove intermedie: Le prove intermedie sono pensate per chi partecipa assiduamente alle lezioni, essendo riferite principalmente agli argomenti trattati in aula nellanno in corso. Pertanto si rivolgono generalmente ai frequentanti. Ove la didattica del corso lo consenta, ne pu essere prevista lestensione anche ad altre tipologie di studenti. La prova intermedia facoltativa per lo studente.
Statistica I - a.a.2009/10 - Prof. Paroli

PROVE INTERMEDIE
I prova: nella settimana delle prove intermedie Programma: statistica univariata/bivariata Durata: 1 ora o 45min
La prova consister di esercizi in parte di calcolo e in parte teorici. Lesito sar comunicato entro Natale 2009.

TRASFERIMENTO GRUPPO

II prova: in uno degli appelli della sessione invernale Programma: statistica bivariata e probabilit Durata: 1 ora o 45min

Non prevista la possibilit di effettuare alcun cambio corso (gruppo di lettere / professore) e non valgono i cambi corso effettuati gli anni scorsi

Alla II prova potr accedere solo chi avr ottenuto esito positivo nella I prova intermedia. La prova consister di esercizi in parte di calcolo e in parte teorici. Prova orale: obbligatoria per tutti
Statistica I - a.a.2009/10 - Prof. Paroli

Ciascuno pu pero frequentare le lezioni con il docente preferito ma dovr obbligatoriamente sostenere lesame con il docente del suo gruppo di lettere (anche se non quello preferito!!!!!)
7
Statistica I - a.a.2009/10 - Prof. Paroli

LE MAIL AL DOCENTE - La buona educazione vorrebbe che si salutasse il docente (meglio buongiorno o buonasera; salve Prof. non molto gradito)
- Indicare sempre nome, cognome, matricola e linsegnamento (ogni docente tiene pi di un corso e non conosce tutti gli studenti per nome non siamo al liceo). - Scrivere in italiano, usando la punteggiatura. Rileggere la mail per verificare che non ci siano errori di grammatica ( vero che la mail vi d anonimato, ma se lerrore molto grave .ci ricordiamo di voi!) - Non correggiamo esercizi via mail, dunque non rispondiamo alle mail che lo richiedono - Non chiedeteci via mail le aule dellesame (scritto o orale), perch anche noi le scopriamo guardando la bacheca on-line.
Statistica I - a.a.2009/10 - Prof. Paroli

COME SI STUDIA STATISTICA???

1) Frequentare le lezioni e le esercitazioni non OBBLIGATORIO ma sicuramente utile 2) Studiare sempre prima la TEORIA e, solo dopo averla capita, fare gli esercizi. Fare il viceversa non d gli stessi risultati. 3) Ripetere a voce alta pensando di dovere spiegare a qualcuno quello che studiate. Dovete essere convinti di quello che dite pensate a quando lavorerete! 4) Studiare volta per volta. Questo vi far capire meglio i nuovi argomenti 5) Fare domande quando non si capisce (il ricevimento studenti da sfruttare non solo la settimana prima degli esami!)

Statistica I - a.a.2009/10 - Prof. Paroli

10

COSA E LA STATISTICA???

FRASI CELEBRI ..

INTRODUZIONE

Se si muove biologia, se cambia colore chimica, se si rompe fisica, se ti fa dormire statistica (Bob Hogg - Universit Iowa)

Statistica I - a.a.2009/10 - Prof. Paroli

11

Statistica I - a.a.2009/10 - Prof. Paroli

12

e nei fumetti
Ci sono tre generi di bugie: le piccole, le grandi e le statistiche (Mark Twain)

Tortura abbastanza a lungo i dati ed essi confesseranno qualunque cosa

Statistica I - a.a.2009/10 - Prof. Paroli

13

Statistica I - a.a.2009/10 - Prof. Paroli

14

Statistica I - a.a.2009/10 - Prof. Paroli

15

Statistica I - a.a.2009/10 - Prof. Paroli

16

Pi seriamente.. cosa la STATISTICA ?????


Un insieme di strumenti logici e matematicoprobabilistici per la misura e il trattamento di insiemi di informazioni configurabili come fenomeni di massa (grandi quantit di dati). La sua conoscenza non solo cruciale in ambito scientifico, ma fondamentale nella gestione aziendale e di non trascurabile importanza nella vita quotidiana. Uno strumento di supporto nei processi decisionali (specie in quelle situazioni in cui si devono prendere decisioni in condizione di incertezza grazie allapporto decisivo della teoria della probabilit).
Statistica I - a.a.2009/10 - Prof. Paroli

La STATISTICA si pu utilizzare in contesti molto differenti: 17

per studiare landamento di un titolo di borsa per controllare la qualit di un processo produttivo per monitorare le vendite di un negozio per misurare la soddisfazione dei clienti per effettuare confronti (ad es. tra due squadre di calcio) per leggere i risultati delle analisi mediche per le analisi demografiche

Statistica I - a.a.2009/10 - Prof. Paroli

Vediamo alcuni esempi

18

statistica ed inquinamento
A quanto ammonta il livello giornaliero degli inquinanti dellaria? Varia nel tempo?

statistica ed economia
Come si misura linflazione???

L'inflazione un processo di aumento del livello generale dei prezzi dell'insieme dei beni e servizi destinati al consumo delle famiglie. Generalmente, si misura attraverso la costruzione di un indice dei prezzi al consumo.
Un indice dei prezzi al consumo uno strumento statistico che misura le variazioni nel tempo dei prezzi di un insieme di beni e servizi, chiamato paniere, rappresentativo degli effettivi consumi delle famiglie in uno specifico anno. In Italia, come nella maggior parte dei paesi, il calcolo dell'indice affidato all'Istituto nazionale di statistica (ISTAT). In particolare, l'Istat produce tre diversi indici dei prezzi al consumo: per l'intera collettivit nazionale (NIC), per le famiglie di operai e impiegati (FOI) e l'indice armonizzato europeo (IPCA).

PM 10 viaVico/Olivetani (Zona1) S. Ambrogio

Statistica I - a.a.2009/10 - Prof. Paroli

19

Statistica I - a.a.2009/10 - Prof. Paroli

20

Indice dei prezzi al consumo FOI


Per adeguare periodicamente i valori monetari, ad esempio gli affitti o gli assegni dovuti al coniuge separato, si utilizza l'indice dei prezzi FOI.

statistica e popolazione
Ad esempio d informazioni sulla natalit.

Indice generale Variazione percentuale rispetto al mese precedente Variazione percentuale rispetto allo stesso mese dell'anno precedente Variazione percentuale rispetto allo stesso mese di due anni precedenti
Periodo di riferimento: agosto 2008 Aggiornato il 15 settembre 2008
Statistica I - a.a.2009/10 - Prof. Paroli

135,5 +0,1 +3,9 +5,5

21

Statistica I - a.a.2009/10 - Prof. Paroli

22

o sul fenomeno migratorio

Statistica I - a.a.2009/10 - Prof. Paroli

23

Statistica I - a.a.2009/10 - Prof. Paroli

24

statistica e marketing
Esempio 2 come pu unazienda accrescere e sfruttare al meglio le sue conoscenze sul mercato in cui opera, sui suoi clienti, sui concorrenti? Esempio 1

Esempio 3

Statistica I - a.a.2009/10 - Prof. Paroli

25

Statistica I - a.a.2009/10 - Prof. Paroli

26

statistica e sondaggi
SONDAGGI DI MERCATO: per conoscere abitudini, preferenze,

Per altri esempi visita il sito ISTAT www.istat.it

gusti e aspettative del consumatore. Per testare lefficacia di un nuovo prodotto o varianti dello stesso prima di lanciarlo sul mercato SONDAGGI DI OPINIONE: conoscere lopinione pubblica sulle questioni di interesse generale (e non solo) attinenti le sfere: dellattivit sociale, del costume, della politica, delletica, della religione SONDAGGI POLITICO-ELETTORALI: www.sondaggipoliticoelettorali.it
perch intervistando un piccolo gruppo di persone (un campione) possiamo dire qualcosa su tutta la popolazione? Quali regole nella scelta del campione occorre seguire per ottenere risultati affidabili?
Statistica I - a.a.2009/10 - Prof. Paroli

27

Statistica I - a.a.2009/10 - Prof. Paroli

28

Dati, statistiche e probabilit sono presenti in tutte le notizie della stampa e in TV: ma chi sa leggerle e interpretarle con chiarezza?

Attenzione a distinguere tra interpretazione dei risultati. La lettura deve essere oggettiva.

lettura

Linterpretazione pu essere diversa se diversi sono i punti di partenza da cui ci si muove. Non ci si deve sorprendere se uno stesso risultato viene interpretato in modo diverso da analisti che partono da punti di vista diversi.

Statistica I - a.a.2009/10 - Prof. Paroli

29

Statistica I - a.a.2009/10 - Prof. Paroli

30

Obiettivo del corso

PROGRAMMA
ANALISI STATISTICA UNIVARIATA

FAR DORMIRE ?????

- Indici di posizione Medie non analitiche Medie analitiche

FORNIRE GLI STRUMENTI PER E LEGGERE OTTENERE CORRETTAMENTE I RISULTATI DELLE ANALISI DEI DATI
Statistica I - a.a.2009/10 - Prof. Paroli

- La variabilit e la mutabilit statistica Misure assolute di variabilit Misure assolute di mutabilit/eterogeneit Indici relativi e normalizzati - Indici di forma - Rapporti statistici Numeri indici
31
Statistica I - a.a.2009/10 - Prof. Paroli

32

ANALISI STATISTICA MULTIVARIATA


- Indipendenza statistica - Connessione fra due caratteri qualitativi misure della connessione - Studio della relazione in media fra due caratteri funzione di regressione - Misure di dipendenza lineare: correlazione - Regressione ai minimi quadrati - Cenni al modello di regressione lineare multipla

CALCOLO DELLE PROBABILIT


- Definizione di probabilit - Teoremi di base del calcolo delle probabilit - I principali modelli probabilistici

ELEMENTI DI INFERENZA STATISTICA (???)


- Cenni al campionamento - Stima puntuale - Stima intervallare - Cenni sulla verifica statistica delle ipotesi

Programma di un corso di STATISTICA II

Statistica I - a.a.2009/10 - Prof. Paroli

33

Statistica I - a.a.2009/10 - Prof. Paroli

34

Altri corsi di STATISTICA


Statistica Applicata
I modulo: INFERENZA II modulo: caratterizzante a seconda del cdl scelto (statistica economica, econometria, teoria dei campioni, statistica per il marketing, .)

BRANCHE DELLA STATISTICA


STATISTICA DESCRITTIVA sintesi delle osservazioni campionarie o dei dati censuari STATISTICA PROBABILISTICA studio del meccanismo generatore delle realizzazioni campionarie (modello campione) STATISTICA INFERENZIALE dal campione al suo meccanismo generatore (campione modello)
35
Statistica I - a.a.2009/10 - Prof. Paroli

Nella laurea specialistica potrete trovare altri esami di Statistica


Statistica I - a.a.2009/10 - Prof. Paroli

36

FASI DELLA RICERCA STATISTICA

Definizione degli obiettivi Astrazione individuazione delle variabili osservabili/proxy

- Registrazione dei dati organizzazione dati classificazione - Elaborazione dei dati sintesi interpretazione inferenza

- Individuazione della popolazione o definizione del piano di campionamento (se si tratta di una indagine campionaria) - Rilevazione sperimentazione, questionari, .
Statistica I - a.a.2009/10 - Prof. Paroli

37

Statistica I - a.a.2009/10 - Prof. Paroli

38

ANALISI DEI DATI

I DATI
Qualsiasi analisi dei dati presuppone che essi siano organizzati in modo che i risultati non siano influenzati dalla cattiva costruzione del database. Le regole fondamentali sono:

DATA BASE analisi esplorative analisi confermative

TECNICHE STATISTICHE (DATA MINING)


Statistica I - a.a.2009/10 - Prof. Paroli

verifica delle fonti verifica della qualit dei dati creazione della matrice dei dati
39
Statistica I - a.a.2009/10 - Prof. Paroli

40

DATA BASE = matrice dei dati tabella formata dalle osservazioni di tutti i dati rilevati per ogni elemento oggetto dellindagine
X1 1 2 j n x1n x2n xin xkn
41

ESEMPIO DATA-BASE

EURISKO: I BILANCI DELLE FAMIGLIE ITALIANE nel 1998 questionario capofamiglia INDAGINE BANCA DITALIA INFORMAZIONI RIGUARDANTI

X2 x21 x22 x2j

Xi xi1 xi2 xij

Xk xk1 xk2 xkj

x11 x12 x1j

struttura famiglia occupazione e redditi strumenti di pagamento e forme di risparmio abitazioni e altri beni immobiliari consumi e spese familiari forme assicurative
42

Statistica I - a.a.2009/10 - Prof. Paroli

Statistica I - a.a.2009/10 - Prof. Paroli

un estratto .
NQUEST 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 NCOMP 4 4 4 3 3 1 4 2 1 2 4 4 4 4 4 2 3 4 3 3 4 3 4 5 5 4 4 2 3 5 5 2 2 SEX 0 0 0 1 1 0 0 1 0 1 0 1 1 1 1 0 1 0 0 1 1 1 1 0 0 1 0 0 0 0 0 1 1 PARENT 2 3 2 1 1 1 2 1 1 1 2 3 1 1 1 1 3 2 2 1 3 1 1 2 3 1 3 1 3 2 2 1 3 ANASC 1959 1978 1947 1948 1960 1938 1954 1937 1961 1941 1954 1974 1954 1950 1949 1964 1978 1946 1963 1968 1974 1950 1960 1957 1970 1966 1976 1947 1969 1948 1950 1945 1957 ETA 39 20 51 50 38 60 44 61 37 57 44 24 44 48 49 34 20 52 35 30 24 48 38 41 28 32 22 51 29 50 48 53 41 STACIV 1 2 1 1 1 3 1 1 2 1 1 2 1 1 1 2 2 1 1 1 2 1 1 1 1 1 2 2 2 1 1 4 2 STUDIO 3 5 5 5 7 7 5 2 3 5 3 3 3 5 3 5 3 3 3 5 5 5 5 3 3 2 5 6 5 5 5 2 7 Istruz_anni 8 12 12 13 18 17 12 5 8 13 8 8 8 13 8 13 8 8 8 13 13 13 13 8 8 5 13 15 13 13 12 5 18 APQUAL 1 1 3 2 4 4 2 1 1 2 1 2 1 5 1 2 1 1 2 2 1 4 2 1 1 1 4 2 2 2 3 1 3 APSETT 4 7 9 9 2 9 9 3 9 3 9 2 2 7 9 4 4 9 2 2 4 4 5 2 4 2 2 9 3 9 9 3 9 ETALAV 15 16 21 18 18 25 20 16 15 20 18 20 21 24 15 16 15 18 18 19 15 24 15 15 18 16 20 20 26 21 18 15 27

TERMINOLOGIA
-

Unit statistiche o sperimentali


- popolazione/universo - campione

supporto fisico/materiale dellindagine

Caratteri
- qualitativi - quantitativi

propriet dellunit sperimentale

Statistica I - a.a.2009/10 - Prof. Paroli

43

Statistica I - a.a.2009/10 - Prof. Paroli

44

Modalit del carattere


modo di manifestarsi del carattere - attributi - misure qualitative quantitative

tabella formata dalle osservazioni di tutti i caratteri rilevati per ogni unit statistica
caratteri
CODFAM 1538404 0084320 0139424 0139424 0025597 0087423 0131457 0087423 0039567 0065549 0056435 0025597 0056435 0155733 PAR 25 01 05 06 18 03 01 01 03 01 01 04 03 05 SESSODATANASC COMNASSTCIVITITSTUDPROFE DATAPROV COMMATDATAMATR NCOMPON M 3/5/1953 072004 29 6/30/2001 0 F 1/19/1962 034027 CG 39 034027 5/6/1989 3 M 2/25/1951 034027 CG 29 45307 034027 7/20/1974 3 F 4/27/1955 034025 CG 16 99116 2/8/1965 034027 7/20/1974 3 F 9/19/1959 034027 CG 39 23916 034027 4/7/1980 4 F 7/18/1968 034033 CG 16 12/16/1975 034027 10/11/1987 3 F 9/9/1966 280042 CG 39 12505 9/3/1993 034027 3/27/1999 4 M 2/3/1965 034027 CG 29 034027 10/11/1987 3 F 11/14/1951 034012 CG 29 6/6/1967 034027 10/20/1973 4 M 7/14/1950 034010 CG 29 21604 4/22/1963 034027 6/27/1976 3 M 9/10/1948 034027 CG 29 99102 034027 6/1/1974 3 M 2/15/1956 034027 CG 29 14701 7/13/1960 034027 4/7/1980 4 F 10/24/1951 034027 CG 39 23916 034027 6/1/1974 3 M 11/19/1951 034027 CG 29 62302 6/27/1974 034027 3/30/1974 3

unit statistiche

Statistica I - a.a.2009/10 - Prof. Paroli

45

Statistica I - a.a.2009/10 - Prof. Paroli

46

TIPI DI CARATTERI
- QUALITATIVI / CATEGORICI

CARATTERI QUALITATIVI
modalit modalit = attributi - sconnessi (scala nominale) . comune di residenza . tipo di industria . tipo di fabbricazione

. sconnessi . ordinati

- QUANTITATIVI / METRICI

. discreti
. continui
Statistica I - a.a.2009/10 - Prof. Paroli

- ordinati (scala ordinale) . titolo di studio . grado di vendibilit . risultato di un esame (A,B,C,) ...

47

Statistica I - a.a.2009/10 - Prof. Paroli

48

sconnessi
esempio:
NQUEST NCOMP SEX PARENT ANASC STACIV

ordinati

STUDIO

APQUAL

YL

ORETOT

molto daccordo

Indifferente

decisamente contrario

1 2

4 4 4 3 3 1 4 2 1

F F F M M F F M F

coniuge figlio/a coniuge

1959 1978 1947

coniug. media inf.

operaio

18000 8000 28000 48000

45 25 65 42 50 42 36 45 40

celibe media sup. operaio coniug. media sup. insegn. coniug. media sup. impieg. coniug. laurea laurea

(punteggi espressi su scale convenzionali) osservazione: NON HA SENSO CONFRONTARE DISTANZE TRA MODALIT (anche se codificate con valori numerici)

3 4 5 6 7 8 9

capo fam. 1948 capo fam. 1960

dirigente 40000 dirigente 36000 29500 15000 22100

capo fam. 1938 separato coniuge 1954

coniug. media sup. impieg. coniug. celibe elem. media inf. operaio operaio

capo fam. 1937 capo fam. 1961

Statistica I - a.a.2009/10 - Prof. Paroli

49

Statistica I - a.a.2009/10 - Prof. Paroli

50

CARATTERI QUANTITATIVI
modalit modalit = misure numeri reali che descrivono una propriet oggettiva dellunit statistica - discreti insieme di modalit: finito , numeri interi - continui insieme di modalit: infinito , numeri reali

- ordinamento dei numeri reali - definibile una funzione distanza tra modalit
d = |x2 - x1| = |x1 - x2| 0 per la quale d=0 ed inoltre |x1 - x3| |x1 - x2| + |x2 - x3| x1 = x2

osservazione
HANNO SENSO LE DIFFERENZE (E LE SOMME)

Statistica I - a.a.2009/10 - Prof. Paroli

51

Statistica I - a.a.2009/10 - Prof. Paroli

52

TABELLE DI FREQUENZA discreti


NQUEST NCOMP SEX PARENT ANASC STACIV STUDIO

continui
organizzazione dei dati elementari
APQUAL YL ORETOT

1 2 3 4 5 6 7 8 9

4 4 4 3 3 1 4 2 1

F F F M M F F M F

coniuge figlio/a coniuge

1959 1978 1947

coniug. celibe

media inf.

operaio

18000 8000 28000 48000 40000 36000 29500 15000 22100

45 25 65 42 50 42 36 45 40

media sup. operaio

prospetti/elenchi delle osservazioni

coniug. media sup. insegn. coniug. media sup. impieg. coniug. laurea laurea dirigente dirigente

capo fam. 1948 capo fam. 1960

capo fam. 1938 separato coniuge 1954

coniug. media sup. impieg. coniug. celibe elem. media inf. operaio operaio

se i dati sono tanti utile riorganizzarli in TABELLE utilizzando la nozione fondamentale di FREQUENZA

capo fam. 1937 capo fam. 1961

Statistica I - a.a.2009/10 - Prof. Paroli

53

Statistica I - a.a.2009/10 - Prof. Paroli

54

TIPI DI FREQUENZE

SIMBOLOGIA - vj = singoli valori

(j=1,2,,n)

Numero di unit statistiche

frequenza assoluta = numero di unit statistiche


che presentano una data modalit (ni): ni0 interi e

(le osservazioni di base)

ki=1ni =n

xi = modalit distinte ni = frequenze (i=1,2,,k)

Numero di modalit differenti

frequenza relativa = numero di unit statistiche sul totale che presentano una data modalit (fi ):
fi= ni/n 0 fi 1 e

n e k sono solitamente diversi tra loro!!!


Statistica I - a.a.2009/10 - Prof. Paroli

N.B.

ki=1fi=1
56

55

Statistica I - a.a.2009/10 - Prof. Paroli

Tabella di frequenza in generale:


modalit xi x1 x2 : xk ni n1 n2 : nk n
k

esempio: qualit dei pezzi prodotti da una linea di produzione

fi = ni/n f1 f2 : fk 1
k

xi idoneo 2a scelta difettoso scarto

conteggio |||| |||| |||| |||| |||| |||| | |||| ||

per la quale si verifica che

ni 19 11 4 2 36

ni = n
i=1
Statistica I - a.a.2009/10 - Prof. Paroli

fi = 1
i=1
57
Statistica I - a.a.2009/10 - Prof. Paroli

totale dei pezzi esaminati


58

frequenza cumulata = numero/frazione di unit statistiche che presentano una data modalit minore o uguale alla corrente (Ni o Fi)

esempio 1: n stanze per abitazione

Ni = frequenze assolute cumulate = = n1+n2++ni = N1=n1 Nk=n

ij=1 nj

xi 1 2 3 4 5 oltre

Fi = frequenze relative cumulate = i = f1+f2++fi = j=1 fj Fk=1 F1=f1


Statistica I - a.a.2009/10 - Prof. Paroli

ni 184 451 312 197 84 26 1254

Ni 184 184+451=635 635+312=947 947+197=1144 1144+84=1228 1228+26=1254

dati rilevati su n = 1254 unit sperimentali


59
Statistica I - a.a.2009/10 - Prof. Paroli

60

Serie statistiche
esempio 2: n. punti vendita di una azienda

Tabelle di frequenza per caratteri qualitativi/quantitativi discreti


modalit x1 x2 : xk ni n1 n2 : nk n fi = ni/n f1 f2 : fk 1

xi 1 2 3 4 5

ni 10 8 6 14 3 41

fi 0.24 0.20 0.15 0.34 0.07 1.00

Fi 0.24 0.24+0.20= 0.44 0.44+0.15= 0.59 0.59+0.34=0.93 0.93+0.07=1.00

Statistica I - a.a.2009/10 - Prof. Paroli

61

Statistica I - a.a.2009/10 - Prof. Paroli

62

esempio 1: carattere qualitativo


variabile stato civile

esempio 2: carattere quantitativo discreto numero di punti vendita di una azienda


xi 1 2 3 4 5 ni 10 8 6 14 3 41

xi Coniugato/a Celibe/nubile Separato/divorziato Vedovo/a

ni 130 63 3 4 200

fi 0.650 0.315 0.015 0.020 1

E se fossero i punti vendita dei supermercati??? potremmo avere anche 100 punti vendita !!!! Cosa succede alla tabella ???

Statistica I - a.a.2009/10 - Prof. Paroli

63

Statistica I - a.a.2009/10 - Prof. Paroli

64

Seriazioni statistiche
SE IL CARATTERE PRESENTA MOLTE MODALIT DISTINTE pu essere conveniente accorpare le modalit in CLASSI

Tabelle di frequenza per caratteri quantitativi ripartiti in classi


classi h0 h1 h1 h2 hk-1 hk ni n1 n2 : nk n fi f1 f2 : fk 1

Classi o intervalli: RAGGRUPPAMENTO IN CLASSI Costruzione di intervalli di valori chiusi o aperti (da escluso, a incluso)
Statistica I - a.a.2009/10 - Prof. Paroli

-devono essere disgiunte (senza sovrapposizioni) - devono essere esaustive (devono contenere il minimo ed il massimo osservati) - solitamente si intendono chiuse a destra
65
Statistica I - a.a.2009/10 - Prof. Paroli

66

esempio: variabile reddito annuo 5 classi Classi 0 20 20 30 30 40 40 80 80 100 ni 35 42 54 59 10 200 fi = ni/n 0.175 0.210 0.270 0.295 0.05 1

densit di frequenza (di) assoluta (o relativa) nellintervallo di = ni/ai con

= % di frequenza
fi/ai

oppure

ai = ampiezza classe i-esima = hi hi-1


classi h0 h1 h1 h2 hk-1 hk ni n1 n2 : nk n ai a1 a2 : ak di n1/a1 n2/a2 : nk/ak

N.B. ATTENZIONE ALLAMPIEZZA DELLE CLASSI !!!!


Se non costante si calcolano le densit di frequenza
Statistica I - a.a.2009/10 - Prof. Paroli

67

Statistica I - a.a.2009/10 - Prof. Paroli

68

esempio: variabile reddito annuo 5 classi Classi 0 20 20 30 30 40 40 80 80 100 ni 35 42 54 59 10 200 ai 20 10 10 40 20 di = ni/ai 1.75 4.2 5.4 1.475 0.5

linsieme delle coppie modalit+frequenze X = {(xi,ni); i=1,2,,k}


detto
- mutabile statistica se il carattere qualitativo

In questo modo si possono confrontare le frequenze nei vari intervalli !!! (es. quale classe di reddito ha max freq.)
Statistica I - a.a.2009/10 - Prof. Paroli

- variabile statistica se il carattere quantitativo (discreto o continuo)

69

Statistica I - a.a.2009/10 - Prof. Paroli

70

ESEMPIO RIASSUNTIVO
La seguente matrice di dati si riferisce al data-base della contabilit clienti di una certa azienda
c o d ic e c lie n te c a te g o r ia r e s id e n z a 0001 g ro s s is ta I ta lia 0002 g ra n d e d is trib I ta lia 0003 g ra n d e d is trib F ra n c ia 0004 g ro s s is ta I ta lia 0005 g ro s s is ta S v iz z e ra 0006 g ra n d e d is trib S v iz z e ra 0007 g ro s s is ta G e rm a n ia 0008 g ra n d e d is trib A u s tria 0009 g ro s s is ta I ta lia 0010 d e tta g lia n te G e rm a n ia 0011 g ro s s is ta F ra n c ia 0012 d e tta g lia n te I ta lia 0013 g ro s s is ta F ra n c ia 0014 d e tta g lia n te I ta lia 0015 d e tta g lia n te G e rm a n ia 0016 g ro s s is ta O la n d a 0017 d e tta g lia n te I ta lia 0018 g ro s s is ta F ra n c ia 0019 d e tta g lia n te O la n d a 0020 g ro s s-is ta Paroli S v iz z e ra Statistica I - a.a.2009/10 Prof. F a ttu r a to p r o d .A p r o d .B p r o d .C 1 1 .2 2 1270 370 4 3 0 .5 3 4820 455 5 3 4 .5 5 5550 580 4 1 5 .1 2 0 210 3 2 8 .9 8 4750 355 4 2 0 .5 3 2570 550 5 1 2 .1 8 1340 365 5 2 7 .6 5 3850 680 5 1 7 .2 3 2320 310 5 1 2 .4 3 1750 225 4 1 3 .2 3 1220 460 5 1 3 .1 4 1875 275 4 3 8 .0 5 6440 385 5 4 4 .5 3 750 175 4 4 6 .4 7 140 235 4 4 0 .1 2 6750 482 5 1 3 .8 8 2570 0 3 2 3 .3 6 3500 480 4 6 .7 6 950 120 3 1 9 .8 8 2780 380 5 71

CARATTERISTICHE DATADATA-BASE n= 20 unit statistiche 6 caratteri rilevati tipi di caratteri: Categoria: qualitativo ordinabile Residenza: qualitativo sconnesso Fatturato: quantitativo continuo Prod. A/B/C: quantitativi discreti
72

Statistica I - a.a.2009/10 - Prof. Paroli

DISTRIBUZIONI DI FREQUENZA Carattere Categoria


xi Dettagliante Grossista Grande distribuzione ni 6 10 4 20 fi 0.3 0.5 0.2 1

Carattere Residenza
xi Italia Francia Svizzera Germania Austria Olanda ni 7 4 3 3 1 2 20 fi 0.35 0.2 0.15 Ni

Statistica I - a.a.2009/10 - Prof. Paroli

73

Statistica I - a.a.2009/10 - Prof. Paroli

74

Carattere Prodotto C =numero di pezzi acquistati del prodotto di tipo C


xi 3 4 5 ni 3 8 9 20

Carattere Fatturato
poich si tratta di un carattere di tipo continuo bisogna scegliere una opportuna ripartizione in classi

5 classi con stessa ampiezza pari a 10

!!!!! Provate a fare anche quelle dei Prodotti A e B !!!!!


Statistica I - a.a.2009/10 - Prof. Paroli

xi 0 10 10 20 20 30 30 40 40 50

ni 1 9 4 3 3 20

75

Statistica I - a.a.2009/10 - Prof. Paroli

76

4 classi con ampiezza differente pari a 10, 10, 20, 15

Dalla lettura delle frequenze si possono trarre alcune osservazioni:


il 50% dei clienti dellazienda sono grossisti, il 30% dettaglianti ed il restante 20% della grande distribuzione per il 35% sono italiani, tra il 15% - 20% francesi, svizzeri e tedeschi per la maggior parte hanno fatturato tra 10 e 20 per il prodotto C il numero di pezzi maggiormente acquistati 5 (per i prodotti A e B????)

xi 0 10 10 20 20 40 40 55

ni 1 9 7 3 20

ai 10 10 20 15

di 1/10=0.1 9/10=0.9 7/20=0.35 3/15=0.2

di frequenza

classi di ampiezza diversasi calcolano le densit

Statistica I - a.a.2009/10 - Prof. Paroli

77

Statistica I - a.a.2009/10 - Prof. Paroli

78

RAPPRESENTAZIONI GRAFICHE
A) RAPPRESENTAZIONI DI DISTRIBUZIONI DI FREQUENZA

Grafici su coordinate cartesiane in cui: asse ascisse = modalit asse ordinate = frequenze

- caratteri qualitativi . diagrammi a torta . diagrammi a rettangoli separati - caratteri quantitativi discreti . diagrammi a bastoncini (canne dorgano) - caratteri quantitativi continui . Istogrammi
Statistica I - a.a.2009/10 - Prof. Paroli

assolute

relative

densit

79

Statistica I - a.a.2009/10 - Prof. Paroli

80

Caratteri qualitativi - diagrammi a torta (caratteri sconnessi) in corrispondenza ad ogni modalit si disegna un settore circolare il cui angolo al centro proporzionale alla frequenza.
- diagrammi a rettangoli separati (caratteri sconnessi

e ordinati) in corrispondenza ad ogni modalit si disegna un rettangolo con altezza proporzionale alla frequenza
sex

sex F M

ni 16 14 30

fi 0,53 0,47 1

Per trovare langolo i:

360 : i = n : ni 360 : i = 1 : fi

ni

M 47%

sex F M
F 53%

ni 16 14 30

fi 0,53 0,47 1

20 18 16 14 12 10 8 6 4 2 0 F M

Statistica I - a.a.2009/10 - Prof. Paroli

81

Statistica I - a.a.2009/10 - Prof. Paroli

82

Caratteri quantitativi discreti


carattere qualitativo ordinato
titolo di studio licenza elementare diploma media sup laurea ni 10 50 30 90 fi 0.111111 0.555556 0.333333 1

diagrammi a bastoncini in corrispondenza ad ogni modalit si disegna un segmento con altezza proporzionale alla frequenza

60 50 40 ni 30 20 10 0 licenza elementare diploma media sup titolo di studio laurea


NCO M P ni fi

ncomp

1 2 3 4 5

2 4 7 14 3 30

0,067 0,133 0,233 0,467 0,100 1

16 14 12 10 ni 8 6 4 2 0 0 1 2 3 4 5 6

Statistica I - a.a.2009/10 - Prof. Paroli

83

Statistica I - a.a.2009/10 - Prof. Paroli

84

Caratteri quantitativi continui (o discreti con modalit in classi) istogramma in corrispondenza ad ogni classe si disegna un rettangolo con base proporzionale allampiezza della classe e altezza proporzionale alla frequenza (o alla densit se le classi sono di diversa ampiezza)
anasc
12

classi con ampiezza diversa

Carattere = ore lavorative settimanali hi-1 hi 17 25 25 35 35 45 45 50 ni 13 32 81 8 ai 8 10 10 5 di=ni/ai 1.63 3.2 8.1 1.6

A NA SC 1936-|1946 1946-|1956 1956-|1966 1966-|1976 1976-|1986

ni

fi

4 10 8 6 2 30

0,133 0,333 0,267 0,200 0,067 1,000

10 8 ni 6 4 2 0
1936-|1946 1946-|1956 1956-|1966 1966-|1976 1976-|1986

classi con ampiezza diversa

altezze rettangoli = densit di frequenza


85
Statistica I - a.a.2009/10 - Prof. Paroli

Statistica I - a.a.2009/10 - Prof. Paroli

86

B) GRAFICO DELLE FREQUENZE CUMULATE

di

Grafico cartesiano per la rappresentazione dellandamento dei valori delle frequenze cumulate assolute o relative (Ni o Fi). Fi
GRAFICO A GRADINI

max Fi (n se fossero le Ni)

xi
Statistica I - a.a.2009/10 - Prof. Paroli

87

Statistica I - a.a.2009/10 - Prof. Paroli

88

C) GRAFICO PER SERIE STORICHE O TEMPORALI esempio: n. di stanze per abitazione

serie dipendenti dal tempo:

xi 1 2 3 4 5 oltre

ni 184 451 312 197 84 26 1254

Ni 184 635 947 1144 1228 1254

Ni
n=1254

grafico in coordinate cartesiane ortogonali in cui il tempo (variabile t) sullasse delle ascisse, mentre i valori della serie sono sullasse delle ordinate
35 30 25 20

184

15 10 5

6 ..

xi
89

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Statistica I - a.a.2009/10 - Prof. Paroli

Statistica I - a.a.2009/10 - Prof. Paroli

90