Sei sulla pagina 1di 16

STATISTICA DI BASE

Prof. Giuseppe BURGIO


Ordinario di Statistica
Sapienza Università di Roma

email: giuseppe.burgio@uniroma1.it
IL METODO STATISTICO

 LA STATISTICA HA COME OGGETTO


FENOMENI COLLETTIVI
 L’INSIEME DELLE UNITA’ DI UN
COLLETTIVO FORMA UNA POPOLAZIONE
 UN SOTTOINSIEME DI UNITA’
RAPPRESENTATIVE DI UNA POPOLAZIONE
SI CHIAMA CAMPIONE
Organizzazione di un’indagine
 SPECIFICAZIONE DELL’OBIETTIVO
 RACCOLTA DELLE INFORMAZIONI
 ANALISI DEI DATI
 INTERPRETAZIONE DEI RISULTATI
 Il campionamento è spesso più conveniente di
un’indagine totale riguardo a : costi, tempo,
organizzazione, riduzione errori, motivi etici, ecc.
Problemi nella scelta del campione
 Scelta della tecnica di campionamento:
* casuale semplice, stratificato, ecc.
 Determinazione della dimensione campionaria:
* problemi di costo, tempo, organizzazione
* variabilità del carattere da rilevare
* precisione dell’indagine
 Scelta del metodo di rilevazione
* questionario con intervista diretta e CAPI
* indagine postale, telefonica e CATI
* indagini panel
Il campionamento casuale
 Consiste nella estrazione a caso (sorteggio) di n unità
(es. 10) dalle N (es. 200) della popolazione
 Per sorteggiare le unità si può ricorrere a metodi automatici
(numeri pseudo casuali generati dal computer) dopo aver
codificato tutte le N unità del reference frame
 Si può semplificare il lavoro con il CAMPIONAMENTO
SISTEMATICO, che consiste:
* nel determinare il passo N/n (es. 200/10 = 20) e nel
sorteggiare un numero a caso tra 1 ed N/n (ad es. 8)
* nell’individuare le n unità estraendo dal Frame le unità
codificate (nell’esempio) con i numeri:
8, 28, 48, 68, 88, 108, 128, 148, 168, 188
Il campionamento stratificato
 Finalità della stratificazione:
- Aumentare la precisione delle stime
- Assicurare una maggiore rappresentatività
 Consiste nel separare le unità della popolazione secondo le
modalità di un dato carattere di essa (ad es. il sesso dei
soggetti) e nel prelevare campioni casuali semplici da
ciascuna sottopopolazione in modo indipendente
 Si può stratificare secondo più caratteri (es. per sesso e
professione) e in tal caso si ripartisce la popolazione in tutti
gli strati conseguenti al prodotto del numero dei caratteri:
(es.: 2 sessi x 6 professioni = 12 strati)
Dalla rilevazione dati all’input su PC

 Completata la fase di raccolta dei dati


si passa alla fase di: SPOGLIO E
CLASSIFICAZIONE
 I dati vengono immessi in un foglio
elettronico (es. EXCEL) in forma di
MATRICE
 In ciascuna riga della Matrice stanno i
dati di una unità statistica (RECORD)
 In ciascuna colonna (CAMPO) stanno
i dati di una VARIABILE
Le misure di dimensione: le medie
 La sintesi analitica dei dati osservati, mediante medie, si
avvale dei seguenti strumenti base:
- media aritmetica
- mediana
- moda
 La media aritmetica corrisponde al principio di uguale
ripartizione del totale tra tutte le unità
 La mediana è il valore del carattere posseduto dal soggetto
che, per quel carattere, si trova nella posizione di mezzo tra i
soggetti ordinati
 La moda è il valore del carattere considerato che si è
presentato il maggior numero di volte
Le misure di variabilità
 La misura della diversità dei valori assunti da un carattere
osservato su più soggetti prende il nome di:
- misura di variabilità
 La differenza tra il valore massimo e il minimo osservati per
un dato carattere, prende il nome di:
- campo di variazione o range
 Si chiama scarto dalla media la differenza tra un dato
osservato e la media aritmetica del gruppo al quale il
soggetto appartiene
 Una speciale media degli scarti (la media quadratica) si
chiama scarto quadratico medio (
 Il quadrato di  si chiama varianza
I rapporti statistici
 Servono a dare la dimensione di un fenomeno in relazione a
quella di un altro fenomeno o dello stesso fenomeno in
condizioni diverse: del tempo (statistiche di flusso) e dello
spazio (statistiche territoriali)
 Si ottengono calcolando il rapporto tra le due quantità
implicate e moltiplicando il rapporto per 100, 1.000 10.000 o
100.000, per esprimere il dato in modo più intuitivo
 Sono di particolare interesse i rapporti demografici che
esprimono le variazioni nell’ammontare e nella
composizione della popolazione a seguito dei fenomeni di
nascita, morte, immigrazione ed emigrazione:
 tassi di natalità, mortalità, fecondità, nuzialità, emigrazione,..
Alcuni rapporti statistici
 I rapporti statistici si distinguono in:
- generici, quando a denominatore è posto un ammontare di
generico riferimento al numeratore (ad es. il rapporto tra il
numero dei disoccupati e la popolazione totale)
- specifici, quando a denominatore è posto un ammontare di
diretto riferimento al numeratore (ad es. il quoziente di
fecondità come rapporto tra il numero dei nati e la rispettiva
popolazione femminile in età feconda)
 I rapporti di derivazione confrontano la grandezza di un
fenomeno con quella di un altro fenomeno che ne è
logicamente antecedente. Ad esempio:
- Il quoziente di fecondità è un rapporto di derivazione
Alcuni rapporti statistici
 I rapporti di densità esprimono la grandezza di un fenomeno
in termini di quella di un altro fenomeno ad esso collegato:
rapporto tra numero di abitanti e superficie del territorio
rapporto tra numero di autoveicoli e lunghezza delle strade
rapporto tra numero di abbonamenti TV e popolazione, ecc.
 I rapporti di composizione confrontano una parte con il tutto
al quale il fenomeno appartiene. Esempi:
- spesa per personale sulla spesa complessiva
- n° dipendenti Ministero X su totale dipendenti Ministeri
 I rapporti di coesistenza confrontano due quantità associate
dello stesso fenomeno. Esempi:
n° maschi/n° femmine; import/export; ecc.
I numeri indice a base fissa
 I numeri indici sono rapporti statistici che esprimono
percentualmente la variazione realizzatasi nello stesso
fenomeno in tempi diversi o in diversi luoghi.
 Generalmente i numeri indici sono calcolati come rapporto
tra un dato (ad es. il prezzo di un dato bene) e il valore che
quel dato assume in un tempo diverso. Ad es., se si assume
come BASE il prezzo del bene nel gennaio 1990 (L. 3450), il
numero indice del prezzo del bene nell’aprile 1996 (L. 4160)
è il rapporto tra quest’ultimo e il primo moltiplicato per
cento: (4160:3450x100= 120,6). Ciò esprime che tra aprile
1996 e gennaio 1990 il prezzo di quel bene è aumentato del
20,6%. Quando il rapporto risulta minore di 100 (ad es. 94)
esso indica una variazione negativa (meno 6%)
I numeri indice a base mobile
 I numeri indici a base mobile sono rapporti statistici che
esprimono percentualmente la variazione realizzatasi nello
stesso fenomeno rispetto al tempo immediatamente
precedente
 Così, ad esempio, se nei primi quattro mesi dell’anno i prezzi
di un bene sono stati: 2600, 2650,2750, 2800, preso 100 il
dato di Gennaio, i numeri indici a base mobile sono:
Febbraio 101,9 (2650/2600x100)
Marzo 103,8 (2750/2650x100)
Aprile 101,8 (2800/2750x100)
che indicano le variazioni: 1,9% tra Febbraio e Gennaio,
3,8% tra Marzo e Febbraio e 1,8% tra Aprile e Marzo
I numeri indice complessi dei prezzi
 L’indice dei prezzi di un aggregato di n beni può essere ottenuto
con diverse formule, tra cui:
– La formula di Laspeyres, che è il rapporto tra il valore di
quantità fisse degli n beni (un paniere fisso) ai prezzi correnti e
il valore dello stesso paniere al tempo base, ossia:
Lt = 100*(∑ pt q0)/ (∑ p0 q0).
– La formula di Paasche, che è il rapporto tra il valore effettivo
delle quantità correnti degli n beni ai prezzi correnti e il valore
delle stesse quantità correnti ai prezzi del tempo base, ossia:
Pt = 100* (∑ pt qt)/ (∑ p0 qt).
– La formula ideale di Fisher, che è la media geometrica di Lt e
Pt e cioè la radice quadrata del loro prodotto.
I numeri indice complessi delle quantità
 Analogamente all’indice dei prezzi, l’indice delle quantità di un
aggregato di n beni può essere ottenuto con:
– La formula di Laspeyres, che è il rapporto tra il valore di
quantità correnti degli n beni con prezzi fissi del tempo base
e il valore effettivo degli stessi n beni al tempo base, ossia:
Qt = 100*(∑ p0 qt)/ (∑ p0 q0).
– La formula di Paasche è il rapporto tra il valore effettivo
delle quantità correnti degli n beni ai prezzi correnti e il
valore, ai prezzi correnti, delle n quantità del tempo base,
ossia:
100* (∑ pt qt)/ (∑ pt qo).
– Fisher ha proposto come formula ideale delle quantità la
radice quadrata del prodotto degli indici di Laspeyres e di
Paasche.

Potrebbero piacerti anche