Ordinario di Statistica Sapienza Università di Roma
email: giuseppe.burgio@uniroma1.it IL METODO STATISTICO
LA STATISTICA HA COME OGGETTO
FENOMENI COLLETTIVI L’INSIEME DELLE UNITA’ DI UN COLLETTIVO FORMA UNA POPOLAZIONE UN SOTTOINSIEME DI UNITA’ RAPPRESENTATIVE DI UNA POPOLAZIONE SI CHIAMA CAMPIONE Organizzazione di un’indagine SPECIFICAZIONE DELL’OBIETTIVO RACCOLTA DELLE INFORMAZIONI ANALISI DEI DATI INTERPRETAZIONE DEI RISULTATI Il campionamento è spesso più conveniente di un’indagine totale riguardo a : costi, tempo, organizzazione, riduzione errori, motivi etici, ecc. Problemi nella scelta del campione Scelta della tecnica di campionamento: * casuale semplice, stratificato, ecc. Determinazione della dimensione campionaria: * problemi di costo, tempo, organizzazione * variabilità del carattere da rilevare * precisione dell’indagine Scelta del metodo di rilevazione * questionario con intervista diretta e CAPI * indagine postale, telefonica e CATI * indagini panel Il campionamento casuale Consiste nella estrazione a caso (sorteggio) di n unità (es. 10) dalle N (es. 200) della popolazione Per sorteggiare le unità si può ricorrere a metodi automatici (numeri pseudo casuali generati dal computer) dopo aver codificato tutte le N unità del reference frame Si può semplificare il lavoro con il CAMPIONAMENTO SISTEMATICO, che consiste: * nel determinare il passo N/n (es. 200/10 = 20) e nel sorteggiare un numero a caso tra 1 ed N/n (ad es. 8) * nell’individuare le n unità estraendo dal Frame le unità codificate (nell’esempio) con i numeri: 8, 28, 48, 68, 88, 108, 128, 148, 168, 188 Il campionamento stratificato Finalità della stratificazione: - Aumentare la precisione delle stime - Assicurare una maggiore rappresentatività Consiste nel separare le unità della popolazione secondo le modalità di un dato carattere di essa (ad es. il sesso dei soggetti) e nel prelevare campioni casuali semplici da ciascuna sottopopolazione in modo indipendente Si può stratificare secondo più caratteri (es. per sesso e professione) e in tal caso si ripartisce la popolazione in tutti gli strati conseguenti al prodotto del numero dei caratteri: (es.: 2 sessi x 6 professioni = 12 strati) Dalla rilevazione dati all’input su PC
Completata la fase di raccolta dei dati
si passa alla fase di: SPOGLIO E CLASSIFICAZIONE I dati vengono immessi in un foglio elettronico (es. EXCEL) in forma di MATRICE In ciascuna riga della Matrice stanno i dati di una unità statistica (RECORD) In ciascuna colonna (CAMPO) stanno i dati di una VARIABILE Le misure di dimensione: le medie La sintesi analitica dei dati osservati, mediante medie, si avvale dei seguenti strumenti base: - media aritmetica - mediana - moda La media aritmetica corrisponde al principio di uguale ripartizione del totale tra tutte le unità La mediana è il valore del carattere posseduto dal soggetto che, per quel carattere, si trova nella posizione di mezzo tra i soggetti ordinati La moda è il valore del carattere considerato che si è presentato il maggior numero di volte Le misure di variabilità La misura della diversità dei valori assunti da un carattere osservato su più soggetti prende il nome di: - misura di variabilità La differenza tra il valore massimo e il minimo osservati per un dato carattere, prende il nome di: - campo di variazione o range Si chiama scarto dalla media la differenza tra un dato osservato e la media aritmetica del gruppo al quale il soggetto appartiene Una speciale media degli scarti (la media quadratica) si chiama scarto quadratico medio ( Il quadrato di si chiama varianza I rapporti statistici Servono a dare la dimensione di un fenomeno in relazione a quella di un altro fenomeno o dello stesso fenomeno in condizioni diverse: del tempo (statistiche di flusso) e dello spazio (statistiche territoriali) Si ottengono calcolando il rapporto tra le due quantità implicate e moltiplicando il rapporto per 100, 1.000 10.000 o 100.000, per esprimere il dato in modo più intuitivo Sono di particolare interesse i rapporti demografici che esprimono le variazioni nell’ammontare e nella composizione della popolazione a seguito dei fenomeni di nascita, morte, immigrazione ed emigrazione: tassi di natalità, mortalità, fecondità, nuzialità, emigrazione,.. Alcuni rapporti statistici I rapporti statistici si distinguono in: - generici, quando a denominatore è posto un ammontare di generico riferimento al numeratore (ad es. il rapporto tra il numero dei disoccupati e la popolazione totale) - specifici, quando a denominatore è posto un ammontare di diretto riferimento al numeratore (ad es. il quoziente di fecondità come rapporto tra il numero dei nati e la rispettiva popolazione femminile in età feconda) I rapporti di derivazione confrontano la grandezza di un fenomeno con quella di un altro fenomeno che ne è logicamente antecedente. Ad esempio: - Il quoziente di fecondità è un rapporto di derivazione Alcuni rapporti statistici I rapporti di densità esprimono la grandezza di un fenomeno in termini di quella di un altro fenomeno ad esso collegato: rapporto tra numero di abitanti e superficie del territorio rapporto tra numero di autoveicoli e lunghezza delle strade rapporto tra numero di abbonamenti TV e popolazione, ecc. I rapporti di composizione confrontano una parte con il tutto al quale il fenomeno appartiene. Esempi: - spesa per personale sulla spesa complessiva - n° dipendenti Ministero X su totale dipendenti Ministeri I rapporti di coesistenza confrontano due quantità associate dello stesso fenomeno. Esempi: n° maschi/n° femmine; import/export; ecc. I numeri indice a base fissa I numeri indici sono rapporti statistici che esprimono percentualmente la variazione realizzatasi nello stesso fenomeno in tempi diversi o in diversi luoghi. Generalmente i numeri indici sono calcolati come rapporto tra un dato (ad es. il prezzo di un dato bene) e il valore che quel dato assume in un tempo diverso. Ad es., se si assume come BASE il prezzo del bene nel gennaio 1990 (L. 3450), il numero indice del prezzo del bene nell’aprile 1996 (L. 4160) è il rapporto tra quest’ultimo e il primo moltiplicato per cento: (4160:3450x100= 120,6). Ciò esprime che tra aprile 1996 e gennaio 1990 il prezzo di quel bene è aumentato del 20,6%. Quando il rapporto risulta minore di 100 (ad es. 94) esso indica una variazione negativa (meno 6%) I numeri indice a base mobile I numeri indici a base mobile sono rapporti statistici che esprimono percentualmente la variazione realizzatasi nello stesso fenomeno rispetto al tempo immediatamente precedente Così, ad esempio, se nei primi quattro mesi dell’anno i prezzi di un bene sono stati: 2600, 2650,2750, 2800, preso 100 il dato di Gennaio, i numeri indici a base mobile sono: Febbraio 101,9 (2650/2600x100) Marzo 103,8 (2750/2650x100) Aprile 101,8 (2800/2750x100) che indicano le variazioni: 1,9% tra Febbraio e Gennaio, 3,8% tra Marzo e Febbraio e 1,8% tra Aprile e Marzo I numeri indice complessi dei prezzi L’indice dei prezzi di un aggregato di n beni può essere ottenuto con diverse formule, tra cui: – La formula di Laspeyres, che è il rapporto tra il valore di quantità fisse degli n beni (un paniere fisso) ai prezzi correnti e il valore dello stesso paniere al tempo base, ossia: Lt = 100*(∑ pt q0)/ (∑ p0 q0). – La formula di Paasche, che è il rapporto tra il valore effettivo delle quantità correnti degli n beni ai prezzi correnti e il valore delle stesse quantità correnti ai prezzi del tempo base, ossia: Pt = 100* (∑ pt qt)/ (∑ p0 qt). – La formula ideale di Fisher, che è la media geometrica di Lt e Pt e cioè la radice quadrata del loro prodotto. I numeri indice complessi delle quantità Analogamente all’indice dei prezzi, l’indice delle quantità di un aggregato di n beni può essere ottenuto con: – La formula di Laspeyres, che è il rapporto tra il valore di quantità correnti degli n beni con prezzi fissi del tempo base e il valore effettivo degli stessi n beni al tempo base, ossia: Qt = 100*(∑ p0 qt)/ (∑ p0 q0). – La formula di Paasche è il rapporto tra il valore effettivo delle quantità correnti degli n beni ai prezzi correnti e il valore, ai prezzi correnti, delle n quantità del tempo base, ossia: 100* (∑ pt qt)/ (∑ pt qo). – Fisher ha proposto come formula ideale delle quantità la radice quadrata del prodotto degli indici di Laspeyres e di Paasche.