Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Statistica: strumento di comunicazione che informa e tiene in costante aggiornamento il cittadino i numeri trasmettono una informazione obiettiva e trasparente la conoscenza statistica rende pi efficace il processo decisionale a vari livelli, fino alle microdecisioni (esempio: litinerario di uno spostamento in auto deciso in base ai flussi di traffico)
In quasi tutti gli Stati italiani, a met Ottocento, sono istituiti uffici nazionali di statistica, come nella maggior parte dei paesi europei.
Allindomani della proclamazione del Regno dItalia, subito istituito lUfficio Statistico Nazionale (9 ottobre 1861), che assume il rango di Direzione Generale.
LUfficio Nazionale si occupa, oltre che dei censimenti e di alcune indagini speciali, delle rilevazioni correnti nel campo del movimento dello stato civile, dellemigrazione, delle cause di morte, degli ospedali.
LUfficio si occupa della compilazione e pubblicazione dell Annuario statistico.
Alcuni esempi : gli indici dei prezzi, la speranza di vita, il tempo libero
Il problema dei numeri indici dei prezzi e delle quantit una costante, la cui importanza cresce in tempi, come i nostri, in cui le applicazioni si moltiplicano di giorno in giorno. E nel dicembre 1945, con la stipulazione dellaccordo sulla scala mobile tra la Confindustria ed i sindacati dei lavoratori, che nasce lurgenza dei numeri indici, ma il benessere non riducibile ad una mera questione di reddito. Diventa di pubblico interesse considerare anche altre variabili, quali lallungamento della vita umana o laumento del tempo libero, per non correre il rischio di generare errori ed omissioni ben noti agli statistici
10
Il PSN approvato con decreto del Presidente della Repubblica, su proposta del Presidente del Consiglio dei Ministri, previa deliberazione del CIPE (Comitato Interministeriale per la Programmazione Economica)
Con la medesima procedura sono predisposti e approvati gli aggiornamenti del Programma
11
12
I Censimenti
57 milioni di cittadini, 4,3 milioni di imprese dell'industria e dei servizi e 2,6 milioni di aziende agricole. Sono questi i risultati degli ultimi Censimenti generali condotti dall'Istat. I Censimenti, svolti con cadenza decennale, costituiscono un momento conoscitivo di grande rilievo poich consentono di costruire un patrimonio informativo completo, indispensabile per programmare, decidere, valutare.
13
BASI DI DATI
Insieme di dati statistici omogenei memorizzati in una banca dati. Tali dati possono essere elaborati e presentati in varie forme e da differenti soggetti I dati di una banca dati possono essere
rilasciati in varie forme comparabili e omogenei rispetto a dati simili ottenibili da altre banche dati
14
SERIE STORICHE SERIE TERRITORIALI SISTEMA INFORMATIVO DEL LAVORO SISTEMA INFORMATIVO AMBIENTALE SISTEMA INFORMATIVO DEI COMUNICATI STAMPA
15
16
Il ruolo dellEurostat
Scopo principale dellEurostat non la raccolta dei dati (compito delle autorit statistiche dei paesi membri) ma rendere confrontabili (armonizzare) a livello europeo le informazioni statistiche La Statistical Law (Febbraio 1997) adottata dal Consiglio Europeo ripartisce le responsabilit tra autorit statistiche nazionali e quelle comunitarie Lart. 285 del Trattato di Amsterdam (Giugno 1997) garantisce fondamento costituzionale alle statistiche comunitarie (Le informazioni diffuse dallEurostat sono le statistiche ufficiali della UE)
LE STATISTICHE INTERNAZIONALI
ONU (ORGANIZZAZIONE DELLE NAZIONI UNITE) AGENZIE DELLE NU:
Statistical Yearbook FAO alimentazione e agricoltura UNESCO educazione, scienza e cultura OMS organizzazione mondiale della sanit BIT agenzia internazionale del lavoro
17
L'idea ispiratrice del sistema che non debba esistere un punto di vista privilegiato per accedere all'informazione ma che l'utente possa navigare tra le tavole scegliendo indipendentemente il tipo di dati e il livello di dettaglio dei medesimi. Come in ogni Data Warehouse, possibile aumentare il livello di dettaglio, ottenendo informazioni pi analitiche, o diminuirlo, ottenendo informazioni di carattere pi generale, o ancora consultare informazioni diverse al medesimo livello di dettaglio.
18
Le opzioni territorio e tipo di tavola sono tra loro collegate: ad esempio, scegliendo una determinata provincia viene consentita la visualizzazione delle sole tavole disponibili a livello provinciale mentre, viceversa, scegliendo una determinata tavola vengono resi disponibili automaticamente tutti i livelli territoriali per essa previsti.
19
Le tavole riguardano la spesa media mensile delle famiglie residenti in Italia a differenti livelli di dettaglio:
Consente di descrivere, analizzare e interpretare i comportamenti di spesa delle famiglie residenti in Italia. Fornisce informazioni sul livello e sulla struttura della spesa mensile, sulle caratteristiche delle famiglie, delle persone che le compongono, sulle loro condizioni abitative e abitudini di spesa. per gruppi e categorie di spesa, secondo la ripartizione geografica e la regione di residenza della famiglia, la condizione e posizione professionale della persona di riferimento le caratteristiche familiari (numero di componenti e tipologia familiare).
20
Un esempio di risultati
Secondo i dati dellindagine sui consumi condotta dallIstat, nel 2008 la spesa media mensile per famiglia pari, in valori correnti, a 2.485 euro, praticamente uguale a quella dellanno precedente (+0,2%). La variazione, che incorpora sia la dinamica inflazionistica (nel 2008, lindice dei prezzi al consumo per lintera collettivit pari, in media, al 3,3%, con differenze non trascurabili tra i diversi capitoli di spesa) sia la crescita del valore del fitto figurativo , mette in evidenza come a un aumento della spesa media mensile per consumi in termini nominali corrisponda una flessione in termini reali.
Le indagini multiscopo
Le indagini Multiscopo condotte dall'Istat rilevano i comportamenti e gli aspetti pi importanti della vita quotidiana delle famiglie. Ad esempio, lindagine Aspetti della vita quotidiana svolta nel febbraio 2008 riguarda informazioni quali:
la disponibilit presso le famiglie delle nuove tecnologie, il loro utilizzo da parte degli individui, le attivit svolte con Internet, il web come strumento per comunicare e l'e-commerce.
Il campione comprende 19 mila 573 famiglie per un totale di 48 mila 861 persone.
21
22
DATA MINING
Processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l'applicazione di algoritmi che individuano le associazioni "nascoste" tra le informazioni e le rendono visibili e mettono a disposizione dei decisori le informazioni pi significative . L'estrazione di conoscenza (informazioni significative) avviene tramite individuazione delle associazioni, o "patterns", o sequenze ripetute, o regolarit, nascoste nei dati. In questo contesto un "pattern" indica una struttura, un modello, o, in generale, una rappresentazione sintetica dei dati. Il termine data mining utilizzato come sinonimo di knowledge discovery in databases (KDD), anche se sarebbe pi preciso parlare di knowledge discovery quando ci si riferisce al processo di estrazione della conoscenza, e di data mining come di una particolare fase del suddetto processo
ANALISI DEI DATI OBIETTIVO: fornire concetti e strumenti utili per evidenziare gli aspetti salienti dellinformazione disponibile e per quantificare la forza dei suggerimenti che da essi si possono ragionevolmente trarre INFORMAZIONE: espressa in forma codificata e non ambigua (valori numerici, categorie, ecc.) -DATI
23
Statistica
DEFINIZIONE: metodologia che ha come scopo la conoscenza quantitativa dei fenomeni collettivi, ossia dei fenomeni il cui studio richiede losservazione di un insieme di manifestazioni individuali FENOMENI COLLETTIVI
relativi ad una collettivit di casi singoli relativi ad una collettivit di osservazioni di un solo caso o fenomeno
Informazioni non sistematiche possono condurre a conclusioni erronee o parziali impressioni qualitative dei fenomeni
statura M > statura F matrimoni tra persone entrambe giovani o entrambe anziane
Errori
osservazione di una parte del fenomeno per cui si osserva in una specie di animali ad es. una proporzione 1:10 di M e F
24
la ricerca di fattori che influiscono su un fenomeno la ricerca di relazioni che legano i fenomeni la previsione di uno o pi fenomeni tra loro collegati
25
Lindagine statistica
OBIETTIVO: conoscenza di una popolazione intesa come insieme di unit elementari su cui si manifesta il fenomeno da studiare FASI Piano di rilevazione Raccolta dati Classificazione e spoglio dei dati Elaborazione dei dati ------| Interpretazione dei risultati ------| ANALISI DEI DATI
26
Metodo di rilevazione
Indiretto: dati derivati da altre indagini Diretto: questionario Ricavato: pianificazione di prove o test da cui trarre osservazioni di tipo sperimentale
27
Metodo diretto
Piano di codifica Questionari, modelli Fonti di reperimento dei dati
Campionamento
Esempi di campioni probabilistici :
Campione casuale semplice Campione stratificato Campione a pi stadi
28
Metodi di rilevazione
DIRETTO Censimento Campione CAPI, CATI, indagine postale INDIRETTO Base dati OSSERVAZIONE SPERIMENTALE Studio osservazionale Studio sperimentale
29
Lista
COMPLETA deve contenere tutte le unit della popolazione ESATTA le unit della lista individuano univocamente le unit della popolazione AGGIORNATA non devono essere presenti unit che non fanno pi parte della popolazione di riferimento
30
Indiretta
Registri (anagrafici, ad esempio) Procedure amministrative
31
Spoglio singolo
Un solo carattere alla volta: Esempio: sezione elettorale liste voti Lista 1 Lista 2 Lista 3
conteggio 12 16 13
32
Spoglio incrociato
Esempio: studio medico di famiglia Et dei pazienti 13-19 20-59 60
conteggio 18 17 18 14 12 18
14 28 31
33
Distribuzioni statistiche
Semplici
Serie statistica: carattere qualitativo Seriazione statistica: carattere quantitativo
Doppie
Contingenza: due caratteri qualitativi Correlazione: due caratteri quantitativi Miste: un carattere qualitativo, un carattere quantitativo
34
Distribuzioni di frequenza
Distribuzione unitarie e distribuzioni di frequenza e di quantit semplici e multiple La distribuzione semplice di frequenze o quantit Distribuzione unitaria Distribuzione di frequenze Distribuzione unitaria / Distribuzione di frequenze
Distribuzione unitaria
Semplice:
Elencazione delle modalit osservate di un carattere, unit per unit
Multipla:
Elencazione delle modalit di pi caratteri
Osservazioni: Descrive la situazione osservazionale ma non consente di cogliere in modo sintetico le caratteristiche del fenomeno
35
F F M F M
2 1 5 4 3
36
Sesso F M totale
37
Collettivo B
Carattere Stato Civile Nubile/celibe Sposato Divorziato Vedovo Totale Frequenza assoluta 9 20 15 6 50
Dal confronto di tali distribuzioni si pu dedurre che nel collettivo A sono meno numerose le persone non sposate (celibi o nubili) e le persone vedove rispetto alla situazione osservata nel collettivo B (rispettivamente 7 contro 9 e 4 contro 6)
Collettivo B
Carattere Stato Civile Nubile/celibe Sposato Divorziato Vedovo Totale Frequenza percentuale 18 40 30 12 100
In realt, la quota di persone non sposate nel collettivo A (46,7%) di gran lunga superiore (pi del doppio) della corrispondente quota presente nel collettivo B (18%) e lo stesso accade per la modalit vedovo che presente nel 26,6% di casi nel collettivo A e solo nel 12% di individui del collettivo B
38
Frequenze cumulate
Si calcolano a partire dalle distribuzioni di frequenza |assoluta, relativa o percentuale| per i caratteri ordinati rettilinei La frequenza per ogni data classe ottenuta come somma della corrispondente frequenza e di tutte quelle precedenti
Fj= f1+ f2+.. fj Valutazione sufficiente Medio-bassa Media Medio-alta Alta Totali Freq. Freq. cum. 60 70 20 60 30 240 60 130 150 210 240 % 25 29.17 8.33 25 12.5 100 % cum 25 54.17 62.5 87.5 100 Osservazioni: Le freq. cumulate consentono di individuare immediatamente il numero di unit che hanno ottenuto una valutazione al di sotto di un certo livello
La distribuzione di quantit
Sesso Ammontare di reddito in migliaia di euro 88 53 141
Le distribuzioni di quantit si ottengono misurando lammontare di un carattere quantitativo sullinsieme delle unit del collettivo che presentano la medesima modalit
39
Distribuzioni doppie
Tabelle a doppia entrata Distribuzioni doppie di frequenze relative o percentuali Trasformazione di variabili e modifiche nelle distribuzioni doppie dipendenza indipendenza interdipendenza
Distribuzioni condizionate
Totale 470 521 991
sesso Totale
maschio femmina
40
Tavola di contingenza sesso * abitudine di guardare la tv abitudine di guardare la tv no si 11 459 2,3% 97,7% 42,3% 1,1% 15 2,9% 57,7% 1,5% 26 2,6% 100,0% 2,6% 47,6% 46,3% 506 97,1% 52,4% 51,1% 965 97,4% 100,0% 97,4%
sesso
maschio
femmina
Totale
Conteggio % entro sesso % entro abitudine di guardare la tv % del totale Conteggio % entro sesso % entro abitudine di guardare la tv % del totale Conteggio % entro sesso % entro abitudine di guardare la tv % del totale
Le distribuzioni relative condizionate (profili di riga o di colonna) del carattere X e del carattere Y si ottengono rispettivamente rapportando le distribuzioni condizionate per i corrispondenti totali di riga o di colonna. Diventano percentuali se moltiplicate per 100. entro carattere = condizionate a tale carattere
Le distribuzioni di frequenza doppie si possono determinare sia per coppie di caratteri dello stesso tipo, sia per coppie di caratteri di tipo diverso. Particolare attenzione tuttavia va prestata alle distribuzioni di caratteri quantitativi, specie quando assumono un numero di valori molto elevato (o addirittura pari a quello delle unit osservate).
In tal caso la tabella presenter molto celle con frequenza nulla . E pertanto opportuno procedere ad una aggregazione in classi
41
Osservazioni: La variabile quantitativa stata aggregata in classi Il numero di celle della tabella si ridotto Si ottiene una maggiore sintesi dellinformazione
Report tempo in ore passato ad ascoltare la radio sesso Media Mediana maschio 1,76 1,00 femmina 1,98 2,00 Totale 1,87 2,00 Deviazione std. 1,73 1,55 1,64 N 290 312 602
Suicidi e tentativi di suicidio accertati per 100.000 abitanti zona geografica nord-ovest nord-est centro sud isole Totale Media 23,752 18,032 14,116 7,559 12,548 14,703 N 4 4 4 6 2 20 Deviazione std. 11,426 5,617 5,945 3,974 ,600 8,462
42
43