Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Lucio Masserini
Introduzione
Il linguaggio segreto della statistica, così seducente in una cultura che ama nutrirsi
di fatti e dati, è usato per sensazionalizzare, gonfiare, confondere e semplificare.
Metodi e termini statistici sono necessari per riferire i dati di massa di tendenze
sociali ed economiche, situazioni ambientali, sondaggi di "opinione" e censimenti. Ma
se chi scrive non usa i termini con onestà e conoscenza, e chi legge non sa che cosa
significano, il risultato è completamente privo di senso.
Darrell Huff
Introduzione
2008 2018
… la statistica e i dati
► Grandi quantità di dati sono costantemente raccolti grazie a potenti sistemi informativi e sono a
disposizione delle aziende (dati su clienti, vendite, comportamenti di acquisto, carte fedeltà, log dei
siti internet, smartphone, gps, dati di testo, dati video, dati di social media, micro-blog, etc.) →
𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑎, 𝐵𝑢𝑠𝑖𝑛𝑒𝑠𝑠 𝑖𝑛𝑡𝑒𝑙𝑙𝑖𝑔𝑒𝑛𝑐𝑒, 𝐵𝑖𝑔 𝐷𝑎𝑡𝑎 e 𝐷𝑎𝑡𝑎 𝑠𝑐𝑖𝑒𝑛𝑐𝑒.
Introduzione
La statistica
► La statistica è una disciplina che fornisce gli strumenti concettuali e i metodi per la raccolta, la
descrizione, l’analisi e la rappresentazione sintetica dei dati per lo studio dei fenomeni collettivi
(sociali, economici e naturali).
Tuttavia, nel linguaggio di tutti i giorni, con il termine «statistica» si indicano più semplicemente
i risultati numerici (le cosiddette «statistiche» richiamate dai mass media, come ad esempio
l’inflazione, il PIL, il tasso di disoccupazione, etc.) che derivano da un processo di sintesi dei
dati osservati → indici statistici.
Concetti preliminari
La terminologia di base
► Innanzitutto, è necessario introdurre il vocabolario statistico di base:
• Fenomeno collettivo
• Unità statistica
• Popolazione (o collettivo statistico)
• Campione
• Carattere statistico (o variabile)
• Modalità
Concetti preliminari
Il fenomeno collettivo
► Un fenomeno collettivo (o di massa) è un qualunque fatto o aspetto osservabile il cui studio
riguarda una pluralità di individui, definiti unità statistiche.
Esempi
• I consumi delle famiglie italiane
• Il livello di disoccupazione nei paesi UE
• Il grado di soddisfazione degli utenti di un’azienda rispetto al servizio erogato
• La spesa di un insieme di turisti per il soggiorno in una certa località
• La scelta di acquisto di un prodotto da parte uno studente del corso di Statistica → (???)
Concetti preliminari
Le unità statistiche
► Le unità statistiche (𝑢𝑠) sono i singoli elementi omogenei tra di loro che compongono il collettivo
oggetto di studio e costituiscono la base per la successiva osservazione, rilevazione e analisi.
• Unità semplici: se formate da un unico elemento non scomponibile ulteriormente
• Unità composte: se costituite da più unità semplici
Esempi
• Individui (cittadini, clienti di un’azienda, consumatori di un prodotto, famiglie, …)
• Oggetti (automobili, TV led, smartphone, …)
• Entità (aziende, ospedali, università, ipermercati, …)
• Aggregati territoriali (stati, regioni, province, comuni, città, località, …)
• Unità temporali (anni, trimestri, mesi, settimane, giorni, …)
Concetti preliminari
La popolazione
► La popolazione (collettivo statistico o universo) è l’insieme di tutte le unità statistiche che
riguardano il fenomeno collettivo oggetto di studio. La numerosità totale delle unità di una
popolazione si indica con 𝑵.
• Popolazione reale: quando è effettivamente già esistente e visibile
• Popolazione potenziale: quando non è osservabile, perché astratta o connessa al futuro
Esempi
• Consumi delle famiglie italiane nel 2019 → collettivo delle famiglie italiane del 2019
• Soddisfazione degli utenti di un servizio → utenti del servizio
• Posti letto negli alberghi della città di Pisa → alberghi di Pisa
• Fatturato annuo delle aziende toscane → aziende toscane
• Vendite del mercato auto → acquirenti futuri di modelli non ancora usciti sul mercato
Concetti preliminari
La statistica descrittiva
► La statistica descrittiva fornisce i metodi per la raccolta (o rilevazione), la classificazione, la sintesi e
la rappresentazione grafica dei dati allo scopo di descrivere le caratteristiche principali di un
fenomeno collettivo osservato su tutte le 𝑵 unità che compongono una popolazione.
La statistica inferenziale
► La statistica inferenziale (o inferenza statistica) fornisce i metodi
che consentono di trarre conclusioni sulle caratteristiche di una
popolazione (stimare) a partire dall’osservazione di un
campione, selezionato mediante una procedura casuale →
induzione probabilistica (processo di generalizzazione alla
popolazione dei risultati osservati su un campione).
Un campione è un qualsiasi sotto-insieme di 𝒏 unità
statistiche derivato da una popolazione e finalizzato ad uno
studio statistico.
Concetti preliminari
Esempi
• Unità: individui → genere, età, titolo di studio, professione, altezza, peso, consumi, …
• Unità: aziende → numero di dipendenti, utile netto, fatturato, settore di attività, …
• Unità: automobili → cilindrata, accelerazione, velocità, peso, …
• Unità: regioni → numero di abitanti, densità abitativa, numero di comuni, …
• …
Concetti preliminari
Le modalità
► Le modalità sono i possibili modi o valori (numerici o non numerici) che può assumere un carattere
(o una variabile) nelle unità statistiche del collettivo.
Esempi
• Età (anni) → Modalità: 22, 37, 42, 25, …
• Titolo di studio → Modalità: laurea, diploma, licenza media, …
• Dimensione schermo smartphone → Modalità: 5,2 pollici; 5,8 pollici; 6,0 pollici, …
• …
Le modalità: esempio
► Le modalità di ciascun carattere devono essere esaustive e non sovrapposte. Ad esempio, la
classificazione in base alla cittadinanza dei turisti che si sono recati in una certa località potrebbe
assumere la seguente forma (𝑎 o 𝑏):
𝒂)
Cittadinanza
Italiana Le modalità del carattere 𝒃)
Francese “nazione” sono sovrapposte e Cittadinanza
non esaustive (𝑎)
Inglese Italiana
Tedesca Francese
Le modalità sono
Europea Inglese esaustive e non
Tedesca sovrapposte (𝑏)
Canadese
Statunitense Canadese
Statunitense
Altro
Concetti preliminari
𝑋, 𝑌, … , 𝑍
► Le modalità distinte che un carattere può assumere si indicano invece con la corrispondente lettera
minuscola per 𝑗 = 1, 2, … , 𝐾 :
𝑋 → 𝑥1 , 𝑥2 , … , 𝑥𝑗 , … , 𝑥𝐾
𝑋 → 𝑥1 , 𝑥2 , … , 𝑥𝑖 , … , 𝑥𝑁
Concetti preliminari
• Popolazione: Francesco (1), Claudia (2), Maria Cristina (3), Lorenzo (4), Sara (5) → 𝑁 = 5
𝑥1 (Francesco) = laurea
𝑥2 (Claudia) = laurea
𝑥3 (Maria Cristina) = licenza media
𝑥4 (Lorenzo) = diploma
𝑥5 → 𝑥𝑁 (Sara) = licenza elementare
Classificazione dei caratteri statistici
Lo schema
► I caratteri statistici (o variabili) si distinguono in base al modo in cui sono espresse le modalità:
Caratteri o variabili
Trasferibili o
Qualitativi Quantitativi non trasferibili
Rettilinei
o ciclici
Classificazione dei caratteri statistici
Lo schema: dettaglio
► I caratteri statistici si distinguono in base al modo in cui sono espresse le modalità:
• qualitativi: le modalità sono attributi o qualità non numeriche
• quantitativi: le modalità sono quantità numeriche
trasferibili: quando ha senso immaginare che una unità statistica possa cedere tutto o parte
del carattere posseduto a un’altra unità statistica
non trasferibili: in tutti gli altri casi.
Esempi
• Marca smartphone → Samsung (1), Apple (2), Huawei (3), …
• Nazione di residenza → Italia (1), Germania (2), Francia (3), …
• Colore degli occhi → neri (1), castani (2), azzurri (3), verdi (4), …
• Sesso → femmine (1), maschi (2), …
Classificazione dei caratteri statistici
Esempi
• Mesi dell’anno → gennaio, febbraio, …, luglio, …, dicembre
• Giorni della settimana → lunedì, martedì, …, sabato, domenica
• Direzione del vento → Tramontana, Grecale, …, Maestrale
Classificazione dei caratteri statistici
0 1 2 3 4 5 6 7
Esempi
• Numero di confezioni di pasta acquistate in un mese → Modalità: 2, 1, 0, 5
• Numero di figli → Modalità: 0, 2, 3, 1, …
• Voto ad un esame → Modalità: 27, 25, 30, 18, …
Classificazione dei caratteri statistici
0 1 2 3 4 5 6 7
Esempi
• Peso di una persona (kg) → Modalità: 62,27231 kg; 51,18 kg; 74,83 …
• Larghezza smartphone (cm) → Modalità: 5,86 cm; 7,62 cm; 6,55 cm …
• Spesa per consumi (€) (?) → Modalità: 212,75 €; 117,22 €; 485,98 € …
• Osservazione: un carattere è continuo solo sul piano concettuale poiché, in pratica, questo
viene sempre reso discreto per l’esigenza di approssimare le misurazioni dei fenomeni reali. Per
esempio, il carattere peso potrebbe essere arrotondato agli ettogrammi (66,0 kg, 67,0 kg, 68,2 kg,
…) rendendolo discreto anche se questo per sua natura è continuo.
I dati
Dato statistico
I dati
Esempio
Se il fenomeno collettivo riguarda l’analisi delle abitudini di vita e di consumo dei cittadini italiani:
• dato statistico → spesa per l’acquisto di beni alimentari di ciascun individuo è un dato
• informazione statistica in grado di descrivere il fenomeno oggetto di studio
→ spesa media di tutti gli individui del collettivo
→ percentuale di quanti spendono più di 500 euro al mese
→ …