Sei sulla pagina 1di 32

Statistica (corso E)

Anno accademico 2021-’22

Introduzione e concetti preliminari

Lucio Masserini
Introduzione

… alcune frasi celebri sulla statistica


► Una breve raccolta di aforismi, frasi e battute divertenti sulla statistica e sugli statistici.
• Ci sono tre generi di bugie: le bugie, le maledette bugie e le statistiche (Benjamin Disraeli).
• Le statistiche dicono che uno su quattro soffre di qualche malattia mentale. Pensa ai tuoi tre
migliori amici. Se stanno bene, vuol dire che sei tu (Rita Mae Brown).
• Non mi fido molto delle statistiche, perché un uomo con la testa nel forno acceso e i piedi nel
congelatore statisticamente ha una temperatura media (Charles Bukowski).
• Se vuoi ispirare fiducia, dai molti dati statistici. Non importa che siano esatti, neppure che siano
comprensibili. Basta che siano in quantità sufficiente (Lewis Carroll).
• Le sole statistiche di cui ci possiamo fidare sono quelle che noi abbiamo falsificato (Winston
Churchill).
• Se sei a corto di argomenti, usa la statistica. Nessuno starà a fare i calcoli necessari a contraddirti
(Arthur Bloch - La legge di Murphy).
• …
Introduzione

… il libro più letto di statistica


► How to Lie with Statistics (Darrell Huff, 1954):
• … presentato ironicamente dall’autore come “una specie di breviario su come usare le statistiche
per ingannare”…
• … il libro è in realtà un brillante corso di autodifesa contro
distorsioni e manipolazioni delle informazioni attraverso l’uso
di dati statistici.

Il linguaggio segreto della statistica, così seducente in una cultura che ama nutrirsi
di fatti e dati, è usato per sensazionalizzare, gonfiare, confondere e semplificare.
Metodi e termini statistici sono necessari per riferire i dati di massa di tendenze
sociali ed economiche, situazioni ambientali, sondaggi di "opinione" e censimenti. Ma
se chi scrive non usa i termini con onestà e conoscenza, e chi legge non sa che cosa
significano, il risultato è completamente privo di senso.
Darrell Huff
Introduzione

… alcune statistiche sulla nostra vita


► Durante la propria vita, in media ciascuno di noi impiega il proprio tempo in questo modo …
• … 6 𝑚𝑒𝑠𝑖 al telefono
• … circa 3 𝑚𝑒𝑠𝑖 in bagno…
• … circa 6 𝑔𝑖𝑜𝑟𝑛𝑖 ad allacciarsi le scarpe
• … circa 5 𝑔𝑖𝑜𝑟𝑛𝑖 ad inserire password
• … 250𝑚𝑖𝑙𝑎 sbadigli
• … 120𝑚𝑖𝑙𝑎 chilometri a piedi
• … mangiare 35 𝑡𝑜𝑛𝑛𝑒𝑙𝑙𝑎𝑡𝑒 di cibo…
• … 38 𝑔𝑖𝑜𝑟𝑛𝑖 in attesa del verde al semaforo (in auto) e 69 𝑔𝑖𝑜𝑟𝑛𝑖 in attesa del verde (a piedi)
• … 76 𝑔𝑖𝑜𝑟𝑛𝑖 a farsi la barba
• … 2 𝑠𝑒𝑡𝑡𝑖𝑚𝑎𝑛𝑒 baciando …
• …
Introduzione

… qualche statistica sull’utilizzo dei social media in Italia


► Le statistiche mostrano l’interesse sempre crescente degli italiani verso l’utilizzo dei social media nel
2019…
Introduzione

… la statistica ufficiale dell’Istat


► Le statistiche ufficiali dell’Istat (Istituto nazionale di statistica), ad esempio quelle sulla tendenza
demografica della popolazione residente, dei nati e dei cittadini stranieri, nel 2008 e 2018…

2008 2018

Popolazione 58.652.875 60.483.973 +3,1%


Nati 576.659 439.747 −23,7%
Cittadini stranieri 3.432.651 (5,9%) 5.144.440 (8,5%) +49,9%
Introduzione

… ancora la statistica ufficiale dell’Istat


► Per esempio, l’indagine “Aspetti della vita quotidiana”, realizzata annualmente dall’Istat su un
campione di circa 24 mila famiglie, consente di stimare la percentuale di cittadini più soddisfatti per
la situazione economica e la vita nel complesso…
Introduzione

Ambito di applicazione della statistica


► La Statistica rappresenta il momento empirico di tutte le discipline scientifiche ed economico-
sociali, pertanto i suoi campi di applicazione sono numerosi e molto differenti tra loro:
• Economia
• Economia aziendale, Finanza e Marketing
• Scienze sociali
• Demografia
• Medicina e biologia
• Giurisprudenza
• Fisica, Chimica e Ingegneria
• Scienze ambientali
• Sistemi logistici
• …
Introduzione

Ambito di applicazione della statistica


► In Economia:
• misura dell’inflazione
• misura del Prodotto interno lordo (PIL)
• misura della povertà e della disuguaglianza sociale
• misura dell’occupazione e della disoccupazione
• analisi della crescita economica, tasso di sviluppo dei paesi
• importazioni ed esportazioni
• previsioni economiche
• …
Introduzione

Ambito di applicazione della statistica


► In Economia aziendale e Finanza:
• analisi degli indici di bilancio e controllo di gestione (indicatori)
• controllo di qualità dei prodotti e dei processi produttivi
• andamento delle vendite (analisi di serie storiche)
• tecniche di campionamento nella revisione dei conti
• analisi dei mercati finanziari
• andamento dei titoli (analisi di serie storiche)
• …

► Nel Marketing e nelle Ricerche di mercato:


• indagini sulle abitudini e i comportamenti dei consumatori
• tecniche di segmentazione del mercato
• analisi delle preferenze
• misura dell’efficacia della pubblicità
• ricerche per la definizione di nuovi prodotti
• …
Introduzione

Ambito di applicazione della statistica


► Nelle Scienze sociali e demografiche:
• analisi della qualità della vita
• rilevazione delle preferenze politiche
• sondaggi d’opinione
• …
• natalità, mortalità
• invecchiamento della popolazione
• previsioni demografiche
• flussi migratori
• …
Introduzione

… la statistica e i dati
► Grandi quantità di dati sono costantemente raccolti grazie a potenti sistemi informativi e sono a
disposizione delle aziende (dati su clienti, vendite, comportamenti di acquisto, carte fedeltà, log dei
siti internet, smartphone, gps, dati di testo, dati video, dati di social media, micro-blog, etc.) →
𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑎, 𝐵𝑢𝑠𝑖𝑛𝑒𝑠𝑠 𝑖𝑛𝑡𝑒𝑙𝑙𝑖𝑔𝑒𝑛𝑐𝑒, 𝐵𝑖𝑔 𝐷𝑎𝑡𝑎 e 𝐷𝑎𝑡𝑎 𝑠𝑐𝑖𝑒𝑛𝑐𝑒.
Introduzione

Alcune citazioni autorevoli


► Ci sono altre opinioni sulla statistica:
• La statistica è l’elemento fondamentale affinché i cittadini possano formarsi in modo
consapevole (Giorgio Napolitano).
• La statistica è diventata per me una metodologia di riferimento quotidiano (Carlo Azeglio
Ciampi).
• La statistica è fondamentale per il “disegno” della politica economica (Mario Draghi).
• Credo sia fondamentale avere una statistica indipendente (Luca Cordero di Montezemolo).
• Il valore profondo dell’uso della statistica nella ricerca demoscopica è offrire un quadro
conoscitivo (Nando Pagnoncelli).
• Lo spirito del metodo statistico mi ha fornito un potente aiuto per dare forma e coerenza alla
fantasia (Franco D’Andrea).
Concetti preliminari

La statistica
► La statistica è una disciplina che fornisce gli strumenti concettuali e i metodi per la raccolta, la
descrizione, l’analisi e la rappresentazione sintetica dei dati per lo studio dei fenomeni collettivi
(sociali, economici e naturali).

Tuttavia, nel linguaggio di tutti i giorni, con il termine «statistica» si indicano più semplicemente
i risultati numerici (le cosiddette «statistiche» richiamate dai mass media, come ad esempio
l’inflazione, il PIL, il tasso di disoccupazione, etc.) che derivano da un processo di sintesi dei
dati osservati → indici statistici.
Concetti preliminari

La terminologia di base
► Innanzitutto, è necessario introdurre il vocabolario statistico di base:
• Fenomeno collettivo
• Unità statistica
• Popolazione (o collettivo statistico)
• Campione
• Carattere statistico (o variabile)
• Modalità
Concetti preliminari

Il fenomeno collettivo
► Un fenomeno collettivo (o di massa) è un qualunque fatto o aspetto osservabile il cui studio
riguarda una pluralità di individui, definiti unità statistiche.

Esempi
• I consumi delle famiglie italiane
• Il livello di disoccupazione nei paesi UE
• Il grado di soddisfazione degli utenti di un’azienda rispetto al servizio erogato
• La spesa di un insieme di turisti per il soggiorno in una certa località
• La scelta di acquisto di un prodotto da parte uno studente del corso di Statistica → (???)
Concetti preliminari

Le unità statistiche
► Le unità statistiche (𝑢𝑠) sono i singoli elementi omogenei tra di loro che compongono il collettivo
oggetto di studio e costituiscono la base per la successiva osservazione, rilevazione e analisi.
• Unità semplici: se formate da un unico elemento non scomponibile ulteriormente
• Unità composte: se costituite da più unità semplici

Esempi
• Individui (cittadini, clienti di un’azienda, consumatori di un prodotto, famiglie, …)
• Oggetti (automobili, TV led, smartphone, …)
• Entità (aziende, ospedali, università, ipermercati, …)
• Aggregati territoriali (stati, regioni, province, comuni, città, località, …)
• Unità temporali (anni, trimestri, mesi, settimane, giorni, …)
Concetti preliminari

La popolazione
► La popolazione (collettivo statistico o universo) è l’insieme di tutte le unità statistiche che
riguardano il fenomeno collettivo oggetto di studio. La numerosità totale delle unità di una
popolazione si indica con 𝑵.
• Popolazione reale: quando è effettivamente già esistente e visibile
• Popolazione potenziale: quando non è osservabile, perché astratta o connessa al futuro

Esempi
• Consumi delle famiglie italiane nel 2019 → collettivo delle famiglie italiane del 2019
• Soddisfazione degli utenti di un servizio → utenti del servizio
• Posti letto negli alberghi della città di Pisa → alberghi di Pisa
• Fatturato annuo delle aziende toscane → aziende toscane
• Vendite del mercato auto → acquirenti futuri di modelli non ancora usciti sul mercato
Concetti preliminari

La statistica descrittiva
► La statistica descrittiva fornisce i metodi per la raccolta (o rilevazione), la classificazione, la sintesi e
la rappresentazione grafica dei dati allo scopo di descrivere le caratteristiche principali di un
fenomeno collettivo osservato su tutte le 𝑵 unità che compongono una popolazione.

La statistica inferenziale
► La statistica inferenziale (o inferenza statistica) fornisce i metodi
che consentono di trarre conclusioni sulle caratteristiche di una
popolazione (stimare) a partire dall’osservazione di un
campione, selezionato mediante una procedura casuale →
induzione probabilistica (processo di generalizzazione alla
popolazione dei risultati osservati su un campione).
 Un campione è un qualsiasi sotto-insieme di 𝒏 unità
statistiche derivato da una popolazione e finalizzato ad uno
studio statistico.
Concetti preliminari

I caratteri statistici o variabili


► I caratteri statistici (o variabili) rappresentano le caratteristiche che vengono rilevate per descrivere
le unità statistiche (di una popolazione o di un campione). È tipico dei fenomeni reali di interesse
statistico che i caratteri assumano valori differenti nelle varie unità statistiche.

Esempi
• Unità: individui → genere, età, titolo di studio, professione, altezza, peso, consumi, …
• Unità: aziende → numero di dipendenti, utile netto, fatturato, settore di attività, …
• Unità: automobili → cilindrata, accelerazione, velocità, peso, …
• Unità: regioni → numero di abitanti, densità abitativa, numero di comuni, …
• …
Concetti preliminari

Le modalità
► Le modalità sono i possibili modi o valori (numerici o non numerici) che può assumere un carattere
(o una variabile) nelle unità statistiche del collettivo.

Esempi
• Età (anni) → Modalità: 22, 37, 42, 25, …
• Titolo di studio → Modalità: laurea, diploma, licenza media, …
• Dimensione schermo smartphone → Modalità: 5,2 pollici; 5,8 pollici; 6,0 pollici, …
• …

► Le modalità devono essere:


• esaustive: devono comprendere tutti i possibili modi di manifestarsi di un carattere.
• non sovrapposte: ogni unità statistica non può assumere modalità diverse di uno stesso
carattere.
Concetti preliminari

Le modalità: esempio
► Le modalità di ciascun carattere devono essere esaustive e non sovrapposte. Ad esempio, la
classificazione in base alla cittadinanza dei turisti che si sono recati in una certa località potrebbe
assumere la seguente forma (𝑎 o 𝑏):
𝒂)
Cittadinanza
Italiana Le modalità del carattere 𝒃)
Francese “nazione” sono sovrapposte e Cittadinanza
non esaustive (𝑎)
Inglese Italiana
Tedesca Francese
Le modalità sono
Europea Inglese esaustive e non
Tedesca sovrapposte (𝑏)
Canadese
Statunitense Canadese
Statunitense
Altro
Concetti preliminari

Caratteri, modalità e unità statistiche


► Un carattere (o una variabile) si indica generalmente con una lettera maiuscola:

𝑋, 𝑌, … , 𝑍

► Le modalità distinte che un carattere può assumere si indicano invece con la corrispondente lettera
minuscola per 𝑗 = 1, 2, … , 𝐾 :

𝑋 → 𝑥1 , 𝑥2 , … , 𝑥𝑗 , … , 𝑥𝐾

► Le modalità di un carattere osservate sulle singole unità statistiche di una popolazione di


numerosità 𝑁 (𝑝𝑒𝑟 𝑖 = 1, 2, … , 𝑁) si indicano invece nel modo seguente:

𝑋 → 𝑥1 , 𝑥2 , … , 𝑥𝑖 , … , 𝑥𝑁
Concetti preliminari

Caratteri, modalità e unità statistiche: esempio


► Si osserva il carattere (o una variabile) 𝑿 → Titolo di studio (composto da 4 𝑚𝑜𝑑𝑎𝑙𝑖𝑡à) su una
popolazione di 5 𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖.

• Modalità: licenza elementare, licenza media, diploma, laurea → 𝐾 = 4


𝑥1 = licenza elementare
𝑥2 = licenza media
𝑥3 = diploma
𝑥4 → 𝑥𝐾 = laurea

• Popolazione: Francesco (1), Claudia (2), Maria Cristina (3), Lorenzo (4), Sara (5) → 𝑁 = 5
𝑥1 (Francesco) = laurea
𝑥2 (Claudia) = laurea
𝑥3 (Maria Cristina) = licenza media
𝑥4 (Lorenzo) = diploma
𝑥5 → 𝑥𝑁 (Sara) = licenza elementare
Classificazione dei caratteri statistici

Lo schema
► I caratteri statistici (o variabili) si distinguono in base al modo in cui sono espresse le modalità:

Caratteri o variabili

Trasferibili o
Qualitativi Quantitativi non trasferibili

Sconnessi Ordinati Discreti Continui

Rettilinei
o ciclici
Classificazione dei caratteri statistici

Lo schema: dettaglio
► I caratteri statistici si distinguono in base al modo in cui sono espresse le modalità:
• qualitativi: le modalità sono attributi o qualità non numeriche
• quantitativi: le modalità sono quantità numeriche
 trasferibili: quando ha senso immaginare che una unità statistica possa cedere tutto o parte
del carattere posseduto a un’altra unità statistica
 non trasferibili: in tutti gli altri casi.

► I caratteri qualitativi si dicono anche «variabili qualitative» o «mutabili statistiche», i caratteri


quantitativi si dicono invece «variabili quantitative».
Classificazione dei caratteri statistici

I caratteri qualitativi sconnessi


► I caratteri qualitativi sconnessi presentano modalità non ordinabili.

Apple Samsung Huawei Blackberry LG Sony

• Le modalità sono nomi o attributi.


• A volte si assegnano numeri alle modalità che servono solo ad identificarle (codifica) ma la
natura del carattere rimane immutata.

Esempi
• Marca smartphone → Samsung (1), Apple (2), Huawei (3), …
• Nazione di residenza → Italia (1), Germania (2), Francia (3), …
• Colore degli occhi → neri (1), castani (2), azzurri (3), verdi (4), …
• Sesso → femmine (1), maschi (2), …
Classificazione dei caratteri statistici

I caratteri qualitativi ordinati


► I caratteri qualitativi ordinati presentano modalità ordinabili.

• Rettilinei: possiedono una modalità iniziale e una finale.

Per niente Poco Abbastanza Molto


Esempi
• Grado di soddisfazione → per niente, poco, abbastanza, molto
• Titolo di studio → nessun titolo, licenza elementare, licenza media, diploma, laurea,
• Stato di salute → pessimo, … , buono

• Ciclici: le modalità estreme sono molto prossime tra loro.

Esempi
• Mesi dell’anno → gennaio, febbraio, …, luglio, …, dicembre
• Giorni della settimana → lunedì, martedì, …, sabato, domenica
• Direzione del vento → Tramontana, Grecale, …, Maestrale
Classificazione dei caratteri statistici

I caratteri quantitativi discreti


► I caratteri quantitativi discreti presentano modalità espresse da numeri interi (in numero finito o
un’infinità numerabile).

0 1 2 3 4 5 6 7

• I valori assunti dalle modalità sono ottenuti di solito da un conteggio.

Esempi
• Numero di confezioni di pasta acquistate in un mese → Modalità: 2, 1, 0, 5
• Numero di figli → Modalità: 0, 2, 3, 1, …
• Voto ad un esame → Modalità: 27, 25, 30, 18, …
Classificazione dei caratteri statistici

I caratteri quantitativi continui


► I caratteri quantitativi continui possono assumere qualsiasi valore contenuto in un intervallo
reale → sottoinsieme di 𝑅.

0 1 2 3 4 5 6 7

• I valori assunti dalle modalità sono ottenuti da una misurazione.

Esempi
• Peso di una persona (kg) → Modalità: 62,27231 kg; 51,18 kg; 74,83 …
• Larghezza smartphone (cm) → Modalità: 5,86 cm; 7,62 cm; 6,55 cm …
• Spesa per consumi (€) (?) → Modalità: 212,75 €; 117,22 €; 485,98 € …

• Osservazione: un carattere è continuo solo sul piano concettuale poiché, in pratica, questo
viene sempre reso discreto per l’esigenza di approssimare le misurazioni dei fenomeni reali. Per
esempio, il carattere peso potrebbe essere arrotondato agli ettogrammi (66,0 kg, 67,0 kg, 68,2 kg,
…) rendendolo discreto anche se questo per sua natura è continuo.
I dati

La matrice dei dati


► La matrice dei dati è una tabella rettangolare in cui sono riportati i dati raccolti su ciascuna unità
statistica rispetto ad una molteplicità di caratteri (o variabili):
• ogni riga corrisponde ad una unità statistica
• ogni colonna corrisponde ad un carattere (o variabile)

Unità Età Genere Metodo di Spesa Numero Titolo di studio


statistica pagamento di acquisti
𝑢1 27 Maschio Carta di credito 522,50 3 Diploma
𝑢2 22 Femmina Carta prepagata 687,00 4 Licenza media
𝑢3 76 Femmina Paypol 187,25 1 Elementare
… … … … … … …
𝑢𝑖 21 Femmina Contrassegno 25,50 1 Diploma
… … … … … … …
𝑢𝑁 37 Maschio Carta di credito 387,00 2 Laurea

Dato statistico
I dati

Dati e informazione statistica


► I dati statistici, in forma «grezza», rappresentano la materia prima su cui si basa l’analisi statistica.
Tuttavia, i dati grezzi non sono immediatamente fruibili e necessitano di essere elaborati per
diventare informazioni, in modo da aiutare a comprendere il fenomeno considerato.

Esempio
Se il fenomeno collettivo riguarda l’analisi delle abitudini di vita e di consumo dei cittadini italiani:
• dato statistico → spesa per l’acquisto di beni alimentari di ciascun individuo è un dato
• informazione statistica in grado di descrivere il fenomeno oggetto di studio
→ spesa media di tutti gli individui del collettivo
→ percentuale di quanti spendono più di 500 euro al mese
→ …

Potrebbero piacerti anche