Sei sulla pagina 1di 11

Lezione 1

Lezione 1

Nozioni introduttive

Esempi di rilevazioni statistiche si registrano fin dalle prime civiltà, per conoscere
la realtà circostante e trovare soluzioni a problemi di varia natura. Più in
particolare, le prime indagini statistiche avevano l’obiettivo di reperire
informazioni sul numero di uomini che potevano combattere, sull’estensione del
territorio e sulla ripartizione delle superfici coltivabili.

Nei tempi attuali siamo sommersi da informazioni ottenute mediante indagini


statistiche da parte dei mass media e queste informazioni riguardano campi molto
diversi fra loro. Solo per citare alcuni dei più frequenti campi di applicazione dei
metodi statistici si possono ricordare

- Studi sulla popolazione, sondaggi, indagini su atteggiamenti e preferenze


- Analisi finanziarie
- Controlli di qualità, marketing
- Sperimentazione farmacologica, agraria e zootecnica
- Analisi del DNA reperito sui luoghi di delitti
- Riconoscimento di autori di scritti apocrifi o di altre opere d’arte

I metodi statistici vengono utilizzati da ricercatori, governi, imprese, sindacati,


amministrazioni pubbliche, meteorologi, forze dell’ordine, agricoltori, chimici,
biologi… Per esempio:

- un amministratore pubblico necessita di informazioni sugli abitanti di una


certa zona per decidere interventi sui mezzi di trasporto oppure in campo
sanitario o scolastico
- una banca ha bisogno di conoscere le caratteristiche dei suoi clienti per
migliorare i servizi offerti
- un’azienda necessita di informazioni per produrre articoli che rispondano
alle aspettative dei potenziali consumatori

1
Lezione 1

Esempi comuni di risultati che derivano da elaborazioni statistiche sono: il PIL, il


tasso disoccupazione, il tasso di inflazione, l’indice della produzione industriale,
il tasso di natalità, l’invecchiamento della popolazione

Dietro quei dati ci sono le tecniche statistiche e queste tecniche sono utilizzate per
stabilire i metodi di campionamento, la costruzione dei questionari e le modalità
di somministrazione degli stessi, i diversi metodi con cui si possono analizzare i
dati, le valutazioni a carattere probabilistico.

Lo scopo di questo corso è chiarire cosa sia la statistica, a cosa serva e come vada
usata per valutare, prevedere e decidere e tutto questo deve essere fatto in modo
corretto, evitando di farsi imbrogliare da parte di chi non sa usare i metodi
statistici in modo corretto o distorce volutamente i risultati.

Il passaggio dai dati statistici a informazione e conoscenza non è infatti


automatico: viviamo immersi nelle notizie, nelle immagini e nei numeri, ma è
necessario porsi domande circa la loro attendibilità.

Durante questo corso verranno perciò illustrate le analisi statistiche più comuni
e il modo in cui devono essere interpretati i risultati ottenuti.

Per esempio, nella fase di lettura dei risultati ottenuti da una qualsiasi indagine
statitica è opportuno

- analizzare le tabelle piuttosto che i grafici, chiedersi da quale fonte


provengono i dati e come sono stati raccolti (sondaggi telefonici,
questionari auto-compilati, interviste dirette), come sono state trattate le
mancate risposte, quanto grande è il campione
- leggere sempre le note e controllare se esistono indagini condotte da altri
soggetti per confrontare i diversi risultati.
- come regola generale è bene diffidare di statistiche che sostengono la
promozione di un certo prodotto

2
Lezione 1

Cos’è la Statistica

Non è possibile dare una definizione esaustiva di Statistica, ma in prima


approssimazione si può affermare che fornisce gli strumenti per ottenere
informazioni su un fenomeno di interesse. Più precisamente, viene utilizzata per
determinare i metodi per la rilevazione e la raccolta dei dati, la loro
rappresentazione e successiva interpretazione sia per scopi puramente
conoscitivi, sia per prendere una qualche decisione, spesso in situazioni di
incertezza (come quando si vuole valutare l'efficacia di un farmaco o di un
fertilizzante, i tempi di conservazione di un alimento, la quota di articoli difettosi
prodotti da un macchinario).

La raccolta dei dati può essere anche finalizzata a esaminare le variazioni di un


certo fenomeno in un arco di tempo: variazioni dei consumi, andamento del PIL o
del tasso di inflazione, rendimento di un titolo. In queste situazioni la raccolta dei
dati è effettuata su uno stesso insieme di unità considerate in diversi istanti
temporali e si parla di studi longitudinali (un esempio è la rilevazione dei CFU
ottenuti da gruppo di studenti universitari durante il corso di studi).

In tutti i casi considerati c’è una caratteristica costante: i fenomeni oggetto di


indagine si manifestano in modo variabile sulle diverse unità.

3
Lezione 1

TERMINI STATISTICI DI USO COMUNE

Con l’uso dei termini popolazione, collettività o collettivo statistico si fa


riferimento a un insieme di unità omogenee rispetto a una o più caratteristiche.

Occorre individuare con precisione le caratteristiche che deve avere un’unità per
fare parte di una certa popolazione (per esempio: per individuare un collettivo di
neonati occorre indicare luogo e data di nascita, se si tratta dei soli figli legittimi
o anche di quelli naturali, se si intendono i soli nati vivi o anche i nati morti).

Esempi di popolazioni sono:

- i residenti a Siena il 31 dicembre del 2015,


- le aziende agricole operanti in Toscana nel mese scorso,
- gli immigrati clandestini arrivati in Italia nello scorso anno solare,
- i faggi presenti in un parco naturale l’autunno scorso,
- i lavoratori in nero del 2017,

Ciascun elemento che costituisce la popolazione è detta unità statistica (o


semplicemente unità) ma un’unità statistica può essere costituita da un gruppo di
soggetti, come nel caso si rilevino i dati per famiglie, aziende, branchi di animali.

La lista delle unità che compongono le popolazioni non è sempre disponibile (in
alcuni casi si studiano popolazioni dette elusive, come nel caso di immigrati
clandestini, lavoratori in nero, popolazioni biologiche costituite da alberi o
animali).

Per le popolazioni con lista è, in teoria, possibile rilevare i dati di interesse su ogni
unità e in questi casi si parla di censimento o rilevazione totale. Per esempio,
l’ISTAT (Istituto Nazionale di Statistica) effettua regolarmente il censimento
generale della popolazione, il censimento delle abitazioni (abbinato al
precedente), il censimento industriale e commerciale e il censimento
dell’agricoltura. Queste rilevazioni totali hanno però diversi inconvienenti, quali

4
Lezione 1

- gli elevati costi dell’indagine


- le difficoltà di reperimento delle unità statistiche e di rilevazione dei dati
- l’impossibilità di terminare la rilevazione e l’analisi dei dati in tempi brevi

Per questi motivi nella maggior parte dei casi la rilevazione non è totale, ma solo
parziale, ossia viene effettuata su un numero limitato di unità statistiche. In
numerose situazioni reali, inoltre, sono possibili solo rilevazioni di tipo parziale
come accade nei controlli di qualità (per valutare la durata delle batterie di un
telefono cellulare, la resistenza alla rottura dei fogli di carta prodotti con un
macchinario, il tempo di ossidazione di una certa sostanza).

In altre situazioni le indagini possono essere effettuate sulle sole unità


effettivamente disponibili (come accade per ricerche paleontologiche o
archeologiche), mentre nelle ricerche sperimentali l’interesse si rivolge a
collettività virtuali ossia a unità potenziali (non si può pensare di somministrare
un farmaco a tutti i malati, nè un fertilizzante a tutte le piante)

L’insieme delle unità rilevate nelle indagini parziali viene detto campione.

Le tecniche statistiche utilizzate nelle rilevazioni campionarie saranno


l’argomento principale della seconda parte del corso e, come vedremo, il loro
obiettivo è quello di fornire indicazioni circa il fenomeno di interesse su tutta la
popolazione da cui il campione è stato estratto.

Nella prima parte del corso si analizzeranno le tecniche utilizzate nella statistica
descrittiva che si occupa della raccolta, della presentazione e della sintesi di un
insieme di dati.

Nella seconda parte si passerà alla statistica inferenziale che studia una
caratteristica ignota della popolazione o consente di prendere decisioni in
condizioni di incertezza

5
Lezione 1

Si indicherà con

N la numerosità della popolazione,

n la numerosità del campione (con n < N), dove il rapporto n/N è la cosiddetta
frazione di campionamento

Per semplicità, però, faremo riferimento a n unità anche nella prima parte del
corso, senza specificare se le unità provengono da un campione o da una
popolazione, dato che le elaborazioni statistiche restano le medesime in entrambe
le situazioni.

La variabile (o carattere) X è quel particolare aspetto delle unità statistiche che


costituisce l'oggetto dell'indagine.

Per esempio, su un insieme di persone si può studiare: età, stato civile, religione,
professione, titolo di studio, reddito, numero di smartphone posseduti, …

Le diverse manifestazioni che la variabile assume sulle singole unità sono dette
determinazioni (per esempio, la variabile “titolo di studio” assume le
determinazioni: nessun titolo, licenza elementare, licenza media, diploma, laurea)

Le determinazioni assunte dalla X su ciascuna unità sono dette osservazioni.

Indicando con xi l’i-esima osservazione, ovvero la determinazione assunta dalla


variabile X sull’i-esima unità (con i = 1, 2, …, n), la sequenza delle n osservazioni
x1, x2, …, xn rappresenta l’insieme dei dati osservati.

6
Lezione 1

CLASSIFICAZIONE DELLE VARIABILI

Tutte le variabili possono essere suddivivise in:

- qualitative (o categoriali)
- quantitative

È detta qualitativa una variabile le cui determinazioni (che vengono chiamate


modalità o categorie) sono espresse mediante aggettivi o sostantivi.

Esempi di variabili qualitative sono: sesso, gruppo sanguigno, colore occhi e


capelli, titolo di studio, livello di soddisfazione per un prodotto o servizio.

Le modalità sono incompatibili ed esaustive, nel senso che

- ciascuna di esse non può coesistere con nessuna delle altre


- la lista delle modalità comprende tutti i modi in cui la variabile può
manifestarsi

È detta quantitativa una variabile le cui determinazioni (che vengono chiamate


valori o intensità) sono espresse mediante valori numerici

Esempi di variabili quantitative sono: reddito, numero di figli, rendimento di un


titolo azionario, voto conseguito all’esame di maturità)

7
Lezione 1

Le variabili qualitative si suddividono in

- ordinabili
- non ordinabili (dette anche sconnesse o sparse)

a seconda che si possa stabilire o meno un ordinamento naturale delle modalità.

Nel primo caso le modalità possono essere elencate secondo un ordine naturale,
nel secondo caso ogni ordinamento risulta arbitrario.

Esempi di variabili non ordinabili sono: sesso, religione, colore degli occhi, stato
civile, luogo di nascita.

Esempi di variabili ordinabili sono: titolo di studio, anno del corso di studi,
qualifica funzionale degli impiegati, grado nella gerarchia militare, la
“dimensione” delle imprese (piccola, media e grande).

Le variabili qualitative si suddividono in

- discrete
- continue

Le variabili discrete derivano generalmente da operazioni di conteggio e possono


assumere un insieme finito o numerabile di valori

Le variabili continue derivano da una qualche misurazione, possono assumere


tutti i valori compresi in un intervallo reale (ossia, possono assumere una infinità
non numerabile di valori diversi).

Esempi di variabili discrete sono: numero dei componenti delle famiglie, numero
di veicoli circolanti, numero di dipendenti di un’azienda e degli sportelli bancari.

Esempi di variabili continue sono: temperatura, statura, peso, altitudine,


superficie coltivabile.

8
Lezione 1

Nelle situazioni concrete, il valore di una variabile continua è misurato in modo


approssimato, con una precisione che dipende dallo strumento di misura
utrilizzato e dagli scopi dell’indagine, ed è quindi finito il numero di
determinazioni distinte effettivamente rilevate (la temperatura si misura
generalmente in gradi, la statura in centimetri, il peso corporeo in chilogrammi).

La distinzione fra variabili è importante nell’organizzazione dei dati, nella


rappresentazione grafica e nelle successive elaborazioni.

Riassumendo:

Sconnessa o non ordinabile


Qualitativa
Ordinabile
Variabile
Discreta
Quantitativa
Continua

9
Lezione 1

SCALE DI MISURA E CAMBIAMENTI DI SCALA

Se la variabile è quantitativa si utilizza una qualche “convenzione” che consente


di esprimere i valori rilevati sulle unità statistiche esaminate.

La statura potrebbe essere misurata in millimetri o centimetri; il peso in chili, etti


o grammi.

La convenzione utilizzata per esprimere i valori di una variabile quantitativa è


detta scala di misura.

Per definire la scala di misura è necessario fissare:

- origine
- unità di misura.

L’origine è quel valore che rappresenta lo zero: valori maggiori e minori di zero
hanno segno rispettivamente positivo e negativo.

L’unità di misura è la quantità posta uguale a uno, in modo che ogni altra quantità
possa essere espressa come multiplo dell’unità di misura utilizzata.

Spesso l’origine è naturale, come per il peso, la statura o il reddito, ma in altri casi
non lo è, come per l'altitudine di una località o la temperatura.

Nell’altitudine, per convenzione, lo zero è al livello del mare, e come unità di


misura si sceglie il metro

Nella temperatura, in Italia si utilizza la scala di misura Celsius, mentre l’unità di


misura è pari a un centesimo della temperatura dell’acqua bollente. Ma esistono
scale di misura diverse, come la Fahrenheit (utilizzata nei paesi anglosassoni).

10
Lezione 1

Per effettuare confronti è necessario utilizzare una stessa scala di misura.

Ogni scala di misura può essere cambiata utilizzando una trasformazione lineare

Y = a + bX,

dove a (con −<a<+) opera una traslazione e produce un cambiamento


dell'origine mentre b (con b>0) è il fattore di scala che modifica l’unità di misura.

Dato il valore xi di X sulla i-esima unità, il valore di Y è yi = a + bxi.

Esercizio:

Data la sequenza di temperature espresse in gradi Celsius (C)

0 5 20

si calcolino le temperature in gradi Fahrenheit (F) sapendo che

9
𝐹 = 𝐶 + 32
5

Applicando la formula si ottengono i seguenti valori

32 41 68

11

Potrebbero piacerti anche