Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Il termine STATISTICA deriva dalla parola STATO, già gli antichi Romani facevano “censimenti” per
contare gli abitanti e per conoscere le loro caratteristiche: età, professione,ecc.
I censimenti sono indagini statistiche che riguardano l’intera popolazione residente nello stato.
Per ragioni economiche spesso le indagini statistiche riguardano un CAMPIONE e non l’intera
popolazione, in tal caso è essenziale che il campione sia rappresentativo altrimenti l’indagine
statistica darebbe risultati errati.
Esempio: per stimare quante persone vanno al cinema in un mese, non bisogna rilevare i dati nelle
vicinanze di una sala cinematografica perché il campione non sarebbe rappresentativo ( alcune
persone potrebbero percorrere quella strada proprio perché vanno al cinema!).
Un grave errore in questo senso è stato commesso negli Stati Uniti quando si stava facendo una
sondaggio telefonico, pre-elettorale, per capire quale dei due candidati alla Casa Bianca avesse
maggiore probabilità di vincere. Poiché in quegli anni, solo la popolazione più ricca e istruita aveva
un telefono in casa, il campione intervistato non era rappresentativo avendo privilegiato la parte
più abbiente della popolazione che era spesso repubblicana. Il risultato del sondaggio infatti, si
rivelo’ completamente errato. ( 1936- Landon ( repubblicano), Roosevelt ( democratico), vinse
Roosevelt mentre il sondaggio aveva previsto la vittoria di Landon)
Per effettuare una INDAGINE STATISTICA bisogna:
rilevare i dati,
fare lo spoglio dei dati e correggere, se possibile, eventuali errori,
elaborare i dati con strumenti matematici adatti
interpretare i risultati ottenuti
Il nostro studio riguarda prevalentemente gli ultimi due punti dell’indagine statistica:
l’elaborazione dei dati con strumenti matematici e l’interpretazione dei risultati dell’indagine
statistica.
Si dice UNITA’ STATISTICA ogni elemento della popolazione, di ciascuna unità statistica si studia
almeno un CARATTERE:
Per studiare i dati statistici si costruiscono delle tabelle dove, accanto ad ogni modalità del
carattere, si riporta la frequenza di quella modalità.
Tali tabelle si chiamano:
SERIE se vi sono caratteri qualitativi SERIAZIONI se vi sono caratteri quantitativi.
Si dice MUTABILE X , la tabella costituita dalle modalità qualitative e dalla relative frequenze (
assolute o relative o percentuali)
X x1 x2 x3
fa f1 f2 f3
Si dice VARIABILE X , la tabella costituita dalle modalità quantitative e dalla relative frequenze (
assolute o relative o percentuali)
X x1 x2 x3
fa f1 f2 f3
Esempio: serie storica della produzione annua di olio, in quintali, e rappresentazione grafica con il
diagramma cartesiano :
Anno Produzione
In quintali
2003 2.508.084
2004 2.678.201
2005 2.458.396
2006 1.914.535
Esempio si di serie : serie delle materie scolastiche preferite dai ragazzi e dalle ragazze e loro
rappresentazione con diagramma a colonne
Materia preferita maschi femmine
Italiano 5 3
Storia 4 7
Geografia 4 2
Matematica 2 3
Scienze 6 4
Ed. Fisica 5 5
3
LE SERIAZIONI
Esempio 1 Con uno strumento, si è rilevato, per 40 minuti consecutivi, il numero delle particelle
cosmiche al minuto:
0 2 1 4 3 1 2 3 8 2 5 2 1 3 3 1 3 2 2 5
4 4 4 2 3 5 5 1 1 2 4 4 2 3 3 3 3 3 3 2
Possiamo chiederci:
Qual è il minor numero di particelle rilevato in un minuto?
Qual è il maggior numero di particelle rilevato in un minuto?
Quale numero di particelle è stato rilevato più frequentemente?
Per quanti minuti sono state rilevate meno di 5 particelle al minuto ?
Qual è il numero medio di particelle rilevate al minuto?
Ad alcune domande si può rispondere anche con i dati grezzi, ad altre no.
Ora che i dati sono stati ordinati e rappresentati, possiamo rispondere ad alcune domande relative al
fenomeno su cui è stata fatta l’indagine statistica.
Qual è il minor numero di particelle rilevato in un minuto? 0 (nessuna particella)
Qual è il maggior numero di particelle rilevato in un minuto? 8 particelle
Quale numero di particelle è stato rilevato più frequentemente? 3 particelle
Per quanti minuti sono state rilevate meno di 5 particelle ? 35 minuti
Per quanti minuti sono state rilevate più di 4 particelle al minuto? 40-35= 5 minuti
Qual è il numero medio di particelle rilevate al minuto?
circa 3 particelle al minuto
La variabile X appena studiata è numerica e discreta perché i valori che assume sono il risultato di
un conteggio.
La variabile Y che assume come valore l’altezza dei giocatori del Novara Calcio è numerica e
continua, perché i valori sono frutto di una misura.
Per ottenere una buona distribuzione statistica si può usare la regola seguente:
se N è il numero dei dati, si calcola e si approssima il risultato:
se i dati sono 80, con la formula si ottiene = 8.9 → 8 classi
Esempio 2
Gli ottanta dati seguenti indicano le emissioni giornaliere di gas inquinante da un impianto
industriale espresse nella stessa unità di misura.
la MODA è utile quando è importante conoscere quale sia il valore che si ottiene con maggiore
frequenza e si usa se, il dato o la classe, hanno una frequenza notevolmente superiore agli altri
dati o classi.
ESEMPIO: In una città l’orario dei negozi di alimentari è libero. Uno straniero appena giunto in città
chiede quale sia l’orario di apertura dei negozi di alimentari. Conviene rispondere indicando la
MODA cioè l’orario rispettato dalla maggior parte dei negozi di alimentari.
6
MEDIANA: è un valore che divide a metà i dati, ordinati in maniera crescente o decrescente. La
mediana si calcola con i caratteri quantitativi o con quelli qualitativi ordinabili ( ad esempio la
modalità titolo di studio è ordinabile, la modalità colore degli occhi non è ordinabile).
La MEDIANA non risente dei valori estremi perché si determina indicando il valore centrale
se la distribuzione ha un numero dispari di dati, oppure indicando la media aritmetica tra i
due valori centrali se la distribuzione ha un numero pari di dati.
La MEDIANA è l’indice centrale da considerare quando c’è molta variabilità tra i dati.
La MEDIANA è il valore che divide a metà l’intervallo della distribuzione statistica e
corrisponde al cinquantesimo percentile e anche al secondo quartile. I quartili sono dei punti
che dividono l’intervallo dei dati in quattro parti, ognuna delle quali contiene il 25% dei dati.
ATTENZIONE: se la distribuzione e divisa in classi, si stima come mediana il valore centrale
della classe in cui cade il dato centrale ( o la media dei due dati centrali)
Valore
classe centrale fa fC
[155-160[ 157,5 3 3
[160-165[ 162,5 4 7
[165-170[ 167,5 4 11
[170-175[ 172,5 3 14
[175-180[ 177,5 6 20
[180-185[ 182,5 4 24
totale 24
Mediana= (x13+x12)/2 = (172,5+172,5)/2= 172,5
La MEDIA ARITMETICA è quel valore che sostituito a tutti i termini della distribuzioni lascia
invariata la somma. La media si calcola solo se i caratteri sono quantitativi.
La MEDIA ARITMETICA risente dei valori estremi della distribuzione e non conviene
utilizzarla quando c’è molta variabilità tra i dati .
LA MEDIA PESATA è la media aritmetica calcolata considerando i pesi ( la frequenza ) di
ogni xi
dove xi è il dato di indice i e pi il suo peso
Nel caso in cui i dati siano raggruppati in classi si usa il valore centrale di ogni classe:
xi è il valore centrale della classe i-esima ed fi la frequenza della classe i-esima
7
S=
Quando i dati sono suddivisi in classi, si utilizza come xi il valore centrale di ogni classe
Il COEFFICIENTE DI VARIABILITA’ ( che si può calcolare solo se la media non è nulla) è il rapporto
tra lo scarto quadratico medio e la media aritmetica in valore assoluto σ/|μ| e viene espresso in
percentuale. E’ un numero puro che permette di confrontare tra loro la variabilità di diverse
distribuzioni statistiche.
Esempio:
Giacomo ha preso questi voti: 5,7,6,8,9,7 il coeff. di variabilità è σ/|μ|=1,29/7=0,18=18%
Luca ha preso questi voti: 4,5,6,5,6 il coeff. di variabilità è σ/|μ|=0,75/5,2=0,14=14%
Marco ha preso questi voti : 7,7,7,7,7,7,7 il coeff. di variabilità è σ/|μ|=0/7=0
TABELLE CONSIGLIATE PER CALCOLARE LO SCARTO SEMPLICE MEDIO E LO SCARTO QUADRATICO MEDIO
X Scarto Valore assoluto Scarti al CLASSI fi Xi valore xi*fi | xi – μ |*fi (xi-μ)2*fi
centrale
(xi-μ) dello scarto quadrato della
|xi - μ | (xi-μ)2 classe
… -8,5 8,5 72,75 0-4 5 2
… ……. …………. …………. 4-8 7 6
Tot. 0 27 189,5 tot
SCARTO SEMPLICE MEDIO : S= | x1 - μ |+………………| xn - μ | = 27/6 =4,5 (6 è il numero dei dati)
N
8
24) Nella corsa dei 200m , 30 ragazzi hanno fatto registrare i tempi misurati sino ai decimi di
secondo:
29,3 31,2 28,5 37,6 30,9 26,0 38,0 37,0 22,8 35,2 35,8 37,7
29,6 26,9 36,9 39,6 29,9 30,0 36,6 34,1 38,2 35,0 28,8 37,8
32,4 31,8 38,1 34,0 36,0 36,1
Costruire una tabella raggruppando i dati in 5 classi : determinare frequenza, frequenza relativa e
frequenza percentuale, media, moda , mediana, range, scarto semplice medio, varianza,deviazione
standard, coefficiente di variabilità . Disegnare il diagramma delle frequenze. Determinare quale
percentuale dei ragazzi ha corso i 200 m in meno di 29 secondi.
25) Le temperature massime in gradi Celsius registrate in una località sono
ESERCIZIO 1-Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato
dei bruchi secondo i numeri riportati in tabella
n° dei bruchi 0 1 2 3
n° delle foglie 167 98 30 5
Calcolare il numero medio di bruchi per foglia e la relativa deviazione standard.
[ media=173/300 = 4%, σ2=(263/300)-(173/300)2 ; σ= radq(48971/90000)= 0,74]
ESERCIZIO 2- Si consideri il numero di giorni che un unguento impiega per far guarire di una dermatite:
n° giorni 1 2 3 4 5 6
frequenza 2 7 9 27 11 5
Determina la media e la varianza. [media= 236/61=3,87; σ 2=998/61-(3,87)2=1,38]
ESERCIZIO 3- Due ditte pubblicizzano le loro pile “ministilo “ a 4,5 Volt e entrambe dicono che le pile hanno
una carica di 1,25 A/h. Si scelgono due campioni di 50 pile da ciascuna ditta e si compila la tabella delle
frequenze assolute con cui sono stati osservati i valori di carica: carica in A/h 1,15 1,20 1,25 1,30
Prima ditta 1 16 25 8
Seconda ditta 17 0 9 24
Stabilire per quale ditta il valore medio di carica è più attendibile.
[prima ditta media=1,24 A/h, σ2=0,065/50=0,0013, σ=0,036---- seconda ditta media=1,24 A/h, σ2= 0,045,σ=0,067]