Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
P R O G e T T O M Í M LeO N ARD O
BOLOGNA
Sommario
Prefazione per il docente
0. Introduzione
V
1
1. Statistica descrittiva
5
1.1 Tipi di vanabili. Distnbuzioni di
frequenza.......................................................... 5
1.2 Grafici di distribuzioni di
frequenza...................................................................... 9
1.2.1 Istogrammi e diagrammi a
barre...............................................................9
1.2.2 Grafici di frequenza
cumulativa............................................................. 11
1.2.3 Diagrammi'' Stem and le a
f .................................................................... 12
1.3 Indici di posizione, di dispersione e di
forma......................................................13
1 4 Calcoto di media e varianza per dati raggruppati.
Trasformazione lineare di
dati...............................................................................
18
1.5
Boxplots...........................................................................
...................................... 21
Esercizi...........................................................................
.........................................23
1.6 Analisi comparative, correlazione di
variabili.................................................... 27
1.6.1 Correlazione di variabili.
Scatterplots.................................................... 27
1.6.2 Método dei minimi quadrati. Regressione
lineare...............................32
1.6.3 Cambiamenti di
scala..............................................................................
..37
1.6.4 Confronto fra gruppi, individuazionedi
sottogruppi............................ 42
Esercizi...........................................................................
.........................................47
2. Probabilita
49
2.1 Esperimenti aleatori, eventi elementan e spazio
campionario......................... 49
2.2 Eventi e operazioni su eventi (per uno spaziocampionario
discreto).............. 49
2.3 Probabilitá di
eventi.............................................................................
.................. 51
2.3.1 Come si opera con la probabilitá. La defínizione assiomatica............51
2.3.2 Come si assegnano le probabilitá. 1: La probabilitá classica..............54
2.3.3 Come si assegnano le probabilitá. 2: L'idea frequentista
di
probabilitá........................................................................
..................... 56
2 4 Probabilitá classica e problemi di conteggio: il calcólo
combinatorio...........56
2.4.1 Lo schema delle scelte successive
e il principio del prodotto delle
possibilitá.............................................57
2.4.2 Lo schema delle scelte simultanee e i coefficienti binomiali...............60
2.4.3 Esempi di problemi combinatori; applicazioni del calcólo
combinatorio alia probabilitá
classica.....................................................64
Esercizi...........................................................................
......................................... 66
2.5 Probabilitá
condizionata.......................................................................
................. 67
2.6 Indipendenza di
eventi.............................................................................
.............. 74
2.7 Añidabilitá di un
sistema............................................................................
........... 76
Esercizi di ricapitolazione sulla
probabilitá ......................................................79
3. Variabili aleatoria e modelliprobabilistici
85
3 1 Variabili aleatoria
discrete...........................................................................
......... 85
3.2 II processo di
Bernoulli..........................................................................
............... 88
3.3 Le variabili aleatoria legateal processo di
Bernoulli............................................ 89
3.3.1 II processo di Bernoulli con un numero finito di
prove......................89
3 .3.2 II processo di Bernoulli
illimitato........................................................... 92
3.4
3.5.
3 .6
3.7
3.8
3.9
3.10
3.11
3.12
Valore
3.4.1
3 .4.2
3 .4.3
187
4 . Statistica inferenziale
4.1 Stima
puntúale...........................................................................
.......................... 187
4.1.1
Stima della
media..............................................................................
..... 187
4 . 1.2 Stima della varianza. Varianza
campionaria........................................189
Esercizi...........................................................................
...................................... 193
4.2 Campionamento da una popolazione normale.
Leggi chi-quadro, di Student, di
Fisher............................................................. 194
4.3 Stima per
intervalli.........................................................................
..................... 202
4.3.1
II concetto di intervallo di confidenza.
Stima della media di una popolazione normale con varianza nota.. 202
4 .3.2
4.4
4.5
4.6
"Statistical Methods fo r Research Workers". 13° ed., Oliver and Boyd, Bdinburgh,
London, 1958
Introduzione
e arriva a dare una trattazione matemática dell'incertezza, ossia delle rególe con
cui noi
attribuiamo un certo grado di fiducia al realizzarsi di un dato evento. Vedremo
come
in molte situazioni concrete, con qualche ipotesi ragionevole sulla natura del
fenómeno
aleatorio e qualche informazione quantitativa, saremo in grado di formulare un
mode lio probabilistico, in base al quale calcolare la probabilitá di un certo
evento.
Nell'esempio deH'uma con palline bianche e nere, impareremo come si calcóla la
probabilitá che, estraendone 10, ne troviamo esattamente 6 bianche.
Un problema in qualche modo inverso a questo é il seguente: se, intervistando un
campione di 100 persone alia vigilia di un referendum, in 67 affermano che
voteranno
"Si", cosa possiamo dire circa la percentuale degli elettori italiani (che sono
milioni,
non solo i 100 intervistati!) che voteranno "Si"? A rigor di lógica, assolutamente
nulla
di certo. II problema tipico della Statistica Inferenziale é proprio questo: fare
inferenze, cioé asserzioni motivate, circa la popolazione complessiva in esame, a
partiré dalle osservazioni fatte su un campione estratto dalla popolazione stessa
La
statistica inferenziale riguarda dunque le conclusion! che si possono trarre quando
si
esegue wn'indagine campionaria su una popolazione (cioé osservando solo una parte,
non tutti gli individui). Queste conclusion! non saranno "certezze", ma asserzioni
formulate con il linguaggio e i metodi (precisi e quaníitativi) del calcólo delle
probabilitá.
La Statistica Descrittiva si occupa invece deW'analisi dei dati osservati,
prescindendo sia da qualsiasi modello probabilistico che descriva il fenómeno
soggiacente, sia dal fatto che l'insieme di dati provenga da un campione estratto
da una
popolazione piú vasta, o coincida invece con la popolazione intera. Obiettivi della
statistica descrittiva sono:
1. Eífettuare quella riduzione dei dati di cui si é detto sopra. L'informazione
rílevante contenuta nei dati puó essere espressa mediante opportuni grafici o
indici
numerici che descrivono la distribuzione di una variabile sul gruppo di individui
considerati.
2. Eseguire indagini di tipo comparativo:
a. confrontare i valor! che una stessa variabile assume su gruppi diversi di
individui
(es.: statura di maschi e femmine, all'interno di una popolazione fissata);
b. cercare relazioni esistenti tra variabili diverse (es.: relazione tra statura e
peso,
per gli individui di una certa popolazione).
3. Verifícare l'adattamento dei dati empiric! a un modello teórico, o orientare
nella
formulazione del modello stesso.
Le tre discipline a cui abbiamo accennato (calcólo delle probabilitá, statistica
inferenziale, statistica descrittiva) hanno quindi strette relazioni reciproche In
estrema
sintesi, si puó dire che il loro scopo é quello di darci degli strumenti per
prendere
decisioni in situazioni di incertezza, o dare valutazioni quantitative precise del
grado
di certezza o incertezza che abbiamo.
Cap. 1. Statistica descrittiva
0 , 2 , 1, 4 , 3 , 1, 2 , 3 , 8 , 2 , 5 . 2 , 1, 3 , 3 , 1, 3 , 2 , 2 ,5 ,
4 ,4 ,4 ,2 ,3 ,5 ,5 ,1 ,1 ,2 ,4 ,4 ,2 ,3 ,3 ,3 ,3 ,3 ,3 ,2 .
Esempio 2. I diametri di 20 sferette prodotte da una linea produttiva sono stati
misurati. Le misure, espresse in cm, sono:
2.08, 1.72, 1.90, 2.11, 1.79, 1.86, 1.80, 1.91, 1.82, 1.84,
2.04, 1.86, 2.04, 1.80, 1.82, 2.08, 2.04, 1.85, 2.07, 2.03.
Esempio 3. In uno stabilimento vengono registrati gli episodi di malíunzionamento
di
un tomio controllato dal Computer, insieme alie loro cause. I dati, relativi a una
certa
settimana, sono i seguenti;
fluttuazioni di tensione;
instabilitá del sistema di controllo:
errore dell'operatore:
strumento consúmalo e non sostituito;
altre cause;
Totale:
6
22
13
2
5
48
In ciascuno dei tre esempi che abbiamo fatto si osserva una variabile che é,
rispettivamente:
1. II numero di particelle cosmiche registrate in un intervallo di un minuto,
2. II diámetro di una sferetta prodotta;
3. La causa di un guasto accaduto.
Di questa variabile noi abbiamo un insieme di n osservazioni registrate (n vale,
rispettivamente, 40, 20, 48, nei tre esempi). Queste osservazioni costituíscono i
dati
che noi vogiiamo analizzare.
CapHoto 1: Statistica descrittiva
j discrete
\ continue
( 1)
( 2)
(3)
Una variabile si dice numérica se i valorí che essa assume sono numerí, categórica
altrímenti; una variabile numérica si dice discreta se l'insieme dei valorí che
essa a
priori puó assumere é finito o numerabile, continua se l'insieme dei valori che
essa a
priori puó assumere é l'insieme R dei numerí reali o un intervallo / C R. Nei casi
pió
comuni, le varíabili aleatoríe discrete coníano il numero di oggetti, eventi, ecc.,
di un
certo tipo, mentre le varíabili continue misurano il valore assunto da una
grandezza
física che varía con continuitá, come un tempo, una lunghezza, ecc.
Esempi 5. Le varíabili degli esempi 1 e 2 sono numeriche, la variabile dell'esempio
3 é
categórica. La variabile dell'esempio 1 é discreta, perché il numero di particelle
osservate é sempre un numero intero > 0 , e l'insieme dei numerí interí é (infínito
ma)
numerabile. La variabile dell'esempio 2 é continua, perché il diámetro é una
lunghezza,
che come tale puó essere misurata da un numero reale positivo qualunque (in un
intervallo ragionevole), físsata un'unitá di misura. Si osservi che per distinguere
una
variabile discreta da una continua occorre ragionare su quali sono i valorí che a
priori
la variabile puó assumere. E' chiaro infatti che in n osservazioni, i valori
effeííivamente
assunti saranno al piu n, e quindi sempre un numero finito!
Per i dati dei tre esempi costruiamo ora la tabella (U distriburione di frequenza,
cioé dividiamo l'insieme dei dati in un opportune numero di classi mostrando il
numero
di osservazioni che cadono in ciascuna classe.
Caso A. Varíabili discrete. Nel primo esempio la variabile x osservata (numero di
particelle) é una variabile numérica discreta, che puó assumere solo valori interí.
E'
naturale in questo caso scegliere come classi A* = {x,| x, = /c} con
fc = 0 ,1 ,2 ,3 ,4 ,5 ,8 (e i = 1 , 2 , 3 , , 40). Ad esempio, A 2 é la classe che
contiene
tutte le osservazioni (10 in tutto) in cui sono state registrate esattamente due
particelle.
Consideríamo la seguente tabella di distríbuzione di frequenza:
Classe (n° di part.)
0
1
2
3
4
5
8
Totale
Freq. ass.
1
6
10
12
6
4
1
40
Freq. reí.
0.025
0.15
0.25
0.3
0.15
0.1
0.025
1
Freq. perc.
2.5
15
25
30
15
10
2.5
100
Freq. cum.
2.5
17.50
42.50
72.50
87.50
97.50
100
100
La somma delle frequem e assolute dá il numero ¡oíale di osservazioni; la somma
delle frequenze relative deve sempre dare l e la somma delle frequenze percentuali
deve sempre dare 100; si tenga conto di questo quando si arrotondano i valori
ottenuti
.
come quozienti.
La somma delle frequenze cumulative non ha alcun significato, visto che ognuna di
esse é giá una somma: ad esempio, la frequenza cumulativa sulla terza riga é somma
delle frequenze percentuali delle prime tre righe.
Caso B. Variabili continue. Nel secondo esempio la variabile osservata (misura, in
cm., del diámetro di una sferetta) é una variabile numérica continua, che puó
assumere
(a priori) tutti i valori compresi in un certo intervallo di numeri reali. In
questo caso i
valori assunti sono compresi tra 1.70 e 2 . 10, perció possiamo, ad esempio,
suddividere questo intervallo in intervallini di ampiezza 0.05 e considerare come
classi;
{1.70 < X < 1.75}, (1.75 < X < 1.80), ecc. La distribuzione di frequenza é allora
data dalla tabella seguente:
Classi
1.70 - 1.75
1.75 - 1.80
1 .8 0 -1 .8 5
1.85 - 1.90
1.90 - 1.95
1.95 - 2.00
2.00 - 2.05
2.05 - 2.10
2 .1 0 -2 .1 5
Totale
Freq. assol.
1
3
3
4
1
0
4
3
1
20
Freq. reí.
0.05
0.15
0.15
0.20
0.05
0
0.20
0.15
0.05
1
Freq. perc.
5
15
15
20
5
0
20
15
5
100
Freq. cum.
5
20
35
55
60
60
80
95
100
Per evitare ambiguitá, bisogna precisare che la scrittura 2.00 - 2.05, ad esempio,
significa (2 < X < 2.05} (perció un'osservazione uguale a 2 non cade in questa
classe,
ma nella precedente). L'ultima riga (frequenza cumulativa) si interpreta cosí; il
valore
scritto é la percentuale di osservazioni minori o uguali dell'estremo destro
deH'intervallo considerato, ad es.; il 5% delle osservazioni sono < 1.75, il 20%
sono
< 1.8, ecc.
II modo di scegliere le classi, nel caso di una variabile continua, non é univoco;
l'ampiezza e il numero delle classi possono essere scelti in infíniti modi;
l'ímportante é
che ogni osservazíone appartenga ad una e una sola classe. Troppe classi rendono la
tabella poco leggibile; troppo poche classi la rendono poco significativa: il
numero
giusto va scelto con buon senso.
8
Freq. assol.
6
22
13
2
5
48
Freq. reí.
0.125
0.458
0.271
0.042
0.104
1
Freq. perc.
12.5
45.8
27.1
4.2
10.4
100
Si noti che per una variabile categórica non ha senso parlare di distribuzione
cumulativa.
Ora che abbiamo introdotto i primi termini che riguardano le variabili statistiche,
vedremo come costruire grafici (§1.2, 15) e calcolare indici (§ 1 3 , 1.4) che
esprimano
in modo sintético e signifícativo \'informazione contenuta nei dati. Tutto ció che
diremo a questo riguardo richiede una precisazione. 11 modo in cui oggi
abitualmente si
* Si confronti con quanto detto nell'lntroduzione a proposito della statistica come
studio dei metodi di
TV
La scelta del numero delle classi (o della loro ampiezza) non è indifferente:
troppo
poche classi appiattiscono il gráfico fino a renderlo insignificante; troppe classi
10
rTTTTiTfcTa a H»¿I e a ¿ a *j
1
1
La
_
: -x
^.. ....X
:X
1
ir.
L."."
- _ .j,
0
i Xs\
¡.NSSSS
>
;1 '
^
I
1
:
A---'
;X ••x ;
'■•X;
nx."*
•=c
P..U4J.V..J
1
2
1
3
11
o
flutt.
ín s t.
errore
Strum.
airo
n u » *« ro
NeU'esempio 2:
Oí
p a r t ic v llc
12
|2 9
100224566
I0 1
I3 4 4 4 7 8 8
21 * 11
(diagramma in unitá di 0 .01).
Ogni riga del diagramma è un ramo (stem), ogni cifra a destra della barra verticale
una foglia (leaf). II numero a sinistra della barra è Vetichetta del ramo, e
significa che,
ad esempio, la prima riga contiene tutti i dati che valgono 17* ("centosettanta e
qualcosa"); le "foglie" precisano che i dati di questa classe sono 172, 179. Sotto
il
diagramma è precisato che l'unitá di misura è 0 .01, quindi 172 sta per 1.72.
Análogamente la seconda riga rappresenta i dati del tipo 18*, e precisamente 180,
180,
182, 182, 184, 185, 186, 186. Quindi il diagramma suddivide i dati in classi e ne
presenta una specie di istogramma con "barre" orizzontali anziché verticali (le
righe di
numeri), ma inoltre conserva traccia delle singóle osservazioni. Se volessimo
suddividere i dati in classi di ampiezza 0.05 anziché 0.1, avremmo;
17* |2
17. 19
18* 1 0 0 2 2 4
18. 1 5 6 6
19* |0 1
19 1
20 * 1 3 4 4 4
20 . 1 7 8 8
21 * 11
(diagramma in unitá di 0 .01).
Capitolo 1: Statistica descrittiva
13
Questa volta abbiamo usato due simboli diversi (17* e 17.) per indicare le due
sottoclassi della classe "centosettanta e qualcosa", e precisamente il ramo 17*
contiene
i dati con l'ultima cifra da 0 a 4, il ramo 17. contiene i dati con l'ultima cifra
da 5 a 9.
Questo tipo di rappresentazione é adatto a insiemi non troppo numerosi di dati, in
questo caso, la costruzione manuale di un diagramma stem and leaf a partiré dai
dati
grezzi puó essere anche un método pratico per suddividere i dati in classi per poi
costruire tabelle di frequenza e istogrammi.
^____
ti
1?;p
Si?»
i«
!iȤi
íiliS
íS:?»Síi
....
T
p
pii
il É II'
il
1 "
í = -E ^ .
La mediana m é defínita cosí: si dispongono in ordine crescente i numeri
x i , X 2, . . . Xn, e si prende quello che occupa la posizione céntrale, se n é
dispari,
oppure la media aritmética dei due valori in posizione céntrale, se n é parí.
Esempio 9.
(a) . La media di {15,14,2,27,13} é x = 14.2, la mediana é m = 14.
(b) . La media di { 1 ,2 ,3 ,4 ,5 ,2 7 } é x = 7, la mediana é m = 3.5.
La mediana é preferíbile alia media quando si vogliono eliminare gli effetti di
valori
estremi (molto grandi o molto piccoli). Nell'esempio precedente, (A), la mediana é
3.5,
che é piú rappresentativo della maggior parte dei valori di quanto non lo sia la
media 7
Inoltre, la mediana ríchíede calcolí piú semplici.
Defínizione 10. Una distríbuzione si dice unimodale quando la sua distríbuzione di
frequenza presenta un solo punto di massimo, plurimodaie quando presenta piú di un
punto di massimo relativo. Ogni punto di massimo é detto moda. Perció, se la
distríbuzione é unimodale, ha senso parlare de "la" moda della distríbuzione.
Esempio 11.
(a).L'insieme di osservazioni { 1, 2 , 2 , 2 , 3 , 3 , 4 , 6 ,7} ha distríbuzione
unimodale, con
moda 2; la mediana é 3; la media é 3.33.
(¿>).L'insieme di osservazioni ( 1, 2 , 2 , 2 , 4 ,5 , 6 , 6 , 8 } ha distríbuzione
bimodale, con
mode 2 e 5; la mediana é 4, la media é 4.
Per renders! conto delle affermazioni fatte sulla moda occorre tracciare
l'istogramma della distríbuzione; si faccia anche attenzione a non confondere la
moda,
che é il punto di massimo della frequenza (che nel caso a é 2 ) con il massimo
della
frequenza (che nel caso a é 3: il valore 2 é assunto 3 volte). In altre parole, la
moda va
rícercata sulle ascisse e non sulle ordinate del gráfico di distríbuzione di
frequenza.
Media, mediana e moda sono dette indici (o misare) di posizione (perché dicono
attom o a quale valore il campione di dati é "posizionato", "centrato") e sono
tanto piú
significative quanto piú i dati sono concentrati vicini ad esse. E' interessante
misurare
quindi il grado di dispersione dei dati rispetto, ad esempio, alia media. Si
osservi che la
somma delle deviazioni dalla media é sempre zero:
¿ (x ¿ -x ) = 0
(1)
Defínizíone
x , , X 2 . . . . X n ,
12. La
è^:
a^ = - ¿ ( x , - x)'^
15
osservazioni
( 2)
(3)
(Si dimostri la (3) per esercizio: basta sviluppare i quadrati che compaiono nella
(2) e
utilizzare le proprietá delle sommatorie).
Varianza e deviazione standard sono dette indici (o misure) di dispersione.
Definiamo ora altre misure che descrivono il grado di dispersione di un insieme di
dati.
Defínizíone 13. Supponiamo che i numeri xi , X 2, . . . x „ siano stati messi in
ordine
crescente, cioé xi < X2 < ... < x„. Se p é un numero reale compreso tra 0 e 1,
definiamo il p-esim o quantile al seguente modo: si considera il numero np, se
questo
numero non é intero, e k é Tintero successivo, il p-esimo quantile é x*; se invece
n p é
un intero k, il p-esimo quantile é la media tra
e xit+i: (x^ -\-Xk+{)/2. II p-esimo
quantile viene detto anche lOOp-esimo percentile. II 25°, 50°, 75° percentile
vengono
detti anche, rispettivamente, primo, secondo e terzo quartile, e indicati con Q \,
Q z t Q z - Si noti che il secondo quartile
coincide con la mediana. In sostanza, i
numeri Q \ , Q 2, Q3, sono tre numeri che dividono Tinsieme delle osservazioni,
disposte
in ordine crescente, in 4 parti ugualmente numeróse. Análogamente, ad esempio, il
30°
percentile, che si chiama anche 0.3-esimo quantile, é il valore tale che almeno il
30%
delle osservazioni sono minori di esso, e almeno il 70% delle osservazioni sono
maggiori o uguali ad esso.
^ Alcuni testi, e molti programmi stalistici, denotano invece col nome di varianza
campionaria la
quantitá
J=1
Nel §4.1.2 spiegheremo quando c perché occorre ulilizzare questa seconda
defmizione; fino ad a w iso
contrario, la varianza sarà per noi la quantité
definita dalla (2)
16
2. 2, 2. 2, 2. 2, 2, 3, 3, 3,
4, 4, 4, 4, 4, 5, 5, 5, 5. 8 .
Q\ = 2 ; Q 2 = 3; Qz = 3.5.
Come si vede, i numeri 2 ,3 ,3 .5 sono i punti di separazione che si ottengono
dividendo
I'insieme delle osservazioni, disposte in ordine crescente, in 4 gruppi ugualmente
numerosi.
Esempio IS. Consideriamo i dati, giá ordinati; 1, 1, 2, 3, 4, 5, 5, 5, 6, 7. In
questo
caso
si ha:
10 0.25 = 2.5,
quindi Qi = X3 = 2; 10 • 0.50 = 5, quindi
Q2 — (2^5 + x^)l2 = 4.5; 10 • 0.75 = 7.5, quindi Q 3 = xg = 5.
Q\ = 2 ; Q2 = 4.5; Q3 = 5.
17
Riassumendo.
Per descrívere un insieme di osservazioni numeríche abbiamo introdotto:
posizione
(media, mediana, moda)
indici di < dispersione (varianza, deviazione standard, range, I Q R )
forma
(coefficiente di skewness, curtosi)
Osservazione 19. V aríabili num eríche e varíabíli categoriche. Ritomiamo ora sulla
defínizione di varíabile numérica e varíabile categórica che abbiamo dato nel § 1.
1, per
fare una precisazione. Consideríamo ad esempio la varíabile G = gruppo sanguigno
delle persone di una certa popolazione. G puó assumere i 4 valori: A, B, A B , 0.
Questi
non sono numerí, perció G é una varíabile categórica. Ma nessuno ci vieta di
chiamare
convenzionalmente i 4 gruppi sanguigni con i numerí 1 ,2 ,3 ,4 , rispettivamente.
Allora
G diventa una varíabile numérica? La risposta sensata é no, in quanto le operazioni
tipiche che ha senso fare sulle varíabili numeríche, di cui abbiamo parlato in
questo
parágrafo (calcólo di indici) non avrebbero comunque senso in questo caso, non
essendoci un ordinamento naturale tra i 4 gruppi sanguigni. Se ad esempio 3 persone
hanno gruppo i4 ,B ,0 , a seconda che noi "etichettiamo" i tre gruppi
rispettivamente
1, 2, 3 oppure 2 ,3 ,1 , oppure 3, l,2,troverem o che "la media dei gruppi
sanguigni"
delle 3 persone é B , oppure é A, oppure é 0, ma é chiaro che questo non ha alcun
signifícato.
La conclusione é che le defmizioni di varíabile categórica e varíabile numérica
non vanno prese troppo alia lettera, ma applicate con buon senso.
Osservazione 20 . L ettura di una tabella forníta dal com puter. Quella che segue
(v.
pagina successiva) é una tipica tabella fomita dal computer dando un comando del
tipo
"calcóla le statistiche descríttive dei dati in memoria", e si ríferísce ai dati
dell'Esempio
2 . Si noti che tutti gli indici ríportati qui sopra sono stati fomiti dal computer
dando un
único comando (in meno di un secondo!). Un po' di legenda. I 5 numerí in basso a
destra sono la media {mean), la deviazione standard {Síd. Dev.), la varianza, la
skewness e la curtosi ^ Le prime due colonne a sinistra indicano vari percentili,
in
particolare leggiamo i quartili (che avevamo calcolato nell'Esempio 17):
^ Si tenga presente che la formula di calcólo della skewness e della curtosi
utilizzata da un
programma, potrebbe difierírc dalla defínizione che abbiamo dato, per la presenza
di un coefficiente
correttivo. Non discutiamo il motivo di questa correzione, che comunque in generale
é tanto piú
trascurabile quanto maggiore é il numero n di dati. Ad ogni modo, si sappia che
eseguendo il calcólo
manualmente a partiré dalla defínizione che abbiamo adottato, si potrebbe trovare
un risultato leggermente
diverso da quello fomito dal computer
18
Q i = 1.82;
(?2 = 1.88;
Q3 = 2.04.
Si ricordi che Q2 coincide con la mediana. Nella terza colonna da sinistra sono
riportati i 4 valori piu piccoli {smallest) e piu grandi {largest), in particolare,
leggiamo
la massima e la minima osservazione (e quindi il range, che é la loro differenza).
diámetro
Percentiles
1.72
1%
5%
1.755
10% 1.795
25% 1.82
50%
1.88
75%
90%
95%
99%
2.04
2.08
2.095
2.11
Smallest
1.72
1.79
1.8
1.8
Largest
2.07
2.08
2.08
2.11
Obs
20
Sum ofW gt. 20
Mean
1.923
Std. Dev. .1234632
Variance .0152432
Skewness .1545068
Kurtosis 1.525947
Freq. assol.
1
3
3
4
1
0
4
3
1
20
Tab. 4
In precedenza abbiamo costruito questa tabella a partiré dai dati grezzi (ossia le
20
osservazioni); supponiamo ora, invece, di conoscere soltanto questa tabella, ossia
i
dati raggruppati, senza conoscere analiticamente le 20 osservazioni. Questo tipo di
situazione si puó presentare quando si elaborano dati "di seconda mano", cioé
raccolti
e parzialmente elaborati da qualcun altro che ci fomisce solo i dati raggruppati,
oppure
quando, a causa del numero elevato di dati grezzi, preferiamo raggrupparli prima di
fare qualsiasi calcólo su di essi.
Come faremmo in questo caso a calcolare media e varianza campionaria? II calcóla
esatto non è possibile, visto che abbiamo perso parte dell'informazione. Possiamo
pero
calcolare una ragionevole approssimazione della media e varianza campionaria
supponendo che i dati di ogni classe valgano, in media, come il valore centrale
della
Capitok) 1: Statistica descríttiva
19
(5)
( 6)
Per I'espressione della varianza, la seconda formula é equivalente alia prima e
porta
calcoli pill semplici.
Si osservi che il numero n per cui si dividono le sommatorie é il numero di
osservazioni (cioé di dati grezzi) e non il numero di classi (che é k, sólitamente
molto
minore di n).
Esempio 21. Nell'esempio riportato in Tab.4, abbiamo; n = 20; fc = 9; xi = 1.725,
X2 = 1.775, ecc.; f \ = 1, /2 = 3, /3 = 3, ecc. Per procederé al calcólo di media e
varianza, conviene costruire una tabella al modo seguente;
Classi
1.70-1.75
1.75 - 1.80
1.80 - 1.85
1.85-1.90
1.90 - 1.95
1.95 - 2.00
2.00 - 2.05
2.05 - 2.10
2.10-2.15
0
E
*=1
Punto medio «•
1.725
1.775
1.825
1.875
1.925
1.975
2.025
2.075
2.125
*=1
38.4
74.0225
1.92
3.7011
Otteniamo quindi;
¿ x ./,= 3 8 .4 ;
X=1
x = 1.92;
¿ x f / , = 74.0225;
i=i
,
74.0225
o
= — — -------1.92^ = 3.7011 - 3.6864 = 0.014725.
20
Per confronto osserviamo che i valorí veri, cioé calcolati sui dati grezzi (non
raggruppati), sono:
20
X = 1.923;
= 0.014481.
L'approssimazione é accettabile.
Si osservi che, nel caso di una variabile numérica discreta in cui ogni classe
raggruppa tutte le osservazioni corrispondenti a un solo valore (come nell'Esempio
1),
le formule per il calcolo di media e varianza a partiré dai dati raggruppati sono
esatle e
non approssimate (in quanto in questo caso nessuna informazione é andata persa
raggruppando i dati).
Si lascia al lettore il compito di riflettere su come si potrebbero calcolare
approssimativamente i quartili, la mediana e la moda dai dati raggruppati.
Un'altra situazione che si incontra spesso é la seguente; abbiamo delle
osservazioni
{xi , X 2, ... ,Xn} di cui abbiamo giá calcolato media e varianza, e ora ci
interessa
conoscere media e varianza dei dati trasformati linearmente y, = ax, + 6 (a, 6
costanti físsate). Ad esempio, se x¿ sono temperature misurate in gradi Farenheit,
e a
noi interessano le temperature y¿ misurate in gradi centigradi, la relazione tra y,
e x¿ é
appunto una relazione lineare y^ = axi + b. E' possibile calcolare media e varianza
di
{ y i ) 2/2>• • •. 2/n} funzione di quelle di { x i , X2, . . . , x „ } (senza
rifare i calcoli)?
Proposizione 22. Siano {xi, X 2, . . . , Xn} n osservazioni di media x e varianza
a^, e
siano
y = ax + b\ a^ =
9
Capitolo 1: Statistica descrittiva
21
1.5. Boxplots
Alcune infortnazioni contenute nella distribuzione di frequenza (e in particolare
nei
quartili) possono essere visualizzate gráficamente con un boxplot. Si tratta di un
tipo di
grafíco semplice ma espressivo, fácilmente prodotto da qualsiasi pacchetto software
statistico. Illustriamo sull'Esempio 1 che cos'é e come si costruisce un boxplot (o
box
and whisker plot = gráfico con rettangolo e baffi).
$ partirelle
2-
La scala delle ordinate riporta i valori assunti dai dati osservati. II "box"
(rettangolo) disegnato ha i due latí orízzontali all'altezza del primo e terzo
quartile,
mentre la linea orizzontale all'interno del box rappresenta la mediana. Di
conseguenza
l'altezza del rettangolo rappresenta la diíferenza interquartile. I due segment!
vertical!
("whisker" = baffo) post! sopra e sotto il rettangolo si estendono fino a due
limit! scelti
in modo da comprendere tutte le osservazioni (quindi, delimitano il range), oppure
(come in questo esempio) "quasi tutte" le osservazioni. Il criterio esatto con cui
tracciare i "bafti" é oggetto di varíe convenzioni, e puo variare da un software a
un
altro. Ad esempio, i baffi possono rappresentare il 5® e il 95® percentile. Dati
ancora piu
"dispersi" vengono disegnati uno per uno con cerchietti e chiamati outliers (dati
che
"giacciono fliori dai limit!"): in questo esempio, il dato "8 particelle osservate"
é un
outlier. Si tratta di dati in un certo senso anomali, la cui correttezza andrebbe
accertata,
quando é possibile riandare "alia fonte" dei dati rilevati. Se quest! dati sono
corretti,
talvolta richiedono un'interpretazione a parte, che renda conto dell'anomalia In
ogni
caso, va tenuto presente che queste osservazioni "estreme" possono influiré
pesantemente su ogni eleborazione successiva dei dati. (Si pens! ad esempio al
calcolo
della media).
Un altro criterio per disegnare i due segmenti veiticali che separano gli outliers
dal resto della
popolazione (criterio usato nel boxplot riportato in precedenza) ¿ il seguente. Si
calcóla un limite
inferiore, uguale al primo quartile meno 1.5 volte VIQR, e un limite superiore,
uguaie al terzo
quartile piii 1.5 volte VIQR. Questi due limit! vengono calcolati, ma non riportati
nel disegno. A
questo punto si disegna il "whisker" superiore prolongándolo fino all'ultima
osservazione che risulta
minore 0 uguale del limite superiore che si é calcolato, e il whisker inferiore
fino all'ultima
osservazione maggiore o uguale del limite inferiore. In questo esempio: I Q R = 2,
Q\ = 2,
= 4.
Limite superiore = 4 + 1.5 • 2 = 7; limite inferiore = 2 - 1.5 2 = - 1. L'ultima
osservazione < 7 c
5; l'ultima osservazione > - 1 ¿ 0. Perció i due whisker si prolungano fino a 0 e
5. L'unico outlier é
8.
22
Nel testo da cui sono tratti questi dati (reali) non e spiegato il significato
dell'indice con
cui sono state misurate le prestazioni. (Scala da 15 a 30). Si osserva che il
gruppo "con
additivo" mostra una certa superiorita di prestazioni, ma anche una maggior
disuniformita; il secondo gruppo di osservazioni ha maggior dispersione del primo □
CapHoto 1: Statistica descrittiva
23
Esercizi
1.2.
1.3.
0 < X < 10
10 < X < 15
15 < X < 20
20 < X < 25
25 < X < 35
8
14
Frequenza
13
17
12
347
1937
2833
698
901
355
Dopo aver determinato le frequenze relative e percentuali, costruire un diagramma a
barre.
1.6.
I seguenti dati mostrano il numero mensile di interventi di manutenzione e
assistenza che si sono resi necessari per un certo macchinario Le osservazioni
riguardano 25 mesi consecutivi (ad esclusione del mese di agosto).
1, 5 , 3 , 1, 3 , 2, 2 , 1, 2 , 5 , 3 , 0 , 1, 4 , 3 , 7 , 1, 3, 1, 7, 2 , 1, 2 , 4
, 8 .
a. Costruire la tabella con le frequenze assolute, relative, cumulative di queste
osservazioni.
b. Disegnare un istogramma di questi dati. Come descrivereste la forma di questa
distribuzione?
c. Dire se la distribuzione é unimodale o plurimodale e, nel primo caso,
determinare la
24
moda.
d Calcolare la media e la mediana di questi dati.
1.7.
Quelli che seguono sono i minuti che una persona ha dovuto aspettare per
prendere I'autobus in 15 giomi lavorativi;
10, 1, 13, 9, 5, 9, 2, 19, 3, 8 , 6 , 17, 2, 10, 15.
Determinare: la media, la varianza, la mediana, i quartili; tracciare un boxplot
1.8.
Le precipitazioni, espresse in pollici, per alcune cittá U.S.A. nel mese di aprile
di un certo anno, sono:
2.9, 3.7, 3.2, 4.0, 3.9, 2.1,
4.0, 4.0, 3.0, 2.2, 3.3, 3.8,2.6, 2.2, 4.2, 5.4, 4.8, 1.8.
a. Costruire uno stem and leaf display, suddividendo ogni unitá in due classi.
b. Costruire un istogramma aventi le stesse classi utilizzate nello stem and leaf
display, e un altro aventi intervalli di ampiezza doppia. La distribuzione appare
simmetrica o asimmetrica? Unimodale o plurimodale? In base all'istogramma, stimare
(senza fare calcoli) la media delle osservazioni. Calcolarla poi analiticamente.
c. Sapendo che Ipollice = 2.54cm., calcolare la media e la varianza in cm.
1.9.
La distribuzione di irequenza cumulativa relativa per la profonditá dei pozzi
petroliferi in una determinara regione é data dalla tabella:
Profonditá (in metri)
h < 300
ZOO < h < 600
900 < h < 1200
1500 < h < 1800
2100 < h < 2400
2700 < h < 3000
3300 < h < 3600
3900 < h < 4200
Voto
18-20
21-23
24-26
27-29
30
Frequenza
5
18
27
15
6
Peso
60 0 meno
61-65
65-70
71-75
76-80
IQ
meno di 90
90-99
100-109
110-119
piú di 119
25
Frequenza
3
14
22
19
7
Frequenza
41
13
8
3
1
№ di messaggi
152
84
56
31
14
6
2
A
B
C
4
0
1
0
2
1
1
1
2
2
5
3
2
2
0
1
1
3
1
2
2
0 1
1 0
1 3
1
1
3
3
2
1
0
2
3
2
1
2
3
4
1
0
5
1
27
povertá
23.60
13.80
18.70
6.10
6.20
8.10
5.50
10.20
10.10
6.00
densitá
2887
1256
1386
101
2255
2437
2816
3346
1996
5259
vittime
27.07
11.37
14.51
8.48
3.15
11.30
4.12
7.32
18.93
5.38
regione
South
South
South
West
West
West
West
West
South
West
Legenda;
Povertá = percentuale delle famiglie al di sotto della soglia di povertá;
Densitá = numero di abitanti per miglio quadrato;
Vittime = numero di vittime di omicidio, diviso 100, nel periodo '80-'84;
Regione = regione geográfica degli Stati Uniti.
Un po’ di terminologia. Ogni riga numerata da 1 a 10 é un'osservazione\ ogni
colonna (tranne la prima, che é un'etichetta deH'osservazione) é una variabile, le
variabili "povertá", "densitá", "vittime" sono numeriche, la variabile "regione" é
' Dati provenienti da un file dimostrativo acciuso al programma StataQuest 4.0.
28
2000
cens i ta'
4000
II gráfico non suggerisce che ci sia una correlazione tra le due variabili. Ad
esempio,
non é in generale vero che cittá con densitá elevata abbiano elevato numero di
omicidi,
o viceversa. I punti sono sparsi senza apparenti regolaritá. Tracciamo ora uno
scatterplot delle variabili povertá/vittime;
Qui una certa regolaritá appare; punti con ascissa piccola hanno ordinata piccola,
e
punti con ascissa grande hanno ordinata grande: diciamo in questo caso che esiste
una
correlazione diretta tra povertá e numero di omicidi. Análogamente parliamo di
correlazione inversa tra due variabili, quando al crescere di una l'altra decresce.
In questo esempio i punti sono (grosso modo) disposti lungo una retta crescente: la
relazione tra le grandezze è proprio lineare? Si puó tracciare la retta di
regressione
(retta che "pió si awicina a tutti i punti", vedremo poi come si calcóla):
Capitolo 1: Statistica descrittiva
vittime=
29
205031 ♦ 1 0 !l74poverta
Per quanto possa essere signifícativa un'indagine statistica fatta con sole dieci
osservazioni, I'idea di una relazione lineare tra le due variabili sembra
plausibile.
I dati di questo esempio sono in reaitá estratti da un insieme di 146 osservazioni
(ossia dati relativi a 146 cittá degli U S A ). Senza riportare (per brevitá) la
tabella
completa di questi dati, é interessante osservare lo scatterplot povertá/vittime
prodotto
dal computer per questo insieme piu ampio di dati.
log(poverta')
In altre parole, una approssimazione ragionevole della relazione che lega vittime e
povertá é una legge non lineare, la cui crescita é una potenza a esponente maggiore
di
1.
□
Puntualizziamo ora alcuni concetti emersi da questo esempio. Nel seguito di questo
parágrafo ci occuperemo del concetto di correlazione tra variabili; nei prossimi
parleremo della retta di regressione e dell'uso delle trasformazioni di scala.
Defínizione 24. Supponiamo di avere n osservazioni congiunte di 2 variabiii:
{(a?i. 1/1). (íC2.Í /2).•••. (^Tn.yn)}- Si dice covarianza delle due variabili z ,
y il numero:
a^y
x)(yi
- y) = f
I - xy.
'^xy
Oxy — <7yiDalla defínizione, si vede che la covarianza puó avere segno positivo o
negativo, e il
coeffíciente di correlazione ha lo stesso segno della covarianza. Se questo segno é
CapHolo 1: Statistica descrittiva
31
a xY > 0
32
axY < 0
axY = 0
(7)
che dá, per a , 6 físsati, la somma dei quadrati delle distanze tra il punto (x ,,y
i) e il
punto di uguale ascissa che si trova sulla retta y = ax + b. Cerchiamo ora la
coppia di
numeri (a, 6) che rende minima questa espressione. Questo procedimento si chiama
método dei m inim i quadrati, e la retta che troveremo, retta di regressione per
gli n
punti ( x j.y i) , (x 2,y 2),
(xn.yn) Per minimizzare l'espressione (7), la vediamo
come una ñmzione / ( a , 6) :
—» R, e usiamo i metodi standard del calcólo
differenziale per funzioni di due variabili. Calcoliamo perció:
|^ ( a , 6 ) = - ^ 2 x , ( y , - (ax, + 6 )]
1 -1
Capitolo 1: Statistica descrittiva
33
| ^ ( a , 6) = - ¿ 2 ( y ¿ - {axi + b)]
e rísolviamo il sistema
|i ( a , 6 ) = 0
%(a.b)=0.
b =
(8)
a x i)
‘i=i
che, sostituito nella prima equazione dà (adenzione a cambiare il nome dell'indice
di sommatoria,
nelle due sommatorie indipendenti!)
n
E * . Vk
0.
k=\
..
- ÿ) “ a ^ X k { X k - x ) = 0
k=\
k=\
da cui si ricava
È^kiVk - y)
k^\________
n
Y ^ X k iX k - x )
*=1
Questa espressione puô essere scritta in modo più leggibile, osservando che
n
k=\
/ 2
n ^
^Xfc(y* - ÿ) = '^XkVk -
n ^
=n
k=\
®ÿ ) =
k=\
Ox)J
oi
e inñne, sostituendo quest'espressione nella (8).
II punto (a, b) trovato ¿ Túnico p u n to sta zio n a rio della ñmzione / in R^.
Poiché questa ñinzione ¿ un
polinomio (perció illimitata alTinfinito) ed ¿ positiva (per definizione), tale
punto é necessariamente il
punto di m ín im o a sso lu to di /.
_______________
34
a = — 5- ;
^ly
b = y - x - — 5T.
(9)
y i = 3x, + 6
che rappresentano, appunto, i valori della variabile y stimati dalla retta di
regressione in
corrispondenza delle osservazioni x,. Chiamiamo residui i numeri
r , = V i - y„
cioé le differenze tra i valori che corrispondono a x, sulla retta e quelli
effettivamente
Capitolo 1: Statistica descrittiva
35
Si
Si
Si
Si
y
44
214
193
299
143
200
i
1
2
3
4
5
X iy ,
105
511
401
622
330
Vi
44
214
193
299
143
4620
109354
77393
185978
47190
11025
261121
160801
386884
108900
y?
1936
45796
37249
89401
20449
1969
893
424535
928731
194831
393.8
178.6
84907
185746.2
38966.2
Xi
i= l
5
1=1
i=\
5
al =
E
i= l
1
a l = - Y '^ i - { y f = 38966.2 - 178.6^ = 7068.24;
8 ,= i
Pxy = --- -- -
14574.32
175.12 • 84.07
0.99.
b= y - x - ^
'xy
14574.32
30667.76
= 0.4752326;
La retta di regressione é;
y = 0.4752 X - 8.5466
Capitolo 1: Statistica descrittiva
37
4 7 5 2 3 3 o a ii
x =
X=
X=
X=
200,y
300,y
400,y
500,y
=
=
=
=
0.4752
0.4752
0.4752
0.4752
• 200
• 300
■400
• 500
8.5466
8.5466
8.5466
8.5466
=
=
=
=
86.4834;
134.0134;
181.5334;
229.0534.
Dall'esempio appare chiara l'utilitá di utilizzare il computer per non fare
manualmente i calcoli.
Esercizio 1.14. Si risponda alie stesse domande dell'esempio precedente,
utilizzando
questa volta i seguenti dati;
X
211
332
322
435
275
y
112
155
131
208
138
y = ax .
(Ossia y cresce proporzionalmente a una potenza di x). Prendendo i logaritmi di
entrambi i membrí dell'equazione, troviamo;
log y = log a + 6 • log X,
il che signifíca che log y é fum ione lineare di logx. Se quindi eseguiamo il
cambiamento di scala logarítmico su entrambi gli assi, ossia consideríamo i nuovi
daíi
(lo g X iJo g y i), (logX 2,lo g y 2), . . . . (IogX „,logy„),
possiamo determinare la retta di regressione relativa a questi punti. Se questa si
adatta
bene alio scatterplot dei nuovi punti, vuol dire che le nostre osservazioni sono
descrítte
bene dalla relazione:
logy = a ■logx + b,
che si puó riscrívere, passando agli esponenziali,
_ C
-6 • X .
y.. =
Si noti che a, b sono i coefficienti della retta di regressione dei dati
trasformati.
In pratica, se le nostre osservazioni appaiono disposte lungo una curva, non
possiamo sapere a priorí se questa curva sará una potenza o una ñmzione di altro
tipo;
quindi il cambiamento di scala illustrato é un tentativo che facciamo; é lo
scatterplot
dei dati trasformati, o il calcólo del coefficiente di correlazione dei dati
trasformati, che
ci deve dire se é corretto procederé per questa strada, e determinare la curva del
tipo
detto. Altrímenti, si potranno cercare altrí cambiamenti di scala.
Si osservi, ad esempio, che se la "relazione vera" che intercorre tra le varíabili
x e y
é del tipo;
y = a -b^
(ossia y cresce proporzionalmente a un esponenziale di x), prendendo i logaritmi di
entrambi i membrí dell'equazione, troviamo;
logy = loga + X • logb,
quindi in questo caso logy é funzione lineare di x. Dunque un cambiamento di scala
logarítmico sul solo asse y mette in luce un'eventuale relazione esponenziale tra x
e y.
Análogamente, un cambiamento di scala logarítmico sul solo asse x mette in luce
un'eventuale relazione logarítmica tra x e y. 1 cambiamenti di scala che abbiamo
illustrato sono solo esempi particolarí, e non hanno alcuna pretesa di generalitá,
tuttavia in certe situazioni possono essere suíficienti.
L'utilitá dei cambiamenti di scala é anche quella di rendere piú leggibili gli
scatterplot, quando i punti che rappresentano le osservazioni sono, ad esempio,
troppo
addensati (come visto neil'Esempio 23). Per scegliere il cambiamento di scala
giusto
occorre naturalmente ríflettere sulle propríetá matematiche della funzione che si
intende utilizzare. Ad esempio il logaritmo allontana numeri compresi tra 0 e 1 e
awicina punti maggiori di 1.
Esempio 28. I seguenti dati si riferiscono all'area di contaminazione dell'acqua
col
passare del tempo, dovuto alia fuga di un agente chimico tossico L'area é misurata
in
Capitolo 1: Statistica descrittiva
39
Acrí y
35.8
44.5
68.7
165.6
253.4
= -366 5 0 0 W 4 3324*
(Non nportiamo i calcoli, che sono stati effettuati dal computer). L'adattamento
sembra discreto, tuttavia si nota che i punti sono disposti lungo una specie di
parabola,
piuttosto che esattamente lungo la retta. Se tracciamo un gráfico dei residui,
questo
fatto é ancora piú evidente:
V=-366 500*74 3324*
100
.vnat
200
logx
1.722767
1.824549
2.091864
1.629241
1.987874
logy
3.795489
4.229749
5.534969
3.577948
5.109575
La relazione
logy = -3.76381 + 4.43663 logx
SI n sen ve come:
y = 0.023195 •
II gráfico mostra la stessa caratteristica di prima; i punti sembrano attraversare
la
retta in modo regolare piú che casuale. Proviamo ad eseguire un cambiamento di
scala
diverso, prendendo x e log y;
CapUolo 1: Statistica descríttiva
41
•ogy
3.795489
4.229749
5.534969
3.577948
5.109575
5.1
5.6
6.2
7.3
8.1
II grafíco che si ottiene é ora;
logV= 030949f 603993X
030949» 6B3993X
nz
-V h íi
iV
La relazione
log y = 0.030949 + 0.68399 X
SI nscnve come:
y = 1.0314 • 1.98* ~ 2*.
La relazione trovata é approssimativamente uguale alia legge esponenziale y = 2^,
un
risultato moho semplice (e che forse, riflettendo sul fenómeno, puó essere previsto
a
priori).
□
42
Freq. assol.
10
11
12
13
14
15
Totale
Freq. perc.
3.33
3.33
3.33
6.67
13.33
6.67
10
10
13.33
10
6.67
10
3.33
100
30
■^4; iV-:
6
10
t1
12
13
15
nunero 0i guflsti
Si puó calcolare;
media = 9.56
mediana = 1 0
varianza = 10.5
La distribuzione mostra una spiccata variabilitá interna, ed é bimodale. Questo puó
apparire strano, in relazione al problema reale in esame; il fatto che il numero di
guasti
annui abbia 2 picchi distinti, di 7 e 11, é puramente casuale o significa qualcosa?
Se i
dati descritti sono tutto ció che sappiamo sul fenómeno, é impossibile rispondere.
Ma
supponiamo di avere la seguente infbrmazione ulteriore. Le 30 macchine in questione
provengono da due distinti lotti di produzione, nella misura di 15 per lotto.
Capitolo 1: Statistica descrittiva
43
Riconsideriamo questi dati tenendo conto della suddivisione delle osservazioni nei
due
lotti:
n** di guasti
2
4
5
6
7
8
9
10
11
12
13
14
15
Totale
Freq. assoluta
Lotto 1 Lotto 2
1
0
1
0
1
0
2
0
4
0
2
0
3
0
0
3
1
3
0
3
2
0
0
3
1
0
15
15
Totale
1
1
1
2
4
2
3
3
4
3
2
3
1
30
La situazione appare ora in una luce ben diversa; evidentemente il lotto 2 é piu
difettoso del lotto 1. Confrontiamo i due lotti mediante boxplot e mediante
istogramma;
^ rtunero a t g u a sti
15
44
varb==l
.1
.J D Q l,
U
(O
c_
vBrl)==2
T T T T T T T T 7 tm îïÇ Ï4 ^
r~
Total
.3
.1
m q:
I I t I j—I—I—I—I—I—I—I—I—1—
2 3 4 5 6 7 8 9 101112131415
varb
Histograms by lotto
Questo tipo di confronto conferma I'ipotesi di maggior difettositá di un lotto
rispetto all'altro. Si ha cosi un'interpretazione soddisfacente della natura
bimodale della
distribuzione complessiva.
Questo é solo un esempio di come I'osservazione dei grafici e degli indici di
sintesi
possa essere il punto di partenza per un'analisi piu approfondita dei dati.
□
II prossimo esempio riassume vari problemi visti in questo parágrafo
Esempio 30. R endim ento dei fondi di investimento. Questi dati ^ descrivono il
rendimento di 186 fondi di investimento U S A., dal 1988 al 1992. Per ogni fondo
viene indicato:
1. Nome del fondo ("etichetta dell'osservazione");
2. tipo di fondo (i fondi sono classificati in 7 tipi, numerati da 1 a 7);
3. rendimento nel quinquennio;
4. rendimento nell'ultimo anno.
Non ci interessa qui descrivere il significato dei 7 tipi di fondo, né spiegare
esattamente come sono misurati i rendimenti in 5 anni e 1 anno: basti tener
presente
che la variabile 3 é una misura nel rendimento a medio termine e la variabile 4 una
misura del rendimento a breve termine (misurato con criteri e unitá di misura
diversi).
Le prime 5 osservazioni sono:
Fondo
COM Mutual
Fidelity Balanced
MainStay Total Ret.
Kemper Inv. Tot. Ret.
Pax World
Tipo
1
1
1
1
1
Rend. 5 anni
15600
14650
15001
15628
14222
Rend. 1 anno
6
8
4
4
1
statistics and data analysis, John Wiley & .sons, inc., 1995.
Capitolo 1: Statistica descrittiva
45
rendim ento
ar^ni
25000
20000
15000
:x ‘
10000
Si osserva che i gruppi di fondi con rendimenti medi maggiori hanno anche maggior
variabilitá interna. Questo puó dipendere dal principio generale secondo il quale
singoli
fondi con rendimenti medi piú alti sono anche fondi con maggior variabilitá nel
tempo;
si puó pensare che, se un gruppo di fondi è caratterizzato dal falto che ogni fondo
che
vi appartiene ha un'alta variabilitá nel tempo, il gruppo stesso avrà un'alta
variabilitá
interna. Si osserva anche che vari gruppi hanno "outliers", ow ero contengono
singoli
fondi particolarmente buoni (moho al di sopra della media del gruppo); invece, i
gruppi
non contengono fondi moho al di sotto della media del gruppo. Si osserva anche che,
con l'eccezione del gruppo 7, i rendimenti peggiori sono simili per tutti i gruppi,
mentre
i rendimenti medi e massimi sono moho diversi.
Vediamo ora il confronto análogo tra tipi di fondo sui rendimenti a breve termine:
^
/1 0
20
-
1992
return
¡J
O-
- 20
Si osserva che gruppi ad alta (bassa) variabilitá nel lungo periodo hanno anche
alta
(bassa) variabilitá nel breve. Pero, si osserva anche che le mediane dei vari
gruppi sono
(almeno per i primi 6 gruppi) paragonabili tra loro, nel breve periodo, mentre nel
lungo
erano moho piú diversifícate: nel breve periodo i tipi di fondo "ad alto rischio"
46
rendono mediamente come quelli a basso rischio; nel lungo período, invece, rendono
mediamente di piú.
Fin qui abbiamo confróntate la varíabile "rendimento a un anno" e "rendimento a 5
anni", separatamente, sui 7 gruppi. Studiamo ora, a prescindere dai gruppi, la
relazione
tra le due varíabili. Osserviamo, mediante uno scaííerplot, la relazione tra
rendimento a
breve e a medio termine:
cinque=
3632+1 77 422return
1 3632+1 77 4 2 2 r e t u r n
•----------- r----1 •
5000 -
o
0^0
0 ^8®
0
" >
"
§8«
8,o8o e «o
* e.
Oo°
-5000 10000
15000
20000
_vnat
Si puó cercare se esiste una relazione diversa da quella lineare, che si adatta con
piú precisione. Ad esempio, se rappresentiamo il logaritmo del rendimento a 5 anni
contro il rendimento a 1 anno, troviamo;
Capitolo 1: Statistica descrittiva
47
log_5an= 9.50463*»-012454return
50463*
0 12454return
•----------L-. I ■
Esercizi
1Л5. I seguenti dati sono stati ottenuti sottoponendo a sforzo delle sbarre
fabbricate
con una lega sperímentale;
Deformazione Laterale
Deformaz. Longitudinale
cy
0.11
0.14
0.06
0.16
0.22
0.3
0.4
0.2
0.5
0.6
Acrí y
4.8
5.3
19.7
1.5
10.1
Capitok) 2: ProbabUHá
Spiegazioni;
(1) Qualunque evento elementare si realizzi, appartiene sempre a íl.
(2) Qualunque evento elementare si realizzi, non appartiene mai a 0.
(3) Nessun evento elementare realizza sia A che B. perció A e B non possono
accadere simultáneamente.
(4) Ogni evento elementare che appartiene a B (ossia realizza l'evento B),
appartiene
anche ad A (ossia realizza l'evento A).
Ricordiamo anche le proprietá delle operazioni insiemistiche :
Proposizione 7. Se A , B , C sono sottoinsiemi di fi, valgono le proprietá:
AU A = A;
ADA = A;
A U B = BuA;
ADB = B n A
A U (B U C) = (A U B) U C
An(BnC) = (AnB)nC
(idempotenza di U )
(idempotenza di n )
(proprietá commutativa di U )
(proprietá commutativa di D )
(proprietá associativa di U )
(proprietá associativa di n )
51
Capitolo 2: Probabilità
AU{BnC) = {AöB)n{AuC)
n ( S U C) =
n ß ) U (>l n C)
Audi = A
> ln0 = 0
>lUfi =
.4 U A =
i4 d 34 = 0
(AUB) = Ä n B
^ n ß ) = AUB
(legge di De Morgan)
(legge di De Morgan)
(A) = A.
2.3.1.
N e l
s ig n ific a
^
K o lm
lin g u a g g io
p r o b a b ilit á
c o m u n e ,
d e l
L 'im p o s t a z io n e
o g o r o v ,
r is a le
5 0 %
la
p r o b a b ilit á
( p r o b a b ilit á
a s s io m a tic a
a l
1 9 3 3 .
d e l
e s p re s s a
s p e s s o
p r o b a b ilit á
c a lc ó lo
d e lle
d e l
ín
p e r c e n tu a le ;
1 0 0 p %
p r o b a b ilit á
a d
e s e m p io
p r o b a b ilit á
1 /2
) .
d o v u ta
a l
m a te m á tic o
ru s s o
A .
N
52
CapHoto 2: Probabilità
P : P{Q) ^ [0,1]
(ossia una flinzione che ad ogni sottoinsieme di Q associa un numero reale compreso
tra 0 e 1) tale che
= 1;
(I)
P( A) = 1 - P(Ay,
P ( A , [ J A 2 U . . . UAr,) = P(Ax) + P{A2) + ... + P ( A „ ) ,
parché gli eventi A i siano a due a due disgiunti;
P {A U B ) = P{A) + P{ B) - P ( A n B)
per ogni coppia di eventi A , B (anche non disgiunti).
Le prime tre proprietá sono abbastanza owie. Dimostriamo invece l'ultima relazione
scritta:
P {A
U fl) =
P{A)
+ P(B) -
P{A
B).
L'idea è scrivere A l ) B come unione di due eventi d isg iu n ti, per poter
calcolare la sua probabilitá
come somma delle probabilitá di due eventi. Consideriamo perció le seguenti
identitá insiemistiche.
che possono essere facimente dimostrate utilizzando le proprietá enunciate nella
Proposizione 7:
5 = (fínX)u(Bnl).
In entrambe le identitá precedenti, a secondo membro c'é l'unione di due insiemi
puó scrivere, per l'additivitá della probabilitá:
P { A U B ) = P{A) + P {B nA )-,
d isg iu n ti.
Perció sí
Capitolo 2: Probabilitá
53
P (Á n B ) = P ( ( A U B ) ) = 1 - P (A U B );
P (A U B ) = P( A) + P{ B) - P { A n B ).
Possiamo quindi calcolare;
P (B ) = 1 - P ( B ) = 0.2;
\u;/k€i4
Wk^A
Capitolo 2: ProbabilHá
dove pk sono una successione di numen > 0 tali che 52 p* = 1, risulta completamente
fc=i
definita una probabilitá P su Q.
Esempio I I . Sia O l'insieme degli interí positivi; se poniamo
^
perfc = 1 , 2 , 3 , . . .
C»
poiché 1/2* > 0 e J ^ l/2 * = 1, rísulta defínita una probabilitá su Í2 Ad esempio,
se
k=\
OO
-•
OO
P (A ) = ^ P ( 2 t ) =
k=í
=
*=1^
k = l^
(somma della serie geométrica di ragione 1/4, privata del primo termine).
La defínizione di probabilitá data in quest'esempio soddisfa gli assiomí (e quindi
le
proprietá) di probabilitá; per il resto, potrebbe sembrare una defínizione
totalmente
arbitraría. Tuttavia, non é cosí: ímmaginiamo il seguente esperímento aleatorio,
con cui
vogliamo estrarre un intero positivo a caso. Lanciamo una moneta (non truccata!);
se
esce testa, il numero estratto é 1; se esce croce, la lanciamo di nuovo; se ora
esce testa,
il numero estratto é 2; altrímenti la lanciamo di nuovo, e cosí via. E' chiaro che
ogni
numero intero puó essere estratto; inoltre, la probabilitá con cui viene estratto k
é
proprío 1/2* (questo fatto potrá esser dimostrato piú avanti nel corso). Dunque la
probabilitá che abbiamo defínito é quella adeguata a descrívere questo esperímento
aleatorio; naturalmente, un diverso método di estrazione avrebbe ríchiesto una
diversa
defínizione di probabilitá.
□
Esercizio 2.1. Dimostrare, utilizzando gli assiomi di probabilitá, che non é possi
hile
definiré una probabilitá suH'insieme Q dei numeri naturali 1 , 2 , 3 , . . . in
modo tale che i
numeri síano tutti equiprobabili.
Questo fatto si puó interpretare dicendo che non é possibile "inventare" un
esperímento aleatorio che abbia come esito l'estrazione di un numero naturale a
caso,
se si vuole che tutti i numeri siano estratti con ugual probabilitá. Si confronti
con
l'Esempio 11, in cui si descríve effettivamente un esperímento aleatorio per
estrarre un
numero naturale a caso, ma i numeri non sono equiprobabili.
2.3.2.
Vediamo ora come aver risposto alia domanda 2 (come si opera con la probabilitá)
aiuti anche a rispondere alia domanda 1 (come si assegnano le probabilitá agli
eventi
"di partenza"). Consideríamo ora il caso in cui lo spazio campionario é finito. In
molte
situazioni, é ragionevole rítenere che gli eventi elementarí siano ugualmente
probabili:
ad esempio se lancio un dado (non truccato!), la simmetría del dado mi fa rítenere
ugualmente probabili i 6 esíti possibili. In generale, se Q ha TV elementi uik
(k = 1 , 2 , . . . , N ), se imponiamo che gli eventi elementarí siano
equiprobabili, o w ero
P({cjit}) = p per fc = 1 , 2 , . . . , TV, otteniamo
Capitolo 2: Probabilitá
55
dacui p = l / N .
= pi-^i =
u^k^A
2.3.3.
Capitolo 2: Probabilità
Esempio 13. Qual è la probabilità che un automobilista scelto a caso (ad esempio,
tra
tutti gli automobilisti milanesi in una certa fascia d'età) faccia un incidente nel
corso
dell'anno prossimo? (La domanda è intéressante dal punto di vista della compagnia
assicurativa).
Supponiamo di sapere dalle statistiche che, durante tutto l'anno scorso, il 4%
degli
automobilisti nella classe considerata ha avuto un incidente. In altre parole, p =
0.04 è
la frequenza relativa con cui si è verificato l'evento 'Tautomobilista x ha avuto
un
incidente nell'anno passato", al variare di x nella classe considerata. In mancanza
di
altre informazioni, è ragionevole assumere questa frequenza relativa come stima
della
probabilità dell'evento "un automobilista scelto a caso fará un incidente nel corso
dell'anno prossimo".
Perché? In eífetti questa conclusione si basa sulla nostra idea intuitiva seconde
cui,
se riteniamo che ottenere "Testa" nel lancio di una moneta abbia probabilità 0.5,
ci
aspettiamo che lanciando un gran numero di volte la moneta, la frequenza relativa
con
cui effettivamente esce testa sia circa 0.5 (la cosiddetta "legge dei grandi
numeri", di
cui daremo piú avanti una formulazione precisa) Allora, in altre situazioni come
quella
dell'esempio degli automobilisti, rovesciamo questo punto di vista e usiamo la
frequenza relativa per valutare la probabilità; in altre parole, usiamo
l'esperíenza
passata (frequenza relativa dedotta da statistiche) per farci delle opinioni sul
futuro
(probabilità di un evento futuro).
Questo modo di pensare si chiama "punto di vista frequentista" e, come si puó giá
intuiré da questo esempio, giocherá un ruolo importante nello studio della
statistica. In
questo caso non sarebbe possibile calcolare a priori la probabilità dell'evento che
intéressa, mediante considerazione di casi possibili e casi favorevoli, e quindi lo
schema
della probabilità classica è inutilizzabile.
2.4.1.
57
Esempio 14. Una casa automobilistica produce una linea di vetture in 3 cilindrate
diverse; per ogni cilindrata è disponibile una versione base ed una più
accessoriata;
infíne, ogni tipo di auto è disponibile in 4 colorí. Quanti tipi di vetture diverse
compongono la linea?
Ragioniamo secondo uno schema di scelle successive: per contare in quanti modi
diversi potrei scegliere un'auto, pensiamo di scegliere per prima cosa il modello
(base o
accessoriato), per secondo il colore e poi la cilindrata. Rappresentiamo il
procedimento
di scelta con un diagramma ad albero:
l “scelta;
modello:
2 opzioni
2“ scelta;
colore:
4 opzioni
3“ scelta:
cilindrata:
3 opzioni
D ia g r a m m a a d a lb e ro p e r !'E se m p io 14.
Capitolo 2: Probabilitá
I prossimí esempi mostrano alcune situazioni diverse che possono essere analizzate
con un ragionamento simile, facendo uso del principio precedente.
Esempío 16. Quanti sono gli "anagrammi" (anche privi di senso!) della parola
"MATRICOLE"?
Ogni anagranuna é una sequenza di 9 lettere scelte fra quelle di "MATRICOLE".
Disponiamo le 9 lettere in 9 caselle.
Per riempire la prima casella possiamo scegliere fra 9 possibilitá;
per riempire la seconda casella possiamo scegliere fra 8 possibilitá (tutte tranne
la
lettera che abbiamo giá sistémate nella prima casella);
per riempire la terza casella possiamo scegliere fra 7 possibilitá;
.. .e cosí via, finché,
per riempire la penúltima casella possiamo scegliere fra 2 possibilitá;
per riempire l'ultima casella abbiamo una sola possibilitá.
Per il principio del prodotto delle possibilitá, il numero totale di anagrammi é
9 - 8 - 7 - 6 - 5 - 4 - 3 - 2 = 362880.
Astraendo dall'esempio precedente, diamo la seguente
Defínizione 17. Una permuíazione di n oggetti é ogni allineamento di n oggetti
(distinti) in n caselle.
Con lo stesso ragionamento visto nell'esempio precedente si trova che:
Proposizione 18. II numero totale di permutazioni di n oggetti é
z= n! = n ( n — l ) ( n —2)... 3 • 2.
—^ = n ( n - l ) ( n - 2 ) . . . ( n - m - h 1).
m\
/: ;
Esempío 19. In una gara con 40 concorrenti, quante sono le possibili classifíche
dei
primi 5?
Per il primo posto possiamo scegliere tra 40 possibilitá;
per il secondo posto possiamo scegliere tra 39 ( = 40 — 1) possibilitá;
...e cosí via, finché...
per il quinto posto possiamo scegliere tra 36 ( = 4 0 - 4) possibilitá.
In tutto quindi ci sono
40 X 39 X 38 X 37 X 36 = 78 960960
classifíche possibili.
In generale;
Capitolo 2: Probabilità
59
— 1 ) ( ^ - 2 ) . . . ( n — fc + 1).
X ... X
3 = 3'^ = 1594323
13 volte
colonne possibili. In generale;
Defînizione 23. Una disposizione con ripetizione di n oggetti in k posti (A; > 1) è
ogni allineamento di k oggetti scelti tra n oggetti e ripetibüi, in k posti.
(Poiché gli
oggetti possono essere ripetuti, in questo caso n pu 6 essere < k o > k).
Proposizionc 24. Il numéro totale di disposizioni con ripetizione di n oggetti in k
posti è
Esempio 25. La distríbuzione dei puntí di tre dadi. (Questo esempio é dovuto a
Galileo, intorno al 1620). Lanciando tre dadi, si vede che il numero 9 e il numero
10 si
possono ottenere entrambi in 6 modi diversi; eppure si osserva che il 10 esce con
maggior frequenza del 9. Come mai?
Enumeriamo i casi possibili e casi favorevoli. Va notato che i "sei modi" in cui si
possono formare il 9 e il 10 sono sei terne di numeri, che pero vanno compútate
tenendo conto delle permutazioni possibili, che sono 6 per tre cifre diverse, 3 per
2
uguali e 1 diversa, 1 per 3 uguali.
9 =6+2+1
5+3+1
5+2+2
4+4+1
4+3+2
3+3+3
totale
6 modi
6 modi
3 modi
3 modi
6 modi
1 modo
25 modi
10 =
6+3+1
6+ 2+2
5+4+1
5+3+2
4+4+2
4+3+3
totale
6 modi
3 modi
6 modi
6 modi
3 modi
3 modi
27 modi
60
Capitolo 2: ProbabilHá
I casi favorevoli ai due eventi "ottenere 9" e "ottenere 10" sono quindi,
nspettivamente, 25 e 27, mentre i casi possibili sono sempre 6^ = 216. Le
probabilitá
dei due eventi sono, nspettivamente;
— = 0.1157; — = 0.125.
216
216
P{A) = 1 - P{A) = 1 -
365 3 6 4 - . . .
( 3 6 5 - n + l)
365"
Questo valore puó essere tabulato per vari valori di n. Si trova ad esempio;
n =
P (A ) =
10
23
20
30
50
366
40
60
70
0.117 0.411 0 .5 0 7 0.706 0.891 0.970 0.994 0.999 1
Si trova che il primo intero per cui P{A) > 0.5 é 23, mentre per n = 70 si ha
p = 0.999.
□
2.4.2.
Problema 27: Sia S un insieme di n elementi, e sia 0 < k < n . Quanti sono i
sottoinsiemi di 5 aventi k elementi? Equivalentemente: in quanti modi si possono
scegliere k oggetti tra n?
In questo caso non possiamo usare lo schema delle scelte successive, perché la
sequenza di scelte a, ¿>,c, poniamo, non individua un sottoinsieme diverso dalla
sequenza di scelte 6, c, a (ad esempio); un insieme é determinato dai suoi
elementi, a
prescindere dall'ordine. In un certo senso, qui occorre pensare agli oggetti come
scelti
"simultáneamente".
Capitolo 2: Probabilità
61
Pk ~
k\
Dimostrazione. Proviamo che D^^k = C'n.fc Pk, ü che equivale alia tesi. Per fare
questo, contiamo le disposizioni di n oggetti in k posti in un modo diverso da come
abbiamo fatto in precedenza.
Se abbiamo k caselle da riempire con k oggetti scelti ira n, procediamo in due
tempi; prima scegliamo i k oggetti tra gli n, e questo si puó fare in Cn,k modi
(per
defínizione di
poi scegliamo in che modo disporre i k oggetti scelti in k caselle,
e questo si puó fare in Pk modi. II numero totale di disposizioni D„ c quindi parí
al
prodotto Cn,k • Pk, che é quanto volevamo dimostrare.
□
Defínizione 30. Se n > 1 e 0 < A: < n , si defínisce il coefficiente binomiale
n ( n — l ) ( n — 2 ) . . . ( n — fc + 1)
k\
( 2)
0 =
n!
fc!(n — k)\
(3)
(:)■ (.% )
Ad esempio, per calcolare ( *®) conviene procederé
flO \
/1 0 \
c o sí :
10-9-8
( o) ^ ( n) ^
P®*’
”•
Capitolo 2: ProbabilUà
altre caselle andranno ríempite con quelle nere). In quanti modi posso scegliere k
caselle tra n? La rísposta é, naturalmente, Cn,k = (*)•
Abbiamo cosí un'altra utíle interpretazione del numero ()^), come il numero di
modi in cui si possono disporre in n posti n oggetti di cui k uguali fra loro, e {n
— k)
uguali fra loro (e diversi dai precedenti).
I coefíicienti binomiali devono il loro nome al noto
Teorema 32. (Formula di Newton per lo svíluppo della potenza di un binomio).
*=0
per ogni infero positivo n, per ogni coppia di numeri reali a,b.
Omettiamo la dimostrazione, che é un facile esercizio che sfrutta quanto osservato
nel problema precedente.
♦♦♦♦♦♦
Problema 33. In quanti modi si possono distribuiré tra 5 persone 10 oggetti
identici?
Sia xi il numero di oggetti che spettano alia prima persona;
sia X2 il numero di oggetti che spettano alia seconda persona;
sia xs il numero di oggetti che spettano alia quinta persona.
Dev'essere:
x \ + X 2 + ■■■
significa; ho dato 2 oggetti alia prima persona, 3 alia seconda, uno alia terza,
nessuno alia quarta, 4
alia quinta. Per separare in S gruppi un allineamento di *, mi servono 4 sbarrette
|. Perció ogni modo
di distribuiré 10 oggetti identici tra 5 persone corrisponde a un allineamento di
10 + 4 oggetti. di cui
10 uguali tra loro e 4 uguali tra loro. Per quanto abbiamo visto nel problema
precedente, in tutto le
possibilitá sono;
1001.
Poiché vi sono varí tipi di problemi che possono trattarsi in modo simile, conviene
enunciare un
rísultato generale (che si dimostra con il ragionamento appena fatto).
Definizíone 34. Si chiama c o m b in a z io n e c o n r ip e tíz io n e di k
oggetti scelti fra n, ogni gruppo
formato di k oggetti scelti fra n, che possono essere ripetuti. Indichiamo con
il numero totale di
tali combinazioni.
P rop osizione
35. II numero
63
n!
.... ki\k2\...krV
In p a r tic o la r e
= í^\
it!(rí-Ar)!
\kl'
n!
lti!(n-/ci)!
(n - fc, - k2)\
fc2!(n - fci - 1:2 )!
k 3 \( n - k \ - k2 - k i Y
semplificando
n!
ki\k2\...krV
♦♦♦♦♦♦
64
2.4.3.
Capitolo 2: Probabilitá
I due schemi che abbíamo visto (I; scelte successive e prodotto delle possibilitá,
2:
scelte simultanee e uso dei coeñicienti binomiali) si usano spesso congiuntamente
per
conteggiare insiemi in situazioni "miste". Si considerino attentamente i prossimi
esempi.
Esempi. Calcólo di probabilitá nel gioco del poker. Consideríamo una partita a
poker tra 4 persone, in cui si usa un mazzo di 32 carte:
8 • 4 - 2 1 - 4 - 4 = 10752
mani che contengono un tris.
Poiché il numero totale di mani possibili é
(?)■ 201376,
questo signifíca che la probabilitá di avere un tris "servito" é
10752
201376
= 0.05339 ~ 5.3%.
40. Quante mani contengono una coppia (ma non un gioco migliore)?
Una coppia é una mano del tipo (X, X , Y, Z, W). Ragioniamo come prima:
1. Scegliamo il valore della coppia: 8 possibilitá;
2. le 2 caite della coppia si possono scegliere tra le 4 del valore fissato in
( 2 ) = 6
modi;
3. i valori delle 3 scartine si possono scegliere tra i 7 disponibili in ( 3 ) = 3
5 modi;
4. la prima scartina si puó scegliere ora in 4 modi,
5. lo stesso per la seconda;
6 . lo stesso per la terza.
In tutto:
Capitolo 2: Probabilità
65
mani che contengono una coppia; la probabilità di aveme una servita è quindi
107520
= 0.5338 ~ 53.4%
201376
Un
1.
2.
3.
4.
8 • 7 • 4 • 6 = 1344
mani che contengono un full, e la probabilitá di averne uno servito é
1344
= 0.006672 ~ 0.66%
201376
P{A^) = S )
o
39!
9! 30!
30! 10!
= ^ = 0.25
40!
40
(“ )
(ÎS) ^
- 0 4423
eccetera...
Esempio 43. Una giunta comunale formata da 20 persone deve scegliere al suo interno
una commissione di 5 persone. La scelta dei membri è casuale, col vinculo pero che
almeno 2 di essi siano del partito di maggioranza relativa (che ha 9 membri). Che
probabilità ha un membro del partito di maggioranza di essere in commissione?
Elenchiamo i casi possibili. Le commissioni contenenti almeno 2 persone del partito
di maggioranza sono quelle che ne contengono 2, piü quelle che ne contengono 3, . .
. ,
66
Capitolo 2: Probabilità
più quelle che ne contengono 5. Per formare una commissione con 2 persone scelte
fra
9 e 3 scelte tra 11 ci sono
/X
Ragionando allô stesso modo per 3,4,5, persone scelte tra i 9 del partito di
maggioranza (e 2 , 1, 0 , rispettivamente, scelte tra gli altri 11) si vede che ci
sono in
tutto
t i ’ l.m T ,,
casi possibili. Ragioniamo in modo análogo per contare i casi favorevoli. Poiché
ora
una persona é físsata nel partito di maggioranza, le scelte sono
e la probabilità richiesta è
3546
= 0.2937.
12072
Esercizi
Combinatoria
2.2.
In quanti modi 8 persone possono sedersi attomo a un tavolo che ha 8 posti?
2.3.
Come sopra, ma si considerano distinti 2 modi solo se varia la disposizione
relativa delle persone attomo al tavolo (rotondo). (In altre parole, due
disposizioni
ottenute Tuna dall'altra mediante rotazione del tavolo si considerano uguali).
2.4.
Idem, a un tavolo rotondo, ma con 4 uomini e 4 donne che devono sedersi in
modo alterno.
2.5.
Una ventiquattrore ha una combinazione di 6 cifre. Quante combinazioni ha? E
se invece di cifre fossero lettere A, B, C, D?
2.6.
In una gara di 40 concorrenti, di 8 nazioni diverse, 5 per nazione, quante
possibili classifíche per nazioni ci sono, per i primi 5 posti?
2.7.
Quante diagonali ha un poligono di n lati?
2.8.
Quante diagonali ha un prisma avente base di n lati? (Per diagonale intendiamo
un segmento congiungente due vertid che non stanno sulla stessa faccia del prisma)
2.9.
In quanti modi 3 persone possono occupare 3 di 4 posti numerati?
2. 10. Se una fíla del cinema ha 15 posti e ci sono solo 8 persone, in quanti modi
si
possono disporre?
2. 11. Se voglio codificare 20 oggetti usando "parole" di lunghezza fissa composte
usando solo 4 caratteri diversi, qual è la minima lunghezza della parola?
2.12. In quanti modi 10 automobili che arrivano a uno snodo autostradale possono
distribuirsi in 3 direzioni diverse? Distinguere i 3 casi:
a. le auto si considerano tutte uguali;
Capitolo 2: Probabilitá
67
Capitolo 2: Pmbabilità
P{AnB)
p(B) ■
P{ A \ B) =
n =
□□□□□So3a
\AnB\
\ B \
|>ln fî|/|fil
\
P{AnB)
P{B)
P{A)
P{B)
1/2 10
1/29
P{A
*
\
S i
f a c c ia
B),
c h e
a t te n z io n e
ra p p re s e n ta
n o n
la
c o n fo n d e re
p r o b a b ilit é
la
s c r it t u r a
d e l l ’e v e n t o
"A
P{A\B)
m e n o
B",
( p r o b a b ilit á
c io è
AnB.
d i
c o n d iz io n a ta
D)
c o n
Capitolo 2: Probabilitá
69
P{R2\ R i ) =
П ill)
P(Ri)
'
cosí
intuitivo. Ad
P( Á\ B) = 1 - P{A\B).
Questo si puó verificare in base alia defínizione di probabilitá condizionata.
Invece, non
é vero (ad esempio) che P{ A\ B) = 1 - P{A\B). (Attenzione a giustificare sempre i
passaggü).
Teorem a 47. (Teorem a delle probabilitá totali). Sia A un evento e {B^}"^, una
partizione di íl. ossia una fam iglia di eventi tali che:
a.
j=i
b.
Bi n Bj = 0 p e r i Ф j;
72
Capitolo 2: ProbabMé
P{Bk\A) =
P{A\B,)P{B,)
per ogni k.
■P{B,)
P{ M\ Po s ) =
P{ P o s \ M) P { M)
P { P o s \ M) P { M) + P{ Po s \ S ) P{ S ) ■
73
Facciamo un esempio numérico.^ La sensibilitá del test "Elisa" per l'HIV é circa
0.993. La specifícitá del test é circa 0.9999. La frequenza relativa dell'HIV nella
popolazione complessiva é circa 0.000025. La probabilitá che una persona risultata
positiva a questo test sia eífettivamente malata é
0.993 • 0.000025
= 0.19888 ~ 20%.
0.993 • 0.000025 + (1 - 0.9999)(1 - 0.000025)
Questo significa che solo il 20% di coloro che risultano positivi al test sono
eífettivamente malati; ow ero 1'80% dei positivi sono "falsi positivi". II
risultato,
sorprendente, dipende dal falto che la malattia che si cerca é moho rara, sulla
popolazione complessiva.^ Si osservi che la probabilitá che una persona sia malata,
sapendo che é risultata positiva al test, é comunque moho maggiore della
probabilitá
che aveva prima di sottoporsi al test;
P{M\ Poa)
P (A Í)
0.19888
= 7955.2
0.000025
P( E\ D) P{ D)
P( D\ E) = - = _________ ,
^ '
P{ E\ D) P{D) + P{ E\ D) P{ D)
Osserviamo che
^ 1 dati che qui vengono citati sono tratti da: S Chatterijee-M. S. Handcock-J. S.
Simonoflf: "A
John Wiley & Sons. New York 1995, pp. 37
sgg
^ Si osservi che si s(a supponendo di sottoporre al test persone di cui a priori
non si sa nulla; se si
applicasse il test a persone scelte in qualche "categoría a rischio", il numero P {
M ) andrebbe sostituito con
la frequenza relativa della malattia in quella classe di persone, e sarebbe
pertanto piii elevato, risulterebbe
di conseguenza piCi elevata anche la predittivitá del test.
74
Capitolo 2: Probabilitá
P{ D\ E) =
0.005 • 0.2
~ 0.00125 ~ 0.125%
0.005 • 0.2 + 0.999 • 0.8
P { A n B ) = P{A)-P{B)\
(7)
P{A\ B) = P{A);
(8)
P( B\ A) = P{B).
(9)
P{ A) = P{ B) = 3 /6 = 1/ 2 ; P{ A) P{ B) = 1/4;
P { A D B) = 2 /6 = 1/3.
Dunque
P { A n B ) ^ P{A) P{B),
e gli eventi non sono indipendenti.
Detto altrímenti; sapere che il numero uscito é > 3 non lascia inalterata la nostra
valutazione della probabilitá che il numero uscito sia parí; infatti
□
Capitolo 2: Probabilitá
75
P{A, n
^ 2
n ... n
= P { A , ) P { A 2). .. P{An).
j,
76
Capitolo 2: Probabilitá
18
1 1
= 2 2
1
4
(e lo stesso si puó ripetere per le altre due coppie di eventi). Affinché i tre
eventi
costituiscano una famiglia di eventi indipendenti deve valere anche la condizione:
P(R osso n Parí n D airi al 18) = P(R osso)P(Pari)P(D aU 'l al 18).
II secondo membro di questa uguaglianza vale 2 ' 2 2 ~ ^ p r i m o membro invece
vale
n° di numeri rossi, parí, dall'l al 18
36
’
e questa frazione non puó valere 1/8 (non c'é bisogno di guardare il tavolo da
gioco
della roulette per dirlo!) perché 36 non é múltiplo di 8 .
Quindi abbiamo un esempio di 3 eventi non indipendenti, anche se sono a due a
due indipendenti.
□
Proposizione 58. Siano A \ , A 2, . . - , An una fam iglia di eventi indipendenti.
Allora la
nuova fam iglia che si ottiene da questa sostituendo qualche A{ (non importa
quanti)
col suo complementare A{ é ancora una fam iglia di eventi indipendenti.
(Si verifica dalla definizione). Ad esempio; se sapere che il primo lancio di una
moneta ha dato Testa non mi dice nulla in piú sulla probabilitá che il secondo
lancio dia
Testa, lo stesso vale se invece so che il primo lancio ha dato Croce.
77
a = a\ • a 2-..
2. Se i componenti sono connessi in parallelo, l'affidabilitá del sistema é
o = 1 - (1 - 0 |) • (1 - 02)... (1 - 0 „).
Dimostrazione.
1. L'affidabilita di 5 e la probabilita che esso funzioni, quindi, per l'ipotesi di
connessione in serie, la probabilita che tutti i componenti flinzionino, quindi,
per
l'ipotesi di indipendenza, il prodotto delle probabilita di flinzionamento dei
componenti,
ossia il prodotto delle afiidabilita.
2 . Calcoliamo (1 — o), ossia la probabilita che S non funzioni. Per l'ipotesi di
connessione in parallelo, questa e uguale alla probabilita che tutti i componenti
non
flinzionino; per l'indipendenza dei componenti, questa e il prodotto delle
probabilita
che ciascuno non funzioni, ow ero il prodotto
78
Capitolo 2: Probabilitá
(1 - a i ) • (1 - a 2 ) . . . (1 - a „ ) .
Da questo segue la tesi. Abbiamo qui usato implicitamente il fatto che se gli
eventi "II
componente A, íunziona" sono indipendenti, per la Proposizione 58, anche gli eventi
"II componente A{ non ñmziona" sono tra loro indipendenti
□
Esem pío 61. Si calcoli l'aflidabilitá del sistema schematizzato in figura,
supponendo
che i componenti abbiano le seguenti affidabilitá:
79
b.
Ricalcoliamo l'affidabilitá nelle due ipotesi alternative. Con un impiegato in piú,
il primo sottosistema ha affidabilitá
1 - (1 - 0.6)® = 0.98976,
e l'affidabilitá del sistema é
0.98976 • 0.85 = 0.841296 ~ 84%.
Nella seconda ipotesi invece, il sottosistema impiegati ha affidabilitá
1 - (1 - 0.6)® = 0.936,
il sottositema dei tre capi ha affidabilitá
1 - (1 - 0.5)(1 - 0.7)(1 - 0.6) = 0.94,
e l'affidabilitá del sistema é
0.936 • 0.94 = 0.87984 ~ 88%.
Conviene quindi seguiré la seconda strada.
Capitolo 2: ProbabUñá
81
Pezzi prodotti da A
4
16
20
Pezzi prodotti da B
6
24
30
Tot
10
40
50
denota
a.
b.
c. P W k )
d. E P M
e. P
□
P( A )
h. k
□
Per ciascuna domanda, scegliere la risposta esatta tra quelle scritte qui sotto;
A. Un numero intero;
B. Un numero reale;
C. Un evento elementare;
D. Un evento;
E. Nessuna delle precedent! risposte
2.32. Alberto, Barbara e Cario lavorano nello stesso ufficio, con un solo telefono
Le
telefónate arrívano in modo casuale nelle proporzioni di 2 /5 per Alberto, 2 /5 per
Barbara, 1/5 per Cario. II loro lavoro richiede che essi lascino l'uñicio in
moment!
casual! e tra loro indipendenti, cosicché Alberto é íuori dall'ufficio per metá
dell'orario
di lavoro. Barbara e Cario ciascuno per un quarto dell'orario di lavoro. Calcolare
la
probabilitá che:
a. Le prime 3 chiamate della gíomata siano per la stessa persona.
b. Le prime 3 chiamate della giomata siano per 3 persone diverse.
c. Nel momento in cui arriva la prima telefonata, non c'é nessuno a rispondere.
82
Capitolo 2: Probabilitá
8
R
10
N
11
R
12
>¡
A 3 -----
A2 K
A4
2.39. Un técnico é chiamato in una ditta per intervenire su una macchina che si sta
rivelando inaffidabile. Infatti, produce 1 pezzo su 5 difettoso, mentre le altre 3
Capitolo 2: Probabilitá
83
macchine identiche che si trovano in quella ditta producono solo 1 pezzo su 100
difettoso. II técnico entra nella ditta, sceglie una macchina a caso tra ie 4
identiche,
osserva un pezzo a caso prodotto da quella macchina, e nota che é difettoso. Qual é
la
probabilitá che abbia scelto la macchina inafíidabile?
2.40. Tutte le borse dei passeggeri che si imbarcano su un aereo vengono passate al
metal detector, alio scopo di individuare eventuali ordigni. E' noto che: la
probabilitá
che una borsa che contiene una bomba faccia suonare Tallarme é 0.99; la probabilitá
che una borsa che non contiene una bomba faccia suonare Tallarme é 0.05; una borsa
ogni 5000 contiene una bomba. Sotto queste ipotesi:
a. Qual é la frequenza relativa con cui ci aspettiamo che suoni Tallarme?
b. Qual é la probabilitá che una borsa che ha fatto suonare Tallarme contenga una
bomba?
c. Se una borsa ha fatto suonare Tallarme, di quante volte é aumentata la
probabilitá
che contenga una bomba, rispetto a un momento prima che Tallarme suonasse?
d. Se su un aereo si trovano 100 borse, e nessuna ha fatto suonare Tallarme, qual é
la
probabilitá che a bordo ci sia (almeno) una bomba? Si supponga che i 100 eventi "La
borsa t-esima contiene una bomba" (i = 1, 2 , . . . , 100) siano indipendenti.
(N.B.; I dati sono inventati; viaggiate pure tranquilli!)
2.41. In una partita a scopa, 40 carte vengono distribuite tra 4 giocatori, 10 a
testa.
Si calcoli la probabilitá che un giocatore abbia serviti, in una partita:
a. almeno un sette;
b. due sette (e non di piú);
c. due sette (e non di piú), sapendo che ne ha almeno uno;
d. il sette di quadri e un altro sette.
2.42. Gli eventi A , B , C sono indipendenti e hanno probabilitá, rispettivamente,
1 /3 ,1 /4 ,1 /3 . Si calcoli
P{{AnB)u{AnC)).
2.43. Un apparecchio é costituito da 5 componenti connessi tra loro secondo lo
schema seguente:
con / Ç R
è una abbreviazione di
{w e í) ; X(w) € /}
ed è pertanto un sottoinsieme di П, quindi un evento. Con la convenzione di
scrittura
che abbiamo indicate, lo spazio campionario viene lasciato sottointeso.
86
P ( X e /) = Y . P x M I»€/
(1)
Y^PxiXk)
1.
( 2)
fe=i
Questa proprietá é caratteristica delle densitá discrete, nel senso che:
Proposizione 5. Se {p*} é una qualunque successione di numeri reali positivi tale
00
che
che, per ogni intero positivo k, assume il valore k con probabilitá pk.
Questo significa che, nella pratica, una v.a. viene spesso definita assegnandone la
densitá discreta (che, come visto, é suíficiente a calcolare la probabilitá degli
eventi
che ci interessano), senza esplicitare lo spazio campionario Q "soggiacente".
Esempío 6 . Sia X la v.a. che indica la somma dei punteggi di due dadi lanciati. In
questo caso, quindi,
Í2 = {(1,1),(1,2),...,(6,6)}
X : f i - ^ R , X : ( h , k ) ^ h + k.
X é una v.a. discreta che puó assumere i valori interi compresi tra 2 e 12, con
probabilitá che abbiamo calcolato in precedenza. Possiamo rappresentare quindi il
gráfico della .sua densitá discreta:
CapUolo 3: Varíabili aleatoríe a modem probabttistici
87
Come per gli eventi, cosi per le v.a. é fondamentale, in probabilitá, la nozione di
indipendenza, che si definisce in modo simile;
Defínizione 7. Due v.a. X ,Y si dicono indipendenti se per ogni coppia di
intervalli
I , J C R , risulta
P { X e l , Y e J ) = P ( X e i ) • P { Y e J).
Piu in generale, n v.a. X i , X 2, . . . , X „ si diranno indipendenti se scelti
comunque n
intervalli 7i
C R si ha
P ( X i e h , X 2 e h ....... e /„ ) = P{ X, e / , ) • . . . • F (X „ e /„ ).
Esempío 8. Lanciamo due dadi. Sia X il punteggio del primo dado, Y il punteggio del
secondo, Z il punteggio totale. Allora X t Y sono indipendenti per ipotesi, in
quanto
assumiamo che conoscere il punteggio del primo dado non ci dia alcuna indicazione
sul punteggio del secondo; invece X t Z non sono indipendenti, perché ad esempio:
P { A r \ B D C ) = P{ A ) P( B) P( C) ,
ma anche
89
sappiamo predire entro quanti lanci ció accadrá); si collaudano 100 pezzi prodotti
e si
registra il numero di pezzi difettosi, ecc.
px(0) = l - p .
- P )"
= 0 ,1 ,2 ,... ,n .
P(X = *) = (" )p ‘ d - p r *.
B ( 8 , 0 .2 )
B (8 ,0 .5 )
B (8 ,0 .6 5 )
91
^«)=§(
=<• - '»'“fie :)
( p o i c h é p = 1/4) = 0 . 7 5 * ° ^ ^ ^ ° ^
= 0.056313 . I ^
^ 1 +
1 + ^ I
= 0.0004158 c. 0.04%.
□
Esempio 20. E* piú facile fare almeno un 6 lanciando un dado 4 volte, o fare almeno
un doppio 6 lanciando due dadi 24 volte? Si conírontino le probabilitá dei due
eventi.
Si commenti poi il seguente ragionamento:
"La probabilitá di ottenere 6 con un dado é 1/6, la probabilitá di ottenere un
doppio 6 con due dadi é 1/36; allora, poiché 4 /6 = 24/36 (cioé il prodotto del
numero di tentativi per la probabilitá dell'evento che si desidera é uguale, nei
due casi)
la probabilitá dei due eventi dovrebbe essere uguale".
(Questa discussione si trova in una lettera di Pascal a Fermat, scriíta nel 1654).
La probabilitá di fare 6 con un dado é, in ogni lancio, p = 1/6, e la probabilitá
di
insuccesso é 5/6 . La probabilitá di ottenere 4 insuccessi in 4 tentativi é quindi
(5 /6 )'',
e la probabilitá di ottenere almeno un successo in 4 tentativi é
1 - (5/6)^ = 0.5177.
Análogamente, poiché la probabilitá di fare un doppio 6 con due dadi é 1/36, e la
probabilitá di non farlo é 35/36, la probabilitá di ottenere almeno un successo in
24
tentativi é
92
1 - (35/36)^^ = 0.4914,
che é inferíore, sia pur di poco, alia probabilitá di vittoría nel prímo gioco.
Questo tipo di ragionamento mostra che, in generale:
n >
log 2
~ 24.6
log(36/35)
p e r fc = 1 , 2 , 3 , . . .
Infatti reventó "il primo successo si verifica alia /c-esima prova" coincide con
l'evento
"si verifica la sequenza ,0 0 0 ^.. 0 0 , 1"
fc - 1 volte
(indicando con 0 l'insuccesso e con 1 il successo), e questa sequenza ha proprio
probabilitá p (l - p)*~*.
□
93
0.3
Se, una volta ottenuto il primo successo, proseguiamo le prove finché otteniamo
un secondo successo, la v a. che conta il numero di prove necessarie per ottenere
il
secondo successo (a partiré dalla prova in cui abbiamo ottenuto il primo), che
legge
avrá? Un attimo di riflessione mostra che si tratta della stessa legge: infatti,
nel
calcolare la probabilitá di dover aspettare ancora k prove, a partiré da adesso, il
passato non gioca alcun ruolo (per l'indipendenza delle prove).
Quindi la legge geométrica conta anche il numero di prove necessarie per
ottenere il prossimo successo, a partiré una prova qualsiasi.
Talvolta si vuole contare il numero Y di insuccessi prima del primo successo:
questa v a. assomiglia molto alia precedente, salvo che i suo valori sono
"traslati" di
una unitá, ow ero:
(3)
P ( Y = k) = P { X + n = k) = P { X ^ k - n ) =
^ (jb -
~ P)*" ">
= n ,n + l , n + 2 ,...
Esempío 24. Si lancia un dado piú volte, e si conta quante volte esce il 6 .
a. Qual é la probabilitá che per ottenere un 6 occorra lanciarlo piú di 6 volte?
b. Qual é la probabilitá che per ottenere 10 volte un 6 occorra lanciarlo piú di 60
volte?
c. E qual é la probabilitá dello stesso evento considerato in b se ora si sa che,
arrivati
al 52° lancio, il 6 é giá uscito 9 volte?
Si tratta di un processo di Bernoulli di parametro p = 1/6.
a. Sia X il numero di lanci necessari per ottenere il primo 6 . X ~ G ( l / 6 ). Si
chiede
di calcolare
k=7
k=\ ^
Esem pio 25. U paradosso della scimmia. Supponiamo che una scimmia scriva a caso
co n una macchina da scrivere e che ogni tasto abbia la medesima probabilita di
essere
battuto, indipendentemente da tutte le altre volte. Sia A I'evento "la scimmia
prima o
Capitolo 3: Variabili aleatoria e modelli probabilistici
95
poi scriverá I'Amleto". Dimostrare che P{A) = 1, sapendo che I'Amleto ha circa
200000 caratteri e la macchina 100 tasti.
Lasciamo lavorare per un po' la scimmia e poi cominciamo ad osservare quello che
ha scritto: si presenta come un'unica lunghissima sequenza di caratteri (spazi
compresi), nella quale dobbiamo vedere se per caso si trova, a partiré da qualunque
punto, una preassegnata sequenza di 200000 caratteri. Possiamo considerare questo
come un processo di Bernoulli, al seguente modo. Quando la scimmia batte il primo
tasto, ha probabilitá 1/100 di battere il primo carattere dell'Amleto; se fallisce,
posso
considerare la seconda battuta della scimmia come la prima battuta di un nuovo
tentativo; se invece batte il primo carattere giusto, ora ha probabilitá 1/100 di
battere
il secondo carattere dell'Amleto, e cosí via. Un "tentativo" della scimmia é una
sequenza (di lunghezza variabile) di battute, che si conclude o quando la scimmia
scrive correttamente I'Amleto, oppure al primo errore; la probabilitá di successo
in un
"tentativo", per il ragionamento fatto, é
200000
■(¿)
= 10 -400000
^ p x (fc ) = 1
che é vero perché px(h) é una densitá discreta. (A rigore, avremmo dovuto
verificarlo
quando abbiamo definito la legge G{p)). Verifichiamolo ora:
OO
OO
OO
*=o
)t = l
1 - (1 - p)
= 1.
A vince il gioco se riesce a vincere (s —a) partite prima che B ne vinca (s — b),
ossia prima che A ne perda (s - b).
Sia X la v a. "numero di partite che A perde prima di vincerne (s - a)". Per
defínizione di Binomiale negativa, si ha
f í( - ( s - a ) ,0 .5 ) ,
e la probabilitá che A vinca il gioco é;
5-6- 1
P (X < 3 -6 )= ^ p x (k ) =
it=0
3-a-\-k
P ( X < 3) =
)0.03*^ 0.97'°®-''
;t-oV ^ /
Capitolo 3: Variabili aleatone a modelli probabiUstici
97
• 0.03^ • 0.97^® +
Q
^ Q
6
b. Sia Y = "numero di pezzi da ispezionare per trovare il primo pezzo difettoso”.
Allora
Y ^ G{p) = G(0.03).
Si chiede di calcolare
Si chiede di calcolare
P ( Z = 100) =
P { W = 150) = P { V = 145) = ^
^ ^ • 0.03^ • 0.97'^^ =
= 0.0058.
(4)
a condizione che la serie scritta converga. In caso contrario si dirá che X non ha
valore atteso finito.
98
La (4) è una somma finita o una sene, a seconda che X assuma un numero finito o
una successione di valorí; notare che mentre sappiamo giá che la serie a termini
positivi
converge e ha somma 1, nella (4) le probabilitá pxi ^k) sono moltiplicate per i
valori
Xk assunti da X (che possono essere numen reali di segno e grandezza qualunque):
questo é il motivo per cui non é scontata la convergenza della serie.
Se X é una v a. che assume solo un numero finito N di valori, equiprobabili
(quindi di probabiliá 1 / N ciascuno), E X sará semplicemente la media aritmética
dei
valori assunti:
N
k^\
■ TV =
■“ k^l
Se i valori assunti da X non sono equiprobabili, la (4) si puó vedere come una
"media
pesata" dei valorí assunti da X , in cui i valorí piú probabili pesano di piú. II
valore
atteso di X é quindi un numero che indica "dove é centrata X", attomo a quale
valore
"c¡ aspettiamo" che cadano i valorí di X , e cosí via. Naturalmente, come la media
aritmética di n numerí puó non coincidere con nessuno di essi, cosí il valore
atteso di
X potrebbe non essere un valore effettivamente assunto da X (in questo senso non é
corretto dire che é il valore piú probabile).
Esempio 29.
a. Se X é il punteggio di un dado, E X = 3.5 (media aritmética dei valori assunti;
infatti i 6 valorí sono equiprobabili).
b. Se X é la somma dei punteggi di due dadi, sfhittando il calcólo della densitá
discreta di X fatto in precedenza, possiamo calcolare
12
E X = ¿ f c p x ( f c ) = 2 - ^ + 3 - ^ + 4 - ^ + ... +
k=2
6
5
1
+ 7 — + 8 — +... + 1 2 — =7.
36
36
36
Esempio 30. (Prezzo equo per partecípare a un gioco d'azzardo). In una lottería
nazionale sono in palio i seguenti premi;
1° premio; 3 miliardi;
2° premio; 2 núliardi;
3“ premio; 1 miliardo;
5 premi da 100 milioni;
20 premi da 10 milioni
100 premi da un milione.
Se vengono venduti 2 milioni di biglietti, qual é il valore atteso della vincita,
per chi
acquista un biglietto? Se il biglietto costa 5000 lire, conviene partecípare alia
lottería?
Capitolo 3: Varíabili aleatoria в modelli probabilistici
99
Xk
3 miliardi
2 miliardi
1 miliardo
100 milioni
10 milioni
1 milione
Px(Xk)
1/(2 milioni)
1/(2 milioni)
1/(2 milioni)
5/(2 milioni)
20/(2 milioni)
100/(2 milioni)
Quindi
E X = 3000000000
1
2 000000
2000000000 -
1
+
2000000
...
E{aX + b) = a(E X ) + 6.
In pari ¡colare, il valore atieso di una costante (cioé della v.a. che assume un
solo
valore con probabilitá l) é la costante siessa.
Vale anche la seguente propríetá, molto piú generale:
Teorema 33. (Línearítá del valore atieso). Se X \ , X 2,... , X ^ sono n v.a.
qualsiasi,
con valore atieso finito, allora
E ( A - , + X 2 + ... +A -„) = E X , + E X j + . . . E X „ .
Si confronti questo enunciate col prossimo:
Teorema 34. Se X \ , X 2y - , X n sono n v.a. indipendenti, con valore atieso
finito,
allora
E /(X ) = ' ^ f ( x k ) p x { x k ) ,
E Y = E (X
?) = 1* . + 2 ^
'* '
6
6 +3'^ . 6 +■■■ + 6 “ ■Í6
6 = 15.16.
La v.a. Z puo scriversi come prodotto X 1X 2, con X i.X o come sopra. Poiché
ríteníamo che gli esiti di due dadi diversi siano indipendenti, possiamo scrívere,
per il
Teorema 34,
E Z = E { X xX 2) = EXi ■E X 2 = 3.5^ = 12.25.
E' interessante osservare i valori diversi ottenuti per E Y e EZ: infatti, entrambe
le v.a,
Y yZ eprimono il prodotto dei punteggi di due dadi, ma per Z si tratta di due dadi
diversi (quindi Z é prodotto di due v.a. indipendenti), per Y sí tratta delio
stesso dado
contato due volte (quindi Y é prodotto di due v.a. non indipendenti). II valore
atteso
del prodotto risente di questa dífTerenza.
□
E ^ ^ = 1 • p + 0 • (1 - p ) = p .
VA .
it=0
Questa sommatoria é un po' complicata da calcolare direttamente^; possiamo pero
sfhittare il fatto che X puó vedersi come somma di n v.a bemoulliane di parametro
p:
X = Xi+X2
+Xry
conX,~B(p),
2 ® /MQpt?
X ~ B (10,0.25);
'll
b.
'
10 • 0.25 = 2.5.
m í e <T‘
( % 'j p í t r i a r r v O
,,
¿ Ü / y y U '/ i u
oo
43 =
k=\
- p)'‘
k=\
^ 7^— 7 ^
U
k^\
perogniíe(-l,l).
(5)
oo
*=o
perognií € ( - 1 , 1 ) .
'
00
oo
I \k=0
E«*)
oo
=*=1
k=0
- f —
3 = —^
°o
ik=l
e infine
EY =
P
Esempio 38. (A ncora sul paradosso della scimmia). Abbiamo calcolato nell'Esempio
25 che, con probabilitá 1, una scimmia che batte a caso i tasti di una macchina da
scrivere, prim a o poi scriverá l'Amleto. E' naturale chiedersi quanto si dovrá
aspettare
perché questo accada.
Abbiamo calcolato che
p = 10 -400000
é la probabilitá di "successo" in un tentativo. (Si rilegga l'esempio citato per la
defínizione precisa di "tentativo"). II numero di tentativi necessari per avere il
primo
successo é una v a. geométrica di parametro p, perció il suo valore atteso é
103
= 10,400000
Ricordiamo ora che un tentativo non é una singóla battuta ma una sequenza (di
lunghezza varíabile) di battute. Sia Y questa lunghezza; F é il numero di battute
necessarie per fare il primo errore; il calcólo esatto della legge di questa v a.
non é
ow io; tuttavia, certamente F > 1 (ogni tentativo dura almeno una battuta).
Concludendo;
per scrivere l'Amleto, la scimmia deve fare in media
"tentativi"; ogni
tentativo consiste almeno di una battuta, e quindi il numero medio di battute é
almeno
JQ400000. gg supponiamo ad esempio che la scimmia esegua 10 battute al secondo,
troviamo che il tempo medio di attesa, espresso in secondi, é un numero maggiore o
uguale a
1^400000
_ ,«399999
■
10
Sia Z ~
ossia Z é una v a. geométrica "traslata", e rappresenta il numero
di insuccessi prima del primo successo, in un processo di Bernoulli illimitato
Allora
Z = Y - \ , con F ~ G{p) (perché F rappresenta il numero di prove necessarie per
ottenere il primo successo), quindi
1
P
1~ P
P
E Z = E F - 1 = - - 1 = -----
Sia VF ~
—n, p). Abbiamo visto che, per il suo significato, una v a. binomiale
negativa si puó scrivere come somma di n v a. geometriche traslate:
W = Z\
Z2
■ + Zn
EW =
Riassunúamo: il valore atteso delle v.a. legate al processo di Bernoulli é:
X -B (p )^ = p ; I
' X ~ B{n, p) E ^ = np;
X ~ C (p) ^ ] = i l
P
1-p
'
X
G\p) EX =
P
X ~ B { - n , p ) EX = n ( i - p )
^
l'e t á
II
te m p o
d 'a tie s a
d e ll'iin iv e r s o
c a lc o la lo
s tim a ta
d e ll'o r d in e
d e ll'o r d in e
d i
d i
g ra n d e z z a
g ra n d e z z a
d i
1 0 ^ ^
d i
a n n i!
anni,
p e r
c o n fr o n to ,
s i
r ic o r d i
c h e
104
Esem pio 39. (11 collezionista di fîgurine). Calcolare il numero medio di figurine
da
comperare per completare una raccolta di n figurine (si assume che queste siano
vendute in pacchetti da una sola figurina, e siano tutte equiprobabili).
Supponiamo di avere giá k figurine diverse tra loro (oltre a un numero imprecisato
di "doppie") e di essere alia ricerca della (fc + l)-esima figurina intéressante
(0 < k < n - l). Ad ogni acquisto di una figurina, la probabilitá di tróvame una
buona è
n° di figurine mancanti _ n - k
n° totale di figurine
k=0
n-1
n-1
E x = 5 :E jf^ = ^ —
k=0
fc=o”
n -•
^
k= l
Esercizi
3.1.
Dimostrare che la legge B { —n, p) ha eñettivamente densitá data dalla (3).
Suggerimento: ragionare in modo simile a quello visto per la legge binomiale,
determinando;
1. II tipo di sequenza che realizza l'evento (X = A:);
2 . La probabilitá di una singóla sequenza di questo tipo;
3 II numero di sequenze di questo tipo.
3.2.
Una macchina per confezionare generi alimentari riempie meno del dovuto il
10% delle confezioni. Calcolare la probabilitá che su 5 confezioni il numero di
quelle
sottopeso sia;
(a) esattamente 3; (b) esattamente 2; (c) zero; (d) almeno 1.
3.3.
Calcolare (esplicitamente) la densitá discreta della legge binomiale B (5 ,0 .1 5 )
(arrotondando a 4 decimali le probabilitá).
3.4.
In una linea produttiva la frequenza relativa con cui sono prodotti pezzi
difettosi é 0 .2 . Consideriamo 10 pezzi prodotti consecutivamente.
a. Qual é la probabilitá che tra questi ce ne siano esattamente 4 difettosi?
b. Qual é il numero medio di pezzi difettosi prodotti?
c. Qual é la probabilitá che il numero di pezzi difettosi non superi il numero
medio di
pezzi difettosi?
d. Si vogliono ora modificare le modalitá produttive in modo che, con probabilitá
del
Capitolo 3. Varíabili aleatoria в modelli probabilistici
105
95%, il numero di pezzi difettosi su ogni 10 prodotti non sia piú di uno. Qual é il
massimo numero ammissibile per p?
e. (Supponiamo di nuovo p = 0.2). Se la produzione continua finché non si sono
ottenuti 10 pezzi non difettosi, qual é il numero medio di pezzi difettosi che
saranno
prodotti? E il numero totale di pezzi?
3.5.
Indicare, per ciascuna delle seguenti situazioni, se le ipotesi del modello
bernoulliano sono soddisfatte. Consideriamo la produzione industríale di pezzi che
possono essere o non essere entro prefíssati limiti di tolleranza.
a. Per evitare la noia, un opéralo al tomio passa, di tanto in tanto, da tipi di
lavori
"facili" ad altrí "difficili".
b. Un altro opéralo lavora con un solo tipo di articolo, ma diventa moho trascurato
dopo pranzo e poco prima dell'ora di uscita.
c. Ogni macchinista neU'impianto verifica le dimensioni dei pezzi prodotti, e
diventa
piú attento se trova un pezzo fliori dai limiti di tolleranza.
d Alcuni apparecchi hanno una taratura automática che gradualmente si allontana dal
valore desiderato.
3.6.
Se lando 2 dadi la probabilitá di fare 12 é 1/36: dunque mi aspetto che in 36
land esca un 12. Qual é la probabilitá che ció accada? Qual é il mínimo numero di
land da fare affmché la probabilitá di uscita di un 12 sia almeno 0.5?
3.7.
Un ispettore per il controllo di qualitá rífiuta una partita di schede a circuit!
stampati se in un campione di 20 schede sottoposte a test vengono trovati 3 o piú
pezzi difettosi. Determinare il numero atteso di pezzi difettosi e la probabilitá
di
rífiutare una partita se la proporzione di pezzi difettosi nell'intera partita é;
(a) 0 .01 ; (A) 0.05; (c) 0 . 1; (í^ 0 .2 .
3.8.
Un centralino telefónico é occupato per il 95% del tempo, per cui si puó
rítenere che, telefonando in un istante a caso, la probabilitá di trovare la linea
libera sia
p = 0.05. Qual é il numero atteso di tentativi da fare per trovare la linea libera?
E qual
é il mínimo numero di tentativi da fare perché la probabilitá di trovare libera la
linea sia
piú del 50%? Se le ipotesi del modello utilizzato sono vere, c'é differenza tra
fare i
tentativi tutti di seguito o a intervalli di tempo?
3.9.
Due giocatorí A, В dispongono di un'urna contenente r palline rosse e b palline
bianche. Essi giocano una successione di partite, ciascuna delle quali consiste in
un'estrazione (con rímessa) eseguita da Л e in un'analoga operazione eseguita da
В . II
gioco si arresta quando una partita dá rísultati diversi per i due giocatorí: vince
allora il
giocatore che in quella partita abbia estratto una pallina rossa.
a. Calcolare la probabilitá p che in una singóla partita i giocatorí ottengano
risultati
diversi.
b. Detto N il numero di partite dispútate perché il gioco abbia termine, si
determini la
legge d\ N e \\ suo valore atteso. Si tratta di una legge nota?
c. A a В decidono di giocare 3 "giochi" consecutivi (dove per "gioco" si intende
una
sequenza di partite come nei punti precedent!). Si determini la densitá discreta
della
v a. M che conta il numero di partite da disputare (complessivamente) per
concludere
3 giochi.
3. 10. Verificare, utilizzando le densitá discrete di queste v a., che le leggi
B{p),
107
Abbiamo una popolazione (in questo caso illimitata), quella deí pezzi via via
prodotti; questa popolazione é distribuita secondo una legge di tipo noto, B{p), ma
contenente un parametro incognito: p. Per stimare il valore vero del parametro p,
il
modo naturale di procederé é estrarre un campione casuale dalla popolazione:
scegliamo a caso n pezzi prodotti, e guardiamo se sono difettosi. L'esito di questa
ispezione é descritto da una n-upla di v a. X | , X 2, . . . ,
(X , = 1
l'i-esimo pezzo
é difettoso). Naturalmente X , ~ B{p) e le X¿ sono indipendenti, per le ipotesi
fatte.
Fissiamo ora le idee emerse da questo esempio in qualche defmizione di carattere
generale.
Defínizíone 40. Un modello statistico é una famiglia di leggi di v a., dipendenti
da uno
o piú parametrí incogniti;
{Px(^;É)
indica un vettore di parametri, quindi uno o piú parametrí, che variano in un
insieme
/ di R o R ^ ). Un campione casuale di ampiezza n estratto da una popolazione di
densitá pxix't'O) é una n-upla di va. indipendenti e idénticamente distríbuite,
( X i , X 2, . . . , X „ ), ciascuna avente legge px (x ; ¿ ) .
Prima di procederé oltre nell'esempio del controllo di qualitá, illustríamo le
defínizioni generali che abbiamo dato. Pensiamo di avere una popolazione, su cui si
vuole osservare una certa variabile. La popolazione puó essere fin ita (es.: gli
elettorí
italiani, in un giomo specificato) o illimitata (es.; la popolazione delie
ripetizioni
indefinite di una prova di Bernoulli, come la produzione di un pezzo difettoso o
no,
nell'esempio precedente).
Nel caso di una popolazione finita, composta da N individui, la legge p x ( ^ ;^ )
rappresenta la frequenza relativa con cui, sugli individui della popolazione, la
variabile
X assume il valore x. Pensiamo ora di estrarre a caso un individuo della
popolazione
(in modo che tutti gli individui abbiano la stessa probabilitá 1 /N di essere
scelti): la
variabile X assumerá il valore x con probabilitá px{x\Ú.) Se scegliamo n individui,
eseguendo un'estrazione "con reimmissione", ossia tale che ad ogni estrazione ogni
individuo puó essere scelto (e quindi le n scelte sono indipendenti) avremo proprio
n
v a. indipendenti e idénticamente distríbuite, ciascuna di legge p x ( ^ ;¿ )
Questo spiega
la definizione data di campione casuale: nel caso di una popolazione finita, un
"campione casuale" (nel senso della definizione) é proprio un campione "scelto a
caso",
con estrazioni con reimmissione ed individui equiprobabili.
Invece, nel caso della popolazione illimitata, non ha senso parlare di estrazione
tra
infiniti oggetti (si pensi all'esempio dei pezzi prodotti, che sono solo
potenzialmente
infiniti); pero, se le modalitá con cui eífettuiamo la scelta di n individui sono
tali da
farci rítenere le scelte indipendenti e rappresentative della distríbuzione della
popolazione complessiva, parleremo ancora di campione casuale.
Riassumendo:
II problema fondamentale della statistica inferenziale é quello di scopríre la vera
distríbuzione della popolazione, a partiré dalle informazioni contenute in un
campione
casuale estratto da essa. Spesso la natura del problema ci consente di formulare un
modello statistico, per cui la distríbuzione della popolazione non é completamente
incognita, ma piuttosto é di un tipo noto, ma ha parametri incogniti. Quindi il
primo
problema della statistica inferenziale é quello di stimare il valore vero del
parametro
108
(o dei parametri) a partiré dal campione casuale. Questa operazione prende il nome
di stim a puntúale dei param etri}
O sservazione 41. C am pionam ento di una popolazione finita. Fermiamoci un
momento a riflettere su come si potrebbe realizzare efFettivamente l'estrazione di
un
campione casuale da una popolazione finita. La cosa é meno scontata di quanto
sembri; come faremmo, ad esempio, a estrarre un campione casuale di 100 abitanti di
una cittá, da intervistare su un certo tema? Per soddisfare i requisiti della
defínizione di
"campione casuale" sono essenziali i seguenti passi;
1. Definiré con precisione la popolazione obiettivo dell'indagine. Nell'esempio in
esame, l'insieme degli "abitanti della cittá" é definito in modo un po' vago:
consideriamo solo i resident! o anche chi transita per la cittá? Consideriamo le
persone
in quale fascia di etá? Ecc.
2 . Associare (biunivocamente) un numero da 1 a agli individui della popolazione
cosí definita.
3. Estrarre, "con reimmissione", n numeri da 1 a N (ad esempio, utilizzando un
computer per generare numeri casuali), e selezionare gli individui corrispondenti;
se un
numero é estratto due volte, l'osservazione fatta sull'individuo corrispondente
sará
contata due volte.
Senza addentrarcí in ulterior! dettagli, si noti comunque che la messa a punto di
un
procedimento di selezione del campione é un'operazione delicata e importante per la
validitá delle conclusioni che sí vogliono trarre dal campionamento: un campione
casuale é tutt'altro che un insieme di individui "sceití a casaccio"
109
abbiamo:
e :a :„
( - Y
^] =
= ^ n p = p,
1 "
- Y ^ t
T i *'
t= 1
si ha
r = / ( X , , X 2, . . . , X „ ) .
Questa statistica é uno stimatore non distorto di p, perché risulta
Anche
¿ X .;
i=l
Y X I,
= p.
(X ,+X „-3)
¿=1
Si noti che
numero.
p r im a
Varianza campionaria
Varianza
Si considera
una n-upla di numeri ( x j , X2, . . . , x„);
Si considera
una variabile aleatoria X ,
i ¿ ( X f c -Xn)^
k=\
E((A' - EX)2)
In base all'analogia, la varianza di una v.a. rappresenterá una misura della sua
dispersione rispetto al valore E ^ i su cui é "centrata".
Proposizione 45. (P roprietá della varianza). Sia X una v.a. discreta dotata di
varianza finita. A llora:
Capitolo 3: Varíabili aleatoria e modelli probabilistici
1.
2.
3.
4.
111
V a rX ^ O
VarX = E ( X ^ ) - ( E X f
Var(c) = O per ogni costante c
V ar(aX + b) = a^WarX per ogni coppia di costanti a, 6 e R
5. V arX =
- E X f p x M = Í E 4 pxM )
~ (EXf.
- E X ) V ;t( it) .
La seconda uguaglianza della (S) segue da questo stesso ragionamento, usando anche
la (2), giá dimostrata. Rimandiamo la dimostrazione della ( 6) al parágrafo sulla
covarlanza (v. §3.6.3).
□
O sservazione 46. L'ipotesi di indipendenza delle v.a. é necessaría per poter
calculare
la varíanza della somma come somma delle varíanze. Si considerí infatti questo
esempio:
V ar(X + X ) = Var(2X ) = 4VarX,
per il punto (4) della Proposizione 45; invece se valesse l'additivitá, si dovrebbe
ottenere 2VarX. II punto é che X non é indipendente da se stessa.
Defínizione 47. Si dice deviazione standard, o scarto quadratico medio di una v.a.,
la radice quadrata della sua varíanza. Si usano spesso i simboli:
Ox = VarX;
= \/V a rX .
ha la sua stessa
112
Deflnizione 48. Se X e una v.a. dotata di media fix c varianza a \ finite, si dice
standantizzato di X la v.a.
X-fix
Ox
Questa nuova v.a. ha media 0 e varianza 1 (segue dal punto (4) della Proposizione
45).
Vediamo ora qualche esempio concrete. Cominciamo dal seguente schema:
eM
= p;
E ^ = np:
V a iM = p ( l - p ) ;
Vai(X]= n p ( l - p);
X ~ G{p)
EX=
VarX =
X ~ G '(p)
EX=
P
1 —p
r
VarX =
X ~ B { —n, p)
EX = n (
);
VarX = n ( l ^ ) .
^*-l
- p)*
E(A-2) =
*=1
Anzitutto, sfruttando la serie notevole
£*^* ' = 7 7 "^
*=i
(1 “ t.)
perognit€ (-1 ,1 ),
(5)
(1 - t ) -
perogni Í € (-1,1).
( 6)
Capitolo 3: Variabili aleatone e modelli probabilistici
113
kt
per la (S)
■i<V (1 - 0 /
(1 - 1)
2 -p _ 2 -p
pJ
p2
e quindi
VarX =
E {X ^) - { E X Ÿ
- 1 = 1 ^ .
Infine, dal valore della varianza di una v.a. di legge G{p), si ottengono subito
gli
Ultimi due risultati. Infatti: una v.a. di legge G'{p) differisce da una v.a. di
legge G{p)
per una costante 1 (si ricordi la sua definizione), percio ha la stessa varianza
della
legge G{p). (Punto (4) della Proposizione 45). Inoltre, una v.a. di legge B { —n,
p) e
somma di n v.a. di legge G'(p), indipendenti, percio la sua varianza e n volte
quella di
una legge G'(p).
□
L'importanza della varianza come misura della dispersione di una v.a. rispetto alia
sua media discende dal prossimo fundamentale teorema:
Teorem a 49, (Disuguagiianza di Cebicev). Sia X una v.a. di valore atieso p x ^
varianza Jinite. A llora, per ogni numero 6 > 0.
\ ¡ h 1 " 0-^
1
P (\X -^x\> 6ax)< j¡
(7)
owero
P( \X - px\ <
) = P{l^x — ^trx < X < p x +
) > 1 —^ •
(8)
í)
Si osservi che la ( 8) é conseguenza immediata della (7), ed entrambe sono
significative quando ¿ > 1 (se ¿ < 1, la (7) dice che la probabilitá di un certo
evento é
< di un numero > 1, il che é ow io, e la ( 8) dice che la probabilitá di un certo
evento é > di un numero < 0, il che é pure owio).
II teorema si puó leggere in due modi. Fissata la deviazione standard <
j x , al
crescere di 6 la disuguagiianza (7) dice che la probabilitá che X si discosti dalla
sua
media per una quantitá via via piü grande, é via via piú piccola. Oppure, fissato
6, la
disuguagiianza ( 8) dice che i valori assunti da X cadono, con probabilitá maggiore
di
<
una certa costante, in un intervallo céntralo nella media, di ampiezza tanto minore
quanto piü piccola é la varianza. Dalla ( 8) segue ad esempio:
114
La cosa notevole delle precedenti disuguaglianze é che valgono per qualsiasi v.a.
(dotata di media e varíanza finite).
Dimostrazione della (7). Sía Y = { X la standardizzata di X : sappiamo che
= 0, Vary = E(y^) = 1. Riscrívendo la (7) mediante Y , ció che occorre dimostrare é
EY
Ora,
l = E(y 2) = 5 3 y * ^ (^ = V*)>
(la somma estesa a tutti gli indici k ë maggiore, essendo ciascun addendo positivo,
della somma estesa
ai soli indici k per cui risulta lyj^l > S)
(poich¿
>
(ricordando chc P ( Y
€ ! ) = '£
P {Y =
= i'*) =
y*))
=
6 ^ P { \ Y \ > 6).
Esempio 50. Lanciamo due dadi e chiediamoci quando otterremo per la prima volta
un 7. Il numero di tiri necessari é X ^ G(p) c o n p = 1/ 6 . In questo caso si ha
/ I Z f = 5.477
p = - = 6 -, <J
'
V
P
e scegliendo 6 = 2 neila ( 8)
P (6 - 2 • 5.477 < X < 6 + 2 • 5.477 ) > 0.75
CapHoto 3: Varíabili aleatoríe e modelli pmbabilistici
115
- 0 .9 2 2 6 .
= ¿ V a rÉ x .) =
—1
i
.1
= - r na
lvfx]= r í
1=1
= —
Troviamo quindi che la v.a. "media campionaria" ha varianza tanto piü piccola
116
-K
^<^00
iC O O .-^xry'C’ Ctv>-' t t v
izc^pixorvh T e C
V a r^ 4 = - ,
■* n
ci C c \ i y r p , o > r a ' X i i \
Questo signifíca che la media campionaría sará piú concéntrala attorno al suo
valore
atieso (che é p ) quanto piú ampio é il campione; intuitivamente, ripetendo molte
osservazioni le oscillazioni casualmente molto lontane dalla media tendono ad
elidersi,
e la media campionaria diventa uno stimatore piú significativo.
Questo falto, unito alia disuguaglianza di Cebicev, ha una conseguenza notevole:
Teorema 53. Legge dei grandi numeri. Sia (X ], X 2 , . . . , X„) un campione
casuale
estratto da una popolazione di legge px{x,'d). Supponiamo che esistano fm iíi
= p e VarX-í = a^. Allora per ogni numero e > Osi ha che
oe
X ai e y C t ¿ e f y i c i c y > ' c P { \ X ^ -
p \>
e} -^ 0
p e r n ^
00.
■Á
Questo fa tto si esprime dicendo che la successione di v.a.
probabilitá a p, per n —* 00.
^
tende in
VarXn =
P ^|X n - p \ > 6 ^
j < ^
( 10)
117
Ad esempio, per quanto appena visto, nel caso di una popolazione bemoulliana la
media campionaria é uno stimaíore corretto e consistente del parametro p. La
consistenza é un'altra proprietá, come la correttezza, che é indice della bontá di
uno
stimatore.
5. La covarianza è bilineare:
|C ov(X ,K )|
119
< 1.
C o v (X ,F )
\ / Va r X ■V a ry ’
soddisfa le disuguaglianze
- 1<
PX.Y
< 1.
Esercízi
3.13. Lanciamo due dadi. Sia X il punteggio del primo dado, Y la somma dei punti
dei due dadi.
a. Calcolare VarK.
b. Calcolare C ov(X , r ) .
3.14. Verificare che il coefficiente di correlazione é invariante per cambiamenti
di
scala, ow ero: se X ,Y sono due v.a. e a, 6 sono due costanti, il coefficiente di
correlazione di {aX + 6 ) e {aY + b) coincide con px.Y
“ ■(r)
Gli oggetti sono solo di due tipi: 450 "bianchi" e 50 "neri". Quante sono le scelte
di 20
oggetti che ne contengono k neri (e quindi (20 - k) bianchi)? I neri si possono
scegliere in (^®) modi; i bianchi in ( 20-°*)- Per 'I principio del prodotto delle
possibilitá, in totale i "casi favorevoli" sono;
/ 5 0 \ / 450 \
\k )\2 0 -k )'
Quindi la probabilité che il campione estratto contenga esattamente k "neri" (cioè;
pezzi difettosi) é:
/ 50 W 450 \
Px(fc) =
\ k ) \20-k)
/500\
per fc = 0 , 1, 2 , . . . , 20 .
V20 /
Px(k) =
O
'
I valori che k puá effettivamente assumere sono solo quelli per cui i coeffwienti
hinomiali scritíi hanno senso, percio:
0 < k < n\
k<K\
(n — k) < { N — K) , ossia k > n - { N - K) .
Jnoltre X ha media e variama date da:
“
121
Р(х^к)-*{Лр\\-рГК
□ ^rgeom
■ Binorriale
E se m p io di a p p ro ssim a zío n e d e lla d e n sitá ip e rg e o m e tric a c
o n q u e lla b in o m ia le :
q u i si c o n fro n ta la d e n sitá ip e rg e o m e tric a G(100,30,10)
c o n la d e n sitá b in o m ia le B(10,0.3).
E X = np\
VarX = n p (l - p)
j •
122
Si nota che la media coincide con quella della legge binomiale corrispondente,
mentre
la varianza è uguale al prodotto della varianza della binomiale, n p (l - p),
moltiplicata
per il fattore
N-n'
N - l
P {X = Jt) =
(\? )
/90N
^ (^ = o) = W
(>“ )
P {X = 1) =
lO ( ^ )
90-89
100-99
81
= 0.330476
91
90-89 . . . - 8 2
D/vr
ox
( 2)(?)
P { X = 2) =
^
= 0.407995
9 - 9 - 9 0 - 8 9 - . . . -83
^
= 0.20151.
2 - 9 9 - 9 8 - . . . -91
Quindi
10-9
123
Esercizi
3.15. Estraiamo 7 palline da un'uma che ne contiene 4 bianche e 8 nere, qual é la
probabilitá di estrarne (esattamente) 3 bianche? Rispondere alia domanda supponendo
I'estrazione compiuta con reimmissione o senza reimmissione (discutere i due casi).
(Questoproblema si trova in Huygens, "De raíiociniis in ludo aleae", 1657).
3.16. Determinare la densitá discreta del numero di pezzi difettosi in un campione
di 5
estratto da un lotto di 500, di cui il 10% difettoso. (Usare approssimazioni a 5
decimali).
(a) Calcolare le probabilitá esatte (legge ipergeometrica);
(¿>) Calcolare le probabilitá con l'approssimazione binomiale.
X^B{N,p).
Siamo cosí arrivati a una formalizzazione precisa. II problema è che né N né p,
sono
fácilmente noti (o calcolabili); ció che conosciamo è A. Poiché E X = N p e A è il
numero medio di persone che transita ogni giomo, è naturale porre N p = A.
Calcoliamo ora
P (X
-■ C )
P*^(l - p)"^-* =
( 11)
124
N -k
lim P { X = k) = \ m ( ^ ) ( ^ )
N^oo ^
N^co\kJ\Nj
= e -A
k\
- A ,;.-!)...
k\
inoltre, per
Af*
N ( N - l ) - . . . ( N - k + l)
ffk
1;
.-A.
0-^r
1.
II rísultato trovato é interessante in quanto é espresso in funzione del parámetro
A
e dell'intero k, che sono noti; abbiamo quindi calcolato eifettivamente la
probabilitá
dell'evento che ci interessava.
□
Notiamo che quella che abbiamo calcolato, é la dem itá discreta di una nuova v.a.
Y (infatti, abbiamo eseguito un'operazione di limite sulla X da cui eravamo
partiti, per
cui la legge trovata non é piú quella di X):
M k)
per fc = 0 , 1, 2 , . . .
( 12)
Verifichiamo che, per ogni A > 0, la (12) é eífettivamente una densitá discreta. E'
o w io che per A > 0 é pv'(fc) > 0 per ogni fc = 0 ,1 ,2 ,__ Inoltre
k=0
k\
= e -X
fc=o
125
Jt=0
OO
»fc
00
= E * " ’ * Y' =
k=0
00
\fc-l
vit
=
k=\
oo \it
‘E n
^ A,
per N
oo.
A= 2
A= 5
126
A = 10
Riassumendo: abbiamo defínito una nuova v a. discreta, la cui densitá è data dalla
(12); si trova che questa legge, detta legge di Poisson di parametro A, ha media e
varianza uguali a A. II procedimento con cui siamo arrívati alia densitá di Poisson
consiste nello scrivere la densitá binomiale B { N , p ) e passare al limite per N
tendente
a infinito e p tendente a zero, tenendo fissato il prodotto N p = A.
Esplicitiamo ulteriormente il significato di questo procedimento di passaggio al
limite nelle prossime due osservazioni, ehe sono tra loro complementari.
O sservazione 67. Utilizzo délia legge di Poisson per approssim are leggi binom
iali.
Se abbiamo una v a. X
B ( N , p ) con N molto grande e p molto piccolo, la
probabilità di { X = k) sarà approssimata dalla probabilité di {Y = k), con
Y ~ Pq{ N p ).
Esempio 68 . In una linea produttiva la frequenza relativa con cui sono prodotti
pezzi
difettosi é 0.01. Qual é la probabilitá che su 1000 pezzi prodotti ce ne siano
esattamente 4 difettosi?
Schematizziamo il fenómeno come un processo di Bemoulli di TV = 1000 prove,
di parametro p = 0.01. II numero di pezzi difettosi (numero di "successi") é
X ~ S ( 1000, 0 .01 ), e
p{x =
4) = ^^^^^^o.oi'*
~ o.oise.
di parametro
10^
P i X = 4) ~ P { Y = 4) = e “ '" — ~ 0.0189,
4!
un'approssimazione accettabile. Inoltre, i numeri che si maneggiano nel secondo
caso
sono piú "trattabili".
□
127
Q R)Í880n
■ Binomiale
□ Fbisson
■ Binomaie
■H---- ¥--- 1
O
Osservazione 69. Utilizzo della legge di Poísson per modellizzare certe classi di
fenomeni. La legge di Poísson, tuttavia, non serve solo per eseguire calcoli
approssimati con v a. binomiali di parametri N grande e p piccolo. La sua
importanza
modellistica é quella di permetterci di descrívere quantitativamente situazioni in
cui
non abbiamo accesso ai valori di N e p, ma possediamo un'unica informazione
numérica: il parametro A, "numero medio di arrivi". Si considerino i seguenti
esempi:
129
Ogni volía che possiamo supporre valide le ipoíesi 1,2,3, la v.a. X = numero di
guasti in (0, t] é una v.a. di Poisson di parametro X = numero medio di guasti in
[O.í].
Osservazione 72. Relazione tra ii primo e il secondo modo di dedurre lo schema
di Poisson. Nello schema di Bernoulli dell'Esempio 65, le "prove" sono gli elementi
della "popolazione di utenti potenziali", in quello dell'Esempio 71 sono gli
"intervallini
di tempo"; nel primo caso non si fa alcuna ipotesi su guando gli utenti arrivano,
aU'intemo di [0, i\: si dice solo che ció "accade" o "non accade"; nel secondo caso
si
introduce invece l'idea che, se un guasto accade in qualche momento di [0 , t],
questo
aw iene con ugual probabilitá in un qualunque intervallino. In altre parole, la
probabilitá che un certo guasto si verifichi é uniformemente distribuita
sull'intervallo
di tempo [0 , t], e la probabilitá che in un intervallino di ampiezza A i si
verifichi un
arrivo é proporzionale a A i.
Da questo fatto segue che, se A é il numero medio di "arrivi" in (0 , i], potremo
definiré v = X¡t = numero medio di arrivi per unitá di tempo. Allora il numero
medio
di arrivi in un altro intervallo di tempo, di ampiezza i', sará A' = v i'.
Riassumiamo la discussione precedente in una definizione precisa:
Defínizione 73. Consideriamo un fenómeno schematizzabile come "registrazione, nel
tempo, degli arrivi casuali di individui indipendenti (oppure; guasti accidentan
dovuíi a cause indipendenti)". Supponiamo che;
la probabilitá che in un intervallino di tempo A t ci sia un arrivo é uguale a v ■A
i,
la probabilitá che in un intervallino di tempo A t ci sia piCi di un arrivo é
trascurabile;
il fatto che in un intervallino di tempo A t ci sia un arfivo é indipendente dal
fatto
che ce ne sia uno in un altro intervallo di tempo.
Allora il numero X di arrivi nell'intervallo di tempo [0, t] ha legge di Poisson
Pq(X), con X = V ■t. La famiglia di v.a.
che rappresentano il numero di arrivi
negli intervalli [0, í], e hanno legge Xt ~ Fo(i/t) si dice processo di Poisson di
intensiíá u. II numero v rappresenta il numero medio di arrivi nell'uniíá di tempo.
II lettore é invitato a questo punto a rileggere gli esempi dell'Osservazione 69 e
a
valutare, per ciascuno di questi, l'applicabilitá della defínizione appena data. Si
osservi
che i termini "arrivi", "guasti", ecc. sono puramente convenzionali, e lo stesso
uso di
intervallini di tempo puó essere sostituito con quello di intervallini di spazio
(nell'es. 6 ,
lunghezza; nell'es. 7, area).
Esempio 74. Se il numero medio di telefónate che arrivano a un certo centralino é
30
all'ora:
a. qual é la probabilitá che in un periodo di 3 minuti non arrivi nessuna
telefonata?
b. qual é la probabilitá che in un periodo di 5 minuti arrivino piú di 5
telefónate?
Se il numero di "utenti potenziali" del centralino é moho alto, la probabilitá che
ciascuno telefoni é moho bassa, e i comportamenti degli utenti sono indipendenti.
130
á).
= 0.223.
Análogamente
se
=b
minuti = 5 /6 0
ore,
□
ik=0
X t ~ Po{ut)\
P ( X , = *) = e - '
EXt =
per fc = 0 , 1, 2 , . . . ;
V arXt =
ut.
Capitolo 3: Varíabili aleatoríe e modelli probabilistici
131
a.
Se ad esempio supponiamo che la ditta abbia un gran numero di "clienti
potenziali", ciascuno con una piccola probabilitá di spedire un ordine alia ditta
in un
giomo prefissato, e i comportamenti dei vari clienti sono indipendenti, il numero X
di
ordini arrivati in un giomo a caso sará una v a. di Poisson Po(-^) H valore di A é
il
numero medio di ordini giomalieri, perció X ~ Po(lO). (Si osservi che in questo
caso
é appropriato ragionare come nel primo modo di dedurre la legge di Poisson, senza
far
riferimento agli "intervallini di tempo": in realtá non sappiamo se la probabilitá
con cui
arrivano fax nell'arco della giomata sia uniforme, ma questo non é rilevante per il
problema in esame).
10 *
P ( X < 3) = e “ ' ° X l T r =
j r» ^ •
k=0
b.
Ogni ordine ha probabilita p = 0.02 di non poter essere soddisfatto (se
stimiamo la probabilita con la frequenza relativa). Se supponiamo che gli ordini
siano
tra loro indipendenti (quanto al fatto di potere o non poter essere soddisfatti),
siamo
nelle ipotesi del modello bemoulliano. Il numero di ordini Y che non possono essere
soddisfatti, su 100 ordini arrivati, e una v.a. binomiale,
y ~ B (100,0.02).
a.
La sequenza di veicoli in transito "T.I.R. o altro veicolo" é un processo di
Bemoulli di parametro p = 0.01 (con "successo" = "il veicolo é un T.I.R "). Sia
X = numero di T.I.R. su 100 veicoli in transito.
X ~ B (1 0 0 ,p ) = B (1 0 0 ,0 .0 1 ).
P{X
b.
II transito dei veicoli nel tempo si puó vedere come un processo di Poisson di
intensitá u = 200/ora. Stiamo supponendo che la probabilitá che in un breve
intervallo
di tempo transiti un veicolo dal casello sia proporzionale all'ampiezza
dell'intervallo,
che in un breve intervallo di tempo non possano transitare due o piü veicoli, e che
l'awenire o meno del transito di un veicolo in intervallini di tempo disgiunti
siano
eventi indipendenti. Detto allora Xi ~ Po(í^Q = Po(200í) il numero di veicoli in
transito neU'intervallo di tempo [0 , (misurato in ore), il numero di veicoli in
transito
CapUolo 3: Varíabili aleatoria e modelli probabilistici
133
in un minuto e
Y ~ G'(O.Ol),
99
99
P { Z = 100) =
n >
logO.5
= 68.97
logO.99
135
2015?
b. Qual é la probabilitá che non si verifichi alcun terremoto nel prossimo mese di
agosto?
3.21. In una rete di telecomunicazioni, le interruzioni della linea si verificano
con una
media di una al giomo. Calculare la probabilitá che nella rete si verífichi;
a. nessuna interruzione per 5 giomi;
b. esattamente 2 interruzioni in 3 giomi;
c. almeno un'intermzione in 4 giomi,
d. almeno 2 interruzioni in 5 giomi.
3.22. L'influenza ha colpito, loi scorso invernó, il 3% degli studenti di una
grande
Universitá. Un ispettore sanitario vuole fare un'indagine sulla salute degli
studenti di
Diploma (che sono in tutto 2000) e chiama, in ordine alfabético, i 150 studenti
della
sezione A del Diploma chiedendo a ciascuno di dichiarare se ha avuto almeno un
episodio di influenza nei mesi da gennaio a marzo. (La risposta alia domanda é
dunque
"si" o "no").
a. Qual é la probabilitá che il primo studente "intervistato" risponda di si?
b. Qual é la probabilitá che il primo studente che rísponde di si sia il numero 5?
c. Qual é la probabilitá che il terzo studente che rísponde di si sia il numero 15?
d. Qual é il valore atteso della variabiie aleatoria che conta il numero totale
degli
studenti "influenzati" (cioé coloro che hanno risposto "si") nella sezione A?
e. Qual é la probabilitá che il numero totale degli studenti influenzati nella
sezione A
sia minore del valore atteso (calcolato al punto precedente)? (Scrívere la formula
esplicita che assegna questa probabilitá, senza eseguire il calculo numérico)
f. Supponiamo ora di sapere che il numero totale di studenti influenzati nella
sezione
A é 5. Qual é la probabilitá che, su 50 studenti scelti a caso tra i 150 della
sezione A ce
ne siano esattamente due influenzati? (Scrívere la formula esplicita che assegna
questa
probabilitá, senza eseguire il calculo numérico).
3.23. Un monitoraggio del trafüco in una via céntrale di una cittá ha dato i
seguenti
rísultati, nei giomi e negli orarí specificati;
n° di auto
ore di osservaz.
h. 8-9
giorno feríale
750
5
h. 8-9
domenica
40
1
h. 14-15
giomo feríale
200
4
h. 10-12
sabato
300
3
/ f x { t ) dt = 1.
P { X e /) = ^ / x ( f ) dt
per ogni intervallo / C R.
*
d e i
II
d is c o r s o
c o n c e tti
d e l
c h e
s e g u e
lo r o
a s p e tto
n o n
s a rá .
o p e r a tiv o
p e r c ió ,
n o n
c o m p le t a m e n t e
d o v r e b b e
r is u lt a m
r ig o r o s o
e
T u tta v ia
d a n n e g g ia ta .
la
c o m p r e n s io n e
in tu itiv a
Capitolo 3: Variabili aleatoria e modem probabilistici
137
integrabile in senso generalizzato su R. Invece, corne vedremo con gli esempi, non
dev'essere necessanamente una funzione continua ^
Esempio 79. La densité uniform e. Per o , 6 e R, a < 6, definiamo la densità
uniforme suH'intervalIo {a, b):
fx { i)
= 7---- - i ( a . b ) { t ) -
0 —a
(Il simbolo /(o.b)(0 denota la funzione indicatrice dell'intervallo (a, 6), che
vale 1 per
t e {a, b) e 0 altrimenti). Significa che X assume tutti e soli i valori
dell'intervallo
(a, b), con probabilité uniforme.
P ( X e J ) = f ^ /( „ .6 ) ( i) d i = - ^ - | ( Q , 6 ) n J | .
JJ 0— a
O— a
La probabilité che X assuma valori in un intervallo J è il rapporto tra la
lunghezza di
|( a , 6) n J | e la lunghezza di (a, f>). Questo è un esempio in cui la funzione /
x ( i ) è
discontinua.
L a d e n sità u n ifo rm e s u
(2,4)
1
7t(1 + ¿2)
In questo caso la densità ha una primitiva elementare, e si puô calcolare, per ogni
intervallo (a, f>).
P(a< X< b) = Í
dt
Ja 7 r ( l+ í^ )
= - [arctan
7T
= -( a rc ta n 6 - arctan a).
TT
fx{t) =
.-í*/2
s fïit
u n a v a. co n tin u a ,
di
138
Si tratta della famosa "curva a campana" di Gauss, o curva degli errori, di cui ci
occuperemo piú ampiamente in seguito (v. §3 11). Si dimostra che questa funzione é
integrabile su R con integrale 1. La sua primitiva non é pero una ílinzione
elementare,
perció non é possibile mediante calcoli elementan determinare esplicitamente il
valore
del suo integrale su un intervallo {a,b) qualunque. In ogni caso é perfettamente
sensato scrivere che
ñh *1
F (o < A -< 6 )= /
Ja
27T
P { X = i) = 0 per ogni i 6 R.
E' importante riflettere su questo fatto per varie ragioni
CapHolo 3: Varíabili aleatorio e modelli probabilistici
139
ecc.
Fx{t) = P { X < ty
(13)
per ogni í 6 R.
Se X é una v a. continua.
i '/
'
(14)
r' I
(15)
r ' Vú
Dalla (13), che e la definizione di fd.r. valida in ogni caso, seguono subito
alcune
proprieta della funzione di ripartivone per v a discrete o continue
2. Fx{t) —» 1 per i —» + 00 .
(Pensare al fatto che P ( X < + 00 ) = 1).
3. P x (i) —►0 per i —> —00 .
(Pensare al fatto che P ( X = - 00 ) = 0).
4. Per ogni a, f> € R, a <
si ha
140
La (14) e la (15) dicono invece come si calcóla la f.d.r. per mezzo della densità,
continua O discreta, rispettivamente. Soffermiamoci sulla (14): la f.d.r. di una v
a.
continua è la funzione intégrale della sua densità. Questo implica che:
1. La f d.r. di una v.a. continua è sempre una funzione continua:,
2. Nei punti in cui la densità f x{ l ) è continua, la fd.r. Fx i t ) è derivabile,
e
F'xit) = fx{t).
La fd .r. di una v.a. discreta non è, invece, una funzione continua, ma ha il
tipico
andamento "a gradini". Qualche grafíco di fd.r. illustrerà le propriété precedenti.
(2,4)
B(8,0.25)
Capitolo 3: Varíabili aleatoria e modelli probabilistici
141
( 16 )
142
purché l'integrale scrítto esista fínito. In caso contrarío si dice che X non ha
valore
atteso fínito.
La defínizione è analoga a quella data nel caso discreto, con la serie sostituita
da
un intégrale. Si dimostra che il valore atteso soddisfa propriété analoghe a quelle
viste
nel caso discreto;
Proposízione 86. (P ropríetá del valore atteso). Siano X | , X 2, . . . ,
A llora:
1.
v.a. continue.
VarX = E { { X - E X f ) ;
C o v (X ,y ) = E ((X - EX ) { Y - EK)).
Essendo identiche, nel caso discreto e continuo, le propríetá formali del valore
atteso
(v. Proposizione precedente), ed essendo formalmente identiche nei due casi le
defínizioni di varianza e covarianza (che sono espresse in termini di valore
atteso),
saranno identiche, nel caso continuo e discreto, anche le propríetá form ali della
varianza e della covarianza (y. Proposizione 43 e Proposizione 55, nel §3.6). Non é
quindi nemmeno il caso di rípeterle; le useremo all'occorrenza. Quello che occorre
notare, invece, é come si calcóla la varianza nel caso continuo; l'espressione
VarX = E(X ^) - (EX)^
si valuterá calcolando E X mediante la (16), e, in base alia 4 della Proposizione
precedente.
E(X") = f i‘fx{t)dt.
t/R
143
f x{ t ) =
,-<V2
''
EX = f t •
J9.
dt = 0,
v
27T
" i ( t ^) ■ ‘
" *'
= 0.
Perció
VarX = E ( x 2) - ( E X f = 1 - 0 = 1.
Conclusione: ¡a normale standard ha media 0 e varíanza 1.
Esempio 88. Sia X una v a. continua con densitá
f x{t ) =
Calcolare il valore atteso e la varíanza di X. Determinare quindi la funzione di
ripartizione di X. Tracciare infíne il gráfico di f x ^ F x
E' sufficiente applicare le defínizioni e calcolare alcuni integrali elementarí;
144
T1
EX =
dt=^
{t - t^) d t = ^
E { x ^ ) = j e f x{ t ) dt = ^
3 J -1
11
e _ e
(<2 - e ) dt = ^
3 ~ 4 -1
VarA- = E { X ^ ) - (EA)^ = ^ ‘ ^
.
=
r O
se í < —1
fx{y)dy = S ^
[ / ‘ j (1 - y )/2 d y
‘ (1 -y )
dy =
se í > 1
s e - l< í< l
_ l _ e
y _ ^
2
4 J -1 “ 2
4
3
4‘
In definitiva
Fx{t) =
0
1
se t < —1
se í > 1
( j - T + f)
se —1 < í < 1.
G rá fic o d i F x ( t )
3
1
3
145
Fx è
continua, anche se
fx
non lo è
EX
che ¿ un in te g ra le
d e fin ito ,
j^tfxit)dt,
fx(t)dt
di
r ip a r tiz io n e
^x{t)
= í
fx(y)dy
J -0 0
Fx{u)=
fx{x)dx
J -00
Fx(t)= f
J -00
fx{t)dt
J-oo
fx {y ) dy
= b(y)l-oo =
9 (0
/x(y).
- y(-oo).
fx
g(-oo)
fx{t)
¿ continua), per il teorema fondamentale del calcólo intégrale. Si osservi infme
fx{y) dy
Esercizi
3.25.
3.26.
3.27.
f x{ t )
_ íie-‘
" \o
per í > 0
per t < 0
per í > 0
per í < 0
a. Determinare il valore della costante c in modo tale che f x (t) risulti una
densitá
(cioé il suo intégrale esteso a R si uguale a l ) .
b. Calcolare il valore atteso di X.
c. Calcolare l'espressione analítica della funzione di ripartizione Fx{t).
3.10.
147
1. La f.d r . di Y é
Fyit) = 1 -
2. ¡M densiíá continua di Y é
f y{t ) = ue~''^ per í > 0, 0 per í < 0;
3. II valore atieso d i Y é l ¡ v \
4. La varianza d i Y é l ¡v^.
Dimostrazione. Calcoliamo P i y > t) per í > 0. Se
~ P{¡/t) é il numero di arrivi
nell'intervallo di tempo [0, í], l'evento ( Y > t) =■ "il primo arrivo aw iene dopo
l'istante
í" coincide con l'evento (Xt = 0) = "il numero di arrivi fino all'istante t é 0".
Perció
P ( Y > t ) = P( Xt = 0 ) = e - u t
e quindi
EY= [ tfy{t)dt= í
Jtt
Jo
tue~^Ut =
r-l-oo
= [-í'-Ío*" + /
«/o
t»-\
e-" dí= /
«/o
Análogamente,
E (y 2 )= f t ^ f y ( t ) d t = í
Jk
i^ve~''^dt =
Jo
r-\-oo
= [ - t V - r + /
Perció
V a r r = E(Y^) - ( E Y f = l/u^.
9
148
L a d e n sità e sp o n e n zia le
Exp(2)
Exp(2)
O sservazione 93. L'esponenziale come legge delle lacune tra due arrivi. Sia Xt un
processo di Poisson di intensità u, e supponiamo che all'istante T si verifíchi il
primo
"arrivo". Sia Y2 il tempo che dobbiamo attendere ora per il secondo arrivo. La v a.
"numero di arrivi nell'intervallo di tempo [T, T + <]" è una v.a. di Poisson di
parámetro
ut (perché U è l'intensità del processo e i la durata dell'intervallo), perciô è
anche
questo un processo di Poisson di intensità u. Il tempo di attesa per il primo
arrivo in
questo nuovo processo di Poisson sarà, per defínizione, un'esponenziale di
parámetro
u; d'altro canto questo coincide con il tempo di attesa per avéré il secondo
arrivo, nel
processo originale. Quindi Y q è un'esponenziale di parámetro u. Più in generale:
/7 tempo di attesa tra due arrivi successivi, in un processo di Poisson di
intensità u, è
una v.a. esponenziale di parámetro u.
Inoltre le v.a. che misurano i tempi di attesa tra arrivi successivi sono tra loro
indipendenti, per l'ipotesi che abbiamo fatto sul processo di Poisson (gli arrivi
in
intervallini di tempo diversi sono tra loro indipendenti). Con riferimento
all'esempio dei
guasti di un apparecchio, la quantité \ / u (valore atteso dell'esponenziale) viene
anche
delta tempo medio tra due guasti
□
Defínizione 94. Sia X t un processo di Poisson di intensità 1/ > 0. Si dice v.a.
gamma
di parametri n (intero positivo) e u (reale positivo) la v a. Y (continua) che
misura
Vistante dell'n-esimo arrivo in questo processo di Poisson. Si scrive Y ~ r ( n ,
u)
Capitolo 3: Varíabili aleatoria e modelli probabilistici
149
Fr(t)
-l / t
1-
k\
*:=0
2. La densiíá continua di Y è
f v i t ) = ve~''^ ^
í”
3. II valore atieso di Y é n f v .
4. La varianza di Y è n/u^.
Dim ostrazione. Calcoliamo P { Y > t) per i > 0. Se
~
e il numero di arrivi
nell'intervallo di tempo [0, t), I'evento (Y > t) = "I'n-esimo guasto aw iene dopo
I'istante i" coincide con I'evento {Xt < n - 1) = "¡1 numero di guasti fino
all'istante t
e < n - 1". Percio
n-1
-l/t
k\
n = 5
n = 4
n = 3
n = 2
G rá fic o d e lle le g g i
r(n , 1) p e r rj = 2,3,4,5.
P ( X < 3) = 1 -
= 1 - e " ‘ = 0.632.
Fri t ) = 1 -
k\
it=0
(t/3)‘
^+ f
P { Z = 2) =
(5 /3 )'
= 0.2623.
1-
0 ,496.
Capitolo 3: Varíabili aleatoria e modelli probabilistici
151
perció la media campionaria X „ é uno síimatore non distarío di 1/A (si veda il
§3.6 2). Per stimare A, sembra quindi naturale considerare lo stimatore
j,
1
^
-* —
— “ñ
i=\
Questo sará uno síimatore non distaría di A? Si noti che questo non é ovvio, perché
in
generale non é vero che sia E (l/y ) = 1/Ey. Perció il calcólo di E T non é banale.
Questo calcólo si puó eseguire sfhittando;
il fatto che E -^» ~ ^“(71, A);
í=i
• la formula per il calcólo del valore atteso di una ílinzione di una v a.
(Proposizione
86, punto 4).
152
Infalti: posto Y
i=I
ET = n E ( i ) = n ^ i / v ( t ) d í =
yo t
dt
CnC-*^
= n -^ C n -1
ncn r ^ - ' ^
yo
í " '*
dt
r C n .ie - ^ r -^ d t = n - ^ .
^Jo
C rx -l
= 1
L'ultimo intégrale scritlo vale 1 perché é l'integrale di una densitá r(n - 1. 1/).
Basta ora ricordarsi
l'esatta espressione della costante Cn'.
^ =
Q u in d i T
— 7T:\ pcrció
(n -l)!’
„
ET
I/'' (n - 2)!
n
_ ; = ----- r •
(n - 1)! !/"-•
n -l
n - ----- —
considerare
"
EJÍ¡
i=l
n —1
U = Ӗ
'
E ^.
A campionamento eseguito, stimeremo 1/ con
u=
n -l
E^.
t=l
Esercizi
3.30. Una folla di persone aspetta in fíla indiana il taxi, alia stazione céntrale.
Sia X il
numero di taxi che passa in un'ora e TV il numero medio di taxi che passano in
un'ora
(N é noto).
a. Sotto quali ipotesi sul fenómeno si puó assumere che X sia una v.a. di Poisson?
b. Ci si metta d'ora in poi nelle ipotesi del punto a. S t N = 20, qual é la
probabilitá
che nella prossima mezz'ora passino non piú di 5 taxi?
c. Sia Y il tempo di attesa, espresso in ore, perché arrivi il primo taxi.
Riconoscere la
legge di Y . Qual é la probabilitá che il primo taxi arrivi in meno di un minuto?
d Se io sono il quinto della fíla, e ogni taxi carica una persona, quanto dovró
aspettare in media per prendere il taxi?
e. Qual é la probabilitá che io debba aspettare piú del doppio del tempo medio
Capitolo 3; Varíabili aleatoríe e modelli probabilistici
153
calcolato in ef?
3.31. Un apparecchio elettronico produce mediamente N impuisi al secondo.
Sapendo che il numero di impuisi segue una legge di Poisson, stabilire la
probabilitá;
a. che in 1000 secondi si veriíichino almeno 2500 impuisi;
b. che il primo impulso si verifíchi dopo almeno 2 secondi;
c. che si debba attendere piü di 3 secondi per avere K impuisi.
Citare esplicitamente le distribuzioni notevoli che si utilizzano per rispondere
alie
domande. Owiamente, per le probabilitá é richiesta una formula, non un risultato
numérico.
3.32. Sia A il numero medio di meteoriti che ogni anno raggiunge l'atmosfera
terrestre. Solo una frazione p di queste raggiunge la superficie terrestre; infine,
solo
una frazione q della superficie terrestre é abitata.
a. Qual é la probabilitá che in un mese almeno due meteoriti cadano su una zona
abitata? Si giustifichi il modello utilizzato per rispondere, esplicitando le
ipotesi fatte.
Si dia poi un risultato numérico supponendo A = 10^, p = 3 • 10
q = 0.1.
b. Sia Y il tempo, espresso in mesi, che occorre aspettare prima che 3 meteoriti
cadano su qualche zona abitata. Dopo aver riconosciuto la legge di Y , si caicoli
la
probabilitá che questo tempo sia < 2 mesi (sfhittando i valori per A, p, q dati nel
punto precedente).
c. Nella "notte di S. Lorenzo" (10 agosto) si osserva un numero particolarmente
elevato di meteoriti in arrivo nell'atmosfera terrestre. Se questo é vero, qualcuna
delle
ipotesi fatte nel punto a va rivista? Come e perché? Si discutano i limiti di
validitá delle
conclusion! tratte ai punti a e b .
3.33. Un ospedale ha un generatore elettrico d'emergenza connesso ai circuit!
ausiliari che fomiscono energia ad alcune aree critiche; in caso di black-out,
l'unitá
prow ede energia elettrica alie sale operatorie e ad alcuni impianti. II tempo
medio tra
due guasti del generatore d'emergenza é 100 ore.
a. Calcolare la probabilitá che il generatore si guasti durante un black-out di 10
ore.
b. Supponiamo che un secondo generatore d'emergenza idéntico operi in parallelo. II
sistema si blocca solo se, durante un black-out, entrambi i generator! si guastano.
Calcolare la probabilitá di questo evento durante un black-out di 10 ore.
3.34. Siano p, (7 la media e la deviazione standard di una v.a. X ^ Esp(A).
Calcolare
P ( \ X - p \ < ka)
per A: = 1 ,2 ,3 . Si confrontino i valori ottenuti con le corrispondenti stime
fornite dalla
disuguaglianza di Cebicev (Teorema 49, §3.6.1).
3.35. Un implanto ha registrato, nelle ultime ore di lavoro, guasti alie ore:
7 ,8 ,2 3 ,2 4 ,2 5 ,2 7 ,4 4 ,4 9 ,5 2 ,5 8 ,8 2 ,9 2 ,1 2 3 ,1 2 5 ,1 3 4 .
a. Assumendo che il tempo tra due guasti successivi segua legge esponenziale, si
stimi
il parametro A.
b. Si traed un istogramma delle osservazioni relative alia variabile T = tempo fra
due
guasti.
c. Assumendo che il valore stimato per A sia il valore vero, si caicoli la varianza
della
v.a. T = tempo fra due guasti. Si confront! poi la varianza calcolata cosí con la
varianza campionaria, calcolata dalle osservazioni. II confronto tende a conformare
o
smentíre il fatto che il modello di Poisson sí applichi?
154
Bernoulli di paramétra p
Poisson di intensità v
it tempo è...
discreto
continuo
II n° di arrivi in...
è una v.a....
binomiale B { n , p )
prove...
esponenziale Esp( v )
esponenziale Esp(z/)
\/u
Il tempo di attesa prima del 1° arrivo è una v.a....
geométrica traslata G'(p)
esponenziale Esp(i/)
p)
gamma r(n ,
¡/)
esponenziale Esp(t')
Le v.a. "numero di arrivi" sono owiamente discrete; le v.a. "istante del primo (o
dell'n-esimo) arrivo" sono continue se il tempo é continuo, discrete se il tempo é
discreto. In entrambi i process! la v.a. "tempo di attesa per l'n-esimo arrivo" é
somma
di n v.a. indipendenti del tipo "istante del primo arrivo" (nel caso discreto, il
tempo di
attesa é misurato dal numero di insuccessi). Infatti, in entrambi i process!, la
legge
della v.a. "tempo di attesa per il primo arrivo" é anche la legge del "tempo di
attesa tra
due arrivi successivi".
Quest'ultimo fatto é legato alia cosiddetta proprieíá di assenza di memoria dei due
process!, che significa quanto segue. Se stiamo aspettando il primo arrivo, e dopo
un
tempo T non si é ancora verificato, qual é la proprietá di dover aspettare ancora
per
un tempo t (e quindi, in totale, di dover aspettare T + ¿)? E uguale alia
probabilitá che
avevamo, all'inizio, di dover aspettare almeno t. In altre parole; ad ogni istante
il
processo azzera la propria memoria del passato, e il fatto che Tarrivo non sia
finora
accaduto non altera la probabilitá di dover attendere tanto o poco perché si
realizzi.
Capitolo 3: Ve^abili aleatoria e modelli probabilistici
155
Formalizziamo questo discorso. Sia Y la v.a. "istante del primo arrivo". Assenza di
memoria significa;
(17)
P {Y > T - h t , Y > T )
P ( Y > T + t)
P(Y >T)
~ P { Y > T) '
quindi la proprietá di assenza di memoria si esprime cosí:
(18)
P {Y > t ) = e “"',
e la (18) segue per la proprietá delle potenze. Se Y r\j
P ( Y > k ) = { l - p )^
e la proprietá
(19)
(La probabilitá che un apparecchio che ha gia vissuto per un tempo T viva ancora
per
un tempo t é minore della probabilitá che un apparecchio nuovo viva almeno per un
tempo t : il tempo aumenta la propensione al guasto).
Inline, si puó ipotizzare che esistano apparecchi che sono "meglio usati che
nuovi",
ossia tali che
(20)
Nella descrizione dei tempi di vita di apparecchi, si cercheranno quindi v.a. che
soddisfíno, tra le tre proprietá (17), (19), (20), quella che meglio traduce le
caratteristiche dell'apparecchio in esame. Mentre peró esiste una sola legge che
soddisfa la (17) (e questo é ció che rende cosí importante la legge esponenziale),
ce ne
sono infinite che soddisfano la (19) o la (20).
Gli esempi che seguono illustreranno queste idee.
Esempio 102. Sistema costituíto da componenti non soggetti a usura, disposti in
sene o in parallelo.
a. Si calcoli il tempo di vita di un sistema costituito da tre elementi identici
posti in
serie, se ciascuno di essi ha tempo di vita di legge Esp{\ i ) (i = 1 ,2 ,3 ), e le
tre "vite"
sono indipendenti. Si calcoli poi il tempo medio di vita del sistema, in funzíone
dei
tempi medi di vita dei componenti.
b. Lo stesso problema nel caso di tre elementi in parallelo.
c. Le v.a. tróvate sono note? Si dica, in ciascuno dei due casi, se il sistema cosí
ottenuto é soggetto o no a usura.
Sia Ti il tempo di vita del componente r-esimo (t = 1 ,2 ,3 ) e sia T il tempo di
vita
del sistema.
Caso a. I tre componenti sono disposti in serie. Allora appena se ne guasta uno, si
guasta il sistema, perció
T = tmn(Ti,T2,T^).
Come si calcóla la legge del mínimo tra v.a. note? Questo é un problema il cui
interesse va oltre questo esempio. E' utile ragionare cosí. Per definizione di
minimo,
157
+'^2+’^3)í
Perció
1
Al + A2 + A3
1
-ti + —
<2 +
^ —
tj
avendo posto í, = E7¿ = 1/A¿ = tempo medio di vita del componente t-esimo. Se ad
esempio i 3 componenti hanno uguale parametro. A, e tempo medio di vita t = 1/A, il
tempo medio di vita del sistema é 1/(3A) = í/3 (in particolare, piú breve di quello
di
ciascun componente).
Caso b. I tre componenti sono disposti in parallelo. II sistema si guasta quando
íutíi e
tre i componenti si sono guastati, perció
(Í)
< t) =
(1 - e"-'*') (1 -
La densitá puó essere calcolata derivando l'espressione trovata, ma non é
necessario:
la f.d.r. basta a determinare la legge. Si osserva che non é una legge
esponenziale,
quindi il sistema ora "ha memoria". Chiediamoci se si usura o, al contrario, é
"meglio
usato che nuovo". Ragionando come nel caso a, é immediato convincersi che il
sistema si usura col tempo; infatti, un sistema con uno o due elementi guasti é un
sistema che flinziona ancora ma ha maggior probabilitá di cessare di funzionare
entro
un certo tempo, rispetto ad uno che ha ancora tutti e tre i componenti sani. (II
numero
di componenti guasti é in questo caso un indice oggettivo di invecchiamento)
II tempo medio di vita dei sistema si potrebbe calcolare in base alia definizione,
integrando
omettiamo il noioso calcólo (che non presenta difficoitá) Si trova,
supponendo per semplicitá A¿ = A per i = 1 ,2 ,3 ,
158
ET =
n
6A
(ossia poco meno del doppio del tempo medio di vita di un singólo componente).
Esempio 103. Sia S un sistema costituito da n elementi identici, che vengono fatti
ñinzionare uno alia volta; quando il primo si guasta, viene sostituito dal secondo
(che
inizia a ñinzionare in quell'istante), e cosí via finché si guasta l'n-esimo
elemento; a
quel punto il sistema cessa di ñinzionare. Se ogni elemento ha tempo di vita di
legge
Esp(A), e le "vite" degli n elementi sono tra loro indipendenti, qual é il tempo di
vita
del sistema 5 ? Calcolame la legge. II sistema S é soggetto a usura?
Per come é costituito il sistema, il suo tempo di vita T é somma di n v a.
indipendenti, ciascuna di legge Esp(A), perció
T ~ r ( n , I/).
Senza eseguire calcoli, é facile convincersi, con lo stesso ragionamento fatto nel
punto
b dell'esempio precedente, che il sistema S é soggetto a usura; infatti il numero
di
componenti giá guastati é un indice oggettivo del grado di invecchiamento del
sistema
Questo mostra che la legge F (n, i/) é una (non Túnica!) legge che descrive il
tempo
di vita di un apparecchio soggetto a usura.
□
Esempio 104. Sia X il tempo di vita ( = fiinzionamento senza alcun guasto) di un
certo tipo di elettrodomestico prodotto da una ditta. Dai dati raccolti é noto che
il
tempo medio di vita é di 2 anni, con uno scarto quadratico medio di 1 anno.
Supponendo di poter descrivere X come v a. di densitá gamma (per opportuni
parametri, da determinarsi), si dica;
a. qual é il numero di mesi che la ditta puó coprire con garanzia, affinché, per
ogni
apparecchio venduto, la ditta abbia il 95% di probabilitá di non dover intervenire
in
garanzia?
b. Supponendo che un apparecchio non abbia avuto guasti fino alio scadere della
garanzia, qual é la probabilitá che si guasti nei 4 mesi successivi? Si confronti
questo
risultato con la probabilitá che un apparecchio nuovo si guasti nei primi 4 mesi.
Commentare.
(Esercizio da fa rsi preferibilmente con I'ausilio di computer per i calcoli).
VarX = 4 -
1/
T=z
U
= i
anni
anno
Si trova
r = 4
1/ = 2
P ( A '> í ) = ¿ e
( 21)
Jk!
fe=0
159
p { x < i \ x > ± )
P(^
< X < 1)
> -fe)
1)
> 2 /3 )
Esercizi
3.36. Un computer é costituito da 4 sottosistemi in serie, ciascuno dei quali si
puo
guastare, indipendentemente dagli altri, causando il blocco del computer.
Supponendo
che il tempo di buon ftinzionamento di ciascun sottosistema sia una v.a.
esponenziale
di parámetro A, determinare:
a. la distribuzione della v.a. "istante in cui si blocca il computer";
b. il valore atteso del tempo prima del blocco del computer, sapendo che il valore
atteso del tempo prima della rottura di un sottosistema é di 2000 ore;
c. la probabilitá che il tempo di flinzionamento del computer superi le 100 ore.
3.37. La durata X di un componente elettronico segue una legge esponenziale con
durata media 12 mesi.
a. Determinare la probabilitá che un componente che é giá durato per 3 mesi duri,
complessivamente, per piú di 12 mesi.
b. Quando si guasta un componente, questo viene sostituito con uno nuovo dello
160
3.10.4. La funzione di i s t a n t a n e o u s
e le leggi di Weibull
fa ilu r e r a te
Z{k) =
P{Y = k , Y > k )
P { Y > k)
P ( Y = k)
P(Y>k)
pY(k)
P(Y>k)
Se ora Y é una v.a. continua (come é piú naturale supporre quando Y rappresenta un
tempo), non ha piú senso calcolare P { Y = t\ Y > t), perché P ( Y = t) = 0 .
Tuttavia
ha senso considerare, per analogia, la funzione
Z{t) =
frit)
P{Y> t)
frit)
1 - F k (í ) ’
161
fvit)
-i/t
e -i/t
1 - Fri t )
F (n , v),
Z(i) = frit)
k=0
tn =
Cr,
k=0
Si osservi che il denominatore é un polinomio di grado n — 1 in t, e vale 1 per í =
0.
Perció la ñinzione Z( t ) si annulla per í = 0 e tende a un valore positivo finito
per
í
+00 (asintoto orizzontale); anzi, questo limite é proprio u (basta scrivere il
valore
esatto di Cn e fare il calcólo). Si puó anche verificare che la flinzione é
monotona
(crescente). Questo studio ci dice che la legge gamma descrive il tempo di vita di
un
apparecchio la cui propensione al guasto cresce col tempo, fin o al limite u (che é
quello che avrebbe se il tempo di vita fosse esponenziale). Questo significa che,
se
¡'apparecchio riesce a Junzionare per un tempo abbastanza tungo, diventa
indistinguibile da un apparecchio non soggetto a usura, cioé con legge di vita
Esp(i^).
La flinzione Z{ t ) dá anche modo di costruire nuovi modelli per rappresentare il
tempo di vita di un apparecchio. Consideriamo ad esempio una semplice ftmzione del
tipo
Z( t )
1 - Frit)
= m .
si ha
Ry(t) = - f y { t ) ,
R'yit)
^rit)
-Z (t)
ossia
~ i \ o g R y { t ) = Z{t).
dt‘
F y H) = 1 - e
fy(t) =
Si osservi Che scelti comunque O 0,/? > - i , quella trovata e efTettivamente una
density la cui funzione di istantaneous failure rate e la Z (i) assegnata. Si
tratta di una
famiglia notevole di densita, note col nome di densitd di Weibull. Questa famiglia
di
densita e piuttosto versatile in quanto per ^ > o la funzione Z{t) e crescente
(apparecchio "che invecchia"), per - 1 < /3 < o la Z (i) e decrescente (apparecchio
"meglio da vecchio che da nuovo"); per /3 = 0 si ritrova la legge esponenziale.
D e n sitá d i W e ib u ll p e r c = \ e ( 3 =
F u n zio n e Z { t ) p e r le le g g i d i W e ib u ll c o n
Esercizi
3.38. Si scriva esplicitamente la flinzione Z{t) per una v.a. di legge r ( 2 ,i/),
e se ne
tracci il grafico.
3.39. II tempo di vita Y di un apparecchio, espresso in anni, e descritto da una
legge di
Weibull con c = /5 = 1. Calcolare;
a. ¡1 tempo io per cui si ha P ( Y > to) = 0.5.
b. la probabilita ehe un apparecchio ehe ha giä vissuto un anno, viva ancora per un
tempo almeno to3.40. Determinare la densita della v.a. "tempo di vita" per un
apparecchio costituito da
due componenti identici e indipendenti, ciascuno con tempo di vita descritto da una
legge di Weibull con c = ß = 1, disposti;
(a) in Serie; (b) in parallelo.
(Suggerimento: ragionare come nell'Esempio 102).
f z{t ) =
v /^
f.d.r:
Fz{t) =
b !z ^
, - ‘V2 =
= v^(0:
r
y/27rJ-oo
= <&(<);
= 0; VarZ = l.
O sservazione 107. Calcoli con i quantili. Vedremo che in molti problemi statistici
occorre ragionare in direzione inversa, ossia:
assegnato a 6 (0,1), determinare un numero A; € R tale che:
i'.
(a) P (Z < k ) = a; (b) P (Z > k) = a;
(c) P (|Z 1 > fc) = q ; (d) P{\Z\ < k) = a.
Risolviamo perció una volta per tutte questi problemi.
(a) . Per defínizione di quantile, sará
P { Z < Za) = Q,
con
Za
P { Z > 2,_„) = a .
(c) Per la simmetria di Z, P{\Z\ > A:) = 2 P{ Z > k) = a per P { Z > k) = a/ 2. Per
il punto (b), allora,
P(\Z\ >
Zx-a/2 )
= OL
(d) P{\ Z\ < k) = a equivale a P {\Z \ > A:) = 1 —q , perció per il punto
precedente
=
^ 1-( 1- q )/2 =
2 ( \ + o )1 2
Riassumendo:
P { Z < Zq) = a
P{\Z\ > 21- 0/ 2) = o
P { Z > 2i_o) = 0
P{\Z\ < 2(n_o)/2) = 0
□
CapUoto 3; Variabili aleatone e modetti probabilistici
165
Queste formule sono utili insieme a una tabella dei quantili di Z, almeno per i piú
comuni valori di a:
a
■2a
0.90
1.2816
0.95
1.6449
0.975
1.96
0.99
2.3263
0.995
2.5758
0.999
3.0902
0.9995
3.2905
fy
v27Tcr
aZ+fi.
(23)
funzione di ripartizione
Fx{t)
media
E X = p,
varianza
WarX = a^.
Una v.a. continua X avente densità (23) si dice avéré legge normale (o gaussiana)
di media p e varianza
e si scrive X
Se X
7V(/i, g^), allora la v.a. Z = (X — p ) f a ha legge normale standard.
Dim ostrazionc. Dal fatto che X = a Z
Infine,
166
\
í t —p
a dt \ a
^ (t-nf/2a^
= Í^ (1 Z £ )
<^ \
<^ /
I \/27ra
Questo dimostra la príma parte del Teorema. Supponiamo ora che X abbia legge
N(fj,,(7^) e sia Z = ( X —
Calcolando F z { t ) in flinzione di F x { t ) con passaggi
analoghi a quelli fatti sopra, si trova che F z { t ) = í>(í), il che signifíca che
Z ~ N { 0 , 1)
X ^N {n,a^)
ctZ
+ /i
X - p
N{fi,o^)\
N{0,1).
X ^ 7 V (1 ,4 ).
Poiché X ~ iV (l,4 ), Z = ^
Calcolare,
utilizzando
<
tavole
O
~ N { 0 , 1); perciô
le
X - 1
— <
di
= $ ( 1 . 5 ) + $ ( 1 ) - 1 = 0.93319 + 0 .8 4 1 3 4 - 1 = 0 .7 7 4 5 3 .
167
Xi + X2 ~
rsj
rsJ
p>2i
N(^ap\ + 6, a^(7|).
E X ^ O, cioé X ~
si dirá che siamo anche in presenza di un errare
sistemático /x che si somma aH'errore casuale. Maggiore é |/i|, maggiore sará
Yimprecisione della misura.
Riassumendo: Sia
Y = misura di una grandezza física.
Y = "valore vero" + "errore di misura" = u + X .
X ~ N{p, a^), ow ero X = p + Ec con Ec
N{0, a^).
E{Ec) = 0;
EY = u + ^
(il valore atteso della misura é la somma del valore vero e dell'errore
sistemático;
il valore atteso dell'errore casuale é zero; notare che l'errore sistemático é una
costante, l'errore casuale una variabile aleatoria)
2. Distribuzíone di una caratteristica quantitativa di una popolazione, che
presenta oscillazioni casuali (ma contenute) attorno a una media. Molte
grandezze antropometriche, come la statura, il peso, ecc., (naturalmente,
all'intemo di
popolazioni omogenee, ad es.: adulti, maschi, italiani) sono rappresentabili da una
legge gaussiana. II valore atteso p é i\ valor medio della grandezza nella
popolazione
in esame, la varianza
é "ragionevolmente piccola" se la popolazione é stata defínita
in modo sensato (nel senso giá spiegato). Lo stesso puó valere per certe grandezze
aventi un significato fisiológico (es. pressione arteriosa media al variare
dell'individuo),
biológico, ecc.
3. Dimensione efTettiva di oggetti prodotti in serie che si cerca di produrre
identici. Esempi; uno stabilimento produce sottili pellicole metalliche che devono
avere spessore di mm.0.1;lo spessore effettivo puó essere rappresentato da una v a.
nórmale di media p = mm.0.1 (si spera!) e varianza molto piccola (si spera!).
Analoghe considerazioni si possono fare per il diámetro effettivo di sfere
metalliche
prodotte in serie, il volume effettivo di liquido contenuto nelle bottigliette che
vengono
riempite automáticamente in una birreria, ecc.
Non deve sñiggire il fatto che le tre classi di esempi discussi sono simili ma
differenti. Nel primo caso la variabilitá é nelle misure che noi facciamo di una
grandezza físsata una volta per tutte (es. la massa di un oggetto, pesato tante
volte);
nel secondo la variabilitá é tra individui diversi presenti "in natura" (es. il
peso di
persone diverse); nel terzo caso tra oggetti diversi che noÍ abbiamo prodotio con
¡'intento di ottenerli uguali (es. il peso del contenuto di una confezione di
caffé).
In tutti i casi, l'interpretazione che sólitamente si dá della variabilitá della
grandezza
é la seguente: si pensa al valore della variabile X osservata come il risultato
della
somma di tanti piccoli contributi indipendenti. (Ad esempio, l'errore nel misurare
una
lunghezza é il concorso di varíe cause; inaccuratezza di chi esegue la misura,
piccole
CapUolo 3: Variabili aleatoria e modelli probabilistici
169
a. Poiché X ~ 7V(250,32), Z =
X -250
iV (0,1); perciô
X - 250
245 - 250
-----r----- < ------r------
P {X < 245)
)=
247 - 250
X - 250
253 - 250
)=
Si fomisca poi una stima di P {p — ka < X < + ka} (per il valore k trovato) in
base alia disuguaglianza di Cebicev (sfhittando il fatto che E X = fi e V arX = a^,
ma
non il fatto che X sia una v.a. normale). Commentare.
P{f i — k a < X < fj, + ka}
<A:
=P{\Z\<k).
e in particolare,
P{fj. -
2.5758a
Quindi la probabilitá
sappiatno
essere in realtá di circa il 99%, viene stimata, dalla disuguaglianza di Cebicev,
come
almeno dell'85%. L'informazione che ci da la disuguaglianza di Cebicev, utilizzando
solo il fatto che X abbia valore atieso p e varíanza a^ (ma non il falto che abbia
legge
nórmale) é quindi piú grossolana di quella che possiamo ottenere sfhittando la
legge di
□
X, come é ragionevole che sia.
Esercízi
3.41. Una macchina confeziona barattoli di caffé del contenuto netto nomínale di
250g. II peso reale é una v.a. nórmale di media 250g. Calcolare la deviazione
standard
del peso, sapendo che il 5% dei barattoli pesa piú di 2b2g. Calcolare quindi la
probabilitá che un barattolo pesi meno di 245^.
3.42. La lunghezza di certe sbarrette d'acciaio prodotte in serie é una v.a.
nórmale di
media 4cm e varianza 0.04cm^. Se decidiamo di scartare il 5% delle sbarrette che
hanno lunghezza minore e il 5% delle sbarrette che hanno lunghezza maggiore,
determinare la lunghezza minima e massima dei pezzi accettati.
3.43. II diámetro delle sfere d'acciaio prodotte da una certa macchina segue una
distribuzione nórmale. Si supponga che il 20% delle sfere abbia diámetro inferiore
a
2.4cm e che il 10% delle sfere abbia diámetro maggiore di 2.6cm.
a. Determinare media e varianza del diámetro della sfera.
b. Calcolare la probabilitá che il diámetro di una sfera sia maggiore di 2.5cm.
3.44. In un processo industríale, una macchina ñúscela due sostanze versandone
quantitá opportune in tanti barattoli. Le proporzioni desiderate sono 1 : 2 (cioé
ogni
barattolo dovrebbe conteneré 1/3 della sostanza A e 2 /3 della sostanza B. In
pratica,
le quantitá X a , X b vérsate in ogni barattolo sono v.a. che si possono supporre
normalmente distríbuite, con
X A ^ N { p , a ‘^)\ X B ^ N { 2 p , a ‘^).
Qual é il massimo valore ammissibile per a^ se si vuole che, con probabilitá 0.99
almeno, sia \ X b - 2 X a \ < 0.01?
3.45. La temperatura di una certa cittá segue la legge nórmale con p = 68°F e
a = 4°F (gradi Farenheit). Trovare la distribuzione della stessa grandezza espressa
in
gradi Celsius. (Si rícordi che la temperatura del ghiaccio fondente e dell'acqua in
ebollizione, in condizioni standard, aw iene a 32°F e 212°F, rispettivamente).
3.46. Si vuole progettare un'ascensore in grado di trasportare 30 persone. Si
supponga che il peso di un individuo segua una legge nórmale di media 70kg e
varíanza lOOkg^. Quale dev'essere il caríco massimo sopportato dalla cabina, se
vogliamo che, con probabilitá del 99.9%, la cabina (da ferma) resista al peso di 30
persone scelte a caso?
3.47. La legge nórmale puó essere usaía talvolta per rappresentare il tempo di vita
di un apparecchio, guando questo tempo sia "abbastanzaprevedibile".
Supponiamo che la durata di funzionamento senza guasti di un certo tipo di
televisóte
sia una v.a. distribuirá normalmente con media 530 giomi e deviazione standard 100
giorni.
Capitolo 3: Variabili aleatone e modem probabilistici
171
Abbiamo visto che la legge normale puó costituire un buon modello per molti
fenomeni
aleatorí. Inoltre, come vedremo nel Cap.4, se é noto che una certa popolazione
statistica é distribuita secondo una legge normale, certi metodi statistic! si
possono
applicare in modo particolarmente semplice. Diventa quindi importante avere qualche
método pratico per valutare se certi dati campionari si possano supporre
provenienti da
una legge normale.
Esempío 114. Le stature di 4 persone scelte a caso in una certa popolazione sono:
165; 162; 171; 167.
Si puó ritenere che il campione sia estratto da una popolazione normale?
Per ríspondere a questo tipo di domanda, esiste un método gráfico qualitativo che
puó essere utile: la costruzione di un normal-scores plot. Per spiegare come si
procede
e perché, si puó ragionare cosí. Cominciamo a supporre di estrarre un campione di
ampiezza 4 da una popolazione distribuita secondo legge normale standard.
(Naturalmente non é il caso delle stature!). Come sarebbe fatto un campione casuale
"ideale"? Possiamo pensare a 4 punti disposti sulla retta in modo da dividerla in 5
intervalli di ugual probabilitá (ossia; una v a. Z
N { 0 , 1) assume valori appartenenti
ai 5 intervalli con ugual probabilitá). Questi 4 punti saranno i 4 quantili;
90.2. 90.4. 9o.6. 9o.8
ossia
-0 .8 4 ; -0 .2 5 ; 0.25; 0.84.
(la v.a. Z
N(p, 1) assume con probabilitá 0.2 valori compres! in ciascuno dei 5
intervalli). Questi numeri sono detti "normal-scores" ("punti normal!"), e
dipendono
solo daW'ampiezza del campione. Per costruire ora un normal-scores plot a partiré
dal
nostro campione mettiamo le nostre osservazioni in ordine crescente
162, 165, 167, 171
e rappresentiamo su un gráfico i punti (-0 .8 4 ,1 6 2 ); (-0 .2 5 ,1 6 5 );
(0.25,167);
(0.84,171). Se i dati fossero estratti da una legge iV (0,1), idealmente dovrebbero
coincidere con i normal-scores, per cui i 4 punti sarebbero allineati sulla
bisettrice del
1° quadrante; se i dati sono estratti da una popolazione Y ~ iV(/¿, a^), é noto che
( y - /x)/a ~ 79(0,1), per cui i punti dovrebbero apparire allineati sulla retta
(y ~
cioe y = a x p.
172
Riassumendo.
Dato un campíone di ampiezza n, per costruire un normal-scores plot:
1.
2.
3.
Se i punti rísultano "abbastanza allineati" (su una qualunque retta y = m x -\- q),
é
verosimiie che le osservazioni provengano da una popolazione nórmale (in questo
caso, il coefficiente angolare della retta rappresenta la deviazione standard,
l'intercetta
rappresenta la media).
Nel nostro esempio, dunque;
(G nd lines are 5. 10. 25. 50, 75, 90. and 95 p e rc e n tile s )
160.041
166 25
17 2.459
(G ria
lines are 5,
1 7855
173
2 2425
La normalitá dei dati é plausibile. (Si osservi che ogni programma statistico puó
seguiré procedure leggermente diverse per costruire il gráfico. II signifícalo pero
é
quello che abbiamo spiegato. Si osservi anche che il computer disegna anche la
retta
che "passa piú vicino" a questi punti, ad esempio col método dei minimi quadrati,
visto
nelCap. 1).
□
Esercizio 3.48. Si vuole studiare la resistenza di un certo tipo di filo di nylon
alia
rottura. La resistenza alia rottura é misurata dalla forza necessaria a spezzare il
filo, ed
é quindi espressa in Newton. Su un campione di 5 fíli si sono ottenute le seguenti
misure di resistenza;
7.17; 6.65; 8.80; 5.49; 7.44.
E' plausibile che la resistenza di un filo si distribuisca secondo una legge
nórmale? Per
rispondere, si costruisca un "normal-scores plot" delle 5 misure osservate e lo si
commenti. Si calcoli quindi media e varianza campionaria a partiré da questi dati.
ha:
2
E (X „) = P\ V a r(x „ ) =
Si noti che, in generale, la legge della v a. X„ sará una legge di tipo diverso da
quella delle X{, di questa legge, pero, conosciamo valore atteso e varianza. In
particolare, la varianza é tanto piu piccola quanto piú grande é n.
Nel caso particolare in c m X i ~ N ( p,a^)j si conosce esattamente anche la legge
della media campionaria, Í n ^ i , peril Teorema 111,
;
(-Í)
II Teorema del limite céntrale, che si puó enunciare in varíe forme, dice che il
risultato
precedente rímane approssimativamente vero se le v a. X ,, invece di essere
normali,
hanno legge qualunque.
Teorema 116. (Teorema del limite céntrale, prima formulazione). Sia
una
successione di v.a. indipendenti e idénticamente distribuite (i.i.d.), con valore
atteso
p fin ito e varianza
finita. Per ogni intero positivo n, si consider! la media
campionaria X ^ delle prime n v.a., e si costruisca la standardizzata di questa,
ossia
la v.a.
5: =
(j/s/n
n = 1, 2, 3, . . .
(24)
175
PI
ajy/n
<i I ~P(Z<i).
(II
N{np,na^).
Riassumendo.
^
Siano X i , X 2, . . . , X n va. i.i.d., BX í ; = / x, VarX¿ =
grande, vale \'approssimazione normale:
ossia P ( X „ < í) ~
~ N{np,na^)
ossia P
< A ~
t= l
con Xi v a. i.i.d. di legge Esp(A). Inoltre EXi = 1/A, VarA^, = 1/A^. Ne segue che
per
B{n,p).
111
Sia
i=\
r
'
t — np
\/n p (F ^
che è il modo che si usa comunemente per calcolare la f.d.r. de||a binomiale,
quando n
¿grande.
La densità binomiale è simmetrica per p = 0.5, ed è tanto più asimmetrica quanto
più p è vicino a 0 O 1. Tenendo conto di questo fatto e dell'osservazione
precedente,
una buona norma è quella di applicare l'approssimazione normale della binomiale
B{n, p) solo se sono verifícate le condizioni;
n p > 5; n ( l - p) > 5.
(25)
P { Y < Í) ~ $ I
t — np
\/n p (r^ ^
Questa relazione vale per ogni t G R. In realtà perô, mentre la fùnzione a secondo
membro é una flinzione continua e strettamente crescente, la fùnzione P ( Y < t) è
costante per t G [ k , k + l), quando k é intero (k = 0 , 1 , 2 , . . . ,n). Dunque
per
approssimare P ( Y < k), che é uguale a P { Y < k + 6), per ogni ¿ e [0,1), é
altrettanto lecito usare
178
k + 6 — np
y/np{l - p)
P { Y < fc) ~ $ I
Al + 0.5 —np
y/np{\ - p )
per fc = 0 , 1 , 2 , . . . , n.
(26)
Questa approssimazione è più precisa della precedente, che non tiene conto del
fatto
che la f.d.r. della binomiale è costante a tratti. L'introduzione del termine " +
0.5" nella
formula precedente prende il nome di correzione di continuità, ed è opportuna ogni
volta che si usa la normale per approssimare una legge discreta.
Il prossimo gráfico illustra visivamente come la correzione di continuité migliori
l'approssimazione normale;
179
= 0 1 630, e
differisce da questo valore per una quantitá parí alia differenza tra le aree delle
due
region! tratteggiate in figura;
Riassumendo: s e Y
B{n, p), con n abbastanza grande (in dipendenza da p), ossia
np > b, n (l — p) > b, la legge di Y si puà approssimare mediante la legge normale,
tenendo conto délia correzione di contirmità, con la (26).
L'approssimazione normale délia binomiale è molto utile in problemi di
campionamento:
180
Esempio 123. II partito politico A ha avuto il 18% dei voti in una tom ata
elettorale.
Una société ha eífettuato un sondaggio exit-poll, chiedendo a un campione casuale
di
1000 elettori, all'uscita del seggio elettorale, per che partito avessero votato, e
stimando da questo campione le percentuali di voti dei vari partiti. Qual è la
probabilité
che, in base al proprio campione, la société abbia dichiarato, per il partito A,
una
percentuale sbagliata di almeno un punto percentuale?
II numero X di persone del campione che hanno votato per il partito A è una v a.
X ~ 5 (1 0 0 0 ,0 .1 8 ). La percentuale dichiarata saré > 19% se X > 190, e saré
< 17% se X < 170. Quindi la probabilité di errore di almeno un punto percentuale è
P ( X < 170)
P ( X > 190) ~ 1 - $
= 1 - 4>(0.782) = 0.2177
= 1 - $(0.782) = 0.2177.
x /IIre
P ( X < 170) =
0.82’°®® *,
un calcólo proibitivo.
E' istruttivo vedere come cambia il risultato numérico aumentando di moho il
campione. Se invece di 1000 persone fossero state 10000, avremmo trovato una
probabilité di commettere un errore di almeno un punto percentuale di circa 0.01
(cioé
delll%). II lettore verifichi questo fatto per esercizio.
□
Esem pio 124. Un ingegnere ha progettato un robot per eseguire saldature,
modificando un tipo gié esistente. II nuovo modello saré considéralo buono se
esegue
male solo 1'1% delle saldature, e scarso se esegue male almeno il 5% delle
saldature. Si
esegue un test di 100 saldature. II nuovo progetto saré accettato se il numero di
errori
saré < 2, rifíutato altrimenti.
a. Qual é la probabilité che un buon progetto sia scartato?
b. Qual é la probabilité che un cattivo progetto sia accettato?
II test si puó schematizzare come un processo di Bernoulli di 100 prove con
parametro p incognito. Sia X il numero di saldature eseguite male su 100,
X ~ 5 (1 0 0 , p). Se il progetto é buono, p < 0.01. II progetto é scartato se X >
2. La
probabilité che il progetto sia scartato, P ( X > 2), é tanto maggiore quanto
maggiore
Capitolo 3: Varíabili aleatoria e modelli probabilistici
181
Pp=o.oi(X > 2) ~ 1
^Q^QQ
Pp=0.05ÍX < 2) ~ $ ( ^
^ 4
^ (1 1 5 ) = 0.1251 = 12.5%.
2 /
Pp=0MÍX < 2) = ¿
Si noti che nel secondo caso, in cui n p = 5, l'approssimazione è moho migliore che
nel primo.
□
Esercízi
3.49. Consideriamo la popolazione degli individui adulti di sesso maschile
residenti in
un certo comune. E' noto che; la statura media di questa popolazione é 174cm; il
99%
degli individui della popolazione ha statura compresa tra 154cm e 194cm; la statura
degli individui della popolazione é normalmente distribuita.
a. In base a questi dati, determinare la deviazione standard della statura.
b. Calcolare la probabilitá che un individuo scelto a caso dalla popolazione abbia
statura compresa tra 165cm e 170cm.
c. Consideriamo ora un campione casuale di 20 individui scelti da questa
popolazione. Calcolare la probabilitá che la media campionaria delle stature degli
individui di questo campione sia compresa tra 165cm e 170cm.
3.50. Due dadi vengono lanciati per 60 volte consecutive. Qual é la probabilitá di
ottenere 7 almeno 10 volte? Per rispondere;
si determini la legge seguita dalla v a. "numero di volte in cui si ottiene 7,
lanciando 60
volte due dadi" e si scriva la formula esatta che assegna la probabilitá
dell'evento
cercato; si calcoli poi la stessa probabilitá facendo uso di una opportuna
approssimazione.
3.51. II numero giomaliero di passeggeri sui treni da Milano a Firenze é una
variabile
aleatoria di distribuzione incognita. Supponendo che il valore atteso sia pari a
3000 e
la deviazione standard pari a 1000, si calcoli approssimativamente la probabilitá
che in
30 giomi il numero complessivo di viaggiatori sia almeno 100000.
3.52. Un libro ha 400 pagine. Supponiamo che la probabilitá che una pagina sia
priva
182
di errorí sia 0.98 e che la presenza o meno di erron in pagine diverse siano eventi
indipendenti. Sia X il numero di pagine che richiedono correzioni.
a. Riconoscere la legge di X.
b. Calcolare la probabilitá che sia X > 4, facendo uso dell'approssimazione
nórmale.
c. La probabilitá calcolata in b potrebbe essere approssimata anche facendo uso di
una v a. notevole diversa dalla nórmale; quale? Si esegua il calcólo approssimato
della
probabilitá che sia X > 4 facendo uso di questo secondo método.
3.53. I traghetti da Bellagio per Varenna partono ogni 10 minuti. II signor Rossi é
in
vacanza a Bellagio per 6 giomi, ed ogni giomo sceglie a caso un istante in cui
recarsi
al molo d'imbarco. Lo stesso fa anche il signor Brambilla, che invece trascorre a
Bellagio un periodo di 30 giomi.
a. Calcolare la probabilitá p che, in un dato giomo, il signor Rossi attenda piú di
7
minuti.
b. Sia X la v a. che denota il numero dei giomi in cui il signor Rossi attende il
traghetto per piú di 7 minuti. Qual é la distribuzione di X I Calcolare E X e VarX.
c. Sia Y la v a. che denota il numero di giomi in cui il signor Brambilla attende
il
traghetto per piú di 7 minuti. Qual é la distribuzione di Y? Calcolare E Y e V arF.
d. Utilizzando l'approssimazione nórmale, calcolare le seguenti probabilitá;
P { Y < 5);
P { Y > 15); P (6 < F < 12).
3.54. La statura X di un ragazzo di 18 anni scelto a caso tra coloro che si
presentano
alia visita di leva é una v.a. di legge nórmale, 7V(175,30). Un addetto misura le
stature
in modo piuttosto inaccurato, cosicché la statura che viene registrata é F = X +
W ,
dove W é l'errore commesso. Supponendo che W ~ N { —2 , 6) si calcoli;
a. la probabilitá che la statura registrata sia inferióte a 180 cm.;
b. un intervallo che contiene il 99% delle misure effettuate;
c. la probabilitá che un ragazzo alto 178 cm. sia registrato come inferióte a 175
cm.
3.12.
Defínizione 125. Sia X una v.a. discreta o continua. Si dice momento r-esimo di X
(r = 1 , 2 , 3 , . . . ) il numero
= E(X^),
se questo esiste finito; si dice momento r-esimo centrato di X (r = 1 , 2 , 3 , . .
. ) il
numero
p , = E ((X - EX)^),
se questo esiste finito.
Ad esempio,
= EX , p 2 = VarX. Si puó dimostrare che se una v.a. X ha
momento r-esimo finito
allora esistono finiti tutti i momenti di ordine inferióte
(cioé p j , P 2. • • • 1 A *r-i) Inoltre, p r c finito se e solo se p ' é finito.
Si osservi anche che,
in base alie proprietá del valore atteso studiate nel §3.4.2 (variabili discrete) e
nel §3.9
(variabili continue) valgono le seguenti formule di calcólo;
Capitolo 3: Variabili aleatoria e modelli probabilistici
J2^kP x i^ k )
= E(x') =
183
se X é discreta
^ / r ^'^/x ( x ) d x
se X é continua
^ (x fe - p Y px{xk)
fir = E ( ( X - E X y ) = {
s t X è discreta
“ p y f x ( x ) dx
, /r
se X è continua
s k { X) = - % = E
pY
con p = EX,
= VarX. Si dice coefjficiente di curtosi di una v.a. X dotata di
momento quarto finito, il numero
curt(X) = ^ = E
/^2
con p = EX,
= VarX.
= Z - N(0, 1)
curt(X) = E(Z*) =
v
l — [ x*e~^^^^dx =
27t7 r
N(ß.<7^).
184
dx _ J -
X=) ■
H—
I 3x^e~^^^^dx = 3 / x^(p(x)dx = 3VarZ = 3.
V^Ju
U
II nsultato notevole trovato è che ia d istrib u zio n e n o rm a le (con q u a
lsia si m ed ia e
v a ria n za ) h a skewness u g u ate a zero e curtosi u g u ale a 3. Una densitá
più (o meno)
"appuntita" delta normale avrà quindi curtosi maggiore (minore) di 3. ^
□
Esempio 128. Indict di forma per la distribuzione esponenziale. Sia X
Allora p. = a = \ / v , e
Esp(i/).
f-^oo
(i/x — \ Ÿ ue ‘'^dx =
'
= l
^-t-OO
{t-lfe~^dt,
da cui si vede, anzitutto, che la skewness dell'esponenziate non dipende dal valore
del
parámetro u. Sviluppando (t — 1) , I'ultimo integrate si scrive come somma di
integrali
che possono calcolarsi per parti. Lasciamo I'esercizio al lettore; il risultato che
si trova
é;
s k ( X ) = 2.
(La densitá dell'esponenziate é asimmetrica, con coda a destra; difatti la sua
skewness é
positiva). II calcólo della curtosi é análogo;
r-hOO
= /
(ux - l ^ i / e ^ ^ d x —
Jo
-3 ,
in modo che esso risulti uguale a zéro per la normale; con questa definizione,
densité più (o meno)
"appuntite" della normale avranno curtosi positiva (negativa).
Capitolo 3: Varíabili aleatoria e modem probabilistici
+0O
(í -
185
= 9.
- L
B( n, p)
Po(A)
l-2p
curtosi
3
i-6p(»-p)
\/n p (l-p )
7X
n p ( l - p )
3 + i
dove
Esempi 1.
a. Modello di Bernoulli*;
e 7(0,00) ( x ) |A € (0, + o o ) } .
c. Modello normale:
/( x ; ( p , a ) )
,-(x-^i)/2a | ( ^ , a ) € R x ( 0 , + O O )
\p 2 ^ a
d. Modello gamma:
{ /(x ; ( r , A ) ) = CA.rx’’“ ‘e “ ''^7(0.oo)(x) | ( r , A ) G (0, + o o ) x (0, +
o o ) } .
Nei primi due esempi c'è un solo parametro t?, nel terzo ^
quarto
¿=(r,A).
T = g ( X i , X 2, . . . , X J ,
' II parámetro dclla bemoulliana é stato qui indicato con tt, anziché con p come di
consueto, per non
confonderlo con il símbolo p che indica la densitá discreta
188
ossia una íunzione delle osservazioni del campione. (Perció anche la legge di T
dipende dal parametro ^). Occorre rendersi conto del fatto che quando si scrivono
espressioni del tipo
> 3), P (1 < X¡ + X q + ... + X^ < 4), ecc.,
il valore della probabilitá che si calcóla dipende anch'esso dal valore del
parametro
Per sottolineare questo fatto, scriveremo talvolta
F ^ (X n > 3), ecc.
Esempío 2. Sia { X i , X 2, ... ,Xio) un campione casuale estratto da una
popolazione
bemoulliana di parametro tt. Allora
10
^X .-B aO .T rX e
i=l
La scrittura
ad esempio, significa;
"La probabilitá che Xio sia uguale a 3/10, nell'ipotesi che il valore vero del
parametro TTsia 0.5, é 0.117".
□
Análogo signiíicato ha la scrittura
E^T,
se T é una statistica.
Se r(i?) é una íunzione del parametro (o dei parametri), cioé r : 0 —> R, uno
síimatore di r (¿ ) é una statistica T che viene usata per stimare il valore vero
di r (^ ).
Lo stimatore T si dice non disíorío se
E - r = r ( ¿ ) per ogni
G 0.
Uno stimatore non distorto si dice consistente se, quando l'ampiezza n del campione
tende a oo,
Var^ T -> 0.
Esempío 3. La media campionaria come stimatore del valore atteso. Se
{ X \ , X i , . . . , Xn) é un campione casuale estratto da una popolazione di
densitá
f { x \ ¿), dotata di valore atteso p, e varianza
finiti, si ha (sempre):
E^X„ = p- Var^Xn = - a \
n
Capitolo 4: Statistics inferenziale
189
p =
cr^ = h{^).
1= 1
con lo stimatore
" fti
Si osservi che, quando si ha a che fare con una legge che dipende da due parametri
incogniti (t?i, 1^2)> la stima di i9i é un problema diverso a seconda che si
conosca giá il
valore dell'altro parametro,
oppure no. Ad esempio, T\ permette di stimare
senza conoscere nemmeno p (implicitamente, p viene stimato da X „) Se pero
conoscessimo il valore vero di p, potremmo utilizzare la statistica;
190
che, intuitivamente, dovrebbe daré una stima migliore di a^, visto che utilizza
un'informazione in piú (il valore vero di n). Si noti che se /u é incógnito,
non é una
statistica, ed é perció inutilizzabile come stimatore.
Vediamo ora se gli stimatori proposti sono corretti e consistenti.
Proposizíone 5. Sia ( X i , X 2, ... ,X„) un campione casuaie esíratto da una
popolazione di densitá f ( x \ ú ) , dotata di valore atieso ¡j, e varianza Jini
ti, e sia
= h(‘0 ). Allora:
E ^ r, =
Se inoltre esiste fin ito per ogni d anche E ^(X ‘*), allora
Var- Ti —> 0 per n —> oo,
t= l
La statistica
é quella piú comunemente usaía per stimare la varianza di una
popolazione (guando la media é incognita), e la chiameremo varianza campionaria.
é uno stimatore corretto e consistente di
purché sia verificata l'ipotesi di
esistenza del momento quarto, cioé E -(X ‘‘). (Si noti che negli esempi c e d
l'ipotesi
vale).
A campionamento effettuato il valore di 5^ é
= \2
4 =
^
t=l
p = Xn
''2 = 3Í.
2
Nel caso in cui la media della popolazione sia giá nota, invece, lo stimatore piú
naturale della varianza é Ta, che pure risulta corretto e consistente.
Si osservi che l'espressione di
differisce da quella della varianza campionaria,
introdotta nel C ap.l, per un fattore n / ( n - 1). Le formule di calcólo viste nel
Cap.l
vanno quindi modificate di conseguenza. Ad esempio, poiché
CapHolo 4: Statistica inferenziale
191
n ( ¿ X ? ) - ( E x. ) ‘
’t=i
Per il calcólo di VarTj. utilizziamo il fatto che le v.a. X f sono indipendenti.
Perció la varianza della
loro sonuna é la sonuna delle varianze, e si puó scrivere;
VarTí = ¿ ¿ V a r(A -? ) = iv aríX ^);
t=l
Var(^2) ^
- (E(A-*)) = E(A^) - 1.
- Xr^f
^ i=l
=
"i=i
' íi=l
2E(XiXr,)
+ e ( a -"„)] =
- 2Cov(Xi.X„) + i | = 1 + i - ^ ¿ C o v ( ^ i , A„).
” " ti
" ti
perché, per l'indipendenza dell v.a.
Xi,
c»v№.jr,) = { ;
Perció
ET, = l + i - í =
n n
^
n
= ^ » ’.
n
Esempio 6 . Stima dei parametrí della densitá gamma. Método dei momenti.
Consideríamo quest'altro esempio di stima, che permette di illustrare un'idea di
carattere generale. Supponiamo di campionare una popolazione di legge F (r, A).
Ricordiamo che, se X ~ F (r, A), è E X = r/A e VarX = r/A ^. Dunque in questo
caso X n è uno stimatore corretto e consistente di r/A e 5^ è uno stimatore
corretto e
consistente di r/A ^. (Si noti che in questo caso sia la media che la varíanza sono
funzioni di entrambi i parametrí). A campionamento eseguito, porremo;
= Xr,
e otteniamo
( 0 - F (0 ) - í
Gli stimatorí di r, A cosí ottenuti, sono stimatorí costruiti a partiré da
stimatori corretti
di r/A , r/A ^, ma non abbiamo alcuna garanzia che siano stimatorí corretti di r,
A. II
método illustrato in questo esempio é un caso particolare del cosiddetto método dei
momenti. dovendo stimare contemporáneamente due parametrí, si calcolano media e
varíanza campionaría, si uguagliano queste alia media e alia varíanza della
popolazione
(che sono ñinzioni dei parametrí), e si rísolve il sistema di due equazioni in due
incogníte cosí ottenuto. In generale, non c'é garanzia che gli stimatorí cosí
ottenuti
siano corretti.
□
Capitolo 4: Statistica inferenziale
193
Esercizi
4.1.
a. Calcolare Xn,
skewness e curtosi.
b. Stimare il valore dei parametri //, a, in base al campione.
c. Raggruppare i dati grezzi in 4 classi (0,1), (1,2), ecc., e calcolare le
frequenze
assolute e relative di queste classi.
d. In base al valore dei parametri stimati al punto 5, calcolare le probabilitá che
X
appartenga a ciascuna delle classi costruite al punto c, e confrontare con le
frequenze
relative. C'é un buon adattamento dei dati empirici al modello teorico?
e. 11 valore di skewness e curtosi conferma o smentisce I'adattamento dei dati
empirici
al modello teorico?
4.4.
Si consideri la famiglia di densitá continue, dipendenti dal parámetro a > 0:
/(x
(1 - x )
per X € (0,1)
altrimenti.
a. Determinare il valore della costante
per cui questa é una densitá.
b. Calcolare, in dipendenza da a , il valore atteso della legge.
c. Costruire uno stimatore del parametro a , in base a un campione casuale di
ampiezza n.
d. Stimare q , utilizzando lo stimatore precedente, nel caso in cui i dati
campionari
fomiscano x„ = 0.52.
194
¿=1
Si scrive
frit) =
S eY \ ~
N{ n, 2n).
Non dimostriamo il fatto che la legge x^(^) sia una legge r ( n / 2 , 1/2). Si noti
che
da questo fatto seguono tutte le altre affeimazioni della Proposizione, per le
proprietá
della legge F. Osservare che per n = 2 la legge x^ coincide con la legge Esp(O.S)
Indichiamo i quantili della legge x ^ ( n ) col simboloXo(^). definito dalla
relazione
a = P (Y < x l( n )) , se r ~ X^(«),
6 (0,1)
I valori dei quantili di x^(^) sono tabulati, per i primi valori di n e qualche
valore
tipico di a. Si ricordi che per n grande (diciamo n > 30) si puo usare
I'approssimazione normale, e calcolare
y/2n
- , ow ero Xû(^) -
+ n.
normale
Capitolo 4: Statistica inferenziale
195
b = Xo.05(50)
n- 5
n- 4
n =3
n^2
n =1
Densitá delle leggi x^(^) per n = 1 , 2 , 3 ,4 ,5 .
Per n = \ la densitá é iliimitata, per n = 2 é l'esponenziale Esp{0.b)
Approssimazione nórmale della legge x^(^) per n grande: qui si mostra la densitá
della legge
X^(30) e la sua approssimazione nórmale, con la densitá N{ ZQ, 60).
Un problema típico che si pone nei calcoli con i quantili della legge X '(n ), é il
seguente: data una v a. Y ~ x ^(^) e un numero q G (0,1), determinare un intervallo
(a, b) tale che
P { a < Y <b) = a.
Poiché Y assume solo valori positivi, cercheremo a,b > 0. (In altre parole,
I'intervallo
non sará un intervallp simmetrico, ( - 6 , 6 ) ) ^ ¡ pone il problema di decidere
un criterio
con cui sceglierp un intervjülo (a^b), tra gli infiniti che soddisfáno la relazione
precedente. Sólitamente, si cerca un intervallo che abbia^cot/e uguafí) ossia tale
che sia
196
P { Y < a ) = P { Y > 6) =
j r
1 —a
da cui
a = Xizoin), b =
2
X i± o (« )2
(1)
appartiene con
Ad esempio, un intervallo con code uguali a cui una v.a. di legge x^(20)
appartiene con probabilita del 95%, e
( xo.o25(20).X o.t o (20)) = (9.59,34.17).
La prossima proposizione mostra I'importanza
campionamento da una popolazione normale.
Proposizione 10. Sia X i , X 2,.. . ,Xn
popolazione di legge N { p , a “
^). Ailora:
della
legge
x ^(^ )
>^cl
1.
x^(n):
2. Se X n é la media campionaria,
^
S (^ )
3. Se Sn =
(A’i —
X ^ ( ^ - !)•
é la varianza campionaria,
•=i
(n - l ) S l
4. Le v.a.
~ X ^ ( « - !)•
(2)
197
x"(19),
1.26 -10-*
=p(y >
P { S i > 2 • 10
19 • 2 • 10-“*
1.26 - 10
= P ( Y > 30.16)
con V ~
0.05
T =
.
...................
.2.
dove Z ~ N (0 ,1 ), y ~ x ^ (^ ),
,
Per n-*
= c„ i 1 + - j
p e r i € R.
-(n+l)/2
=
lim ( l + - )
n-»oo
n/
e.
sß n '
Si osservi che per n = 1 la i(n ) coincide con la legge di Cauchy, incontrata nel
§3.9. La densitá di t{n) é una íunzione simmetrica pari, perció il valore atteso é
0
(tranne per n = 1, per cui non esiste finito). La varianza é una quantitá > 1 che
dipende da n, e tende a 1 per n —^ oo. II gráfico della densitá é una curva a
campana
simile alia A^(0 , 1), ma tendente a zero piú lentamente (come una potenza, invece
che
come un'esponenziale).
P { T < <o(n)) = a
(3)
Osservazione 14. Calcoli coi quantili della legge t di Student. Le tavole riportano
sólitamente i quantili della legge í(n ) per i primi valorí di n (ad esempio, 1 < n
< 30),
e poi per qualche valore di n piú elevato (ad esempio, n = 4 0 ,5 0 ,..., 120). Per
i
valorí intermedi, possiamo approssimare i quantili per interpolazione lineare.
Illustríamo questo método su un esempio.
Supponiamo di conoscere dalle tavole i valorí
< 0.95(30)
= 1.69726;
< 0.95(40) = 1 .6 8 3 8 5 .
Per calcolare, in modo approssimato, il valore del quantile <0.95 (33), scriviamo
l'equazione
y = mx + q
della
retta
che
passa
per
i
due
punti
(30, <0.95( 30 )), (40, <0.95( 40 )), e calcoliamo poi il valore y per i = 33:
y ~ <0.95(30 ) =
<0.95(4 0 ) - <0.95 (4 0 )
{x - 30):
4 0 -3 0
Capitolo 4: Statistica inferenziale
y-
199
<0.99 (^)
decresce al crescere di n.
Esempio 15. Calcolare il numero k tale che, se V ~ <(97), P(\Y\ < A:) = 0.95.
In base alie relazioni (3), k = <0.975 (97). Calcoliamo in modo approssimato questo
quantile, interpolando tra
<0.975(90 ) = 1.98667 e <0.975( 100) = 1.98397.
Troviamo:
I ^ 0 .9 7 5 ( 10 0 ) -
< 0 .9 7 5 (9 0 )
Proposizione 16. Sia X\,X 2 ,... ,X„ un campione casuale estrado da una
popolazione di legge N(p,a^). Allora:
Xn-P
~ i(n — 1).
s /S U ^
percio
Xn-p
Inoltre, per la Proposizione 10, punto 3,
----- ~2----- ' “ X (n - 1).
e per il punto 4, questa v.a. é indipendente da
/,/(n-l)52
t{n
(n -l) =
— 1).
X =
dove U ~ x^("г). V ~
U, V indipendenti. Si scrive X
F {m , n).
Una v.a. con legge di Fisher e positiva, essendo quoziente di v.a. positive (chi
quadro). La sua densita e una curva simile a quella delle leggi x^> e alcuni valori
dei
suoi quantili sono tabulati. Si osservi ehe, per definizione di legge di Fisher,
„
^
t//m
1
V /n
X = ZTÄi ~
D'altra parte
a = P ( X < F .( m ,n ) ) =
.) = l - p { \ <
F a {m ,n ) J
\X
\X
.)
F a { m ,n ) J
da cui
l-o = p (i <
\X
e poiche
■),
Fa{Tn,n)J
~ F (n , m ), si ha
1
Fc,{m,n)
= Fi_Q (n,m ),
Fo.o5(20,50) =
1
F o.95(50,20)-
Cercando Fo.95(50,20) nelle tavole, vediamo che questo valore non é riportato. In
compenso, troviamo:
F o.95(40,20) = 1.84; Fo.95(60,20) = 1.75.
Per interpolazione lineare tra questi due valori, otteniamo:
CapHoto 4: Statistica inferenziale
F „ .„ ( 5 0 ,2 0 ) c 1 :5 1 ^
201
= 1.795^
S\ ~ F (m - l , n - 1).
~X
1):
(n — 1 )5 |
- 1).
5?
5|
O sservazione 20. Le Proposizioni 10, 16, 19, dicono che campionando una
popolazione normale, certe quantita costruite mediante opportune statistiche hanno
una legge nota (rispettivamente; chi quadro, t di Student, F di Fisher). II
risultato
espresso dalla Proposizione 16 (che riguarda la t di Student) rimane
approssimativamente vero se la popolazione e solo "approssimativamente normale"
(come gia si e osservato); gli altri due risultati, invece, dipendono in modo piii
sensibile
dall'ipotesi di normalita dei dati. Si ricordi questo fatto, quando applicheremo
questi
risultati per fare inferenze su una o piu varianze (§§4.4.5-4.4.6).
202
4.3.1.
P = Xn,
ossia utilizziamo la statistica X„ per stimare p. Ricordiamo che, se X
S ’
e quindi
Xn- p _ Xn- P ^
^^(0,1).
a ! yjn
0.61
Allora, fissato a e (0,1), possiamo affermare che
0.61^
) = O-
o w ero
203
Xn = 178.5cm.
L'intervallo di confidenza diventa ora un intervallo numérico, non piú aleatorio;
(178.5 - 1.1956,178.5 + 1.1956) ~ (177.3,179.7).
Qual é il signifícalo di questo intervallo trovato? Possiamo dire, ancora, che con
probabüitá 0.95, p € (177.3,179.7)? La risposta é NO, perché p non é una variabile
aleatoria ma un numero (a noi incógnito): il fatto che p appartenga all'intervallo
numérico (177.3,179.7) é, semplicemente, vero o falso, ma non dipende da alcun
fenómeno aleatorio, e non ha senso, di conseguenza, parlare di probabiliíá a questo
riguardo. Si dice invece che, con una confidenza del 95%, il parametro p appartiene
alVintervaUo ( 1 7 7 .3 ,1 7 9 .7 ) , e questo intervallo numérico si chiama
intervallo di
confidenza per p , al livello del 95%, calcolato dal campione. II signifícalo di
questo
concetto si capisce riflettendo sul procedimento seguito per determinare
l'intervallo.
Abbiamo prima costruito un intervallo aleatorio che contenesse, con probabüitá
0.95, il
valore di p. (Si noti che, in questa affermazione, aleatorio é l'intervallo, non il
parametro). Quindi abbiamo eseguito il campionamento e calcolato, a partiré da
un'opportuna statistica (in questo caso X „) i valori numerici assunti dagli
estremi
dell'intervallo. A questo punto non sappiamo se l'intervallo numérico contenga o
non
contenga, effettivamente, il valore vero di p. Se pero pensassimo di eifettuare un
gran
numero di campionamenti, e per ciascuno di questi calcolassimo, con questo
procedimento, un intervallo numérico, otterremmo un gran numero di intervalli di
cui,
per la legge dei grandi numeri, ci aspettiamo che all'incirca una frazione 0.95
contenga
il valore vero di p. Questo é il motivo per cui affermiamo che, con una confidenza
del
95%, il nostro intervallo contiene p. In reaitá pero noi non effettuiamo tanti
campionamenti, ma uno solo, e otteniamo un único intervallo numérico, che contiene
o
non contiene il valore di p (e noi non lo sappiamo).
La prossima fígura illustra questo concetto con un altro esempio numérico.
Supponiamo che, per una certa popolazione nórmale, il valore vero del parametro p
sia
25, e supponiamo di estrarre per 20 volte un campione casuale, determinando ogni
volta l'intervallo di confídenza per p al livello del 95%. II grafíco rappresenta i
20
intervalli di confídenza ipoteticamente ottenuti; 19 di questi (ossia il 95% del
totale)
contengono il valore vero del parametro, mentre uno non lo contiene. Se non
conosciamo il valore vero del parametro p, non potremo mai dire con certezza se un
particolare intervallo di confídenza contiene o non contiene questo valore.
204
0)
c
o
*2.
E
(0
o
■o
2
o
E
3
205
Xn-ji
afy/n
iV (0 ,l),
si ha
\X r.-n\
< 2 {i-fQ)/2 I = a
a/y/n
e quindi, con probabilité q .
|-^n
'2(l+o)/2
/— •
y /n
X fi
■2( 1+ o
)/2
2 ( i + q )/2
)'
p = X „± Z ( i +q)/2 - ^ =
y /n
X n ± E ,
al livello 100a%.
Poiché
(4)
E = 2(i+û)/2—
V^
(5)
p =
x „±Z ( i +^)/2-4=
y n
Abbiamo ottenuto un intervallo più ampio, quindi una stima più imprecisa: questo è
il
prezzo da pagare per una stima più afiidabile.
Supponiamo ora (nello stesso esempio) di aver estratto un campione di 500
individui, anziché 100, e di aver trovato (ancora) x„ = 178.5. L'intervallo di
confidenza al livello del 95% sarebbe ora;
Ct 1
p = x„±Z (n.a)/2-4= = 178.5±1.96 • - 7 = ~ (177.9,179.1).
y /n
y/500
Si confronti con l'intervallo calcolato con un campione di 100 individui:
(177.3,179.7).
Il miglioramento puô apparire piccolo, rispetto al fatto che abbiamo quintuplicato
I'ampiezza del campione.
Se volessimo ottenere un intervallo di confidenza al livello del 95%, con un errore
massimo di 0.5 (ossia ampiezza dell'intervallo < 1) come dovremmo scegliere n?
Dalla (5) leggiamo
'> = ( 2 , , + „ ) / 2 | ) ' = ( i . 9 6 . ^ )
= 5 7 1 .7 8 .
207
confidenza sarebbe:
p = x „ ± 2( i +o;/2 - 7 = = x„±0.4999.
4.3.2.
P^^-°^{\Xr, -p\<E)=a.
In questo caso, pero.
con a incognita; perció (X „ - p) non ha una legge nota, e non possiamo determinare
E in base ad o direttamente. Occorre invece sfruttare il fatto che
t(n — 1)
(v. Proposizione 16, §4.2). Perció
/^1
>(íl.o) í( l^ n - p\
< t(
l+o)/2
(n - 1)
= Q,
V
da cui otteniamo \'intervallo di confidenza al livello 1 0 0 a % per la media p di
una
popolazione normale di varianza incognita:
52
E = í(|+o)/2(n - l ) y
che non é, come nel caso in cui la varianza é nota, una costante, ma una variabile
208
^ = í(l+a)/2(” - l ) ; ^ -
4.3.3.
Xn-P
~ í(n — 1).
•MT^
Come abbiamo osservato nel §4.2, se la popolazione non è normale ma la sua densità
non è troppo asimmetrica, e inoltre l'ampiezza n del campione è abbastanza grande
(diciamo n > 30), la quantité
X^-P
209
Si rícordi anche che, se n é moho grande (ad esempio n > 120), si puó fare
l'ulteriore approssimazione
í(l+o)/2(” - 1) ~ 2( i +o)/2.
Se la varíanza della popolazione si suppone nota e il campione é numeroso
(n > 30), si puó usare l'approssimazione nórmale;
Xn-p
~7N r(0,l).
O jy /n
In questo caso l'intervallo di confidenza approssimato, al livello del 100a%, è
^
P ~ -^ni'2’(l4-Q)/2
^
y/n
4.3.4.
Un caso particolarmente importante di stima della media per una popolazione non
nórmale (e grandi campion!) é quello in cui la popolazione é bemoulliana. Si vuole
quindi stimare il valore del parametro p, che rappresenta la frequenza relativa
(proporzione) con cui una certa caratteristica si presenta sugli individui di una
certa
popolazione.
Esempio tipico di questa situazione é il problema del sondaggio d ’opinione: si
vuole stimare la proporzione della popolazione complessiva che "é d'accordo con
l'opinione X ”, osservando il valore che questa proporzione ha su un campione di n
individui.
Un altro esempio di questa situazione é il seguente. Supponiamo che un prodotto
venga venduto in lotti números!; il produttore vuole poter garantiré al cliente che
la
proporzione di pezzi difettosi in un lotto non superi un certo valore prefissato.
Occorre quindi determinare, attraverso osservazioni campionarie, un intervallo di
confidenza per la proporzione p dei pezzi difettosi in un lotto, ed eventualmente
intervenire sulle modalitá di produzione fínché il limite di confidenza superiore
per il
parametro p scenda al di sotto della soglia voluta. Questo sará tanto piú
impegnativo
quanto piú alto é il livello di confidenza fissato dal produttore (o dalle norme a
cui il
produttore deve sottostare).
Sappiamo che, se { X \ , X 2,... , Xn) é un campione casuale estratto da una
popolazione bemoulliana B(p), nelle ipotesi in cui vale l'approssimazione nórmale,
é
pp\
\Xn-p\
< 2(|+o)/2
y/p{l - p ) /n
- Ú.
p ( i - p)
mediante
n
^Xnil-Xr,)
n
In definitiva, otteniamo
P — ■^nÍ'^(l+Q)/2
mediante
211
Con una confídenza del 95%, una frazione della popolazione compresa tra lo 0.71% e
il 5.96% rísponderebbe "si" alia domanda che abbiamo posto a un campione.
□
Osservazione 28. Precisíone della stim a e ampiezza del cam pione. Si osservi che
l'intervallo di confídenza per p é, anche in questo caso, un intervallo simmetrico,
del
tipo
P = Xn±E,
con
E = 2(1+q)/2
Anche in questo caso, con gli stessi dati campionari e la stessa ampiezza del
campione,
livello di confídenza piú alto signifícherá intervallo piú ampio, quíndi maggior
imprecisione. Si noti che, anche se l'errore E é una varíabile aleatoria, sappiamo
che
0 < Xn < 1, perció X „ (l - Xrx) < 1/4,
(come si deduce dal grafíco della parabola / ( í ) = í( l — í) per t 6 [0,1]) e
possiamo
maggiorare l'errore:
E < E q = 2(1+o)/2
2 y /ñ '
E' possibile quindi físsare a priori a e l'errore massimo E q che siamo disposti a
commettere, e determinare l'ampiezza n necessaria per ottenere la precisione
voluta;
2Eo ) -
Esempi
Esempio 29. Un campione di 100 osservazioni e estratto da una popolazione normale
di media p incognita, la cui deviazione standard si assume a = 5 grammi. La media
campionaria e
= 29.4^.
a. Costruire intervalli di confidenza per p al livello di confidenza:
a). 90%; b) 95%; c) 99%.
b. Se la deviazione standard non fosse nota a priori, ma dal campione si fosse
trovato
3n = ^9, cosa cambierebbe?
c. L'ipotesi che la popolazione sia normale e essenziale per giustificare il
procedimento seguito?
a. L'intervallo di confidenza per la media e:
fi = X„Í2(14-q)/2
y/n
— 29.4iZ ( i+o)/2
10
■
212
Per a = 0.90,
(28.112,30.688).
Si osserva che l'intervallo é di ampiezza maggiore, se maggiore é il livello di
conñdenza.
b.
Se la deviazione standard non é nota, ma é stimata da s„, occorre utilizzare la
legge t di Student, con 99 gradi di libertá. I relativi quantili si possono
determinare per
interpolazione lineare a partiré dai quantili di ¿(100) e ¿(90):
io(99)
- 90) + i„(90) =
= 0.9¿,»(100) + 0.1¿o(90).
p =
x „±¿0
yn
10
L'intervallo è
(28.4,30.4),
che, come si vede, è un po' più ampio di quello calcolato, sempre al livello del
95%,
supponendo a nota, perché ta{n) > Za. Questo risultato è ragionevole: avendo, a
priori, informazioni più scarse ( a incognito), la stima risulta più imprecisa
(intervallo
più ampio).
Si osservi che valutando, corne abbiamo fatto, i limiti di confídenza con
l'approssimazione al primo décimale, l'interpolazione lineare era in realtà
superflua.
considerare ¿0.975( 99 ) ~ ¿0.975( 100) avrebbe fomito lo stesso risultato.
c.
Se la popolazione non è normale, poiché il campione è numeroso (n > 30),
possiamo ancora usare lo stesso procedimento del punto a o b, rispettivamente, a
seconda che a sia nota oppure sia stimata da d„.
□
Esempio 30. Supponiamo che si voglia stimare la proporzione di elettori che approva
l'operato del capo del govemo. Su un primo campione di 130 persone intervistate nel
mese di maggio, 75 erano favorevoli. Su un secondo campione di 1056 persone
intervistate a ottobre, 642 erano favorevoli.
a. Per ciascuno dei due campioni, si costruisca un intervallo di confídenza al
livello
del 95% per la proporzione degli elettori favorevoli al capo del governo
b. Si confronti la precisione delle due stime effettuate. (O w ero si confrontino
le
ampiezze degli intervalli di confídenza).
Capitolo 4: Statistica inferenziale
213
75
P=
9 6
130
55
. J »30 j3 0 ^ o.57692±0.08493;
V 130
l'intervallo é circa;
(0.492,0.662),
di ampiezza 0.17. Ció signifíca che, con una conñdenza del 95%, la percentuale
degli
elettori che é "favorevole" é compresa tra il 49.2% e il 66.2% (la diíTerenza tra i
due
valori é di ben 17 punti percentuali!)
Nel secondo caso.
n = 1056; Xn =
642
1056
p = T -r r r ± 1 .9 6
642
414
1056 ' 1056
1056
642
1ÖM’
= 0.60795±0.02945;
l'intervallo é circa;
(0.5785,0.6374),
di ampiezza 0.0589. La percentuale é compresa tra il 57.85% e il 63.74%, con una
confídenza del 95%. L'ampiezza dell'intervallo é di 5.89 punti percentuali, cioé é
moho
inferiore al precedente; la seconda stima é piú precisa.
c.
Ampiezza di un punto percentuale significa ampiezza di 0.01 per la
proporzione. Al livello del 95% occorre allora scegliere
Per avere una stima della precisione voluta occorre intervistare almeno 38416
personO
Esempio 31. Negli ultimi 9 mesi si sono verificati 30 guasti a un certo impianto, e
si
sono registrati i giomi in cui ció é successo. Per la variabile T = tempo tra due
guasti
successivi (misurato in giomi) si é calcolato, in base a questi dati,
Xn = 9.07; s„ = 9.45.
Supponendo che la variabile T segua una legge esponenziale di parametro A, si
fomisca un intervallo di confídenza per A, al livello del 95%.
214
!
p.
X n ± t ( \ + a ) / 2 ip.
- l)y
9 45
= 9.07±io.975(29)—^
=
E = i( i + a ) / 2 ( 7 9 ) ^ = 20000 per
Y 71
^
20000 - v/80
=
99000
=
q
) / 2 per
Q = 0.9254,
ow ero un livello di confidenza del 92.54%.
Capitok) 4: Statistica inferenziale
215
Esercizi
4.5.
In ciascuno degli esempi successivi, costruire un intervallo di confidenza al
livello del 95% per la media p di una popolazione normale la cui deviazione
standard si
assume pari a a = 14.5:
n = 36
Xn = 100.25
n = 100
Xn = 99.75
n = 500
x„ = 100.75
n = 1000
x„ = 100.5
4.6.
Un ispettore vuole stimare il peso medio del contenuto in una partita di
barattoli di conserve di 450p. Un campione di 200 barattoli viene percio
ispezionato.
Media e deviazione standard calcolate sul campione sono x„ = 447p e
= 9ff.
Costruire un intervallo di confidenza al livello del 99% per il peso medio p su
tutta la
partita.
4.7.
Si sono fatti dei test per confrontare l'affidabilitá di 3 differenti marche di
floppy
disk. Per ciascuna delle 3 marche, A ,B ,C , si é considerate un campione di 100
esemplari, che sono stati sottoposti a varíe prove. Per ogni dischetto si é
misurato il
tempo, in ore, dopo il quale si é verificato il primo errore. I dati sono i
seguenti:
Marca A
Xn = 49h
= 8.2h
Marca B
Xn = 55h
$n = lO .lh
Marca C
Xn = 53/i
= 7.5/1
affermare, con una confidenza del 90%, che la percentuale di italiani che
preferiscono il
mare é compresa (approssimativamente) tra il 69% e il 71%?
4.11. In un campione casuale di 500 abbonati al telefono, si é accertato che il 20%
utilizza il servizio di fílodifiusione. Sia p la frequenza relativa di coloro che
usano la
fílodiñlisione nella popolazione costituita dalla totalitá degli abbonati.
a. Si costruisca un intervallo di confidenza (approssimato) al livello del 95% per
il
parámetro p.
b. Si supponga ora che I'indagine campionaria non sia ancora stata eseguita. Come
si
deve scegliere I'ampiezza n del campione per essere certi che (qualunque sia
I'esito
dell'indagine campionaria) I'intervallo di confidenza per p, al livello del 95%,
abbia
ampiezza < 0.01?
4.12. Per stimare il tempo medio richiesto per assemblare un certo componente di
computer, 40 tecnici di una ditta elettronica vengono cronometrati mentre svolgono
questa operazione, ottenendo una media di x„ = 12.73 minuti, con una deviazione
standard di s„ = 2.06 minuti.
a. Costruire un intervallo di confidenza al livello del 95% per il tempo medio di
assemblaggio.
b. Calcolare I'errore massimo che si commette stimando la media con
al livello di
confidenza del 99%.
4.13. In uno studio sull'inquinamento atmosférico effettuato da una certa stazione
sperimentale, si sono registrati, su 8 diversi campioni d'aria, i seguenti valori
di una
certa sostanza tossica (in microgrammi per metro cubo):
2.2; 1.8; 3.1; 2.0; 2.4; 2.0; 2.1; 1.2.
Assumendo che la popolazione campionata sia nórmale, si stabilisca un intervallo di
confidenza per la media, al livello del 95%. L'ipotesi di normalitá della
popolazione é
essenziale, in questo caso, per giustificare il procedimento seguito?
Ci sono molte situazioni in cui una indagine campionaria viene eseguita per
premiere
una decisione che coinvolge la nostra opinione su quale sia il valore vero di un
parametro incognito. Introduciamo questo problema mediante un esempio.
Esempío 33. In un impianto industríale si produce una certa sostanza chimica, ed é
essenziale tenere sotto controllo il grado di impuritá presenti nel prodotto
finale.
Un'impurítá fino a 150 parti su un milione é accettabile, una quantitá maggiore no.
Perció vengono prelevati ed esaminati dei piccoli campioni della sostanza prodotta,
su
cui si misura il grado di impuritá. Sia X la quantitá di impuritá (misurata in
parti per
milione, ppm), presente in un'ampolla di questa sostanza prelevata in un momento a
caso dal prodotto finale. Supponiamo che X sia normalmente distríbuita e che, in
base
a studi precedenti, si possa assumere la deviazione standard parí a a = 20ppm. Una
volta estratto un campione di n ampolle e calcolata la quantitá media X„ di
impuritá
presenti, occorre prendere una decisione: il processo si considera "sotto
controllo".
Capitolo 4: Statistica inferenziale
217
P^ i Xn < k ) <
< k)
(piú grande é il valore vero di p, meno probabile é che X„ assuma valori piccoli).
Quest'ultima quantitá aumenta all'aumentare di k. Quindi ridurre la massima
probabilitá di commettere il primo errore aumenta la massima probabilitá di
commettere il secondo.
Le due osservazioni falte implicano che dobbiamo anziiutto decidere quale dei due
errori consideriamo piú grave. Se riteniamo che il processo vada fermato e
riaggiustato solo in caso di grave necessitá, fisseremo una soglia k piuttosto
alta; se
invece vogliamo essere moho severí nel controllo, fisseremo una soglia k piú bassa.
Supponiamo di considerare piú grave il primo errore. Questo equivale a porsi dal
seguente punto di vista:
la nostra ipotesi é che il processo sia sotto controllo, owero che sia p < 150.
Siamo
disposti ad abbandonare questa ipotesi solo se i daíi campionari ci forniscono una
forte evidenza del contrario.
218
Abbiamo giá osservato che, se /i < 150, cíoé il processo é sotto controllo, la
probabilitá di rítenerlo erróneamente íliorí controllo é minore o uguale di
>
k).
> k ) = 0.05,
(6)
avremo che la probabilitá di commettere il primo errore é < 0 .0 5 (un margine che
in
molti casi viene ritenuto accettabile). II numero k si puó ricavare dall'identitá
(6)
ricordando che per ipotesi é a = 20, per cui, per p = 150, si ha
Xn - 150
2 0 /y ñ
N(0,1).
20
v/ÏÔ
20.95 + 150
> 160.4".
219
Se H q è falsa...
Decisione corretta
Decisione corretta
Se i/o è vera...
e noí rifíutiamo Hq.
e noí non rifíutiamo Hq.
L'errore del I tipo è quello consideratopiü grave. Quesío significa che l'ipotesi H
q
va formulata in modo che quello che noi riteniamo l'errore piü grave coincida con
l'errore di I specie. Detto in altrí termini, l'ipotesi nulla è quella che noí
vogliamo
rifíutare solo di fronte a "prove schiaccianti".
Una analogia che puó chiarire le idee precedent! è quella del processo a un
imputato. Se una persona viene processata, è perché qualcuno pensa che sia
colpevole;
tuttavia, il diritto vuole che la persona sia ritenuta innocente fino a prova
contraria.
L'ipotesi nulla è dunque H q : "L'imputato è innocente", l'ipotesi alternativa è
H\ : "L'imputato è colpevole". L'errore del primo tipo è condannare un innocente;
l'errore del secondo tipo è assolvere un colpevole. II presupposto garantista è che
l'imputato sia condannato solo in presenza di forti prove a suo carico; altrimenti,
va
assolto. "Non rifíutare l'ipotesi" è l'analogo di "assolvere l'imputato per
insufficienza di
prove"; non implica che noi siamo fortemente convinti della sua innocenza.
Scegliere
come ipotesi nulla la H q ; "L'imputato è innocente" significa ritenere che
condannare
un innocente sia un errore piú grave che assolvere un colpevole.
Se l'imputato è innocente... Se l'imputato è colpevole...
. . .e noi lo condanniamo; Errore del I tipo
Decisione corretta
...e noi lo assolviamo;
Errore del II tipo
Decisione corretta
Esempio 35. (C riterio di scelta dell'ipotesi nulla). Formalizzare le seguenti
situazioni scegliendo l'ipotesi nulla, l'ipotesi alternativa e il tipo di test.
a. II contenuto dichiarato delle bottiglíe di acqua minerale di una certa marca é
990ml. Un'associazione consumatori sostiene che, in realtá, le bottiglie
contengono, in
media, una quantitá inferiere d'acqua.
b. Due amici giocano a testa o croce; uno dei due, pero, ha il sospetto che la
moneta sia truccata, e decide di registrare un gran numero di esiti di lanci per
verificare
questa sua convinzione.
c. Un ingegnere suggerisce alcune modifíche che sí potrebbero apportare a una
linea produttiva per aumentare il numero di pezzi prodotti giomalmente. Si decide
di
sperimentare queste modifíche su una macchina; se i risultati saranno buoni, si
applicheranno le modifíche anche alie altre.
(Lo studente é invitato a riflettere per proprio conto e proporre la propria
soluzione, prima di proseguiré la lettura).
220
R = { ( i i , X 2, . . . , x „ ) : T ( x i , x 2, . . . , x „ ) e /} .
Nell'Esempio 33, era T = X „, I — (160.4, + 00 ) e
ü = {( x i , X21... 1
^ (160.4, “hoo)}.
P^( T( XuX2, . . . . X „ ) e l ) .
Se H q é un'ipotesi semplice, ossia del tipo ^ = i2o>
del primo tipo é
pá»(T(X,,X2,...,X„)€/).
Se pero H q é un'ipotesi composta, cioé H q : ^ e Q Q con 0 o non ridotto a un
punto,
non ha senso parlare deiia probabilitá di rifíutare l'ipotesi se questa é vera:
infatti, per
ogni ^ € & o (per cui H q é vera) c'é una probabilitá diversa di rifíutare H q. Si
definisce
ampiezza del test la quantitá
a=
sup P \ T { X u X 2, . . . , X r , ) e I ) ,
00
221
Hq
p = po
p < no
n > no
Hx
n > Po
n < Po
dove po é un valore físsato (es. po = 0). Nei 3 casi detti, il test sará,
rispettivamente,
del tipo:
Si rifíuti i/o se jXn - /xo| >
Si rifíuti H q se Xn > k]
Si rifíuti H q se Xn < k.
Nel primo caso il test si dice bilatero, o a due code, negli altri due casi si dice
unilaiero, o a una coda (per via della forma che ha l'insieme I: unione di
intervalli, oppure un intervallo solo). Fissato il livello di signifícativitá a, si
determinare k, nell'ipotesi che sia X ~ N {y,,a^) con a nota. Si trova, nei tre
rispettivamente,
k
— ■2’1—o / 2
r~ y ^
y jn
7^
y /n
™— t^O
^ 1 —0
P {Z <
Za)
=a
P (Z > z\-a) = a
P{\Z\ < 2( i +q)/2) = Q-
r~‘
y /n
test
due
puó
casi
222
Questo tipo di test si chiama test z, perché coinvolge la legge normale standard.
Xn - Pq
a/y/n ’
Ho
P = Po
Hx
P < Po
p>Po
p > Po
p < Po
Po
Rifíutare H q se
\z\ > Zx-a/2
2 > Zx-a
Z < -Zx-Q
Esem pio 38. Da una popolazione nórmale di media incognita e deviazione standard
a = 2 si estrae un campione di ampiezza 10, per sottoporre a test I'ipotesi nulla
H q : p, = 20.
a. Si dica qual é la regione critica, al livello deH'1%, 5%, 10%, per questo test.
b. Supponendo di aver estratto un campione per cui é
= 18.58, si tragga una
conclusione, a ciascuno dei 3 livelli di signifícativitá.
con
2^1- 0 / 2
' 2.5758
= ^ 1-96
1.6449
per a = 0.01
p e ro = 0.05
per a = 0.1.
b. Se x„ = 18.58, 2 =
|x„ - 20| = 2.2452, e la conclusione che si trae, in
ciascuno dei tre casi, é;
1.
I dati campionari non consentono di rifiutare I'ipotesi nulla, al livello di
signifícativitá deiri% .
2. I dati campionari consentono di rifíutare I'ipotesi nulla, al livello di
signifícativitá del 5%.
3. I dati campionari consentono di rifíutare I'ipotesi nulla, al livello di
signifícativitá del 10%.
Come si vede, la decisione che si prende non dipende solo dai dati campionari, ma
anche dal livello di signifícativitá físsato. In questo caso, la discrepanza tra la
media
campionaria (18.58) e il valore ipotizzato del parametro ( 20) viene ritenuto
statisticamente signifícativo al livello del 5% e del 10%, ma non al livello dell'l
%.
Questo significa che se il valore vero del parametro é 20, la probabilitá di
ottenere,
per effetto delle oscillazioni casuali, uno scostamento della media campionaria dal
Capitolo 4: Statistica inferanziale
223
Q = 0.0248.
(II numero P {Z < 2.2452) é stato calcolato col computer). Questo significa che il
livello di significativitá del 2.48% é quello che, con i dati campionari che
abbiamo
ottenuto, fa da spartiacque tra la decisione di rifiutare I'ipotesi e quella di non
rifiutarla.
E' il piú piccolo livello a cui i dati consentono di rifiutare I'ipotesi. In altre
parole,
0.0248 é la probabilitá, calcolata prima di eseguire il campionamento, che,
nell'ipotesi
che sia p = 20 , si osservi, per efíetto del caso, una discrepanza tra la media
campionaria e il suo valore ipotizzato maggiore o uguale a quello che abbiamo
effettivamente riscontrato. Questo valore si chiama p-value.
Defínízione 39. In un test di ipotesi, dopo che si é effettuato il campionamento e
si é
calcolato il valore della statistica necessaria ad eseguire il test, si dice p-
value il
numero parí al minimo livello di significativitá a cui i dati campionari consentono
di
rifiutare I'ipotesi nulla. Questo numero si puó interpretare anche come la
probabilitá,
calcolata prima di eseguire il campionamento, che, supponendo vera I'ipotesi nulla,
i
dati campionari fomiscano una discrepanza dal loro valore ipotizzato parí almeno a
quello che abbiamo osservato nel campionamento.
Un p-value quasi uguale a zero significa che siamo praticamente certi di non
sbagliare rifiutando I'ipotesi; un p-value dell'ordine dei consueti livelli di
significativitá
(cioé 0.01, 0 .0 5 ...) é "imbarazzante", in quanto indica che la decisione se
rifiutare o
no I'ipotesi é crítica; difatti, dipende in modo cruciale dalla scelta del livello
di
significativitá. Un p-value vicino a 1 indica invece che, se scegliessimo come
ipotesi
nulla quella che abbiamo scelto come ipotesi alternativa, il test porterebbe a
rifiutare la
224
nuova ipotesi nulla, cioé la vecchia ipotesi alternativa; in questo caso quindi il
test ci
consente di ritenere, con una buona fiducia, che I'ipolesi nulla vada accettata. ■
II p-value puo essere difficile da calcolarsi con precisione usando le tavole, ma
viene di consueto fomito dai programmi statistici. Anzi, sólitamente i pacchetti
software statistici non chiedono, tra i dati, quale livello di significativitá si
sceglie, ma
fomiscono il p-value, che permette di trarre la conclusione (rifiutare/non
rifiutare)
qualunque sia il livello scelto. Questo non ci esime pero dal fissare a priori il
livello a
che intendiamo usare. Diversamente, potremmo "far dire al test", a posteriori,
quello
che vogliamo!
Dopo aver illustrate le idee fondamentali sui test di ipotesi servendoci di
quest'unico esempio (il test sulla media di una popolazione nórmale con varianza
nota),
nei prossimi paragrafi illustreremo brevemente vari altri tipi di test di ipotesi
di uso
comune. Passeremo in rassegna i seguenti test:
I test sulla media di una popolazione (nórmale o qualsiasi);
2 . test sulla frequenza, per una popolazione bemoulliana;
3. test sulla differenza tra le medie di due popolazioni normali;
4. test sulla differenza tra le ftequenze di due popolazioni bemoulliane;
5. test sulla varianza di una popolazione nórmale;
6 . test sul rapporto tra le varianze di due popolazioni normali.
II lettore é invitato a non perdersi nella casistica complessa che si puo ottenere
(test
unilatero, bilatero...) ma a fissare alcune idee uniftcanti. Lo schema di lavoro
che
abbiamo tracciato nel caso del test su una media, rimane valido in generale:
1. Scegliere I'ipotesi nulla e I'ipotesi alternativa; solo la riflessione sul
problema
concreto in esame puo guidare in questo.
2 . Scegliere la statistica per stimare il parámetro su cui si esegue il test, e
decidere
la forma della regione critica. La scelta della statistica é molto naturale; per
stimare una
media o una frequenza si userá
per stimare una varianza si userá 5^, vedremo poi
come procederé per la differenza tra due medie o il rapporto tra due varianze. La
forma della regione critica segue poi naturalmente dalla statistica usata e
dall'ipotesi
nulla scelta.
3. Scegliere il livello di signifícativitá.
4. Determinare la regione critica. Questo é il punto piú "técnico"; occorre infatti
costruire, mediante la statistica utilizzata come stimatore ed eventualmente altre
statistiche o parametri noti, una v a. la cui legge sia nota. Solo cosí dal livello
a si puó
risalire alia regione critica. Ripercorreremo qui alcuni ragionamenti giá visti nel
calcólo
degli intervalli di confídenza.
5. Eseguire il campíonamento.
6 . Prendere la decisione, eventualmente corredando la decisione presa con
l'indicazione del p-value, che ne chiarisce il grado di affidabilitá.
4.4.2.
Volendo eseguire un test sulla media di una popolazione normale con varianza
incognita, seguiremo la stessa idea generale che nel caso della varianza nota; se
ad
esempio è
H q : p < po,
Capitolo 4: Statistica inferenziale
225
'
- P-o
~ i(n - 1).
S J ^
> k) = a
purché
k = p o + i l -a(n - 1) —
y/ n
In altre parole, questa volta occorre calcolare in base ai dati campionari la
quantité
t =
Xn
PO
Po
Ho
P = Po
p<po
P>Po
Hx
M ^ Mo
P > Po
P<P0
Rifiutare Ho se
\t\ > U - a / 2 { n - 1)
t > ii-o (n - 1)
t <
- 1)
Xn - p o
SJy/^
t{n — 1)
4.4.3.
Possiamo ripetere per il test di ipotesi gran parte dei ragionamenti visti nel
§4.3.4 per il
calcólo degli intervalli di confidenza per la frequenza di una popolazione
bemoulliana.
Volendo sottoporre a test l'ipotesi nulla
Po
-Po)/n
quando p = po. Percio calcoleremo questa quantita in base ai dati del campione e la
confronteremo con I'opportuno quantile della legge normale standard. Per la
verifica
delle condizioni di applicabilita dell'approssimazione normale, rimandiamo a quanto
detto nel §4.3.4 e ai prossimi esempi.
Xn-Po
y/poi^ - P o ) /n '
H,
p ¥^ po
P>Po
P<Po
Rifiutare H q se
Questa procedura è valida purché risulti nx„ > 5 e n ( l —Xn) > 5; altrimenti il
campione estratto non è sufficientemente numeroso per giustificare
l'approssimazione
normale.
Capitoto 4: Statistica inferenziale
227
Esempi
Esempio 40. II contenuto nomínale delle bottiglie di una certa bibita é di 330ml.
Scegliendo un campíone casuale di 20 bottiglie, si riscontra un contenuto medio di
328ml, con una deviazione standard di 3.2ml. In base a questi dati, si puo ritenere
che
si tratti di una frode deliberata?
Assumiamo che la quantitá contenuta in una bottiglietta segua una distribuzione
nórmale. Si tratta di eseguire un test, al livello del 5% (ad esempio) sull'ipotesi
nulla;
H q \ n > 330.
(II presupposto é che il produttore va ritenuto innocente finché i dati non
fomiscono
una forte evidenza statistica contraria). II test sará del tipo "Si rifiuti H q se
x „ < k ”.
Poiché la varianza non é nota, si tratta di un test t. Calcoliamo la quantitá
t =
Xn - po
s „ /v / ñ
328 - 330
3.2/y/^
= -2.7951.
(dove T ^ <(19)). Questo signifíca che ín base ai dati si puó rifíutare l'ipotesi
non solo
al livello del 5%, ma anche al livello deH'1% o dello 0.6% (ad esempio).
□
Esempio 41. Un lotto di 5000 pezzi viene ritenuto inaccettabile se contiene almeno
1'8% di pezzi difettosi. Per decidere se accettare o no il lotto, si esamina un
campione
di 100 pezzi. Se tra questi si trovano 9 pezzi difettosi, il lotto va rigettato o
no?
Sí tratta qui di eseguire un test sul parametro p di una popolazione bemoulliana.
(Si noti che la legge esatta del numero di pezzi difettosi, ín un campione di 100
estratto
da un lotto di 5000, é una legge ipergeometrica; tuttavia, poiché l'ampiezza del
campione é meno di 1/10 dell'ampiezza della popolazione, possiamo usare
l'approssimazione binomiale). L'ipotesi nulla é
Ho : p < 0.08 "dal punto di vista del produttore"
mentre e
H q : p > 0.08 "dal punto di vista dell'acquirente".
(Si rifletta su questo fatto!) Poniamoci dal punto di vista del produttore, ed
eseguiamo
un test al livello del 5%. II test sará del tipo "Si rifíutí H q se
> k". II campione é
abbastanza numeroso da consentiré l'uso dell'approssimazione nórmale, infatti:
z =
Xn - PO
\/p t)(l - Pt»)/n
0.09 - 0.08
= 0.3686.
x/Ó ^Ó TÓ W ÍÓ O
Poiché 0.05 = P { Z > 20.95), confrontiamo z col quantile 20.95 = 1 645. Poiché
z < 20.95, i dati non consentono di rifiutare, al livello del 5%, I'ipotesi nulla:
il lotto non
va puo essere rígettato.
Si osservi che, se ci fossimo posti "dal punto di vista dell'acquirente", il test
sarebbe
stato del tipo "Si rifiuti H q se x„ < fc", con k opportuno, ma certamente minore
di
0.08. Perció, con un dato campionarío x„ = 0.09, non avremmo rifmtato I'ipotesi di
inaccettabilítá: perció avremmo rígettato il lotto.
Si vede quindi come nei casi crítici, in cui mancano "prove schiaccianti" sia a
favore sia contro un'ipotesi, diventa determinante, nella decisione che si prende,
il
presupposto da cui si é partiti, ossia la scelta fra H q e H\ . ribadiamo ancora
una volta
quindi, che nella formalizzazione di un problema, la scelta di quale ipotesi
chiamare H q
e quale chiamare H\ non é puramente fórmale, ma comporta un nostro giudizio sul
problema in esame. Calcoliamo il p-value, nel test eseguito dal punto di vista del
produttore:
Q
Signifíca che, assumendo p < 0.08, c'é una probabilitá del 35.6% di trovare, su un
campione casuale di 100 pezzi, almeno 9 pezzi difettosi (come a noi é capitato):
siamo
quindi in un caso crítico in cui non possiamo rífíutare I'ipotesi che il lotto sia
"buono",
ma rímane comunque il sospetto che non lo sia.
Con gli stessi dati, il p-value, nel test eseguito dal punto di vista
dell'acquirente é;
Q = P { Z < 0.3686) = 1 - 0.3562 = 0.6438.
Esempio 42. Dall'esperienza passata é noto che il numero di rapine che ogni
settimana
aw engono in una certa cittá segue una legge di Poisson di parametro 1. Se nel
corso
dell'anno passato ci sono state 85 rapine (1 anno = 52 settimane), si puó affermare
che
l'entitá del fenómeno é cresciuta in modo significativo? Per ríspondere, si faccia
un
test, al livello dell'l%, sull'ipotesi nulla che il parametro non sia cresciuto.
Sia X il numero di rapine settimanali nella cittá. Si suppone X
sottoporre a test I'ipotesi nulla
P q{X), e si vuole
Hq : X < 1 .
(O w ero, ci interessa vedere se é possibile affermare con sicurezza che il
parametro sia
> 1). Le osservazioni fatte su 52 settimane danno una media campionaria pari a
x„ = 85/52. Non é nota la varíanza campionaria ma, se X segue la legge di Poisson
Po(A), la sua varíanza é X. Perció, nel caso estremo dell'ipotesi nulla, A = 1, si
ha
X n-l
~ iV ( 0 ,l) .
y /ÍJ ñ
Calcoliamo
Capitolo 4: Statistica inferenziale
229
II test, al livello deH'1%, é; "Si rifiuti I'ipotesi se 2 > 20.99". Poiché 20.99 =
2.3263, si
puo affermare, al livello di confidenza deH'1%, che il numero medio settimanale di
rapine é effettivamente aumentato. Calcoliamo il p-value;
a = P {Z > 4.576) = 0.0000.
La probabilitá di osservare un numero di rapine cosí elevato, se il numero medio
non
fosse aumentato, é inferiore a 1/ 10000.
□
Escmpio 43. Consideriamo lo stesso problema posto nell'esercizio precedente, con
queste dííferenze. Dall'esperienza passata é noto che il numero di rapine che ogni
settimana aw engono in una certa cittá ha media 1 (ma non supponiamo di conosceme
la legge). Nel corso dell'anno passato ci sono state 85 rapine, quindi una media di
85/52 alia settimana, con una deviazione standard di 1.5 rapine alia settimana. Si
puó
affermare che l'entitá del fenómeno é cresciuta in modo significativo? Per
rispondere, si
faccia un test, al livello deH'1%, sull'ipotesi nulla che il parametro non sia
cresciuto.
Questa volta abbiamo un campione numeroso estratto da una popolazione non
nórmale (di legge sconosciuta). L'ipotesi nulla é H q : fj, < 1. Possiamo fare un
test t,
calculando
v /íI 7 ñ
v /O V W
(0 .9 9 (4 0 )
4.4.4.
Test su due medie
(A ',,X 2, . . . . X „ ) ,
(YuY2,...,Y,n)-
H q : p x < Mv-
Ho . p x —
H q : fix ^ t^Y +
H q : p x ^ tJ'Y +
X n-Y^
per stimare la différenza p x — t^Y- Ad esempio, se H q : p x = f^Y, ü test sará
del tipo
"Si rifíuti H q se |X „ - Yjn\ > A;"; se invece H q : p x > P y , ü test sará del
tipo "Si
rifiuti Ho se X n - Ym < k '\ ecc. II problema é costruire mediante
- Ym una v a.
di legge nota.
Si noti che non abbiamo ancora fatto alcuna ipotesi sulle varíame delle due
popolazioni; abbiamo quindi 4 parametri incogniti, fínora. Tratteremo solo due
situazioni particolarí:
a. Le varianze
, o \ sono note;
b. Le varianze a \ , cry sono incognite ma uguali tra loro.
Ritomeremo poi sulla discussione del significato di queste ipotesi.
Caso a. Ragioniamo, per fissare le idee, nel caso in cui l'ipotesi nulla é
H q : P x = P y + Se a \ , ay sono note, possiamo scrivere
2
); y ^ ^ n í p y , ^ ) ,
T7l
X ^ - Y m - 6 ^ N ( o ,á r + i ) ,
\
n
m )
ow ero
- 5
n
'
^ ( 0 , 1).
X„ - Y , ^ - 6
Ho
Hx
ß x = f^Y
ßX < ßY
ßx
Rifíutare H q se
\z\ > Zx-a / 2
Z > Zx-a
Z < -Zx-a
ßY
> ßY
ßx < ß Y + ^
ßx
ßX > ß Y + 6
231
X r,-Y ^~ 6
lo^
\ n
N{QA).
< »
1
i
5" =
__
n + m —2
rt
T7l
fy
n + m —2
Questa grandezza è una media pesata delle varianze campionarie dei due campioni, ed
è la quantité ehe è più naturale introduire per stimare a^ tenendo conto delle
informazioni contenute in entrambi i campioni. Ricordando ehe, essendo i campioni
estratti da popolazioni normali, è
(n-l)5^
2/
----- ^2----- ~ X
ly { m -l)S y
2/
-|\
- 1), ----- ^2------ ~ X (»Tl - 1),
(n + m - 2 ) S ^
2/
ox
Xr^-Ÿm -è
loJ_ ,oJ_
y n
m
X ^-Y m -à
/1
/ (n -l)5 l+ (m -l)^
T\ ' TTx\j
n4-m-2
rsj t(n + m —2 ).
Abbiamo ottenuto quindi una quantité che si puô calculare dai dati campionari ed ha
legge nota.
232
Si noti che, net caso particolare in cui i campioni hanno uguate ampiezza (n = m ),
la varianza campionaria pesata assume I'espressione piu semplice
Xn-Yr,
/ 1 , 1
y n ^ my
/ (n -l)5 |+ (m -l)^
n + m -2
Hi
Px > P Y + ^
Px < P y + 6
Rifíutare H q se
|¿| > ti-a/2{n + m - 2 )
t > t\-a{n -f m —2)
t < —¿ 1- 0(71 + TTx —2 )
233
{XuX2,...,Xn),
( y , , r 2, . . . , r „ ) ,
(Si badi che é fondamentale Yordine in cui accoppiamo le X i con le Vi; con
riferimento
agli esempi fatti, (X i, Yi) possono essere le temperature massima e minima della
stessa
cittá, il peso di una stessa persona prima e dopo una cura dimagrante, ecc.). In
questo
caso il problema naturale non é confrontare la media della popolazione X con la
media
della popolazione Y , ma piuttosto studiare la media delle differenze .
( ( y , - X , ) , ( V 2 - X 2) , . . . , ( y '„ - X „ ) ) .
Si osservi che se X ~
Y - X r-.
{p y - iix,<^Y +<^x) =
4.4.5.
Ho : p i = P2\ Ho :p x<
pi\
H q : pi >
p¿.
In ogni caso, la cosa naturale é eseguire un test sulla differenza delle medie, e
quindi
considerare
—Y ^ - Se i campioni sono suficientemente numerosi da giustiicare
I'approssimazione nórmale, possiamo scrivere
Y „ , c,
( p 2,
P2Í I - P 2)
)
Se inoltre P\ = P 2 = p , s \ ha
II problema è che questa legge dipende ancora dal parametro incognito p. Stimiamo
allora questo parametro con la media campionaría calcolata sull'unione dei due
campioni;
+ Evj
p = ------------------- = --------------------.
n + m
n + m
e quindi la quantitá
CapUolo 4: Statistica inferenziale
z =
235
Xn - y„
rísulta distñbuita approssimativamente come una nórmale standard (al solito, sotto
n
l'ipotesí
t=i
j= i
un test di ipotesi (o anche di determinare un intervailo di confidenza per la
differenza
tra le medie).
Xn-Vn
con p =
^ K i-p )(J + i)
n Xn + my„
n +m
Riflutare H q se
\z\ > ¿ 1- 0/2
2 > ¿ 1-0
2 < - ¿ 1-0
n
m
Laprocedura è valida se risulta Y^Xi > 5; Y V i > ^
i^i
j=i
Esempi
Esempio 45. Da due popolazioni normali si estraggono i campioni:
{8 , 11, 7, 3, 9}
{6 , 5, 10, 3, 2, 4}.
2 _ (n - 1)3^ + (m - 1 ) 4 _ 4 - 8 .8 + 5 -8
n Tn ~ 2
5 "I" 6 —2
8.355.
236
t =
Xn - y„
7 .6 - 5
= 1.4854.
-3 .8 3 3
^ 1 8 .9 6 7 /6
= -2 .1 5 6 .
2—
-3 .8 3 3 + 5
^ 1 8 .9 6 7 /6
= 0.656.
237
con una deviazione standard di 21.4 minuti. Si esegua un test, al livello del 5%,
sull'ipotesi nulla di uguaglianza tra i tempi medi di riparazione.
Supponiamo che i tempi di riparazione abbiano legge normale. Abbiamo:
— 83.2{
3^
— 1 9 . Ti
71i
83.2 - 90.8
Xn-Vn
/
/ 1 9 . 3 *
= -2 .2 5 5 6 .
, 2 1 . 4 ’
Vn +m
+ ^
II test, al livello del 5%, é: si rifiuti H q se \z\ > 20.975 = 1-96. Poiché 2.2556
> 1.96,
si puó rifíutare l'ipotesi.
II secondo modo di procederé é questo. Poiché le varianze campionarie hanno
rapporto S y / s ^ x — 21.4^/19.3^ = 1.23 < 4, possiamo ritenere le varianze
(incognite
ma) uguali, e applicare il test t. In questo caso, calcoliamo
t =
.h
Xn-Vn
\ ^ ■/'(» -0 4 + (^ -i)4
Y n ' mY
n + m -2
83.2 - 90.8
/ i
V 71
, J . / 70-19.3*+74-21.4*
75V
71+75-2
= -2 .2 4 9 .
II test, al livello del 5%, e: si rifiuti H q se |i| > io.975(144) ~ 20.975 = 1-96
(poiche i
gradi di liberta sono piu di 120, i quantili della t si approssimano con quelli
della 2).
Poiche 2.249 > 1.96, si pud rifiutare I'ipotesi.
La conclusione, con entrambi i procedimenti, e che le medie sono diverse.
Possiamo costruire un intervailo di confidema per la differenza delle medie
6 = p x - f^Y Sfhittando il fatto che
Z =
'y —Y — i)
r
"
~ 7NT(0.1),
/ 19.3*
V ~
■ 21.4*
+ ^
possiamo scnvere:
Xr^-Y^-6
< 1.96
/ 19.3* I 21.4*
V 71
75
= 0.95,
S = -7 .6 ± 6 .6 0 4 = (-1 3 .6 6 4 , -0 .9 9 6 ).
238
Con una confidenza del 95% possiamo affermare che il tempo medio di riparazione
richiesto dalla macchina B e da 1 a 14 minuti circa maggiore del tempo medio di
riparazione richiesto dalla macchina A.
□
Esempio 48. Un ufficio studi di una certa assicurazione ha constatato che nella
localita
A, dove conta 25 automobili assicurate, vi sono stati 5 flirti d'auto; nella
localita B, a
fronte di 45 auto assicurate, vi sono stati 8 flirti d'auto. L'ufficio studi pud
concludere
che le due localita siano ugualmente pericolose? In caso contrario, qual e la piu
pericolosa?
Si tratta di eseguire un test sull'uguaglianza di due frequenze. Si ha:
_
5+ 8
P=
z =
25 + 45
5.
25
80’
i.
45
/13 67 M , J_\
V 8O80I 25 ■'■45/
= 0.2415.
Esercizi
4.14. Un'associazione di consumatori decide di controllare se le confezioni di
spaghetti di una certa marca contengono effettivamente il peso dichiarato. Su 51
scatole di spaghetti da 500g si è trovata una media campionaria di x = 492g., con
una
varianza campionaria
= 220g^.
a. Supponendo che la quantité di spaghetti contenuta in una confezione si possa
modellizzare con una v.a. normale, un opportuno test statistico permette di
concludere,
al livello a = 0.05, che in media le confezioni contengono meno di quanto
dichiarato?
Per rispondere si espliciti I'ipotesi nulla, la statistica e la regola di decisione
utilizzata.
b. L'ipotesi che la distribuzione sia normale è indispensabile per giustificare il
procedimento seguito?
4.15. La precisione di una macchina che produce componenti di dimensioni
specificate viene tenuta sotto controllo con verifiche campionarie; la dimensione
specificata è /i = 3.5 mm. Se,
su 150 pezziprodotti, si è riscontrata
una media
campionaria pari a 3.42 mm., e una varianza campionaria pari a 0.2209 mm^, il
processo va considerato "sotto controllo" o "fiiori controllo"? Rispondere poi alia
stessa domanda, supponendo che le stesse statistiche siano state rilevate su un
campione di ampiezza 60.
4.16. Una ditta acquista componenti semplici da un'altra ditta, in lotti da 5000
pezzi,
e vuole avere la garanzia che al massimo il 4% di questi pezzi siano difettosi
Prima di
Capitolo 4: Statistica inferenziale
239
= 1.98; Sy = 2.1.
In base a questi dati si puó affermare, al livello di signifícativitá del 5%, che p
x >
4.20. Quattro macchine selezionate a caso tra tutte quelle di una certa officina,
hanno
prodotto, in un'ora, 1 2 ,8 ,1 0 ,9 pezzi. Le stesse macchine, dopo una certa
modifica,
hanno prodotto, rispettivamente, 14,10,13,8 pezzi, sempre in un'ora.
a. Si puó affermare che la modifica abbia innalzato il numero medio di pezzi
prodotti?
Per rispondere, si esegua un test al livello del 5% sull'ipotesi che la media non
sia
cresciuta.
b. Si risponda alia stessa domanda supponendo ora che le 4 macchine dopo la
modifica abbiano prodotto, rispettivamente, 8 ,1 0 ,1 3 ,1 4 pezzi in un'ora.
240
4.5.1.
- !)■
Sia, ad esempio, H q .
< Oq. Allora il test sará del tipo; "Si rifiuti H q se
> fc",
con k opportuno. Fissiamo il livello di signifícativitá q . Se H q é vera, la
probabilitá di
rifíutare l'ipotesi é
> k).
o = pi - ”!
> xí_„(n - d )
otteniamo
k =
(n -1 )
X ? - a ( ^ - !)•
_2
241
Rifiutare H q se
Hx
Ho
= al
/ al
X^ > X?-a/2(” - 1) O
< al
a'^ > a l
> al
X^ > X l-a (^ - 1)
X^ < x l { n - 1)
< al
< X ^2(^ “ 1)
-1 ) <
< x L (" - d ).
(n - 1)5^
X Í^ (n -l)
2
jn - 1)3^
(n - 1)3^
x L ( ^ - i) ’x L ( ^ - i) r
Si osservi che, rispetto al valore
che costituisce la stima puntúale di cг^, questo
non è un intervallo simmetrico, cioé del tipo
= a^±6. II criterio con cui è costruito
è quello di avere code uguali: la probabilitá, calcolata prima di eseguire il
campionamento, che
risulti maggiore di
Osservazione 49. Inferenze sulla varianza di una popolazione normale con media
nota o incognita. Abbiamo fínora supposto, implicitamente, che la media della
popolazione normale fosse incognita: infatti, per stimare
abbiamo utilizzato la
statistica 5^, che non dipende da /x. Se pero p fosse nota, sarebbe naturale
stimare la
varianza mediante
(si veda la Proposizione 10), abbiamo che questa volta la quantité da calculare è
242
2 /
X = - T ~ X («)■
<7*
Si puo npetere quanto detto nel caso della media incognita, sostituendo la quantitá
con quella appena calcolata, e ncordando che i gradi di liberté sono ora n, anziché
n —1.
Esempio 50. Avendo osservato il campione ( 1 ,2 ,4 ,5 ,3 ,5 ,6 ,0 ,4 ,6 ,7 }
proveniente
da una legge nórmale;
a. fomire una stima puntúale della varianza, utilizzando uno stimatore non
distorto.
b. Calcolare I'intervallo di confidenza della varianza al livello del 90%.
c. Rispondere alia stessa domanda, nell'ipotesi ora che il valore vero della media
sia4.
a. Calcoliamo:
x„ = 3.909; si = 4.891.
La stima puntúale della varianza é, naturalmente,
= 4.891.
b. Poiché n = 11 e a = 0.9, dobbiamo calcolare i quantili;
xL2 (n -
1)
= Xo.95(10) =
18.307:
xL(n
2
1)
= X ^5(10) =
3.9403.
( Xo.QsilO)
lOs?
Xo.osi^*^)
^ ( 10 ■4.891 10 -4.891 \
18.307 ’ 3.9403 )
V
Questa volta i gradi di liberté sono 11, per cui, al livello del 90%, l'intervallo
di
confidenza per
è
i=l
non eè uguate a
fiy
CapHolo 4: Statistica inferenziale
115'“
49
11a'
49
243
Xo.9s(^^) Xo.osi^l)
Osservare ehe il secondo intervallo di confidenza ha entrambi gli estremi un po'
piu
piccoli degli estremi del prime intervallo; la varianza stimata 6 cioe inferiore
nel
secondo caso, in cui abbiamo maggiori informazioni.
□
Esempio 51. Su un campione di 100 misure della temperatura di ebollizione di un
certo liquido, si e trovata una media campionaria x„ = 100°C, con una varianza
campionaria
= 0.0098
Si puo affermare, al livello di significativita deiri% , ehe
la varianza di questa grandezza e inferiore a 0.015?
Eseguiamo un test al livello deH'1% sull'ipotesi nulla a^ > 0.015 (se rifiuteremo
I'ipotesi, potremo affermare ehe la varianza h inferiore a 0.015). Calcoliamo
anzitutto
(n - l ) s l
2
X
99 • 0.0098
= 64.68.
0.015
Dobbiamo supporre che la temperatura di ebollizione del liquido segua una legge
normale. Sotto quest'ipotesi, il test chi-quadro porta a rifíutare I'ipotesi se
< x l ( n - 1) = Xo.oi(99).
Ricordiamo ora che, quando i gradi di liberté della chi-quadro sono piu di 30, si
puo
usare I'approssimazione normale e calcolare (v. §4.2)
Xq (^) - Z a y / ^ + n.
Nel nostro caso,
X^.oi (99)
11-5.1742
= 4.553296.
12.5
> x l a / 2 ( ” - 1)
X^<Xo/2(^-l)
Poiché
X ?-a/2(«-l)
xL 2 ( " - 1 )
= Xo.975(ll) = 21.92;
= x U 5 (1 1 ) = 3.8157.
i dati non consentono di rífíutare I'ipotesi che la varianza sia uguale a 12.5.
Calcoliamo
il p-value. Risolvendo I'equazione
4.5533 = x L ( l l ) .
cioe, per X ~ x ^ ( l l ) .
4.5.2.
Nel §4.4.4 abbiamo visto che, per eseguire un test sull'uguaglianza delie medie di
due
popolazioni normali (situazione tipica nelle analisi comparative), occorre
conoscere le
loro varianze, o per lo meno sapere che sono uguali. E' utile dunque avere una
procedura per verificare I'ipotesi di uguaglianza delie varianze: questo test di
venta un
prerequisito per applicame un altro, quello sulle medie. Inoltre, possono esserci
altre
situazioni in cui il nostro interesse primario é proprio confrontare le varianze:
si
ricordi, ad esempio, che se X , Y denotano le misure di un certo pezzo prodotto da
due
macchine simiii, le varianze di X , Y rappresentano l'inaccuratezza del processo.
In
questo caso é un problema naturale voler confrontare le varianze per giudicare
quaie
macchina é migliore.
Trattandosi di quantitá positive, per confrontare due varianze si considera
sólitamente il loro rapporto (che é una quantitá positiva), invece che la loro
diíTerenza
(come si fa per le medie). E' quindi naturale utilizzare la statistica;
F= ^
s y
e quindi anche
1)»
X^(m-l);
Capitolo 4: Statistica inferenziale
^ xXI/ ° X
~
S y I oy
245
1 . ^ - 1).
Hi
Rifiutare H q se
a \= a \
a\ < a\ 4
a\> a\r 4
oF <
H > F i_ ^ (n -l,m
H < F ,_ ^ (n -l,m
> 4
< 4
F ^ (n -l,m -l)
-l)
-l)
esempio, se
oF < F ^ (n -l,m -l)
sono equivalent! a
s2
3min > F ,_ q'/2(^AÍ -
- !)•
Questa forma é quella utile per usare le tavole, che riportano i quantili Fp solo
per /3
grande; ad esempio per a = 0.05, ci interessano i quantili Fo,975(nM - 1,
- 1).
Con ragionamenti analoghi si puo determinare I'intervallo di confidenza, al livello
100 q %, per ilrapporto delle varianze a \ ! a \ . Dall'identitá
a =
\
^ Y /^ Y
Sx
cr^x
Sy ^ a \ ^
5^
F ¡^ (n -l,m -l)
fly
s‘
Esempio 53. Due macchine diverse producono fílo di rame che deve avere diámetro
costante. Per controllare la qualitá del processo, vengono eseguite misure precise
del
diámetro in punti casuali del fílo prodotto dall'una e dall'altra macchina. Le
osservazioni cosí ottenute possono ritenersi provenire da una legge nórmale di
media e
varianza incognita. 13 misure effettuate sulla prima macchina hanno fomito una
varianza campionaria s \ = 0.001225, mentre 11 misure effettuate sulla seconda
macchina hanno fomito una varianza campionaria Sy = 0.003844. Si puó ritenere che
le due macchine abbíano la stessa accuratezza? In caso contrario, quale é piú
accurata?
Per rispondere alie domande;
a. si sottoponga a test l'ipotesi di uguaglianza delle varianze;
b. si esegua un test sull'ipotesi nulla che
c. si calcoli un intervallo di confidenza, al livello del 95%, per il rapporto
delle
varianze.
“ 13
0.001225
mentre
CapHoto 4: Statistica infeœnziale
247
0.001225
= 0.31868.
0.003844
F < F ,_ J 1 2 ,1 0 ) = Fo.95(12.10).
II quantile F q 95( 12,10) non compare nelle tavole; per interpolazione lineare tra
F o.95(12,8) = 2.85 e Fo.95( 12, 12) = 2.69 troviamo Fo.95( 12, 10) ~ 2.77. Perció,
in
base ai nostri dati, non possiamo rífíutare l'ipotesi, e quindi non possiamo
affermare
che sia
c. L'intervallo di confídenza per o \ ! a \ , al livello del 95%, é dato da:
F ¡^ (n -l,m -l)
a\ ' F | ^ ( n - l , m
-l)
s\
— 0.31868, -=—
0-31868
’ F o.o5(12,10)
^•^ 0.975(^ 2 , 10)
1
F o.o5(12,10)
= Fo.975(10,12) = 3.62.
Nelle tavole non compare F q 975( 12,10); per interpolazione lineare tra
Fo.975(12,8)= 3.51 e
Fo.975(12,12)= 3.28
troviamo
F o.975(12, 10)
3.395.
( 3.395
31868,3.62 • 0.31868
= (0.0938,1.154)
) -
Esercizio 4.21. Nel §4.4.4 si é fomita la seguente "regola pratica" per valutare se
le
varianze di due popolazioni normali si possano rítenere uguali: ríteniamo diverse
le
varianze quando una varíanza campionaría é almeno 4 volte l'altra. Vogliamo ora
sottoporre questa regola pratica ad una crítica piú rigorosa. Supponiamo di
eseguire un
test F , al livello del 5%, sull'uguaglianza di 2 varianze; supponiamo di aver
trovato
^moi/^mtn = 3.95 (perció, in base alia regola pratica, non dovremmo rífíutare
l'ipotesi
di uguaglianza tra le varianze); usando le tavole della distribuzione F , si dica
se i dati
consentono di rífíutare l'ipotesi nei seguenti casi:
248
^Af —
— 5, c)
— 20 .
(Si noti che la regola pratica fomita era fínalizzata solo a garantiré la validità
approssimata del test t suH'uguaglianza delle medie, mentre non è uno strumento
preciso per valutare l'uguaglianza delle varianze. Questo esercizio vuole anche
insegnare a non avéré una fíducia assoluta nelle "rególe pratiche" troppo semplici
per
poter essere rigorosamente valide in tutti i casi).
Al
32%
A2
27%
^3
16%
A4
25%
Totale
100%
In una certa sezione elettorale di quel comune, su 320 voti validi, i voti sono
risultati
cosí ripartiti;
Partito
N® voti
Percentuale di voti
Al
118
36.9%
A2
71
22 .2%
A4
69
21.5%
^3
62
19.4%
Totale
320
100%
0
50
1
32
2
3
3 O piú
0
Totale
85
si puó affermare che il modello è ancora applicabile alia descrizione del fenómeno,
o
qualcosa è cambiato?
Esempio 56. Si dispone delle seguenti osservazioni circa i soldati dell'antico
esercito
prussiano uccisi da un calcio di cavallo, ín un anno, in un battaglione:
Capitolo 4: Statistica inferenziale
0
109
1
65
2
22
3
3
4
1
249
Totale
200
N‘^ di lampadine
24
16
20
14
10
16
0
100
In base a questi dati, si puo affermare che il tempo di vita di una lampadina segue
una
legge esponenziale?
Per arrivare a rispondere a questi problemi, cominciamo a descrivere la situazione
generale di cui quelle precedent! sono esemplifícazioni concrete.
Supponiamo di avere una tabella che rappresenta n osservazioni (di una sola
variabile) raggruppate in k classL Le class! possono rappresentare;
a. caratteristiche qualitative (in altre parole; valori assunti da una variabile
categórica), come nell'Esempio 54 (in cui la classe è il partito votato);
b. valori assunti da una variabile discreta; ogni classe raggruppa tutte le
osservazioni che assumono un singolo valore, come nell'Esempio 56; eventualmente,
una o due class! raggruppano le "code", come nell'Esempio 55, dove I'ultima classe
(vuota) è "3 o più";
c. intervalli di valori assunti da una variabile continua, come nell'Esempio 57
(ogni
classe contiene tutte le osservazioni che cadono in un certo intervallo); in questo
caso
la tabella contiene meno informazioni di quelle che si avrebbero conoscendo i dati
grezzi (ossia i valori esatti di tutte le n osservazioni).
In altre parole; la tabella rappresenta la tavola delle frequenze (assolute) di una
variabile categórica o di una variabile numérica, discreta o continua.
Per ciascuna classe A i ( i = l , 2 , . . . , k ) supponiamo di avere, oltre alia
"frequenza
osservata", una '^freguenra atiesa", con cui vogliamo confrontare la frequenza
osservata Discutiamo, nei vari esempi, il signifícate di questa frequenza attesa
Esempio 54. Le frequenze attese sono quelle che si osserverebbero, sui 320 voti
della
sezione, se questi fossero distribuiti esattamente seconde le percentuali di tutto
l'elettorato. Per ottenerle dobbiamo trasformare le percentuali attese in frequenze
relative attese, e moltiplicare queste per il numero di osservazioni (cioé di voti
valid!
della sezione); otteniamo una tabella cosí;
250
Partito
Percentuale atiesa
Freq. relativa atiesa pi
Freq. assoluta attesa npi (n = 320)
Freq. assoluta osservata N{
A^
32%
0.32
102.4
118
M
27%
0.27
86.4
71
A3
16%
0.16
51.2
62
A4
25%
0.25
80
69
Totale
100%
1
320
320
0.42
= 0.054;
{ J C = 1}
0.268
22.78
32
{A- = 2 }
0.054
4.59
3
(JC>3)
0.008
0.68
0
Tot.
1
85
85
= ^ ( 1 0 9 • 0 + 65 • 1 -h 22 • 2 + 3 • 3 + 1 • 4)
122
= 0.61.
200
251
P {X = 0) =
= 0.543;
P (X = 1) =
• 0.61 = 0.331;
P {X = 2) =
= 0.101;
P {X = 3) =
= 0.021;
P (X = 4) = C-® ®*
4!
= 0.003.
Freq. reí. attesa pi Freq. ass. attesa np¿ = 200p¿ Freq. ass. osservata N{
109
108.6
0.543
65
66.2
0.331
22
0.101
20.2
3
0.021
4.2
1
0.6
0.003
0
0.2
0.001
200
1
200
i=l
oppure (se vogliamo usare uno stimatore non distorto, v. Osservazione 100,
§3,10.1),
252
u=
n —1
n - 1 1
n
Ex.
Xr
Anzitutto quindi occorre calcolare x^. Si noti che in questo caso non disponiamo
dei
dati grezzi, ma solo dei dati raggruppati in classi; poiché la varíabile in esame é
continua, nel raggruppare i dati in classi parte deH'informazione é andata perduta.
Abbiamo visto nel §1.4 come si calcóla la media campionaría approssimata in un caso
come questo;
classe Ai
(0,1)
(1.2)
(2,3)
(3,4)
(4,5)
(5,10)
(1 0 ,oo)
punto medio x*
0.5
1.5
2.5
3.5
4.5
7.5
?
freq. ass. / ,
24
16
20
14
10
16
0
x*/¿
12
24
50
49
45
120
0
100
300
E
¿=1
x„ =
Ex*/i Ex*/,
1=1
1=1
300
100
= 3.
E /.
i=l
^
n -1 1
99 1
„„„
u = ----------- --- ----------- = 0.33.
n x„
100 3
Ora calcoliamo le frequenze relative attese. Supponendo X ~ Esp(0.33) sará
Fx{t) = 1
Quindi;
P { X < 1) = 1 -
= 0.2811
^ 0.2021
^ - e"®^"* = 0.1044
= 0.0751
CafMoto 4: Statistica inferenziale
253
'® = 0.1552
P { X > 10) = e
-0.33 10
= 0.0369.
1.0001
100
100
II confronto visivo tra le ultime due colonne suggerisce che ci sia un buon
adattamento
tra i dati; vedremo poi corne effettuare una verifica quantitativa.
Ricapitoliamo; in quest'esempio, oltre a dover stimare un parámetro incognito dai
dati del campione (corne nell'esempio precedente), abbiamo l'ulteriore
complicazione
dovuta al fatto che la variabile è continua, per cui i dati raggruppati in classi
non
consentono di determinare la media campionaria in modo esatto, ma solo
approssimato.
□
Veniamo ora al punto fondamentale: corne si valuta, quantitativamente, la bontà
dell'adattamento delle Jrequenze assolute osservate aile frequem e assolute áltese?
Supponiamo di avéré, in generale, n osservazioni raggruppate in k classi
siano P i,P 2, •• • ,Pit le frequenze relative attese di queste classi,
rispettivamente; siano
n p \ , n p i , . . . , npk le frequenze assolute attese, e siano
N\,N<i,... ,Nk le frequenze assolute osservate. Calcoliamo, in base a questi dati,
la
seguente statistica;
« =E
i=l
(np, - N j f
npi
che viene detta, per motivi che chiariremo fra poco, i7 chi quadra calcolato dal
campione. Per calcolare Q si costruisce una tabella di questo tipo:
Classi
Ak
Pk
Pi
P2
np2
npi
Ni
N2
lnP2-Nif
Scarti quadratici pesati (nPi-N,r
npi
np2
E
i=i
npk
Nk
(np.-NkV
npk
n
n
<?= E
i=\
(np^ - N ,Ÿ
np.
"bene"!); tuttavia, non entriamo nella discussione di queste ipotesi, che tra
l'altro non sonu di facile verifica
in moite situazioni comuni.
Capitolo 4: Statistica inferenziale
255
C orollario 59. Nelle ipotesi del teorema precedente, volendo eseguire un test
sull'ipotesi nulla H q: Le osservazioni prove ngono da una popolazione distribuí ta
nelle classi A \ , A 2 , . . . , A k secondo lefrequenze relative attese P \ , P
2 , ■ ■ ■ , P k " , fissato
il livello di significatività a, la regola di decisione sarà:
P {X > Q ),
con X ~
— 1 —r).
2.38
A2
0.27
86.4
71
A3
0.16
51.2
62
A4
0.25
80
69
Totale
1
320
320
Classe
{ X = 0} { X = l } { X = 2} { X > Z } Tôt.
0.67
0.054
Freq. rel. attesa pi
0.268
0.008
4.59
0.68
85
Freq. ass. attesa np¿ = 85p¿ 56.95
22.78
32
85
Freq. ass. osservata N{
50
Si osserva che le ultime due classi hanno frequenze assolute attese < 5, perció non
possiamo usare la tabella cosí com'é per eífettuare il test chi-quadro; se
accorpiamo le
ultime due classi otteniamo una nuova classe {X > 2} con frequenza assoluta attesa
parí a 4.59 + 0.68 = 5.27, e frequenza assoluta osservata parí a 3 + 0 = 3
(rícordare
che é solo la frequenza assoluta atiesa che deve essere > 5). Perció consideríamo
la
nuova tabella;
Classe
Freq. ass. attesa npi (n = 85)
Freq. ass. osservata N{
{X = 0)
56.95
50
{X = l}
22.78
32
[X> 2)
5.27
3
Tot.
85
85
0.8482
3.7317
0.9778
5.5576
II chi-quadro calcolato dal campione é Q = 5.5576; i gradi di libertá sono
fc — 1 —r = 3 —l - 0 = 2 (le classi, dopo l'accorpamento, sono 3, nessun parametro
é stato stimato dal campione). Al livello di signiñcativitá del 5%, il test é: si
rifiuti
l'ipotesi di adattamento se Q >
~ 5.991. Perció, in base ai nostri dati, non
possiamo rifitíare l'ipotesi di adattamento, al livello di signijicativitá del b%.
nel
problema in esame, ció significa che non c'é evidenza statistica del fa tto che la
legge
seguita dal numero settimanale di incidenti sia cambiata (né nella form a, né nel
valore atieso).
II p-value corríspondente a Q = 5.5576 e 2 gradi di libertá é 0.0621. Questo
significa che, con gli stessi dati campionarí, avremmo potuto rífiutare l'ipotesi
di
adattamento al livello del 10%, o del 7% (ma non del 5%).
□
{A^ = 0}
{ X = l}
( J f = 2)
{ X = 3>
{ X = 4}
{AT > 5 )
Tot.
Pi
0.543
0.331
0.101
0.021
0.003
0.001
1
K
109
65
22
3
1
0
200
Le ultime 3 classi hanno frequenze relative attese < 5; accorpandole, otteniamo una
nuova classe, { X > 3}, di frequenza assoluta attesa parí a 4.2 -h 0.6 -t- 0.2 = 5,
e
frequenza assoluta osservata parí a 3 + l- l- 0 = 4. Consideríamo quindi la nuova
tabella;
Capitolo 4: Statistica inferenziale
Classe
257
npi
(A- = 0) 108.6
66.2
{■y = 2) 20.2
{X>3)
200
Tot.
N,
109
65
22
200
np.
0.0015
0.0218
0.1604
0.2000
0 .3 8 3 6
1.0001
100
1=1
100
Dobbiamo accorpare le ultime due classi, per far si che abbiano entrambe frequenza
assoluta attesa > 5; perciô introduciamo la nuova classe (5, oo), con frequenza
assoluta attesa 15.52 + 3.69 = 19.21, e frequenza osservata 16;
258
Classe Freq. ass. attesa Freq. ass. oss. Scarti quadr. pesati
Ai
npi
(0,1)
(1,2)
(2.3)
(3.4)
(4,6)
(5,oo)
(n p ,-N ,f
28.10
20.21
14.53
10.44
7.51
19.21
Ni
24
16
20
14
10
16
0.6003
0.8760
2.0615
1.2106
0.8267
0.5349
100
100
6 .1 1
np,
i=l
259
Nel caso in cui occorra calcolare le frequenze relative attese da una legge, la
demanda successiva è; la legge è nota, o ci sono parametri da stimare? Nel seconde
caso, occorre scrivere lo stimatore che si utilizza, e calcolare l'appropriata
statistica
(sólitamente la media e/o la varianza campionaria); fare attenzione, in questo
caso, a
corne si calcolano la media o la varianza campionaria a partiré da dati raggruppati
(tipicamente, questo problema si presenta nel caso di variabili continue, in cui
parte
dell'informazione è andata persa nel costruire le classi).
3. Una volta calculate le frequenze relative attese, si calcolano le frequenze
assolute
attese (moltiplicando le prime per il numero n di osservazioni).
4. A questo punto ci si chiede: le frequenze assolute attese sono tutte > 5? In
caso
negativo, occorre accorpare opportunamente due o più classi contiguë, fînché questa
condizione sia verificata. Compilare quindi una nuova tabella che contenga le nueve
classi (in numero minore), le loro frequenze assolute attese e osservate (le
frequenze
relative attese non ci servono piCi). Controllare sempre i totali, a titolo di
verifica.
5. Su quest'ultima tabella si puó ora procederé al calcólo degli scarti quadratic!
pesati
e quindi del chi-quadro Q. Dalla stessa tabella si contano le classi, per
determinare il
numero di gradi di liberté: ricordarsi che questi sono fc — 1 —r, dove fc è il
numero di
classi e r il numero di parametri stimati dal campione (questo numero non appare
dalla
tabella: occorre ricordarsi il procedimento che si è seguito).
6. Fissato il livello di signifícativitá a , si puó ora calcolare, mediante le
tavole, il
quantile x Î - q (^ ~ 1 ~
se Q è maggiore di questo numero, si puó rifíutare l'ipotesi
di adattamento, ai livello a .
7. Calcolati il numero Q e i gradi di liberté (fc — 1 - r), si puó calcolare
(mediante
computer) il p-value: questo è il numero a = P {X > Q ), dove X ~
~ 1“
O sservazioni 60. Ora che abbiamo descritto il test chi-quadro "pragmáticamente"
(ossia spiegando come si esegue), puó essere utile riflettere su alcuni punti che
possono meglio inquadrare questo argomento tra gii aitri capitoli della statistica
inferenziale gié visti.
1. Perché si esegue un test chi-quadro. Supponiamo di eseguire un test di ipotesi
sulla media di una popolazione normale, per piccoli campioni (test t di Student).
II
fatto che la popolazione sia normalmente distribuita è uxíipotesi che occorre fare
a
priori, e senza la quale la procedura che abbiamo imparato nel §4.4.2 è priva di
valore:
se, ad esempio, il test porta a rifíutare l'ipotesi che la media sia nulla, ma in
realtà la
popolazione da cui si campiona non è affatto normalmente distribuita, il risultato
ottenuto non è afüdabile. Questo è solo un esempio per mostrare un fatto generale:
ci
sono moite procedure statistiche che richiedono corne ipotesi il fatto che la
popolazione sia distribuita secondo una certa legge; in queste situazioni, il test
chiquadro di adattamento è uno strumento utile per verifícare se queste procedure
sono
applicabili.
Il test chi-quadro puô essere eseguito anche su una variabile categórica, come
nell'Esempio 54. In questo caso le frequenze relative attese non sono dedotte da
una
legge, ma assegnate a priori; queste frequenze possono avéré un significato
empirico
(corne nell'Esempio 54) o teorico (si veda l'Esercizio 4.23 al termine del
parágrafo
successivo).
2 Rifíutare o accettare l'ipotesi. Parlando dei test di ipotesi, abbiamo detto che,
sólitamente, l'obiettivo di chi esegue un test statistico è quello di rifíutare
l'ipotesi
260
261
(x’i Ÿ
(x:fNi
(27,28)
27.5
3
82.5
(28,29)
28.5
23
655.5
756.25 812.25
2268.75 18681.75
(29,30)
29.5
53
1563.5
870.25
46123.25
(30,31)
30.5
50
1525
930.25
46512.5
(31,32)
31.5
21
661.5
992.25
20837.25
Totale
150
4488
134423.5
Quindi;
4488
= 29.92;
150
149 V 1 5 0 ^
\
»=1
(x -m -in
p, = 29.92;
= 0.9566; a = 0.978.
/ 28 - 29.92 \
/ 27 - 29.92 \
P(27 < X <28) = ^ { — —
) - ^ I ——
I =
^
V 0.978 J
\
0.978 )
<
<
<
<
<
28
29
30
31
32
Pi
0.0014
0.0234
0.1486
0.3592
0.3327
0.118
0.0167
npi
0.21
3.51
22.29
53.88
49.905
17.7
2.505
150
N,
23
53
50
21
150
Per ottenere classi con frequenze assolute attese > 5, dobbiamo accorpare le prime
3
e le ultime 2. Otteniamo cosi la nuova tabella;
Classi
npi
X < 29
29 < X < 30
30 < X < 31
X > 31
Totale
26.01
53.88
49.905
20.205
150
N.
26
53
50
21
150
(np,-Njf
nPx
0.0000
0.0144
0.0002
0.0313
0.0458
263
Fx{t)
si calcóla
Accorpiamo ora le prime due e le ultime tre classi, per avere npi > 5, e otteniamo;
Statura in cm.
freq. ass. attesa npi
freq. ass. osservata
scarto quadratico pesato
< 168
12.57
12
0.02585
168 - 171
18.89
20
0.06522
> 171
18.54
18
0.01573
Totale
50
50
0.1068
II chi-quadro calcolato é quindi Q = 0.1068; i gradi di liberté sono 2 (3 classi e
nessun
parámetro stimato dai dati); Xo.9s(2) = 5.991, percio al livello del 5% non si puo
rifiutare I'ipotesi di adattamento ai dati. II p-value corrispondente a Q = 0.1068
e 2
gradi di liberté é a = 0.9480; é un numero moho vicino a 1, il che significa che
c'é un
ottimo adattamento dei dati alia distribuzione teórica assegnata.
□
Ossevazione 63. M etodi di verifica della norm alitá dei dati. L'importanza di
disporre di metodi utili per verificare che un certo insieme di osservazioni
provenga da
una distribuzione nórmale dovrebbe risultare evidente, al termine di questo
capitolo
sulla statistica inferenziale. Infattí, abbiamo visto come vari test di ipotesi su
media e
varianza abbiano valore nell'ipotesi che i dati siano distribuiti, almeno
approssimativamente, secondo una legge nórmale. Riepiloghiamo allora alcuni
strumenti che abbiamo incontrato in questo corso, utili a questo scopo;
a. Metodi della statistica descrittiva, basati suU'osservazione della form a della
distribuzione: se l'insieme delle osservazioni é abbastanza numeroso, un istogramma
evidenzieré la tipica forma simmetrica a campana, nel caso di una distribuzione
nórmale. Abbiamo anche a disposizione gli indici di forma: la skewness dev'essere
264
4.6.2.
II test chi-quadro puó essere utílizzato anche per verificare l'indipendenza o meno
di
due varíabili. E' questo un altro problema che si presenta spesso nelle
applicazioni:
disponiamo di n osservazioni congiunte di due variabili, e ci chiediamo: esiste una
form a di dipendenza tra le variabili, o no? Nel Cap. I abbiamo visto come si possa
valutare la correlazione di due varíabili numeriche, ín un campione di n
osservazioni;
utilizzo di scatterplot, calcólo del coefficiente di correlazione, retta dei minimi
quadrati... Ora vedremo un método diverso, che permette di trattare sia varíabili
numeriche che varíabili categoríche, valutando quantitativamente l'indipendenza (o
la
dipendenza) di queste. Al solito, introduciamo il problema mediante alcuni esempi
concreti.
Esempio 64. Un certo corso universitario é impartito a studenti del terzo anno di
tre
diversi indirizzi; gli studenti frequentano le lezioni del medesimo professore, che
registra il numero di studenti di ogni indirizzo che hanno supéralo l'esame,
nell'arco
dell'anno. I dati sono i seguenti:
esame superato
esame non superato
Tot. studenti iscritti
Indirizzo A
30
40
70
Indirizzo B
15
8
23
Indirizzo C
50
37
87
Tot. esami
95
85
180
II
s ig n ifíc a lo
m a n u a le
s ta tis tic o
d e l
d e i
s o ñ w a r e
te s t e
s u lle
s ta tis tic o
c h e
ip o te s i s o t to
s i
le
u s a
q u a li
d o v r e b b e
s o n o
c o n te n e ré
a p p lic a b ili.
d e lle
b r e v i
s p ie g a z io n i
s u l
Capitolo 4: Statistica inferenziale
265
A2
B2
n il
n 2 i
Ar
Uri
n i2
n22
n^2
Tôt.
n .2
n .i
...
Bs
nu
” 2«
nrs
Tôt.
n i.
«2
Ur.
n.s
n
Tab. A
Notazioni;
è la frequenza assoluta della classe { X E A i , Y E Bj)', i totali riga e
colonna si indicano coi simboli;
r
n.j =
i=\
j =
j=\
i=l
n.
(Il totale dei totali riga, ossia la somma delle frequenze assolute delle classi B
j, è
266
rii.
p,. = — = freq. relativa della classe A , \
n
n.i
p.j = — = freq. relativa della classe B ,.
n
Si avrà:
¿Pi = 1=£ p r
Veniamo ora al problema che ci interessa; valutare I'indipendenza (o meno) delle
variabili X , Y . Poiché i valori di X sono raggruppati nelle classi A , e i valori
di Y nelle
classi B j , se X , Y sono indipendenti, per deñnizione di indipendenza di v.a.,
avremo
P { X G A.,
Bj)
P { X G A , ) P { Y G B j ) per ogni A „ B j .
rii
Pij = Pi
•Pj
= n
n.
n
La situazione si puo ora descrivere in termini simili a quelli usati per il test
<1*
adattamento; abbiamo n osservazioni raggruppate in k = rs classi; di ogni classe
conosciamo la fre q u e n z a assoluta osservata r i i j e la frequenza assoluta
attesa
.
Indipendenza delle variabili X , Y significa adattamento delle frequenze relative
osservate alle frequenze relative attese (che sono quelle calculate nell'ipotesi di
indipendenza). Costruiamo quindi il chi-quadro calcolato dai dati
K
¿=1 j=i
- V )
fit.n.j
(7)
267
Bs
71
Ar
nr-n.1
ryi.rí.i
71
712.71,2
n
n
Tab.B
D al confronto delle due tabelle, calcoliamo la somma degli scarti quadratici
pesati, ow ero il chi-quadro Q dato dalla form ula (7). Allora la Q é una v.a. la
cui
legge é approssimativamente uguale a quella
— l)( s — 1)). L'approssimazione
vale se ciascuna delle /requem e attese
é > 5. Un test, al livello di significativitá
a, sull'ipotesi nulla H q: "Le variabili X ,Y sono indipendenti" avrá come regola
di
decisione:
"Si rifiuti H o s e Q > X i-o((^ ~ 1)(3 - 1))"
Questa procedura viene detta test chi-quadro di indipendenza. 11 p-value
corrispondente a un chi-quadro calcolato Q é
a = P {Y > Q) con Y ~ x^((^ ~ 1)(^ ~ !))•
Illustríamo ora il procedimento sui due esempi riportati in precedenza.
Esempio 64. Riportiamo la tabella di contingenza;
esame superato
esame non superato
Tot. student! iscritti
Indirizzo A
30
40
70
Indirizzo B
15
8
23
Indirizzo C
50
37
87
Tot. esami
95
85
180
esame superato
esame non superato
Indirizzo A
95 • 70/180
85 • 70/180
Indirizzo B
95 •23/180
85 •23/180
Indirizzo C
95 • 87/180
85 • 87/180
esame superato
esame non superato
Indirizzo A
36.94
33.05
Indirizzo B
12.14
21.72
Indirizzo C
45.92
82.17
ossia
Osserviamo che tutti i numeri che compaiono in quest'ultima tabella sono maggiori
di
268
5, o w e ro I'ipotesi
> 5 è verificata per ogni t, j. Dal confronto tra la tabella di
contingenza e I'ultima tabella scritta, si calcóla il chi-quadro;
^
Q
(3 0 -3 6 .9 4 )^
-
Ad
36.94
(40 - 33.05Г
33.05
”1
”
(1 5 -1 2 .1 4 )^
12.14
-A
"b
(8 - 21.72Г
21.72
(5 0 -4 5 .9 2 )^
45.92
d
AA
”1
”
(37 - 82.1 7 f
82.17
< 30 000 km
30 0 0 0 - 4 5 000 km
> 45000 km
Ora si calcóla
Marca A
24
112
64
Marca В
24
112
64
Marca С
24
112
64
Marca D
24
112
64
CapUolo 4: Statistica inferenziale
Ç _ (26 - 2 4 r
24
(1 1 8 -1 1 2 )^
112
(56 - 64)^
64
(23 - 2 4 f
24
(15 - 2 4 y
24
(32 - 24)'^ ^
24
(9 3 -1 1 2 f
(1 1 6 -1 1 2 r
112
'''
112
(1 2 1 -1 1 2 )^
112
(84 - 64)^
64
(69 - 64)^
64
269
Esercizi
4.22.
0
52
> 5
60
55
18
315
108
101
32
556
2 settimane prima
79
84
37
4 settimane prima
91
66
43
vaccinate
non vaccinate
nessuna influenza
252
224
una influenza
145
136
271
Esercizi di ncapitolazione
sulla statistica inferenziale
4.27. Si vuole eseguire un'indagine campionaria per stimare quale proporzione delle
famiglie di una certa cittá va al rístorante almeno una volta al mese. L'obiettivo
é
determinare un intervallo di conñdenza al livello del 90% per questa proporzione;
inoltre, si vuole che l'ampiezza dell'intervallo di confidenza non superi 0.04.
a. Si determini il minimo numero di famiglie da intervistare, affinché l'indagine
permetta di raggiungere l'obiettivo.
b. Si risponda alia stessa domanda utilizzando ora la seguente informazione
ulteriore;
sappiamo che la proporzione che vogliamo stimare certamente non supera 0.1.
c. II sondaggio é stato eseguito su un campione di 700 famiglie, e si é trovato che
32
di esse vanno al rístorante almeno una volta al mese. Si calcoli l'intervallo di
confidenza
ríchiesto, in base a questo rísultato, e si verifíchi che la sua ampiezza non
eccede 0.04.
4.28. II tempo di vita di 41 componenti elettronici scelti a caso da una partita
numerosa é stato misurato, e si é trovato una media campionaria x„ = 12.3 mesi, con
una varíanza campionaria
= 150 mesi^.
a. Determinare un intervallo di confídenza al 95% per il tempo medio di vita. Per
giustificare il procedimento seguito, é necessarío conoscere la legge della v.a.
"tempo
di vita"? Spiegare la risposta.
b. Se, con gli stessi dati campionarí e lo stesso livello di confídenza, l'ampiezza
del
campione aumenta, l'ampiezza dell'intervallo di confídenza;
1^ aumenta;
diminuisce; |Q dipende ? Spiegare brevemente la risposta.
c. Se, con gli stessi dati campionarí e la stessa ampiezza del campione, il livello
di
confídenza aumenta, l'ampiezza dell'intervallo di confídenza;
aumenta;
diminuisce; Ю dipende ? Spiegare brevemente la risposta.
d. Se eseguiamo un nuovo campionamento con un campione di ampiezza maggiore e
físsiamo lo stesso livello di confídenza, l'ampiezza dell'intervallo di confídenza;
aumenta;
diminuisce;
dipende ? Spiegare brevemente la risposta.
e. Assumendo che il tempo di vita X segua una legge esponenziale (si stimi il
parametro dai dati campionarí), qual é la probabilitá che un componente che ha giá
4
mesi di vita flmzioni ancora per almeno 10 mesi?
4.29. II tempo di vita T di 100 componenti elettronici é stato registrato, e i dati
(espressi in mesi) sono raggruppati nella seguente tabella;
0 < T
2 < T
4 < T
6 < T
Totale
<
<
<
<
2
4
6
10
40
34
11
15
100
Si puo rítenere che la varíabile "tempo di vita" segua una legge esponenziale? Per
rispondere, si esegua un test chi quadro di adattamento al livello di
significativité del
5%.
4.30. Dalla misurazione della lunghezza di 15 chiodi prodotti da una fabbrica sono
stati ottenuti i seguenti valorí ¡n millimetrí;
138 130
143
140
136
129 137
136
135
131
272
143
136
142
140
132
a. Raggruppare questi dati in opportune class! di uguale ampiezza, dopo averli
ordinati in senso crescente (si consiglia di costruire 3 classi).
b. Costruire la tabella delle frequenze relative e percentuali.
c. Qual é la lunghezza media del campione di chiodi?
d Calcolare lo scostamento quadratico medio.
e. Disegnare I'istogramma di frequenze associato a questa distribuzione.
f. Si consider! ora un campione di 150 chiodi distribuiti tra le classi nel modo
prima
descritto (basta quindi moltiplicare per 10 ognuna delle frequenze assolute
calcolate
prima). E* noto che la lunghezza dei chiodi si distribuisce come una v.a. nórmale
di
media 136 mm. e varianza 25 mm^. Si adatta questa distribuzione teórica ai dati
empiric! qui analizzati? Rispondere a questa domanda eseguendo un test chi quadro
al
livello 0.05.
g. Si supponga ora di sapere solo che la lunghezza dei chiodi si distribuisce come
una
v.a. nórmale di media 136 mm. (e varianza incognita). Cosa cambia nel procedimento
seguito per effettuare il test? E se non si conoscesse neppure la media?
4.31. Campionando da una popolazione nórmale, si sono osservati i 4 valori;
2;
- 1 .8 ; 3;
-4 .1 .
< <Jo\ H \ :
>
ctq
273
^ ( x , - X2o)^ = 250.
t=i
Si determini un intervallo di confidenza al 95% per .
4.38. Per studiare la crescita di un certo tipo di pianta, un agricoltore misura
venti
piante del tipo prescelto ad un anno da quando sono state piantate, e ottiene i
seguenti
dati;
2.6
2.2
1.4
2.8
1.9
1.2
2.3
2.1
1.8
1.6
1.7
1.0
1.6
1.6
2.0
0.8
1.4
1.5
2.1
3.1
0
12
22 14
11
Totale
60
0
10
1
11
2
6
3
3
Totale
30
275
15
Totale
30
Daltonici
Normali
Maschio
38
442
Femmina
6
514
Daltonici
Normali
Maschio
q-Zq^
0 . 5 - q + 3q2
Femmina
0.5 - 3g2
a.
278
279
del campione, nel caso della stima sulla media di una popolazione nórmale con
varíanza incognita.
c. Si spieghi il significato della proposizione: "Con una confidenza del 90%, il
valore
p della media appartiene all'intervallo (2.3,2.5)". La parola "confidenza" si puó
sostituire con "probabilitá"? Perché?
d. Si descriva la procedura statistica che si puó adottare per eseguire un
sondaggio di
opinione consistente nel porre una sola domanda che ha solo due risposte possibili.
In
particolare, si discuta la scelta dell'ampiezza del campione, in relazione al
problema
della precisione e deH'afüdabilitá della stima.
15. Test di ipotesi.
a. Si spieghi il signifícate dei seguenti termini; ipotesi statistica; ipotesi
semplice e
ipotesi composta; ipotesi nulla e ipotesi alternativa; errore del primo tipo e del
secondo
tipo; regione di rifíuto; livello di signifícativitá; ampiezza del test; test
unilatero o
bilatero; p-value.
b. Si spieghino i criteri di scelta dell'ipotesi nulla, illustrandoli con opportuni
esempi.
c. Si supponga di voler eseguire un test sulla media di una popolazione nórmale, e
si
considerino le due situazioni seguenti;
/) Si é scelta l'ipotesi nulla H q. p > 3, e il test eseguito, al livello del 5%,
ha
portato a rifíutare l'ipotesi.
//) Si é scelta l'ipotesi nulla i/o P < 3, e il test eseguito, al livello del 5%,
ha
portato a non rifíutare l'ipotesi.
Le informazioni che otteniamo dal test nei due casi sono esattamente le stesse o
no? Spiegare.
d. Tra le seguenti due affermazioni, quale é piú forte (ow ero contiene piú
informazioni, ow ero implica l'altra)?
"I dati consentono di rifíutare l'ipotesi, al livello del 5%"
"I dati consentono di rifíutare l'ipotesi, al livello del 10%".
Stessa domanda per le due affermazioni;
"I dati non consentono di rifíutare l'ipotesi, al livello dell'1%"
"I dati non consentono di rifíutare l'ipotesi, al livello del 5%".
e. Si descrivano in dettaglio le situazioni in cui siamo in grado di eseguire un
test di
ipotesi su una popolazione non nórmale.
/
Si dica in quali casi conosciamo procedure per effettuare un test sull'uguaglianza
di
due medie o di due ífequenze, e si discutano le ipotesi di validitá di tali
procedure.
16. Test chi quadro di adattamento.
a. Si spieghi; qual é I'obiettivo di un test chi-quadro di adattamento; a che tipo
di
variabili si puó applicare; come si eífettua il raggruppamento delle osservazioni
in
classi; cosa sono le frequenze attese e come si determinano; qual é la statistica
utilizzata per effettuare il test; come si determinano i gradi di liberté della
legge chiquadro impiegata nel test.
b. Dopo aver effettuato un test chi-quadro di adattamento, possiamo dire che c'é un
buon adattamento dei dati alia distribuzione teórica se il p-value é prossimo a
zero o a
uno?
17. Test chi quadro di indipendenza.
a. A quali coppie di variabili si puó applicare il test chi-quadro di indipendenza?
b. Si spieghi come si calcolano le ífequenze attese e i gradi di libertá, in un
test chiquadro di indipendenza.
c. Si conffonti il test chi-quadro di indipendenza con la procedura vista in
statistica
descrittiva per valutare la correlazione tra due variabili (scatterplot,
coefficiente di
correlazione, retta di regressione) Quando sono applicabili entrambi i metodi?
Appendice A: Demande di verífíca
281
283
G. Software didattico
20. StataQuest4 per windows, Stata Corporation, Duxbury press.
Esegue calcoli e grafici di statistica descrittiva; test di ipotesi e intervalli di
confidenza
(statistica inferenziale); generazione di numeri casuali seconde le leggi più
comuni;
contiene molti files dimostrativi.
21. H. J. Newton, J. L. Harvill: StatConcepts. A visual tour o f Statistica Ideas.
Brooks/Cole Publishing Company, Duxbury press.
Contiene il programma StataQuest4 per windows, integrate da un menú ulteriore di
"laboratori", che visualizzano con grafici e simulazioni alcuni concetti
fondamentali
della statistica; distribuzioni notevoli, intervalli di confidenza, test di
ipotesi,
approssimazione normale, ecc.
22. Interactive probability per windows, Wadsworth Publishing Company. Duxbury
press.
Contiene 13 simulazioni di fenomeni aleatori, che permettono di visualizzare
grafici
delle densité teoriche assieme a quelli delle distribuzioni empiriche; in
particolare,
"visualizza" le leggi notevoli legate al processo di Bernoulli e di Poisson.
Appendice C.
Divulgazione dell'informazione statistica
La Società Italiana di Statistica ha presentato nel '94 un testo^ contenente alcune
rególe générait che sarebbe opportuno venissero tenute presenti da chi utilizza, a
fin i
di divulgazione mediante mass-media, risultati statistici, ed in modo particolare
risultati raggiunti con procedimenti campionari. Anche se moite di queste rególe
riguardano soprattutto le indagini statistiche di carattere sociale (che non sono
quelle che più interessano dal punto di vista ingegneristico), puà essere utile che
lo
studente che ha iniziato lo studio della statistica rifletta criticamente su queste
rególe.
1. Ciascuna statistica deve sempre essere accompagnata dalle indicazioni relative
alla
sua validité -temporale, spaziale ecc - e dalla corretta interpretazione del suo
contenuto
informativo. In particolare, le prévision! economiche e demografiche debbono essere
corredate dalle specifícazioni relative alla loro caratterizzazione (estrapolativa
e
neutrale, normativa, scenario più probabile, ecc.) e dalle condizioni al contorno
2. Qualora, nel corso di una ricerca, si abbia sentore dell'insorgere di fonti di
distorsione o comunque di imprecisione, quali reticenze da parte degli
intervistati,
incomprensione di specifici quesiti e simili, si porranno in essere i correttivi
necessari e
sempre si segnaleranno esplicitamente i fenomeni stessi, nella relazione técnica
che
accompagna la esposizione dei risultati, specificandone limiti e condizioni di
validité.
3. Le statistiche non campionarie^ debbono essere preséntate con l'indicazione
degli
aspetti che inevitabilmente introducono approssimazioni ed errori. Ogni sforzo deve
essere fatto per valutare direzione e intensité, quindi ordine di grandezza delle
possibili
imprécision!. Non si deve creare la illusione di una esattezza assoluta in un dato
perché
non campionario. Cosi, ad esempio, l'indicazione della numerosité della popolazione
italiana ai censimenti è espressa in unité a fíni burocratici e amministrativi. Ma
saré
opportuno accompagnare i dati censuali con idonee note di valutazione, usuali in
moiti
paesi. La "cultura dell'approssimazione" di ogni dato comporta peraltro un giusto
equilibrio tra onesté scientifîca e rischio di ingenerare una impropria reazione di
sfíducia.
4. Si dovranno tutelare i termini stessi di campione e sondaggio, da utilizzare
esclusivamente quando ci si possa riferire ad una popolazione individuata e
possibilmente ben caratterizzata, nonché si utilizzi un algoritmo di selezione
della
medesima. Invece, la raccolta di indicazioni sollecitate nel corso di una
trasmissione
radiofónica o televisiva o da una "testata" giomalistica rappresenteré soltanto
l'opinione dei più attivi e motivati tra gli ascoltatori o lettori. In questo caso
non
dovrebbe essere lecito adottare il termine di campione o sondaggio. II dato che se
ne
ottiene non è riferibile, nell'esempio in questione, a tutto il pubblico della
trasmissione
o dei lettori, né tanto meno rappresenteré l'opinione della intera popolazione
italiana.
Esso risulta da un'autoselezione e non dall'applicazione di un criterio obiettivo
di scelta
di natura probabilistica. Perianto non appaiono pertinent! qualifiche con preciso
contenuto técnico.
' II testo, qui riportato in forma stralciata, è tratto dalla rivista "Induzioni -
Demografía, probabilitá,
statistica a scuola", n® 9, 1994, pp.65-69.
^ Cioé quelle che nel testo abbiamo chiamato "indagini totali".
286
r—
oo
jCLQfl.
dt = P {Z < x)
con Z ~ N{Q, 1)
y 2TT
0,01
0.02
0,03
0,04
0,06
0,06
0,07
0,08
0,09
0,0
0,50399
0,50798
0,51197
0,52392
0.52790
0,53188
0,53586
0,54380
0,54776
0,55172
0,51595
0,55567
0,51994
0.1
0,55962
0,56356
0,56749
0,57142
0.57535
0¿
0.58317
0,58706
0,59095
0,59483
0,59871
0,60257
0,60642
0,61026
0.61409
0.3
0,62172
0.62552
0,62930
0,63307
0,63683
0,64431
0,64803
0.65173
0,4
0.65910
0,66276
0,66640
0,67003
0,67364
0.64058
0.67724
0,68082
0,68439
0.68793
0.6
0,69497
0,69847
0,70194
0,70540
0,70884
0,72907
0,73237
0,73565
0,73891
0,74215
0.71226
0.74537
0,71566
0.74857
0.71904
0.6
0,75175
0,72240
0,75490
0,7
0.76115
0.76424
0,76730
0,77035
0,77337
0,77637
0,77935
0,78230
0,78524
0.8
0,79103
0,79389
0,79673
0,79955
0,80234
0,80511
0.80785
0,81057
0,81327
0.9
0.81859
0,82121
0,82381
0,82639
0,82894
0,83147
0,83398
0.83646
0,83891
1.0
0.84134
0,84375
0,84614
0,84849
0,85083
0,85314
0,85543
0,85769
0,85993
0,86214
1.1
0.86433
0,86650
0,86864
0.87076
0,87286
0.87493
0,87698
0.87900
0,88100
0.88298
1.2
0.88493
0,88686
0,88877
0,89065
0,89251
0,89435
0,89617
0.89796
0.89973
0,90147
1.3
0.90320
0.90490
0,90658
0.90824
0,90988
0,91149
0,91308
0,91466
0.91621
0,91774
1.4
0.91924
0,92073
0,92220
0.92364
0,92507
0.92647
0.92785
0.92922
0,93056
0,93189
1.5
0.93319
0,93448
0,93574
0,93699
0,93822
0.93943
0,94062
0.94179
0,94295
0,94408
1.6
0.94520
0,94630
0,94738
0,94845
0,94950
0.95053
0,95154
0,95254
0,95352
0,95449
0,96080
0,96164
0,96246
0,96327
1.7
0.95543
0,95637
0,95728
0,95818
0,95907
0.95994
1.8
0.96407
0,96485
0,96562
0,96638
0,96712
0,96784
0,96856
0.96926
0,96995
0.97062
1.9
0.97128
0,97193
0,97257
0.97320
0,97381
0,97441
0,97500
0,97558
0.97615
0.97670
2.0
0,97725
0.97882
0,97932
0,97982
0,98030
0,98077
0,98124
0,98169
2.1
0.97778
0.98257
0,97831
0.98214
0,98300
0.98341
0,98382
0,98422
0,98461
0,98500
0,98537
0,98574
2.2
0.98610
0,98645
0,98679
0,98713
0.98745
0.98778
0,98809
0,98840
0.98870
0,98899
2.3
0,98928
0,98956
0,98983
0,99010
0,99036
0,99061
0,99086
0,99111
0,99134
0,99158
2.4
0,99180
0.99202
0.99224
0,99245
0,99266
0.99286
0,99305
0,99324
0,99343
0,99361
0,99413
0,99430
0,99446
0.99461
0,99477
0,99492
0,99506
0,99520
2.6
0.99534
0,99396
0,99547
0,99560
0,99573
0,99585
0,99598
0,99609
0.99621
0.99632
0,99643
2.7
0.99653
0,99664
0,99674
0,99683
0,99693
0.99702
0,99711
0,99720
0.99728
0,99736
2.8
0.99744
0,99752
0,99760
0,99767
0,99774
0.99781
0,99841
0,99788
0,99795
0.99801
0.99807
0,99846
0,99851
0,99856
0,99861
2.5
0.99379
2.9
0.99813
0,99819
0,99825
0.90
1.2816
0,99831
0.95
1.6449
0,99836
0.975
1.96
0.99
2.3263
0.995
2.5758
0.999
3.0902
0.9995
3.2905
Za)
P{Z >
Ct
û;
Zx-a)
=
Q
con T ~ t{n)
0.9
0,95
0,975
0,99
0,995
1
2
3
4
5
6
7
8
9
10
3,07768
1,88562
1,63775
1,53321
1,47588
1,43976
1,41492
1,39682
1,38303
1,37218
6,31375
2,91999
2,35336
2,13185
2,01505
1,94318
1,89458
1,85955
1,83311
1,81246
12,70615
4,30266
3,18245
2,77645
2,57058
2,44691
2,36462
2,30601
2,26216
2,22814
31,82096
6,96455
4,54071
3,74694
3,36493
3,14267
2,99795
2,89647
2,82143
2,76377
63,65590
9,92499
5,84085
4,60408
4,03212
3,70743
3,49948
3,35538
3,24984
3,16926
11
12
13
14
15
16
17
18
19
20
1,36343
1,35622
1,35017
1,34503
1,34061
1,33676
1,33338
1,33039
1,32773
1,32534
1,79588
1,78229
1,77093
1,76131
1,75305
1,74588
1,73961
1,73406
1,72913
1,72472
2,20099
2,17881
2,16037
2,14479
2,13145
2,11990
2,10982
2,10092
2,09302
2,08596
2,71808
2,68099
2,65030
2,62449
2,60248
2,58349
2,56694
2,55238
2,53948
2,52798
3,10582
3,05454
3,01228
2,97685
2,94673
2.92079
2,89823
2.87844
2.86094
2,84534
21
22
1,32319
1,32124
23
24
25
26
27
28
29
30
1,31946
1,31784
1,31635
1,31497
1,31370
1,31253
1,31143
1,31042
1,72074
1,71714
1,71387
1,71088
1,70814
1,70562
1,70329
1,70113
1,69913
1,69726
2,07961
2,07388
2,06865
2,06390
2,05954
2,05553
2,05183
2,04841
2,04523
2,04227
2,51765
2,50832
2,49987
2,49216
2,48510
2,47863
2,47266
2,46714
2,46202
2,45726
2.83137
2.81876
2,80734
2,79695
2,78744
2.77872
2.77068
2,76326
2,75639
2,74998
40
50
60
70
80
90
100
110
120
1,30308
1,29871
1,29582
1,29376
1,29222
1,29103
1,29008
1,28930
1,28865
1,68385
1,67591
1,67065
1,66692
1,66413
1,66196
1,66023
1,65882
1,65765
2,02107
2,00856
2,00030
1,99444
1,99007
1,98667
1,98397
1,98177
1,97993
2,42326
2,40327
2,39012
2,38080
2,37387
2,36850
2,36421
2,36072
2,35783
2,70446
2,67779
2,66027
2,64790
2,63870
2,63157
2,62589
2,62127
2,61742
Pern > 120, si approssima ta{n) con Zq (quantile della normale standard)
P{T < t a { n ) )
= a
P (T > íi-o(n)) = Q
P { y < xl(n))
chi-quadro
con
^ X^(n)
0.01
0,025
0.05
0.95
0.975
0.99
0,00016
3,84146
5,02390
6.63489
0,02010
0,00098
0,05064
0,00393
0,10259
5,99148
7,37778
9,21035
0,11483
0,21579
0,35185
7.81472
9,34840
11.34488
0,29711
0,48442
0,71072
9,48773
11.14326
0,55430
0,83121
1,14548
11,07048
12,83249
13.27670
15,08632
0,87208
1,23734
1,63538
12,59158
14,44935
16,81187
1,23903
1,68986
2,16735
14,06713
16,01277
18.47532
1,64651
2,17972
2,73263
15,50731
17,53454
20,09016
2,08789
2,70039
3,32512
16,91896
19,02278
21,66605
10
2,55820
3,24696
3,94030
18,30703
20,48320
23,20929
11
3,05350
3,81574
4,57481
19,67515
21,92002
24.72502
12
3,57055
4,40378
5,22603
21,02606
23,33666
26,21696
13
4,10690
5,00874
5,89186
22,36203
24,73558
27,68818
14
4,66042
5,62872
6,57063
23,68478
26,11893
29,14116
15
5,22936
6,26212
7,26093
24,99580
27,48836
30,57795
16
5,81220
6,90766
7,96164
26,29622
28,84532
31,99986
17
6,40774
7,56418
8,67175
27.58710
30,19098
33.40872
18
7,01490
8,23074
9,39045
28,86932
31.52641
34,80524
19
7,63270
8,90651
10,11701
30,14351
32,85234
36.19077
20
8,26037
9,59077
10,85080
31,41042
34,16958
37,56627
21
8,89717
10,28291
11,59132
32,67056
35,47886
38,93223
22
9,54249
10,98233
12,33801
33,92446
36,78068
40,28945
23
10,19569
11,68853
13,09051
35,17246
38,07561
41,63833
24
10,85635
36,41503
39.36406
42,97978
11,52395
12,40115
13,11971
13,84842
25
14,61140
37.65249
40,64650
44,31401
26
12,19818
13,84388
15,37916
38,88513
41,92314
45,64164
27
12,87847
14,57337
16,15139
40,11327
43,19452
46,96284
28
13,56467
15,30785
16,92788
41.33715
44,46079
48.27817
29
14,25641
16,04705
17,70838
42,55695
45,72228
49.58783
30
14,95346
16,79076
18,49267
43,77295
46,97922
50,89218
Per n
> 30
P(Y<xl{n)) = a
P (r> xta(^ ))
■ P(x!^(") < Y < X i ^ ( n ) ) = a
\/^ +
= «
con F ~ F(A:,m)
1
F o .9 5 ( fc ,m )
3
4
1
6
8
2
7
0
12
15
20
K fn
30
60
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,41 19,43 19,45 19,46 19,48
3
4
6
6
7
8
8
10
11
12
13
14
16
16
17
18
19
20
21
22
23
24
26
26
27
28
29
30
40
60
120
10,13
7.71
6,61
5,99
5,59
5,32
5.12
4.96
9,55
6,94
5,79
5.14
4,74
4.46
4.26
4.10
9,28
6,59
5.41
4.76
4.35
4,07
3.86
3.71
9,12
6,39
5.19
4.53
4.12
3,84
3,63
3.48
9.01
6,26
5,05
4.39
3,97
3,69
3.48
3.33
8,94
6.16
4.95
4,28
3.87
3.58
3,37
3,22
8,89
6,09
4,88
4.21
3,79
3,50
3,29
3.14
8,85
6,04
4.82
4.15
3.73
3.44
3,23
3,07
8.74
5,91
4,68
4.00
3,57
3,28
3,07
2,91
8,70
5.86
4.62
3,94
3,51
3,22
3,01
2,85
8,66
5,80
4.56
3,87
3,44
3,15
2,94
2.77
8.62
5,75
4.50
3,81
3,38
3,08
2.86
2,70
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
4.84
4.75
4,67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
3.98
3.89
3,81
3.74
3.68
3.63
3.59
3,55
3.52
3,49
3,59
3,49
3.41
3.34
3,29
3,24
3,20
3,16
3,13
3.10
3,36
3,26
3.18
3.11
3,06
3,01
2.96
2,93
2,90
2,87
3.20
3.11
3,03
2.96
2.90
2,85
2,81
2.77
2.74
2.71
3,09
3,00
2.92
2.85
2,79
2.74
2,70
2,66
2,63
2,60
3.01
2,91
2,83
2,76
2.71
2,66
2,61
2,58
2.54
2.51
2.95
2.85
2.77
2,70
2,64
2,59
2,55
2.51
2.48
2.45
2,79
2.69
2,60
2.53
2.48
2,42
2,38
2.34
2,31
2,28
2.72
2.62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2.65
2.54
2,46
2,39
2,33
2,28
2,23
2.19
2,16
2,12
2.57
2.47
2.38
2.31
2,25
2.19
2.15
2.11
2,07
2.04
2,49
2,38
2,30
2,22
2,16
2.11
2,06
2,02
1,98
1,95
4.32
4.30
4.28
4.26
4,24
4.23
4.21
4.20
4.18
4.17
3.47
3,44
3,42
3.40
3,39
3,37
3,35
3.34
3.33
3,32
3,07
3.05
3.03
3.01
2.99
2.98
2,96
2.95
2,93
2,92
2,84
2,82
2.80
2,78
2.76
2.74
2.73
2.71
2.70
2,69
2,68
2,66
2.64
2.62
2.60
2,59
2.57
2.56
2.55
2,53
2.57
2.55
2,53
2.51
2.49
2.47
2.46
2.45
2.43
2,42
2,49
2,46
2,44
2.42
2,40
2,39
2,37
2.36
2,35
2,33
2,42
2.40
2,37
2.36
2.34
2,32
2,31
2.29
2.28
2,27
2.25
2,23
2,20
2,18
2,16
2.15
2,13
2,12
2,10
2,09
2.18
2.15
2.13
2.11
2.09
2,07
2,06
2,04
2,03
2.01
2,10
2,07
2,05
2,03
2,01
1.99
1.97
1,96
1.94
1,93
2,01
1.98
1,96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1,92
1,89
1,86
1.84
1,82
1,80
1.79
1.77
1.75
1.74
4,08
4,00
3,92
3,23
3,15
3,07
2,84
2,76
2,68
2,61
2,53
2.45
2.45
2,37
2,29
2.34
2.25
2.18
2,25
2.17
2,09
2,18
2,10
2,02
2,00
1.92
1,83
1,92
1.84
1.75
1.84
1.75
1,66
1.74
1.65
1.55
1.64
1,53
1.43
Tabella del quantili i^o.976(fc»
0.975 = P {F < Fo,975{k, m))
K tn
2
3
4
6
6
7
8
9
10
12
16
20 30
60
38,51 39,00 39,17 39.25 39,30 39,33 39,36 39,37 39.41 39.43 39,45 39.46 39,48
17,44 16,04 15,44 15,10 14,88 14.73 14,62 14,54 14,34 14,25 14.17 14,08 13.99
12,22 10,65 9,98 9.60 9,36 9,20 9,07 8.96 8.75 8,66 8.56 8.46 8,36
10,01 8,43 7.76 7,39 7.15 6.98 6.85 6,76 6,52 6.43 6.33 6.23 6.12
8,81 7.26 6.60 6,23 5,99 5,82 5,70 5,60 5,37 5.27 5.17 5.07 4.96
8.07 6,54 5.89 5,52 5.29 5.12 4,99 4.90 4.67 4.57 4,47 4,36 4.25
7.57 6,06 5.42 5,05 4.82 4.65 4.53 4,43 4.20 4,10 4,00 3,89 3.78
7,21 5,71 5.08 4.72 4,48 4.32 4.20 4,10 3,87 3.77 3.67 3.56 3.45
6,94 5.46 4,83 4.47 4.24 4.07 3.95 3,85 3.62 3.52 3.42 3.31 3.20
4.63
4,47
4.35
4.24
4.15
4.08
4.01
3.95
3.90
3.86
4.28
4.12
4.00
3.89
3,80
3.73
3,66
3.61
3,56
3,51
4.04
3.89
3.77
3.66
3,58
3,50
3.44
3,38
3,33
3.29
3.88
3.73
3,60
3,50
3.41
3.34
3,28
3,22
3.17
3.13
3.76
3.61
3.46
3.38
3,29
3,22
3.16
3.10
3.05
3,01
3.66
3,51
3,39
3.29
3,20
3.12
3,06
3,01
2.96
2.91
3.43
3.28
3,15
3.05
2.96
2.89
2,82
2.77
2.72
14
6.72
6,55
6.41
6,30
16
6,20
16
6,12
17
18
19
6,04
5,98
5,92
5.07
5.26
5.10
4,97
4,86
4,77
4,69
4,62
4,56
4,51
4.46
5,83
5,79
5,75
5.72
5,69
5,66
5,63
5,61
5,59
5.57
4.42
4,38
4.35
4.32
4.29
4.27
4,24
4.22
4,20
4.10
3,82
3,78
3,75
3.72
3,69
3,67
3,65
3.63
3,61
3.59
3.48
3.44
3.41
3,38
3,35
3,33
3,31
3.29
3,27
3.25
3.25
3.22
3.18
3.15
3,13
3,10
3.06
3.06
3.04
3,03
3,09
3,05
3,02
2.99
2,97
2,94
2,92
2,90
2.07
2,97
2,93
2,90
2,87
2.85
2,82
2,80
2,78
2.76
2.75
5.42
5,29
5,15
4,05
3,93
3,80
3.46
3,34
3,23
3.13
3.01
2.89
2.90
2.79
2.67
2.74
2,63
2,52
2.62
2.51
2.39
11
12
13
20
21
22
23
24
26
26
27
28
29
30
40
60
120
Fo.97b{k,m)
2.88
2.68
3.33
3.18
3.05
2.95
2,86
2,79
2.72
2,67
2,62
2.57
3.23
3.07
2,95
2,84
2,76
2.68
2,62
2.56
2.51
2,46
3.12
2,96
2,84
2,73
2,64
2.57
2,50
2,44
2,39
2,35
3.00
2,85
2.72
2,61
2.52
2.45
2.38
2.32
2.27
2,22
2,87
2,84
2,81
2,78
2.75
2,73
2.71
2,69
2.67
2,65
2,64
2,60
2.57
2.54
2.51
2.49
2.47
2.45
2.43
2.41
2.53
2.50
2.47
2.44
2.41
2.39
2,36
2.34
2,32
2,31
2.42
2,39
2,36
2.33
2,30
2.18
2.14
2.20
2.31
2,27
2.24
2,21
2,18
2,16
2.13
2,11
2.09
2.07
2,53
2.41
2.30
2.29
2.17
2.05
2.18
2.06
1.94
2.07
1.94
1,02
1.94
1.62
1,69
2,20
2.25
2.23
2.21
2.11
2,08
2.05
2,03
2.00
1,98
1.96
1,94
1,80
1.67
1.53