Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
BUCURESTI
PROBABILITATI SI STATISTICA
Viorel PETREHUS, Sever-Angel POPESCU
BUCURESTI 2005
Cuprins
Cuvnt nainte
Probabilit
ati
1 Denitia probabilit
atii
1.1 Denitia clasic
a . . . . . . . . . . .
1.2 Denitia axiomatic
a a probabilit
atii
1.3 Probabilit
ati conditionate . . . . .
1.4 Rezumat . . . . . . . . . . . . . . .
1.5 Exercitii . . . . . . . . . . . . . . .
2 Variabile aleatoare simple
2.1 Denitie si propriet
ati . . . . .
2.2 Spatiul de probabilitate produs
2.3 Rezumat . . . . . . . . . . . . .
2.4 Exercitii . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
3
6
9
10
.
.
.
.
14
14
19
20
21
3 Cmpuri de probabilitate
24
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
25
27
.
.
.
.
.
30
32
33
37
39
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
CUPRINS
ii
4 Legi clasice
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
43
Repartitia binomial
a . . . . . . .
Repartitia Poisson . . . . . . . .
Repartitia uniform
a. . . . . . . .
Repartitia Normal
a . . . . . . . .
Repartitia exponential
a negativ
a
Repartitia Gamma . . . . . . . .
Repartitia X2 (hi p
atrat) . . . . .
Repartitia Student . . . . . . . .
Rezumat . . . . . . . . . . . . . .
Exercitii . . . . . . . . . . . . . .
5 Legi limit
a
5.1 Legea numerelor mari . .
5.2 Teoreme limit
a central
a.
5.3 Rezumat . . . . . . . . .
5.4 Exercitii . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43
44
46
46
51
51
53
54
55
56
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
60
61
63
68
69
Coecientul de corelatie . . . . .
Variabile aleatoare bidimensionale
Functia de repartitie conditionat
a
Distributia sumei si ctului . . . .
6.4.1 Distributia sumei . . . . .
6.4.2 Distributia ctului . . . .
6.5 Distributia Student . . . . . . . .
6.6 Distributia Snedecor-Fisher . . .
6.7 Exercitii . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
72
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
72
74
79
81
81
82
82
84
85
7 Procese aleatoare
89
7.1 Procese Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2 Procese Markov discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3 Procese de nastere si moarte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.3.1 Model de asteptare cu o singur
a statie de deservire si un num
ar mare
de unit
ati ce au nevoie de serviciile statiei
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.2 Model de asteptare cu o singur
a statie
iar num
arul de unit
ati care au nevoie de serviciile statiei este limitat la
o valoare dat
a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
CUPRINS
7.3.3
Model de asteptare cu n
deservite (1<n<N) . . .
7.4 Procese aleatoare stationare . .
7.5 Exercitii . . . . . . . . . . . . .
II
iii
statii de
. . . . .
. . . . .
. . . . .
deservire si
. . . . . . .
. . . . . . .
. . . . . . .
cu N
. . .
. . .
. . .
unit
ati ce
. . . . . .
. . . . . .
. . . . . .
trebuie
. . . . . 99
. . . . . 99
. . . . . 102
Statistic
a
106
8 Statistica descriptiv
a
107
8.1
Statistica unei variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.2 Statistica a dou
a variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.3 Exercitii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9 Statistici. Estimarea parametrilor
9.1 Principiul verosimilit
atii maxime . . . . . . . . . . . . . . . . . . . . . .
9.2 Metoda momentelor (K. Pearson) . . . . . . . . . . . . . . . . . . . . . .
9.3 Exercitii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
118
125
129
130
10 Intervale de ncredere
10.1 Intervale de ncredere pentru medie . . . . . . . .
10.1.1 Dispersia este cunoscut
a. . . . . . . . . .
10.1.2 Dispersia este necunoscut
a . . . . . . . .
10.2 Intervale de ncredere pentru dispersie . . . . . .
10.3 Intervale de ncredere pentru ctul a dou
a dispersii
10.4 Intervale de ncredere n cazul unor selectii mari .
10.5 Rezumat . . . . . . . . . . . . . . . . . . . . . . .
10.6 Exercitii rezolvate . . . . . . . . . . . . . . . .
10.7 Exercitii . . . . . . . . . . . . . . . . . . . . . . .
132
133
134
135
136
137
138
139
141
142
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
CUPRINS
12 Testul neparametric 2
12.1 Principiul testului 2 . . . . . . . . . . . .
12.1.1 Teste asupra formei unei distributii
12.1.2 Teste de independent
a . . . . . . .
12.1.3 Teste de omogenitate . . . . . . . .
12.2 Rezumat . . . . . . . . . . . . . . . . . . .
12.3 Exercitii rezolvate . . . . . . . . . . . . .
12.4 Exercitii . . . . . . . . . . . . . . . . . . .
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
174
174
179
179
180
184
185
187
.
.
.
.
.
.
190
190
192
195
196
196
197
.
.
.
.
.
.
200
200
202
204
205
207
210
Cuvnt nainte
Cursul de fata a fost scris n perioada 1996-1997 de c
atre Viorel Petrehus (partea I, probabilit
ati) si Sever-Angel Popescu (partea a II-a, statistic
a) pentru studentii anului II din
Universitatea Tehnic
a de Constructii Bucuresti si a ap
arut n 1997 multiplicat n atelierele
universit
atii. El a fost gndit n 14 lectii, cte una pe s
apt
amn
a, pe parcursul unui semestru.
Fiecare lectie se ncheie cu exercitii.
Autorii sunt recunosc
atori tuturor celor care au contribuit cu observatiile lor la buna
organizare a materialului prezentat.
Autorii
Partea I
Probabilit
ati
Lectia 1
Denitia probabilit
atii
1.1
Denitia clasic
a
doi asi
trei asi
z }| { z }| { z }| {
2
1
4 C32
+ C42 C32
+ C43 1 = 2180
2
TII
LECTIA
1. DEFINITIA
PROBABILITA
1.2
Denitia axiomatic
a a probabilit
atii
c)Distributivitatea
A _ (B _ C) = (A _ B) _ C
A ^ (B ^ C) = (A ^ B) ^ C
A ^ (B _ C) = (A ^ B) _ (A ^ C)
A _ (B ^ C) = (A _ B) ^ (A _ C)
TII
LECTIA
1. DEFINITIA
PROBABILITA
d) Absorbtia
e)Legile lui Morgan
(A \ B) [ A = A
(A [ B) \ A = A
A_B =A^B
A^B =A_B
f)Evenimentele 1 si 0 se caracterizeaz
a prin
0 ^ A = 0; 0 _ A = A
1 ^ A = A; 1 _ A = 1
g)Evenimentul non A sau contrarul lui A are propriet
atile:
A^A=0 A_A=1
Remarc
am c
a aceste relatii sunt adev
arate dac
a A; B;.. sunt propozitii, iar 0 este propozitia totdeauna fals
a si 1 este propozitia totdeauna adev
arat
a.
O multime de evenimente cu propriet
atile de mai sus se numeste cmp de evenimente sau
algebr
a de evenimente sau algebr
a Boole. Relatiile de mai sus nu sunt independente, deci nu
formeaz
a un set minimal de axiome pentru algebrele Boole. Pe de alt
a parte ele implic
a alte
atoarea teorem
a a lui Stone descrie asemenea
relatii importante, ca de exemplu A = A. Urm
cmpuri de evenimente prin submultimi.
Teorema 1.5 (Stone)Fie M o multime de evenimente cu proprietatile de mai sus. Atunci
exista o multime X si o submultime
P (X) cu proprietatile :
1); 2
; X 2
2)A,B2
) A [ B 2
3)A,B2
) A B 2
si o bijectie : M !
astfel ca:
a)(A _ B) = (A) [ (B)
b)(A ^ B) = (A) \ (B)
c)(A) = (A)
(0) = ; (1) = X
Teorema arat
a c
a n esenta orice cmp de evenimente poate reprezentat prin submultimi
ale aceleiasi multimi X. Operatiei si ntre evenimente i corespunde intersectia submultimilor,
operatiei sau i corespunde reuniunea, negatiei i corespunde complementara, evenimentul
sigur corespunde multimii totale X, iar evenimentul imposibil corespunde cu multimea vid
a.
Denitia 1.6 O multime
P (X) cu proprietatile 1,2,3 din teorema lui Stone se numeste
clan, algebra de evenimente sau cmp de evenimente. Uneori o vom numi algebra de multimi.
TII
LECTIA
1. DEFINITIA
PROBABILITA
Ai 2
si
a) Daca A1 ; A2 ; :::An 2
atunci
i=1::n
i=1:n
b) Daca A2
atunci A 2
:
Ai ) =
i=1::n
n
X
p(Ai )
(1.1)
TII
LECTIA
1. DEFINITIA
PROBABILITA
Exemplul 1.11 Se arunca doua zaruri. Pot apare toate perechile de fete (i,j) cu 1 i 6
si 1 j 6, n numar de 36. Fie X multimea acestor perechi. Fie
= P (X) si p :
! R
de elemente din A
denita prin p (A) = numar
. Functia p denita n acest fel este o probabilitate n
numar de elemente din X
sensul denitiei anterioare. Numarul de elemente din X reprezinta numarul cazurilor posibile,
iar numarul de elemente din A reprezinta numarul cazurilor favorabile. In acest fel denitia
clasica a probabilitatilor este cuprinsa n denitia axiomatica de mai sus.
Acum putem s
a d
am o solutie pentru problema pus
a n exemplul 4.
Exemplul 1.12 Fie X=[0,1][0,1]. Fie
P (X) formata din submultimile lui X cu frontiera formata dintr-un numar nit de curbe de clasa C 1 pe portiuni (adica ecare curba poate
avea cel mult un numar nit de puncte unde sa nu e cu derivata continua). Se verica usor
ca
este o algebra de mu`ltimi. Denim acum probabilitatea prin
p(A) =
aria(A)
aria(X)
pentru A 2
Este clar ca p astfel denita satisface conditiile din denitia axiomatica a probabilitatii. In
raport cu aceasta probabilitate evenimentul din exemplul 4 este reprezentat prin A={(x; y) 2
X j y > x} pentru care p(A) = 1=2. Asemenea probabilitati n care X este o submultRime n
f ()d
R, R2 ; R3 , unde
este este formata din submultimi cu arie ale lui X, iar p (A) = R A f ()d
X
se numesc probabilitati geometrice. Functia f n aceasta denitie se mai numeste pondere sau
densitate si trebuie sa e positiva.
1.3
Probabilit
ati conditionate
Fie (X,
;p) un cmp de probabilitate, B n
, p(B)> 0:
TII
LECTIA
1. DEFINITIA
PROBABILITA
p(A \ B)
p(B)
(1.2)
pB (A1 [ A2 ) =
B)
sunt independente.
(A,B),
(A,
Demonstratie. Prin denitie p(A \ B) = p(A)p(B): Deoarece A = (A \ B) [ (A \ B)
(reuniune disjunct
a), avem
= p(A)p(B) + p(A \ B)
p(A) = p(A \ B) + p(A \ B)
de unde rezult
a
= p(A)
p(A \ B)
p(A)p(B) = p(A)(1
p(B)) = p(A)p(B)
: Analg se demonstreaz
a independenta si n celelalte cazuri.
n mod analog se deneste independenta mai multor evenimente:
Denitia 1.17 A1 ; A2 ; :::An sunt independente daca pentru orice k n si orice evenimente
Ai1 ; Ai2 ; ::Aik dintre cele A1 ; ::An date avem
p(Ai1 \ Ai2 \ ::Aik ) = p(Ai1 )p(Ai2 )::p(Aik ):
Analog cu propozitia anterioar
a se poate demonstra si
(1.3)
TII
LECTIA
1. DEFINITIA
PROBABILITA
2) Ai \ Aj = ; pentru orice i 6= j:
Avem urm
atoarea
(1.5)
Q.E.D.
Formula urm
atoare, numit
a formula lui Bayes, ne d
a probabilitatea ca dup
a ce stim c
a
un eveniment ce poate apare din mai multe cauze s-a realizat, acesta s
a se realizat dintr-o
cauz
a anume. Enuntul precis este:
Propozitia 1.21 (Bayes)Fie (X;
; p) un cmp de probabilitate si A1 ; A2 ; ::An o partitie a
lui X. Fie B un eveniment cu probabilitate nenula. Atunci:
Demonstratie.
p(Ai )p(BjAi )
p(Ai jB) = Pn
j=1 p(Aj )p(BjAj )
p(Ai jB) =
(1.6)
p(B \ Ai )
p(Ai )p(BjAi )
= Pn
p(B)
j=1 p(Aj )p(BjAj )
Exemplul 1.22 n trei urne cu bile albe si negre avem compozitiile: 4+6, 2+8, 4+1. Se pun
toate bilele la un loc si se extrage o bila la ntmplare. Se constata ca este alba. Care este
probabilitatea ca ea sa provenit din urna a treia?
TII
LECTIA
1. DEFINITIA
PROBABILITA
10
25
4
10
10
25
10
25
4
5
2
10
5
25
4
5
2
5
Observatia 1.23 Daca alegerea unei bile s-ar facut dupa regulile: i)se alege la ntmplare
o urna; 2)din urna aleasa se extrage la ntmplare o bila; atunci am avea p(A1 ) = p(A2 ) =
p(A3 ) = 31 si tot formula lui Bayes conduce la p(A3 jB) = 47 .
1.4
Rezumat
TII
LECTIA
1. DEFINITIA
PROBABILITA
1.5
10
Exercitii
3. La un teatru sunt 2n persoane la coada la bilete. n persoane au bancnote de 500 lei iar
celelalte n persoane au bancnote de 1000 lei. Un bilet costa 500 lei. Care este probabilitatea
ca asezindu-se ntmplator la coada sa poata toate persoanele sa-si cumpere bilet, stiind ca
initial n casa nu este nici un leu si ecare persoana primeste restul de la casa?
Solutie Ca s
a num
ar
am asez
arile n care toti -si pot cump
ara bilete, reprezent
am ntr-un
sistem xOy pe cele 2n persoane prin puncte n 1,2,3..2n pe Ox. Fiec
arei asez
ari i asociem o
functie denit
a pe 0; 2n prin f(0)=0 si f(i)=f(i-1)+1 dac
a persoana i de la rnd are 1000 lei
si f(i)=f(i-1)-1 dac
a persoana i are 500 lei. Fiecare traiectorie ncepe n (0,0) si se termin
a n
(2n,0), deoarece de cte ori se urc
a se si coboar
a. Num
arul aranj
arilor la coad
a este n!n!Cn2n
a num
arul de alegeri ale locurilor de c
atre cei cu 500 lei (sau num
arul
unde Cn2n reprezint
traiectoriilor) iar n! reprezint
a num
arul de permut
ari celor cu 500 lei sau cu 1000 lei intre
ei. O traiectorie reprezint
a o asezare nefavorabil
a dac
a pentru un i avem f(i)=1. n acest caz
primul i cu proprietatea de mai sus reprezinta cel cu 1000 lei care nu mai poate primi rest de la
cas
a. Considernd simetrica acestei traiectorii de la acest i fata de y=1 obtinem o traiectorie
ce se termin
a n (2n,2) si are n+1 urcusuri si n-1 coborsuri. Num
arul traiectoriilor de acest
n+1
fel este Cn+1
,
deci
num
a
rul
cazurilor
nefavorabile
este
n!n!C
:
Probabilitatea
este deci
2n
2n
p=
n+1
n
n!n!C2n
n!n!C2n
1
=
n
n!n!C2n
n+1
4. Fie (X;
; p) un cmp de probabilitate si A1 ; A2 ; ::An evenimente din
: Sa se arate
TII
LECTIA
1. DEFINITIA
PROBABILITA
11
ca
p( [ Ai ) =
i=1::n
n
X
p(Ai )
i=1
i6=j6=k
i6=j
(1.7)
p(Ai \ Aj )
p(Ai \ Aj \ Ak ) +
p(
i=1::n+1
Ai ) = p(B [ An+1 )
= p(B) + p(An+1 ) p(B \ An+1 )
= (f ormula 1.7 ) + p(An+1 ) p( [ Bi )
i=1::n
5. O persoana scrie n scrisori catre n persoane distincte, le pune n n plicuri si apoi scrie
adresele la ntmplare. Care este probabilitatea ca cel putin o scisoare sa ajunga la destinatarul
potrivit? (problema concordantelor).
Indicatie. Fie Ak evenimentul ce const
a n faptul c
a persoana k primeste scrisoarea potriv(n 1)!
2
it
a. p(Ak ) = n! = 1=n. Exist
a Cn evenimente de tipul Ai \ Aj si ecare are probabilitatea
(n 2)!
(deoarece dou
a persoane primesc scrisorile potrivite iar celelalta n-2 persoane primesc
n!
scrisorile ntmpl
ator n (n 2)! feluri. Analog, exist
a Cn3 evenimente de tipul Ai \ Aj \ Ak
si ecare are probabilitatea (nn!3)! , etc. Aplicnd formula de mai sus rezult
a:
p = n
=
1
1!
1
n
Cn2
(n
2)!
n!
1
1
+ + :::
2! 3!
+ Cn3
(n
3)!
n!
+ :::
6. Doua persoane A si B s-au nteles sa se ntlneasca ntr-un anumit loc ntre orele 12
si 13. Persoana care vine prima asteapta 20 de minute si apoi pleaca. Daca ecare persoana
vine la ntmplare n acel loc, care este probabilitatea ca persoanele sa se ntlneasca?
Indicatie. Prima problem
a este cum reprezent
am toate posibilit
atile de ntlnire. Fie pe
axa x ora de sosire a primei persoane iar pe axa y ora de sosire a celei de a doua persoane.
TII
LECTIA
1. DEFINITIA
PROBABILITA
12
TII
LECTIA
1. DEFINITIA
PROBABILITA
13
distincte care se poate obtine din A1 ; :::An prin aplicarea repetata a operatiilor si, sau, non?
14. Pe un segment AB se iau la ntamplare doua puncte C si D, astfel ca jACj < jADj.
Care este probabilitatea ca sa se poata forma un triunghi cu segmentele AC, CD, DB?
15. O urna contine 5 bile albe, 3 bile negre si 2 bile rosii iar alta urna contine 3 bile negre
, 2 bile albe si 5 bile rosii. Se extrage cte o bila din ecare urna. Care este probabilitatea ca
sa se extraga bile de aceeasi culoare?
16. Fie evenimentele A1 ; A2 ; ::An . Sa se demonstreze ca
p (A1 \ A2 \ ::: \ An ) p (A1 ) + p (A2 ) + ::: + p (An )
(n
1)
Lectia 2
Variabile aleatoare simple
2.1
Denitie si propriet
ati
De ecare dat
a cnd aplic
am teoria probabilit
atilor subntelegem c
a exist
a o algebr
a de evenimente realizat
a ca o multime de submultimi ale unei multimi X, si, o probabilitate denit
a
pe acele evenimente, chiar dac
a X si algebra de evenimente nu sunt exprimate explicit. n
general informatia din X se extrage prin functii. n cele ce urmeaz
a, X este o multime pe care
avem denit
a o algebr
a de evenimente
si o probabilitate p.
Denitia 2.1 O functie f : X ! R se numeste variabila aleatoare ( pe scurt v.a.) daca
pentru orice (a; b) R avem f 1 (a; b) 2
: O functie f : X ! C se numeste variabila
aleatoare daca Re(f ) si Im(f ) sunt variabile aleatoare reale.
n cele ce urmeaz
a variabilele aleatoare considerate iau un num
ar nit de valori. Asemenea
variabile aleatoare le vom numi simple. Fie v1 ; v2 ; ::vn valorile distincte ale lui f si e Ai =
f 1 (vi ). n aceste conditii variabila aleatoare se scrie
8
v1 dac
a x 2 A1
>
>
<
v2 dac
a x 2 A2
(2.1)
f (x) =
:::::
>
>
:
vn dac
a x 2 An
Este clar c
a denitia de mai sus este echivalent
a cu a spune c
a pentru orice valoare v rezult
a
c
a f 1 (v) 2
: Vom mai scrie Ai = ff = vi g; pi = p(Ai ) = p(f 1 (vi )) = p(f = vi ): Este
mai putin important din punctul de vedere al calculului cu probabilit
ati, care este multimea
Ai ; ct care sunt probabilit
atile p(Ai ); p(Ai \ Aj ) etc. Fiec
arei variabile aleatoare f i vom
asocia o diagram
a (notat
a tot f):
14
LECTIA
2. VARIABILE ALEATOARE SIMPLE
f=
15
v1 v2 v3 ::: vn
p1 p2 p3 ::: pn
p1 + p2 + :: + pn = 1: Putem considera si diagrame n care unele valori v coincid ntre ele ceea
ce ar corespunde denirii lui f prin (2.1) si unde am avea de exemplu v1 = v2 dar neap
arat
1
A1 \A2 = ;: n acest caz Ai nu mai este neap
arat f (vi ) dar A1 ; ::An formeaz
a nc
a o partitie,
pi = p(Ai ) si p1 + :: + pn = 1. De exemplu functia f k ia valorile (vi )k pe multimile Ai , deci
diagrama asociat
a este:
k k
v1 v2 ::: vnk
k
f =
p1 p2 ::: pn
iar probabilitatea lui cu p(a < f < b). Analog vom nota evenimentele ce se obtin folosind
inegalit
ati de tipul ; ;etc.
LECTIA
2. VARIABILE ALEATOARE SIMPLE
16
Exemplul 2.4 ntr-o clasa s-au obtinut urmatoarele note: 5 de catre 8 elevi, 7 de catre 3
elevi, 8 de catre 5 elevi, 10 de catre 4 elevi. Functia nota ia valorile 5,7,8,10, iar probabilitatile
8
3
5
4
corespunzatoare sunt: 20
. Diagrama asociata functiei este:
20
20
20
5 7 8 10
nota
8
3
5
4
20
20
20
20
8
3
5
4
media notelor este M1 = 5 20
+ 7 20
+ 8 20
+ 10 20
= 7; 05
3
5
4
8
2
2
2
momentul de ordinul doi este M2 = 5 20 + 7 20 + 8 20
+ 102 20
= 53; 35
4
2 8
2 3
2 5
dispersia este D = (5 7; 05) 20 + (7 7; 05) 20 + (8 7; 05) 20 + (10 7; 05)2 20
= 3; 6475
p
i5t 8
i7t 3
i8t 5
i10t 4
functia functia caracteristica este fc (t) = e 20 + e 20 + e 20 + e 20 unde i =
1
Observatia 2.5 Media se poate numi centrul valorilor luate de o v.a. iar dispersia este
o masura a mprastierii valorilor acelei v.a. n jurul mediei. In afara de medie, celelalte
caracteristici se utilizeaza doar pentru v.a. reale.
Denitia 2.6 Doua variabile aleatoare reale, f si g denite pe acelasi cmp de probabilitate
X se numesc independente daca oricare ar intervalele (a,b) si (c,d) avem
p(f
LECTIA
2. VARIABILE ALEATOARE SIMPLE
17
Demonstratie. Avem:
p ((F f = v) \ (G g = u))
= p f 2 F 1 (v) \ g 2 G 1 (u)
= p(f 2 F 1 (v)) p(g 2 G 1 (u))
= p(F f = v)p(G g = u)
Q.E.D.
De exemplu (f
a)2 si (g
Pm
Pm
j=1
LECTIA
2. VARIABILE ALEATOARE SIMPLE
18
P
Demonstratie. 1) D(f ) = (vi M (f ))2 p(f = vi ) si suma este zero numai dac
a vi = M (f )
pentru orice i cu pi 6= 0, adic
a f M (f ) a.p.t.
2) Avem
D(af ) = M ((af
M (f ))2 ) = a2 M ((f
M (f ))2 ) = a2 D(f )
a)2 si
=0
D(f1 ) + D(f2 )
Q.E.D.
O generalizare a punctului 3) este:
Propozitia 2.12 Fie f1 ; f2 ; ::fn variabile aleatoare independente doua cte doua. Atunci
D(f1 + f2 + ::: + fn ) = D(f1 ) + D(f2 ) + :: + D(fn )
Demonstratia este analoag
a celei pentru dou
a functii si e l
asat
a ca exercitiu.
Denitia 2.13 Daca f este o variabila aleatoare, expresia fpM (f ) se numeste deviatia stanD(f )
dard a lui f.
Se vede imediat c
a M ( fpM (f ) ) = 0 si D( fpM (f ) ) = 1:
D(f )
D(f )
Teorema 2.14 (proprietati ale functiei caracteristice) Fie fc functia caracteristica a variabilei aleatoare f. Atunci:
1) fc este continua (chiar uniform continua) pe R)
2) fc (0) = 1; jfc (t)j 1 pentru -1 < t < 1
p
3) Daca g=a f + b; cu a si b constante, atunci gc (t) = e 1bt fc (at)
4) Daca f1 si f2 sunt independente, atunci (f1 + f2 )c (t) = f1c (t) f2c (t)
(k)
5) Mk (f ) = p 1 k fc (0)
1
( )
6) Daca f1c f2c atunci f1 si f2 au aceleasi diagrame standard, adica f1 = f2 a.p.t.
p
P
Demonstratie. 1)fc este o sum
a nit
a de functii continue fc (t) =
pk e 1vk t deci este o
functie continu
a. Avnd
derivata m
a este
a.
p
p uniform continu
parginit
p a c
P
Pa rezult
1t(vk +)
1t
1tvk
1t
2) gc (t) =
pk e
=e
=e
pk e
fc (t):
LECTIA
2. VARIABILE ALEATOARE SIMPLE
3) fc (0) =
pk e
10vk
pk = 1 si jfc (t)j
19
p
pk e
P
pk = 1
=
1vk t
4) Dac
a f1 si f2 sunt independente atunci eif1 si eif2 sunt independente.
Acum observ
am c
a
Denitia 2.15 Spunem ca n variabile aleatoare f1 ; ::fn sunt independente daca pentru orice
intervale I1 ; ::Ik ; si orice alegere fi1 ; ::fik , k n, rezulta ca evenimentele fi1 1 (I1 ); fi2 1 (I2 ) ;
::: ; fik 1 (Ik ) sunt independente.
Exercitiul 2.16
Daca variabilele aleatoare f1 ; ::fn sunt independente atunci
(f1 + f2 + :: + fn )c (t) = f1c (t) f2c (t) :: fnc (t)
2.2
Fie (X1 ,
1 ; p1 ) si (X2 ;
2 ; p2 ) dou
a cmpuri de probabilitate nite. Atunci pe multimea
X = X1 X2 se poate deni o algebr
a de multimi astfel:
seama c
a
1 si
2 sunt algebre de evenimente, rezult
a c
a si
este. : Denim
p :
! R prin p(A1 A2 ) = p1 (A1 ) p2 (A2 ): Dac
a A este o reuniune disjunct
a de multimi
LECTIA
2. VARIABILE ALEATOARE SIMPLE
20
P
de forma [Aii A2i atunci p(A)= p1 (A1i ) p2 (A2i ): Se demonstreaz
a c
a p este o probabilitate pe
iar cmpul (X;
; p) se numeste cmpul produs al cmpurilor (X1 ;
1 ; p1 ) si
(X2 ;
2 ; p2 ). n mod asem
an
ator se deneste produsul unui num
ar nit de cmpuri de probabilitate (X1 ;
1 ; p1 ); :: (Xn ;
n ; pn ). Spatiul total este X = X1 X2 ::Xn iar multimea de
evenimente se deneste prin A 2
, A este o reuniune nit
a de elemente de forma A1 A2
A3 ::: An cu Ai 2
i pentru orice i. Se arat
a c
a
este o algebr
a de evenimente pe care
se poate deni o probabilitate care pe evenimentele de forma A1 A2 :: An are valoarea
p(A1 A2 ::An ) = p1 (A1 ) p(A2 ) :: pn (An ). Este foarte usor de ar
atat c
a evenimentele
B1 = A1 X2 ::Xn
B2 = X1 A2 ::Xn
:::::::::
Bn = X1 X2 ::An
sunt independente(exercitiu). De asemenea urm
atoarele variabile aleatoare
pr1 (x1 ; x2 ; ::xn ) = x1
pr2 (x1 ; x2 ; ::xn ) = xn
::::::::::::::::
prn (x1 ; x2 ; ::xn ) = xn
numite proiectiile canonice ale lui X, sunt independente(exercitiu). De asemenea dac
a fk :
Xk ! R sunt variabile aleatoare atunci variabilele aleatoare Fk : X ! R denite prin
Fk (x1 ; x2 ; ::xn ) = fk (xk ) sunt independente(exercitiu).
2.3
Rezumat
Informatiile dintr-un spatiu probabilizat se extrag prin functii, numite variabile aleatoare.
In cazul variabilelor aleatoare ce iau un num
ar nit de valori (numite si variabile simple),
media este denit
a ntr-un mod analog cu media notelor la scoal
a. Dispersia e denit
a ca o
m
asur
a a mpr
astierii valorilor n jurul mediei. Functia caracteristic
a este o notiune auxiliar
a important
a pentru calculul mediei, dispersiei,etc. Ea deneste unic diagrama variabilei
aleatoare.Propriet
atile acestor m
arimi sunt listate n cele trei teoreme anterioare. E de remarcat comportarea acestor m
arimi la adunarea variabilelor aleatoare independente. Un exemplu
important de spatiu probabilizat si variabile aleatoare independente este spatiul produs si
proiectiile prk .
________________________________
FORMULE UTILIZATE FRECVENT:
a) Denitiile mediei, momentelor, dispersiei, etc. pentru calculul direct al lor pag(15)
.
b) Proprit
atile mediei, dispersiei,functiei caracteristice. De remarcat:
LECTIA
2. VARIABILE ALEATOARE SIMPLE
21
2.4
Exercitii
1
1
2
10
1
10
3
10
1
10
S
a se calculeze media, dispersia si momentul de ordinul 3.
Indicatie. Se utilizeaz
a denitiile.
2 Fie v.a.
2
1 2 4 10
f=
1
1
3
1
5
10
10
10
LECTIA
2. VARIABILE ALEATOARE SIMPLE
22
Probabilitatea ca toti s
a e respinsi este q n . Prin urmare f are diagrama:
1 2 ::
k
:: n
p qp :: q k 1 p :: q n
Este foarte simplu acum de a calcula functia caracteristic
a, media si dispersia.
7. O persoan
a se deplaseaz
a aleator plecnd din punctul 0. Cu probabilitatea p face un
pas n fata si cu probabilitatea q=1-p face un pas napoi. Valoare unui pas este de 1m iar
ritmul este de un pas pe minut. Fie f variabila aleatoare egal
a cu abscisa la care se ajunge
dup
a o or
a(un pas n fata este +1m iar un pas n spate este -1m). Se cer probabilit
atile
p(f=k), valoarea medie si dispersia lui f.
Indicatie. Dac
a se fac n fata k pasi, se ajunge n pozitia k-(60-k)=2k-60. Probabilitatea
k k 60 k
p q
(vezi n lectia 4 despre schema
Deci p(f =
de a face k pasi n fata este C60
P60 Bernoulli).
k k 60 k
k k 60 k i(2k 60)t
. Deci functia caracteristic
a este fc (t) = k=0 C60 p q
e
=
2k 60) = C60 p q
60
60ti
2ti
e
(pe + q) . Cu formulele uzuale se deduc acum media, momentele, dispersia.
8. Probabilitatea ca un bec sa reziste la suprasarcina este p=0,90. Se fac 5 incercari de
becuri. e f variabila aleatoare care reprezinta numarul de becuri care au rezistea. Se cere
media si dispersia lui f.
9. Se arunc
a dou
a zaruri si se noteaz
a cu f suma punctelor obtinute. Se cer media si
dispersia lui f.
Indicatie. Se poate obtine suma 2 din varianta (1,1), adic
a un caz din 36. Se poate obtine
suma 3 din variantele (1,2) sau (2,1), deci 2 cazuri din 36, etc. De aici rezult
a imediat legea
lui f etc.
10. O urn
a contine n bile albe si n bile negre. Se extrag una cte una bilele pn
a se
epuizeaz
a urna. Fie f variabila aleatoare care pentru o variant
a de extragere succesiv
a a
tuturor bilelor ia valoarea k dac
a prima bil
a alb
a apare la extragerea k.
a)S
a se determine legea lui f
b) Se cere media lui f.
Indicatie. k ia valori ntre 1 si n+1. Ca f s
a ia valoarea k trebuie s
a ias
a primele k-1 bile nen
gre. Probabilitatea ca s
a ias
a prima bil
a neagr
a este 2n
. Conditionat de aceasta, probabilitatea
n 1
ca a doua bil
a s
a ias
a neagr
a este 2n
. Deci probabilitatea ca primele dou
a bile s
a ias
a negre
1
n(n 1)
este 2n(2n 1) . Dac
a primele dou
a bile au iesit negre, probabilitatea ca a treia s
a ias
a neagr
a este
n 2
.
2n 2
n(n 1)(n 2)
. Analog g
asim
2n(2n 1)(2n 2)
k
1
n(n 1)(n 2)::(n k+2)
n
tiind aceasta,
= C
k 1. S
2n(2n 1)::(2n k+2)
C2n
probabilitatea ca la extragerea k s
a ias
a bila alb
a este
n
.
2n k+1
Deci p(f = k) =
k 1
Cn
n
.
k
2n k+1 C2n 1
LECTIA
2. VARIABILE ALEATOARE SIMPLE
23
11. Dou
a variabile aleatoare f si g iau aceleasi valori v1 ; v2 ; ::vn : Se mai stie c
a M (f ) =
M (g), M2 (f ) = M2 (g),..Mn 1 (f ) = Mn 1 (g). S
a se arate c
a p(f = vk ) = p(g = vk ) pentru
orice k2 1::n .
Indicatie. Fie pk = p(f = k ) si p0k = p(g = k ). Avem:
Mk (f ) = p1 k1 + p2 k2 + :::pn kn = Mk (g) = p01 k1 + p02 k2 + :: + p0n kn
0
pentru k=0,1,2,..n. Prin urmare p1 ; p2 ; ::pn si p01 ; p2 ; ::p0n satisfac acelasi sistem nesingular.
12. S
a se arate c
a D(f + C) = D(f ), C ind o constant
a.
Indicatie. Se aplic
a denitia dispersiei si se tine seama c
a M (f + C) = M (f ) + C.
13. Fie X o variabil
a aleatoare nit
a cu media m si dispersia 2 . Cum trebuie s
a e a si
b (constante) ca variabila aleatoare af+b s
a aib
a media zero si dispersia unu?
Indicatie. 0=M (af +b) = aM (f )+b = am+b si 1 = D(af +b) = D(af ) = a2 D(f ) = a2 2
14. Dou
a variabile aleatoare independente ; au distributiile
0 1 2 3
0 1 2 3
1 1 a a
1
b 18 14
8
4
4
2
2
a) Sa se determine a si b
b) Care este distributia variabilei ?
c) Care este distributia variabilei 2 + 3?
Indicatie. Pentru avem 81 + 14 + a4 + a4 = 1 si analog pentru . Pentru se tine seama
c
a si sunt independente, deci, de exemplu p( = 1 si = 2) = p( = 1) p( = 2), etc.
15. Doi juc
atori, A si B, convin asupra urm
atoarei reguli de joc: la o aruncare cu zarul,
dac
a apar fetele 1 sau 2 atunci primul juc
ator d
a celui de al doilea 3 lei, iar n caz contrar al
doilea juc
ator d
a primului 1 leu. Care este cstigul mediu al ec
arui juc
ator dup
a n arunc
ari?
Indicatie. Probabilitatea de cstig a lui A este 1/3 iar a lui B este de 2/3. Se scriu variabilele aleatoare care reprezinta cstigul pentru A si B, ca la problema 7.
16. Trei juc
atori A, B, C pun jos cte o sum
a de a, b, respectiv c lei, apoi arunc
a o
moned
a, pe rnd, n ordinea A, B, C, A, B, C,... pn
a apare fata. Primul juc
ator la care
apare fata ia toti banii, iar dac
a nu a ap
arut dup
a ce ecare a aruncat de 3 ori, se anuleaz
a
jocul.
a) Care sunt cstigurile medii ale ec
arui juc
ator dup
a 3 jocuri?
b) Cum ar trebui s
a e sumele a, b, c ca jocul s
a e echitabil?
Lectia 3
Cmpuri de probabilitate
Fie (X;
; p) un cmp de probabilitate. Dac
a algebra de evenimente veric
a n plus axioma:
Oricare ar sirul de evenimente (An )n2N , cu An 2
atunci [An 2
,
spunem ca
este algebra sau un cmp de evenimente. Dac
a p este o probabilitate
pe
care n plus veric
a relatia
p(
An ) =
n=1;1
1
X
p(An )
n=1
n=1;1
24
LECTIA
3. CMPURI DE PROBABILITATE
Ak
k=1::1
[ (A1
A2 ) [ (A2
p(A1 ) = p
k=1::1
de unde:
Ak
Ak
= p(A1 ) lim
n!1
k=1::1
Pn 1
= lim p(A1 )
k=1 p(Ak
p
25
n!1
1
X
p(Ak
Ak+1 )
k=1
Pn
1
k=1
p(Ak Ak+1 ) =
Ak+1 ) = lim p(An )
n!1
QED.
3.1
LECTIA
3. CMPURI DE PROBABILITATE
26
Propozitia 3.4 f:X! R este variabila aleatoare daca si numai daca este ndeplinita una din
conditiile urmatoare:
a)8c 2 R ) ff < cg 2
b)8c 2 R ) ff cg 2
c) 8c 2 R ) ff > cg 2
d) 8c 2 R ) ff cg 2
e) 8; 2 R ) f f < g 2
T
Demonstratie.a) este denitia curent
a a variabilei aleatoare.Ta) ! b) ff cg = n ff <
c + n1 g 2
. b)! c) {f>c}=X ff cg 2
c)! d) {f S
cg = n ff > c n1 g 2
d}! e)
{ f < g = ff g ff g 2
e)! a) {f< cg = n f n f < cg 2
QED.
Prin urmare o variabil
a aleatoare este caracterizat
a prin faptul c
a pentru orice interval
1
I R , nchis,deschis,seminchis,nit sau nu, avem relatia f (I) 2
. Spre deosebire de cazul
variabilelor aleatoare simple studiate n lectia trecut
a, conditia f 1 (v) 2
pentru v 2 R nu
este sucient
a ca f s
a e variabil
a aleatoare.
Teorema 3.5 Fie f : X ! R o variabila aleatoare si 2 R. Atunci urmatoarele functii sunt
variabile aleatoare: a) + f ; b) f ; c)f 2 ; d) f1 daca f6= 0; e) jf j.
Demonstratie. a) { + f < cg = ff < c g 2
. b) ff < cg = ff < c g dac
a>0
2
si ff
<
cg
=
ff
>
c=g
dac
a
<
0.
In
ambele
cazuri
se
ob
t
in
mul
t
imi
n
.
c)
ff
< cg =
p
p
1
f
c < f < cg 2
. d) f f < cg = (ff > 0g \ fcf > 1g) [ (ff < 0g \ fcf < 1g) 2
. e)
exercitiu.
QED.
Teorema 3.6 Fie (fi )i2N un sir de variabile aleatoare. Atunci:
a)h(!) = sup fi (!) este o variabila aleatoare.
1i<1
S1
S
Demonstratie. a) fh > cg = 1
i=1 ffi < cg 2
c) Fie
i=1 ffi > cg 2
b) fg < cg =
fi = maxfj . Conform cu a) fi este o variabil
a aleatoare. f = lim fi = minfi care este conform
ji
i!1
cu b) o variabil
a aleatoare.
QED.
f
g
S
Demonstratie. ff + g < cg = ff < c gg = r2Q (ff < rg \ fc g > rg) 2
, stiind
c
a toate numerele r2 Q se pot pune ntr-un sir. Deci f +g este o variabil
a aleatoare. Analog se
LECTIA
3. CMPURI DE PROBABILITATE
27
procedeaz
a cu f g. Putem scrie f g = 41 (f + g)2 (f g)2 si conform punctului anterior
f geste o variabil
a aleatoare. Deoarece fg = f g1 rezult
a c
a si fg este o variabil
a aleatoare.
QED.
Din cele de mai sus vedem c
a dac
a a si b sunt constante atunci af + bg este variabil
a
aleatoare odat
a cu f si g. Deci multimea vsriabilelor aleatoare pe o aceeasi algebr
a formeaz
a
un spatiu vectorial. Se poate ar
ata c
a dac
a f este o variabil
a aleatoare si F : R ! R este o
functie continu
a atunci F f : X ! R este o variabil
a aleatoare (demonstratia este l
asat
a ca
exercitiu)
S
Dac
a f este o v.a. simpl
a atunci exist
a o partitie a spatiului X= ni=1 Ei ; Ei \ Ej = ;
astfel c
a f este constant
a pe Ei . Dac
a f si g sunt variabile aleatoare simple atunci f
2
g; f g; f ; f ; jf j sunt simple. Orice variabil
a aleatoare este limita unui sir de variabile
aleatoare simple.
Teorema 3.8 Fie (X;
) o algebra si f o variabila aleatoare pe X. Atunci exista un sir de
variabile aleatoare simple fn ! f . Convergenta este nteleasa n sensul ca pentru orice x 2 X
rezulta lim fn (x) = f (x) n R (convergenta simpla).
n!1
fn este o variabil
a aleatoare simpl
a si se vede c
a fn (!) ! f (!). De asemenea se vede c
a
fn tinde uniform la f dac
a f este m
arginit
a. In plus dac
a f >0, atunci fn tinde cresc
ator la
f.
QED.
3.2
Dac
a variabila aleatoare este simpl
a atunci media ei a fost denit
a n lectia anterioar
a. Fie
f (!) = vi dac
a ! 2 Ei , pentru i=1,2,..n. Atunci
media luiR f se deneste prin M (f ) =
R
P
a variabila
a expresie prin X f dp sau X f (!) dp(!). Dac
i vi p(Ei ). Vom mai nota aceast
aleatoare nu este simpl
a atunci se aproximeaz
a f prin variabile aleatoare simple iar media
lui f se aproximeaz
a prin media acestora. In continuare vom folosi notiunea de convergenta
aproape peste tot (pe scurt a.p.t.).
Denitia 3.9 Un sir (fn )n2N denv.a. se spune ca este convergent
a.p.t. la variabila aleatoare
o
f daca si numai daca multimea x 2 Xj lim fn (x) 6= f (x) are probabilitatea 0.
n!1
LECTIA
3. CMPURI DE PROBABILITATE
28
2)
f dp = c
(f + g)dp =
3)
f dp +
(f1 + f2 + :: + fn )dp =
gdp
f1 dp +
f2 dp + :: +
fn dp
Spunem c
a variabilele aleatoare f1 ; f2 sunt independente, la fel ca n cazul variabilelor
aleatoare simple, dac
a oricare ar intervalele I1 ; I2 avem p(ff1 2 I1 g \ ff2 2 I2 g) = p(f1 2
I1 ) p(f2 2 I2 ). Cu aceasta putem enunta urm
atoarea proprietate:
4) Dac
a f1 si f2 sunt variabile aleatoare independente atunci:
Z
Z
Z
f2 dp
f1 dp
(f1 f2 )dp =
5)
f 0)
6)
f g)
7)
f dp 0
f dp
Z
f dp max jf j
X
Proprietatea urm
atoare este mai special
a:
gdp
LECTIA
3. CMPURI DE PROBABILITATE
29
8) Dac
a lim fn = f a.p.t. si dac
a exist
a o variabil
a aleatoare g 0 astfel ca
n!1
lim
n!1
fn dp =
gdp < 1
f dp
Deci dac
a un sir de variabile aleatoare este convergent si dominat de o v.a. pozitiv
a cu medie
nit
a, atunci media limitei este egal
a cu limita mediilor.
O variabil
a aleatoare complex
a este o functie f : X ! C
R f = uR+ iv astfelR ca u si v
s
a e variabile aleatoare reale. Se deneste media lui f prin X f dp = X udp + i X vdp. Se
demonstreaz
a c
a propriet
atile 1)-8) se p
astrez
a.
Momentul de ordin k al unei variabile aleatoare oarecare se deneste ca pentru variabilele
simple
Z
k
Mk (f ) = M (f ) =
f k dp
X
M (f ))k dp
(M (f ))2
Propriet
atile demonstrate pentru dispersie n cazul variabilelor aleatoare simple r
amn
adev
arate n general, ele deducndu-se din propriet
atile mediei, care r
amn adev
arate n
general.
Functia caracteristic
a a unei variabile aleatoare generale se deneste ca pentru variabile
aleatoare simple, cu ajutorul mediei:
Z
p
1tf
fc (t) = M (e
)=
eitf dp
X
LECTIA
3. CMPURI DE PROBABILITATE
30
f dp = lim
X
n!1 X
vi ! 2 Ei ; i n
0 ! 2 Ei ; i > n
D(f ) =
n!1
1
X
(vi
P1
i=1
v i pi =
M (f ))2 pi
i=1
P
P
P
1
Solutie. a) In acest
caz avem vi = i. G0f (t) =P ipi ti P
si deci G0f (1) =
ipi =
vi p i =
P
ipi adic
a G00f (1) = M2 (f ) M (f )
i(i 1)pi ti 2 deci G00f (1) = i2 pi
M (f ). b) G00f (t) =
de unde rezult
a b). c) Avem D(f ) = M2 (f ) (M (f ))2 ceea ce d
a, conform cu a) si b), exact
c).
3.3
Functia de repartitie
densitatea de probabilitate
Fie f : X ! R o variaibil
a aleatoare denit
a pe spatiul probabilizat X. Asociem lui f o functie
F : R ! R prin formula F (t) = p(f < t). Functia F nu mai apare ca depinznd explicit de
X. Ea contine informatiile probabilistice despre f , independent de natura elementelor din
X. Este posibil ca aceeasi functieF s
a corespund
a la variabile aleatoare diferite, denite pe
acelasi spatiu X sau pe spatii diferite.
Denitia 3.11 Functia F : R ! R cu F (t) = p(f < t) , f ind o variabila aleatoare, se
numeste functia de repartitie a acestei variabilei aleatoare.
Denitia 3.12 Fie o variabila aleatoare f cuR functia de repartitie F . O functie : R !
t
[0; 1) , integrabila, cu proprietatea ca F (t) = 1 (x)dx se numeste densitate de repartitie
a varibilei f .
Teorema 3.13 Functia de repartitie are urmatoarele proprietati:
1) F este monoton crescatoare
LECTIA
3. CMPURI DE PROBABILITATE
2)F ( 1) = lim F (t) = 0
t! 1
31
n!1
Pentru a vedea cum putem calcula efectiv media, dispersia, etc. n general, studiem pe
scurt un concept numit integrala Stieltjes.
LECTIA
3. CMPURI DE PROBABILITATE
3.4
32
Integrala Stieltjes
Rb
a
n
X
f ( i ) (F (xi )
F (xi 1 ))
i=1
Spunem c
a f este integrabil
a Stieltjes n raport cu F dac
a pentru orice sir de diviziuni
(n )n2N cu norma jn j = max jxi xi 1 j tinznd la zero, sirul de sume Stieltjes are o aceeasi
i
limit
a, independent de sirul de diviziuni sau de punctele i alese. Aceast
a limit
a se noteaz
a
Rb
Rb
cu a f (x)dF (x) sau a f dF . Se demonstreaz
a c
a pentru orice functie f continu
a integrala
Stieltjes exist
a. Urm
atoarele propriet
ati ale integralei Stieltjes seam
an
a cu cele ale integralei
Riemann:
a) Daca f1 si f2 sunt integrabile Stieltjes atunci f1 + f2 este integrabila si
Z
(f1 + f2 )dF =
f1 dF +
Rb
Rc
Rb
b) Daca a < c < b atunci a f dF = a f dF + c f dF .
Rb
c) f 0 implica a f dF 0.
Rb
d) a f dF max jf (x)j (F (b) F (a)).
f2 dF .
x2[a;b]
Rb
Rb
Rb
e) Daca F = F1 +F2 suma de doua functii monotone, atunci a f dF = a f dF1 + a f dF2 .
Demonstratia acestor propriet
ati nu o facem aici. S
a calcul
am cteva integrale Stieltjes.
Exemplul 3.15 Fie F : [a; b] ! R; F (x) = x. Atunci F (xi ) F (xi 1 ) = xi xi
Stieltjes devine integrala Riemann.
si integrala
f (x)(x)dx
f dF =
(3.1)
LECTIA
3. CMPURI DE PROBABILITATE
33
i=1
Se poate deni
R +1
1
f dF prin
i=1
lim
Rb
a! 1;b!1 a
f dF . Propriet
atile a)..e) se p
astreaz
a la fel ca
3.5
Fie o variabil
a aleatoare f cu valori ntr-un interval[a; b) si cu functia de repartitie F . Fie
: x0 = a < x1 < :: < xn
< xn = b
LECTIA
3. CMPURI DE PROBABILITATE
34
P
P
Variabila f este deci simpl
a, cu media M (f ) = i i p(xi 1 f < xi ) = i i (F (xi )
F (xi 1 )). Atunci cnd norma diviziunii jj ! 0, variabilele f tind la f (a se vedea gura)
X
A1
An
A2
f
1
x0=a x1
2
x2
xn-1
xn=b
jj!0
i (F (xi )
F (xi 1 )) =
xdF (x)
(3.3)
ki
(F (xi )
F (xi 1 )) !
xk dF (x)
( i
M (f )) (F (xi )
F (xi 1 )) !
(x
M (f ))2 dF (x)
a prin
Functia caracteristic
a a lui f este media variabilei aleatoare eitf care este aproximat
p
1tf
variabilele e
cu mediile
Z b p
X p
1t i
e 1tx dF (x)
(F (xi ) F (xi 1 )) !
e
i
Dac
a f nu este m
arginit
a atunci integralele trebuie luate de la -1 la 1. Avem deci
LECTIA
3. CMPURI DE PROBABILITATE
35
f k dp =
R1
xk dF (x) =
R
k (f ) = M (f M (f ))k = X (f
R1
R1
= 1 (x M (f ))k dF (x) = 1 (x
R
2
D(f
)
=
M
(f
M
(f
))
=
R 1X (f
R1
= 1 (x M (f ))2 dF (x) = 1 (x
fc (t) = M (e
1tf
)=
1tf
dp =
R1
1tx
R1
xk (x)dx
M (f ))k dp =
(3.4)
M (f ))k (x)dx
M (f ))2 dp =
M (f ))2 (x)dx
dF (x) =
R1
1tx
(x)dx
LECTIA
3. CMPURI DE PROBABILITATE
36
lim
n!1
n!1
f (Pij ) (xi
i;j=1::n
xi 1 ) (yj
yj 1 ) =
Z Z
f (x; y)dxdy =
i;j=1::n
1Z 1
(x + y)dxdy = 1
0.8
0.6
0.4
0.2
-2
-1
Gracul densit
atii este:
LECTIA
3. CMPURI DE PROBABILITATE
37
0.8
0.6
0.4
0.2
-2
-1
Gracul densit
atii de probabilitate a variabilei aleatoare f
4)
M (f ) =
=
t(t)dt =
t(t)dt =
tdF (t) =
0
1
Z 2
2
t 2(2 t)dt = 1
2t dt +
1
1
3.6
Rezumat
ii) O probabilitate S
este probabilitate
dac
a pentru orice sir de evenimente (multimi)
P
p(A
).
An ) = 1
disjuncte An avem p(
n
n=1
n=1::1
iv) O variabil
a aleatoare general
a este o functie real
a care ntoarce intervalele n evenimente, deci au sens expresii ca p(f = a) sau p(a f < b) etc. Operatiile uzuale cu functii,
inclusiv trecerea la limit
a, aplicate variabilelor aleatoare duc tot la variabile aleatoare. Orice
variabil
a aleatoare este limit
a de variabile aleatoare simple (ce iau un num
ar nit de valori).
v) Caracteristicile numerice ale unei variabile aleatoare se denesc prin limita caracteristicilor corespunz
atoare ale variabilelor aleatoare simple ce tind la variabila general
a. Aceast
a
LECTIA
3. CMPURI DE PROBABILITATE
38
limit
a nu exist
a ntotdeauna. Propriet
atile acestor caracteristici: medie, dispersie, momente,
functie caracteristic
a, demonstrate anterior pentru variabile aleatoare simple se p
astreaz
a prin
trecere la limit
a si pentru variabile aleatoare generale.
vi) Pentru calculul concret al caracteristicilor numerice se introduce functia de repartitie
denit
a prin F (t) = p(f < t), F ind functia de repartitie a variabilei aleatoare f . Toate
informatiile numerice legate de f sunt continute n functia de repartitie F , independent de
spatiul probabilizat pe care e denit
a f.
vii) Densitatea de probabilitate , este derivata functiei de repartitie (dac
a exist
a), adic
a
Rx
p(tf <t+t)
(x) = lim
,sau, mai exact se deneste prin: F (x) = 1 (t)dt. Propriet
atile
t
t!0
functiei de repartitie si ale densit
atii de probabilitate sunt studiate mai sus.
viii) Pentru a ajunge la scopul propus, exprimarea caracteristicilor numerice ale unei
variabile aleatoare prin intermediul functiei de repartitie, avem nevoie de un concept auxiliar
numit integrala Stieltjes
Z b
X
f (x)dg(x) = lim
f ( i ) (g(xi ) g(xi 1 ))
jj!1
Rb
Rb
n=1;1
Pn
n!1
F (a) =
Rb
a
(x) dx.
LECTIA
3. CMPURI DE PROBABILITATE
3.7
39
Exercitii
0
1
2 ::: n :::
0
p p p2 ::: pn :::
a)Sa se determine astfel ca diagrama de mai sus sa corespunda unei variabile aleatoare.
b) Sa se calculeze media P
, dispersia si functia caracteristica.
k
a . O problem
a analoag
a este rezolvat
a
Indicatie. Trebuie ca 1
k=0 p = 1. De aici rezult
n cadrul lectiei.
2. Fie variabila aleatoare uniforma
1 2 ::: k :: n
1
1
::: n1 :: n1
n
n
LECTIA
3. CMPURI DE PROBABILITATE
40
e x dx = 1
pentru t 0
In mod evident G(t)=0 pentru t 0. Densitatea lui f 2 se obtine prin derivarea lui G. Analog
se procedeaz
a si cu celelalte expresii de f.
7. Se da functia
8
0
x<0
>
>
<
x 1 0x1
f (x) =
x2
1<x<2
>
>
:
5 x x2
R5
Sa se calculeze 1 (2 + x)df (x).
Indicatie. Se aplic
a tehnicile de calcul ale integralei Stieltjes din lectie.
8. Functia de repartitie a unei v.a. continue este
8
< a; x 0
bx2 ; x 2 (0; 1)
F (x) =
:
c; x 1
LECTIA
3. CMPURI DE PROBABILITATE
41
11. Fie o v.a. cu functia de repartitie F care admite medie si dispersie nite. Sa se arate
Z 1
(x a)2 dF (x)
1
14. Se iau la ntmplare doua puncte n intervalul [0; 1]. Care este functia de repartitie a
distantei dintre ele? Care e valoarea medie a acestei distante?
Indicatie. Se procedeaz
a ca la problema 7).
1
15. O variabila aleatoare f are densitatea (x) = 1 1+x
Se cere repartitia variabilei
2.
g=min(jf j ; 1) precum si media lui g.
Indicatie. Fie G functia de repartitie a lui g. Dac
a t 1 atunci
LECTIA
3. CMPURI DE PROBABILITATE
42
2l
x
2d
2 [0; ) iar x 2 [0; d]. Pentru intersectie trebuie ca x d cos . Spatiul pozitiilor
posibile este X = [0; ) [0; d], iar multimea pozitiilor favorabile intersectiei este A =
f(; x) 2 X j x d cos g. In cazul cnd toate pozitiile sunt egal probabile, probabilitatea
unui eveniment este proportional
a cu aria multimii punctelor prin care se reprezint
a acel
eveniment.
Lectia 4
Legi clasice
Am v
azut c
a valorile caracteristice ale unei variabile aleatoare sunt determinate de functia
de repartitie (sau de densitatea de probabilitate, dac
a exist
a). In cazul variabilelor simple,
caracteristicile numerice sunt determinate de diagrama asociat
a lor. In cele ce urmeaz
a sunt
studiate cteva legi frecvent ntlnite n aplicatii. Cnd discut
am o asemenea lege subntelegem
c
a exist
a un cmp de probabilitate (X;
; p) si o functie f : X ! R care are ca functie de
repartitie pe F si ca densitate pe . Pentru calcule nu este nevoie s
a avem explicit date X;
; p
si f; ci numai pe F sau .
4.1
Repartitia binomial
a
:::
1
k
k k n
Cn p q
n
X
eitk Cnk pk q n
= peit + q
k=0
a)
1 2 C. De aici obtinem:
0
M (f ) = 1i fc (0) = 1i
M2 (f ) = i12 fc00 (0) =
n
n n 0
Cn p q
n 2 N . O asemenea variabil
a aleatoare se numeste binomial
a.
fc (t) =
unde i =
:::
it
n (pe + q)
n 1
it
pie = np
t=0
n
b)
n2 p2 + npq
c) D = M2 (f ) (M (f ))2 = npq
Fie p probabilitatea cu care apare A ntr-o experienta independent
a. Atunci n n experiente
k
independente aparitia de k ori a evenimentului A se poate face n Cn feluri, egal cu num
arul de
43
LECTIA
4. LEGI CLASICE
44
variante n care sunt plasate cele k experiente unde apare A printre toate cele n experiente.
Probabilitatea ec
arui sir de n experiente, cu k aparitii ale evenimentului A, este pk q n k ,
q = 1 p. Sumnd probabilit
atile tuturor acestor siruri favorabile g
asim c
a probabilitatea ca
n k
k k
a distributie a fost studiat
a intensiv
evenimentul A s
a apar
a de k ori este Cn p (1 p) . Aceast
de Bernoulli si se mai numeste si repartitie Bernoulli. Pentru n=20 si p=3/4 probabilit
atile
a astfel:
Cnk pk (1 p)n k arat
0.2
0.15
0.1
0.05
10
3 k
k
Valorile pentru C20
15
1
220
20
Se vede c
a probabilit
atile care difer
a substantial de 0 apar pentru valori ale lui k n jurul
lui np, care n acest caz este 15. In lectia 5 vom demonstra c
a acest lucru are loc pentru orice
p 2 (0; 1) si n sucient de mare.
4.2
Repartitia Poisson
Spunem c
a f este o varibil
a aleatoare de tip Poisson dac
a ia valori ntregi pozitive si p(f =
k e
k) = k! unde > 0. Diagrama unei asemenea variabile aleatoare este
f=
0
e
1
1!
2
2!
:::
n
:::
n
::: e n! :::
1
X
k=0
Prin urmare:
a) M (f ) = 1i fc0 (0) =
eitk e
k!
=e
1
k
X
(eit )
k=0
k!
=e
eit
it
= e(e
1)
LECTIA
4. LEGI CLASICE
45
k
k!
cnd n ! 1.
n(n 1)(n
n k
n
QED.
Prin urmare k e =k! reprezint
a probabilitatea ca un anumit eveniment A s
a apar
a de k ori
ntr-un sir foarte mare de n experiente independente, probabilitatea de aparitie a evenimentului A ntr-o singur
a experienta nd foarte mic
a, de tipul =n. Valoarea medie a num
arului
de aparitii este np = . Valorile p (f = k) pentru k = 0; 1; ::10, la o valoare a parametrului
= 6 se reprezint
a astfel:
0.15
0.125
0.1
0.075
0.05
0.025
10
Valorile pentru e
15
20
6 6k
k!
Se vede c
a valorile p (f = k) care difer
a substantial de zero se concentreaz
a n jurul valorii
k= = 6.
LECTIA
4. LEGI CLASICE
46
1)
it
ei(e
1)
4.3
Repartitia uniform
a
Spunem c
a o v.a. are o repartitie uniform
a dac
a densitatea ei este:
1
x 2 [a; b]
b a
(x) =
0 x2
= [a; b]
unde a < b sunt reale. Functia caracteristic
a este
etc.
4.4
Rb
a
eitx b 1 a dx =
eibt eiat
,
it
media este
b+a
,
2
Repartitia Normal
a
Spunem c
a o variabil
a aleatoare f admite o repartitie normal
a de parametri m si > 0 dac
a
densitatea ei de probabilitate este:
1
(x) = p e
2
(x m)2
2 2
O variabil
a aleatoare cu repartitia normal
a, de medie m si dispersie 2 o vom numi de
tipul N (m; ). Gracul pentru m = 0 si = 1 al densit
atii de probabilitate si al functiei
de repartitie, arat
a astfel:
LECTIA
4. LEGI CLASICE
47
0.4
0.8
0.3
0.6
0.2
0.4
0.1
0.2
-4
-2
-4
-2
= p12
Am folosit
e
R
x2
2
(y it)2
2
dy =
R1
e
1
t2
2
dt = 1, rezult
a
(x m)2
1
p1
eitx e 22 dx =
1
2
R1
(schimbarea y = x m ) = p12 1 eit(m+y)
R1
(y it)2
2 t2
2
= eitm 2 p12 1 e
dy = eitm
fc (t) =
x m
)
y2
2
dy =
y2
2
dy =
2 t2
2
(4.1)
2
0 = 2i Res e
R R it z2
R R
dx + R
e 2 dz
R
z2
2
; zk =
it
z2
2
dz +
R
R it
z2
2
(4.2)
dz
it;
2 2 2
LECTIA
4. LEGI CLASICE
48
c) D(f ) = M2 M 2 = 2
d) 2k+1 = 0 2k = (2k)!
2k . (exercitiu)
2k k!
In anumite conditii avem urm
atoarea relatie ntre dou
a variabile norale:
Propozitia 4.3 a) Fie f1 si f2 doua variabile aleatoare normale independente, de parametri
m
p1 ; 1 respectiv m2 ; 2 . Atunci f1 + f2 este normala de parametri m = m1 + m2 ; =
21 + 22 .
n
b) Daca f1 ; f2 :::fn sunt v.a. independente
si normale de tip N (m; ), atunci f1 +f2 +:::+f
n
este v.a. normala de tip N m; pn .
Demonstratie.a)f1c (f ) = eim1 t
2
1
1t
2
=
2
2
2t
2
p
21 + 22 .
= eimt
2 t2
2
n 2 2
b) Ca la punctul a) g
asim (f1 + f2 + :::fn )c (t) = einmt 2 t . Din teorema 3, lectia 2,
rezult
a
2
f1 + f2 + :: + fn
t
imt 12 pn t2
(t) = (f1 + f2 + :: + fn )c
=e
n
n
c
Gracele densit
atilor unor variabile normale
pentru diverse valori ale lui
LECTIA
4. LEGI CLASICE
49
Legea normal
a a ap
arut n leg
atur
a cu teoria erorilor de m
asurare. S
a presupunem c
ao
m
arime z este determinat
a prin m
asur
atori. In mod normal se vor face erori. Fie p(z; x)dx
probabilitatea ca s
a obtinem rezultatul ntre x s x+dx, dac
a valoarea exact
a este z. p(z,x)
este deci densitatea de probabilitate a rezultatului m
asur
atorii . Dac
a facem n m
asur
atori
independente atunci probabilitatea ca s
a obtinem rezultatele n intervalele [x1 + dx1 ], [x2 +
dx2 ],..[xn + dxn ] este
p(z; x1 )dx1 p(z; x2 )dx2 ::p(z; xn )dxn = F (z; x1 ; x2 ; ::xn )dx1 ::dxn
(4.3)
0 (z
=
(z
x1 )
0 (z
+ :: +
x1 )
(z
0 (z x)
(z x)
xn )
=0
xn )
avem
x1
x2
::
g 0 (nz
si datorit
a arbitrarit
atii valorilor x1 ; ::xn
x1
::
xn 1 ) 0
xn 1 ) 0
g
asim c
a
g 0 (x) a = const
1
LECTIA
4. LEGI CLASICE
50
de unde
g(x) = ax + b
Deoarece 0 = g(x1 ) + g(x2 ) + :: + g(nz
x1
0 (z
(z
sau
xn 1 ) = anz + nb rezult
ab=
::
x)
= a(x
x)
0 (t)
=
(t)
az, deci:
z)
at
de unde
ln((t)) =
(t) = ec e
t2
+c
2
2
a t2
Deci:
p(z; x) = (z
x) = ke
(z
x)2
2
a
.
2
Dac
a lu
am a =
p(z; x) = p
1
e
2
1
2
(x z)2
2 2
adic
a ceea ce am numit legea normal
a.
Alte motive pentru care legea normal
a este important
a vom vedea la considerarea teoremelor de tip limit
a central
a. Fiind frecvent folosit
a valorile functiei de repartitie pentru
Rt
x2
1
m = 0 , = 1, adic
a 1 p2 e 2 dx au fost tabelate. Mai precis s-a introdus functia
Z t
x2
1
p e 2 dx
(t) =
2
0
. Cu ajutorul acestei functii avem
p(a f < b) =
(x)dx = (b)
(a)
LECTIA
4. LEGI CLASICE
4.5
51
Repartitia exponential
a negativ
a
4.6
it
x<0
x0
M=
1
M2 =
2
2
D=
1
.
2
Toate aceste
Repartitia Gamma
unde >
1
x e
(+1) +1
x0
x>0
Reamintim c
a functia gamma se deneste astfel
Z 1
e t tx 1 dx
(x) =
0
LECTIA
4. LEGI CLASICE
fc (t) =
52
1
( + 1) +1
eitx x e
dx
1
1X
(itx)n x
x e dx
n!
0
n=0
Z
1
X
1
(it)n 1 n+ x
=
x e dx
( + 1) +1 n=0 n! 0
Z
1
X
1
n++1 1 n+ y
n
y
e dy
=
(it)
+1
n!
(
+
1)
0
n=0
=
1
( + 1) +1
1
X
(it)n
n=0
1
X
1
n++1
(n + + 1)
( + 1) +1 n!
n++1 (n + ) (n + 1) ( + 1) ( + 1)
=
(it)
( + 1) +1 n!
n=0
=
1
X
n=0
( it)n
1) (
n!
2) (
n)
= (1
it)
0.3
0.15
0.2
0.1
0.1
0.05
-2
10
-2
10
LECTIA
4. LEGI CLASICE
53
Densit
atile
(m) pentru m = 0 si m = 2.
Propozitia urm
atoare este simplu de demonstrat:
Propozitia 4.4 Daca f si g sunt variabile aleatoare independente de tipurile
(m1 ) respectiv
(m2 ) atunci f + g este de tipul
(m1 + m2 ).
Demonstratie.Exercitiu
QED.
4.7
Repartitia X2(hi p
atrat)
2 2 s ( 2s )
0
s
x2
x0
x>0
x
2 2
s este un num
ar natural numit num
arul gradelor de libertate, iar > 0. Acest tip de variabil
a
s
2
aleatoare l vom numi H(s; ); se vede imediat c
a este acelasi cu
( 2 1; 2 ). Prin urmare
avem:
s
a) fc (t) = (1 2 2 it) 2
b) M = s 2
c) M2 = s (s + 2) 4
c) D = 2s 4
Iat
a cum se poate ajunge la o distributie X2 placnd de la distributii normale:
Propozitia 4.5 Fie f1 ; f2 ; ::fs variabile aleatoare independente de tipu N (0; ). Atunci variabila aleatoare g = f12 + f22 + :: + fs2 este de tipul H(s; ).
Demonstratie.Fie Fi (t) functia de repartitie a variabilei fi2 . Avem
Fi (t) = p(fi2 < t) = p(
t < fi <
R pt
= p22 0 e
t) =
x2
2 2
p1
2
dx
R pt
e
t
x2
2 2
dx =
i (t) = Fi (t) =
1
( 21 ) (2 2 )1=2
1
2
t
2 2
(fi2 )c (t) = (1
2 2 it)
1
; 2 2 ),
2
s
2
deci
LECTIA
4. LEGI CLASICE
54
0.12
0.1
0.08
0.06
0.04
0.02
10
15
20
Densitatea pentru s = 6 si = 1.
2
4.8
Repartitia Student
s+1
2
s
x2
1+
s
s
2
s+1
2
se numeste variabil
a Student. Tipul acesta de v.a. l vom nota S (s). Demonstratiile armatiilor de mai jos n leg
atur
a cu distributiile Student se vor da n lectia 6.
a) M (f ) = 0 si n general 2k+1 (f ) = 0 pentru 0 k < 2s . Pentru k 2s ; 2k+1 (f ) nu
exist
a.
k 13::(2k 1)
r
(k+ 12 ) ( 2s k)
b) 2k (f ) = M2k (f ) = ps
= (s s2)(s
.
s
4)::(s 2k)
(2)
c) Dac
a este o v.a. de tip normal N (0; ) si este de tip 2 cu s grade de libertate, adic
a
de tip H (s; ) atunci v.a. p este de tip Student S (s). Pentru s = 6, gracul densit
atii este
urm
atorul:
LECTIA
4. LEGI CLASICE
55
0.15
0.1
0.05
-4
-2
4.9
Rezumat
Variabilele aleatoare anterioare apar n multe modele de probleme reale. De aceea au fost
studiate mai n detaliu.
i) Modelul binomial descrie probabilitatea de aparitie de k ori a unui eveniment ntrun sir de n experiente independente, dac
a probabilitatea de aparitie a evenimentului ntr-o
experienta este p. Aceast
a probabilitate este Cnk pk (1 p)n k .
ii) Modelul Poisson descrie probabilitatea de aparitie de k ori a unui eveniment ntr-un
sir mare de n experiente independente, dac
a probabilitatea de aparitie a evenimentului ntro experienta este foarte mic
a, de tipul =n. Num
arul mediu de aparitii este acelasi, ; iar
probabilitatea este e k =k!.
(x m)2
1
a de distributia erorilor de
iii) Legea norml
a, cu densitatea (x) = p2
e 22 este legat
2
m
asurare. m este valoarea medie a valorii m
asurate iar este m
asura dispersiei valorilor
g
asite n jurul mediei.
iv) Distributia 2 cu s grade de libertate are densitatea
(
0
x0
x
s
(x) =
1
1
2
x>0
x 2 e 2
s
s
2 s
2
(2)
LECTIA
4. LEGI CLASICE
56
Alte legi clasice sunt date n exercitii sau vor studiate mai trziu, pe m
asur
a ce vor folosite. E de remarcat utilitatea functiei caracteristice n calculul
momentelor.
________________________________
4.10
Exercitii
1. Sa se arate ca
2k
1
= p
2
(x
m)2k e
(x m)2
2 2
1) 2 2k
dx = (2k
de unde
(2k)!
2k k!
Indicatie. Cu substitutia t = x m se g
aseste
Z 1
Z 1
x2
1
1
2k
2k = p
x e 2 dx = p
x2k
2 1
2 1
2k =
1
2. Fie o v.a. cu densitatea (x) = 2
e
imt
e
a)Sa se arate ca fc (t) = 1+2 t2 .
b) Sa se determine media si dispersia.
Indicatie. Se aplic
a denitiile.
jx mj
x2
2
0
dx = :::
LECTIA
4. LEGI CLASICE
57
(x) =
unde c este o constanta. Sa se determine viteza medie, energia cinetica medie si dispersiile
lor.
Indicatie. Pentru c=100, gracul distributiei vitezelor este:
0.008
0.006
0.004
0.002
100
200
300
400
0
1
p
e
x 2
(ln x )2
2 2
x0
x>0
LECTIA
4. LEGI CLASICE
58
Indicatie. Dac
a este o v.a. cu astfel de lege atunci:
Z 1
(ln x )2
1
x p e 22 dx
M () =
x 2
0
Z 1
(t )2
2
1
t
= p
e 22 dt = e+ 2 :
2 1
2
2
1 A.N. Kolmogorov
Analog se procedeaz
a pentru dispersie, g
asindu-se D (f ) = e2+ e
a ar
atat c
a aceasta este legea de distributie a diametrelor particulelor ntr-un proces de
m
acinare.
8. O variabila aleatoare f cu densitatea
0
(x) =
1
cx e
cx
x0
x>0
0.8
0.6
0.4
0.2
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
LECTIA
4. LEGI CLASICE
cu conditiile
x2
2 2
1
1
59
(x) dx = 1si
x2 (x) dx = 2
10. Sa se arate ca distributia pe [0; 1) care maximizeaza entropia si are media m > 0;
x
este este exponentiala negativa (x) = m1 e m . R
R1
1
(x) dx =
(x)
ln
(x)
dx
n
condi
t
iile
Indica
t
ie.
Trebuie
maximizat
a
integrala
I
=
0
0
R1
1, 0 x (x) dx = m. (vezi problema 9).
11. Sa se arate ca distributia pe intervalul [a,b] care maximizeaza entropia, este distributia
uniforma.
12. Intr-o urna se gasesc a bile albe si b bile negre. Se extrag n bile din care k sunt albe
si n k sunt negre ( k a, n k b). Extragerea se face fara punerea bilei napoi (schema
Cak Cbn
n
Ca+b
. Sa se arate ca
a+b
a
cu k 2 [max (0; n b), min (a; n)] media este M (f ) = n a+b
si dispersia este D (f ) =
a+b n
a
b
n
.
a+b 1 a+b a+b
P
n
unde nsumarea se face ntre limIndicatie. Se utilizeaz
a identitatea k Cak Cbn k = Ca+b
itele specicate n problem
a pentru k (identitatea se poate obtine egalnd coecientii lui xn n
(1 + x)a (1 + x)b = (1 + x)a+b ). Pentru medie se utilizeaz
a kCak = aCak 11 iar pentru dispersie
se utilizeaz
a k (k 1) Cak = a (a 1) Cak 22 .
13. Fata de un adversar la fel de tare ce este mai probabil sa se cstige: trei partide din
patru sau cinci partide din opt?
14. Pentru o variabila aleatoare se deneste asimetria prin
1 = p3 3 si excesul prin
2 = 24
2
lectie.
2
Lectia 5
Legi limit
a
In cele ce urmeaz
a vom studia semnicatia dispersiei, precum si importanta repartitiei normale
pentru probabilit
ati. Incepem cu inegalitatea lui Cebsev.
Teorema 5.1 Fie f o variabila aleatoare cu medie si dispersie nite. Atunci pentru a > 0
avem:
D(f )
p (jf M (f )j > a)
a2
sau
D(f )
p (jf M (f )j a) 1
(5.1)
a2
Demonstratie.
R
R
2
p (jf M (f )j > a) = jx M (f )j>a dF (x) jx M (f )j>a (x Ma2(f )) dF (x)
1
a2
jx M (f )j>a
(x
M (f ))2 dF (x)
1
a2
R1
(x
M (f ))2 dF (x) =
D(f )
a2
QED.
p
Putem pune acest lucru si n alt mod dac
a scriem a = = D. In acest caz avem
1
. Inegalitatea devine
2
D
a2
1
sau
2
1
p (jf M (f )j ) 1
v2
Aceasta nseamn
a c
a variabila aleatoare ia valori n intervalul [M (f ) ; M (f ) + ] cu
o probabilitate mai mare ca 1 12 . In cazul particular al unei variabile normale f 2 N (m; )
g
asim c
a f ia valori n intervalul [m 3; m + 3] cu probabilitatea 1 19 = 0; 88:: adic
a
p (jf
M (f )j > )
(x m)2
LECTIA
5. LEGI LIMITA
61
Observatia 5.2 Estimarea data de inegalitatea lui Cebsev este destul de grosiera n cazuri
practice si se nlocuieste cu alte estimari mai eciente. De exemplu
p( 3 < f < 3) = (3)
( 3) = 2(3) = 0; 9973::
pentru f 2 N (0; 1) este o estimare mai buna ca cea data de inegalitatea lui Cebsev
p( 3 < f < 3) 0; 88::
5.1
Urm
atoare teorem
a este o ilustrare a aplic
arii inegalit
atii lui Cebsev.
Teorema 5.3 (Legea numerelor mari)Fie f1 ; f2 ; :::fn ; :: un sir de v.a. independente doua
cte doua si cu dispersiile marginite de aceeasi constanta: D(fn ) C; pentru orice n 2 N .
Atunci pentru orice > 0 avem:
f1 + f2 + ::: + fn M (f1 ) + ::: + M (fn )
=1
lim p
(5.2)
n!1
n
n
Mai precis
f1 + f2 + ::: + fn
p
n
M (f1 ) + ::: + M (fn )
1
n
C
n2
(5.3)
(fn )
n
Demonstratie. Fie gn = f1 +f2 +:::+f
. Avem M (gn ) = M (f1 )+:::+M
si D(gn ) =
n
n
1
C
(D(f
)
+
:::
+
D(f
))
.
Inegalitatea
lui
Ceb
s
ev
pentru
g
d
a
(5.3)
iar
prin
trecere la
1
n
n
n2
n2
limit
a se obtine (5.2).
QED.
Teorema se interpreteaz
a astfel: oricare ar > 0, dac
a n este sucient de mare, atunci
functia (f1 + f2 + ::: + fn )=n difer
a cu mai putin de de constanta (M (f1 ) + ::: + M (fn )) =n
pe o multime cu probabilitate foarte aproape de 1. Dac
a f1 ; :::fn ; :: au aceeasi medie m atunci
avem:
Corolarul 5.4 Fie v.a f1 ; f2 ; :::fn ; :: cu aceeasi medie m si dispersiile marginite de C. Atunci
pentru orice > 0 avem:
f1 + f2 + ::: + fn
lim p
m = 1
(5.4)
n!1
n
Un alt caz particular este:
LECTIA
5. LEGI LIMITA
62
Corolarul 5.5 (teorema lui Bernoulli) Fie n numarul de aparitii ale unui eveniment A n
n experiente independente. Probabilitatea de realizare a lui A ntr-o singura experienta este
2 [0; 1]. Atunci pentru orice > 0 avem
lim p n = 1
(5.5)
n!1
n
Observatia 5.6 Cu alte cuvinte pentru un > 0 orict de mic, daca numarul de experiente
n este sucient de mare atunci frecventa relativa nn este aproape sigur n jurul probabilitatii
p de aparitie a evenimentului ntr-o singura experienta.
Demonstrtie. Fie sirul de v.a.
1 ,dac
a la experienta n s-a realizat A
fn (!) =
0 ; dac
a la experinta n s-a realizat A
(5.6)
cu = 1
seama c
a
(f1 + f2 + :: + fn ) = n
sau
j nk
Cnk k n
pj
k
n
= p( n
n
j>
Cnk k n
) 1
k
(5.7)
1
4n2
(5.8)
1
4n2
Datorit
a frecventei schemei binomiale si dicult
atii de a calcula Cnk k n
tehnici de calcul aproximativ, mai rapide, pentru aceste m
arimi.
(5.9)
k
s-au dezvoltat
LECTIA
5. LEGI LIMITA
5.2
63
Teoreme limit
a central
a
numit
a formula lui Stirling. Demonstratia acestei formule se poate g
asi ntr-un curs de
Analiz
a matematic
a.
Teorema 5.8 (fornula locala de Moivre-Laplace)Fie 0 < p < 1 si xk =
Atunci
Cnk pk q n k
!1
x2
k
1
1
p
2
p
e
npq 2
k np
p
,
npq
q = 1
p.
(5.10)
npqCnk pk q n k
npq
n
2k(n
n n pk q n k
k) k k (n k)n
en;k
(5.11)
r
q
p
k np + a npq = np(1 + a
)
np
r
q
p
k nq b npq = nq(1 b
)
nq
deci:
n k
n k
1 1 1
1
+
+
< ( + +
)<
n
k
n k
12 n! k n k
1
1
p pq +
p pq
1+
p+a n
q
n
1
12n
Prin urmare n;k tinde uniform la zero cnd n ! 1 si a xk b, deci en;k tinde uniform la
1.
p
asim:
ii) Scriind c
a k = np + xk npq, g
r v
r
n
1u
1
1
p
u
npq
=
q
q !p
t
q
q
2k(n k)
2
2
1 + xk np
1 xk np
LECTIA
5. LEGI LIMITA
64
uniform pentru a xk b.
iii) Mai avem n (5.11) de aat limita lui
n n pk q n
An;k =
Avem:
ln(An;k ) =
=
=
k)n
k k (n
!
np k nq n k
ln
k
n k
k
n k
k ln
(n k) ln
np
nq
p
np + xk npq
p
(np + xk npq) ln
np
p
nq xk npq
p
(nq xk npq) ln
nq
r
q
p
(np + xk npq) ln 1 + xk
np
r
p
p
(nq xk npq) ln 1 xk
nq
r
q
1
1 x2k q
(np + xk npq) xk
+O
np 2 np
n3=2
r
1
1 x2k p
p
p
(nq xk npq)
+O
xk
nq 2 nq
n3=2
p
deoarece xk sunt m
arginiti de a si b. Dup
a ce facem nmultirile si reducem termenii rezult
a:
x2k
1
ln (An;k ) =
+O p
2
n
Deci
An;k = e
x2
k
2
eO(1=
npqCnk pk q n
n)
!e
1
!p e
2
x2
k
2
x2
k
2
uniform pentru a xk b.
QED.
In gura urm
atoare apar pentru n = 20 si n = 40, p = 3=4, q = 1=4 att valorile Cnk pk q n
ct si gracelel functiilor
p 1 p1 e
npq 2
(x np)2
2npq
p 1 p1 e
npq 2
x2
k
2
LECTIA
5. LEGI LIMITA
65
0.2
0.2
0.175
0.15
0.15
0.125
0.1
0.1
0.075
0.05
0.05
0.025
0
5
10
15
20
10
15
20
1 p1
Probabilit
atile Cnk pk q n k si gracele functiilor pnpq
e
2
pentru p=3/4 si n=20 respectiv n=40
25
30
35
40
(x np)2
2npq
1
=p e
2
x2
k
2
(1 + n;k )
p. Atunci:
(5.12)
a pnpq b
k np
p
.
npq
x2
p
k
Dar conform formulei locale npqCnk pk q n k = p12 e 2 (1 + n;k ) cu jn;k j n ! 0 indepen1
dent de k, dac
a a xk b si xk xk 1 = pnpq
. Deci
npqCnk pk q n
1
= p e
2
1
= p e
2
x2
k
2
x2
k
2
+ n;k e
+ 0n;k
x2
k
2
LECTIA
5. LEGI LIMITA
66
1
p e
2
axk b
x2
k
2
(xk
xk 1 ) +
n;k e
x2
k
2
(xk
xk 1 )
axk b
Rb
x2
Prima sum
a de mai sus tinde cnd n ! 1 c
atre a p12 e 2 dx = (b) (a) iar a doua e
majorat
a de n (b a) deci tinde la zero cnd n ! 1. Prin urmare teorema e demonstrat
a
pentru a si b nite. O examinare mai atent
a a situatiei arat
a c
a teorema este adev
arat
a si
pentru a sau b innite, iar limita este uniform
a n a si b.
QED.
Care sunt valorile n pentru care aproximarea probabilit
atilor Cnk pk q n k prin formulele de
Moivre-Laplace este sucient de bun
a? In general se consider
a c
a:
1
i) n 30 p 2 , atunci formulele de Moivre-Laplace dau o aproximatie satisf
ac
atoare.
1
ii) n 30 , p 10
np = 10 atunci formulele distributiei Poisson dau o
k
aproximatie sucient de bun
a: Cnk pk q n k e k! .
1
iii)n 30 p 10
np 10 atunci sunt satif
ac
atoare formulele de MoivreLaplace, adic
a Cnk pk q n
'
x2
k
2
p 1 p1 e
npq 2
100 np
np
np
p
p
kpnpq
n
npq
npq
p
p
10000 60
100000;0060;994
100 60
100000;0060;994
= (1287)
1
p e
2
x2
2
dx
(5; 17) 0; 5
0; 5 = 0
LECTIA
5. LEGI LIMITA
67
b) Firma cstig
a cel putin 50 milioane dac
a pl
ateste sub 150 milioane, deci dac
a num
arul
celor accidentati este sub 75. Probabilitatea cerut
a este deci
p =
k np
np
p
p
= 75
npq
npq
Cnk pk q n
k75
Cnk pk q n
k np
0 np
p
=p
npq
npq
75 100000;006
x= p100000;0060;994
0 100000;006
x= p100000;0060;994
1
p e
2
x2
2
dx =
1;371
5;485
1
p e
2
x2
2
dx
np
a kpnpq
b
Cnk pk q n k
1
!p
2
x2
2
n
Prin urmare variabila aleatoare f1 +f2 +:::+f
p se comport
a, pentru valori mari ale lui n
n
p
ca o variabil
a aleatoare normal
a, de tip N (0; 1) multiplicat
a cu pq
. Acest fenomen este mai
n
general.
LECTIA
5. LEGI LIMITA
68
Anume, relatia:
p a
(f1
= p a pPn
k=1 D(fk )
Z b
x2
1
n!1
! p
e 2 dx
2 a
f1 +::+fn
n
M (fn ))
<b
<b
!
(5.14)
Mai exist
a si alte variante de conditii necesare pentru ca relatia (5.14) s
a aib
a loc. Asemenea teoreme poart
a numele de teoreme limit
a central
a si pun n evidenta c
a n conditii foarte
generale medierea unui num
ar mare de v.a. independente conduce la o constant
a plus o
variabil
a aleatoare normal
a. Forma exact
a este relatia (5.14).
5.3
Rezumat
p1 e
2
x2
2
LECTIA
5. LEGI LIMITA
69
atile legii
functia (cazul global). In unele cazuri Cnk pk q n k se pot aproxima prin probabilit
k k n k
prin legea normal
a sau
Poisson. Limitele n care aproximatiile probabilit
atilor Cn p q
Poisson sunt considerate satisf
ac
atoare sunt date n pag. ??.
Formula lui Stirling este frecvent folosit
a pentru evaluarea factorialelor. Exist
a si o generalizare a ei pentru evaluarea functiei Gamma.
________________________________
FORMULE UTILIZATE FRECVENT:
)
a) Inegalitatea lui Cebsev: p (jf M (f )j ) 1 D(f
.
2
M (f1 )+:::+M (fn )
n
b) Legea numerelor mari: lim p f1 +f2 +:::+f
1 nC2 dac
a
n
n
n!1
toate dispersiile sunt m
arginite de C; varianta Bernoulli: lim nn p = 1
n!1
unde n este num
arul de aparitii ale unui eveniment A n n experiente independente iar p este probabilitatea de aparitie a lui
A ntr-un singur experiment.
p
k pk q n k
npqCn
c) Formula local
a de Moivre-Laplace: lim
= 1.
x2
n!1
d) Formula global
a de Moivre-Laplace: lim
n!1
0<p<1, q=1-p.
5.4
p1 e
2
k
2
np
a kpnpq
b
Cnk pk q n
p1
2
Rb
a
x2
2
dx,
Exercitii
1. Se arunca o moneda de 10000 ori. Care e probabilitatea ca banul sa apara de mai putin
4550 ori?
Indicatie. Se procedeaz
a ca n exemplul din lectie.
2. Probabilitatea de a lovi o tinta este p=1/1000. Care e probabilitatea ca din 5000 de
lovituri, tinta sa e atinsa de cel putin 2 ori?
Indicatie. Se utilizeaz
a de Moivre-Laplace.
3. Probabilitatea ca un anumit produs sa e defect este p=0,005. Care e probabilitatea ca
dintr-un lot de 10000 produse luate la ntmplare sa e mai putin de 70 defecte?
Indicatie. Se utilizeaz
a formula de Moivre-Laplace.
4. O rma de asigurari are m salariati cu un salariu mediu de s lei pe an. O persoana
asigurata cu a lei primeste o despagubire de d lei daca pateste ceva. Probabilitatea de a pati
ceva este p. a)Care este probabilitatea ca veniturile companiei sa e n acel an mai mari sau
egale cu c0 .b) Care e numarul minim de asigurati de la care rma nregistreaza un venit brut
mai mare ca c0 cu probabilitatea de cel putin 0,99?
Indicatie. Se utilizeaz
a formula de Moivre-Laplace.
LECTIA
5. LEGI LIMITA
70
x2
2
(x)
1
e
x
R1
x
t2
2
x2
2
x2
x
2
Indicatie. Pentru prima inegalitate se considet
a f (x) = 1+x
(x). Avem f (0) = 0.
2e
Se deriveaz
a si se studiaz
a variatia lui f. Analog pentru a doua inegalitate.
6. Doua vase identice contin ecare 1022 molecule. Vasele sunt puse n contact si moleculele se misca liber ntre vase. Dupa omogenizare, care e probabilitatea ca n vasul A sa e
cu a zece miliarda parte mai multe molecule ca n B? (admitem ca pentru ecare molecula
probabilitatea de a n A este egala cu probabilitatea de a n B si este 1/2).
Indicatie. Se utilizeaz
a formula de Moivre-Laplace si ex. precedent.
7. Pe scara unui bloc sunt 40 apartamente si n ecare apartament este cate un frigider
de putere 0,6 kW. In medie un frigider consuma energie electrica 3 ore din 24. Care este
probabilitatea ca la un moment dat sa e absorbita de la retea, de ctre frigidere, o putere mai
mare de 4 kW?
Indicatie. Se utilizeaz
a de Moivre-Laplace.
8. a) Sa se arate ca daca > 0 si > 0 sunt date ,iar n
j
k
n
Cnk xk (1
x)n
xj>
1
42
atunci:
k
f( )
n
C
f (x) A ! x;
LECTIA
5. LEGI LIMITA
71
Cnk xk (1
x)n
k=0::n
k
f( )
n
mj ")
r
"r
11. Vrem sa vericam daca un zar este falsicat sau nu, cautnd care este probabilitatea
r de aparitie a fetei sase . Pentru aceasta alegem " = 0; 01, aruncam zarul de un numar n
de ori si observam care este numarul k de aparitii ale fetei sase.
Sa se determine o valoare ct mai mica pentru n astfel ca probabilitatea p nk r "
sa e cel putin 0; 99 utiliznd:
a) inegalitatea lui Cebsev
b) formula integrala de Moivre-Laplace.
12. In problema acului lui Buon (vezi lectia 3, exercitii), probabilitatea de intersectare
2l
a paraleleor este p = a
unde l este lungimea acului iar
a este distanta dintre paralele. De
< 0; 01 sa e cel putin 0; 99. ( n este
cte aruncari este nevoie ca probabilitatea ca 2ln
ak
numarul de aruncari iar k este numarul de intersectari ale retelei de drepte paralele).
Lectia 6
Dependenta ntre variabilele aleatoare
6.1
Coecientul de corelatie
M ((f1
m1 ) (f2
m ) (f2
p 1
D1 D2
m2 ))
(6.1)
Spunem c
a dou
a functii f1 ; si f2 coincid aproape peste tot (a.p.t.) dac
a p(f1 6= f2 ) = 0.
Importanta acestui coecient se va vedea n continuare.
Teorema 6.2 (Inegalitatea Cauchy-Buniakovski). Fie f1 ; f2 : X ! R doua v.a . cu momente
de ordinul doi nite. Atunci:
M 2 (f1 f2 ) M f12 M f22
(6.2)
Egalitatea poate avea loc daca si numai daca f2 = af1 sau f1 = af2 a.p.t. cu a=const.
Demonstratie. M (f1 + xf2 )2 0 pentru orice x 2 R, deci M (f12 ) + 2M (f1 f2 ) x +
M (f22 ) x2 0 pentru orice x. De aici rezult
a c
a discriminantul functiei de gradul doi este
2
2
2
a tocmai inegalitatea Cauchy-Buniakovski.
negativ: = M (f1 f2 ) M (f1 ) M (f2 ) 0 adic
Dac
a = 0 atunci exist
a un x0 real, solutie a ecuatiei de gradul doi
M (f1 + x0 f2 )2 = 0
de unde rezul
a c
a (f1 + x0 f2 )2 ia valoarea zero pe o multime cu probabilitatea 1, adic
a f1 =
x0 f2 a.p.t.
72
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
73
a f2 = 0 a.p.t.,
In cazul n care inecuatia nu ar de gradul 2, deci M (f22 ) = 0, rezult
deci f1 f2 = 0 a.p.t., deci (6.2) are din nou loc deoarece ambii membri sunt 0. In acest caz
f2 = 0 f1 .
Teorema 6.3 Fie f1 ; f2 : X ! R doua v.a.
cu mediile m1 ; m2 si dispersiile D1 = 21 =
2
2
M (f1 m1 ) ; D2 = 22 = M (f2 m2 ) nite. Atunci:
a) c(f1 ; f2 ) 2 [ 1; 1].
b) c(f1 ; f2 ) = 1 este echivalent cu f1 = af2 + b sau f2 = af1 + b a.p.t. pentru niste
constante a si b potrivit alese.
c) f1 si f2 independente implica c(f1 ; f2 ) = 0 (dar nu si invers).
Demonstratie. a) Se aplic
a inegalitatea Cauchy-Buniakovski pentru f1 m1 si f2 m2 .
b) Dac
a c(f1 ; f2 ) = 1 atunci n inegalitatea Cauchy-Buniakovski semnul devine = si
teorema precedent
a implic
a (f2 m2 ) = a (f1 m1 ) deci f2 = af1 +m2 am1 sau (f1 m1 ) =
a (f2 m2 ) de unde rezult
a f1 = af2 + b pentru a si b potrivit alese.
c) f1 si f2 independente implic
a (f1 m1 ) si (f2 m2 ) independente deci:
M ((f1
m1 ) (f2
m2 )) = M (f1
m1 ) M (f2
m2 ) = 0 0 = 0
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
74
P
forma y = ax + b se determin
a din conditia ca
(yi axi b)2 s
a e minim
a (a se vedea
axi
lectia 8 sau lectia 14). Dac
a se caut
a dependente de forma yi = be , prin logaritmare se
g
aseste ln (yi ) = axi + ln (b). O asemenea dependenta exist
a, conform celor de mai sus dac
a
c (f1 ; ln (f2 )) = 1. Dac
a jc (f1 ; ln (f2 ))j este sucient de aproape de unu atunci punctele
(xi ; ln (yi )) sunt aproximativ pe o dreapt
a care se determin
a prin metoda celor mai mici
p
atrate.G
asim astfel a si ln (b) care ne dau dependenta ln (yi ) = axi + ln (b), adic
a yi = beaxi .
6.2
Fie (X;
; p) un cmp de probabilitate si e f1 ; f2 : X ! R dou
a variabile aleatoare.
Leg
atura ntre variabilele aleatoare este pus
a n evidenta prin functia lor comun
a de repartitie.
2
2
S
a consider
am f : X ! R , denit
a prin f (!) = (f1 (!); f2 (!)) 2 R . Functia f are calitatea
c
a pentru orice produs de intervale I1 I2 R2 multimea f 1 (I1 I2 ) = f1 1 (I1 ) \ f2 1 (I2 ) 2
.
Denitia 6.5 Se numeste v.a. bidimensionala pe cmpul de probabilitate (X;
; p) o functie
f : X ! R2 cu proprietatea ca pentru orice intervale I1 si I2 din R, rezulta f 1 (I1 I2 ) 2
.
Vom mai spune uneori variabil
a aleatoare dubl
a n loc de variabil
a aleatoare bidimensional
a. Notnd f1 (!) si f2 (!) cele dou
a componente ale lui f , vedem c
a o v.a. bidimensional
a
este asociat
a unei perechi de v.a. unidimensionale.
Denitia 6.6 Se numeste functie de repartitie bidimensionala a lui f , functia F : R2 ! R
denita prin:
F (x1 ; x2 ) = p f 1 (( 1; x1 ) ( 1; x2 ))
= p ((f1 < x1 ) \ (f2 < x2 ))
Teorema 6.7 1)Functia de repartitie bidimensionala are proprietatile:
a) F este crescatoare n ecare argument.
b) F (x1 ; 1) = 0; F ( 1; x2 ) = 0; F (1; 1) = 1.
c) F este continua la stnga n ecare argument.
d) Pentru orice a1 < b1 si a2 < b2 avem
p ((a1 f1 < b1 ) \ (a2 f2 < b2 ))
= F (b1 ; b2 ) F (a1 ; b2 ) F (b1 ; a2 ) + F (a1 ; a2 ) 0
(6.4)
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
75
n=1;1
D
(a1,a2)
(b1,a2)
Scriem acum
F (b1 ; b2 ) = p (A0 [ B 0 [ C 0 [ D0 ) = p (A0 ) + p (B 0 ) + p (C 0 ) + p (D0 )
= F (a1 ; b2 ) F (a1 ; a2 ) + +F (b1 ; a2 ) F (a1 ; a2 ) + F (a1 ; a2 ) + p (D0 )
de unde rezult
a pentru p (D0 ) formula 6.4.
QED.
2
2
Denitia 6.8 Se numeste densitate
R x1 R x2de probabilitate a v.a. f : X ! R o functie :2R ! R
pozitiva, integrabila, astfel ca 1 1 (t1 ; t2 )dt1 dt2 = F (x1 ; x2 ) pentru (x1 ; x2 ) 2 R F ind
functia de repartitie a lui f.
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
76
Rb Rb
b) p ((a1 f1 < b1 ) \ (a2 f2 < b2 )) = a11 a22 (x1 ; x2 )dx1 dx2 .
2) Invers, orice functie : R2 ! R pozitiva si integrabila cu proprietea a) de mai sus este
densitate de probabilitate pentru o v.a. bidimensionala potrivit aleasa.
Demonstratie. a), b) sunt evidente din denitie. Punctul 2) se poate demonstra lund
RbRd
X = R2 , probabilitatea unui paralelipiped [a; b)[c; d) se deneste prin a c (x1 ; x2 )dx1 dx2 ,
iar cele dou
a variabile aleatoare sunt f1 ; f2 : R2 ! R, f1 (x1 ; x2 ) = x1 , f (x1 ; x2 ) = x2 .
QED.
Cunoscnd F =functia de repartitie si =densitatea de probabilitate bidimensional
a a lui
f = (f1 ; f2 ) putem calcula relativ usor diverse m
arimi legate de f1si f2 .
1. Functia F1 de repartitie a lui f1 este
Z 1
Z x1
(t1 ; x2 )dx2
(6.5)
F1 (x1 ) = p (f1 < x1 ) = F (x1 ; 1) =
dt1
1
1 (x1 ) =
2. Media lui f1 este
m1 = M (f1 ) =
3. Dispersia este
D (f1 ) =
x1 1 (x1 ) dx1 =
1
1
(6.6)
(x1 ; x2 )dx2 :
(x1
1
1
(6.7)
(6.8)
5. Dac
a g : R2 ! R este o functie continu
a, atunci g (f1 ; f2 ) : X ! R dat
a de
g (f1 ; f2 ) (!) = g (f1 (!) ; f2 (!)) este o v.a. Media acestei v.a. se calculeaz
a cu densitatea
mixt
a prin
Z Z
M (g) =
(6.9)
m1 ) (f2 m2 ))
q
m1 ) 2
M (f2 m2 )2
m1 )2 si g = (f2
m2 )2
M ((f1
M (f1
R1 R1
(x1
1
1
(6.10)
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
77
7. Dac
a f1 si f2 sunt independente atunci
F (x1 ; x2 ) = p (f < x1 \ f2 < x2 ) = p (f1 < x1 ) p (f2 < x2 ) = F1 (x1 ) F2 (x2 )
(6.11)
De aici rezult
a
(x1 ; x2 ) = 1 (x1 ) 2 (x2 ) :
(6.12)
Se vede usor c
a si reciproc este adev
arat: dac
a functia de repartitie ori densitatea de probabilitate se descompune n produs de dou
a functii, una depinznd de x1 si cealalt
a depinznd
de x2 atunci f1 si f2 sunt independente (exercitiu).
Dintre formulele de mai sus doar (6.9) mai necesit
a demonstratie, celelalte ind evidente.
a) Consider
am cazul cnd f1si f2 sunt m
arginite, deci f = (f1 ; f2 ) : X ! [a; b) [c; d).
Diviz
am intervalele [a; b] si [c; d] prin x = (xi )0in respectiv y = (yj )0jmsi not
am
1
= x y ; jj = maxfjx j ; jy jg; Dij = [xi 1 ; xi ) [yj 1 ; yj ), Aij = f (Dij ) X.
Variabila aleatoare
g (xi ; yj ) dac
a ! 2 Aij
g (!) =
0
n caz contrar
este simpl
a, si tinde la g (f1 ; f2 ) atunci cnd jx j ! 0 si jy j ! 0. Deci
X
M (g ) =
g (xi ; yj ) p (Aij )
Z Z
X
=
g (xi ; yj )
(x; y) dxdy
Dij
|
{z
}
=
p(Aij )
g (xi ; yj ) i ; j (xi xi 1 ) (yj yj 1 )
|
{z
}
din teorema de medie
Z Z
g (x; y) (x; y) dxdy
!
jj!0
[a;b][c;d]
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
78
2
X
ai;j (xi
mi ) (xj
mj )
i;j=1
ii) Se determin
a vectorii proprii ai matricei
normalizeaz
a. Acesti vectori pusi pe
A si se
r11 r12
; Rt = R 1 .
dou
a coloane dau o matrice ortogonal
aR=
r
21 r22
0
1 0
x1
x1 m1
t
iii) Se stie c
a R AR =
. Prin
=R
. Facem schimbarea
x2 m2
0 2
x02
D(x1 ;x2 )
02
aceast
a schimbare Q devine Q (x1 ; x2 ) = 1 x02
1 + 2 x2 iar iacobianul D(x0 ;x0 ) = det (R) = 1.
1 2
Avem de asemenea det (A) = 1 2 . Toate aceste lucruri se studiaz
a la cursul de algebr
a
R1
R 1 2 x2
R1
x2
x2
1
1
1
2
liniar
a. Utiliznd p2 1 e 22 dx = 1, p2 1 x e 22 dx = , p2 1 xe 22 dx = 0,
(a se vedea lectia 4, legea normal
a) g
asim:
iv)
p
Z
Z
1 02 2 02
1 2 1 0 1
M (f1 ) =
(m1 + r11 x01 + r12 x02 ) e 2 x1 2 x2 dx02
dx1
2
1
p
p 1
Z 1
Z 1
2 02
1 02
1
2
x1
0
2
e 2 x2 dx02 = m1
dx1
= p p m1
e
2
2
1
1
Analog g
asim M (f2 ) = m2 .
Putem acum calcula dispersiile.
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
79
a)
Z Z
21
2 x02
2
dx01 dx02
2
2
11 + r22
In mod analog g
asim 22 = r21
12
b) Covarianta lui f1si f2 este:
p
Z Z
02
1 x02
1 2 x 2
1 2
2
cov (f1 ; f2 ) =
dx01 dx02
(r11 x01 + r12 x02 ) (r21 x01 + r22 x02 ) e
2
p
Z Z
1 x021 2 x022 0 0
1 2
02
2
dx1 dx2
r11 r21 x02
+
r
r
x
=
12 22 2 e
1
2
1
1
= r11 r21
+ r12 r22
1
2
. De aici
rezult
a c (f1 ; f2 ) si punctul b) e terminat. Mai remarc
am c
a deoarece Rt AR =
1 0
, rezult
a
0 2
A
6.3
=R
1
1
0
1
2
R =
21
cov (f1 ; f2 )
cov (f1 ; f2 )
22
In aceast
a sectiune (X;
; p) este un cmp de probabilitate, f : X ! R o v.a. cu functia de
repartitie F;iar ; sunt numere reale pozitive. Dac
a exist
a urm
atoarea limit
a
p (B \ (x f < x + ))
;!0
p (x f < x + )
p (B \ (x f < x + ))
= lim
;!0
F (x + ) F (x )
lim
atunci o not
am p (Bjf = x). Putem da acum denitia:
Denitia 6.12 Daca x 2 R si B 2
, numim probabilitatea lui B conditionata de f = x
marimea p (B j f = x).
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
80
=x))
E posibil ca p (f = x) = 0 si deci s
a nu putem deni p (Bjf = x) = p(B\(f
asa ca
p(f =x)
n lectia 1. In asemenea situatie aplic
am trecerea la limit
a de mai sus. Ca functie de B,
p ( jf = x) este o probabilitate nit aditiv
a pe o subalgebr
a a lui
. Dac
a nu exist
a pericol
de confuzie vom scrie p (B j x) n loc de p (B j f = x).
Fie g : X ! R este o v.a. iar h : X ! R2 h = (f; g) o v.a. dubl
a care are functia de
repartitie H: Vom nota cu f densit
atile care se refer
a la f , cu g densit
atile care se refer
a la
g, cu densitatea variabilei bidimensionale (f; g). Not
am
G (t j f = x) = p (g < tjf = x)
p ((g < t) \ (x f < x + ))
= lim
;!0
p ((x f < x + ))
H (x + ; t) H (x ; t)
= lim
;!0 H (x + ; 1)
H (x ; 1)
(6.13)
dac
a limita exist
a. Dac
a limita exist
a n orice t 2 R si are ca functie de t propriet
atile unei
functii de repartitie, atunci denim:
Denitia 6.13 Se numeste functia de repartitie a lui g conditionata de f = x functia
G ( jf = x) : R ! R denita prin (6:13).
Se vede c
a dac
a H este derivabil
a, cu densitatea avem
Rt
@H(x;t)
(x; y) dy
@x
G (tjf = x) = @H(x;1) = R 11
(x; y) dy
1
@x
(6.14)
S
i aici vom scrie g (tjx) sau (tjx)n loc de g (tjf = x) dac
a nu exist
a pericol de confuzie.
In studiul probabilit
atilor conditionate din lectia 1, cele mai importante formule studiate au fost formula probabilit
atii totale si formula lui Bayes. Cum arat
a aceste formule n
contextul prezent?
1. Formula probabilit
atii totale:
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
Dac
a p (Bjx) este o functie continu
a atunci
Z
Z 1
p (Bjf = x) dF (x) =
p (B) =
1
81
p (Bjf = x) f (x) dx
n particular
G (t) =
G (tjf = x) dF (x) =
G (tjf = x) f (x) dx
f (xjg = y) = R 1
Dac
a nu exist
a pericol de confuzie putem scrie:
(x) (yjx)
(yjx) (x) dx
1
(xjy) = R 1
Nu insist
am asupra demonstratiilor acestor formule. Ele se pot obtine prin divizarea intervalului unde se g
asesc valorile lui x, aplicarea formulei clasice a probabilit
atii totale sau a lui
Bayes asa cum au fost studiate n lectia 1 si trecerea la limit
a pentru diviziuni din ce n ce
mai ne.
6.4
Fie f; g : X ! R dou
a v.a. si h : X ! R2 ; h = (f; g) cu repartitia H si densitatea . Care
este repartitia sumei f+g si a ctului fg n eventualitatea c
a g 6= 0? In general dac
a r este o
2
functie continu
a r : R ! R atunci repartitia lui r (f; g) este:
Z Z
Fr(f;g) (t) = p (r (f; g) < t) =
(x; y) dxdy
(6.15)
r(x;y)<t
Pentru sum
a si produs avem formule mai precise. Alte exemple sunt date la exercitii.
6.4.1
Distributia sumei
du
1
1
1
(v; u
v) dv
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
82
6.4.2
Distributia ctului
Fie f si g ca mai nainte si n plus g6= 0. In aceste conditii ctul fg are distributia:
Z Z
Z Z
f
F f (t) = p
<t =
(x; y) dxdy +
(x; y) dxdy
g
g
=
dy
y>0;x<ty
ty
(x; y) dx +
1
dy
y<0;x>ty
1
(x; y) dx
ty
1
1
jyj (ty; y) dy
6.5
(6.17)
(6.18)
Distributia Student
Exemplul 6.15 Fie f normala de tipul N (0; ) iar g o variabila 2 de tipul H (s; ), independenta de f. Se cer:p
a) Densitatea lui gs :
b) Densitatea lui h = pf g .
s
c) Momentele lui h.
1
e
2
x2
2 2
1
2
s
2
s
s
2
y 2
y
2 2
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
83
< y = p (g < y 2 s) = Fg (y 2 s) ; pentru y > 0 si 0 pentru y 0. Prin
s
p
urmare densitatea lui gs este
a) Fp g (y) = p
pg
d p
F g (y) = 2syFg0 y 2 s
s
dy
s
2sy
= 2syg y 2 s = s s s y 2 s 2
22
2
p g (y) =
s
g=s
h (t) =
=
yp
=
=
1
e
2
s
2s 2
2
2
2
s+1 p
s+1
2
s+1
2
s+1
2
y2 s
2 2
densitatea
1
1
p
p
( 2s )
sy 2
2sy
s 2 2s 1
2 2 dy
e
y
s
2 s 2s
Z 1 (t2 +s)y2
2 2
y s dy (schimb
am sy 2 = u)
e
t2 y 2
2 2
1
s s+1
s
2
1
s s+1
s
2
s
2
2
1+ ts
2 2
s+1
2
2
1+ ts
2 2
s+1
2
du
s+1
2
=p
s+1
s
2
t2
1+
s
s
2
s+1
2
x h (x) dx =
(x
Rezult
a momente de ordin impar zero. Inlocuind pe h (x) cu expresia de mai nainte s
2
u
f
acnd schimbarea xs = u si apoi 1+u
= y ajungem la
k+ 1 Z 1
s+1
s
s 2
1
2
2k = p
y (k+ 2 ) 1 (1 y)( 2 k) 1 dy
s
s 2 2 0
k+ 1
s+1
s
k + 12
s 2
k
2
2
= p
s+1
s 2s 2
2
s
1
k
k
+
k
s
2
2
= p
s
2
=
(s
sk 1 3 :: (2k 1)
2) (s 4) :: (s 2k)
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
84
dac
a 2k < s. Pentru celelalte valori ale lui k momentele nu exist
a.
Denitia 6.16 O variabila aleatoare cu densitatea
(t) = p
s+1
2
s
t2
1+
s
s
2
s+1
2
se numeste variabila Student.Tipul acesta de v.a. l notam S (s). Gracul acestei densitati
se gaseste la lectia 4.
O asemennea variabila aleatoare
este raportul dintre o variabila normala cu media zero si
pg
2
dispersia pe de o parte si
unde g este o variabila de tipul H (s; ) adica 2 cu s grade
s
de libertate obtinuta ca suma a s patrate de variabile normale de tip N (0; ) (vezi lectia 4),
pe de alta parte.
6.6
Distributia Snedecor-Fisher
Exemplul 6.17 Fie f1 si f2 doua variabile aleatoare independente de tip H (n1 ; ) si H (n2 ; ).
=n1
Se cere densitatea variabilei g = ff21 =n
.
2
Solutie. f1 si f2 sunt variabile 2 . Deoarece ele sunt independente densitatea variabilei
h = (f1 ; f2 ) este
(
n1
n
x+y
1
1 22 1
y
e 2 , x; y > 0
n1 +n2 n +n
n2 x 2
n1
1
2 (
)
(
)
2
2
(x; y) = f1 (x) f2 (y) =
2 2
0;
^{n rest
dac
a x 0 , y 0 si 0 n rest. Aplicnd aceeasi tehnic
a precum n exemplul precedent rezult
a
:
8 n1
n1 +n
2
2
< n1 2
2
( n1 +n
) n21 1
n1
2
1 + n2 x
;x>0
x
n2
(6.19)
g (x) =
( n21 ) ( n22 )
:
0;
in rest
dac
a x 0 si 0 n caz contrar.
Denitia 6.18 O variabila aleatoare cu densitatea (6.19) se numeste variabila SnedecorFisher. Acest tip l vom nota S (n1 ; n2 ).
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
6.7
85
Exercitii
1 4 7 9
3 8 12 18
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
86
sens contrar, n acelasi interval de timp, este o variabila Poisson cu parametrul 2 . Daca
cele doua v.a. sunt independente, care este distributia numarului total de masini pe sosea n
acelasi interval de timp?
6. Un cuplu de v.a. f = (f1 ; f2 ) are densitatea dubla
4(x+3y)e x 3y
; dac
a x0 y0
5
(x; y) =
0
^{n caz contrar
i) Sa se determine densitatile marginale pentru f1 si f2 .
ii) Sa se calculeze densitatea conditionala a lui X daca Y=y.
ii) Sa se calculeze coecientul de corelatie dintre X si Y.
7. Se trage asupra unei tinte plane asezate n (0; 0). Masuratorile indica o distributie
normala a absciselor X a punctelor de impact de tip N (0; 2) si la fel pentru ordonatele Y .
De asemenea X si Y sunt
p independente. Se cer:
a) Distributia distantei X 2 + Y 2 de la punctul de impact pna la tinta.
b) Probabilitatea ca o lovitura specicata sa cada n discul X 2 + Y 2 4.
c) Probabilitatea ca din 4 lovituri cel putin una sa cada n discul X 2 + Y 2 4.
d) Probabilitatea ca din 100 lovituri cel putin 25 sa cada n discul X 2 + Y 2 4.
x2
y2
x2 +y 2
1
1
1
2 (x) = p22
Indicatie. a) 1 (x) = p22
e 8
e 8 deci (x; y) = 8
e 8 . Fie F (t)
p
functia de repartitie a lui X 2 + Y 2 . Avem pentru F (t) = 0 pentru t < 0 iar pentru t 0:
Z Z
x2 +y 2
1
2
2
2
F (t) = p X + Y < t =
e 8 dxdy
8
x2 +y 2 <t2
1
1
.
2 (1+x2 +y 2 )3=2
Se cere:
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
87
a) Valoarea lui daca durata medie de viata a unui bec este de 20 zile (ziua va n problema
unitatea de masura pentru timp).
b) Sa se arate ca daca f1 si f2 sunt independente, cu densitatea atunci f1 +f2 are densitatea
2 t
te
t0
1 (t) =
0
t<0
c) Sa se arate ca daca f1 ; f2 ; :::fn sunt independente si au densitatea de mai sus, atunci
f1 + f2 + ::: + fn are densitatea
( nn 1
t
e t t 0
(n 1)!
n (t) =
0
t<0
d) Care e probabilitatea ca prin nlocuirea becurilor arse sa poata mentinuta lumina aprinsa
peste 200 zile?
1
Indicatie. a) M (f1 ) = 1 deci = 20
. b,c) Se aplic
a (5.13) sau se procedeaz
a ca n lectia
1
4, exercitiul nr. 4. d) In datele de la c) avem = 20 , n = 10, iar probabilitatea cerut
a este:
Z 1
t
1
P = p (f1 + f2 + ::: + f10 200) =
t9 e 20 dt
10
200 20 9!
10 Z 1
10
=
u9 e 10u du ' 0; 457
9! 1
10) Doua variabile aleatoare independente f1 si f2 au distributii normale N (0; ). Sa se
arate ca f12 + f22 si ff21 sunt independente.
Indicatie. (f1 ; f2 ) are densitatea
0. Fie : R2
D(r;s)
D(x;y)
1
e
4 2
x2 +y 2
2 2
f1
f2
este denit
a a.p.t. deoarece p (f2 = 0) =
x
2
2
2
f(x; 0) jx 2 Rg ! R denit
a prin (x; y) ! r = x + y ; s = y . Avem
2
rs
r
= 2 (s2 + 1). De asemenea x2 = 1+s
y 2 = 1+s
a pentru orice pereche
2
2 . Vedem c
(r; s) exist
a dou
a perechi (x; y) ce i corespund prin transformarea dat
a. Pentru D R2
1
sucient de mic (D) = D1 [ D2 cu D1 si D2 disjuncte n corespondenta bijectiv
a si
diferentiabil
a cu D. Avem
2
2 f1
p
f1 + f2 ;
2D
f2
= p (f1 ; f2 ) 2 1 (D)
Z Z
Z Z
x2 +y 2
x2 +y 2
1
1
2
2
2 2 dxdy
=
dxdy
+
e
e
2
4 2
4
D2
ZD1Z
r
1
1
= 2
e 22
drds
4 2
2 (s2 + 1)
D
LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
Prin urmare perechea de v.a.
si remarcii de dup
a ea rezult
a c
a
+ f22 ; ff21
f12 + f22 ; ff21
f12
are densitatea
1
e
4 2
sunt independente.
r
2 2
88
1
.
1+s2
Conform (6.12)
Lectia 7
Procese aleatoare
In modelarea probabilistic
a a unor fenomene, presupunem implicit existenta unei multimi X
de factori necontrolabili, multime care nu poate exact denit
a, ce afecteaz
a desf
asurarea
fenomenelor, precum si existenta unei probabilit
ati pe aceast
a multime. Rezultatul observatiei unui fenomen l reprezent
am printr-un num
ar sau mai multe numere. Observnd de
mai multe ori acelasi fenomen, chiar reproducnd conditiile de desf
asurare ct mai del posibil, rezultatele numerice pot iesi diferite. Intervin aici acei factori necontrolabili care fac s
a
uctueze rezultatele numerice ale experientei ntr-o anumit
a zon
a de valori. De exemplu,
m
asurnd independent cu o rulet
a obisnuit
a de 2m o distanta destul de lung
a, s
a zicem n
jur de 100 m, persoane diferite vor ajunge la rezultate diferite. Nu putem specica exact ce
factori contribuie la aparitia diferentei ntre rezultate si care este contributia ec
aruia, dar
putem admite existenta unei probabilit
ati pe aceast
a multime X de factori necontrolabili.
Fie acea m
arime numeric
a pe care o urm
arim, egal
a cu . Dup
a ce x
am valorile factorilor
controlabili, devine o functie : X ! R, pe multimea factorilor necontrolabili, adic
a o
variabil
a aleatoare. Dac
a reprezint
a o m
arime ce evolueaz
a n timp atunci : T X ! R,
deci variabila aleatoare este (t; ) : X ! R, pentru ecare t 2 T R. Mai not
am aceast
a
variabil
a aleatoare prin t .
Denitia 7.1 O asemenea familie de variabile aleatoare, ce depinde de un parametru t 2
T R se numeste proces aleator sau proces stochastic.
Fie F (t; x) sau functia de repartitie a acestei variabile aleatoare, adic
a:
F (t; x) = p (f! 2 Xj (t; !) < xg)
sau pe scurt
F (t; x) = p ( (t; ) < x) = p ( t < x)
LECTIA
7. PROCESE ALEATOARE
90
multimii X, F este o functie de variabilele reale t; x. Cum functia de repartitie contine toate
informatiile probabilistice despre o v.a., un proces stochastic va descris prin functia sa de
repartitie F (t; x). Vom caracteriza procesul stochastic prin Ft (x) sau derivata ei (t; x) =
(t;x)
t (x) = @F@x
. Dac
a t ia o valori ntr-o multime discret
a fv1 ; ::vn ; ::g atunci
functia de
P
repartitie este complet determinat
a de pk (t) = p ( t = vk ) sau prin Ft (x) = vk <x pk (t) deci,
procesul stochastic va descris prin aceste functii. Mai jos studiem cteva tipuri de procese
stochastice.
7.1
Procese Poisson
S
a consider
am num
arul particulelor cosmice care p
atrund ntr-un anumit volum V, ntr-un
interval de timp. Acest num
ar depinde de factori incontrolabili si apare ca o valoare aleatoare.
Presupunem c
a t este un proces aleator pentru valori ale timpului t 2 [0; 1) care ia doar
valori naturale 0,1,2,...k,... , si anume pentru t > 0, t ia valoarea k dac
a n intervalul de
timp (0; t] au p
atruns n volumul V, k particule cosmice. Pentru ecare t 0, t este o
variabil
a aleatoare. Pentru t < t + t; variabila aleatoare t+t t reprezint
a num
arul de
particule cosmice care au p
atruns n volumul V n intervalul de timp (t; t + t]. Variabilele
t nu sunt independente deoarece valoarea lui t+t depinde de valoarea lui t . Urm
atoarele
ipoteze asupra variabilelor t apar ca naturale:
a) Absenta post efectului, adic
a num
arul de particole care n intervalul de timp [a; b) intr
a
n volumul V este independent de num
arul de particule care au p
atruns anterior n acest
volum si de momentele la care au p
atruns. Exprim
am acest fapt astfel: dac
a 0 a1 < b1
arul de
a2 < b2 ::an < bn atunci avem v.a. b1 a1 , ... bn an care au ca valoare num
particule ce au p
atruns n V n intervalele de timp (a1 ; b1 ], ... (an ; bn ]; ipoteza a) nseamn
a c
a
aceste v.a. sunt independente, adic
a
p b1 a1 = k1 ; b2 a2 = k2 ; :::; bn an = kn
(7.1)
= p b1 a1 = k1 p b2 a2 = k2 ::: p bn an = kn
= 0.
LECTIA
7. PROCESE ALEATOARE
91
Denitia 7.2 Un proces aleator t , t 2 [0; 1) unde t ia valori numere naturale si unde sunt
satisfacute conditiile a), b), c) de mai sus se numeste proces Poisson.
Multe alte fenomene din natur
a apar ca satisf
acnd cerintele a), b), c) : dezintegrarea
spontan
a a nucleelor radioactive, venirea la coad
a a masinilor la o statie de benzin
a, num
arul
de apeluri la o central
a telefonic
a etc.
Problema pe care vrem
s
a
o
rezolv
am n continuare este de a determina probabilit
atile
pk (t) = p a+t a = k , adic
a probabilitatea ca n intr-un interval de lungime t s
a intre k
particule cosmice n volumul V. Conform cu b) aceste probabilit
ati nu depind de a.
Teorema 7.3 Fie un proces Poisson ca mai sus. Atunci exista > 0 astfel ca p1 (t) =
t + 0 (t) si
(t)k t
pk (t) =
e
(7.3)
k!
Demonstratie.(Schita) Fie r = p0 (1). Imp
artim intervalul [0; 1] prin
0<
1
2
n
< < :: <
n
n
n
1=n = 0 = ::: = p 1
n
1
n
=0
1
a n intervalul (0; nk ] nu intr
De aici rezult
a p0 n1 = r n Evenimentul c
a nici o particul
a n
V, este echivalent cu intersectia evenimentelor n intervalul ( i n1 ; ni ] nu intr
a vreo particul
a
k
n V, pentru 1 i k. Cum aceste evenimente sunt independente, rezult
a p0 n =
k
k
1
p0 n
atoare n t, rezult
a usor c
a p0 (t) = rt . Cum
= r n . Acum, deoarece p0 (t) este cresc
r este o probabilitate, r 2 (0; 1), deci r = e pentru un > 0, deci p0 (t) = e t . Am
demonstrat deci formula 7.3 pentru k=0.
Mai departe avem
X
pk (t) = 1
p0 (t) + p1 (t) +
k>1
{z
=0(t) conform cu c)
LECTIA
7. PROCESE ALEATOARE
adic
ae
t
92
t
+ O (t) = t + O (t)
k
X
pi (t) pk
(t)
i=0
= e
t
(t) +
k
X
i=2
pi (t) pk
{z
(t)
}
=0(t) conform cu c)
= pk (t)
(t) + 0 (t)
pentru k 1. Prin trecerea lui pk (t) n membrul stng si divizarea la t, apoi trecerea la
limit
a t ! 0, rezult
a
dpk (t)
= pk (t) + pk 1 (t)
(7.4)
dt
Dac
a tinem seama de conditiile p0 (t) = e t , pk (0) = 0 (din ordinaritate), atunci sistemul
k
7.4 se rezolv
a si se g
aseste pk (t) = (t)
e t .
k!
QED.
Probabilit
atile pk (t) = p ( t = k) sunt la fel ca la o v.a. Poisson (vezi lectia 4), deci media
lui t este M ( t ) = t si dispersia D ( t ) = t.
7.2
Denitia 7.4 Un proces stochastic se numeste proces Markov discret daca t poate lua un
numar nit de valori V = fv1 ; v2 ; :::vn g, timpul t variaza ntr-o multime discreta de valori
T = ft1 ; t2 ; :::tn ; :::g si
p tk = v j tk 1 = vik 1 ; tk 2 = vik 2 ; ::; t1 = vi1 = p tk = v j tk 1 = vik 1
pentru orice v; vik 1 ; :::vi1 2 V .
LECTIA
7. PROCESE ALEATOARE
93
m
arimi se numesc probabilitati de tranzitie. Deoarece din starea i se poate ajunge la momentul
urm
ator doar n st
arile 1,2,3,...n, trebuie s
a avem pi;1 (k) + pi;2 (k) + ::: + pi;n (k) = 1. Cel
mai simplu proces de acest tip este acela n care probabilit
atile de tranzitie pi;j (k) nu depind
de momentul k. In acest caz avem pi;j (k) = pP
ste
i;j . Matricea p cu elementele pi;j se nume
n
matricea de tranzitie. Intr-o astfel de matrice j=1 pi;j = 1, pi;j 0.
Exemplul 7.5 Sa presupunem ca o particula se poate misca ntre doua bariere a < b trecnd
prin puncte intermediare
a = x1 < x2 < ::: < xn = b
Daca particula se gaseste n pozitia xi atunci cu probabilitatea r se deplaseaza nainte n
pozitia xi+1 si cu probabilitatea s = 1 p se deplaseaza napoi n pozitia xi 1 . In capetele a
si b particula este respinsa n pozitia imediat vecina. Pentru 4 pozitii posibile, matricea de
tranzitie este
0
1
0 1 0 0
B s 0 r 0 C
C
p=B
@ 0 s 0 r A
0 0 1 0
(k)
(k)
Din aceast
a formul
a rezult
a prin inductie
p(k) = pk
adic
a p(k) este puterea de ordinul k a matricei de tranzitie.
Exemplul 7.6 Pentru matricea de tranzitie din exemplul 1 gasim
1
0
s
0
r
0
B 0 s+rs
0
r2 C
C
p2 = B
2
@ s
0
r+rs 0 A
0
s
0
r
LECTIA
7. PROCESE ALEATOARE
94
1
C
C
A
1
C
C
A
Cum arat
a probabilit
atile pi;j pentru valori mari ale lui k? Urm
atoarea teorem
a aduce
l
amuriri n aceast
a privinta.
(m)
Teorema 7.7 Daca pentru m 2 N are loc inegalitatea pi;j > 0 pentru orice i; j, atunci exista
lim p(k) si
k!1
(k)
lim pi;j = pj
k!1
independent de i.
Altfel spus, probabilit
atile de tranzitie de la starea i n momentul 0, la starea j n momentul
k, se stabilizeaz
a pentru k ! 1 la valori independente de starea la momentul 0.
Pentru demonstratie se poate consulta bibliograa.
Exemplul 7.8 Fie matricea de tranzitie
0
1=8
B 1=4
p=B
@ 1=10
7=20
Utiliznd calculatorul gasim
0
0; 214013
B
0; 21402
p7 = B
@ 0; 214014
0; 214024
2=8
1=4
5=10
3=20
0; 283041
0; 283038
0; 28304
0; 283037
2=8
1=4
2=10
5=20
1
3=8
1=4 C
C
2=10 A
5=20
0; 238095
0; 238095
0; 238095
0; 238095
1
0; 264851
0; 264846 C
C
0; 26485 A
0; 264844
LECTIA
7. PROCESE ALEATOARE
p100
0; 214018
B 0; 214018
=B
@ 0; 214018
0; 214018
95
0; 283039
0; 283039
0; 283039
0; 283039
0; 238095
0; 238095
0; 238095
0; 238095
1
0; 264848
0; 264848 C
C
0; 264848 A
0; 264848
Se vede cum de la p7 se stabilizeaza primele trei zecimale ale probabilitatilor limita, la p100
ind stabilizate cel putin 6 zecimale.
7.3
S
a presupunem c
a ntr-un proces stochastic t ia valori numere naturale si c
a urm
atoarele
conditii sunt ndeplinite:
i) p t+t = k + 1j t = k = k t + O (t) ; > 0;(aceasta este probabilitatea unui
proces de nastere n intervalul (t; t + t))
ii) p t+t = k 1j t = k = k t + O (t) ; > 0; k 1( aceasta este probabilitatea
unui proces
n intervalul (t; t + t).
de moarte
iii) p t+t t > 1 = O (t) (aceasta este probabilitatea a mai mult de o nastere sau
o moarte n intervalul (t; t + t))
Denitia 7.9 Un proces stochastic cu valori naturale si care ndeplineste conditiile i)-iii) de
mai sus se numeste proces de nastere si moarte.
Dac
a k = 0 atunci procesul se numeste proces de nastere iar dac
a k = 0 se numeste
proces de moarte. Deoarece pentru k 1 avem
1 =
1
X
n=0
p t+t = nj t = k
= p t+t = k 1j t = k + p t+t = kj t = k
+p t+t = k + 1j t = k + p t+t k 2 j t = k
rezult
a imediat din i). ii),iii) c
a
iv) p t+t = kj t = k = 1 k t k t + O (t).
Problema care se pune la aceste procese const
a n determinarea probabilit
atilor
p ( t = k) = pk (t) cunoscnd pk (0) = p ( 0 = k).
Solutie. Deoarece evenimentele f t = kgk2N sunt disjuncte avem conform formulei probabilit
atii totale pentru k 1
p t+t = k = p ( t = k) p t+t = kj t = k
(7.5)
+p ( t = k + 1) p t+t = kj t = k + 1
(7.6)
+p ( t = k 1) p t+t = kj t = k 1
(7.7)
+p (j t kj 2) p t+t = kj j t kj 2
(7.8)
LECTIA
7. PROCESE ALEATOARE
96
Folosind relatia iv) n (7:5), relatia ii) n (7:6), relatia i) n (7:7), relatia iii) n (7:8) g
asim:
pk (t + t) = pk (t) (1 k t k t + O (t))
+pk+1 (t) k+1 t + O (t)
+pk 1 (t) (k 1 t + O (t))
+O (t)
Trecnd pk (t) n membrul stng, diviznd prin t, apoi trecnd la limit
a t ! 0 g
asim
p0k (t) = k 1 pk
(t)
(7.9)
0 p0 (t) + 1 p1 (t)
(7.10)
0
p.
1 0
pn =
0 1 ::: n 1
p0
1 2 ::: n
1
X
pi = 1
0 1
,
1 2
(7.12)
(7.13)
i=0
P
n 1
si acest lucru este posibil numai dac
a n 0 1 :::
< 1.
1 2 :::n
In acest fel poate modelat fenomenul de asteptat la coad
a.
7.3.1
LECTIA
7. PROCESE ALEATOARE
97
Prima problem
a care se pune este modelarea caracterului ntmpl
ator al venirilor n statie
si al plec
arilor din statie. Fie num
arul mediu de veniri n unitatea de timp. Deci ntrun timp t vor n medie t veniri. Dac
a num
arul de masini din care se vine la coad
a
este n iar nevoia de benzin
a este ntmpl
atoare si independent
a de la o masin
a la alta atunci
k k n k
unde p este
probabilitatea de a veni la coad
a k masini n intervalul (t; t + t) este Cn p q
probabilitatea ca o masin
a s
a aib
a nevoie de benzin
a iar q = 1 p (vezi legea binomial
a).
t
Num
arul mediu de veniri este np iar pe de alt
a parte este t. Deci np = t ) p = n .
k
Prin urmare :
a) Probabilitatea ca n intervalul (t; t + t) sa vina n statie o masina este e t t
=
1
t + O(t).
b) Probabilitatea ca sa nu vina n statie nici o masina n intervalul (t; t + t) este e t =
1 t + O(t).
c) Probabilitatea ca n intervalul (t; t + t) sa vina n statie mai mult de o masina este
k
P
t (t)
= O(t).
k2 e
k!
In mod analog, e num
arul mediu de masini deservite de o statie n unitatea de
timp(presupunnd c
a are continuu de lucru). Intr-un interval de lungime t vor n medie
deservite t masini. Num
arul real al celor deservite poate mai mare sau mai mic dect
media si depinde de factori ntmpl
atori, ca necesarul de benzin
a, ntrzieri produse de sofer,
etc. Admitem c
a:
a) Probabilitatea ca n intervalul (t; t + t) sa plece din statie o masina, daca exista
vreuna, este t + O (t)
b) Probabilitatea ca n intervalul (t; t + t) sa nu plece din statie nici o masina, daca
exista vreuna, este 1 t + O (t)
c) Probabilitatea ca n intervalul (t; t + t) sa plece din statie mai mult de o masina este
O(t).
Ipotezele f
acute asupra plec
arilor din statie sunt asem
an
atoare cu conditiile a), b),c) ndeplinite de probabilit
atile de venire n statie.
Fie acum familia de variabile aleatoare t ; t 2 T = [0; 1) , unde valoarea lui t este egal
a
cu num
arul de masini n statie la momentul t. Ipotezele f
acute asupra venirilor si plec
arilor,
independente unele de altele, se mai scriu:
LECTIA
7. PROCESE ALEATOARE
98
i)
p t+t = k + 1j t = k
+
O (t)
| {z }
= ( t + O (t)) (1
|
{z
}|
t O (t)) +
{z
}
= ( t + O (t)) (1
|
{z
} |
t O (t)) +
{z
}
o venire
= t + O (t)
nici o plecare
ii)
p t+t = k
+
1j t = k
O (t)
| {z }
o plecare
= t + O (t)
nici o venire
P1 k
k=0
a
= p0 1 1 rezult
p0 = 1
Stabilizarea se poate face doar cu conditia 0 <
gent
a.
7.3.2
P k
s
a e conver-
Presupunem acum c
a populatia de unde provin masinile (unit
atile) n asteptare este limitat
a
la un num
ar de N exemplare. Coada care se formeaz
a depinde de ct de des au nevoie
masinile de serviciile statiei si ct de prompte sunt aceste servicii. In ce priveste capacitatea
de deservire a statiei, nu apar elemente care s
a modice ipotezele a), b), c) anterioare.
In ce priveste venirile n statie, ele apar n mod normal proportionale cu num
arul masinilor
LECTIA
7. PROCESE ALEATOARE
99
N (N
1) ::: (N
k
k + 1) k
p0 ;
0kN
(7.15)
P
Valoarea lui p0 se determin
a din conditia ca nk=0 pk = 1.
Un asemenea proces ar putea modela de exemplu coada la reparatii ntr-o intreprindere
cu N masini dac
a serviciul de reparatii are doar un mecanic. Un model mai realist este:
7.3.3
7.4
Prin urmare pentru procese stationare de ordinul unu, functia de repartitie este aceeasi
pentru toate variabilele t .
S
a consider
am acum pentru dou
a valori t1 ; t2 vectorul aleator t1 ; t2 . Acest vector are
o functie de repartitie mixt
a (vezi lectia 6) denit
a prin Ft1 ;t2 (x; y) = p t1 < x; t2 < y .
LECTIA
7. PROCESE ALEATOARE
100
Denitia 7.11 Spunem ca procesul aleator t este stationar de ordinul doi daca functia de
repartitie mixta este invarianta la o translatie a timpului. Mai precis Ft1 ;t2 = Ft1 + ;t2 + pentru
orice .
In mod analog se poate deni un proces stationar
de ordinul n, prin functia de repartitie
a un proces aleator este stationar de
n dimensional
a a vectorului aleator t1 ; t2 ; ::: tn . Dac
ordin n, atunci el este stationar de orice ordin 0 k n.
Pentru un proces stationar media,dispersia, momentele de diverse ordine ale variabilei t
nu depind de t.Variabilele aleatoare t nu sunt n general independente. Dac
a m este media
variabilei t (independent de t) atunci coecientul de corelatie
M t1 m t2 m
c t1 ; t2 = r
2
2
M t1 m
M t2 m
(vezi lectia 6) este si el invariant la o translatie n timp, adic
a c t1 ; t2 = c t1 + ; t2 +
pentru orice . Ins
a n multe aplicatii ale probabilit
atilor se utilizeaz
a doar media, dispersia
pentru variabilele aleatoare individuale si coecientul de corelatie pentru perechile de variabile
aleatoare. Aceste m
arimi pot invariante la o translatie a timpului f
ar
a ca functia de repartitie
s
a e. De aceea s-au studiat n mod special procesele aleatoare pentru care aceste m
arimi
sunt invariante la o translatie a timpului, f
ar
a s
a se cear
a si invarianta functiei de repartitie.
Denitia 7.12 Un proces aleator ( t )t2T se numeste stationar n sens larg daca
a) media M ( t ) = m este independenta de t 2 T .
b) dispersiaM ( t ) = 2 esteindependenta de t 2 T .
c) c t1 ; t2 = c t1 + ; t1 + pentru orice t1 ; t2 ; t1 + ; t2 + 2 T .
LECTIA
7. PROCESE ALEATOARE
pentru c
a R ( ) = M tt
3.
101
= M t t = R ( ).
2
R (0) jR ( )j
0 rezult
a M 2t + M 2t+ 2M t t+ 0, sau
pentru c
a din M t t+
2R (0) 2R ( ) 0.
4. Pentru orice n 2 N si 1 ; 2 ; :: n 2 R forma p
atratic
a
n
X
R ( i
j ) xi x j
i;j=1
P
n
i=1 xi t+ i
2
0, oricare ar t astfel ca
t!t0
t0 2 T .
Se mai spune c
a procesul aleator este continuu n medie p
atratic
a.
5. Dac
a procesul aleator stationar n sens larg ( t )t2T este continuu atunci functia de
autocorelatie R ( ) este continu
a (exercitiu).
6. Functia de autocorelare a unui proces stationar n sens larg, continuu, se poate pune
sub forma
Z 1
ei ! dF (!)
R ( ) =
1
7. Orice proces aleator continuu stationar n sens larg se poate aproxima prin procese
aleatoare standard. Anume, pentru orice A > 0 si orice " > 0 exist
a un num
ar nit n de
LECTIA
7. PROCESE ALEATOARE
102
7.5
Exercitii
2. Sa presupunem ca numarul de statii este n iar solicitarile vin dintr-o populatie foarte
mare, deci numarul de veniri nu este inuentat de numarul de unitati n asteptare. Care este
probabilitatea ca o solicitare sa poata satisfacuta imediat? Caz particular n = 5, = = 12 ?
Solutie. In acest caz avem un proces de nastere si moarte n care k = si n care
k = k pentru 0 k n si k = n pentru k n (probabilitatea de a iesi o unitate
din sistem este proportional
a cu num
arul unit
atilor n curs de deservire). G
asim, conform cu
(7.12)
(
k
p , pentru k n
k! 0
pk =
k
p , pentru k > n
n!nk n 0
P
pk = 1 conduce la
Conditia
p0 = Pn
k
k=0 k!
1
P1
nn
n!
k=n+1
= Pn
k
k
k=0 k!
n+1
n!(n )
LECTIA
7. PROCESE ALEATOARE
103
Pentru n = 5, = 1=2 g
asim p = 0; 998. Dac
a venirile sunt mai pronuntate, de exemplu
= = 3 (probabilitatea de solicitare a unui serviciu ntr-un interval scurt t este de trei
ori mai mare ca probabilitatea de iesire de la un server n lucru), atunci g
asim o probabilitate
de satisfacere imediat
a a cererii mai mic
a, p = 263
=
0;
7638.
343
3. La o centrala telefonica vin apeluri aleatoare, independente. Centrala poate deservi
simultan n = 50 de cereri, iar apelurile care vin cnd centrala este ocupata se anuleaza.
Presupunnd ca raportul = dintre probabilitatea t de venire a unui apel ntr-un timp
scurt t si probabilitatea t de eliberare ntr-un timp scurt t a unui circuit ocupat este
= 50, sa se calculeze probabilitatea ca un apel telefonic sa e anulat.
Solutie. S
i n acest caz avem un proces de nastere si moarte. Fie pk probabilitatea ca n
central
a s
a e k circuite ocupate. Coecientul k pentru nastera unui apel este x, egal cu
. Coecientul k pentru moartea unui apel este k = k , pentru c
a dac
a sunt k circuite
ocupate atunci probabilitatea de eliberare a unui circuit creste de k ori fata de cazul unui
singur circuit ocupat. Conform cu formulele (7.12) avem
pk
pk
Din conditia
Pn
k=0
0 1 ::: k 1
k
k
=
p
=
p0 , pentru 0 k n
p0 =
0
1 2 ::: k
k!k
k!
= 0, pentru k > n
pk = 1 rezult
a
p0 = Pn
k
k=0 k!
Probabilitatea cerut
a n problem
a este
p = pn =
n
n!
Pn k
k=0 k!
LECTIA
7. PROCESE ALEATOARE
104
0.5
0.4
0.3
0.2
0.1
20
40
60
80
100
Cresterea probabilit
atii p (vertical
a) de refuz a unui apel
cu cresterea factorului (orizontal
a) de nc
arcare al centralei
4. O particula se misca ntre doi pereti doar prin pozitiile x1 < x2 < x3 < x4 astfel: daca
este ntr-o pozitie interioara atunci cu probabilitatea 34 face un salt n pozitia din fata si cu
probabilitatea 41 n pozitia imediat din spate; daca se gaseste n prima sau n ultima pozitie,
ramne denitiv acolo.
Sa se descrie comportarea particulei dupa un numar mare de salturi.
Indicatie. Matricea probabilit
atilor de trecere din o pozitie n alta este:
0
1
1
0
0
0
B 1=4 0 3=4 0 C
C
p=B
@ 0 1=4 0 3=4 A
0
0
0
1
Cu calculatorul g
asim de exemplu
0
1
0
B
0:30769
4:4679 10
p100 = B
@ 0; 07692
0
0
0
37
0
0
4; 4679 10
0
37
1
0
0; 692308 C
C
0; 923077 A
0
1
2
LECTIA
7. PROCESE ALEATOARE
105
1, t 2 ( 2b ; 2b ]
Fie f : R ! R prin f (t) =
. Denim acum procesul aleator ( t )t2R
0, n caz contrar
P
prin t = i2Z f (t i b) i . Sa se calculeze functia de autocorelatie R (t1 ; t2 ). Este procesul
stationar n sens larg?
Solutie. Pe intervalul ( 2b ; 2b ] , t = 0 ; pe intervalul ( 2b ; 3b
], t = 1 ; ... pe intervalul
2
Ii = (ib 2b ; ib + 2b ] , t = i . Prin urmare t1 t2 = i j dac
a t1 2 Ii si t2 2 Ij . Deoarece
a de zero doar
variabilele i sunt independente rezult
a c
a M t1 t2 = M i j este diferit
2
dac
a i = j, adic
a t1 ; t2 2 Ii , caz n care avem R (t1 ; t2 ) = M ( i ) = 1. Functia de autocorelatie
nu este invariant
a la o translatie n timp deci procesul nu este stationar n sens larg.
P
6. Fie procesul aleator t = nk=1 ak (k cos k t + k sin k t) unde ak si k 2 R, iar k si
k sunt variabile aleatoare independente, de medie 0 si dispersie 1, pentru k=1,2,...n. Sa se
arate ca procesul este sta
n sens larg si sa se determine autocorelatia procesului.
Ptionar
2
R
aspuns. R ( ) = ak cos k .
Partea II
Statistic
a
106
Lectia 8
Statistica descriptiv
a
In cele ce urmeaz
a vom ncerca s
a explic
am ce este statistica, cum difer
a ea de teoria probabilit
atilor, ce o leag
a de aceasta, care sunt p
artile ei componente si cum ncepe demersul practic
ntr-o problem
a de statistic
a (adic
a vom spune cteva cuvinte despre statistica descriptiv
a).
Atunci cnd omul nu a mai putut intui a nceput s
a masoare. M
asur
atorile si observatiile au devenit prima treapt
a spre ntelegerea legilor naturii. Dar, n acest fel, omul nu
mai poate s
a cunoasc
a direct realitatea, el poate numai s
a o aproximeze succesiv prin modele
zice si apoi prin modele matematice. Dar aceste modele nu descriu exact Realitatea. Ele o
aproximeaz
a si apar asa numitele erori. Unele erori sunt previzibile, altele ns
a sunt ntmpl
atoare (aleatoare). Aceste ultime erori (aleatoare) au si ele legile lor de manifestare. Apar
deci fenomenele aleatoare descrise prin variabilele aleatoare. Teoria probabilit
atilor pleac
a de
la ipoteza c
a se cunosc exact aceste variabile aleatoare (prin functiile de probabilitate, prin
functiile de repartitie, prin functiile caracteristice, etc.). Statistica pleac
a de la m
asuratorile brute si caut
a s
a reg
aseasc
a modelul probabilistic teoretic exact care se a
a n spatele
acestor m
asuratori. Partea empiric
a a statisticii care se ocup
a de prelucrarea datelor obtinute prin m
asuratori sau observatii se numeste statistica descriptiva. Aparatul matematic al
teoriei probabilit
atilor, pus n functiune pentru a studia si interpreta aceste date, n dorinta
de a recupera modelul probabilistic real, care guverneaz
a fenomenul m
asurat sau observat,
formeaz
a inferenta statistica. Dup
a ce cercet
atorul cap
at
a informatii sucient de clare despre
fenomenul probabilistic studiat, el va trebui s
a actioneze optim potrivit acestor informatii.
Apare deci teoria deciziei statistice, care este o ramur
a important
a a statisticii.
8.1
LECTIA
8. STATISTICA DESCRIPTIVA
108
calitative (culoarea ochilor, sex, loc de nastere, etc...). Oricum statistica lucreaz
a cu numere,
caracteristicilor calitative li se atasaz
a coduri numerice.
Exemplul 8.1 Ne intereseaza statistica ploilor n Bucuresti pe anul 1995, zilnic. Aici populatia este multimea zilelor din anul 1995, un individ al populatiei este o zi anume din acest an,
de exemplu 3 ianuarie, iar caracteristica calitativa este faptul ca a plouat sau nu n acea zi.
Daca a plouat punem 1 si daca nu, putem 0. Numerele 1 si 0 reprezinta coduri n statistica
respectiva.
Presupunem n continuare c
a avem numai caracteristici cantitative ale unor populatii, mai
exact avem multimi brute de numere reale, sau tabele de numere reale. Privim aceste numere
atasate unei populatii ca ind valori ale unei variabile aleatoare X. Vom spune pe scur: e
populatia X .
Exemplul 8.2 O masina produce piese cilindrice ne, cu diametru standard xat = 3 cm.
Fiecare piesa are o abatere de la acest diametru, masurata n microni. Aceste abateri formeaza
o populatie n sensul de mai sus, mai bine zis valorile unei variabile aleatoare X. Noi nu
putem sa precizam de la nceput ce abatere va avea o piesa luata la ntmplare, dar putem
face o selectie de n piese si putem masura abaterile lor: x1 ; x2 ; :::; xn . Fiecare xi reprezinta
o valoare a v.a. X care, teoretic vorbind, are o densitate de probabilitate (x) si o functie de
repartitie F (x).
Denitia 8.3 O multime de n observatii independente asupra unei caracteristici numerice X
a unei populatii P, care ne da n valori x1 ; x2 ; :::xn , se numeste selectie de volum n. Sirul
de
valori (xi )1in l vom numi serie statistica discreta.
In exemplul de mai sus facem o selectie de volum n din multimea pieselor si construim asa
numita functie de repartitie empirica Fn (x).
Denitia 8.4 Se numeste functie de repartitie empirica asociata unei variabile aleatoare X
si unei selectii fx1 ; x2 ; :::; xn g;functia Fn : R ! R
Fn (x) =
Fn (x) j g ! 0
cnd n ! 1; pentru orice > 0, xat. Altfel spus Fn (x) ! F (x) n probabilitate.
LECTIA
8. STATISTICA DESCRIPTIVA
109
Demonstratie S
a not
am cu p =ProbfX < xg = F (x), si cu Fn (x) = knx (vezi denitia de
mai sus). Not
am cu 1 ; :::; n v.a. construite astfel: j are valoarea 1 dac
a xj < x si 0 n caz
contrar. Variabilele 1 ; ::: n sunt independente (ca valori ale unor observatii independente) si
au distributia
1 0
p 1-p
Avem M ( i ) = p; D ( i ) = p(1
D(Yn ) =
1 ++ n
n
1
p(1 p)
(D ( 1 ) + ::: + D ( n )) =
2
n
n
(a se vedea propriet
atile mediei si dispersiei, Lectia 2). Aplic
am acum inegalitatea lui Cebsev
lui Yn si g
asim c
a
Prob (j Fn (x)
= Prob (jYn
F (x) j )
D (Yn )
p2 (1 p)2
pj )
=
2
n2
centrat de ordin k.
LECTIA
8. STATISTICA DESCRIPTIVA
2
110
2
2
iv) S 2 =D = 2 = (x1 m ) +(x2 mn ) +:::+(xn m ) se numeste dispersia empirica sau varianta empirica. se numeste deviatia standard.
2
2
2
v) S 02 = (x1 m ) +(x2 nm 1) +:::+(xn m ) se numeste dispersia empirica modicata.
vi) Valoarea 2 R astfel ca numarul de valori xi este egal cu numarul de valori
xi , se numeste mediana. Daca exista mai multe asemenea valori pentru , atunci ele
formeaza un interval si mediana este prin denitie mijlocul acestui interval.
vii) Valoarea xi cu frecventa maxima de aparitie se numeste modul selectiei. (este posibil
sa nu e unic)
viii) Se numeste prima cvartila a selectiei, cel mai mic x astfel ca numarul de valori xj x
sa e 41 n . A treia cvartila este cea mai mica valoare xi astfel ca numarul de valori xj xi
sa e 34 n. Analog se deneste a p-a cuantila de ordin q ca cea mai mica valoare xi astfel
ca numarul de valori xj xi sa e pq n.
Observatia 8.7 In cazul cnd datele sunt grupate pe intervale, denitiile de mai sus se
refera la mijloacele intervalelor, ecare mijloc ind considerat de attea ori cte valori se aa
n el.
In general daca o valoare xi se repeta atunci vom nota cu ni numarul
P de apari
Ptii, si
ni xi
ni
cu fi = n frecventa relativa. Formulele de mai sus pot scrise m = n =
fi xi ,
P
2
2
=
fi (xi m ) , etc. Insumarea se face acum numai dupa valorile xi distincte. Seria
statistica o vom nota n acest caz (xi ; ni )1ip , punnd n evidenta de cte ori apare ecare
valoare.
Media si mediana descriu centrul valorilor de selectie iar dispersia este o masura a
mprastierii acestor valori n jurul centrului. Modul indica n ce zona sunt cele mai probabile
valori. Cuantilele indica n ce zone se aa un anumit procent de valori.
Propozitia 8.8 Urmatoarele formule au loc:
P
n x2i
2
S =
S
0 2
0 2
n2
xi ) 2
P
( xi )2
1)
x2i
n(n
x2i
=
n 1
n
n
(8.1)
(8.2)
m2
(8.3)
LECTIA
8. STATISTICA DESCRIPTIVA
111
frecv. cumulata
F(ti )
8=40
8
5
+ 40
= 13
40
40
8
5
5
+ 40 + 40
= 18
40
40
24=40
25=40
26=40
29=40
30=40
33=40
36=40
38=40
40=40 = 1
ti ni =n =
1X
ti fi
n
1
(1 8 + 2 5 + 3 5 + 4 6 + 5 1 + +6 1
40
+7 3 + 8 1 + 9 3 + 10 3 + 11 2 + 12 2)
= 5
=
dispersia empiric
a este
X
(ti m )2 ni =n
1
=
(1 m )2 8 + (2
40
= 13; 179
2
m ) 5 + (3
2
m ) 5 + + (12
2
m ) 2
LECTIA
8. STATISTICA DESCRIPTIVA
112
0,6
0,5
0,4
0,3
0,2
0,1
0
1
10 11 12
10 11 12
Exemplul 8.11 Se da o selectie de 150 de numere fx1 ; x2 ; :::; x150 g cu media de selectie
m=102, 42. Aceste numere se grupeaza n 8 intervale [81; 5; 87; 5); [87; 5; 93; 5); :::; [123; 5; 129; 5),
de lungime 6 unitati. Ele se repartizeaza n aceste intervale dupa cum urmeaza: n primul
interval avem 2 numere (n1 =2), n al doilea 23 de numere (n2 =23), f3 =22, n4 =65, n5 =20,
n6 =10, n7 =0, n8 =8.a) Sa se calculeze media selectiei. b) Sa se calculeze dispersia selectiei.
Solutie a) este l
asat ca exercitiu; se g
aseste m = 102; 42:
b) Se face urm
atorul tabel de calcule:
LECTIA
8. STATISTICA DESCRIPTIVA
xj
113
m (xj
nj xj
m )2
(xj
m ) 2 nj
(mijlocul int:)
84; 5
90; 5
96; 5
102; 5
108; 5
114; 5
120; 5
126; 5
G
asim S2 =
x2j nj
n
8.2
2
23
22
65
20
10
0
8
P
(xj m)2 nj
n
17; 92
11; 92
5; 92
0; 08
6; 08
12; 08
18; 08
24; 08
11519;04
150
321; 1264
142; 0864
35; 0464
0; 0064
36; 9664
145; 9264
326; 8864
579; 8464
642; 2528
3267; 9872
771; 0208
0; 4160
739; 3280
1459; 2640
0; 0006
4638; 7712
__________
11519; 0400
Statistica a dou
a variabile
S
a presupunem c
a avem dou
a caracteristici numerice care se urm
aresc, de exemplu n
altimea
si greutatea. Prin testare se g
aseste urm
atoarea situatie: xi sunt greut
atile, yj sunt n
altimile
observate (grupate pe intervale), iar la ntret
aierea coloanei i cu linia j se a
a num
arul de
cazuri observate, ni;j .
xi !
yj #
152
157
162
167
ni;:
43
20
2
0
0
22
48
8
18
1
1
28
53
2
1
10
4
16
58
0
4
4
15
23
n:;j
30
25
15
20
N=80
Not
am o asemenea serie de observatii prin (xi ; yj ; ni;j ) 1ip . Avem de exemplu la x2 =48
1jq
si y1 =152 un num
ar de n2;1 =8 cazuri nregistrate.
Se denesc
atoareleP
m
arimi: P
P urm
a n
i) ni;: = j ni;j , n:;j = i ni;j , N= i;j ni;j . Seria (xi ; ni;: ) se numeste seria marginal
n
n
x, iar seria (yj ; n:;j ) se numeste seria marginal
a n y. fi;: = Ni;: si f:;j = N:;j se numesc frecvente
n
marginale, iar
f = Ni;j se numeste frecven
ta dubl
a.P
P i;j
P
ii) mx =
ii)
ni;j xi
N
i;j
2
x
i;j
ni;: xi
N
ni;j (xi
N
si my =
mx )2
ni;j yj
N
i;j
ni;: (xi
N
n:;j yj
N
mx )2
ni;: x2i
N
m2
x
LECTIA
8. STATISTICA DESCRIPTIVA
si
114
2
P
P
2
ni;j (yj my )2
my
j n:;j yj
j n:;j yj
=
=
=
m2
y
N
N
N
se numesc dispersii (variante) marginale.
iv) Covarianta seriei este num
arul
P
P
n
(x
m
)
y
m
i;j
i
j
x
y
i;j
i;j ni;j xi yj
cov(x; y) =
=
mx my :
N
N
2
y
i;j
cov(x;y)
.
x y
22 43 + 28 48 + 16 53 + 23 58
= 49; 438;
80
Reprezentarea grac
a a datelor se face prin discuri pline: n punctul (xi ; yj ) se pune un
disc cu aria proportional
a cu num
arul de observatii care au dat greutatea xi si n
altimea yj .
Se obtine histograma:
LECTIA
8. STATISTICA DESCRIPTIVA
115
167.5
165
162.5
160
157.5
155
152.5
42.5
45
47.5
50
52.5
55
57.5
a) 1 x;y 1 si semnul egal apare daca si numai daca punctele (xi ; yj ), pentru ni;j 6= 0;
sunt coliniare.
b) Ecuatia dreptei y = ax+b, unde coecientii a; b sunt determinati de conditia ca expresia
X
X
(yj axi b)2 =
ni;j (yj axi b)2
(a; b) =
(xi ;yj )=observat
i;j
sa e minima, este:
y=
cov(x; y)
(x
2
x
mx ) + my
(8.4)
LECTIA
8. STATISTICA DESCRIPTIVA
116
este egal
a cu 0, deci pentru orice i; j, pentru care ni;j 6= 0 avem t0 yj my + xi mx = 0,
deci punctele (xi ; yj ) cu ni;j 6= 0 sunt coliniare.
b) @(a;b)
= 0; @(a;b)
= 0 formeaz
a un sistem liniar n a si b cu solutiile a = cov(x;y)
,
@a
@b
2
x
b = my amx .
QED.
Analog se determin
a dreapta de regresie a lui x n y. Cele dou
a drepte sunt distincte. Ele
coincid doar dac
a datele (xi ; yj ) sunt coliniare. In cazul de mai sus g
asim y = 0; 67x+124; 188,
dreapt
a care este reprezentat
a pe histograma datelor.
Dac
a f (x) =Pax2 +bx+c, corelatia se zice parabolica. Coecientii se determin
a din conditia
2
2
a e minim
a.
ca (a; b; c) = i;j ni;j (yj axi bxi c) s
bx
Dac
a f (x) = ae , corelatia se zice exponentiala si se reduce prin logaritmare tot la o
corelatie liniar
a: ln (f (x)) = ln (a) + bx. Coecientii = ln (a) si b se determin
a din conditia
P
a e minim
a.
ca (; b) = i;j ni;j (ln (yj ) bxi )2 s
Dac
a f (x) = axb , atunci avem prin logaritmare ln(f (x)) = P
ln(a) + b ln (x), si, la fel ca mai
sus se deduc coecientii = ln (a) si b din conditia (; b) = i;j ni;j (ln(yj ) b ln(xi ))2
s
a e minim
a.
In multe situatii pentru ecare xi avem doar o valoare y pe care o not
am yi , deci valorile
(xi ; yi ) sunt pe gracul unei functii. Determinarea unei functii care ajusteaz
a datele respective
prin metoda celor mai mici patrate const
a n propunerea unui model
de
func
tie, f (x; a; b; ::);
P
f (xi ; a; b; ::))2 s
a e
si determinarea parametrilor a; b; :: din conditia (a; b; ::) =
i (yi
minim
a.
8.3
Exercitii
LECTIA
8. STATISTICA DESCRIPTIVA
117
D !7
2. Doua grupe de 10 studenti A si B au obtinut urmatoarele note la examenul de statistica:
A : 8, 5, 6, 6, 7, 9, 4, 3, 5, 6
B : 9, 6, 7, 8, 6, 10, 5, 4, 6 ,7.
Sa se gaseasca cea mai buna corelatie liniara ntre cele doua selectii. Sa se gaseasca valoarea deviatiei patratice. Sa se faca acelasi lucru pentru o corelatie de tip parabolic si sa se
compare deviatiile patratice.
3. Fie selectia {0, 1, -1, -1, -2, 1, 1, -1, 2, 3, 1, 4, 3, -1, 0, 0, 3, -1, -2, -2} dintr-o
populatie anume. Fie X v.a. care guverneaza populatia. Sa se aproximeze cu ajutorul selectiei numarul P (0 X 2). Se cere gracul functiei de repartitie pentru aceasta selectie si o
histograma a frecventelor.
4. S-a facut un sondaj asupra pretului (n centi) galonului de benzina premium asupra a
30 statii luate la ntmplare. De aici a rezultat selectia: 65, 58, 64, 68 , 52, 48, 59, 59, 56, 63,
61, 66, 52, 57, 60, 62, 55, 55, 64, 71, 61, 63, 46, 53, 60, 57, 58, 57, 54, 58. Se cere gracul
poligonului de frecventa (relativa) daca: a) grupam datele n intervale de lungime 3, cu 60
centrul unui asemenea interval; b) grupam datele n intervale de lungime 5, cu 60 ca centru al
unui asemenea interval. Calculati pentru aceste grupari media si dispersia de selectie. Gasiti
gracul functiilor de repartitie empirice.
5. La un concurs 12 studenti au obtinut urmatorele punctaje: 18, 15, 19, 27, 13, 30, 24,
11, 5, 16, 17, 20. Calculati media, mediana, deviatia standard si deviatia absoluta medie.
Construiti functia empirica de frecventa cumulata (f. de repartitie) si interpretati rezultatele
obtinute.
Lectia 9
Statistici. Estimarea parametrilor
Amintim c
a o populatie P este o multime de obiecte din care se fac selectii nite (de volum
n < 1). Populatia se poate identica cu multimea tuturor observatiilor potentiale pe care
le putem face asupra obiectelor ei. Pentru ecare obiect al selectiei se testeaz
a valoarea unei
caracteristici numerice, X. Admitem c
a pe P exist
a o probabilitate si c
a X este o variabil
a
aleatoare. Distributia (functia de repartitie) a v.a. X se numeste distributia populatiei dupa
caracteristica X.
Exemplul 9.1 Intr-o magazie grul este amestecat cu neghina. Populatia P este aici totalitatea boabelor din magazie ( cteva sute de milioane). Fie X : P ! R,
1 daca e grau
X(bob) =
0 daca e neghina
Probabilitatea p ca un bob sa e de tip A este denita prin:
p(A) =
AP
Aici p nu se poate determina experimental exact din cauza numarului mare de boabe, dar
teoretic p exista. Valoarea medie a lui X nmultita cu 100 este procentul de boabe de gru din
magazie, lucru important.
Exemplul 9.2 Sa presupunem ca mai multe persoane, sau aceeasi persoana n mai multe
rnduri, masoara independent o lungime, de aproximativ 1 km folosind o ruleta de 2 m.
Evident ca se vor obtine rezultate diferite datorita unei game largi de cauze incontrolabile.
Putem n acest caz considera P ca multimea tuturor complexelor de cauze necontrolabile care
inuenteaza rezultatul masuratorii sau putem considera P ca multimea tuturor masuratorilor
posibile. Oricum P nu este o multime pe care o putem explicita ca n cazul precedent. Admitem
nsa ca pe P exista o probabilitate iar o masuratoare nseamna o manifestare a unui complex
! de cauze necontrolabile care conduc la un rezultat X(!) , n cazul nostru X ind o lungime.
118
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
119
(9.1)
unde Ak 2
pentru orice k, se numesc paralelipipede. Aici n nu este xat ci poate orice
num
ar natural. Fie
1 submultimile lui P 1 care sunt reuniuni nite de paralelipipede.
Se arat
a c
a aceaste multimi formeaz
a o algebr
a. Pe aceast
a algebr
a putem deni o unic
a
0
probabilitate p astfel ca pentru paralelipipede s
a avem:
p0 (A) = p (A1 ) p (A2 ) :::p (An )
(9.2)
b) Probabilitatea p0 denit
a pe
1 ese extinde unic la o probabilitate pe
(1) notat
a
(1)
p
Probabilitatea p(1) se numeste probabilitate produs. Detaliile de constructie nu fac obiectul acestui curs. Putem remarca asem
anarea constructiei probabilit
atii produs cu a volumului
corpurilor plecnd de la lungime. Asa cum n afar
a de reuniuni nite de paralelipipede exist
a
(1)
si alte corpuri cu volum, tot asa apar n
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
120
Observatia 9.4 In lectia 2 am introdus produsul nit al unor cmpuri de probabilitate. Fata
de cazul considerat acolo, aici avem doua lucruri n plus:
a) pentru a avea o probabilitate pe produs trebuie extinsa algebra de multimi formata din
reuniuni nite de multimi paralelipipedice la o algebra
b) Am luat n consideratie o innitate de factori n produs .
Observatia 9.5 In principiu nu e nevoie de o cunoastere detaliata a produsului de cmpuri
de probabilitate. Este sucient sa stim ca el exista si ca probabilitatea unei multimi paralelipipedice este produsul probabilitatilor factorilor (formula 9.2).
Fie acum X o v.a. pe P , X : P ! R. In aceste conditii pe P 1 avem un sir de v.a. denite
prin:
Xi : P 1 ! R; Xi (!) = Xi (! k )k2N = X (! i )
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
121
, astfel
gn (X1 ; X2 ; ::Xn ) (!) = gn (X1 (!) ; X2 (!) ; :::Xn (!)) pentru ! 2 P 1
Uneori vom folosi termenul de statistica pentru sirul de variabile aleatoare construite mai sus
pe P 1 .
Exemple de statistici frecvent folosite
Fie X o v.a. cu functia de repartitie F : R ! R, si X1 ; X2 ; :::Xn variabilele de selectie
asociate. Vom
atoarele notatii:
R 1 folosi urm
a1) m= 1 xdF (x) = media lui X (Lectia 3)
(n) = X1 +X2 +:::+Xn : P 1 ! R; o v.a. numit
b1) M(X1 ; X2 ; :::Xn ) = X
a media de selectie.
n
Uneori o vom nota cu X(n) pentru a pune n evidenta dependenta de n, alteori o vom nota
Astfel,
simplu X.
n
c1) m = m (x1 ; x2 ; :::xn ) = x1 +x2 +:::+x
este valoarea mediei de selectie pentru rezultatele
n
x1 ; x2 ; :::xn ob
n cele n experiente, numit
a si media empirica (Lectia 8).
Rtinute
1
ak) mk = 1 xk dF (x) =momentul de ordin k al lui X (Lectia 3)
X1k +X2k +:::+Xnk
; o v.a. numit
a momentul de selectie de ordin k.
n
xk1 +xk2 +:::+xkn
ck) mk = mk (x1 ; x2 ; :::xn ) =
=momentul empiric de ordin k (Lectia 8)
n
R1
k
ak0) k = 1 (x m) dF (x) = momentul centrat de ordin k al lui X (Lectia 3)
k
k
k
(X1 X ) +(X2 X ) +:::+(Xn X )
bk0) M0k (X1 ; X2 ; :::Xn ) =
: P 1 ! R; o v.a. numit
a mon
m )2 +:::+(xn m )2
= dispersia empirica de
n
m )2 +:::+(xn m )2
se numeste dispersia empirica modn 1
(9.3)
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
122
Demonstratie
2
S (X1 ; X2 ; :::; Xn ) =
=
=
=
2
1X
1 X 2
2
Xi 2XXi + X
Xi X =
n
n
X
1X 2 2
1
2
Xi + nX
X
Xi
n
n
n
1X 2
2
Xi 2 X X + X
n
2
M2 (X1 ; X2 ; :::; Xn ) X
QED.
Fie X o v.a. si X1 ; X2 ; :::; Xn ::: variabilele de selectie asociate. Fie de asemenea A2 R.
Denitia 9.8 Se numeste estimator sau functie de estimatie pentru A, o statistica (gn )n2N
astfel ca pentru orice > 0 sa avem:
lim Prob( jgn (X1 ; X2 ; :::Xn )
n!1
Aj > ) = 0
Cu alte cuvinte, > 0 ind dat, pentru valori mari ale lui n este foarte putin probabil ca
variabila aleatoare gn (X1 ; X2 ; :::Xn ) s
a ia valori n afara intervalului [A ; A + ], adic
a este
foarte putin probabil ca num
arul
gn (x1 ; x2 ; :::xn ) s
a e n afara intervalului [A ; A + ]. In aceste conditii, dup
a un num
ar de
n experiente, consider
am pe gn (x1 ; x2 ; :::xn ) ca o aproximatie bun
a pentru A. Este posibil s
a
ne nsel
am, dar probabilitatea de a ne nsela este mic
a, pentru n mare. Statistica nu ne ofer
a
r
aspunsuri sigure ci doar aproximatii n care putem avea un grad mai mic sau mai mare de
ncredere. Se accept
a acele aproximatii n care avem un grad mai mare de ncredere.
Denitia 9.9 O statistica (gn (X1 ; :::Xn ))n2N se numeste corecta sau deplasata relativ la valoarea A daca avem:
1) lim M(gn (X1 ; X2 ; :::; Xn )) = A:
n!1
n!1
Aj > ) = 0:
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
123
Aj > ) ! 0
cnd n ! 1, deci statistica (gn (X1 ; X2 ; :::; Xn ))n2N este un estimator al lui A.
QED.
Ar
at
am acum c
a functiile de selectie introduse cu ocazia notatiilor precedente sunt estimatori pentru valorile corespunz
atoare ale variabilei X.
Teorema 9.11 a) Statistica media de selectie:
(n) = (X1 + X2 + + Xn ) =n
gn (X1 ; X2 ; :::; Xn ) = X
estimeaza media m =M(X) a v.a. X absolut corect.
b) Statistica
1X r
Xi
n
estimeaza absolut corect momentul de ordin r, mr , al v.a. X.
c) Statistica
2
1X
S 2 (X1 ; X2 ; :::; Xn ) =
Xi X (n)
n
estimeaza corect dar nu absolut corect dispersia v.a. X, 2 =D(X).
n
2
P
d) S0 2 (X1 ; X2 ; :::; Xn ) = n 1 1
Xi X (n) , adica dispersia de selectie modicata, aproxhn (X1 ; X2 ; :::; Xn ) =
i=1
(9.4)
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
124
c) ncerc
am s
a veric
am 1):
din 9.3
= M M2 (X1 ; X2 ; :::; Xn )
X
2
1
= M (M2 (X1 ; X2 ; :::; Xn ))
X
M
i
n2
X X
1
M
Xi
Xj
= M (X 2 )
n2
!
X
X
1
1
2
2
= M (X )
Xi Xj
M
M
Xi
n2
n2
i6=j
n
1X
2
= M (X 2 )
M (Xi Xj )
M
X
n2
n2 i6=j
M S 2 (X1 ; X2 ; :::; Xn )
Xi ;Xj independente:
1
n
M(X2 )
M (X 2 )
n
M(X)2 =
X (n)
1
n(n 1)M (X)2
n2
1
D(X) ! D (X)
1
n
D(X)
E clar c
a M (S 02 (X1 ; X2 ; :::; Xn )) = D (X).
Veric
am 2): l
as
am ca exercitiu pentru cititor vericarea formulei
1
n 3
2
02
D(S ) =
[D(X)]
m4
n
n 1
(9.5)
(9.6)
D(S ) =
1)2
(n
n3
m4
n
n
3
[D(X)]2
1
(9.7)
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
125
s0 *2 =
0; 8)2 + (1
0; 8)2 + (0
0; 8)2 + (1
0; 8)2
0; 8)2 + (0
0; 8)2 + (0
0; 8)2 + (2
0; 8)2 ]
Observatia 9.14 Deoarece dispersia se mai numeste si varianta vom folosi si noi uneori
varianta de selectie pentru dispersia de selectie.
9.1
Principiul verosimilit
atii maxime
Presupunem c
a P este o populatie unde se urm
areste caracteristica numeric
a X; care este o
variabil
a aleatoare cu densitatea de probabilitate f (x; ), ind un parametru necunoscut.
Cunoastem doar forma matematic
a a functiei f (x; ). De exemplu dac
a stim c
a X este
2
o v.a. normal
a cu media , necunoscut
a dar cu dispersia cunoscut
a, atunci f (x; m) =
p1 e
2
(x m)2
2 2
.
Pentru determinarea lui facem o selectie care d
a rezultatele fx1 ; :::; xn gsi ncerc
am pe
baza lor s
a estim
am pe . Deoarece v.a. de selectie X1 ; :::; Xn sunt independente, probabilitatea ca X1 s
a ia valoari n intervalul [x1 ; x1 + dx1 ), X2 s
a ia valori n [x2 ; x2 + dx2 ), ...,
Xn s
a ia valori n [xn ; xn + dxn ) este dat
a de f (x1 ; ) f (x2 ; ) f (xn ; )dx1 dx2 :::dxn =
L (x1 ; :::; xn ; ) dx1 dx2 ::::dxn . Aceast
a functie L se numeste functia de verosimilitate si va
folosit
a pentru estimarea lui .
Dac
a X ia valori discrete, atunci f (x; ) este probabilitatea ca X s
a ia valoarea x: De
x
exemplu, n cazul distributiei Poisson, f (x; ) = e x! , cu x 2 N, reprezint
a probabilitatea ca
X = x, iar este parametrul necunoscut ( pe care urmeaz
a s
a-l estim
am!). Probabilitatea ca n
n selectii independente s
a se obtin
a rezultatele x1 ; x2 ; :::xn este f (x1 ; )f (x2 ; ) :::f (xn ; ) =
L (x1 ; x2 ; :::xn ; ) care se numeste si n acest caz functia de verosimilitate.
Functia L este determinat
a de volumul selectiei n si depinde de . Metoda verosimilt
atii
maxime const
a n urm
atorul principiu (axiom
a): valoarea cea mai verosimila (cea mai
potrivita n acest sens!) a parametrului este aceea pentru care functia L (x1 ; :::; xn ; ) este
maxima. Dup
a cum stim de la Analiza matematic
a, aceast
a cerint
a are loc dac
a avem:
@L (x1 ; :::; xn ; )
=0
@
adic
a este un punct crirtic pentru L (x1 ; :::; xn ; ).
(9.8)
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
126
(9.9)
care poart
a numele de ecuatie a verosimilitatii maxime. Rezolv
am ecuatia (9.9), sau ecuatia
(9.8) si g
asim = n (x1 ; :::xn ). Ca estimator (functie de estimare) pentru lu
am variabila
aleatoare n (X1 ; X2 ; :::Xn ); care, pentru selectia fx1 ; x2 ; :::xn g d
a rezultatul n (x1 ; x2 ; :::xn ).
Se poate demonstra ca n conditii foarte generale, pentru selectii mari, statistica (X1 ; X2 ; :::Xn )
obtinuta prin metoda verosimilitatii maxime, are o distributie aproximativ normala, cu media
egala cu =valoarea adevarata a parametrului si dispersia
D () =
n
1
R 1 @ 2 ln(f (x;))
1
@
=
f (x; ) dx
R 1 @ ln
1
1
f (x;)
@
2
f (x; ) dx
Daca distributia este discreta atunci integralele din formula precedenta devin sume.
Exemplul 9.15 Presupunem ca populatia are distributia Poisson (cazul evenimentelor rare).
k
Functia de probabilitate este f (k; ) = e k! , k =0, 1, 2, .... Ne intereseaza sa estimam parametrul prin metoda verosimilitatii maxime. Pentru aceasta facem o selectie
fx1 ; x2 ; :::; xn g f0; 1; 2; :::g.
L (x1 ; :::; xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; ) = e
ln L (x1 ; :::; xn ; ) =
n +
X
xk ln
n
xk
x1 !x2 !:::xn !
ln (xk !)
1
R
1
@ ln f (x;)
@
2
f (x; )dx
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
sau
D (gn (X1 ; :::; Xn )) =
n
1
P
x=0
1
@ ln f (x;)
@
2
127
(9.10)
f (x; )
F
ar
a demonstratie.
P
Xk
Ne ntoarcem la exemplul anterior. Stim c
a D(n ) = D
=
n
e x
,
x!
deci
@ ln f (x;))
@
x=0
1
X
x=0
= e
@
x x2
2 + 2
B1 x
BX
B
B
@ x=0 x!
| {z }
=e
1
= n . f (x; ) =
1 + x . De aici rezult
a
2
1
X
@ ln f (x; )
=
D(X)
n
f (x; )
e
x!
1
1
X
X
x 1
x 2
(x
2
+
(x 1)! x=1 (x 1)!
x=1
|
{z
|
{z
}
1
=e
=e + e
C
C
1 + 1)C
C
}A
1
= n = D (n ). Rezult
a din teorema Rao-Cramer c
a statistica
2
( @ ln @f(x;) ) f (x;)
x=0
P
medie de selectie este si un estimator ecient pentru . Putem spune acum c
a = ( xk ) =n
este o estimatie foarte bun
a n toate sensurile.
Prin urmare
1
P
p dac
a x=1
1 p dac
a x=0
Functia de verosimilitate este L (x1 ; x2 ; :::xn ) = pn1 (1 p)n n1 unde n1 este num
arul de real@(n1 ln p+(n n1 ) ln(1 p))
n1
n n1
@ ln L
iz
ari ale lui 1. @p = 0 devine
= 0 adic
a p
= 0 care are solutia
@p
1 p
n1
p = n . Valoarea n1 este valoarea variabilei X1 + X2 + ::: + Xn , unde Xi este variabila de
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
128
selectie a c
arei valoare este 1 dac
a la experienta i se obtine rezultatul 1 si are valoarea 0 n
caz contrar. Prin urmare statistica ce estimeaz
a parametrul p este
P=
X1 + X2 + ::: + Xn
n
care este chiar media de selectie. La fel ca n cazul repartitiei Poisson se arat
a c
a
D (P) =
pq
n
=
n
P1
x=0
1
@ ln f (x;p)
@p
2
=
f (x; p)
@ ln (1 p)
@p
2
1
(1
p) +
@ ln p
@p
2
p
1
f (x; m; ) = p2
e
(9.11) devine:
(x m)2
2 2
xi
n
1
2
n
n
2
ln (2)
n ln
m) = 0
+
=0
qP
2
i (xi m )
= m (x1 ; ::xn ) si =
.
n
P
(xi m)2
.
2 2
Sistemul
(x
Pi
(xi m)2
3
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
9.2
129
Dat
a selectia fx1 ; :::; xn g noi putem calcula momentul de ordin k al selectiei:
= in ,
pentru orice k =0, 1, 2, .... Obtinem astfel estimatori pentru medie, dispersie ,momente de
(k)
diferite ordine. Functia caracteristic
a Xc (t) are toate derivatele n t = 0 date de Xc (0) =
ik M k (X). Prin urmare n conditii foarte generale, care asigur
a c
a Xc (t) este analitic
a (se
poate dezvolta n serie convergent
a de puteri n jurul oric
arui punct), rezult
a c
a momentele
k
M (X) determin
a pe Xc (t) care la rndul ei determin
a repartitia lui X (vezi Lectia 3).
Aceast
a observatie a fost folosit
a de K. Pearson pentru a g
asi estimatori pentru parametrii
unei legi de probabilitate.
Fie (x; 1 ; 2 ; :::p ) densitatea Rde probabilitate a v.a. X, unde parametrii 1 ; :::p sunt
1
necunoscuti. Exist
a relatiile:mk = 1 (x; 1 ; 2 ; :::p ) xk dx pentru orice k. Am v
azut c
a mk
este estimat de mk . Egalnd valoarea teoretic exact
a cu estimarea practic
a, mk = mk , adic
a:
(Z
Pi=n k
1
x
k
x (x; 1 ; 2 ; :::p ) dx = i=1 i
(9.12)
n
1
mk
adica =
x1 +x2 +:::xn
.
n
ac + bc2 = 1
(9.13)
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
130
Calcul
am acum media v.a. X:
M (X) =
Zc
x(a + 2bx)dx =
Zc
x2 (a + 2bx)dx =
ac2 2bc3
+
2
3
(9.14)
momentul de ordin 2:
M2 (X) =
ac3 2bc4
+
3
4
(9.15)
Momentele de selectie m1 =(-1+0+1)/3=0 si m2 = (-1)2 +02 +12 /3=2/3 vor estima pe
M (X) si pe M2 (X). Deci vom obtine sistemul nelinear de ecuatii:
8
2
< ac + bc = 1
2
2
ac
+ 2bc3 = 0
(9.16)
2
: ac3 2bc4
2
+ 4 =3
3
In general rezolvarea acestor sisteme (care se obtin folosind metoda momentelor) este
foarte complicat
a. Din ecuatia a doua g
asim c = 3a
. nlocuim expresia lui c n prima si n
4b
ultima ecuatie si g
asim:
2
3a2
+ 9a
=1
4b
16b
(9.17)
81a4
2
9a4
+
=
3
3
64b
512b
3
2
9.3
Exercitii
LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
131
3. Viata unui bec electric, masurata n numarul de ore de functionare continua pna cnd
se arde, se presupune uniform distribuita cu parametrii a si b:
1=(b a) ; a x b
f (x) =
0 ; n rest.
Se face o selectie de n becuri si se noteaza cu x1 ; :::; xn timpii de functionare ai acestora
pna cnd se ard. Determinati estimatori pentru a si b prin metoda momentelor.
4. Functia de probabilitate a v.a. X este data de
2b(c bx)
; dac
a0x
c2
f (x) =
0; n rest
c
b
c
c
: Stim ca media M(X)= 3b
si 2X = 18b
2.
i) daca c=3, este oare media de selectie M a unui esantion de volum n un estimator
nedeplasat pentru parametrul b?
ii) daca b=1/3, este M un estimator pentru c? (P( jM-cj < ) ! 1, cnd n ! 1). Indicatie: folositi inegalitatea lui Cebsev sau teoria din aceasta lectie.
2X ,
Lectia 10
Intervale de ncredere
Denitia 10.1 Fie P o populatie, un parametru al ei si g = g (X1 ; :::; Xn ), h = h (X1 ; :::; Xn )
doua statistici astfel nct g (X1 ; :::; Xn ) h (X1 ; :::; Xn ), adica oricare ar selectia fx1 ; :::; xn g
sa avem ca g (x1 ; :::; xn ) h (x1 ; :::; xn ). Spunem ca intervalul [g; h] este un interval de ncredere pentru parametrul , de nivel de ncredere daca avem relatia:
P rob fg hg
(10.1)
Num
arul "=1 se mai numeste prag de ncredere. De obicei se
exprim
a n procente, de exemplu pentru =0,95 putem scrie =95%.
Cerinta (10.1) trebuie nteleas
a astfel: dac
a dup
a un num
ar mare de selectii fx1 ; :::; xn g, s
a
zicem N, K dintre ele dau intervale [g(x1 ; x2 ::xn ); h(x1 ; x2 ; :::xn )] cu proprietatea c
a 2 [g; h]
(pentru ecare selectie xat
a, intervalul devine interval obisnuit, numeric), atunci K/N .
Altfel spus, intervalele [g; h] acoper
a pe n proportie de cel putin %(de exemplu ,dac
a
= 1=5 = 20=100, = 20%).
Denitia 10.2 Pentru un , un interval de ncredere [g ; h ] de lungime minima, astfel
nct Probfg h g = , se zice interval de ncredere ecient, relativ la ncrederea .
Pentru calculele urm
atoare vom avea nevoie de teorema:
Teorema 10.3 Fie X o v.a. normala, de tip N (m; ). Fie X1 ; X2 ; :::Xn variabilele de
selectie asociate cu X. Atunci avem:
= X1 +X2 +:::+Xn este de tipul N m; p .
a) Variabila X
n
n
X1 m 2
X2 m 2
Xn m 2
b) Variabila
+
+ ::: +
este de tip H (n) adica este o variabila
2 standard cu n gradede libertate.
c) Variabila
X1 X
X2 X
Xn X
este de tip H (n
cu n-1 grade de libertate si este independenta fata de variabila X.
+
+ ::: +
132
LECTIA
10. INTERVALE DE NCREDERE
d) Variabila
libertate.
(n
1) n q
(X1
133
m
X
)2 +(X2 X
)2 +:::+(Xn X
)2
X
Demonstratie. a) Aceast
a armatie este demonstrat
a n lectia 4, sectiunea Repartitia
normal
a.
b) Deoarece Xi m sunt normale de tip N (0; 1) si independente, armatia de la acest
punct rezult
a din lect
ia 4, sec
tia 2 .
Distribu
t2iunea
2
2
X1 X
X2 X
Xn X
+
+ ::: +
sunt independente nu se demonc) Faptul c
a X si
+ X
m , de unde P (Xi m)2 =
streaz
a n acest curs. Acum scriem c
a Xi m = Xi X
P
P
2+P X
m 2 + 2(X
. Dar P Xi X
= 0, deoarece
Xi PX
m)
Xi X
= 1
X
Xi . Prin urmare
n
X Xi m 2
X Xi X
m)2
2 n(X
+
=
=
2
X Xi X
m 2
2 X
p
+
= n
Membrul stng este de tip H (n), iar n membrul doi avem o sum
a de v.a. independente, dintre
care a doua este de tip H (1) ind p
atratul unei v.a. normale, de tip N (0; 1) (vezi lectia 4).
2
2
Prin urmare am g
asit (n) =? + (1) .Comparnd aceast
a relatie cu 2(p+q) = 2(p) + 2(q) , unde
P Xi X 2
este
indicii de jos indic
a num
arul de grade de libertate (vezi lectia 4), g
asim c
a
de tip 2(n 1) .
d) Conform cu lectia 6, sectiunea Distributia Student, variabila aleatoare
m
X
p
= n
r
P
Xi
2
X
n 1
1) n q
(n
X
X1
X
2
+ X2
m
2 + ::: + Xn
X
10.1
1) = H (n
X
2
1; 1) , rezult
a c
a
1 grade de libertate.
S
a consider
am o caracteristic
a numeric
a X care are o disributie normala de medie m si
2
dispersie . Dac
a n urma unei selectii de volum n s-au obtinut rezultatele x1 ; x2 ; :::xn
pentru X; atunci, conform celor ar
atate n lectia trecut
a valoarea x1 +xn2 +::xn este o estimare
2
bun
a pentru m iar (x1 x) +(x2 nx) +:::(xn x) este o estimare bun
a pentru 2 . Ce ncredere putem
avea n aceste estim
ari? In continuare vom da un r
aspuns la aceast
a ntrebare?
LECTIA
10. INTERVALE DE NCREDERE
10.1.1
134
S
a consider
am cazul cnd dispersia 2 este cunoscut
a. Valorile x1 ; x2 ; :::xn sunt valorile variabilelor aleatoare de selectie, independente, X1 ; X2 ; :::Xn , care au aceeasi distributie normal
a
X1 +X2 +:::Xn
2
ca X. Deoarece variabila X =
este normal
a cu media m si dispersia n rezult
a c
a
n
m
X
variabila Z = =pn este normal
a cu media 0 si dispersia 1. Ca urmare:
P ( a Z a) = (a)
Dac
a nlocuim pe Z cu
X1 +X2 +:::Xn
n p
= n
( a) = 2 (a)
g
asim:
X1 + X2 + ::: + Xn
P
ap m
+ ap
= 2 (a)
n
n
n
h
i
x1 +x2 +:::xn
x1 +x2 +:::xn
p
p
Prin urmare intervalul intervalul
a n;
+ a n este un interval de nn
n
credere pentru m cu nivelul de ncredere 2 (a). Introducnd pragul de ncredere ", avem
1 " = 2 (a) sau (a) = 1 2 " . Am demonstrat deci:
X1 + X2 + ::: + Xn
n
Propozitia 10.4 Fie X o variabila normala de dispersie cunoscuta 2 si de medie m necunoscuta. Dac
h a " 2 (0; 1) si a i2 R + , atunci, la selectii de volum n, o conditie sucienta
ca intervalul X a pn ; X + a pn sa e interval de ncredere de nivel 1 " pentru media m,
este ca a sa verice ecuatia (a) 21 (1
").
QED.
Observatia 10.5 La acelasi prag de ncredere ", cresterea volumului n de selectie conduce la
un interval de ncredere mai scurt.
Exemplul 10.6 Fie P o populatie normala de varianta (dispersie) cunoscuta 2 si de medie
m necunoscuta (de estimat). Consideram selectii de volum xat n. Vom gasi un interval de
95
ncredere,de nivel de ncredere 95% pentru medie, daca alegem astfel pe a nct (a) 12 100
.
Din tabelul pentru gasim a 1; 96. Deci un interval de ncredere de nivel 95% va de
forma:
X 1; 96 p ; X + 1; 96 p :
n
n
Exemplul 10.7 O rma produce piese cilindrice de diametru =10 mm. Abaterile de la
acest diametru impus respecta o lege normala de variatie (dispersie) egala cu 0,04 mm (practica a aratat acest lucru). Se face un sondaj pe 100 de piese si se gaseste ca media de selectie
(empirica) este de 10,01 mm. Sa se gaseasca un interval de estimatie pentru media reala cu
nivelul de ncredere de 90%.
LECTIA
10. INTERVALE DE NCREDERE
135
Solutie Aici n=100, =0,2, X (100) =0,01, (1-")=0,90, deci " =0,10. Din tabelul functiei
90
g
asim (a)
45 pentru 1; 65. Deci,
un interval de estimatie pentru media
2100 = 0; 0;2
0;2
real
a este: 10; 01 1; 65 10 ; 10; 01 + 1; 65 10 = [9; 977; 10; 043].
Ce informatie obtine de aici produc
atorul? El este sigur n proportie de 90% c
a abaterea
medie de la diametru real =10 mm este de cel mult 0,043 mm.
10.1.2
Am v
azut pn
a acum c
a dac
a dispersia unei populatii normale este cunoscut
a putem estima
m
p ,
prin intervale de ncredere media populatiei cu ajutorul v.a. normale standard Z = X
= n
unde X este media de selectie, iar m este media real
a a populatiei.
Dac
a media m nu este cunoscut
a atunci putem folosi punctul d) al teoremei precedente
care spune c
a variabila
T =
(n
1) n q
X
X
X1
X
2
+ X2
m
2 + ::: + Xn
X
X
2
are o distributie Student cu n-1 grade de libertate. Aici utilizat notatia (vezi lectia 9) S 2 =
2
2
2
(X1 X ) +(X2 X ) +:::+(Xn X )
. Asa cum se vede n lectia 4, densitatea de probabilitate este
n
simetric
a fata de x=0, deci pentru functia de repartitie F (t) avem relatia F ( t) = 1 F (t).
Aceast
a observatie ne ajut
a s
a folosim tabelul II pentru g
asirea cuantilelor corespunz
atoare
acestei distributii. Pe coloana din stnga a tabelului avem gradele de libertate = n 1 (n
volumul selectiei), pe prima linie orizontal
a avem valorile functiei F(t) de la 0,60 pn
a la 0,999.
Fie de aat la = n 1 = 4 valoarea lui a astfel ca F(a)=0,40. Avem 1-F(a)=F( a)=0,60
si pentru 0,60 avem cuantila n tabel: a=0,271. Deci a = 0; 271.
S
a punem aceste rezultate n urm
atoarea propozitie:
Propozitia 10.8 Fie P o populatie normala cu media m si dispersia 2 necunoscute. Pentru
orice n, pentru un prag " 2 (0; 1) si a 2 R + , o conditie sucienta ca intervalul
S
S
X ap
; X + ap
n 1
n 1
sa e interval de ncredere de nivel 1 " (sau de prag ") pentru media m, este ca a sa e
cuantila de ordin 1 "=2 a distributiei Student cu n 1 grade de libertate (adica F (a) =
1 "=2).
LECTIA
10. INTERVALE DE NCREDERE
Demonstratie. Relatia P X
P
a pnS 1
p
a n
136
mX+
X
a pnS 1
a
= 1
S
sau P ( a T a) = 1
=1
";
"
Dar
P ( a T a) = F (a) F ( a) =
F (a) 1 + F (a) = 2F (a) 1 = 2 (1
"=2)
1=1
"
QED.
Exemplul 10.9 Presupunem ca n exemplul precedent nu cunoastem dispersia 0,04 mm si
2
2
2
(X1 X ) +(X2 X ) +:::+(Xn X )
ca o estimam cu formula S 2 =
gasind-o ca ind egala cu 0,09
n
mm. Avem 1 ("=2) = 0; 95, n = 100, S = 0; 3 (n cazul nostru). Cuantila corespunzatoare
lui 0,95 o gasim din tabelul cu distributia Student. La = n 1 = 99 nu gasim date dar
putem folosi linia lui = 120, deoarece cuantilele vecine difera putin unele de altele (pentru
acelasi
prag binenteles). Aici gasim
h
i a=1,1658. Cu acest a gasit, intervalul de ncredere va :
0,3
0,3
10,01-1,658 p99 ; 10,01+1,658 p99 , adica [9,9798,10,0599]. Sa observam ca a=1,65 pentru
situatia cnd am folosit v.a. Z si a=1,658 pentru situatia cnd am folosit v.a. T. Acest lucru
se explica, deoarece pentru n mare (mai mare ca 40), n cazul nostru 100, cele doua cuantile
difera foarte putin.
10.2
Dac
a media m a variabilei aleatoare X este cunoscut
a, atunci putem folosi punctul b) al
2
2
X1 m 2
teoremei precedente care spune c
a variabila
+ X2 m + ::: + Xn m este de tip
H (n) iar dac
a media m nu este cunoscut
a putem folosi punctul c) al teoremei, anume c
a
2
2
2
X1 X
X2 X
Xn X
variabila aleatoare
+
+ ::: +
este de tip H (n 1), n scopul de a
determina intervale de ncredere pentru dispersie.
nS 2
= 2(n
2
(10.2)
1)
adic
a nS
este v.a 2 cu n 1 grade de libertate. Dac
a n loc de S 2 se foloseste estimatorul
2
02
nedeplasat S se obtine formula
(n
1)S 0 2
= 2(n
2
1)
(10.3)
LECTIA
10. INTERVALE DE NCREDERE
137
Teorema 10.10 Fie " 2 (0; 1). Un interval de ncredere de nivel 100(1 ") procente pentru
dispersia 2 a unei populatii normale cu media cunoscuta m, n cazul selectiilor de volum n
, este
(n
1)S 0 2 (n
;
b
1)S 0 2
a
(10.4)
unde a este cuantila de ordin "=2 si b este cuantila de ordin 1 ("=2) a distributiei 2 cu n 1
grade de libertate.
Demonstratie Not
am cu F (t) functia de repartitie a v.a. 2(n 1) . Avem F (a) = "=2 si
0 2
F (b) = 1 ("=2). Atunci P a (n 1)S
b
= F (b) F (a) = 1 ("=2) ("=2) = 1 ".
2
0 2
0 2
(n 1)S 0
a
Exemplul 10.11 Media erorilor de masurare a lungimilor unor baghete metalice este de 3
mm. Presupunem ca aceste erori respecta legea normala cu media 3 mm si dispersia necunoscuta. Se face o selectie de volum 4: {-1, 4, 4, 1}. Se cere un interval de estimatie pentru 2
cu pragul de ncredere de 90%.
Solutie n cazul nostru aplic
am Teorema 10.9 cu 1-" =0,90, deci " =0,10. C
aut
am cuantilele pentru "=2 =0,05 si 1-("=2)=0,95, cnd n-1=3 (grade de libertate). G
asim a=0,351846 si
1
02
2
2
b=7,81473 n Tabelul III.
aim acum S = 3 (( 1 3) + (4 3) + (4 3)2 + (1 3)2 ) =
h Calcul
22
.
3
Intervalul va deci
22
; 22
7,81 0,35
= [2,81;62,85]. Se observ
a c
a intervalul este destul de mare,
10.3
1)S10 2
21
(n2
1)S20 2
22
= 2(n1
1)
= 2(n2
1)
(10.5)
a
unde 1 ; S10 2 si 2 ; S20 2 sunt dispersiile si dispersiile de selectie modicate pentru cele dou
populatii. Not
am cu 1 = n1 1 si cu 2 = n2 1. Not
am cu F (de la Fischer) v.a.
LECTIA
10. INTERVALE DE NCREDERE
S10 2 = 21
S20 2 = 22
=h
138
2( 1 ) = 1
2( 2 ) = 2
(10.6)
Aceast
a v.a. are o densitate de probabilitate ce depinde de doi parametri 1 si 2 iar formula
ei este complicat
a din punct de vedere matematic (vezi lectia 4). Ea apare ca un ct de v.a.
2 , nmultit cu un num
ar care depinde de 1 si 2 , adic
a 2 = 1 . Vom mai nota o asemenea
variabil
a F 1 ; 2 pentru a pune n evidenta cei doi parametri de care depinde. Tabelul IV ne
furnizeaz
a fractilele acestei distributii numai pentru ordinele 0,95; 0,975 si 0,99. Pe coloane
apar valorile parametrului 1 si pe linii apar valorile parametrului 2 . De exemplu, pentru
n1 = 10; n2 = 6; 1 = 9; 2 = 5; presupunem c
a dup
a selectie am obtinut F =7. Ne uit
am la
cuantila de ordin 0,95 si g
asim valoarea 3,48. Valoarea selectiei, 7, este mai mare dect 3,48,
deci cade n partea opus
a, adic
a n partea cu probabilitatea 5%. Prin urmare inferenta
S10 2
noastr
a asupra ctului S 0 2 nu este adev
arat
a cu 95% probabilitate. n practic
a este util
a
2
relatia:
1
P F( 1 ; 2 ) c = P F( 2 ; 1 )
(10.7)
c
Aici F( 2 ; 1 ) se numeste inversa v.a. F( 1 ; 2 ) .
Din aceste observatii rezult
a imediat:
"
2
QED.
10.4
R1
Dac
a f (x; ) este densitatea de probabilitate a variabilei aleatoare X atunci din 1 f (x; )dx =
R
R1
1 rezult
a prin derivare n raport cu c
a 1 @f
(x; ) d = 0 sau @ ln(f@(x;)) f (x; )dx = 0.
@
R 1 @ ln(f (x;)) 2
@ ln(f (x;))
Deci variabila aleatoare
f (x; )dx. Preare media 0 si dispersia 1
@
@
supunnd c
a dispersia este nit
a , rezult
a din legea limit
a central
a (vezi lectia 5) c
a pentru n
LECTIA
10. INTERVALE DE NCREDERE
139
(X1 ;))
+ ::: + @ ln(f@
r
2
R1
n 1 @ ln(f@(x;)) f (x; )dx
(X1 ;))
(X1 ;))
+ @ ln(f@
+ ::: + @ ln(f@
r
<b
R 1 @ ln(f (x;)) 2
n
f (x; )dx
@
1
10.5
Rezumat
1: Fie " > 0; " 2 (0; 1). Vom numi interval de ncredere de prag " (sau de nivel de ncredere
1 ") pentru parametrul dou
a statistici 1 = f1 (X1 ; :::; Xn ) si 2 = f2 (X1 ; :::; Xn ) astfel
nct P (1 2 ) 1 ".
b1si a statisticii 2
Pentru selectii efectivehx1 ; :::;ixn ; vom nota valoarea statisticii 1 cu
b2 . Intervalul numeric
b1 ;
b2 este considerat nc
cu
a ca interval de ncredere de nivel 1 "
(se mai spune de prag ") pentru parametrul estimat .
2: Dac
a exist
a dou
a statistici Y = f (X1 ; :::; Xn ) si Z = g (X1 ; :::; Xn ) astfel nct v.a.
Y
T = Z s
a e normal
a redus
a sau Student cu d grade de libertate si t" un num
ar pozitiv
astfel nct P(jTj > t" ) ", atunci [Y t" jZj ; Y + t" jZj] este un interval de ncredere de prag
" pentru media , adic
a:
P (Y
"
LECTIA
10. INTERVALE DE NCREDERE
140
unde m = 1 2n1
1 = n1 1, 2 = n2
4a
i=1 (yi
n2
Pn1
i=1 (xi
n1
m )
1
m )2
1
y +y +:::y
;b
i=1 (yi
n2
Pn1
i=1 (xi
n1
m )
1
m )2
1
LECTIA
10. INTERVALE DE NCREDERE
10.6
141
Exercitii rezolvate
s
i
p(C)=
.
4
2
ii) Fie X v.a. care are valoarea 1, dac
a se realizeaz
a evenimentul C, si 0 altfel. Este
328
clar c
a M(X)== 1 2 . X = n1 YC = 1000
= 0; 328. Cum X=Xi , avem c
a X2i =Xi , deci
P
S2 = n1 X2i (X)2 = X 1 X . Cum T= XpM(X)
este practic normal
a redus
a, egalitatea
2
i
S =n
P(jTj 1; 96) = 0; 05 d
a pentru intervalul de ncredere cerut: X 1; 96 pSn X+1; 96 pSn ,
sau 0; 299 1 2 0; 357. De aici rezult
a intervalul de ncredere c
autat pentru : 0; 286
0; 402:
2
iii) YC este binomial
a cu p= 1 2 . Avem deci M(YC )= n(12 ) si D(YC )= n(1 4 ) . Egalitatea
2
= 1 n2 M(YC ) d
a pentru estimatorul nedeplasat Z=1- n2 YC de dispersie n42 D(YC )= 1 n .
Cnd n ! 1, YC este practic gaussian
a (normal
a), deci si Z este la fel. Consider
am
Z
deci T= q
care este gaussian
a redus
a. Egalitatea P(jTj 1; 96) = 0; 05 ne per(1 2 )=n
q
q
p
1 2 =n 1=n avem
mite s
a scriem P jZ j 1; 96 1 2 =n = 0; 05, si cum
p
p
p . Lungimea lui va mai mic
P(jZ j 1; 96= n) < 0; 05, de unde Z- 1;96
Z+ 1;96
a
n
n
2
21;96
3;92
1
dect a atunci cnd a pn , sau n a . Pentru a = 100
g
asim n 153664.
2. Se masoara forta de compresiune X (n Kg/cm 3 ) a cimentului din care sunt confectionati cilindri mici, limita de la care ei se sparg. Pentru n=10 cilindri se observa urmatoarele
presiuni:
19,6 19,9 20,4 19,8 20,5
21,0 18,5 19,7 18,4 19,4
LECTIA
10. INTERVALE DE NCREDERE
142
n 1 = 9 grade de libertate, avem P(jTj > t" ) = 0; 1 pentru t" = 1; 833. Intervalul de
ncredere cerut este deci X t" pnS 1 M(X) X + t" pnS 1 , sau 19; 243 M(X) 20; 197.
2
10.7
Exercitii
LECTIA
10. INTERVALE DE NCREDERE
143
?
3. Fie distributia student T cu 12 grade de libertate.
a) gasiti fractile pentru 0,10; 0,60 si 0,95.
b) gasiti media si dispersia.
c) P(T <-0,695).
d)P(-2,179 <T <1,356).
4. Fie distributia T cu 6 grade de libertate.
a) gasiti P(T 1).
b) gasiti fractila pentru 0,20.
5. Fie P o populatie distribuita normal. Se face selectia: -2, -1, 0, 0, 1, 2, 2, 3, 0. Sa
se gaseasca un interval de ncredere pentru media populatiei cu pragul de ncredere de 80%,
folosind distributia T.
6. Dintr-un lot de 100 piese, 4 sunt gasite defecte. Presupunem ca procesul de productie
se comporta ca un proce de tip Bernoulli. Determinati intervale de ncredere de 95% si de
99% pentru probabilitatea ca lund o piesa la ntmplare ea sa e defecta.
7. Se urmareste indicatorul Dow-Jones (indicator la bursa americana) la stocurile industriale de la o zi la alta. Se presupune ca acesta variaza dupa o distributie normala. Se face
un sondaj pe parcursul a 81 de zile si se obtine o medie de selectie de 0,20 si o dispersie de
selectie de 1,50. Gasiti un interval de ncredere pentru medie de 90%.
8. Dintr-o populatie noramla ( m=24, 2 =9)
de volum 8. Notam cu W
se ia un esantion
2
suma patratelor celor 8 valori standardizate Zi2 = Xi m
. Gasiti: a) P(W 20,09); b)
P(2,73 <W <5,07); c) P(W >2,18).
11. Pentru distributia F cu 5 grade de libertate la numarator si cu 8 grade de libertate la
numitor, gasiti : a) fractilele de ordin 0,025 si 0,99; b) P( F 3,69); c) P( F 1,22).
12. Durata de viata a unui bec electric este o variabila aleatoare normala. Testul pe 16
becuri a aratat o valoare medie de viata de 3000 ore si o abatere standard = 20. Sa se
determine intervale de ncredere pentru medie si abatere standard cu pragul de risc " = 0; 1.
13. Un producator de rulmenti pretinde ca diametrul mediu al rulmentilor, n mm este de
10 mm cu o dispersie de 10 4 . Admitem ca diametrul este o v.a. normala. Pe un lot de 20
rulmenti masurati s-a gasit ca diametrul mediu 9; 98 mm si o dispersie empirica 0; 0002. Sa
se determine intervale de ncredere pentru diametrul mediu si dispersie cu ncrederea 0; 99.
Valorile pretinse de fabricant se aa n aceste intervale?
Lectia 11
Ipoteze statistice. Teste statistice
11.1
n continuare vom face ipoteze asupra parametrilor unor populatii, stiind n prealabil clasa
de distributii din care fac parte (de exemplu: normal
a, Bernoulli, Poisson, etc.). Vom folosi
rezultatele obtinute n Lectia 10 asupra estim
arii prin intervale de ncredere a unor parametri
remarcabili pentru distributii cunoscute (media si dispersia pentru populatii normale, de
exemplu).
O ipotez
a statistic
a este o ipotez
a f
acut
a asupra unor nsusiri statistice ale unei populatii
P.Ea este simpla, dac
a se refer
a la ntreaga informatie care determin
a distributia populatiei,
de exemplu ipoteza:
H: populatia este normal
a de medie m=10 si dispersie 2 =225, sau
H: populatia este Bernoulli cu p=0,3.
Ipoteza poate compusa dac
a se refer
a numai la o parte din informatiiile ce ar putea
determina distributia populatiei. Iat
a un exemplu de distributie compus
a:
H: populatia este normal
a de medie 40, sau
H: populatia este Poisson (nu facem nici o ipotez
a asupra mediei ).
In cazul ipotezelor compuse, ceilalti parametrii care impreuna cu cei testati ar duce la
determinarea completa a distributiei, se estimeaza dintr-o selectie (sau mai multe) facuta
asupra populatiei.
O ipotez
a poate exacta,de exemplu ipoteza H: media populatiei Poisson este =3, sau
poate inexacta : H: media populatiei normale este m 5.
n aparent
a noi lucrm cu o singur
a ipotez
a H. De fapt lucr
am cu dou
a ipoteze: H=H0 si
H1 , ipoteza contrar
a ipotezei H0 . n cele ce urmeaz
a vom considera dou
a ipoteze alternative
H0 si H1 . Nu intotdeauna ipoteza H1 reprezinta negatia logica obisnuita a ipotezei H0 . De
exemplu, H0 : media populatiei este m=30, H1 : media populatiei s-a micsorat, adica este
m<30.
Operatia de comparare a dou
a ipoteze statistice n lumina informatiilor furnizate de selectie
144
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
145
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
146
11.1.1
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
147
I)
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
148
Deci, din TABELUL I gasim ca Z0;025 (cuantila de ordin 0,025) este 1,96.
Zcalc = 17210150 = 2; 2. Deoarece jZcalc j > 1; 96 respingem H0 (acceptam H1 ) cu pragul de
semnicatie de 5%. Adica este putin probabil ca selectia sa provina dintr-o populatie normala
cu media m = 150 si dispersia 2 = 100.
Aici am folosit un test bilateral (zona de respingere este simetrica fata de origine, adica
are 2 cozi) deoarece pentru H1 ; m poate tot asa de bine < 150 sau > 150.
Exemplul 11.2 Testati cu un prag de semnicatie " = 1% daca selectia de volum 1, x1 = 54,
a fost facuta dintr-o populatie normala cu media m = 65 si dispersia 2 = 30, sau daca media
este mai mica decat 65.
Solutie H0 : m = 65; H1 : m < 65. Vom avea deci un test unilateral (la stanga, cu o
pm = X m .
singura coada).Z = X
= n
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
149
seminte germineaza. Folositi doua teste: unul cu pragul de semnicatie de 5%, altul cu pragul
de 1%.
Solutie Fie X v.a. care numara cate seminte au germinat din cele n. X Bin(n; p),
unde n = 100.
H0 : p = 0; 9 (rata de germinare este de 90%).
H1 : p < 0; 9 (rata de germinare este mai mica de 90%).
Vom avea deci un test unilateral, deoarece este putin probabil ca vanzatorul sa sustina o
rata de germinare mai mica decat aceea reala.
Pentru pragul " = 0; 05 avem:
P(Z < Z0;05 ) = 0; 05; deci P(Z < Z0;05 ) = 0; 95 =F( Z0;05 ).
Din TABELUL I gasim ca Z0;05 = 1; 65, deci Z0;05 = 1; 65.
np
Cum H0 : X Bin(100; 0; 9) avem ca X N(np; npq) =N(90; 9), deci Zcalc = Xpnpq
=
83 90
= 2; 33.
3
Dar Zcalc = 2; 33 < 1; 65 si deci va trebui sa resping H0 cu pragul de 5%. Adica
fabricantul de seminte... minte!
Pentru pragul " = 0; 01; ( Z0;01 ) 0; 99, deci Z0;01 = 2; 32, sau Z0;01 = 2; 32.
Cum Zcalc = 2; 33 < 2; 32, dar aproape insensibil mai mic, testul in acst caz nu poate
concludent deoarece valoarea calculata Zcalc este prea aproape de valoarea critica 2; 32. Prin
urmare, fabricantul... minte, dar nu minte prea mult! Este nevoie de alte solutii pentru a
capata o certitudine mai mare.
Exemplul 11.4 O masina produce benzi elastice cu tensiuni de rupere normal distribuite cu
media m = 45N si = 4; 36N . Intr-o zi s-a facut o selectie de volum 50 si s-a gasit media
selectiei x = 43; 46N . Testati cu un prag de semnicatie de 5% daca acest lucru indica sau
nu o schimbare a mediei tensiunilor de rupere.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
150
2
X N m; n , m = 45N; = 4; 36; n = 50.
43;46 p45
x pm
Zcalc = =
= 43;36=
= 2; 4975 < 1; 96. Prin urmare respingem ipoteza H0 cu
n
50
pragul de semnicatie de 5%.
Un interval de incredere de nivel 95% pentru medie este x 1; 96 pn = (42; 25; 44; 67).
Vedem ca 45 2
= (42; 25; 44; 67). Cea mai mica valoare a lui astfel incat 45 sa e in intervalul
de incredere x 1; 96 pn este = 5; 56 (vezi ecuatia 43; 46 + 1; 96 p50 = 45).
Exemplul 11.5 Tensiunea de rupere a unor cabluri produse de o fabrica este normal distribuita cu media 6000N si deviatia standard = 150N. Gasiti probabilitatea ca un cablu luat
la intamplare se aiba tensiunea de rupere > 6200N.
S-a modicat procesul de productie si media tensiunilor de rupere se modica. Se aleg
6 cabluri la intamplare dupa aceasta modicare, se testeaza si se gaseste o medie de rupere
x = 5920N. Testati cu un prag de 5% daca dupa modicare media tensiunilor s-a micsorat.
Gasiti o constanta C a.i. noi sa putem spune cu un nivel de incredere de 90% ca media de
rupere este mai mare decat C.
Solu
tie X N(6000; 1502 );
X m
6200 m
P (X > 6200) = P
>
= P (Z > 1; 333) = 1 P (Z 1; 333)
= 1 F (1; 333) = 1 0; 90 = 0; 1:
x = 5920N;
H0 : m= 6000N;
H1 : m < 6000N;
1502
2
X N m; n =N 6000; 6 ;
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
151
x pm
6000
p
Zcalc = =
= 5920
= 1; 306 > 1; 65, deci acceptam ipoteza H0 cu pragul de
n
150= 6
semnicatie 5%.
C a.i. P(C < m < 1) = 0; 9, sau P( C > m) = 0; 9, sau inca
Trebuie sa gasim
X pC
X pm
X pC
X pC
P = 6 > = 6 = Z = 0; 9. Deci F =
> Z = 0; 9 si de aici gasim ca =
= Z0;9 =
6
6
p .
1; 29 150
6
Exemplul 11.6 O distributie normala se crede a avea media 50. Se face o selectie de volum
100 si se gaseste o medie de 52,6 si o deviatie standard de selectie de 14,5. Testati cu nivelul
de 5% daca media populatiei a crescut.
p
Solutie Fie m media reala si 2 dispersia reala a populatiei. x = 52; 6, iar s = s2 =
14; 5,
P
unde s2 = n1
(x x)2 .
H0 : m = 50 (nu exista o schimbare a mediei)
H1 : m> 50 (media
populatiei a crescut)
2
2
X N m; n . Estimam pe 2 cu
b2 = nns 1 s2 , deoarece n = 100 este considerat mare
(100 > 30). Folosim deci statistica Z =
X pm
b= n
si calculam Zcalc =
52;6p50
14;5= 100
= 1; 793.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
152
Cum Zcalc = 1; 793 > 1; 645, vom respinge H0 , adica acceptam H1 cu pragul de semnicatie
de 5%. Deci acceptam ca mesia a crescut cu pragul de semnicatie de 5%.
11.1.2
cu n
1 = 4 grade de libertate.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
153
F(T0;05 ) =P(T<T0;05 ) = 0,95. Din TABELUL II, pentru = 4 grade de libertate gasim
ca T0;05 = 2; 132.
P
1;50
7;6
1
2
Tcalc = S=xpnm 1 = 1;52
x
=
=
2;
105,
deoarece
=
1;
52,
iar
S
=
(x x)2 =
0;019=2
5
n
0;0018
5
(x
x)2 =
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
154
11.1.3
Exemplul 11.9 La o universitate americana senatul sustine ca nu se face discriminare sexuala la admitere. Se aleg 500 studenti si se gasesc 267 baieti. Testati cu nivelul de semnicatie
5% daca senatul universitatii spune adevarul sau nu.
Solutie H0 : p = 0; 5=probabilitatea ca un student sa e baiat;
H1 : p 6= 0; 5 (test bilateral)
267
0;5
500
Z = Pps pqp ; zcalc = p
= 1; 52.
0;50;5
n
500
Cum zcalc = 1; 52 < 1; 96, acceptam ipoteza H0 cu pragul de semnicatie de 5%. Prin
urmare este foarte probabil ca senatul sa spuna adevarul.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
155
11.1.4
a ar
atat c
a T tinde c
atre o repartitie Student cu grade de liberate. Calcul
am T . G
asim
cuantila de ordin 1=2 n Tabelul corespunz
ator lui T pentru grade de libertate si o not
am
cu T=2 . Testul functioneaz
a astfel:
Dac
a jT j > T=2 atunci vom respinge ipoteza H0 cu pragul de semnicatie .
Dac
a jT j T=2 atunci vom accepta ipoteza H0 cu pragul de semnicatie .
Exemplul 11.12 (R. A. Fisher) 8 ghivece cu re de orez au fost supuse la descarcari
electrice. Altele 9 au fost ferite de descarcari. Rezultatul recoltei a fost (numar de spice):
Izolate: 17, 27, 18, 25, 27, 29, 27, 23, 17;
Electrizate: 16, 16, 20, 16, 20, 17 ,15, 21.
Sa se testeze ipoteza H0 :<<electricitatea inuenteaza cresterea orezului>>.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
11.2
156
r=n
0
1
2
3
4
5
6
7
8
9
10
0
0; 1
0; 2
0; 3
0; 4
0; 5
0; 6
0; 7
0; 8
0; 9
1
P (r=n j p = 0; 8)
aprox. 4 zecimale
0
0
0
0; 001
0; 006
0; 026
0; 088
0; 201
0; 302
0; 268
0; 107
P (r=n j p = 0; 4)
aprox. 4 zecimale
0; 006
0; 040
0; 121
0; 215
0; 251
0; 2
0; 111
0; 042
0; 011
0; 002
0; 0001
(11.1)
S
a presupunem c
a statisticianul are datele de selectie ale sondajului, are deci raportul
R=n calculat din sondaj. El are nevoie de o REGUL DE DECIZIE pentru a putea alege
H0 sau H1 . Exist
a foarte multe posibilit
ati de a construi astfel de reguli de decizie. Unele
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
157
sunt mai bune, altele nu sunt asa de bune. Vom alege acum urm
atoarea regul
a: <<Dac
a
R=n <0,8, alegem H1 ; dac
a R=n 0,8, alegem H0 >>(REGULA 1).
Ce se poate ntmpla dup
a ce statisticianul a folosit aceast
a regul
a?
El poate gresi sau nu. S
a calcul
am probabilit
atile n toate cele patru cazuri care pot s
a
apar
a:
Decizia H0
luata H1
Situatia
reala
H0
H1
corect eroare II
eroare I corect
(11.2)
De exemplu, s
a presupunem c
a din selectie am obtinut R=n 0,8 si totusi n realitate
p=0,4. Deci am ales H0 si totusi H1 este adev
arat
a. Apare al doilea tip de eroare (eroare II).
S
a calcul
am probabiltatea acestei erori (folosind tabelul de mai sus):
P (R=n 0,8 j p=0,4)
= P (R=n=0,8 j p=0,4) + P (R=n=0,9 j p=0,4) + P (R=n=1 j p=0,4)
= 0; 011 + 0; 002 + 0; 0001 0; 013:
Primul tip de eroare (eroare I) apare dac
a alegem H1 si totusi H0 este adev
arat
a. Probabilitatea acesteia este:
P (R=n < 0,8 j p=0,8)
= +0 + 0 + 0; 001 + 0; 006 + 0; 026 + 0; 088 + 0; 201 = 0; 322:
Cele dou
a situatii corecte au urm
atoarele probabilit
ati:
P(R=n 0,8 j p=0,8) =0,677,
P(R=n < 0,8 j p=0,4) =0,987.
Punem aceste rezultate n urm
atorul tabel:
Decizia H0
luata H1
Situatia reala
H0
H1
0,677 0,013
0,323 0,987
(11.3)
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
158
Iat
a o alt
a regul
a de decizie: <<Dac
a R=n <0,6, alegem H1 ; dac
a R=n 0,6, alegem
H0 >>(REGULA 2). Tabelul corespunz
ator acestei reguli este urm
atorul:
Decizia H0
luata H1
Situatia reala
H0
H1
0,966 0,116
0,034 0,834
(11.4)
Este clar c
a dintre cele dou
a reguli de decizie este mai bun
a a doua regul
a deoarece
probabilit
atile de eroare sunt mici.
n prima regul
a de decizie valoarea lui R=n=0,8 (care face trecerea de la zona ipotezei H0
la zona ipotezei H1 ) se numeste valoarea critica a lui R=n (adic
a a statisticii R=n).
Pentru a doua regul
a de decizie valoarea critic
a a statisticii R=n este 0,6.
n general, frontiera dintre domeniul de acceptare D si domeniul de respingere D,
formeaz
a multimea de puncte n care statistica de testare g (X1 ; :::; Xn ) ia valoarea critica
C0 .
n gura urm
atoare avem reprezentarea grac
a a domeniului de acceptare D pentru ipoteza
H0 , a domeniului de respingere D pentru ipoteza H0 si a multimii punctelor de valoare
critic
a pentru urm
atoarea regul
a de decizie: <<Dac
a g (X1 ; :::; Xn ) C0 , accept
a H0 ; dac
a
g (X1 ; :::; Xn ) <C0 , accept
a H1 >>. Aici C0 este valoarea critic
a a testului.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
159
Decizia Accept H0
luata Resping H0
Situatia reala
H0
H1
1-
1-
(11.5)
Orice regul
a de decizie are un cuplu de numere (; ).
Idealul ar ca si s
a e 0, sau foarte mici.
Dintre dou
a reguli de decizie cu(1 ; 1 ) si (2 ; 2 ) astfel nct 1 2 , 1 2 , vom
elimina pe cea de-a doua. Spunem c
a regula de decizie cu (1 ; 1 ) domina (este mai tare)
regula de decizie cu (2 ; 2 ). n cazul Exemplului 11.1 cele dou
a reguli nu se pot compara,
ele nu se domin
a una pe alta.
O regul
a de decizie dominat
a de o alt
a regul
a de decize se zice inadmisibila.
Vom da acum un exemplu de regul
a de decizie inadmisibil
a: <<Dac
a R=n 2 ( 1; 0; 2) [
(0; 8; 1), alegem H1 ; dac
a R=n 2 [0; 2; 0; 8], alegem H0 >>(REGULA III).
Tabelul corespunz
ator ei este:
Decizia Accept H0
luata Resping H0
Situatia reala
H0
H1
0,625 0,952
0,375 0,048
(11.6)
Aici 2 =0,375, 2 =0,952. Cum 1 =0,323 si 1 =0,013 erau probabilitatile de eroare pentru
prima regul
a, rezult
a c
a regula <<Dac
a R=n 2 ( 1; 0; 2) [ (0; 8; 1), alegem H1 ; dac
a
R=n 2 [0; 2; 0; 8], alegem H0 >>(REGULA III) este inadmisibil
a deoarece este dominat
a de
prima regul
a de decizie. Nu vom lucra niciodat
a cu reguli de decizie despre care stim c
a sunt
inadmisibile. Dac
a se analizeaz
a ndeaproape regula <<Dac
a R=n 2 ( 1; 0; 2) [ (0; 8; 1),
alegem H1 ; dac
a R=n 2 [0; 2; 0; 8], alegem H0 >>(REGULA III) se constat
a c
a ea contrazice
chiar bunul simt probabilistic (De ce?).
n general statisticianul este interesat de modul in care variaza probabilitatile de eroare
si atunci cnd el schimba legea de decizie. Evident c
a pentru orice statistica de testare
g (X1 ; :::; Xn ) si pentru orice lege de decizie xat
a avem un si un bine determinati. P
astr
am
statistica de testare xat
a si variem legile de decizie. Se obtine un domeniu al probabilitatilor
de eroare (un domeniu de risc) dac
a se consider
a abscisa si ordonata punctului (,)
vezi gura urm
atoare:
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
160
Domeniul probabilit
atilor de eroare
d din gura anterioar
Curba groas
a AB
a este curba corespunz
atoare tuturor cuplurilor (,)
care deriv
a din decizii bune sau admisibile. Oricare alt punct (1 , 1 ) din domeniul de
d provine dintr-o decizie inadmisibil
risc care nu se a
a pe curba AB
a, deoarece aceasta este
d si aat la intersectia
dominat
a de decizia corespunz
atoare punctului (2 , 2 ) de pe curba AB
dintre aceast
a curb
a si segmentul OM.
d se apropie de
Experienta arat
a c
a dac
a volumul de selectie n creste, atunci curba AB
origine, adic
a riscul devine mai mic cel putin pentru deciziile admisibile (deoarece precizia de
predictie asupra populatiei creste odat
a cu n).
Singura problem
a care r
amne pentru statistician este aceea legat
a de alegerea regulii de
decizie admisibile. Aici intervine negocierea ntre cazurile mare, mic, sau invers,
d
mic, mare, (,)2 AB.
Situatia neutr
a este aceea cnd =. n practic
a aceast
a negociere depinde de factori
subiectivi sau obiectivi dar.
Din punct de vedere istoric ipoteza H0 se numeste ipoteza nula (nevinov
atia prezumtiv
a
n cazul unui acuzat!), iar ipoteza H1 se zice ipoteza alternativa (vinov
atia acuzatului). n
practic
a, num
arul (notat uneori si cu ") se d
a ca ind 0,05 sau 0,01 (rareori se utilizeaz
a
alt
a valoare). reprezint
a probabilitatea de a respinge H0 cu toate c
a H0 este adev
arat
a.
Presupunem c
a H0 este adev
arat
a si alegem asa numita regiune (domeniu) de respingere
n concordant
a cu ipoteza H1 . S
a not
am domeniul de respingere cu Res = facele valori ale
statisticii de testare g (X1 ; :::; Xn ) pentru care H 1 este adevarata g. G
asim multimea Res din
ipoteza:
P (g (X1 ; :::; Xn ) 2 Res j H0 =adev
arat
a) = (dat)
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
161
Dac
a la o selectie de volum n: X1 ; :::; Xn ; valoarea v.a. g (X1 ; :::; Xn ) 2 Res, spunem c
a
ipoteza H1 este adevarata cu pragul de semnicatie (cu conditia ca s
a e mic, ca mai sus).
Vom da acum cteva exemple de testare a unor ipoteze statistice n lumina celor spuse
mai sus.
Exemplul 11.14 ([Hays], pag. 415) Un muncitor poate sa realizeze X piese pe ora.
Dupa ndelungate cercetari statistice s-a stabilit ca X este o v.a. normala cu media m=138 si
deviatia standard =20. Un inginer pretinde ca poate aduce o inovatie n procesul de productie
astfel nct sa ridice media la m=142 piese pe ora, fara a perturba normalitatea v.a. X si pe
. Este chemat un statistician sa testeze pretentia inginerului.
Solutie Introducem dou
a ipoteze:
H0 : m=138
H1 : m=142
Facem o selectie de 100 muncitori care lucreaz
a cte o or
a ecare. Alegem pragul de
semnicatie =0,05=P(respingem H0 jH0 este adev
arat
a). Vrem acum s
a g
asim regiunea de
respingere n acest caz concret. Stim c
a un estimator bun pentru media m este media de
selectie X = (X1 + X2 + + Xn ) =n, care este normal
a cu media m si deviatia
p distribuit
standard (pentru selectia noastr
a n=100) X = 20= 100 = 2. Chiar dac
a ipoteza de normalitate a v.a. X nu este ntrutotul adev
arat
a (sau chiar fals
a!), deoarece n=100 este mare,
din teorema limit
a central
a, rezult
a c
a X este distribuit
a normal. Dac
a H0 este adev
arat
a,
atunci X este normal distribuit
a cu media 138 si deviatia standard 2, pe cnd, dac
a H1 este
adev
arat
a, m=142 si deviatia standard tot egal
a cu 2. Vedem de aici c
a valorile mari ale v.a.
X favorizeaz
a ipoteza H1 , iar valorile mici ale v.a. X favorizeaz
a ipoteza H0 .
Regiunea de respingere va deci de forma: <<Respinge H0 dac
a X C >>. Aici C
reprezint
a valoarea critic
a a regulii de decizie: <<Dac
a X < C, alegem H0 ; dac
a X C,
alegem H1 >>.
Vrem acum s
a determin
am valoarea critic
a C a statisticii X dac
a stim pe =0,05. Scriem
c
a =P(respinge H0 jH0 =adev
arat
a)=P(X C j m=138)=0,05. Dar P(X C j m=138)=
C 138
X 138
P Z 2 , unde Z = 2 este v.a. standard normal
a cu media 0 si cu deviatia standard
1. Vrem ca P Z C 2138 = 0; 05 = 1 F C 2138 , unde F (z) este functia de repartitie
(functia de distributie cumulat
a) a v.a. normale stanard Z. Din Tabelul I g
asim c
a C 2138
este 1,65, adic
a cuantila de ordin 1-0,05=0,95 a v.a. Z. De aici rezult
a c
a punctul critic
C=141,30. Acum putem calcula si probabilitatea
= P (accept H0 j H1 = adev
arat
a) = P (X < 141; 30 j m = 142)
141; 30 142
= P Z<
= P (Z < 0; 35) = F ( 0; 35) = 1 F (0; 35) = 0; 36:
2
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
162
Tabelul corespunz
ator regulii de decizie de mai sus este:
Decizia Accept H0
luata Resping H0
Situatia reala
H0
H1
0,95
0,36
=0,05 0,64
(11.7)
Dac
a din calcule X < 141; 30, atunci alegem H0 , adic
a r
amnem la vechiul procedeu de
lucru.
S
a coment
am putin rezultatele din tabelul (11.7). =0,05 , chiar dac
a X 141; 30, adic
a
aleg H1 si resping H0 , probabilitatea de eroare n cazul cnd H0 este adev
arat
a, este foarte
mic
a. Prin urmare, dac
a alegem noul procedeu si-l nlocuiesc cu primul (primul ind mai
amnem la
bun) riscul este mai mic, aproape zero. Totusi, dac
a alegem H0 (X < 141; 30) r
vechiul procedeu n timp ce noul procedeu este mai bun, riscul este mai mare: =0,36.
Statisticianul vrea s
a micsoreze si acest risc f
ar
a ns
a a m
ari pe =0,05 (putem micsora
pe dac
a reducem valoarea critic
a la 140, de exemplu; dar, n acest caz creste si ). Teoretic
stim c
a si se micsoreaz
a dac
a m
arim volumul selectiei.
p
Vom m
ari pe n la 400. n acest caz deviatia standard a v.a. X devine X = 20= 400 = 1.
Determin
am valoarea critic
a ca mai sus si g
asim C = 139; 65. n acest caz
= P (accept
a H0 j H1 = adev
arat
a) = P (X < 139; 65 j m = 142)
139; 65 142
= P Z<
= P (Z < 2; 35) = 0; 01:
1
Iat
a deci c
a am redus pe de la 0,36 (cnd n=100) la 0,01 (cnd n=400).
Acum statiticianul poate s
a r
aspund
a cu riscuri foarte mici (; mici) dac
a este bine s
a
schimb
am procedeul de producere al pieselor (accept H1 si resping H0 ) sau, dimpotriv
a, s
a
lucr
am dup
a acelasi procedeu (accept H0 si resping H1 ).
n primul caz pot gresi cu 5%, iar n al doilea caz cu 1%. Facem deci un sondaj de 400
a X < 139; 65 sau X 139; 65.
muncitori/or
a. Calcul
am X si vedem dac
Observatia 11.15 Pentru valoarea critica C=141,30, regiunea de respingere este [141,30;1),
pe cnd pentru valoarea critica C=139,65, regiunea de respingere este [139,65;1).
11.3
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
163
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
164
11.4
Rezumat
Partea teoretica
Fie X un model statistic pentru o populatie P, model care depinde de un parametru 2 .
Fie H o submultime specicat
a n . Ea va numit
a ipotez
a. Fie K=nH. Spunem c
a:
H se realizeaz
a dac
a 2H (prin natura lucrurilor)
H nu se realizeaz
a dac
a 2K.
n Lectia 11 am notat H cu H0 si K cu H1 .
S
a not
am cu
spatiul tuturor observatiilor pe care le vom face asupra populatiei P (spatiul
de selectie). Pentru ecare 2 avem o distributie p pentru X. Dac
a pentru un sondaj
! 2
, g
asim c
a 2H, spunem c
a accept
am ipoteza H, dac
a 2K spunem c
a respingem
ipoteza H. Spatiul de selectie se mparte n dou
a p
arti distincte:
=A[R, unde A este zona
de acceptare a ipotezei H, adic
a A=f! 2
j 2Hg, iar R=f! 2
j 2Kg este zona de
respingere a ipotezei H.
S
a not
am cu p (R) = =probabilitatea de a respinge ipoteza H cnd de fapt este bine
ales de natur
a. Se zice eroare de primul tip respingerea ipotezei H cnd ea este adev
arat
a:
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
165
X pm
S= n
N (0; 1). H0 si
adic
a distributia Student cu n
X m
= = p
t (n
S = n
1)
4) Test pentru
proportia de succese
pq
Ps N p; n ; q = 1 p: Z = Pps pqp N (0; 1). H0 si H1 apar exact ca la 1).
n
Decizie
Decizie
Decizie
Decizie
corecta
falsa
Eroare I
falsa
Eroare II
corecta
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
11.5
166
s
i
T=
n
X.
Testul
va
avea
pragul
"
dac
a
P(X
y)
",
sau
P(T
ny)
",
adic
a
p
t
ny t. Testul va cel mai puternic dac
a y = pn , deci avem testul:
1;6449
Respinge H() X pn .
p
p
2) Presupunem c
a H nu se veric
a = 1 si p
T= nX
n. Se comite o eroare de
pa, adic
p
n. Puterea testului va deci 0; 9
al doilea tip pentru
p X y sau
p T ny p n = t
dac
a P(T t
n), sau t
n < u, deci n > t u = 2; 9265. Cel mai mic n pentru care
puterea testului este 0; 9 este n = 9.
3. Fie X pretul aceluiasi articol luat la ntmplare din 15 magazine. Gasim tabelul acestor
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
preturi n $:
167
0; 8366. O variabil
a aleatoare cu n 1=14 grade de libertate are o probabilitate de cel putin
0,40 pentru a lua o astfel de valoare. Ipoteza M(X)=43 este perfect acceptabil
a.
2) O estimare nedeplasat
a pentru 2 =D(X) este nn 1 S2 = 0; 21. Aceast
a valoare este
dublul valorii testate 0,1. Vrem s
a vedem dac
a nu cumva ea este prea mare. Pentru aceasta
nS 2
2
folosim faptul c
a 2 are o distributie (Pearson) cu n 1 grade de libertate. G
asim c
a
nS 2
2
= 30. Dar cu 14 grade de libertate are o probabilitate < 0; 01 pentru a lua o astfel de
0;1
valoare ridicat
a. Cu pragul 0,05 va trebui deci s
a respingem ipoteza 2 = 0; 1.
4. ntr-un oras A, 300 de locuitori din 1500 interogati declara ca nu s-au uitat niciodata
la TV. ntr-un alt oras B, 320 din 1800 declara acelasi lucru. Ce credeti despre ipoteza H:
proportia de locuitori care nu se uita la TV este aceeasi n ambele orase. (pragul 0,05).
Solutie Vom accepta pentru cele dou
a v.a. X si Y ce reprezint
a num
arul acelora care nu
se uit
a deloc la TV c
a au o distributie uniform
a. Presupunem c
a X1 ,...,X1500 si Y1 ,...,Y1800
300
320
sunt independente. Avem c
a m = 1500, n = 1800, X = 1500
= 0; 2, Y = 1800
= 0; 172;
P
Y
X
2
2
j
j
S2X = m1
Xi X = X 1 X , S2Y = Y 1 Y ; jT0 j = p 1 2 1 2 = 1; 61.
S + n SY
m X
O variabil
a gaussian
a redus
a are o probabilitate mai mare dect 0,1 pentru a lua o valoare
att de mare. Prin urmare, la pragul de 0,05 ipoteza H se accept
a.
5. Pentru a masura o masa putem folosi doua procedee A si B. Rezultatul masuratorii lui
prin procedeul A este o v.a. gaussiana X cu media si cu dispersia 2X . Prin procedeul B,
avem o variabila gaussiana Y cu media si dispersia 2Y . S-au facut 8 masuri independente
pentru prin procedeul A care au condus, la o dispersie de selectie empirica egala cu 0,24.
S-au facut apoi 12 masuratori independente pentru aceeasi masa prin procedeul B si s-a
obtinut dispersia de selectie 0,08. Ce credeti despre ipoteza H: cele doua procedee A si B au
aceeasi precizie? (prag " = 0; 05)
Solutie. Testul se refer
a la ipoteza H: 2X = 2Y , cu m = 8, n = 12, S2X = 0; 24, S2Y = 0; 08.
S2
De aici s-ar putea crede c
a 2X > 2Y . Vrem s
a vedem dac
a nu cumva raportul SX2 nu este prea
Y
mare (relativ la pragul ") pentru ca ipoteza H s
a e vericat
a.
mS 2
nS 2
Stim c
a variabilele aleatoare 2X si 2Y sunt 2 cu m 1 = 7 si respectiv n 1 = 11
X
mS 2 (m 1)
1)
Y
ar avea o
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
distributie F (Fisher-Snedecor) cu
m
n
1
1
7
11
168
80;24=7
U= 120;08=11
= 3; 14.
Se vede din cercetarea direct
a a tabelului pentru distributia F c
a probabilitatea ca v.a.
acesta s
a ia o astfel de valoare este ceva mai mic
a dect 0,05. Vom deci obligati s
a respingem
ipoteza c
a 2X este cu mult mai mare dect 2Y . Totusi nu putem avea mare certitudine c
a 2X
= 2Y .
11.6
Exercitii propuse
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
169
6. Un esantion de volum 25 a fost extras dintr-o populatie normala, X N (m; 4). Media
de selectie x este 10,72. Fie ipoteza nula H 0 : m = 10 si ipoteza alternativa: a) H 1 : m > 10;
b) H 1 : m 6= 10. Gasiti in ambele cazuri nivelul de semnicatie la acre trebuie sa respingem
ipoteza nula in favoarea ipotezei alternative.
R: a) " 3; 59%; b) " 7; 18%:
7. Un producator de becuri sustine ca media de viata a unui bec electric produs de el este
de 2000 de ore.
la intamplare si se testeaza viata lor in ore, x.
P Se iau 64 de becuri
P
Se obtine
x = 127808,
(x x)2 = 9694; 6. Oare la un nivel de semnicatie de 2%
putem spune ca producatorul si-a supraestimat produsul? Presupunem ca durata de viata a
unui bec are distributia normala.
qP
(x x)2 =n.
R: n = 64 > 30 este mai mare; deci estimam cu
b=S=
pm si gasim zcalc =
Folosim statistica Z = X
b= n
supraestimat produsul la nivelul de 2%.
P
8.
Dintr-o
populatie
normala
X
se
extrage
un
esantion
de
volum
40
cu
x = 24 si
P 2
x = 596: Testati (test bilateral) la nivelul de semnicatie de 5% daca media populatiei
este 0 (estimati cu S).
R: z = 0; 995. Se accepta armatia.
9. La un examen se analizeaza
punctajul
P
Px 2obtinut de ecare candidat in parte. Se aleg 250
de candidati si gasim ca
x = 11872 si
x = 646193. Gasiti un interval de incredere de
nivel 90% pentru media m. Testati ipoteza H 0 : m = 49; 5 impotriva ipotezei H 1 : m < 49; 5
cu nivelul de semnicatie % si gasiti a.i. H 0 sa e respinsa.
R: (45; 6; 49; 4) ; > 4:
P
10. Un esantion de volum 8 dintr-o populatie normala are x = 4; 65,
(x x)2 = 0; 74.
Testati la un nivel de semnicatie de 2% daca media distributiei este 4,3.
R: Folositi statistica T= S=Xpnm 1 2 t(n
1), deoarece esantionul este mic (8 < 30);
tcalc = 3; 05 (test bilateral). Respingem armatia.
11. O masina produce ace de otel de lungume 2 cm. Se face o selectie de 10 ace si se
gaseste: 1,98; 1,96; 1,99; 2,00; 2,01; 1,95; 1,97; 1,96; 1,97; 1,99. Presupunand ca lungimile
acelor sunt normal distribuite, testati cu 1% daca masina functioneaza bine sau nu.
R: n = 10 < 30; folosim deci statistica T; tcalc = 3; 601: Nu functioneaza bine.
12. Se aleg 8 femei la intamplare si li se masoara nivelul de colesterol: 3,1; 2,8; 1,5; 1,7;
2,4; 1,9; 3,3; 1,6.
Vrem sa testam daca nivelul mediu de colesterol este 3,1.
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
170
a) Presupunand ca selectia face parte dintr-o populatie normala aratati de ce testul T este
cel mai potrivit.
b) Aplicati testul asupra mediei 3,1 si gasiti cu nivelul de semnicatie de 2% daca media
3,1 este corecta sau nu.
c) Fasiti un interval de incredere de 90% pentru nivelul mediu al colesterolului.
R: b) Resping H 0 (m=3,1); c) (1,81;2,72).
13. Teoria prezice realizarea unui eveniment A cu probabilitatea p=0,4. Se experimenteaza
realizarea evenimentului A de 400 de ori. Din cele 400 de incercari A se realizeaza de 140 de
ori. Testati cu nivelul de semnicatie de 1% daca p este mai
sau nu decat 0,4.
mica
P
s p
p
R: Se modeleaza cu proportia de succese: P s N p; pq
;
Z=
2; 04: Nu.
pq ; zcalc =
n
n
14. Se cerceteaza proportia de studenti care au un calculator personal. Din 200 de studenti,
143 au un calculator personal. Testati cu un nivel de 5% ipoteza H 0 :p=75% (probabilitatea
ca un student sa aiba un calculator) contra ipotezei H 1 : probabilitatea p este mai mica decat
75%.
R: z calc = 1; 143: Se accepta.
15. Gasiti probabilitatile erorilor de tipul I si celor de tipul II in testarea urmatoarelor
ipoteze. Se stie ca o cutie poate sa contina e (H 0 ) 10 jetoane albe si 90 negre, e (H 1 ) 50
jetoane albe si 50 negre. Pentru a testa ipoteza H 0 impotriva ipotezei H 1 se aleg 4 jetoane
din cutie fara a le pune inapoi. Daca toate 4 jetoane sunt negre, accept H 0 . Altfel, o resping
(regula de decizie a testului).
Indicatie H 0 : cutia contine 10 jetoane albe si 90 negre.
H 1 : cutia contine 50 jetoane albe si 50 negre.
P(Eroare I)=P(resping H 0 j H0 este adevarata)=P(cel putinun jetoneste albjin cutie sunt
90 89 88 87
10 albe si 90 negre)=1-P(toate 4 sunt negrejin cutie sunt 10 albe si 90 negre)=1 100
99 98 97 =
1 0; 652 = 0; 348:
P(Eroare II)=0; 059:
16. Pentru datarea specimenelor arheologice se foloseste faptul ca aceste specimene emit
particule radioactive. Numarul de particule emise in n minute are o distributie Poiison cu
parametrul n, unde este un parametru ce depinde de varsta specimenului.
Se fac doua ipoteze asupra varstei unui specimen
H 0 : specimenul este de 7000 de ani ( = 0; 1)
H 1 : specimenul este de 15000 de ani ( = 4; 0)
S-a decis sa se contorizeze numarul X al particulelor radioactive emise in n minute de
specimen si
Acceptam H 0 ; daca X 1 (respingem H 1 )
Acceptam H 1 ; daca X 2 (respingem H 0 )
Daca n = 1; se cere: a) P(resping H 0 j H 0 =adevarata) si b) P(resping H 1 j H 1 =adevarata).
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
171
18. Dintr-o populatie normala N (m; 36) se ia un esantion de volum 100. Un cercetator
vrea sa testeze ipotezele H 0 : m = 65, H 1 : m > 65: El decise sa foloseasca urmatoarea regula
de decizie:
accept H 0 daca media de selectie x 66; 5
resping H 0 daca x > 66; 5:
a) Gasiti P(Eroare I ) ;
b) Daca el foloseste alternativa H 1 : m = 67; 9; gasiti P(Eroare II ).
c) Ce valoare critica trebuie sa considere el pentru media de selectie daca vrea ca
P (Eroare I ) = P (Eroare II )
36
Indicatie a) Sub H 0 avem: X N 65; 100
: El respinge H 0 daca x > 66; 5; adica
P X > 66; 5 = P (Z > 2; 5) = 0; 00621: Deci P(Eroare I ) = 0; 00621:
36
b) Daca el considera H 1 : m = 67; 9; atunci sub H 1 avem ca X N 67; 9; 100
si
P (Eroare II ) = P (accept H 0 j H 1 este adevarata) = P X 66; 5 j m = 67; 9
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
172
P X 66; 5 j m = 67; 9 = P (Z 2; 333) = 0; 00982:
c) P X > x j H 0 este adevarata = P X x j H 1 este adevarata ; deci x se aa la mijlocul segmentului [65; 67; 9], adica x = 66; 45.
19. Ingredientele care se amesteca pentru a forma betonul au asemenea proportii incat
rezistenta medie la rupere sa e de 2000N. Daca rezistenta medie la rupere cade sub 1800N
atunci compozitia trebuie schimbata. Distributia rezistentei de rupere este normal distribuita
cu deviatia standard de 200N.
Se iau esantioane pentru a se cerceta ipotezele:
H 0 : m = 2000N
H 1 : m = 1800N
Cate esantioane trebuie testate pentru ca sa avem:
P(Eroare I ) = = 0; 05 si
P(Eroare II ) = = 0; 1:
2
Indicatie Sub H 0 avem ca X N (2000; 2002 ) ; deci X N 2000; 200
n
LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
173
20. Se aleg aleator esantioane de 400 seminte dintr-un anumit sortiment. Probabilitatea
ca o seminta sa germineze este egala cu . Sa notam cu X v.a. ce reprezinta numarul de
seminte care au germinat din totalul semintelor dintr-un esantion.
Folositi o aproximare convenabila a modelului probabilistic cu un model normal pentru a
determina:
a) P(X 340 j = 0; 9)
b) P(X 340 j = 0; 8)
c) Controlorul de calitate al semintelor stie ca este e 0; 8; e 0; 9: Sa presupunem
ca, de fapt, din totalul de 400 de semninte dintr-un esantion au germinat numai x. Controlorul decide ca valoarea lui este 0; 8 daca
Z = P (X x j = 0; 8)
P (X x j = 0; 9)
este pozitiv. Altfel el decide ca = 0; 9: Gasiti care este decizia controlorului pentru ecare
dintre cazurile x = 330; x = 340; x = 350:
R: a) 0,000577; b)0,00738; c)0,8; 0,8; 0,9.
Lectia 12
Testul neparametric 2
12.1
Principiul testului 2
Frecventa observata
n 1995, fo;j
35
40
83
16
26
0
Frecventa
observata n 1985, fs;j
36
34
64
26
34
6
200
200
174
LECTIA
12. TESTUL NEPARAMETRIC 2
175
fs;j )2
(12.1)
fs;j
Se arat
a (Teorema lui K. Pearson) c
a pentru n mare (cel putin 20-25), n cazul nostru
n=200, aceast
a sum
a tinde c
atre valoarea distributiei 2 cu 6-1 grade de libertate n ipoteza c
a
H0 este adev
arat
a: avem aceiasi distributie, adic
a distributiile celor dou
a sondaje concord
a. n
general, dac
a am repartizat elementele din selectie n J clase, pentru un volum mare (n 25)
suma (12.1) cu J n loc de 6, este aproximativ egal
a cu valoarea distributiei 2 cu J 1 grade
de libertate.
Ipoteza H0 are sanse s
a e adev
arat
a dac
a valoarea sumei (12.1) este mic
a. G
asim
2 =
(35
C
aut
am n Tabelul III pe linia corespunz
atoare = 5 (grade de libertate) si g
asim c
a
16,749618.4620,515.
Dar
P (16; 7496 2 20; 515)
= F (20; 515) F (16; 7496) = 0; 999
0; 995 = 0; 004
<
<
LECTIA
12. TESTUL NEPARAMETRIC 2
176
Prezent
am acum situatia general
a n care putem utiliza testul de concordanta 2 . Facem
urm
atoarea ipotez
a: H0 :<<Presupunem c
a populatia P are o functie de probabilitate g(x),
specicat
a (de exemplu normal
a cu m = 0 si = 2)>>.
Vrem s
a folosim testul 2 pentru a m
asura ct
a dreptate avem s
a presupunem acest
lucru pornind de la un sondaj de volum n: x1 ; x2 ; :::; xn din populatia P. Dup
a regulile de
mai sus mp
artim datele x1 ; x2 ; :::; xn n J grupe disjuncte. Not
am cu j frecventa absolut
a n
grupa j(num
arul acelor xi care se a
a n grupa j). Not
am cu pj probabilitatea teoretic
a
(obtinut
a cu ajutorul functiei de probabilitate g(x); sau cu ajutorul functiei de repartitie
corespunz
atoare G(x)) ca un element x din populatia P s
a se ae n grupa j. Atunci frecventa
teoretic
a este npj , si suma care m
asoar
a deviatia din formula (12.1) devine:
d=
J
X
( j
j=1
npj )2
npj
(12.2)
Calcul
am acest num
ar d. Privim Tabelul III si ncerc
am s
a estim
am probabilitatea ca 2
s
a aib
a valoarea d. De obicei se xeaz
a un prag de semnicatie 2 (0; 1). Se caut
a cuantila
2
2
corespunz
atoare acestui prag, adic
a acea valoare a lui astfel nct functia de repartitie
a lui 2 s
a aib
a valoarea . Cum P(2 2 ) = , din denitia functiei de repartitie, vom
face urm
atorul rationament:
dac
a d 2 , vom accepta ipoteza H0 (distributia populatiei este de forma prescris
a) cu
pragul de semnicatie .
dac
a d < 2 , vom respinge ipoteza H0 cu pragul de semnicatie .
Acesta este testul de concordant
a 2 . De obicei se ia mic: =0,05; 0,01; 0,001.
Exemplul 12.2 Se fac 500 de masuratori asupra erorilor date de un aparat de masura de la
bordul unui avion. Ele se mpart n 8 intervale consecutive. Freventele absolute cu care apar
aceste erori pe un interval sunt date n urmatorul tabel:
Ij : [ 4; 3) [ 3; 2) [ 2; 1) [ 1; 0) [0; 1) [1; 2) [2; 3) [3; 4)
j :
6
25
72
133
120
88
46
10
Utiliznd testul 2 sa se verice cu pragul de semnictie = 0; 95 daca distributia erorilor
este normala cu media estimata la m = 0; 168 si dispersia estimata la 2 = 14482 .
Solutie Aici avem un exemplu mai complicat deoarece P
cei doi parametri auPdeja estim
ari
1
1
date. Vom avea mereu dou
a relatii de leg
atur
a: 0; 168 = 500
xi si 14482 = 500
(xi 0; 168)2 .
Deci numarul gradelor de libertate va sc
adea cu doi. Prin urmare 2 va avea 8-1-2=5
grade de libertate.
Calcul
am probabilitatea teoretic
a pe ecare interval [xi ; xi+1 ):
xj+1 m
xj m
pj =
LECTIA
12. TESTUL NEPARAMETRIC 2
177
Cuantila 20;95 pentru 5 grade de libertate este 11,0705 (vezi Tabelul III). Deci P(2
11; 0705)=0,95,adic
a P(2 > 11; 0705)=0,05.
Cum d = 3; 94 < 11; 0705 accept
am ipoteza de normalitate cu probabilitatea 0,95 (adic
a
cu 95%), sau cu pragul = 0; 05.
Vom prezenta acum testul 2 (se citeste chi p
atrat sau chi doi) dintr-un punct de vedere
mai general.
Fie evenimentele fA1 ;A2 ; :::;Ar g P
cu probabilitatea pi =P(Ai ), i = 1; r, cunoscute mai
mult sau mai putin. Putem cere ca
pi = 1, adic
a fA1 ;A2 ; :::;Ar g s
a e o descompunere a
2
evenimentului singur. n esent
a testul si propune s
a testeze o ipotez
a oarecare H privind
probabilit
aile p1 ; :::; pr . Se fac sondaje de volum mare pentru ecare Ai , i = 1; r. Se noteaz
a
cu Yi num
arul acelor probe care sunt favorabile evenimentului
A
.
i
P 0
Cazul I Se dau numerele p01 ; p02 ; :::; p0r 0 cu
pi = 1 si se consider
a ipoteza H: p1 = p01 ,
0
0
a de concordant
a). Dac
a H este adev
arat
a statistica (Helmertp2 = p2 ; :::; pr = pr (problem
Pearson)
!
X (Yi np0 )2
X Y2
i
i
T =
=
n
(12.3)
0
0
np
np
i
i
i
1ir
LECTIA
12. TESTUL NEPARAMETRIC 2
178
X (Yi
i
nb
pi )2
= min
nb
pi
(12.5)
b1 ; :::;
bs care veric
adic
a acele
a ecuatiile diferentiale.
1:
X Y2 @ pbi
i
= 0; 0 j s
(12.6)
2
bj
pb
1ir i
P
P
b1 ; :::;
bs = 0si se foloseste faptul c
Se pune conditia grad d
a @@bpbi = 0;deoarece j pbj =
i
(12.7)
pentru 1 j s.
Regula III n locul formulelor (12.6) se pot folosi formulele:
X pbi @ pbi
=0
b
Y
1ir i @ j
(12.8)
pentru 1 j s
(2 minim modicat).
Aceast
a distributie att de folosit
a are pentru diverse valori ale lui n, densit
atile ca n
gracul urm
ator:
LECTIA
12. TESTUL NEPARAMETRIC 2
179
0.175
0.15
0.125
0.1
0.075
0.05
0.025
10
15
20
25
30
Densit
atile 2 pentru n=4, 6, 8, 10, 12, 14, 16, 18, 20
S
a aplic
am acum cele de mai sus la cteva tipuri de probleme.
12.1.1
Fie P=Q(1 ; :::; s ) o familie de legi pe R care depinde de s parametrii 1 ; :::; s si X o v.a.
aleatoare. Pentru a testa ipoteza: H: X se supune unei anume legi din familia P, mp
artim
pe R n r subintervale: R =A1 [ [Ar , si punem fi (1 ; :::; s ) =Q(1 ; :::; s ) (Ai ).
Exemplul 12.3 Fie X o v.a. ce poate lua valorile 0, 1, 2,..., k,.... Testam ipoteza: H: X se
supune unei legi Poisson.
Familia legilor Poisson depinde de un singur parametru > 0. Ca estimator bun pentru
b media de selectie (eventual dup
se alege =
a grupaje convenabile). Avem s = 1 n acest
caz.
Exemplul 12.4 Vrem sa testam pentru o v.a. X continua urmatoarea ipoteza H: X se supune
unei legi gaussiene. Aici P este familia N(; 2 ) care depinde de doi parametri: si 2 . Dupa
cum stim este convenabil sa estimam media cu media de selectie si pe 2 cu S0 2 . Aici s = 2.
12.1.2
Teste de independent
a
Fie X si Y dou
a v.a. denite pe aceeasi categorie de probe. Pentru a testa ipoteza H: X si
Y sunt independente, se descompune R n dou
a partitii: R =E1 [ [Ea =F1 [ [Fb si
consider
am cele r = a b evenimente: X2Ei si Y2Fj , pentru 1 i a, 1 j b.
LECTIA
12. TESTUL NEPARAMETRIC 2
180
Se face un num
ar mare de sondaje independente de tipul (X1 ,Y1 ),... (Xn ; Yn ). Not
am cu
Nij num
arul realiz
arilor X2Ei si Y2Fj . Se introduc statisticile
e i =
N
Nij
1jb
T = n
X Nij
i;j
e j =
N
(12.9)
Nij
1ia
1e e
N N
n i j
e i N
e j
N
X
2
=n
"
X N2ij
e i N
e j
N
i;j
(12.10)
Dac
a H este adev
arat
a, T se supune practic unei legi 2 cu (a 1)(b 1) grade de libertate.
Testul const
a n a respinge ipoteza H dac
a T ia o valoare semnicativ prea mare relativ la
e i N
e j este un estimator bun pentru
2 . Dac
a ipoteza H este vericat
a num
arul pbij = n12 N
probabilitatea pij =P(X 2 Eisi Y 2 Fj ).
12.1.3
Teste de omogenitate
Se consider
a t variabile aleatoare X1 ; :::;Xt . Pentru a testa ipoteza H: X1 ; :::;Xt satisfac aceeasi
lege, se face partitia R =A1 [A2 [ [Ar , pentru ecare i se ia un esantion (Xi1 ; :::; Xini ) de
volum mare, xi 2Xi , n = n1 + +ni , v.a. X11 ; :::;Xini ind considerate independente. Pentru
1 i t se noteaz
a Yij num
arul de indici k astfel nct Xik 2Aj . Se introduc statisticile
2
"
#
ni e
Y
X Yij
X
X Y2ij
n j
e ij
e j =
Y
T =
Y
=n
1 :
(12.11)
ni e
e j
ni Y
Yj
1it
1it
1ir
i;j
Dac
a H este adev
arat
a, T se supune practic unei legi 2 cu (t 1) (r 1) grade de libertate. Testul const
a n a respinge H atunci cnd T ia o valoare semnicativ mare relativ la 2 .
e j este un estimator bun pentru P(Xi 2Aj ) si nici nu depinde
Dac
a H este adev
arat
a pbj = n1 Y
de i. Dac
a r = 2 (12.10) devine
n2 X Y2i1
T =
e 1 Y
e 2
ni
Y
i
e 1
Y
e 2
Y
(12.12)
Exemplul 12.5 Teoria lui Mendel asupra ereditatii ne previne ca daca crestem 2 tipuri de
plante va trebui sa obtinem produse de tipul A, B, C, D n proportie de 9, 3, 3 si 1. Dupa
experiente se observa ca s-au obtinut 154 produse de tipul A, 44 de tip B, 63 de tip C si 21
de tip D. Ce parere aveti n acest caz de teoria lui Mendel (prag " = 0; 05)?
Solutie Aici evenimentele A1 , A2 , A3 , A4 sunt A, B, C si D. Teoria lui Mendel prevede c
a
9
3
3
1
p1 = 16
, p2 = 16
, p3 = 16
, p4 = 16
(deoarece 9+3+3+1=16). Suntem n Cazul I al testului 2
LECTIA
12. TESTUL NEPARAMETRIC 2
181
9
3
3
1
cu: p01 = 16
, p02 = 16
, p03 = 16
, p04 = 16
. Experientele conduc la , Y1 = 154, Y2 = 44, Y3 = 63,
Y4 = 21, n = 154 + 44 + 63 + 21 = 282.
Dac
a U este variabila 2 cu r 1 = 3 grade de libertate, avem c
a P(U 7; 81)=0,05. Testul
2
de prag 0,05 se scrie: Respinge H() 7; 81. n cazul nostru avem np01 , np02 = np03 = 53,
np04 = 18 si
(154
Exemplul 12.6 Fie p probabilitatea pentru ca o piesa din echipamentul fabricat de o anumita
masina sa aiba defecte. Vrem sa testam ipoteza H: p = 0; 2. Pentru aceasta luam 100 de piese
si constatam ca 22 dintre ele au defecte. Care este probabilitatea, daca ipoteza este adevarata,
pentru ca 2 sa aiba o valoare mare? Cum interpretati acest lucru?
Solutie Aici A1 =succes si A2 =esec. Fie p1 = p =P(A1 ) si p = 1 p = q =P(A2 ). Vom
arul de succese n cursul a n ncerc
ari(=Y) si
avea p01 = p0 si p02 = q 0 = 1 p0 . Fie Y1 =num
Y2 =n Y. Avem
T =
(Y
np0 )2 [n
+
np0
Y n (1 p0 )]2
(Y np0 )2
=
= Z2
0
0
0
n (1 p )
np q
Y np
2
at
a deci urm
atoarea form
a: Respinge H() (T y) ; sau dac
a
unde Z= p
0 0 . Testul cap
p np q
jZj y. Se stie c
a dac
a H este adev
arat
a Z este practic gaussian
a redus
a (teorema limit
a
central
a).
(22 20)2
Aplicatie numeric
a: p0 = 0; 2, n = 100, Y= 22. Valoarea lui Z2 este Z2 = 1000;20;8
= 41 .
q
Probabilitatea ca variabila gaussian
a redus
a s
a ia o valoare absolut
a > 14 = 0; 5 este 0,616.
Se accept
a deci aceast
a ipotez
a H.
Exemplul 12.7 O v.a. X ia numai valorile 0, 1, 2, 3 ,4. Vrem sa testam daca aceasta v.a.
se spune legii binomiale cu p = 13 si n = 4 (numarul de probe). S-au facut pentru aceasta 324
ncercari independente care au condus la urmatoarele rezultate, fi ind frecventa absoluta a
valorii i:
i 0
1
2 3 4
fi 67 122 94 38 3
Ce concluzie trageti?
i
4 i
Solutie Fie Ai evenimentul: X=i; P(Ai )=Ci4 31 23
, pentru 0 i 4. Avem
16
24
8
1
0
0
0
deci p00 = 81
; p01 = 32
;
p
=
;
p
=
;
p
=
;
Y
=
67;
Y
0
1 = 122; Y2 = 94; Y3 = 38;
2
3
4
81
81
81
81
Y4 = 3. Deoarece Y4 este mic se grupeaz
a A3 cu A4 si g
asim A0 , A1 , A2 si B=(A3 [ A4 ) cu
p00 , p01 , p02 si q 0 = p03 + p04 . Experienta a condus la Y0 , Y1 , Y2 si Z=Y3 +Y4 . Se obtine 2 =1,15.
Probabilitatea ca 2 cu 4-1=3 grade de libertate s
a ia o valoare de aceast
a m
arime este > 0; 1.
Deci ipoteza se accept
a.
LECTIA
12. TESTUL NEPARAMETRIC 2
182
Exemplul 12.8 Gazul de esapament al unui motor contine particule solide. Se considera
ipoteza H: numarul X al acestor particule continut ntr-un volum mic V de gaz se supune
unei legi Poisson. Pentru a testa aceasta ipoteza luam 400 esantioane de acelasi volum V
si se gasesc 1872 de particule reprezentate dupa urmatorul tabel (ni reprezinta numarul de
esantione care au continut i particule):
i
ni
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 20 43 53 86 70 54 37 18 10 5 2 2 0 0
i
Yi
0 sau 1 20
2
43
3
53
4
86
5
70
6
54
7
37
8
18
9
10
10
9
pbi
0,0527
0,1016
0,1585
0,1855
0,1736
0,1354
0,0905
0,0529
0,0275
0,0218
nb
p1
21,1
40,6
63,4
74,2
69,4
54,1
36,2
21,1
11,0
8,7
(Y i nb
pi )2
nb
pi
0,0552
0,1372
1,7060
1,8764
0,0044
0,0004
0,0176
0,4720
0,0908
0,0152
4,3772
LECTIA
12. TESTUL NEPARAMETRIC 2
183
34 62 28
27 28 20
57 105 52
.
Solutie Cu notatiile din Aplicatia 2 din aceast
a lectie avem
e 1 = 34 + 62 + 28 = 124
N
e 2 = 75; N
e 3 = 214
N
e 1 = 34 + 27 + 57 = 118
N
e 2 = 196; N
e 3 = 52in = 34 + 62 + + 52 = 413:
N
e i N
e j avem tabelul:
Pentru numerele n1 N
j
i
1
2
3
si
35 59 30
21 35 18
61 101 52
1) = 2 2 = 4 grade de
Exemplul 12.10 Inteligenta unui copil se claseaza n 6 nivele: de la A foarte slaba, pna
la F foarte buna. S-au clasat 1725 copii la ntmplare alesi din 8 scoli numerotate de la 1
la 8 si s-au obtinut rezultate urmatoare:
LECTIA
12. TESTUL NEPARAMETRIC 2
nivelul
scoala
1
2
3
4
5
6
7
8
184
6
14
14
33
45
18
18 36 43 39 4
25 52 87 54 13
1
8 37
19 60 94 73 12
69 132 187 85 14
50 69 72 66 15
6 20
8
9 1
32 37 36 12
j
12.2
Rezumat
LECTIA
12. TESTUL NEPARAMETRIC 2
185
Fie acum 2 (0; 1) (de odicei se ia mic =0,05; 0,01; 0,001), un num
ar real dat pe
care l vom numi prag de semnicatie.
a aceea valoare pentru care P(2 < 2 )=
Fie 2 cuantila de ordin pentru v.a. 2 , adic
(vezi gura )
Testul 2 functioneaz
a astfel:
Daca valoarea calculata din selectie > 2 vom accepta ipoteza H cu pragul de
semnicatie , adic
a este foarte probabil ca ipoteza s
a e adev
arat
a.
Daca valoarea calculata 2 vom respinge ipoteza H cu pragul de semnicatie
.
Aceasta este testul 2 simplu (Cazul I)
Dac
a ns
a legea Q are s parametri de estimat tot din selectie, atunci va trebui s
a micsor
am
num
arul gradelor
a s
a avem r s 1 grade de libertate, deoarece apar
P de libertate cu s, adic
s + 1 leg
aturi:
pi = 1 si cele s leg
aturi de estimare.
12.3
Exercitii rezolvate
1. Se arunca 4 monede simultan de 160 de ori. Se observa de ecare data de cate ori a aparut
capul.
x =de cate ori poate sa apara capul,
0 1 2 3 4
cand aruncam o data cele 4 monede
f =de cate ori s-a realizat x in cele 160
5 35 67 41 12
de aruncari x in cele 160 de aruncari
Sa se testeze ipoteza H0 : monedele nu sunt falsicate, cu pragul de 5%.
Solutie Fie X v.a. care ia valorile x = de cate ori apare capul cand aruncam o data
cele 4 monede (sau de 4 ori aceeasi moneda). Avem ca:
LECTIA
12. TESTUL NEPARAMETRIC 2
186
x
4 x
4
P (X = x) = C4x 12 12
= 12 C4x :
Prin urmare frecventa absoluta sperata (daca presupunem H0 adevarata) de aruncari pentru x este 160P (X = x) : Obtinem deci urmatorul tabel:
x
0
1
2
3
4
P (X = x)
1/16 4/16 6/16 4/16 1/16
Ei =fr. abs. sperata cand x = i
10
40
60
40
10
sperata cand x = i
Oi =fr. abs.
5
35
67
41
12
observata cand x = i
(Oi Ei )2
2,5
0,625 0,817 0,025 0,4
Ei
P
2
Folosim testul cu =5 clase-1 restrictie ( Oi = 160) =4 grade de libertate.
5
P
(Oi Ei )2
Avem deci 2calc =
= 4; 365 < 20;05 (4) = 9; 49: Prin urmare acceptam H0 cu
Ei
pragul de 95%.
i=1
LECTIA
12. TESTUL NEPARAMETRIC 2
187
P
Folosim testul 2 cu = 4 clase-2 restrictii( Oi = 500 si x = 1; 044 este impus prin
estimare)= 2 grade de libertate.
4
P
(Oi Ei )2
Avem deci 2calc = 5; 959 =
< 20;05 (2) = 5; 99: Acceptam deci ipoteza H0 (reparEi
i=1
titia este binomiala) cu pragul de semnicatie 5%. Avem o oarecare neincredere deoarece 5,959
este prea aproape de valoarea critica 5,99. Se indica sa se repete experienta pentru mai multa
siguranta.
P (X = x) = e x!(2;3) ; x = 0; 1; 2; :::.
Calculam Ei = 100P (X = i) frecventa absoluta sperata (teoretica) a i goluri inscrise
de echipa in cele 100 de meciuri. Aici P (X = i) este probabilitatea ca echipaPsa inscrie i
goluri intr-un singur meci. Folosim testul 2 cu = 6 clase - 2 restrictii ( Oi = 100 si
x = 2; 3 este impus)=4 grade de libertate. Teoretic avem 9 clase: E0 ; E1 ;..., E7 ; E8 (i 8):
Cum E5 = 5; 4; E6 = 2; 1; E7 = 0; 7; E8 = 0; 2; cumulam clasele E5 ; E6 ; E7 si E8 intr-una
singura, desemnata tot cu E5 = 8; 4: Vom obtine tabelul:
x
0
1
2
3
4
5
Ei
10,0 23,1 26,5 20,3 11,7 8,4
Oi
14
18
29
18
10
11
(Oi Ei )2
1,6 1,126 0,236 0,261 0,247 0,805
Ei
5
P
(Oi Ei )2
Folosim deci testul 2 cu 4 grade de libertate. Cum 2calc =
= 4; 275 <
Ei
i=0
20;05 (4) = 9; 49 vom accepta ipoteza H0 : distributia golurilor urmeaza o lege Poisson cu
nivelul de incredere de 95%.
12.4
Exercitii
LECTIA
12. TESTUL NEPARAMETRIC 2
66
96
79
86
73
78
78
62
84
65
82
89
67
75
88
75
61
97
81
87
94
75
78
68
60
188
77
95
85
63
62
69
60
76
62
71
74
79
65
75
78
68
83
71
76
85
60
71
75
77
72
Folositi testul 2 pentru a decide cu pragul de =0,90 daca populatia este normala cu
media 75 si dispersia 625. Faceti acelasi lucru dar cu media si dispersia estimate din selectie.
mpartiti esantionul n zece intervale.
2. Se urmaresc accidentele mortale pe o portiune dintr-un drum national timp de 100 saptamni. Timp de 45 de saptamni nu a fost nici un accident mortal. n 29 de saptamni s-a
produs un accident, n 17 saptamni 2 accidente, iar n 9 saptamni au avut loc 3 accidente.
Folositi testele 2 si K-S pentru a vedea, cu pragul =0,90, daca distributia accidentelor
urmeaza modelul Poisson sau nu. Parametrul se estimeaza din selectie.
3. Se considera o prisma care are ca baze doua triunghiuri echilaterale B 1 si B 2 si ca fete
laterale A1 , A2 si A3 . Se arunca prisma de 500 de ori si se constata ca prisma a cazut de :
Y 1 = 111 ori pe fata A1
Y 2 = 113 ori pe fata A2
Y 3 = 118 ori pe fata A3
Z 1 = 81 ori pe fata B 1
Z 2 = 77 ori pe fata B 2 . Testati ipoteza dupa care cele 3 fete laterale si cele 2 baze au
aceeasi probabilitate 51 (pragul " = 0; 05 si " = 0; 01).
Indicatie. Avem Cazul I: r = 5 si p01 = p02 = = p05 = 15 . Gasim 2 =15,04. Analiznd
tabelul vedem ca trebuie sa respingem ipoteza pentru cele doua praguri.
4. Vrem sa testam ipoteza H dupa care o anumita v.a. X este gaussiana cu media 1,1 si
dispersia 0,2. S-au facut 1000 de probe independente care au condus la rezultatele urmatoare:
0,6 0,7 0,8 0,9
1
1,1 1,2 1,3 1,4 1,5
26 51 107 168 200 193 138 80 29
8
adica X a luat de 26 de ori o valoare mai mica dect 0,6 si de 51 de ori o valoare cuprinsa
n intervalul [0; 6; 0; 7), etc. Testati ipoteza H cu pragurile " = 0; 05, " = 0; 01 si " = 0; 001.
Indicatie Se partitioneaza R dupa cum indica problema. Se gaseste 2 = 13; 97. Folosim
tabelul distributiei 2 cu 10 1 = 9 grade de libertate. Ipoteza trebuie respinsa cu pragul 0,05
si 0,01, dar trebuie sa o acceptam cu pragul 0,001.
5. Se testeaza ipoteza dupa care culoarea ochilor este independenta de culoarea parului.
Pentru aceasta se introduc 2 caractere X si Y:
LECTIA
12. TESTUL NEPARAMETRIC 2
189
.
Indicatie Aici (a 1)(b
ipoteza nu este acceptabila.
Lectia 13
Alte teste neparametrice
13.1
Testul de concordant
a Kolmogorov-Smirnov
Acest test este din multe puncte de vedere mai bun dect testul 2 . El se aplic
a bine si
pentru esantioanele mici (n 25). Dac
a pentru testul 2 trebuia s
a grup
am datele, pentru
testul K-S nu este nevie dect s
a calcul
am functia de repartitie empiric
a asociat
a selectiei
efectuate. El poate utilizat bine si pentru a compara dou
a distributii.
Presupunem c
a populatia P are ca functie de repartitie teoretic
a functia FT (x). Efectu
am
un sondaj de volum n: fx1 ; :::; xn g si not
am cu FS (x) functia de repartitie empiric
a asociat
a
acestui sondaj (vezi Lectia 8). Pentru a m
asura deviatia functiei FT (x) de la functia FS (x) se
introduce statistica lui Kolmogorov: D=max jFS (x)-FT (x)j. Dac
a populatia P are ntr-adev
ar
x
repartitia FT (x) atunci se cunoaste distributia v.a. D (vezi Tabelul XIX). Pe prima coloan
a
n acest tabel avem volumul de selectie. Pe prima linie orizontal
a avem 5 valori ale pragului
de semnicatie: =0,80; 0,85; 0,90; 0,95 si 0,99.
Tabelul XIX este construit pe baza teoremei lui A. N. Kolmogorov:
Teorema 13.1 Fie X o v.a., FT (x) functia ei de repartitie considerata continua si Fn (x) o
functie empirica de repartitie asociata unei selectii de volum n:fx1 ; :::; xn g; dintr-o populatie
cu v.a. X. Atunci avem relatia
lim P
n!1
Dp
n
= K() =
1
X
1
( 1)k exp
190
2k 2 2
(13.1)
LECTIA
13. ALTE TESTE NEPARAMETRICE
191
0.8
0.6
0.4
0.2
0.5
1.5
Fn (x)
LECTIA
13. ALTE TESTE NEPARAMETRICE
192
1
0
0
0
2
0
0; 08
0; 08
1
1
8
0; 25
0; 125
3
8
5
8
0; 5
0; 125
0; 75
0; 125
1
1
0; 92
1
0; 170 0
2
6
8
.
Prin urmare D=max jFS (x)-FT (x)j = 0; 170. Cuantila pentru = 0; 80 si n = 8 (din
Tabelul XIX) este D = 0; 358. Cum P(D< 0; 358)=0,80 rezult
a c
a putem accepta ipoteza c
a
populatia P este normal
a cu pragul de semnicatie 80% (deoarece 0,170<0,358).
Observatia 13.3 Acest test se poate aplica cnd avem de comparat doua distributii:
D = max jFS1 (x)-FS2 (x)j
etc.,unde cele doua functii empirice de repartitie care apar corespund celor doua distributii.
Exercitiul 13.4 Folositi testul K-S pentru exemplul 12.1
13.2
Fie X si Y dou
a variabile aleatoare. Vrem s
a test
am urm
atoarea ipotez
a:
H: X si Y au aceeasi lege de distributie.
Pentru aceasta consider
am un esantion de volum m al v.a. X:(X1 ; :::; Xm ) si un esantion
de volum n al v.a. Y:(Y1 ; :::; Y2 ). Consider
am acum sirul de m + n variabile aleatoare
(X1 ; :::; Xm ; Y1 ; :::; Yn ). Presupunem c
a ele sunt independente. Dac
a X si Y ar avea aceeasi
lege de distributie am putea amesteca oricum aceste variabile si rationamentele noastre nu
s-ar schimba la trecerea de la (X1 ; :::; Xn ) la (Y1 ; :::; Ym ).
Introducem urm
atoarea v.a. R. Facem cte o selectie de volum m din X: x1 ; :::; xm si
de volum n din Y: y1 ; :::; yn consider
am sirul de numere x1 ; :::; xm ; y1 ; :::; yn . Asez
am acum
aceste numere n ordinea cresc
atoare si nu ne intereseaz
a dect faptul c
a ele sunt din X sau
din Y. Vom nota o astfel de situatie sub forma: !=XXYXYYYXXXXYY. Aici m= num
arul
X-lor, adic
a m=7, n= num
arul Y-lor, adic
a n=6. n sirul ! cel mai mic num
ar din sirul
x1 ; :::; xm ; y1 ; :::; yn , este din (x1 ; :::; xm );urm
atorul n ordine cresc
atoare este tot din acest
sir,al treilea n ordine cresc
atoare este din (y1 ; :::; yn ),etc. Cel mai mare num
ar din ! este din
(y1 ; :::; yn ). Dac
a cumva xi1 = xi2 le asez
am unul dup
a altul n orice ordine, etc.
Vom numi secventa (lungime) n sirul ! orice subsir format numai din X sau numai din
Y. De exemplu n ! avem urm
atoarele secvente:
XX Y X YYY
XXXX YY
___ _ _ ____ _____ __
S1 S2 S3
S4
S5
S6
LECTIA
13. ALTE TESTE NEPARAMETRICE
193
1
m
Cm+n
2
m
Cm+n
s
[Cm
s 1
s 1
Cm
1 Cm 1 ; pentru 1 s m;
s 1
s
Cm
1 + Cn
P (R = 2m + 1) =
1
m
Cm+n
Cns 11 ]; pentru 1 s m;
Cnm 1 ; dac
a m < n;
P (R = r) = 0
n toate celelalte cazuri r
amase.
Se demonstreaz
a c
a statistica v.a. R este asimptotic
a (m; n mari) gaussian
a cu
M (R) = 1 +
S
a not
am cu
2mn
2mn (2mn m n)
; D(R) =
m+n
(m + n)2 (m + n 1)
R-M(R)
T = p
D(R)
(13.2)
(13.3)
Variabila T tinde c
atre o v.a. gaussian
a redus
a.
Un test de preg se construieste astfel:
Fie r cel mai mare ntreg x astfel nct F(x) .
Testul va : Respinge H()R r, unde R este valoarea efectiv
a a v.a. R obtinut
a
din sondaje (= num
arul secventelor). Pragul este si acest test este cel mai puternic pentru
acest prag.
Desigur c
a am putea construi si alte teste plecnd de la formula (13.3) n analogie cu
testele de semnicatie sau ca testul 2 . Pentru m si n mici se calculeaz
a direct F(x) dup
a
formulele (13.1), iar pentru m si n mari se foloseste (13.3).
LECTIA
13. ALTE TESTE NEPARAMETRICE
194
Exemplul 13.5 Se cntaresc 10 mere de doua calitati A si B si se gasesc urmatoarele rezultate (n grame):
A: 192 197 207 182 191
B: 212 201 209 214 203
Ne permit oare aceste rezultate sa respingem ipoteza H: greutatea unui mar urmeaza aceeasi
lege de distributie indiferent de calitatea lui A sau B (cu pragul =0,05)? Calculati probabilitea erorii de primul tip pentru acest test. Utilizati si aproximarea gaussiana si comparati
rezultatele.
m
= 252. S
a not
am
Solutie Aici avem m = n = 5; Cm+n
s 1 2
m
, pentru 1s5,
N(x)= Cm+n P(R=x)=225P(R=x). Avem N(2s)=2 C4
N(2s+1)=2C4s 1 C4s 1 , pentru 1s4 si N(x)=0 n celelalte cazuri. Deducem de
aici legea de distributie pentru v.a. R:
x
2 3 4 5 6 7 8 9 10
252 P(R=x) 2 8 32 48 72 48 32 8 2
C
aut
am cel mai mare x cu F(x)0,05, sau 252 F(x) 12; 60. Cum avem 252 F(x)=
N(i),
ix
g
asim c
a 252 F(2)=2; 252 F(3)=10; 252 F(4)=42.
Cel mai mare x este deci 3 si testul devine: Respinge H()R <3. Probabilitatea erorii de
10
primul tip pentru acest test este P(R3)=F(3)= 252
=0,0397. S
a utiliz
am acum aproximarea
gaussian
a estimnd M(R) si D(R) direct din selectie.
M (R) = 1 +
255
= 6:
5+5
2 5 5 40
= 2; 222:
10 9
R 6
2; 5
P (R 3; 5) = P p
p
= 0; 047
2; 222
2; 222
D(R) =
Avem c
a
S
a observ
am c
a rezulatele sunt comparabile chiar dac
a m si n si sunt mici.
n exemplul nostru !=XXXXYYXYYY, deoarece selectia ordonat
a este:
182 191 192 197 201 203 207 209 212 214
.
Avem deci 4 secvente. Cum R = 4 > 3 va trebui s
a accept
am ipoteza H cu pragul =0,05.
LECTIA
13. ALTE TESTE NEPARAMETRICE
13.3
195
Denitia 13.6 Fie X si Y doua v.a. Variabila aleatoare Y se zice stochastic superioara v.a.
X daca (8) z 2 R avem ca P(Y z)P(X z), cu inegalitate stricta cel putin pentru un
z = z1 . Presupunem ca avem alternativele:
sau X si Y au aceeasi lege
sau Y este stochastic superioar
a lui X.
Fie ipoteza H: X si Y au aceeasi lege. Ca si la testul secventelor construim sirul !=XXYX:::,
de exemplu !=XYXXYYXYY. Statistica lui Wilcoxon T este v.a. care are ca valoare T=
suma numerelor care arat
a locurile pe care le ocup
a X n sirul !. Aici avem T=1+3+4+7=15.
Testul este de forma: Respinge H()T t, unde t este valoarea lui T din selectie. Dac
aH
1
este vericat
a, P(T t)= C m nmultit cu num
arul probelor favorabile relatiei T t (pentru
m+n
m si n mici se poate calcula direct F(t) ). Aici lucr
am cu selectiile X1 ; :::;Xm ;Y1 ; :::;Yn . Dac
a
m si n sunt mari, T este aproape gaussian
a cu:
M (T ) =
m (m + n + 1)
2
D(T ) =
mn (m + n + 1)
12
(13.4)
Exemplul 13.7 Se ncearca un tratament mediacl nou asupra unui grup de persoane de aceesi
vrsta, bolnave grav cu o maladie de tip cardiac. S-a notat timpul (n ani) dupa care aceste
persoane tratate mai traiau nca, ct si timpul dupa care alte persoane de aceeasi vrsta,
bolnave de aceeasi boala, dar netratate, mai traiau. S-au obtinut urmatoarele rezultate:
Tratate: 1; 2 6; 3 6; 5 7; 8 11; 2 15; 6
Netratate: 0; 4 3; 5 4; 8 6; 7
Testati ipoteza H potrivit careia tratamentul nu prelungeste viata unui bolnav (prag 0,05).
Solutie Aplic
am testul lui Wilcoxon. X este v.a. care exprim
a durata de viat
a a unui
bolnav netratat si Y a unui bolnav tratat. Este clar c
a v.a. Y este stochastic superioar
a
v.a. X. Ordon
am cresc
ator sirul fx1 ; :::; xm ; y1 ; :::; yn g si g
asim !=XYXXYYXYYY. Aici
T=1+3+4+7=15. Avem m=4 si n=6. S
a num
ar
am cazurile favorabile conditiei T15. Un
caz l avem mai sus: (1, 3, 4, 7), adic
a am asezat ntr-un sir pozitiile lui X n !. Cazurile
favorabile vor : (1, 2, 3, 4), (1, 2, 3, 5), (1, 2, 3, 6), (1, 2, 3, 7), (1, 2, 3, 8), (1, 2, 3, 9), (1, 2,
4, 5), (1, 2, 4, 6), (1, 2, 4, 7), (1, 2, 4, 8), (1, 2, 5, 6), (1, 2, 5, 7), (1, 3, 4, 5), (1, 3, 4, 6), (1,
3, 4, 7) si (1, 3, 5, 6). Sunt n total 16 posibilit
ati favorabile. Num
arul tuturor posibilit
atilor
4
arul modurilor n care putem aseza patru litere X ntr-un sir de10
este C10 = 210 (= num
16
litere X si Y). Dac
a H ar adev
arat
a ar trebui s
a avem P(T15)= 210
=0,076. Prin urmare,
cum 0,076>0,05 trebuie s
a accept
am ipoteza H cu pragul 0,05 si trebuie s
a o respingem cu
pragul 0,1.
LECTIA
13. ALTE TESTE NEPARAMETRICE
13.4
196
Testul semnelor
Presupunem c
a avem dou
a dou
a v.a. X si Y denite pe aceeasi categorie de probe, astfel nct P(X=Y)=0. Vrem s
a test
am ipoteza: H: P(Y>X)P(X>Y) contra ipotezei K:
P(Y>X)<P(X>Y).
Pentru aceasta se fac n observatii independente (X1 ,Y1 ),..., (Xn ,Yn ) ale v.a. (X,Y). Se
noteaz
a cu V num
arul acelor cupluri (Xi ,Yi ) pentru care Yi <Xi . Testul este de forma:
Respinge H()V v, unde v este valoarea lui V din sondajul respectiv.
Dac
a H este adev
arat
a cea mai mare valoare posibil
a pentru P(V v) se obtine dac
a
1
presupunem c
a V satisface legea lui Bernoulli B n; 2 .
Exemplul 13.8 O rma vrea sa testeze un nou ingredient adaogat unei creme antisolare. Se
fac testari pe 7 voluntari si pe spatele ecaruia se aplica crema antisolara astfel: pe jumatatea
superioara se aplica crema veche, iar pe jumatatea inferioara se aplica crema cu ingredientul
respectiv. Se expun la soare cei 7 voluntari si se observa masura n care pielea lor se nnegreste.
Se obtine tabelul urmator:
Voluntarul nr. 1 2 3 4 5 6 7
crema veche 42 51 31 61 44 55 48
crema noua 38 53 36 52 33 49 36
.
Solutie Not
am cu Y v.a. corespunz
atoare nnegririi pielii cu vechea crem
a si cu X v.a.
pentru noua crem
a, deoarece se presupune c
a prin ad
aogarea ingredientului valorile lui X vor
n general mai mici dect cele ale lui Y. Avem n=7. Aplic
am testul semnelor. Num
arul
cuplurilor
a H este adev
arat
a V are o distributie
(X,Y) pentru care Y<X este V=2. Dac
B 7; 12 si deci
7
1 0
29
P (V 2) =
C7 + C71 + C72 =
= 0; 23 > 0; 1
2
128
13.5
Fie X, Y dou
a v.a. denite pe aceeasi ctegorie de probe. Fie Z=Y-X. Vrem s
a test
am ipoteza
H: Z este o variabil
a aleatoare simetric
a, adic
a are aceeasi lege ca si v.a. -Z, contra ipotezei
K: Z este stochastic superioar
a lui -Z. S
a observ
am c
a cele 2 ipoteze nu sunt contrare si deci
nu acoper
a gama de posibilit
ati.
LECTIA
13. ALTE TESTE NEPARAMETRICE
197
Pentru aceasta facem n observatii independente (X1 ,Y1 ),...,(Xn ,Yn ) ale v.a. (X,Y). Aranj
am apoi n ordinea cresc
atoare a modulelor lor diferentele Z=YX si nu retinem dect semnele
lor. G
asim de exemplu !=( + + + + +). Not
am cu W suma numerelor ce exprim
a
pozitia semnelor minus. n cazul nostru W=1+2+3+5=11. Testul are forma urm
atoare:
Respinge H()W w, unde w este valoarea v.a. W obtinut
a din sondaj.
Dac
a H este adev
arat
a, multimea
a celor 2n posibilit
ati pentru semnul este nzestrat
a
cu legea uniform
a (este unica lege probabilistic
a pe o multime nit
a de evenimente, care face
ca aceste evenimente s
a e egal probabile). Dac
a n nu este prea mare legea W se obtine prin
num
ararea direct
a a cazurilor favorabile. Dac
a n este mare W este aproximativ gaussian
a cu:
M (W ) =
n (n + 1)
n (n + 1) (2n + 1)
iD(W ) =
4
24
(13.5)
Exemplul 13.9 Reluam exemplul 13.6 si vrem sa-i aplicam testul Wilcoxon II (=0,1).
Ordon
am valorile v.a. YX n ordinea cresc
atoare a valorilor lor absolute: 2, 4, 5, 6,
9, 11, 12. G
asim sirul de semne !=( + + + + +). Suma indicilor cu semnul minus este
W=1+3=4. Num
arul cazurilor posibile este 27 =128. Aici w=4. Cazurile favorabile (W4)
sunt: (+ + + + + + +), ( + + + + + +), (+ + + + + +), (+ + + + + +), (+ + +
7
+ + +), ( + + + + +), ( + + + + +), adic
a 7. De aici avem c
a P(W4)= 128
=0,054.
Cu pragul 0,1 va trebui s
a respingem ipoteza H.
Observatia 13.10 Daca comparam rezultatul obisnuit cu acela din Exemplul 13.6 aparent
gasim o contradictie. Aceasta se explica deoarece n testul semnelor nu tinem seama dect
de numarul semnelor minus si nu de pozitia lor n sirul !. n testul lui Wilcoxon se tine
seama ca aceste semne sunt plasate la nceput, si nu oriunde n sirul !. Acest lucru face ca
valoarea V sa e n general mult mai mare dect valoarea W. De aici apare clar ca rezultatul
testului Wilcoxon II sr trebui sa e mai demn de crezut de rma dect rezultatul testului
semnelor. Comparatia dintre cele doua teste se face de obicei de la caz la caz si se interpreteaza
rezultatul potrivit situatiei particulare studiate. Evident ca aici, pentru rma, este convenabil
testul Wilcoxon II si nu testul semnelor, care nu pare concludent. n plus, n testul Wilcoxon
II se presupune ceva n plus de la nceput (K nu este aplternativa ipotezei H).
13.6
Exercitii
LECTIA
13. ALTE TESTE NEPARAMETRICE
198
LECTIA
13. ALTE TESTE NEPARAMETRICE
Anul
1
2
3
4
5
6
7
8
9
10
A
68,3
60,1
52,2
41,7
32,0
30,9
39,3
42,0
37,7
33,5
199
B Anul A
B
72,5 11 32,2 31,9
56,0 12 63,3 58,1
55,8 13 54,2 52,7
39,2 14 47,0 46,2
31,4 15 91,9 90,2
35,5 16 56,1 55,4
39,2 17 79,6 75,1
41,1 18 81,2 86,6
43,3 19 78,4 75,3
31,7 20 46,6 43,8
Sa se testeze cu testul semnelor, apoi cu testul Wilcoxon II ( =0,05) ipoteza: H: cele doua
zone melifere A si B sunt tot att de productive.
Indicatie. Fie X v.a. ce m
asoar
a greutatea mierii provenit
a din zona A si Y v.a. corespunz
atoare zonei B.
Testul semnelor Z=YX conduce la legea binomial
a B 20; 12 si deci
P(V 4)=0,00591 < 0,05
Lectia 14
Analiza dispersiei si analiza regresiei
14.1
Analiza dispersiei
X ni
1 X
Xi
Xij =
n 1is
n
1is
(14.2)
1jni
QA =
ni Xi
1is
QR =
1is
1jni
Xij
Xi
2
X =
2
1is
2
ni Xi
B X 2C
=B
Xij C
@
A
1is
1jni
ni Xi :
(14.4)
1in
Se stie c
a statistica QR / 2 se spune unei legi Pearson cu n
variabila aleatoare.
200
(14.3)
nX
s grade de libertate si c
a
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
Uij =
201
s grade de liberate
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
un nou tabel:
A1
50
46
30
38
42
36
44
52
A2
20
28
26
46
8
12
36
20
14
34
A3
24
30
32
22
36
42
32
14
12
28
21
18
18
202
A4
46
14
12
42
44
30
1) Folosim o analiz
a dispersional
a pentru a testa ipoteza H. Aici avem s=4, n1 =8,
n2 =10, n3 =13, n4 =6, n=8+10+13+6=37; n1 Z1 =338; n2 Z2 =244; n3 Z3 =188; nZ=n1 Z1 + +
n4 Z4 =1099.
P
P 2
2
2
Zij =38229, avem
ni Zi =34449, nZ =32640, deci QA =1809. Cum
Prin urmare
i;j
1i4
3
grade de libertate s
a ia o valoare
Probabilitatea ca o v.a. FisherSnedecor cu
33
asem
an
atoare lui W este inferioar
a lui 0,01. Prin urmare ipoteza H se respinge.
2) n acest caz s0 =3, n0 =n2 + n3 + n4 =29, Q0A =199; Q0R =3400 si W0 =0,76. Aceast
a
0
valoare a lui W este prea mic
a, deci ipoteza se accept
a n acest caz
14.2
Analiza regresiei
Fie X si Y dou
a variabile aleatoare si X1 ,...,Xn ,Y1 ,...,Yn v.a. de selectie de acelasi volum n.
Se pune problema de a studia legatura (dac
a exist
a) dintre cele dou
a v.a. X si Y numai din
analiza unor cupluri de selectie de tipul fx1 ; :::; xn g ; fy1 ; :::; yn g. Este posibil ca cele dou
a
M ((X X )(Y Y ))
cov(X;Y)
v.a. s
a nu e corelate, adic
a coecientul de corelatie XY = X Y =
s
a e
X Y
zero. Acest lucru nu nseamn
a c
a nu poate exista o relatie functional
a de forma F(X,Y)=0
ntre v.a. X si Y. Aceast
a egalitate poate s
a nu e determinist
a. Sau poate s
a e astfel,dar
noi s
a nu putem descrie matematic aceast
a functie de leg
atur
a. n Lectia 6 s-a ar
atat c
a
X si Y sunt legate ntre ele printro relatie liniar
a: Y=aX+b, sau X=cX+d, dac
a si numai
dac
a XY =1. De regul
a noi facem sondaje n urma c
arora estim
am coecientul de corelatie
printro formul
a empiric
a de forma:
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
XY
n
P
x
) (yi
(xi
i=1
203
y)
(14.5)
n x y
n
n
P
P
qP
xi
yi
(xi x
)2
i=1
i=1
x
=mx = n si y
=my = n , x =
, y =
n
XY se apropie de +1 sau de 1 putem spera ca X si
unde
Dac
a
nu, se continu
a investigatia prin analize mai ne.
S
a ncepem prin a examina urm
atorul exemplu:
qP
(yi y)2
.
n
Y s
a e corelate liniar. Dac
a
Exemplul 14.2 Ne intereseaza care este legatura ntre numarul de ore afectate de un student
de inteligenta medie studiului Analizei matemetice (lunar) si rezultatele obtinute de acesta la
examen. n urma unui sondaj efectuat pe 10 studenti sau obtinut urmatoarele rezultate:
Student
1
2
3
4
5
6
7
8
9
10
10
10
15
20
Dreapta de regresie
25
30
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
204
Se pune problema daca aceste puncte sunt foarte apropiate de o dreapta. Mai exact, sa
notam cu (xi ; yi ), i = 1; n valorile obtinute dintr-un sondaj pentru v.a. X si Y. Exista b0 ; b1 2
R astfel nct diferentele ei = yi b0 b1 xi sa e mici? Care sunt cei mai buni
b0 si b1 care sa faca acest lucru? Sau poate exista b0 ; b1 ; :::; bk astfel nct diferentele ei =
yi b0 b1 xi b2 x2i bk xki sa e mici pentru orice i = 1; n?
Denitia 14.3 Ecuatia
yi = 0 + 1 xi + ei ; i = 1; n
(14.6)
(14.7)
14.2.1
Dac
a vrem s
a aproxim
am yi 0 + 1 xi eroarea comis
a este ei , i = 1; n. Vom pune conditia
ca suma p
atratelor erorilor ei s
a e minim
a:
S=
n
X
e2i =
i=1
n
X
(yi
1 xi )2 = minim
a.
(14.8)
i=1
@S
=
@ 1
n
X
(yi
1 xi ) = 0
(14.9)
1 xi ) xi = 0
(14.10)
i=1
n
X
i=1
(yi
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
Not
am cu y = n
n
P
yi si cu x = n
i=1
n
P
205
xi .
i=1
b0 = y
(14.11)
b1 x
Dar b0 si b1 veric
a si (14.10):
n
X
y 1 xi
nb0
b1
i=1
n
X
x2i = 0
(14.12)
i=1
b1 =
n
X
y i xi
nxy
i=1
n
X
x2i
nx
i=1
(14.13)
Nu este greu de ar
atat c
a b1 se mai poate scrie sub form
a centrat
a:
b1 =
n
P
y) (xi
(yi
x)
i=1
n
P
(xi
x)2
cov (x; y)
2
x
(14.14)
i=1
Cu acest
a expresie a lui b1 venim n (14.11) si g
asim
b0 = y
n
X
i=1
(yi
y) (xi
x)
n
X
i=1
(xi
x)2 = y
x
cov (x; y)
2
x
(14.15)
14.2.2
Conditiile GaussMarkov sunt conditii naturale care se impun v.a. ei , i = 1; n. Prima conditie
cere ca media v.a. ei s
a e zero:
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
S
a observ
am c
a oricum
M (ei ) = 0;
pentru orice i = 1; n
n
P
n
P
ei =0, deci
206
(14.16)
i=1
i=1
Figura urm
atoare ne arat
a un caz n care nu are loc (14.16).
25
20
15
10
-4
-2
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
207
(14.17)
Denitia 14.4 Metoda celor mai mici patrate se spune ca este o metoda buna daca variabilele
aleatoare erori, ei , i=1, 2,..., n ndeplinesc cele trei conditii GaussMarkov (14.16), (14.17)
si (14.18).
14.2.3
M
asura deviatiei la metoda celor mai mici p
atrate
Am v
azut mai sus c
a S=
n
P
i=1
asoar
a deviatia adev
aratelor yi de la valorile estimate prin
e2i m
metod
a , ybi = b0 + b1 xi , deoarece ei = yi ybi . Cum nu se doreste ca m
asura deviatiei s
a
depind
a de unitatea de m
asur
a, se lucreaz
a cu alt
a m
arime, oarecum relativ
a.
n
P
M (b0 ) = 0
6
D(b0 ) = 2 6
4n
+P
n
i=1
x2
(xi
x)
7
7
5
2
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
n
X
D(b1 ) = 2
(xi
M (b1 ) = 1
208
x)2
(14.18)
i=1
Demonstratie Deoarece
n
P
(xi
i=1
n
X
(yi
x) = 0 rezult
a c
a
y) (xi
n
X
x) =
i=1
(14.19)
x)
yi (xi
i=1
b1 =
n
X
ci yi ; unde
(14.20)
i=1
x)
ci = (xi
n
X
(xi
x)
i=1
ci = 0
i=1
n
X
ci xi =
i=1
n
X
i=1
n
X
ci (xi
x) = 1 , de unde
i=1
1
i=1 (xi
c2i = Pn
x)2
n
X
ci M (yi ) = 0
i=1
ci + 1
i=1
i=1
c2i D(yi ) =
ci xi +
| {z }
=0
n
X
n
X
i=1
| {z }
Calcul
am acum D(b1 ):
D(b1 ) =
n
X
=1
n
X
i=1
c2i
2 = P
n
i=1
ci M (ei ) = 1
| {z }
(14.21)
=0
2
(xi
x)2
(14.22)
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
n
P
M (yi )
a c
a
= 0 + 1 x, rezult
M (b0 ) = M (y
b1 x) = 0 + 1 x
Calcul
am acum D(b0 ):
n
n
n
P
P
P
b0 = n 1 y i x ci y i =
(n
xM (b1 ) = 0
xci ) yi , deci
n
X
D(b0 ) =
n
xci
i=1
= 2
n
X
n
2
D(yi )
2n 1 xci + x2 c2i
i=1
deoarece
n
P
(14.23)
i=1
i=1
i=1
209
6
= 2 6
4n
+P
n
x2
x)
(xi
i=1
7
7
5
2
ci = 0.
i=1
@S
@ 1
b1 =
n general
n
P
i=1
ei 6= 0
n
P
= 0 c
a
yi x i
i=1
n
P
ei = y i
i=1
b1 x i
(14.24)
x2i
nlocuim n (14.25) pe yi cu 1 xi + ei si g
asim c
a
1
b1 =
n
P
i=1
n
P
i=1
De aici rezult
a c
a
x2i
+
x2i
n
P
ei xi
i=1
n
P
i=1
x2i
n
P
= 1 +
n
P
i=1
x2i
2
D(b1 ) =
=
n
2
P
n
P
x2i
x2i
2
i=1
i=1
ei x i
i=1
n
P
i=1
(14.25)
x2i
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
210
si c
a M(b1 )= 1 , deoarece M(ei )=0, pentru orice i = 1; n.
Corolarul 14.7 Cu formele de mai sus, rezulta din Teorema 14.6 ca b0 este un estimator
nedeplasat al parametrului 0 si ca b1 este un estimator nedeplasat al parametrului 1 .
Formulele (14.19) arat
a c
a D(b0 ) si D(b1 ) contin pe 2 care este necunoscut. De obicei 2
se estimeaz
a cu estimatorul nedeplasat (vericarea nu este simpl
a!)
2
s = (n
1)
n
X
e2i
(14.26)
i=1
14.2.4
Presupunem c
a avem modelul de regresie liniar
a: yi = 0 + 1 xi + ei , i = 1; n, unde ( yi ) si
(ei ) sunt v.a., iar 0 si 1 sunt considerati parametri statistici care au fost estimati mai sus
prin b0 si b1 .
Presupunem c
a acest model ndeplineste conditiile GaussMarkov. De asemenea facem
presupunerea c
a v.a. (ei ) au o distributie normal
a N(0, 2 ). Atunci rezult
a (vezi Lectia 4) c
a
2
(yi ) au o distributie normal
a N( 0 + 1 xi , ). Cum b0 si b1 sunt combinatii liniare de (yi )-uri
rezult
a c
a si ele sunt v.a. cu mediile
sipdispersiile date n formula (14.19).
Se poate ar
ata c
a v.a. bj j D(bj ) este o v.a. Student cu n 2 grade de liberate,
pentru j = 0; 1 (dac
a 0 6= 0).
Folosim acum teoria testelor de semnicatie si g
asim c
a intervalul
q
q
bj
D(bj )Tn 2;=2
bj + D(bj )Tn 2;=2
este un interval de ncredere pentru j , j=0,1, de (1)100 procente. Aici Tn 2 ; =2 este
cuantila de ordin =2 a distributiei Student cu n2 grade de libertate.
n lumina rezultatelor de mai sus vom studia pe scurt urm
atoarea situatie.
Fie X1 , X2 ,..., Xn variabile aleatoare gaussiene independente cu aceeasi dispersie 2 astfel
nct s
a existe dou
a constante a, b cu proprietatea: M(Xi )=a + bti , 1 i n.
Ca si mai sus (nlocuim pe Yi cu M(Xi )!) introducem urm
atoarele notatii:
n
t =
St2
1X
1X
ti ; X =
Xi
n i=1
n i=1
1X
=
ti
n i=1
2
1X 2
t =
t
n i i
t;
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
211
n
2
1X
1X
2
Xi X =
Xi X
n i
n i=1
1X
1X
=
ti t Xi X =
ti Xi tX
n i
n i
SX2 =
2
StX
1X
=
Xi
n i
b
a
bbti
2
S2t S2X
S2tX
S2t
2
= SX2
bbS 2
tX
este independent
a de statisticile b
a si bb. Se poate ar
ata de asemenea c
a n2 2tX se supune unei
legi Pearson (2 ) cu n2 grade de libertate. Aceast
a observatie ne permite s
a construim un
test de semnicatie si un nou tip de intervale de ncredere pentru parametrii a si b.
Mai mult, se poate ar
ata c
a statisticile
p 2
p
St bb b
n 2S2t bb b
T = q
=q
2
1
2
S2tX
S2t S2X
n 2 tX
si
p 2
p
a a)
n(n 2)S2t (b
a a)
St (b
U = rP q
=r
2
2
2
1
2
t2i S2t S2X
S2tX
St + t
n 2 tX
i
satisfac legea Student cu n2 grade de libertate. Si ele pot folosite pentru cei doi
parametri a si b.
Exemplul 14.8 Un biolog studiaza cresterea unei specii de plante, pe mai multe exemplare,
ntrun interval de timp dat. La nceputul perioadei planta avea (n mm) naltimea initiala t.
La sfrsitul perioadei ea a avut naltimea X. S-au facut 10 probe:
t 57 60 52 49 56 46 51 63 49 57
X 86 93 77 67 81 70 71 91 67 82
1) Gasiti estimatori punctuali pentru a, b si 2 .
2) Estimati naltimea unei plante la sfrsitul perioadei daca initial ea a avut 52 mm.
3) Dati pentru b un interval de ncredere de 95%.
LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
212
10
P
Solutie 1) Folosim formulele de mai sus si g
asim: n=10; nt=540; nX=785; t2i =29426;
i=1
P
P 2
ti Xi =42836; t=54; X=78,5; nS2t =266; nS2tX =446; nS2X =836,5. De aici se
Xi =62459;
i
g
aseste pentru b estimarea bb=1,677 si pentru a, b
a=12,06.
n2tX
2
Dar ntX =88,5. Folosim acum faptul c
a 2 se supune unei legi Pearson cu n2=8 grade
n2