Sei sulla pagina 1di 225

UNIVERSITATEA TEHNICA DE CONSTRUCTII

BUCURESTI

PROBABILITATI SI STATISTICA
Viorel PETREHUS, Sever-Angel POPESCU

BUCURESTI 2005

Cuprins
Cuvnt nainte

Probabilit
ati

1 Denitia probabilit
atii
1.1 Denitia clasic
a . . . . . . . . . . .
1.2 Denitia axiomatic
a a probabilit
atii
1.3 Probabilit
ati conditionate . . . . .
1.4 Rezumat . . . . . . . . . . . . . . .
1.5 Exercitii . . . . . . . . . . . . . . .
2 Variabile aleatoare simple
2.1 Denitie si propriet
ati . . . . .
2.2 Spatiul de probabilitate produs
2.3 Rezumat . . . . . . . . . . . . .
2.4 Exercitii . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.

2
2
3
6
9
10

.
.
.
.

14
14
19
20
21

3  Cmpuri de probabilitate

24

3.1 Variabile aleatoare pe  cmpuri de probabilitate


3.2 Media unei variabile aleatoare oarecare . . . . . .
3.3 Functia de repartitie
densitatea de probabilitate . . . . . . . . . . . . .
3.4 Integrala Stieltjes . . . . . . . . . . . . . . . . . .
3.5 Media si functia de repartitie . . . . . . . . . . .
3.6 Rezumat . . . . . . . . . . . . . . . . . . . . . . .
3.7 Exercitii . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .

25
27

.
.
.
.
.

30
32
33
37
39

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

CUPRINS

ii

4 Legi clasice
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10

43

Repartitia binomial
a . . . . . . .
Repartitia Poisson . . . . . . . .
Repartitia uniform
a. . . . . . . .
Repartitia Normal
a . . . . . . . .
Repartitia exponential
a negativ
a
Repartitia Gamma . . . . . . . .
Repartitia X2 (hi p
atrat) . . . . .
Repartitia Student . . . . . . . .
Rezumat . . . . . . . . . . . . . .
Exercitii . . . . . . . . . . . . . .

5 Legi limit
a
5.1 Legea numerelor mari . .
5.2 Teoreme limit
a central
a.
5.3 Rezumat . . . . . . . . .
5.4 Exercitii . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

43
44
46
46
51
51
53
54
55
56

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

60
61
63
68
69

6 Dependenta ntre variabilele aleatoare


6.1
6.2
6.3
6.4

Coecientul de corelatie . . . . .
Variabile aleatoare bidimensionale
Functia de repartitie conditionat
a
Distributia sumei si ctului . . . .
6.4.1 Distributia sumei . . . . .
6.4.2 Distributia ctului . . . .
6.5 Distributia Student . . . . . . . .
6.6 Distributia Snedecor-Fisher . . .
6.7 Exercitii . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

72
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

72
74
79
81
81
82
82
84
85

7 Procese aleatoare
89
7.1 Procese Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2 Procese Markov discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.3 Procese de nastere si moarte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.3.1 Model de asteptare cu o singur
a statie de deservire si un num
ar mare
de unit
ati ce au nevoie de serviciile statiei
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.3.2 Model de asteptare cu o singur
a statie
iar num
arul de unit
ati care au nevoie de serviciile statiei este limitat la
o valoare dat
a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

CUPRINS
7.3.3

Model de asteptare cu n
deservite (1<n<N) . . .
7.4 Procese aleatoare stationare . .
7.5 Exercitii . . . . . . . . . . . . .

II

iii
statii de
. . . . .
. . . . .
. . . . .

deservire si
. . . . . . .
. . . . . . .
. . . . . . .

cu N
. . .
. . .
. . .

unit
ati ce
. . . . . .
. . . . . .
. . . . . .

trebuie
. . . . . 99
. . . . . 99
. . . . . 102

Statistic
a

106

8 Statistica descriptiv
a
107
8.1
Statistica unei variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.2 Statistica a dou
a variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.3 Exercitii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9 Statistici. Estimarea parametrilor
9.1 Principiul verosimilit
atii maxime . . . . . . . . . . . . . . . . . . . . . .
9.2 Metoda momentelor (K. Pearson) . . . . . . . . . . . . . . . . . . . . . .
9.3 Exercitii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

118
125
129
130

10 Intervale de ncredere
10.1 Intervale de ncredere pentru medie . . . . . . . .
10.1.1 Dispersia este cunoscut
a. . . . . . . . . .
10.1.2 Dispersia este necunoscut
a . . . . . . . .
10.2 Intervale de ncredere pentru dispersie . . . . . .
10.3 Intervale de ncredere pentru ctul a dou
a dispersii
10.4 Intervale de ncredere n cazul unor selectii mari .
10.5 Rezumat . . . . . . . . . . . . . . . . . . . . . . .
10.6 Exercitii rezolvate . . . . . . . . . . . . . . . .
10.7 Exercitii . . . . . . . . . . . . . . . . . . . . . . .

132
133
134
135
136
137
138
139
141
142

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

11 Ipoteze statistice. Teste statistice


144
11.1 Ipoteze si testarea lor
. . . . . . . . . . . . . . . . . . . . . . . . . . . 144
11.1.1 Testul Z privind media unei populatii normale cu dispersia cunoscuta  2 146
11.1.2 Testul T privind media unei populatii normale cu dispersia estimata
prin estimatorul nedeplasat S 02 . . . . . . . . . . . . . . . . . . . . . . 152
11.1.3 Test pentru proportia de succese . . . . . . . . . . . . . . . . . . . . . 154
11.1.4 Testul T pentru compararea a dou
a esantioane . . . . . . . . . . . . . 155
11.2 Tipuri de erori. Reguli de decizie . . . . . . . . . . . . . . . . . . . . . . . . . 156
11.3 Puterea unui test statistic . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
11.4 Rezumat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.5 Exercitii rezolvate (mai dicile) . . . . . . . . . . . . . . . . . . . . . . . . . 166
11.6 Exercitii propuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

CUPRINS
12 Testul neparametric 2
12.1 Principiul testului 2 . . . . . . . . . . . .
12.1.1 Teste asupra formei unei distributii
12.1.2 Teste de independent
a . . . . . . .
12.1.3 Teste de omogenitate . . . . . . . .
12.2 Rezumat . . . . . . . . . . . . . . . . . . .
12.3 Exercitii rezolvate . . . . . . . . . . . . .
12.4 Exercitii . . . . . . . . . . . . . . . . . . .

iv

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

13 Alte teste neparametrice


13.1 Testul de concordant
a Kolmogorov-Smirnov . . . . .
13.2 Testul lungimilor (secventelor) . . . . . . . . . . . .
13.3 Testul lui Wilcoxon I (cazul observatiilor necuplate)
13.4 Testul semnelor . . . . . . . . . . . . . . . . . . . . .
13.5 Testul lui Wilcoxon II (cazul observatiilor cuplate) . .
13.6 Exercitii . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

14 Analiza dispersiei si analiza regresiei


14.1 Analiza dispersiei . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.2 Analiza regresiei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.2.1 Metoda celor mai mici p
atrate (C. F. Gauss) . . . . . . . . . .
14.2.2 Conditiile GaussMarkov pentru metoda celor mai mici p
atrate
14.2.3 M
asura deviatiei la metoda celor mai mici p
atrate . . . . . . .
14.2.4 Intervale de ncredere si teste pentru 0 si 1 . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.

174
174
179
179
180
184
185
187

.
.
.
.
.
.

190
190
192
195
196
196
197

.
.
.
.
.
.

200
200
202
204
205
207
210

Cuvnt nainte
Cursul de fata a fost scris n perioada 1996-1997 de c
atre Viorel Petrehus (partea I, probabilit
ati) si Sever-Angel Popescu (partea a II-a, statistic
a) pentru studentii anului II din
Universitatea Tehnic
a de Constructii Bucuresti si a ap
arut n 1997 multiplicat n atelierele
universit
atii. El a fost gndit n 14 lectii, cte una pe s
apt
amn
a, pe parcursul unui semestru.
Fiecare lectie se ncheie cu exercitii.
Autorii sunt recunosc
atori tuturor celor care au contribuit cu observatiile lor la buna
organizare a materialului prezentat.
Autorii

Partea I
Probabilit
ati

Lectia 1
Denitia probabilit
atii
1.1

Denitia clasic
a

Probabilitatea a fost privit


a e dintr-un punct de vedere psihologic ca m
asurnd gradul de
siguranta al observatorului relativ la producerea sau neproducerea unui fenomen, e statistic
ca frecventa de aparitie a unui fenomen ntr-un num
ar mare de experimente independente.
Din punct de vedere clasic, denitia care s-a dovedit cea mai ecient
a n calcule a fost aceea
care a plecat de la conceptul de egal
a posibilitate. Acest lucru nseamn
a c
a num
arul de
posibilit
ati ntr-un experiment este nit si toate posibilit
atile au aceeasi sans
a.
Probabilitatea unui eveniment care const
a din mai multe asemenea posibilit
ati este raportul dintre num
arul cazurilor favorabile si num
arul cazurilor posibile. Utilizarea acestei
denitii presupune c
a ntr-un fel sau altul putem num
ara st
arile posibile si pe cele favorabile.
Exemplul 1.1 Se arunca un zar de doua ori.Sa se determine probabilitatile evenimentelor:
a) Suma celor doua zaruri este 6.
b) Ambele zaruri au acelasi numr.
Solutie. Cazurilor posibile in cele dou
a situatii sunt (1,1), (1,2), ... (6,6), n num
ar de 36.
Pentru punctul a) numai cazurile (1,5), (2,4), (3,3), (4,2), (5,1) sunt favorabile. Probabilitatea
este deci
nr: cazuri f avorabile
5
p=
=
nr: cazuri posibile
36
Analog, probabilitatea celui de-al dolea eveniment este p=6/36=1/6.
Exemplul 1.2 Dintr-un pachet de 36 carti se extrag trei la ntmplare. Care este probabilitatea ca cel putin o carte sa e as?
3
=7140. Num
arul cazurilor favorabile este
Solutie. Num
arul cazurilor posibile este C36
un as

doi asi

trei asi

z }| { z }| { z }| {
2
1
4  C32
+ C42  C32
+ C43  1 = 2180
2

TII
LECTIA
1. DEFINITIA
PROBABILITA

Probabilitatea este deci p = 2180=7140  0; 30532::


n exemplul urm
ator vedem ct de dicil este uneori s
a num
ar
am cazurile posibile sau
cazurile favorabile.
Exemplul 1.3 O persoana scrie n scrisori catre n persoane distincte, le pune n n plicuri si
apoi scrie adresele la ntmplare. Care este probabilitatea ca cel putin o scrisoare sa ajunga la
destinatarul potrivit?
Num
arul cazurilor posibile de a scrie adresele este n!. Enumerarea cazurilor favorabile
este mai dicil
a. Dup
a o mic
a dezvoltare a calculului probabilit
ailor se poate rezolva elegant
aceat
a problem
a (exercitiul 5).
Exemplul 1.4 Care este probabilitatea ca lund un punct la ntmplare n patratul [0,1][0; 1]
el sa e deasupra bisectoarei y=x?
n acest caz num
arul cazurilor posibile si favorabile este innit si denitia clasic
a nu se
mai aplic
a.

1.2

Denitia axiomatic
a a probabilit
atii

n general evenimentele se exprim


a prin propozitii. Propozitiile obtinute prin operatiile logicii
matematice (sau,si,non), ntre propozitii care exprim
a evenimente, exprim
a la rndul lor alte
evenimente. n cele ce urmeaz
a probabilitatea este denit
a pe o multime
de evenimente
care odat
a cu evnimentele A si B contine si evenimentele urm
atoare exprimate prin operatiile
logice sau, si, non:
A^B
A si B
A_B
A sau B
A
non A
1
evenimentul sigur
0 evenimentul imposibil
De asemenea, presupunem c
a au loc urm
atoarele relatii:
a)Comutativitatea
A^B =B^A A_B =B_A
b)Asociativitatea

c)Distributivitatea

A _ (B _ C) = (A _ B) _ C
A ^ (B ^ C) = (A ^ B) ^ C
A ^ (B _ C) = (A ^ B) _ (A ^ C)
A _ (B ^ C) = (A _ B) ^ (A _ C)

TII
LECTIA
1. DEFINITIA
PROBABILITA

d) Absorbtia
e)Legile lui Morgan

(A \ B) [ A = A

(A [ B) \ A = A

A_B =A^B

A^B =A_B

f)Evenimentele 1 si 0 se caracterizeaz
a prin

0 ^ A = 0; 0 _ A = A
1 ^ A = A; 1 _ A = 1
g)Evenimentul non A sau contrarul lui A are propriet
atile:
A^A=0 A_A=1
Remarc
am c
a aceste relatii sunt adev
arate dac
a A; B;.. sunt propozitii, iar 0 este propozitia totdeauna fals
a si 1 este propozitia totdeauna adev
arat
a.
O multime de evenimente cu propriet
atile de mai sus se numeste cmp de evenimente sau
algebr
a de evenimente sau algebr
a Boole. Relatiile de mai sus nu sunt independente, deci nu
formeaz
a un set minimal de axiome pentru algebrele Boole. Pe de alt
a parte ele implic
a alte
atoarea teorem
a a lui Stone descrie asemenea
relatii importante, ca de exemplu A = A. Urm
cmpuri de evenimente prin submultimi.
Teorema 1.5 (Stone)Fie M o multime de evenimente cu proprietatile de mai sus. Atunci
exista o multime X si o submultime
 P (X) cu proprietatile :
1); 2
; X 2

2)A,B2
) A [ B 2

3)A,B2
) A B 2

si o bijectie  : M !
astfel ca:
a)(A _ B) = (A) [ (B)
b)(A ^ B) = (A) \ (B)
c)(A) = (A)
(0) = ; (1) = X
Teorema arat
a c
a n esenta orice cmp de evenimente poate reprezentat prin submultimi
ale aceleiasi multimi X. Operatiei si ntre evenimente i corespunde intersectia submultimilor,
operatiei sau i corespunde reuniunea, negatiei i corespunde complementara, evenimentul
sigur corespunde multimii totale X, iar evenimentul imposibil corespunde cu multimea vid
a.
Denitia 1.6 O multime
 P (X) cu proprietatile 1,2,3 din teorema lui Stone se numeste
clan, algebra de evenimente sau cmp de evenimente. Uneori o vom numi algebra de multimi.

TII
LECTIA
1. DEFINITIA
PROBABILITA

Propozitia 1.7 Fie


 P (X) un
T
S cmp de evenimente.
Ai 2

Ai 2
si
a) Daca A1 ; A2 ; :::An 2
atunci
i=1::n

i=1:n

b) Daca A2
atunci A 2
:

Demonstratie. b) A = X A si din proprietatile 1 si 3 ale algebrei de multimi rezult


a
A 2
: a)Dac
a A si B sunt n
atunci A \ B = A [ B 2
conform cu proprietatea 2 a
algebrei de multimi si punctul b). Prin inductie rezult
a acum usor si a).
Vedem c
a n general un num
ar nit de operatii de intesectie, reuniune,diferenta sau complementar
a cu multimi din
are ca rezultat tot o multime din
: Vom deni acum probabilitatea.
Denitia 1.8 Fie
 P (X) un cmp de evenimente. Se numeste probabilitate pe
; o
functie p:
! R cu proprietatile:
1) p(A)2 [0; 1] pentru oricare A2

2) p(A [ B) = p(A) + p(B) daca A \ B = ;


3) p(;) = 0 p(X) = 1
Tripletul (X;
; p) l vom numi cmp de probabilitate.
Teorema 1.9 Fie (X;
; p) un cmp de probabilitate. Atunci:
1) p(A) = 1 p(A)
2) Daca A1 ; A2 ; :::An sunt n
si Ai \ Aj = ; pentru orice i si j atunci
p(

Ai ) =

i=1::n

n
X

p(Ai )

(1.1)

3) p(A [ B) = p(A) + p(B) p(A \ B) A si B neind neaparat disjuncte.


4) A  B implica p(A)  p(B):

Demonstratie. 1) X = A [ A ; A \ A = ;; deci 1 = p(X) = p(A) + p(A)
2) Pentru n=2 armatia rezult
a din denitia probabilit
atii, pe urm
a se procedeaz
a prin
inductie.


3) S
a privim evenimentele ca multimi. Atunci A[B = (A\ B)[(B
\ A)[(A\B),
reuniune



disjunct
a, deci p(A[B) = p(A\ B)+p(B \ A)+p(A\B): De asemenea A = (A\ B)[(A\B)
 + p(A \ B) si prin urmare p(A \ B)
 = p(A) p(A \ B). Analog
deci p(A) = p(A \ B)

p(B \ A) = p(B) p(A \ B). Punnd aceste valori n expresia precedent
a pentru p(A [ B)
se obtine punctul 3).
 [ A (disjuncte) ) p(B) = p(B \ A)
 + p(A)  p(A).
4) A  B ) B = (B \ A)
Observatia 1.10 Datorita formulei (1.1) probabilitatea p se mai numeste nit aditiva.

TII
LECTIA
1. DEFINITIA
PROBABILITA

Exemplul 1.11 Se arunca doua zaruri. Pot apare toate perechile de fete (i,j) cu 1  i  6
si 1  j  6, n numar de 36. Fie X multimea acestor perechi. Fie
= P (X) si p :
! R
de elemente din A
denita prin p (A) = numar
. Functia p denita n acest fel este o probabilitate n
numar de elemente din X
sensul denitiei anterioare. Numarul de elemente din X reprezinta numarul cazurilor posibile,
iar numarul de elemente din A reprezinta numarul cazurilor favorabile. In acest fel denitia
clasica a probabilitatilor este cuprinsa n denitia axiomatica de mai sus.
Acum putem s
a d
am o solutie pentru problema pus
a n exemplul 4.
Exemplul 1.12 Fie X=[0,1][0,1]. Fie
 P (X) formata din submultimile lui X cu frontiera formata dintr-un numar nit de curbe de clasa C 1 pe portiuni (adica ecare curba poate
avea cel mult un numar nit de puncte unde sa nu e cu derivata continua). Se verica usor
ca
este o algebra de mu`ltimi. Denim acum probabilitatea prin
p(A) =

aria(A)
aria(X)

pentru A 2

Este clar ca p astfel denita satisface conditiile din denitia axiomatica a probabilitatii. In
raport cu aceasta probabilitate evenimentul din exemplul 4 este reprezentat prin A={(x; y) 2
X j y > x} pentru care p(A) = 1=2. Asemenea probabilitati n care X este o submultRime n
f ()d
R, R2 ; R3 , unde
este este formata din submultimi cu arie ale lui X, iar p (A) = R A f ()d
X
se numesc probabilitati geometrice. Functia f n aceasta denitie se mai numeste pondere sau
densitate si trebuie sa e positiva.

Diverse tipuri de guri pentru care este denit


a probabilitatea geometric
a

1.3

Probabilit
ati conditionate

Fie (X,
;p) un cmp de probabilitate, B n
, p(B)> 0:

TII
LECTIA
1. DEFINITIA
PROBABILITA

Denitia 1.13 Denim pB :


! R (sau p( jB)) prin
p(AjB) = pB (A) =

p(A \ B)
p(B)

(1.2)

si o numim probabilitatea lui A conditionat


a de B.
Teorema 1.14 n conditiile denitiei de mai sus pB este o probabilitate si n plus p(A\B) =
p(B)  pB (A).
Demonstratie. Deoarece ;  A \ B  B atunci 0  pB (A)  1: De asemenea pB (;) = 0
si pB (X) = 1 sunt evidente. Dac
a A1 \ A2 = ; atunci si (A1 \ B) \ (A2 \ B) = ;, deci
p((A1 [ A2 ) \ B)
p((A1 \ B) [ (A2 \ B))
=
p(B)
p(B)
p(A1 \ B) + p(A2 \ B)
=
= pB (A1 ) + pB (A2 )
p(B)

pB (A1 [ A2 ) =

Denitia 1.15 Spunem ca doua evenimente A si B sunt independente daca p(A \ B) =


p(A)  p(B), altfel spus daca p (A) = pB (A).

Propozitia 1.16 Daca A si B sunt independente atunci si perechile de evenimente (A,B),

B)
sunt independente.
(A,B),
(A,

Demonstratie. Prin denitie p(A \ B) = p(A)p(B): Deoarece A = (A \ B) [ (A \ B)
(reuniune disjunct
a), avem
 = p(A)p(B) + p(A \ B)

p(A) = p(A \ B) + p(A \ B)
de unde rezult
a
 = p(A)
p(A \ B)

p(A)p(B) = p(A)(1


p(B)) = p(A)p(B)

: Analg se demonstreaz
a independenta si n celelalte cazuri.
n mod analog se deneste independenta mai multor evenimente:
Denitia 1.17 A1 ; A2 ; :::An sunt independente daca pentru orice k n si orice evenimente
Ai1 ; Ai2 ; ::Aik dintre cele A1 ; ::An date avem
p(Ai1 \ Ai2 \ ::Aik ) = p(Ai1 )p(Ai2 )::p(Aik ):
Analog cu propozitia anterioar
a se poate demonstra si

(1.3)

TII
LECTIA
1. DEFINITIA
PROBABILITA

Propozitia 1.18 Daca evenimentele A1 ; A2 ; ::An sunt independente atunci si evenimentele


A1 ; A2 ; ::An sunt independente (orice combinatie de Ai sau complementare).
Demonstratia este l
asat
a ca exercitiu.
Denitia 1.19 Spunem ca evenimentele A1 ; A2 ; ::An formeaza o partitie a lui X daca
1) [ Ai = X
i=1::n

2) Ai \ Aj = ; pentru orice i 6= j:
Avem urm
atoarea

Propozitia 1.20 Fie (X;


; p) un cmp de probabilitate si partitia A1 ; ::An : Atunci pentru
orice B 2
avem
n
X
p(B) =
p(Ai )  p(BjAi )
(1.4)
i=1

Formula de mai sus se numeste formula probabilit


atii totale.
Demonstratie.
p(B) = p(B \ X) = p(B \ ( [ Ai )) = p( [ (B \ Ai )) =
i=1::n
i=1::n
Pn
Pn
p(B
\
A
)
=
p(A
)p(B)
i
i
i=1
i=1

(1.5)

Q.E.D.
Formula urm
atoare, numit
a formula lui Bayes, ne d
a probabilitatea ca dup
a ce stim c
a
un eveniment ce poate apare din mai multe cauze s-a realizat, acesta s
a se realizat dintr-o
cauz
a anume. Enuntul precis este:
Propozitia 1.21 (Bayes)Fie (X;
; p) un cmp de probabilitate si A1 ; A2 ; ::An o partitie a
lui X. Fie B un eveniment cu probabilitate nenula. Atunci:

Demonstratie.

p(Ai )p(BjAi )
p(Ai jB) = Pn
j=1 p(Aj )p(BjAj )
p(Ai jB) =

(1.6)

p(B \ Ai )
p(Ai )p(BjAi )
= Pn
p(B)
j=1 p(Aj )p(BjAj )

conform formulei probabilit


atii totale.

Exemplul 1.22 n trei urne cu bile albe si negre avem compozitiile: 4+6, 2+8, 4+1. Se pun
toate bilele la un loc si se extrage o bila la ntmplare. Se constata ca este alba. Care este
probabilitatea ca ea sa provenit din urna a treia?

TII
LECTIA
1. DEFINITIA
PROBABILITA

Solutie. Fie Ai evenimentul care const


a n extragerea unei bile provenind din urna i si B
10
evenimentul care const
a n extragerea unei bile albe. Avem p(A1 ) = 25
p(A2 ) = 10
p(A3 ) =
25
5
(probabilitatea
evenimentului
A
este
propor
t
ional
a
cu
num
a
rul
bilelor
provenite
din
urna
i
25
4
2
4
i). Mai departe avem p(BjA1 ) = 10 p(BjA2 ) = 10 p(BjA3 ) = 5 : Probabilitatea care ni se
cere este p(A3 jB) si conform cu formula lui Bayes
p(A3 jB) =

10
25

4
10

10
25
10
25




4
5
2
10

5
25

4
5

2
5

Observatia 1.23 Daca alegerea unei bile s-ar facut dupa regulile: i)se alege la ntmplare
o urna; 2)din urna aleasa se extrage la ntmplare o bila; atunci am avea p(A1 ) = p(A2 ) =
p(A3 ) = 31 si tot formula lui Bayes conduce la p(A3 jB) = 47 .

1.4

Rezumat

Probabilitatea are o component


a psihologic
a n sensul de grad de ncredere si una practic
a
n sensul de frecventa de aparitie a unui fenomen ntr-un num
ar mare de experiente independente, dar pentru a putea introduce numere si a face calcule s-a dovedit util
a o denitie
axiomatic
a, asem
an
ator cum n geometrie dreapta se introduce axiomatic, independent de
multimea exemplelor practice. Punctele importante n acest demers sunt:
i) Reprezentarea evenimentelor prin algebre de multimi(Stone).
ii) Denitia probabilit
atii ca functie pe algebre de evenimente, cu propriet
ati asem
an
atoare
cu aria gurilor plane.
In dezvoltarea elementar
a a calculului cu probabilit
ati urm
atoarele trei puncte sunt esentiale:
iii) Notiunea de probabilitate conditionat
a si probabilitatea de aparitie simultan
a a evenimentelor independente.
iv) Formula probabilit
atii totale (1.4) .
v) Formula pentru probabilitatea cauzelor (1.6).
________________________________
FORMULE UTILIZATE FRECVENT :
f avorabile
a) p= nr:nr:cazuri
.
cazuri posibile
b) Denitia probabilit
atii conditionate p(AjB) = pB (A) = p(A\B)
(1.2);
p(B)
probabilitatea evenimentelor independente
Pn p(A \ B) = p(A)  p(B)(1.3)
c) Formula probabilit
atii totale p(B) = i=1 p(Ai )  p(BjAi )(1.4) .
i )p(BjAi )
d) Formula lui Bayes p(Ai jB) = Pnp(Ap(A
(1.6).
j )p(BjAj )
j=1

TII
LECTIA
1. DEFINITIA
PROBABILITA

1.5

10

Exercitii

1. O urna contine jetoane numerotate de la 1 la 8. Se extrag la ntmplare 3 jetoane. Care


este probabilitatea ca suma numerelor extrase sa e superioara sau egala cu suma numerelor
ramase?
Indicatie. Probabilitata este raportul dintre num
arul cazurilor favorabile si num
arul
cazurilor posibile. Sunt posibile C83 = 56 cazuri. Suma tuturor numerelor este 36, deci
suma celor extrase trebuie s
a dep
aseasc
a 18 pentru a caz favorabil. Acum se enumer
a pur
si simplu toate cazurile favorabile: (8,7,6), (8,7,5), etc.
2. Se aleg la ntmplare a,b,c n intervalul (0,1). Care este probabilitatea ca ecuatia de
gradul doi ax2 +2bx+c = 0 sa aiba radacini reale? (se considera (a,b,c)2 (0; 1)(0; 1)(0; 1)
iar probabilitatea este proportionala cu volumul).
p
Indicatie. (a,b,c)2 (0; 1)3 . Conditia de r
ad
acini reale este 4b2 4ac  0R sau
1

b

ac.
RR
3
da  dc  db =
Fie V=volumul lui (0; 1) si Vf =volumul cazurilor favorabile. Avem Vf =
Vf
R1 R1 R1
a V=1, se obtine imediat probabilitatea p = Vf =V .
da 0 dc pac db. Tinnd seama c
0

3. La un teatru sunt 2n persoane la coada la bilete. n persoane au bancnote de 500 lei iar
celelalte n persoane au bancnote de 1000 lei. Un bilet costa 500 lei. Care este probabilitatea
ca asezindu-se ntmplator la coada sa poata toate persoanele sa-si cumpere bilet, stiind ca
initial n casa nu este nici un leu si ecare persoana primeste restul de la casa?
Solutie Ca s
a num
ar
am asez
arile n care toti -si pot cump
ara bilete, reprezent
am ntr-un
sistem xOy pe cele 2n persoane prin puncte n 1,2,3..2n pe Ox. Fiec
arei asez
ari i asociem o
functie denit
a pe 0; 2n prin f(0)=0 si f(i)=f(i-1)+1 dac
a persoana i de la rnd are 1000 lei
si f(i)=f(i-1)-1 dac
a persoana i are 500 lei. Fiecare traiectorie ncepe n (0,0) si se termin
a n
(2n,0), deoarece de cte ori se urc
a se si coboar
a. Num
arul aranj
arilor la coad
a este n!n!Cn2n
a num
arul de alegeri ale locurilor de c
atre cei cu 500 lei (sau num
arul
unde Cn2n reprezint
traiectoriilor) iar n! reprezint
a num
arul de permut
ari celor cu 500 lei sau cu 1000 lei intre
ei. O traiectorie reprezint
a o asezare nefavorabil
a dac
a pentru un i avem f(i)=1. n acest caz
primul i cu proprietatea de mai sus reprezinta cel cu 1000 lei care nu mai poate primi rest de la
cas
a. Considernd simetrica acestei traiectorii de la acest i fata de y=1 obtinem o traiectorie
ce se termin
a n (2n,2) si are n+1 urcusuri si n-1 coborsuri. Num
arul traiectoriilor de acest
n+1
fel este Cn+1
,
deci
num
a
rul
cazurilor
nefavorabile
este
n!n!C
:
Probabilitatea
este deci
2n
2n
p=

n+1
n
n!n!C2n
n!n!C2n
1
=
n
n!n!C2n
n+1

4. Fie (X;
; p) un cmp de probabilitate si A1 ; A2 ; ::An evenimente din
: Sa se arate

TII
LECTIA
1. DEFINITIA
PROBABILITA

11

ca
p( [ Ai ) =
i=1::n

n
X

p(Ai )

i=1

i6=j6=k

i6=j

(1.7)

p(Ai \ Aj )

p(Ai \ Aj \ Ak ) +

+::: + ( 1)n 1 p(A1 \ A2 \ :: \ An )


(formula lui Poincar).
Indicatie. Formula a fost demonstrat
a pentru n=2 n cadrul lectiei. Presupunem prin
inductie c
a este adev
arat
a pentru n. Fie B = [ Ai si Bi = An+1 \ Ai . Avem
i=1::n

p(

i=1::n+1

Ai ) = p(B [ An+1 )
= p(B) + p(An+1 ) p(B \ An+1 )
= (f ormula 1.7 ) + p(An+1 ) p( [ Bi )
i=1::n

= (f ormula 1.7 ) + p(An+1 )


= (f ormula 1.7 pt: n + 1)

(f ormula 1.7 pt: Bi )

5. O persoana scrie n scrisori catre n persoane distincte, le pune n n plicuri si apoi scrie
adresele la ntmplare. Care este probabilitatea ca cel putin o scisoare sa ajunga la destinatarul
potrivit? (problema concordantelor).
Indicatie. Fie Ak evenimentul ce const
a n faptul c
a persoana k primeste scrisoarea potriv(n 1)!
2
it
a. p(Ak ) = n! = 1=n. Exist
a Cn evenimente de tipul Ai \ Aj si ecare are probabilitatea
(n 2)!
(deoarece dou
a persoane primesc scrisorile potrivite iar celelalta n-2 persoane primesc
n!
scrisorile ntmpl
ator n (n 2)! feluri. Analog, exist
a Cn3 evenimente de tipul Ai \ Aj \ Ak
si ecare are probabilitatea (nn!3)! , etc. Aplicnd formula de mai sus rezult
a:
p = n
=

1
1!

1
n

Cn2 

(n

2)!
n!

1
1
+ + :::
2! 3!

+ Cn3 

(n

3)!
n!

+ :::

6. Doua persoane A si B s-au nteles sa se ntlneasca ntr-un anumit loc ntre orele 12
si 13. Persoana care vine prima asteapta 20 de minute si apoi pleaca. Daca ecare persoana
vine la ntmplare n acel loc, care este probabilitatea ca persoanele sa se ntlneasca?
Indicatie. Prima problem
a este cum reprezent
am toate posibilit
atile de ntlnire. Fie pe
axa x ora de sosire a primei persoane iar pe axa y ora de sosire a celei de a doua persoane.

TII
LECTIA
1. DEFINITIA
PROBABILITA

12

Toate variantele de sosire se reprezint


a deci prin produsul [12; 13]  [12; 13]. Conditia de
1
ntlnire este jx yj  3 ore. Admitnd c
a probabilitatea este proportional
a cu aria, g
asim
c
a aria zonei de ntlnire este 5/9 iar aria zonei de sosire este 1. Deci probabilitatea este 5/9.
7. Un magazin se aprovizioneaza de la trei fabrici A,B.C, cu un anumit produs, n proportie
de 30%,60%,10%. Proportia de articole defecte dintre cele achizitionate este de 2%,1%,5%,
pentru A, respectiv B si C. Daca un cumparator gaseste ca produsul achizitionat la magazin
este cu defectiuni, care este probabilitatea ca el sa provenit de la fabrica B?
Indicatie. Se aplic
a formula lui Bayes.
8. Intr-un circuit sunt legate n serie rezistentele R1 ; R2 si grupul de rezistente n paralel:
R3 ; R4 ; R5 . Probabilitatile de defectiune ale celor cinci elemente independente sunt: 0,1; 0,01;
0,05; 0,04; 0,1. Care este probabilitatea de ntrerupere a circuitului?
Indicatie. Fie Ak evenimentul care const
a n ntreruperea rezistentei Rk . Avem p(A1 ) =
0; 1 p(A2 ) = 0; 01 etc.Toate aceste evenimente sunt independente si ntreruperea circuitului
este: A1 [A2 [(A3 \ A4 \ A5 ). Se aplic
a formula lui Poincar si se tine seama c
a evenimentele
Ak sunt independente.
9. Trei tintasi nimeresc o tinta cu probabilitatile 0,7;0,8;0,9. Fiecare trage cte o lovitura.
Care este probabilitatea ca:
a) Toti trei sa nimereasca tinta?
b) Cel putin unul sa nimereasca tinta?
c) Unul singur sa nimereasca tinta?
Indicatie. Fie Ak evenimentul care const
a n faptul c
a tr
ag
atorul k nimereste. Avem
p(A1 ) = 0; 7; p(A2 ) = 0; 8; p(A3 ) = 0; 9 iar evenimentele A1 ; A2 ; A3 sunt independente.
La punctul a) se cere probabilitatea lui A1 \ A2 \ A3 care este produsul probabilit
atilor
p(A1 )  p(A2 )  p(A3 ). Analog se consider
a si celelalte cazuri.
10. Fie X={1,2,3,4} si
= P (X). Se deneste o probabilitate pe X astfel ca p(f1; 2; 3g) =
7=8, p (f2; 3; 4g) = 1=2, si p (f1; 4g) = 5=8: Sa se determine p (f1g) si p (f1; 3; 4g).
11. Intr-o urna se aa bile numerotate 0, 1, 2, ..9. Se extrag 3 bile la ntmplare, fara a
pune bila napoi. Se scrie numarul format din cele trei cifre n ordinea aparitiei. Care este
probabilitatea ca numarul sa se divida la 12? Dar daca extragerea se face cu punerea bilei
napoi?
12. Un grup format din 2n baieti si 2n fete este despartit n doua subgrupuri de acelasi
efectiv. Care este probabilitatea ca n ecare subgrup numarul de baieti sa e egal cu numarul
de fete.
13. Fie A1 ; A2 ; :::An evenimente independente. Care este numarul maxim de evenimente

TII
LECTIA
1. DEFINITIA
PROBABILITA

13

distincte care se poate obtine din A1 ; :::An prin aplicarea repetata a operatiilor si, sau, non?
14. Pe un segment AB se iau la ntamplare doua puncte C si D, astfel ca jACj < jADj.
Care este probabilitatea ca sa se poata forma un triunghi cu segmentele AC, CD, DB?
15. O urna contine 5 bile albe, 3 bile negre si 2 bile rosii iar alta urna contine 3 bile negre
, 2 bile albe si 5 bile rosii. Se extrage cte o bila din ecare urna. Care este probabilitatea ca
sa se extraga bile de aceeasi culoare?
16. Fie evenimentele A1 ; A2 ; ::An . Sa se demonstreze ca
p (A1 \ A2 \ ::: \ An )  p (A1 ) + p (A2 ) + ::: + p (An )

(n

1)

(inegalitatea lui Boole).


17. Un submarin lanseaza n torpile asupra unui vas. Daca ecare torpila are probabilitatea 12 de a lovi vasul, independent de celelalte torpile, care este numarul minim de torpile
ce trebuie lansate ca probabilitatea de a lovit vasul de cel putin una sa depaseasca 0,9?

Lectia 2
Variabile aleatoare simple
2.1

Denitie si propriet
ati

De ecare dat
a cnd aplic
am teoria probabilit
atilor subntelegem c
a exist
a o algebr
a de evenimente realizat
a ca o multime de submultimi ale unei multimi X, si, o probabilitate denit
a
pe acele evenimente, chiar dac
a X si algebra de evenimente nu sunt exprimate explicit. n
general informatia din X se extrage prin functii. n cele ce urmeaz
a, X este o multime pe care
avem denit
a o algebr
a de evenimente
si o probabilitate p.
Denitia 2.1 O functie f : X ! R se numeste variabila aleatoare ( pe scurt v.a.) daca
pentru orice (a; b)  R avem f 1 (a; b) 2
: O functie f : X ! C se numeste variabila
aleatoare daca Re(f ) si Im(f ) sunt variabile aleatoare reale.
n cele ce urmeaz
a variabilele aleatoare considerate iau un num
ar nit de valori. Asemenea
variabile aleatoare le vom numi simple. Fie v1 ; v2 ; ::vn valorile distincte ale lui f si e Ai =
f 1 (vi ). n aceste conditii variabila aleatoare se scrie
8
v1 dac
a x 2 A1
>
>
<
v2 dac
a x 2 A2
(2.1)
f (x) =
:::::
>
>
:
vn dac
a x 2 An

Este clar c
a denitia de mai sus este echivalent
a cu a spune c
a pentru orice valoare v rezult
a
c
a f 1 (v) 2
: Vom mai scrie Ai = ff = vi g; pi = p(Ai ) = p(f 1 (vi )) = p(f = vi ): Este
mai putin important din punctul de vedere al calculului cu probabilit
ati, care este multimea
Ai ; ct care sunt probabilit
atile p(Ai ); p(Ai \ Aj ) etc. Fiec
arei variabile aleatoare f i vom
asocia o diagram
a (notat
a tot f):

14

LECTIA
2. VARIABILE ALEATOARE SIMPLE

f=

15

v1 v2 v3 ::: vn
p1 p2 p3 ::: pn

Valorile v1 ; v2 ; ::vn sunt n general distincte iar evenimentele AS


a o
i ; i = 1; 2; ::n formeaz
Ai = X: Este clar c
a
partitie a lui X , adic
a Ai si Aj sunt disjuncte dac
a i 6= j si
i=1::n

p1 + p2 + :: + pn = 1: Putem considera si diagrame n care unele valori v coincid ntre ele ceea
ce ar corespunde denirii lui f prin (2.1) si unde am avea de exemplu v1 = v2 dar neap
arat
1
A1 \A2 = ;: n acest caz Ai nu mai este neap
arat f (vi ) dar A1 ; ::An formeaz
a nc
a o partitie,
pi = p(Ai ) si p1 + :: + pn = 1. De exemplu functia f k ia valorile (vi )k pe multimile Ai , deci
diagrama asociat
a este:
 k k

v1 v2 ::: vnk
k
f =
p1 p2 ::: pn

a unde unele valori din rndul de


iar dac
a v1 = v2 , k=2 atunci v12 = v22 si avem o diagram
sus coincid. Diagramele n care vi 6= vj pentru i 6= j le vom numi standard. Dat
a o variabil
a
aleatoare simpl
a, ca mai sus, denim:
P
P
Denitia 2.2 1)media lui f: M (f ) = ni=1 P
vi pi = ni=1 vi  p(f = vi )
2)momentul de ordin k: Mk (f ) (sau mk ) = ni=1 vik pi = M (f k )


Pn
k
k
3)momentul centrat de ordin k: k (f ) = i=1 (vi M (f )) pk = M (f M (f ))
P
4)dispersia: D(f ) =  2 (f ) = ni=1 (vi M (f ))2 pi = M ((f M (f ))2 ) = 2 (f ) p
P
5)functia caracteristica fc : R ! C sau 'f : R ! C, fc (t) = 'f (t) = ni=1 e 1vi t pi
6)functia de repartitie F : R ! R; F (t) = p(fx 2 Xjf (x) < tg):
Observatia 2.3 Daca pentru un i avem pi = 0 atunci valoarea corespunzatoare vi o putem
exclude din diagrama deoarece nu are nici o contributie la caracteristicile numerice ale lui
f. Despre doua v.a. f si g, pentru care multimea pentru care f 6= g are probabilitatea 0,
spunem ca ele coincid aproape peste tot (pe scurt a.p.t.). Ele au aceleasi diagrame standard
si aceleasi caracteristici numerice: medie, dispersie,.... Daca unei v.a. f i se asociaza doua
diagrame distincte, atunci denitiile de mai sus pentru medie, dispersie, momente, functie
caracteristica, dau acelasi rezultat, indiferent de diagrama folosita. Se poate demonstra acest
lucru usor comparnd valorile obtinute dintr-o diagrama cu cele date de diagrama standard
(exercitiu).
Vom nota n general cu fa < f < b} evenimentul f 1 (a; b) = fx 2 Xja < f (x) < bg 2

iar probabilitatea lui cu p(a < f < b). Analog vom nota evenimentele ce se obtin folosind
inegalit
ati de tipul ; ;etc.

LECTIA
2. VARIABILE ALEATOARE SIMPLE

16

Exemplul 2.4 ntr-o clasa s-au obtinut urmatoarele note: 5 de catre 8 elevi, 7 de catre 3
elevi, 8 de catre 5 elevi, 10 de catre 4 elevi. Functia nota ia valorile 5,7,8,10, iar probabilitatile
8
3
5
4
corespunzatoare sunt: 20
. Diagrama asociata functiei este:
20
20
20


5 7 8 10
nota
8
3
5
4
20

20

20

20

8
3
5
4
media notelor este M1 = 5  20
+ 7  20
+ 8  20
+ 10  20
= 7; 05
3
5
4
8
2
2
2
momentul de ordinul doi este M2 = 5  20 + 7  20 + 8  20
+ 102  20
= 53; 35
4
2 8
2 3
2 5
dispersia este D = (5 7; 05)  20 + (7 7; 05)  20 + (8 7; 05)  20 + (10 7; 05)2  20
= 3; 6475
p
i5t 8
i7t 3
i8t 5
i10t 4
functia functia caracteristica este fc (t) = e  20 + e  20 + e  20 + e  20 unde i =
1

Observatia 2.5 Media se poate numi centrul valorilor luate de o v.a. iar dispersia este
o masura a mprastierii valorilor acelei v.a. n jurul mediei. In afara de medie, celelalte
caracteristici se utilizeaza doar pentru v.a. reale.
Denitia 2.6 Doua variabile aleatoare reale, f si g denite pe acelasi cmp de probabilitate
X se numesc independente daca oricare ar intervalele (a,b) si (c,d) avem
p(f

(a; b) \ g 1 (c; d)) = p(f

(a; b))  p(g 1 (c; d))

Denitia independentei a dou


a v.a. simple se poate da n mai multe feluri asa cum rezult
a
din propozitia urm
atoare:
Propozitia 2.7 Fie (X;
; p) un cmp nit de probabilitate si f,g doua variabile aleatoare
simple cu valori reale. Urmatoarele armatii sunt echivalente:
1) f si g sunt independente
2) evenimentele fa < f < bg si fc < g < dg sunt independente pentru a; b; c; d 2 R
3) pentru orice v,u2 R evenimentele ff = vg si fg = ug sunt independente
4) pentru orice submultimi A,B din R, evenimentele ff 2 Ag si ff 2 Bg sunt independente
Demonstratia este l
asat
a ca exercitiu.
Observatia 2.8 Sub forma (3) cu u; v 2 C sau sub forma (4) cu A; B 2 C, din propozitia
anterioara, denitia independentei a doua v.a. simple se poate enunta si pentru v.a. cu valori
complexe.
Propozitia 2.9 Daca f; g : X ! C sunt v.a. simple independente iar F; G : C ! C atunci
F  f si G  g sunt independente.

LECTIA
2. VARIABILE ALEATOARE SIMPLE

17

Demonstratie. Avem:
p ((F  f = v) \ (G  g = u))


= p f 2 F 1 (v) \ g 2 G 1 (u)
= p(f 2 F 1 (v))  p(g 2 G 1 (u))
= p(F  f = v)p(G  g = u)
Q.E.D.
De exemplu (f

a)2 si (g

b)2 sunt independente pentru orice a si b.

Teorema 2.10 (proprietati ale mediei) Fie (X;


; p) un cmp de probabilitate nit si f; f1 ; f2 ; :::
variabile aleatoare pe X. Atunci:
1)f C (constant) ) M (f ) = C
2) = const ) M ( f ) = M (f )
3)M (f1 + f2 ) = M (f1 ) + M (f2 ) si de aici M (f1 + f2 + :: + fn ) = M (f1 ) + M (f2 ) + :: + M (fn )
, M (af + bg) = aM (f ) + bM (g) , si M (f M (f )) = 0, (a si b ind constante)
4) Daca f1 ; f2 sunt independente atunci M (f1 f2 ) = M (f1 )  M (f2 ).
5) f  0 ) M (f )  0.
6) f  g ) M (f )  M (g).
7) jM (f )j  max jf j.
Demonstratie. 1) si 2) sunt evidente.
3)Fie v1 ; v2 ; ::vn valorile lui f1 si Ai = f1 1 (vi ) iar u1 ; ::um valorile lui f2 si Bj = f2 1 (uj ):
Variabila aleatoare f1 + f2 ia valorile vi + uj pe evenimentele Ai \ Bj cu probabilit
atile
pij = p(Ai \ Bj ) = p(f1 = vi \ f2 = uj ): Avem acum
P
P
P
P
P
uj ni=1 pij =
pij + m
M (f1 + f2 ) = i=1::n;j=1::m (vi + uj )pij = ni=1 vi m
j=1
j=1
P
P
=
vi p(f1 = vi ) + uj p(f2 = uj ) = M (f1 ) + M (f2 )
Am folosit

Pm

Pm

p(Ai \ Bj ) = (ind disjuncte)


S
= p( j=1::m (Ai \ Bj )) = p(Ai \ ( j=1::m Bj )) =
p(Ai \ X) = p(Ai ) = p(f = vi )
Pn
si n mod analog
cealalt
a
sum
a
este
i=1 pij = p(f2 = uj ):
P
v
u
p(f
=
v
\
f
=(din independenta variabilelor aleatoare)
4)
M
(f
f
)
=
1
2 = uj ) P
1 2
i;j i j
Pi
P
= i;j vi uj p(f1 = vi )p(f2 = uj ) = i vi p(f1 = vi ) j uj p(f2 = uj ) = M (f1 )M (f2 )
5), 6), 7) sunt evidente.
Q.E.D.
p
j=1
S ij

j=1

Teorema 2.11 (proprietatile dispersiei). 1) f C a.p.t.(constant) , D(f ) = 0


2) D(af ) = a2 D(f ) a ind o constanta.
3) Daca f1 si f2 sunt independente atunci D(f1 + f2 ) = D(f1 ) + D(f2 )

LECTIA
2. VARIABILE ALEATOARE SIMPLE

18

P
Demonstratie. 1) D(f ) = (vi M (f ))2 p(f = vi ) si suma este zero numai dac
a vi = M (f )
pentru orice i cu pi 6= 0, adic
a f M (f ) a.p.t.
2) Avem
D(af ) = M ((af

M (af ))2 ) = M (a2 (f

M (f ))2 ) = a2 M ((f

M (f ))2 ) = a2 D(f )

3) n formulele de mai jos utiliz


am faptul c
a f1 si f2 independente implic
a (f1
2
(f2 b) sunt independente, precum si propriet
atile mediei:

a)2 si

D(f1 + f2 ) = M (((f1 + f2 ) M (f1 + f2 ))2 ) =


M (((f1 M (f1 )) + (f2 M (f2 ))2 ) =
2
M ((f1 M (f1 )) + (f2 M (f2 ))2 + 2M ((f1 M (f1 ))(f2 M (f2 ))) =
M ((f1 M (f1 ))2 ) + M ((f2 M (f2 ))2 ) + 2M (f1 M (f1 ))  M (f2 M (f2 )) =
|
{z
} |
{z
}
=0

=0

D(f1 ) + D(f2 )

Q.E.D.
O generalizare a punctului 3) este:
Propozitia 2.12 Fie f1 ; f2 ; ::fn variabile aleatoare independente doua cte doua. Atunci
D(f1 + f2 + ::: + fn ) = D(f1 ) + D(f2 ) + :: + D(fn )
Demonstratia este analoag
a celei pentru dou
a functii si e l
asat
a ca exercitiu.
Denitia 2.13 Daca f este o variabila aleatoare, expresia fpM (f ) se numeste deviatia stanD(f )

dard a lui f.

Se vede imediat c
a M ( fpM (f ) ) = 0 si D( fpM (f ) ) = 1:
D(f )

D(f )

Teorema 2.14 (proprietati ale functiei caracteristice) Fie fc functia caracteristica a variabilei aleatoare f. Atunci:
1) fc este continua (chiar uniform continua) pe R)
2) fc (0) = 1; jfc (t)j  1 pentru -1 < t < 1
p
3) Daca g=a  f + b; cu a si b constante, atunci gc (t) = e 1bt  fc (at)
4) Daca f1 si f2 sunt independente, atunci (f1 + f2 )c (t) = f1c (t)  f2c (t)
(k)
5) Mk (f ) = p 1 k fc (0)
1
( )
6) Daca f1c  f2c atunci f1 si f2 au aceleasi diagrame standard, adica f1 = f2 a.p.t.
p
P
Demonstratie. 1)fc este o sum
a nit
a de functii continue fc (t) =
pk e 1vk t deci este o
functie continu
a. Avnd
derivata m
a este
a.
p
p uniform continu
parginit
p a c
P
Pa rezult
1t( vk + )
1t
1t vk
1 t
2) gc (t) =
pk e
=e
=e
pk e
fc ( t):

LECTIA
2. VARIABILE ALEATOARE SIMPLE
3) fc (0) =

pk e

10vk

pk = 1 si jfc (t)j 

19
p

pk e

P
pk = 1
=

1vk t

4) Dac
a f1 si f2 sunt independente atunci eif1 si eif2 sunt independente.
Acum observ
am c
a

(f1 + f2 )c (t) = M (eit(f1 +f2 ) ) = M (eitf1  eitf2 ) = (ind indep.)


= M (eitf1 )M (eitf2 ) = f1c (t)  f2c (t)
P
P
a
5) fc0 (t) = i k pk vk eitvk si deci fc0 (0) = i k pk vk = iM1 (f ). Analog prin derivare succesiv
se obtine f (n) (0) = in Mn (f ).
P
P iu t
6) Avem, folosind diagrame reduse,
pk eivk t 
ql e l , unde vk sunt diferite ntre ele
si ul sunt diferite ntre ele. Dac
a nu se reduc toti termenii, adic
a pentru ecare
a existe l
Pk s
astfel ca pk = ql ; vk = ul atunci dup
a toate reducerile posibile egalitatea devine:
rs eiws t  0,
(1  s  m) unde rs sunt nenule , iar ws sunt diferite ntre ele. Derivnd de mai multe ori
expresia de mai sus si punnd t=0 n derivate g
asim:
8
r1 + r2 + ::: + rm = 0
>
>
<
r1 w1 + r2 w2 + ::: + rm wm = 0
::::::::::::::::
>
>
:
m 1
m 1
r1 w1 + r2 w2m 1 + :: + rm wm
=0
ceea ce nu se poate dect dac
a r1 = r2 = ::rm = 0. Contradictia obtinut
a arat
a c
a reducerea
are loc, deci f1 si f2 iau aceleasi valori, cu aceleasi probabilit
ati.
QED.

Denitia 2.15 Spunem ca n variabile aleatoare f1 ; ::fn sunt independente daca pentru orice
intervale I1 ; ::Ik ; si orice alegere fi1 ; ::fik , k n, rezulta ca evenimentele fi1 1 (I1 ); fi2 1 (I2 ) ;
::: ; fik 1 (Ik ) sunt independente.
Exercitiul 2.16
Daca variabilele aleatoare f1 ; ::fn sunt independente atunci
(f1 + f2 + :: + fn )c (t) = f1c (t)  f2c (t)  ::  fnc (t)

2.2

Spatiul de probabilitate produs

Fie (X1 ,
1 ; p1 ) si (X2 ;
2 ; p2 ) dou
a cmpuri de probabilitate nite. Atunci pe multimea
X = X1  X2 se poate deni o algebr
a de multimi astfel:

= fA  XjA este reuniune nit


a de elemente de forma A1  A2 ,
cu A1 2
1si A2 2
2 g
Tinnd

seama c
a
1 si
2 sunt algebre de evenimente, rezult
a c
a si
este. : Denim
p :
! R prin p(A1  A2 ) = p1 (A1 )  p2 (A2 ): Dac
a A este o reuniune disjunct
a de multimi

LECTIA
2. VARIABILE ALEATOARE SIMPLE

20

P
de forma [Aii  A2i atunci p(A)= p1 (A1i )  p2 (A2i ): Se demonstreaz
a c
a p este o probabilitate pe
iar cmpul (X;
; p) se numeste cmpul produs al cmpurilor (X1 ;
1 ; p1 ) si
(X2 ;
2 ; p2 ). n mod asem
an
ator se deneste produsul unui num
ar nit de cmpuri de probabilitate (X1 ;
1 ; p1 ); :: (Xn ;
n ; pn ). Spatiul total este X = X1  X2  ::Xn iar multimea de
evenimente se deneste prin A 2
, A este o reuniune nit
a de elemente de forma A1  A2
A3  :::  An cu Ai 2
i pentru orice i. Se arat
a c
a
este o algebr
a de evenimente pe care
se poate deni o probabilitate care pe evenimentele de forma A1  A2  ::  An are valoarea
p(A1  A2  ::An ) = p1 (A1 )  p(A2 )  ::  pn (An ). Este foarte usor de ar
atat c
a evenimentele
B1 = A1  X2  ::Xn
B2 = X1  A2  ::Xn
:::::::::
Bn = X1  X2  ::An
sunt independente(exercitiu). De asemenea urm
atoarele variabile aleatoare
pr1 (x1 ; x2 ; ::xn ) = x1
pr2 (x1 ; x2 ; ::xn ) = xn
::::::::::::::::
prn (x1 ; x2 ; ::xn ) = xn
numite proiectiile canonice ale lui X, sunt independente(exercitiu). De asemenea dac
a fk :
Xk ! R sunt variabile aleatoare atunci variabilele aleatoare Fk : X ! R denite prin
Fk (x1 ; x2 ; ::xn ) = fk (xk ) sunt independente(exercitiu).

2.3

Rezumat

Informatiile dintr-un spatiu probabilizat se extrag prin functii, numite variabile aleatoare.
In cazul variabilelor aleatoare ce iau un num
ar nit de valori (numite si variabile simple),
media este denit
a ntr-un mod analog cu media notelor la scoal
a. Dispersia e denit
a ca o
m
asur
a a mpr
astierii valorilor n jurul mediei. Functia caracteristic
a este o notiune auxiliar
a important
a pentru calculul mediei, dispersiei,etc. Ea deneste unic diagrama variabilei
aleatoare.Propriet
atile acestor m
arimi sunt listate n cele trei teoreme anterioare. E de remarcat comportarea acestor m
arimi la adunarea variabilelor aleatoare independente. Un exemplu
important de spatiu probabilizat si variabile aleatoare independente este spatiul produs si
proiectiile prk .
________________________________
FORMULE UTILIZATE FRECVENT:
a) Denitiile mediei, momentelor, dispersiei, etc. pentru calculul direct al lor pag(15)
.
b) Proprit
atile mediei, dispersiei,functiei caracteristice. De remarcat:

LECTIA
2. VARIABILE ALEATOARE SIMPLE

21

i) M (af + bg) = aM (f ) + bM (g);


ii) f  0 ) M (f )  0;
iii) jM (f )j  max jf j;
iv) f1 ; f2 independente ) M (f1 f2 ) = M (f1 ) M (f2 ) , D (f1 + f2 ) = D (f1 ) + D (f2 ) si
(f1 + f2 )c (t) = f1c (t) f2c (t);
v) D (f ) = M2 (f ) M 2 (f )
.
(k)
vi) Mk (f ) = p 1 k fc (0).
1
( )

2.4

Exercitii

1. Fie variabila aleatoare


f=

1
1
2

10

1
10

3
10

1
10

S
a se calculeze media, dispersia si momentul de ordinul 3.
Indicatie. Se utilizeaz
a denitiile.
2 Fie v.a.


2
1 2 4 10
f=
1
1
3
1

5
10
10
10

Sa se determine astfel ca f sa eo v.a. discreta.


a se calculeze media si dispersia ei.
 S
1 0 1
3. Stiind ca pentru v.a. f =
avem M (f ) = 15 si M (f 2 ) = 33
s
a se
5
p 1 p 2 p3
determine p1 ; p2 ; p3 .
4. Fie o v.a. f cu media 10 . Se cere b 2 R astfel ca M (f + b) = 0.
5. n N urne se g
asesc cte n bile numerotate de la 1 la n, n ecare. Se extrage cte o bil
a
din ecare urn
a si se noteaz
a cu f valoarea celui mai mare num
ar obtinut. Se cere explicitarea
probabilit
atilor p(f=k), valoarea medie mn si limita expresiei mn =n cnd n! 1:
Indicatie. p(f  k)=probabilitatea ca din ecare urn
a s
a se extrag
a un num
ar mai mic
sau egal cu k. Num
arul cazurilor favorabile este k N iar num
arul celor posibile este nN , deci
N
N
(k 1)N
probabilitatea este p(f  k) = nk N . De aici deducem p(f = k) = nk N
. Aplicnd
nN
R1 N
Pn (k 1)N
mn
denitia mediei g
asim mn = n
deci n ! 1
x dx.
k=1
nN
0
6. O intreprindere recruteaz
a un nou angajat. Se prezint
a n candidati ntr-o ordine
aleatoare si primul candidat care trece testul proous de comisie este angajat. Probabilitatea
de a trece testul este p pentru ecare candidat. Fie variabila aleatoaref ce ia valoarea j dac
a
al j-ulea candidat este admis, si valoarea 0 dac
a nu este nimeni admis.
S
a se determine p(f=j), valoarea medie M(f) si dispersia D(f).
Indicatie. Ca s
a e admis candidatul j trebuie ca toti candidatii 1,2,..j-1 s
a e respinsi
j 1
iar j s
a e admis. Probabilitatea acestui eveniment este p(f = j) = q p, unde q = 1 p.

LECTIA
2. VARIABILE ALEATOARE SIMPLE

22

Probabilitatea ca toti s
a e respinsi este q n . Prin urmare f are diagrama:


1 2 ::
k
:: n
p qp :: q k 1 p :: q n
Este foarte simplu acum de a calcula functia caracteristic
a, media si dispersia.
7. O persoan
a se deplaseaz
a aleator plecnd din punctul 0. Cu probabilitatea p face un
pas n fata si cu probabilitatea q=1-p face un pas napoi. Valoare unui pas este de 1m iar
ritmul este de un pas pe minut. Fie f variabila aleatoare egal
a cu abscisa la care se ajunge
dup
a o or
a(un pas n fata este +1m iar un pas n spate este -1m). Se cer probabilit
atile
p(f=k), valoarea medie si dispersia lui f.
Indicatie. Dac
a se fac n fata k pasi, se ajunge n pozitia k-(60-k)=2k-60. Probabilitatea
k k 60 k
p q
(vezi n lectia 4 despre schema
Deci p(f =
de a face k pasi n fata este C60
P60 Bernoulli).
k k 60 k
k k 60 k i(2k 60)t
. Deci functia caracteristic
a este fc (t) = k=0 C60 p q
e
=
2k 60) = C60 p q
60
60ti
2ti
e
(pe + q) . Cu formulele uzuale se deduc acum media, momentele, dispersia.
8. Probabilitatea ca un bec sa reziste la suprasarcina este p=0,90. Se fac 5 incercari de
becuri. e f variabila aleatoare care reprezinta numarul de becuri care au rezistea. Se cere
media si dispersia lui f.
9. Se arunc
a dou
a zaruri si se noteaz
a cu f suma punctelor obtinute. Se cer media si
dispersia lui f.
Indicatie. Se poate obtine suma 2 din varianta (1,1), adic
a un caz din 36. Se poate obtine
suma 3 din variantele (1,2) sau (2,1), deci 2 cazuri din 36, etc. De aici rezult
a imediat legea
lui f etc.
10. O urn
a contine n bile albe si n bile negre. Se extrag una cte una bilele pn
a se
epuizeaz
a urna. Fie f variabila aleatoare care pentru o variant
a de extragere succesiv
a a
tuturor bilelor ia valoarea k dac
a prima bil
a alb
a apare la extragerea k.
a)S
a se determine legea lui f
b) Se cere media lui f.
Indicatie. k ia valori ntre 1 si n+1. Ca f s
a ia valoarea k trebuie s
a ias
a primele k-1 bile nen
gre. Probabilitatea ca s
a ias
a prima bil
a neagr
a este 2n
. Conditionat de aceasta, probabilitatea
n 1
ca a doua bil
a s
a ias
a neagr
a este 2n
. Deci probabilitatea ca primele dou
a bile s
a ias
a negre
1
n(n 1)
este 2n(2n 1) . Dac
a primele dou
a bile au iesit negre, probabilitatea ca a treia s
a ias
a neagr
a este
n 2
.
2n 2

n(n 1)(n 2)
. Analog g
asim
2n(2n 1)(2n 2)
k
1
n(n 1)(n 2)::(n k+2)
n
tiind aceasta,
= C
k 1. S
2n(2n 1)::(2n k+2)
C2n

Deci probabilitatea ca primele trei bile s


a ias
a negre este

probabilitatea ca primele k-1 bile s


a ias
a negre

probabilitatea ca la extragerea k s
a ias
a bila alb
a este

n
.
2n k+1

Deci p(f = k) =

k 1
Cn
n
.
k
2n k+1 C2n 1

LECTIA
2. VARIABILE ALEATOARE SIMPLE

23

11. Dou
a variabile aleatoare f si g iau aceleasi valori v1 ; v2 ; ::vn : Se mai stie c
a M (f ) =
M (g), M2 (f ) = M2 (g),..Mn 1 (f ) = Mn 1 (g). S
a se arate c
a p(f = vk ) = p(g = vk ) pentru
orice k2 1::n .
Indicatie. Fie pk = p(f =  k ) si p0k = p(g =  k ). Avem:
Mk (f ) = p1  k1 + p2  k2 + :::pn  kn = Mk (g) = p01  k1 + p02  k2 + :: + p0n  kn
0

pentru k=0,1,2,..n. Prin urmare p1 ; p2 ; ::pn si p01 ; p2 ; ::p0n satisfac acelasi sistem nesingular.
12. S
a se arate c
a D(f + C) = D(f ), C ind o constant
a.
Indicatie. Se aplic
a denitia dispersiei si se tine seama c
a M (f + C) = M (f ) + C.
13. Fie X o variabil
a aleatoare nit
a cu media m si dispersia  2 . Cum trebuie s
a e a si
b (constante) ca variabila aleatoare af+b s
a aib
a media zero si dispersia unu?
Indicatie. 0=M (af +b) = aM (f )+b = am+b si 1 = D(af +b) = D(af ) = a2 D(f ) = a2  2
14. Dou
a variabile aleatoare independente ;  au distributiile




0 1 2 3
0 1 2 3
 1 1 a a
 1
b 18 14
8
4
4
2
2
a) Sa se determine a si b
b) Care este distributia variabilei  ?
c) Care este distributia variabilei 2 + 3?
Indicatie. Pentru  avem 81 + 14 + a4 + a4 = 1 si analog pentru . Pentru   se tine seama
c
a  si  sunt independente, deci, de exemplu p( = 1 si  = 2) = p( = 1)  p( = 2), etc.
15. Doi juc
atori, A si B, convin asupra urm
atoarei reguli de joc: la o aruncare cu zarul,
dac
a apar fetele 1 sau 2 atunci primul juc
ator d
a celui de al doilea 3 lei, iar n caz contrar al
doilea juc
ator d
a primului 1 leu. Care este cstigul mediu al ec
arui juc
ator dup
a n arunc
ari?
Indicatie. Probabilitatea de cstig a lui A este 1/3 iar a lui B este de 2/3. Se scriu variabilele aleatoare care reprezinta cstigul pentru A si B, ca la problema 7.
16. Trei juc
atori A, B, C pun jos cte o sum
a de a, b, respectiv c lei, apoi arunc
a o
moned
a, pe rnd, n ordinea A, B, C, A, B, C,... pn
a apare fata. Primul juc
ator la care
apare fata ia toti banii, iar dac
a nu a ap
arut dup
a ce ecare a aruncat de 3 ori, se anuleaz
a
jocul.
a) Care sunt cstigurile medii ale ec
arui juc
ator dup
a 3 jocuri?
b) Cum ar trebui s
a e sumele a, b, c ca jocul s
a e echitabil?

Lectia 3
 Cmpuri de probabilitate
Fie (X;
; p) un cmp de probabilitate. Dac
a algebra de evenimente veric
a n plus axioma:
Oricare ar sirul de evenimente (An )n2N , cu An 2
atunci [An 2
,
spunem ca
este  algebra sau un  cmp de evenimente. Dac
a p este o probabilitate
pe
care n plus veric
a relatia
p(

An ) =

n=1;1

1
X

p(An )

n=1

pentru orice sir An de evenimente disjuncte, atunci spunem c


a p este o  probabilitate. n
aceste conditii tripletul (X;
; p) se numeste -cmp de probabilitate.
Teorema 3.1 Fie (X;
; p) un  -cmp deTprobabilitate. Atunci:
An 2
:
1) Daca An 2
pentru orice n, avem si
n=1;1
T
An ) = lim p(An )
2) Daca A1  A2  ::  An  :: atunci p(
n!1
n=1;1
S
An ) = lim p(An )
4) Daca A1  A2  ::  An  :: atunci p(
n!1
n=1;1
P1
S
An )  n=1 p(An )
3) p(
n=1;1

Demonstratie. p ind o probabilitate, toate propriet


atile pentru probabilit
atile nit
aditive r
a
mn
adev
a
rate.
S 
T
An , si deoarece An 2
, rezult
a c
a reuniunea multimilor An este in
;
An =
1)
n=1;1

n=1;1

deci si complementara acestei reuniuni, adic


a intersectia multimilor An este T
n
:
2) Multimile Ak Ak+1 sunt disjuncte ntre ele si sunt disjuncte de
Ak iar A1 =
k=1:::1

24

LECTIA
3.  CMPURI DE PROBABILITATE


Ak
k=1::1

[ (A1

A3 ) [ ::: este o reuniune disjunct


a, de unde:

A2 ) [ (A2

p(A1 ) = p

k=1::1

de unde:

Ak

Ak

= p(A1 ) lim
n!1
k=1::1
Pn 1
= lim p(A1 )
k=1 p(Ak
p

25

n!1

1
X

p(Ak

Ak+1 )

k=1

Pn

1
k=1

p(Ak Ak+1 ) =

Ak+1 ) = lim p(An )
n!1

3) Demonstratia este asem


an
atoare cu cea de la punctul 2).
4) p(A1 [A2 ) = p(A1 )+p(A2 ) p(A1 \A2 )  p(A1 )+p(A2 ) si prin inductie se demonstreaz
a
c
a p(A1 [ A2 [ :: [ An )  p(A1 ) + p(A2 ) + ::p(An ) . Acum avnd A1  A1 [ A2  :: 
(A1 [ A2 :: [ An )  :: , rezult
a:


p [Ak = lim p (A1 [ A2 [ :: [ An ) 
n!1
k=1::1
P
 lim p(A1 ) + p(A2 ) + ::p(An ) = 1
k=1 p(Ak )
n!1

QED.

Exemplul 3.2 Fie X = [0; 1]  [0; 1] si


multimea submultimilor lui X cu frontiera formata
dintr-un numar nit de segmente. Este clar ca
este o multime nchisa la reuniune, intersectie si complementara n X, deci este o algebra de multimi. O probabilitate pe
se poate
aria(A)
deni prin formula p (A) = aria(X)
= aria (A). Pe de alta parte
nu este o  algebra deorece
spre exemplu on cerc plin C nu face parte din
desi este reuniunea unui sir crescator An de
multimi din
, cu An egal cu poligonul regulat cu 2n laturi nscris n C. Se demonstreaza ca
exista o cea mai mica  algebra ce contine pe
, e ea B, iar probabilitatea p (sau aria p)
se poate extinde la o  probabilitate pe B. Probabilitatea (sau aria) astfel denita se numeste
probabilitatea Lebesgue (aria sau masura Lebesgue).
In mod asemanator se deneste masura Lebesgue pe un segment sau pe un paralelipiped
n spatiu, ca o extindere a notiunii de lungime a unui segment sau de volum al unui corp
marginit de un numar nit de fete plane.

3.1

Variabile aleatoare pe  cmpuri de probabilitate

Denitia 3.3 Fie (X;


; p) un  cmp de probabilitate. O functie f : X ! R se numeste
variabila aleatoare daca pentru orice numar c2 R , multimea {! 2
jf (!) < cg este un
eveniment din
: Adesea vom nota multimea de mai sus prin {f< cg sau f 1 ( 1; c).

LECTIA
3.  CMPURI DE PROBABILITATE

26

Propozitia 3.4 f:X! R este variabila aleatoare daca si numai daca este ndeplinita una din
conditiile urmatoare:
a)8c 2 R ) ff < cg 2

b)8c 2 R ) ff  cg 2

c) 8c 2 R ) ff > cg 2

d) 8c 2 R ) ff  cg 2

e) 8 ; 2 R ) f  f < g 2

T
Demonstratie.a) este denitia curent
a a variabilei aleatoare.Ta) ! b) ff  cg = n ff <
c + n1 g 2
. b)! c) {f>c}=X ff  cg 2
c)! d) {f S
cg = n ff > c n1 g 2
d}! e)
{  f < g = ff  g ff  g 2
e)! a) {f< cg = n f n  f < cg 2

QED.
Prin urmare o variabil
a aleatoare este caracterizat
a prin faptul c
a pentru orice interval
1
I R , nchis,deschis,seminchis,nit sau nu, avem relatia f (I) 2
. Spre deosebire de cazul
variabilelor aleatoare simple studiate n lectia trecut
a, conditia f 1 (v) 2
pentru v 2 R nu
este sucient
a ca f s
a e variabil
a aleatoare.
Teorema 3.5 Fie f : X ! R o variabila aleatoare si 2 R. Atunci urmatoarele functii sunt
variabile aleatoare: a) + f ; b)  f ; c)f 2 ; d) f1 daca f6= 0; e) jf j.
Demonstratie. a) { + f < cg = ff < c g 2
. b) f f < cg = ff < c g dac
a >0
2
si f f
<
cg
=
ff
>
c= g
dac
a

<
0.
In
ambele
cazuri
se
ob
t
in
mul
t
imi
n

.
c)
ff
< cg =
p
p
1
f
c < f < cg 2
. d) f f < cg = (ff > 0g \ fcf > 1g) [ (ff < 0g \ fcf < 1g) 2
. e)
exercitiu.
QED.
Teorema 3.6 Fie (fi )i2N un sir de variabile aleatoare. Atunci:
a)h(!) = sup fi (!) este o variabila aleatoare.
1i<1

b) g(!) = inf fi (!) este o variabila aleatoare.


1i<1

c) Daca exista lim fi ( !) = f (!) atunci f este o variabila aleatoare.


i!1

S1
S
Demonstratie. a) fh > cg = 1
i=1 ffi < cg 2
c) Fie
i=1 ffi > cg 2
b) fg < cg =
fi = maxfj . Conform cu a) fi este o variabil
a aleatoare. f = lim fi = minfi care este conform
ji

i!1

cu b) o variabil
a aleatoare.
QED.

Teorema 3.7 Daca f si gsunt variabile aleatoare atunci f +g; f g;

f
g

sunt variabile aleatoare.

S
Demonstratie. ff + g < cg = ff < c gg = r2Q (ff < rg \ fc g > rg) 2
, stiind
c
a toate numerele r2 Q se pot pune ntr-un sir. Deci f +g este o variabil
a aleatoare. Analog se

LECTIA
3.  CMPURI DE PROBABILITATE

27



procedeaz
a cu f g. Putem scrie f  g = 41 (f + g)2 (f g)2 si conform punctului anterior
f geste o variabil
a aleatoare. Deoarece fg = f  g1 rezult
a c
a si fg este o variabil
a aleatoare.
QED.
Din cele de mai sus vedem c
a dac
a a si b sunt constante atunci af + bg este variabil
a
aleatoare odat
a cu f si g. Deci multimea vsriabilelor aleatoare pe o aceeasi  algebr
a formeaz
a
un spatiu vectorial. Se poate ar
ata c
a dac
a f este o variabil
a aleatoare si F : R ! R este o
functie continu
a atunci F  f : X ! R este o variabil
a aleatoare (demonstratia este l
asat
a ca
exercitiu)
S
Dac
a f este o v.a. simpl
a atunci exist
a o partitie a spatiului X= ni=1 Ei ; Ei \ Ej = ;
astfel c
a f este constant
a pe Ei . Dac
a f si g sunt variabile aleatoare simple atunci f 
2

g; f g; f ; f ; jf j sunt simple. Orice variabil
a aleatoare este limita unui sir de variabile
aleatoare simple.
Teorema 3.8 Fie (X;
) o  algebra si f o variabila aleatoare pe X. Atunci exista un sir de
variabile aleatoare simple fn ! f . Convergenta este nteleasa n sensul ca pentru orice x 2 X
rezulta lim fn (x) = f (x) n R (convergenta simpla).
n!1

Demonstratie.Fie En;j = f! 2 Xj j2n1  f < 2jn g


n2n  j  n2n . Fie acum fn
denite astfel:
8 j 1
< 2n ; ! 2 Enj
fn (!) =
n; f (!)  n
:
n; f (!) < n

fn este o variabil
a aleatoare simpl
a si se vede c
a fn (!) ! f (!). De asemenea se vede c
a
fn tinde uniform la f dac
a f este m
arginit
a. In plus dac
a f >0, atunci fn tinde cresc
ator la
f.
QED.

3.2

Media unei variabile aleatoare oarecare

Dac
a variabila aleatoare este simpl
a atunci media ei a fost denit
a n lectia anterioar
a. Fie
f (!) = vi dac
a ! 2 Ei , pentru i=1,2,..n. Atunci
media luiR f se deneste prin M (f ) =
R
P
a variabila
a expresie prin X f  dp sau X f (!)  dp(!). Dac
i vi p(Ei ). Vom mai nota aceast
aleatoare nu este simpl
a atunci se aproximeaz
a f prin variabile aleatoare simple iar media
lui f se aproximeaz
a prin media acestora. In continuare vom folosi notiunea de convergenta
aproape peste tot (pe scurt a.p.t.).
Denitia 3.9 Un sir (fn )n2N denv.a. se spune ca este convergent
a.p.t. la variabila aleatoare
o
f daca si numai daca multimea x 2 Xj lim fn (x) 6= f (x) are probabilitatea 0.
n!1

LECTIA
3.  CMPURI DE PROBABILITATE

28

Putem descrie acum felul n care se deneste media n general:


a) Consider
am un sir de variabile aleatoare simple (fn )n2N care converge la f a.p.t.(un
asemenea sir exist
a conform
R teoremei precedente, si care convege peste tot la f ).
a. Dac
a 8 > 0; 9n() 2
b) Stim c
a M (fn ) = X fn dp exist
Ra sirul e Cauchy n sensul c
a c
a exit
a
N; a:^R{ 8n; m 2 N; n  n(); m  n() ) X jfn fm j dp <  , atunci
R se arat
a limit
a se numeste media lui f . Ea se noteaz
a cu X f dp sau M (f ) si
lim X fn dp si aceast
n!1
nu depinde de sirul de variabile aleatoare simple care tind Cauchy la f . In cazul particular
cnd f este simpl
a, se reg
asaste vechea denitie.
Se demonstreaz
a c
a propriet
atile mediei demonstrate anterior pentru variabile
aleatoare
simple
se
p
a
streaz
a
prin
trecere la limit
a, n general. Avem deci (scriind
R
f dp n loc de M (f )):
X
1)
Z
f =c)

2)

f dp = c

( f + g)dp =

3)

f dp +

(f1 + f2 + :: + fn )dp =

gdp

f1 dp +

f2 dp + :: +

fn dp

Spunem c
a variabilele aleatoare f1 ; f2 sunt independente, la fel ca n cazul variabilelor
aleatoare simple, dac
a oricare ar intervalele I1 ; I2 avem p(ff1 2 I1 g \ ff2 2 I2 g) = p(f1 2
I1 )  p(f2 2 I2 ). Cu aceasta putem enunta urm
atoarea proprietate:
4) Dac
a f1 si f2 sunt variabile aleatoare independente atunci:

 Z
Z
Z
f2 dp
f1 dp 
(f1 f2 )dp =
5)
f 0)
6)
f g)
7)

f dp  0

f dp 

Z



f dp  max jf j


X

Proprietatea urm
atoare este mai special
a:

gdp

LECTIA
3.  CMPURI DE PROBABILITATE

29

8) Dac
a lim fn = f a.p.t. si dac
a exist
a o variabil
a aleatoare g  0 astfel ca
n!1

si jfn j  g pentru orice n, atunci

lim

n!1

fn dp =

gdp < 1

f dp

Deci dac
a un sir de variabile aleatoare este convergent si dominat de o v.a. pozitiv
a cu medie
nit
a, atunci media limitei este egal
a cu limita mediilor.
O variabil
a aleatoare complex
a este o functie f : X ! C
R f = uR+ iv astfelR ca u si v
s
a e variabile aleatoare reale. Se deneste media lui f prin X f dp = X udp + i X vdp. Se
demonstreaz
a c
a propriet
atile 1)-8) se p
astrez
a.
Momentul de ordin k al unei variabile aleatoare oarecare se deneste ca pentru variabilele
simple
Z
k
Mk (f ) = M (f ) =
f k dp
X

Momentul centrat de ordinul k se deneste analog:


 Z

k
(f
k (f ) = M (f M (f )) =

M (f ))k dp

Dispersia se deneste de asemenea ca pentru variabile simple:


Z
2
D(f ) = M (f M (f )) =
(f M (f ))2 dp = M2 (f )

(M (f ))2

Propriet
atile demonstrate pentru dispersie n cazul variabilelor aleatoare simple r
amn
adev
arate n general, ele deducndu-se din propriet
atile mediei, care r
amn adev
arate n
general.
Functia caracteristic
a a unei variabile aleatoare generale se deneste ca pentru variabile
aleatoare simple, cu ajutorul mediei:
Z
p
1tf
fc (t) = M (e
)=
eitf dp
X

Si n acest caz propriet


atile demonstrate pentru variabile aleatoare simple r
amn adev
arate
n general.
Unei variabile aleatoare generale nu-i putem atasa o diagram
a ca n cazul variabilelor
aleatoare simple, ele lund n general o innitate de valori. In cazul particular cnd valorile se
pot enumera v1 ; v2 ; ::vn ; ::: iar evenimentele Ei = ff = vi g au probabilit
atile pi putem asocia
lui f diagrama:


v1 v2 v3 ::: vn :::
p1 p2 p3 ::: pn :::

LECTIA
3.  CMPURI DE PROBABILITATE

30

In acest caz variabilele simple


fn (!) =
tind spre f , si deci

f dp = lim
X

M (f ). Analog, dispersia este

n!1 X

vi ! 2 Ei ; i  n
0 ! 2 Ei ; i > n

fn dp = lim (v1 p1 + v2 p2 + v3 p3 + :::vn pn ) =

D(f ) =

n!1

1
X

(vi

P1

i=1

v i pi =

M (f ))2 pi

i=1

Exemplul 3.10 Fie o variabil


a aleatoare ce ia valorile 0; 1; 2; :::n; :: cu probabilitatile p0 ; p1 ;
P
i
p
a se arate ca:
p2 ; ::: pn :::. Fie Gf (t) = 1
i=0 i t . S
0
a) M (f ) = Gf (1);
b) M2 (f ) = G00f (1) + G0f (1);
2
G0f (1) . Functia Gf se numeste functia generatoare a v.a. f .
c) D(f ) = G00f (1) + G0f (1)

P
P
P
1
Solutie. a) In acest
caz avem vi = i. G0f (t) =P ipi ti P
si deci G0f (1) =
ipi =
vi p i =
P
ipi adic
a G00f (1) = M2 (f ) M (f )
i(i 1)pi ti 2 deci G00f (1) = i2 pi
M (f ). b) G00f (t) =
de unde rezult
a b). c) Avem D(f ) = M2 (f ) (M (f ))2 ceea ce d
a, conform cu a) si b), exact
c).

3.3

Functia de repartitie
densitatea de probabilitate

Fie f : X ! R o variaibil
a aleatoare denit
a pe spatiul probabilizat X. Asociem lui f o functie
F : R ! R prin formula F (t) = p(f < t). Functia F nu mai apare ca depinznd explicit de
X. Ea contine informatiile probabilistice despre f , independent de natura elementelor din
X. Este posibil ca aceeasi functieF s
a corespund
a la variabile aleatoare diferite, denite pe
acelasi spatiu X sau pe spatii diferite.
Denitia 3.11 Functia F : R ! R cu F (t) = p(f < t) , f ind o variabila aleatoare, se
numeste functia de repartitie a acestei variabilei aleatoare.
Denitia 3.12 Fie o variabila aleatoare f cuR functia de repartitie F . O functie  : R !
t
[0; 1) , integrabila, cu proprietatea ca F (t) = 1 (x)dx se numeste densitate de repartitie
a varibilei f .
Teorema 3.13 Functia de repartitie are urmatoarele proprietati:
1) F este monoton crescatoare

LECTIA
3.  CMPURI DE PROBABILITATE
2)F ( 1) = lim F (t) = 0
t! 1

31

F (1) = lim F (t) = 1


t!1

3) F este continua la stnga.


4) p(a  f < b) = F (b) F (a).
5) Reciproc, daca o functie F : R ! R are proprietatile de mai sus, exista un cmp de
probabilitate (X;
; p) si o variabila aleatoare pe X , care are pe F ca functie de repartitie.
Demonstratie.1) t1 < t2 ) ff < t1 g  ff < t2 g ) p(f < t1 )  p(f < t2 ) adic
a
F (t1 )  F (t2 ). 3) Fie tn ! t monoton cresc
ator. In aceste conditii multimile ff < tn g
formeaz
a un sir cresc
ator spre ff < tg deci p(f < t) = lim p(f < tn ), adic
a F este continu
a
n!1

n t la stnga. 2)Sirul de multimi An = ff < tn g este monoton descresc


ator cu intersectia
vid
a pentru orice sir (tn ) monoton descresc
ator spre -1. Din continuitatea probabilit
atii,
rezult
a F ( 1) = lim F (tn ) = lim p(An ) = p(;) = 0. Analog se demonstreaz
a c
a F (1) = 1.
n!1

n!1

4)Avem ff < bg = ff < ag [ fa  f < bg, reuniune disjunct


a. Lund probabilit
atile n ambii
membri g
asim formula din punctul 4).
5). Se poate lua X = R,
= cea mai mic
a  algebr
a ce contine intervalele de forma [a; b), iar
probabilitatea este denit
a prin p ([a; b)) = F (b) F (a). Detaliile nu fac obiectul prezentului
curs.
Teorema 3.14 Densitatea de probabilitate a unei variabile aleatoare are proprietatile:
1) R(t)  0
1
2) 1 (t)dt = 1
Rb
3)p(a  f < b) = a (x)dx.
4)Reciproc, daca o functie integrabila  : R ! R are proprietatile 1)-3) atunci exista un
cmp de probabilitate (X;
; p) si o variabila aleatoare pe X, care admite pe  ca densitate de
probabilitate.
Demonstratie.1) si 2) sunt evidente iar 3) rezult
a din punctul 4) al teoremei precedente.
5) Se poate lua, ca n teorema precedent
a, X = R,
= cea mai mic
a  algebr
a ce contine
intervalele
a prin p ([a; b)) = F (b) F (a), unde
R x de forma [a; b), iar probabilitatea este denit
F (x) = 1  (t) dt.
QED.
Functia de repartitie a unei variabile aleatoare exist
a ntotdeauna pe cnd densitatea de
repartitie nu. Dac
a exist
a densitate de repartitie , atunci F este continu
a iar n punctele de
continuitate ale lui  functia F este n plus derivabil
a si exist
a relatia F 0 (t) = (t) = lim
t!0

p(tf < t+t)


.
t

Pentru a vedea cum putem calcula efectiv media, dispersia, etc. n general, studiem pe
scurt un concept numit integrala Stieltjes.

LECTIA
3.  CMPURI DE PROBABILITATE

3.4

32

Integrala Stieltjes

Fie F : [a; b] ! R o functie monoton cresc


atoare. Vrem s
a denim
f : [a; b] ! R. Fie
 : x0 < x1 < ::: < xn 1 < xn = b

Rb
a

f (x)dF pentru o functie

o diviziune a intervalului [a,b] si e cte un element  i 2 [xi 1 ; xi ]. Denim suma Stieltjes


analog cu suma Riemann:
S =

n
X

f ( i ) (F (xi )

F (xi 1 ))

i=1

Spunem c
a f este integrabil
a Stieltjes n raport cu F dac
a pentru orice sir de diviziuni
(n )n2N cu norma jn j = max jxi xi 1 j tinznd la zero, sirul de sume Stieltjes are o aceeasi
i
limit
a, independent de sirul de diviziuni sau de punctele  i alese. Aceast
a limit
a se noteaz
a
Rb
Rb
cu a f (x)dF (x) sau a f dF . Se demonstreaz
a c
a pentru orice functie f continu
a integrala
Stieltjes exist
a. Urm
atoarele propriet
ati ale integralei Stieltjes seam
an
a cu cele ale integralei
Riemann:
a) Daca f1 si f2 sunt integrabile Stieltjes atunci f1 + f2 este integrabila si
Z

( f1 + f2 )dF =

f1 dF +

Rb
Rc
Rb
b) Daca a < c < b atunci a f dF = a f dF + c f dF .
Rb
c) f  0 implica a f dF  0.
Rb
d) a f dF  max jf (x)j  (F (b) F (a)).

f2 dF .

x2[a;b]

Rb
Rb
Rb
e) Daca F = F1 +F2 suma de doua functii monotone, atunci a f dF = a f dF1 + a f dF2 .
Demonstratia acestor propriet
ati nu o facem aici. S
a calcul
am cteva integrale Stieltjes.
Exemplul 3.15 Fie F : [a; b] ! R; F (x) = x. Atunci F (xi ) F (xi 1 ) = xi xi
Stieltjes devine integrala Riemann.

si integrala

Exemplul 3.16 F : [a; b] ! R este monoton crescatoare, derivabila, cu derivata (x) =


0
F 0 (x) integrabila Riemann. Atunci F (xi ) F (xi 1 ) = ( i )(xi xi 1 ) (conform teoremei lui
Lagrange) si daca luam n suma Stieltjes  i =  0i obtinem suma Riemann pentru functia f .
Deci
Z
Z
b

f (x)(x)dx

f dF =

(3.1)

LECTIA
3.  CMPURI DE PROBABILITATE

33

Exemplul 3.17 Fie c 2 [a; b] si F : [a; b] ! R data prin




x 2 [a; c]
F (x) =

x 2 (c; b]
Atunci n suma Stieltjes numai termenul f ( i )(xi xi 1 ) pentru care xi 1  c  xi este nenul
si suma este ( )f ( i ) care tinde spre ( )f (c) daca f este continua n c.Deci
Z b
f dF = ( )f (c) = (F (c + 0) F (c 0))  f (c)
(3.2)
a

Exemplul 3.18 Fie F : [a; b] ! R o functie constanta pe portiuni, cu salturi n punctele


c1 ; c2 ; ::cn unde avem F (ci + 0) F (ci 0) > 0. Atunci, la fel ca n exemplul anterior, daca f
este continua n punctele ci avem
Z b
n
X
f dF =
f (ci ) (F (ci + 0) F (ci 0))
a

i=1

Exemplul 3.19 Fie F continua pe portiuni, cu discontinuit


ati n c1 ; c2 ; ::cn iar ntre aceste
Rb
puncte derivabila, F 0 (x) = (x), integrabila. Atunci n a f dF avem doua parti: una de tipul
(3.1) iar alta de tipul (3.2), deci
Z b
Z b
n
X
f (x)(x)dx +
f (ci ) (F (ci + 0) F (ci 0))
f dF =
a

Se poate deni

R +1
1

f dF prin

i=1

lim

Rb

a! 1;b!1 a

f dF . Propriet
atile a)..e) se p
astreaz
a la fel ca

si metodele de calcul descrise n exemplele anterioare.

3.5

Media si functia de repartitie

Fie o variabil
a aleatoare f cu valori ntr-un interval[a; b) si cu functia de repartitie F . Fie
 : x0 = a < x1 < :: < xn

< xn = b

o diviziune a intervalului [a,b]. Lu


am cte un punct  i 2 [xi 1 ; xi ]. Fie variabila aleatoare

0
dac
a f (!) 2
= [a; b)
f (!) =
i
dac
a f (!) 2 [xi 1 ; xi )
Altfel spus, dac
a Ai =f! 2 X j f (!) 2 [xi 1 ; xi )g, atunci
8
 , dac
a ! 2 A1
>
>
< 1
 2 , dac
a ! 2 A2
f (!) =
:::::::::::::::::::::
>
>
:
 n , dac
a ! 2 An

LECTIA
3.  CMPURI DE PROBABILITATE

34

P
P
Variabila f este deci simpl
a, cu media M (f ) = i  i  p(xi 1  f < xi ) = i  i (F (xi )
F (xi 1 )). Atunci cnd norma diviziunii jj ! 0, variabilele f tind la f (a se vedea gura)
X
A1

An

A2

f
1
x0=a x1

2
x2

xn-1

xn=b

Exemplu de diviziune pentru calculul mediei


deci prin denitie
M (f ) = lim M (f ) = lim
jj!0

jj!0

 i (F (xi )

F (xi 1 )) =

xdF (x)

(3.3)

Am obtinut astfel formula simpl


a de mai sus care exprim
a media unei variabile aleatoare
printr-o integral
a Stieltjes. Dac
a variabila aleatoare nu este m
arginit
a de a si b nite, atunci
integrala de mai sus trebuie luat
a ntre -1 si 1. Variabila aleatoare f k este aproximat
a de
k
variabilele aleatoare f care au mediile
X

 ki

(F (xi )

F (xi 1 )) !

xk dF (x)

Dispersia lui f este media variabilei (f M (f ))2 . Aceast


a variabil
a aleatoare este aprox2
imat
a prin variabilele simple (f M (f )) care au mediile
X

( i

M (f )) (F (xi )

F (xi 1 )) !

(x

M (f ))2 dF (x)

a prin
Functia caracteristic
a a lui f este media variabilei aleatoare eitf care este aproximat
p
1tf
variabilele e
cu mediile
Z b p
X p
1t i
e 1tx dF (x)
(F (xi ) F (xi 1 )) !
e
i

Dac
a f nu este m
arginit
a atunci integralele trebuie luate de la -1 la 1. Avem deci

LECTIA
3.  CMPURI DE PROBABILITATE

35

formulele( = F 0 este densitatea de probabilitate):


R1
R1
R
M (f ) = X f dp = 1 xdF (x) = 1 x(x)dx
Mk (f ) = M (f k ) =

f k dp =

R1

xk dF (x) =

 R

k (f ) = M (f M (f ))k = X (f
R1
R1
= 1 (x M (f ))k dF (x) = 1 (x
R
2
D(f
)
=
M
(f
M
(f
))
=
R 1X (f
R1
= 1 (x M (f ))2 dF (x) = 1 (x

fc (t) = M (e

1tf

)=

1tf

dp =

R1

1tx

R1

xk (x)dx

M (f ))k dp =
(3.4)

M (f ))k (x)dx
M (f ))2 dp =
M (f ))2 (x)dx
dF (x) =

R1

1tx

(x)dx

Prin urmare cunoasterea functiei de repartitie este sucient


a pentru determinarea caracteristicilor numerice ale unei variabile aleatoare. Asa cum s-a mentionat mai nainte propriet
atile acestor m
arimi, demonstrate pentru variabile aleatoare simple, r
amn adev
arate n
general. Se vede n ultima formul
a c
a functia caracteristic
a este pn
a la un factor transformata Fourier invers
a a densit
atii de probabilitate, deci, densitatea de probabilitate este
determinat
a de functia caracteristic
a(prin transformata Fourier). Mai precis se demonstreaz
a
teorema urm
atoare:
Teorema 3.20 Fie doua variabile aleatoare f si g, cu functiile de repartitie F; G si functiile
caracteristice fc si gc . Daca functiile caracteristice sunt egale, atunci F = G.
Nu demonstr
am aceast
a teorem
a dar o vom folosi mai departe pentru a pune n evidenta
egalitatea unor functii de repartitie.
Exemplul 3.21 Fie X = [0; 1]  [0; 1] ,
= multimea gurilor cu arie, p(A) =aria lui
A. Fie f : X ! R f (x; y) = x + y. Este clar ca f este o variabila aleatoare pentru ca
ff < tg = f(x; y) 2 Xj x + y < tg este o gura cu arie. Se cere:
1) Sa se determineRun sir marginit de v.a. simple ce tind la f.
2)Sa se determine X f dp utiliznd sirul de v.a. de la punctul precedent.
3) Sa se determine functia de repartitie si densitatea de repartitie(daca exista).
4) Sa se determine media si dispersia folosind functia de repartitie.
Solutie. 1,2) Putem n mai multe moduri determina siruri de v.a. simple ce tind la f .
De exemplu pentru un n dat e
0 = x0 < x1 < :: < xn = 1 xi = i=n
0 = y0 < y1 < :: < yn = 1 yj = j=n

LECTIA
3.  CMPURI DE PROBABILITATE

36

si e fn (x; y) = (xi 1 + xi ) =2+(yj 1 + yj ) =2 dac


a (x; y) 2 [xi 1 ; xi )[yj 1 ; yj ) , adic
a valoarea
lui f (x; y) n centrul Pij dreptunghiului [xi 1 ; xi )  [yj 1 ; yj ) pe care o not
am si f (Pij ). Dac
a
(x; y) nu se a
a ntr-un dreptunghi [xi 1 ; xi )  [yj 1 ; yj ) atunci denim fn (x; y) = 0. Este clar
c
a fn ! f a.p.t. si avem:
Z
Z
X
fn dp = lim
f dp = lim
f (Pij )p ([xi 1 ; xi )  [yj 1 ; yj )) =
n!1

lim

n!1

n!1

f (Pij ) (xi

i;j=1::n

xi 1 ) (yj

yj 1 ) =

Z Z

f (x; y)dxdy =

i;j=1::n
1Z 1

(x + y)dxdy = 1

3) Functia de repartitie este


F (t) = aria (f(x; y) 2 Xjx + y < tg) =
8
0
t0
>
>
<
t2
0t1
2
=
(2 t)2
>
1t2
>
2
: 1
1
t2

Gracul functiei de repartitie este:


1

0.8

0.6

0.4

0.2

-2

-1

Gracul functiei de repartitie al variabilei aleatoare f


Deoarece F este derivabil
a avem densitatea de probabilitate:
8
0
t0
>
>
<
2t
0t1
(t) =
2(2
t)
1
t2
>
>
:
0
t2

Gracul densit
atii este:

LECTIA
3.  CMPURI DE PROBABILITATE

37

0.8

0.6

0.4

0.2

-2

-1

Gracul densit
atii de probabilitate a variabilei aleatoare f
4)
M (f ) =
=

t(t)dt =
t(t)dt =
tdF (t) =
0
1
Z 2
2
t  2(2 t)dt = 1
2t dt +

1
1

Analog se poate calcula dispersia.

3.6

Rezumat

Pentru a putea lucra si cu variabile aleatoare cu un num


ar innit de valori trbuie l
argit
conceptul de algebr
a de evenimente la cel de  algebr
a iar conceptul de probabilitate la cel
de  probabilitate. Concret:
i) O  algebr
a de evenimente(multimi) este o algebr
a de
S evenimente(multimi) cu propriAn este n algebr
a.
etatea c
a dac
a An sunt n algebr
a pentru orice n, atunci
n=1::1

ii) O probabilitate S
este  probabilitate
dac
a pentru orice sir de evenimente (multimi)
P
p(A
).
An ) = 1
disjuncte An avem p(
n
n=1
n=1::1

iii)  probabilitatea are o remarcabil


a proprietate de continuitate: dac
a A este intersectia
unui sir monoton descresc
ator sau reuniunea unui sir monoton cresc
ator de evenimente An
atunci p(A) = lim p(An ).
n!1

iv) O variabil
a aleatoare general
a este o functie real
a care ntoarce intervalele n evenimente, deci au sens expresii ca p(f = a) sau p(a  f < b) etc. Operatiile uzuale cu functii,
inclusiv trecerea la limit
a, aplicate variabilelor aleatoare duc tot la variabile aleatoare. Orice
variabil
a aleatoare este limit
a de variabile aleatoare simple (ce iau un num
ar nit de valori).
v) Caracteristicile numerice ale unei variabile aleatoare se denesc prin limita caracteristicilor corespunz
atoare ale variabilelor aleatoare simple ce tind la variabila general
a. Aceast
a

LECTIA
3.  CMPURI DE PROBABILITATE

38

limit
a nu exist
a ntotdeauna. Propriet
atile acestor caracteristici: medie, dispersie, momente,
functie caracteristic
a, demonstrate anterior pentru variabile aleatoare simple se p
astreaz
a prin
trecere la limit
a si pentru variabile aleatoare generale.
vi) Pentru calculul concret al caracteristicilor numerice se introduce functia de repartitie
denit
a prin F (t) = p(f < t), F ind functia de repartitie a variabilei aleatoare f . Toate
informatiile numerice legate de f sunt continute n functia de repartitie F , independent de
spatiul probabilizat pe care e denit
a f.
vii) Densitatea de probabilitate , este derivata functiei de repartitie (dac
a exist
a), adic
a
Rx
p(tf <t+t)
 (x) = lim
,sau, mai exact se deneste prin: F (x) = 1 (t)dt. Propriet
atile
t
t!0
functiei de repartitie si ale densit
atii de probabilitate sunt studiate mai sus.
viii) Pentru a ajunge la scopul propus, exprimarea caracteristicilor numerice ale unei
variabile aleatoare prin intermediul functiei de repartitie, avem nevoie de un concept auxiliar
numit integrala Stieltjes
Z b
X
f (x)dg(x) = lim
f ( i ) (g(xi ) g(xi 1 ))
jj!1

, o generalizare a integralei Riemann. Propriet


atile integralei Stieltjes seam
an
a n mare m
asur
a
cu cele ale integralei Riemann.
ix) In nal, prin formulele (3.4), media, dispersia, etc. sunt exprimate direct prin functia
de repartitie ori prin densitatea de probabilitate, independent de spatiul pe care e denit
a
variabila aleatoare.
______________________
FORMULE UTILIZATE FRECVENT:
T
An ) =
a) Pentru o probabilitate  aditiv
a: Dac
a A1  A2  ::  An  :: atunci p(
n=1;1
S
An ) = lim p(An ).
lim p(An ) iar dac
a A1  A2  ::  An  :: atunci p(
n!1

Rb

Rb

n=1;1

Pn

n!1

b) a f dF = a f (x)(x)dx + i=1 f (ci ) (F (ci + 0) F (ci 0)) unde F e functia de


repartitie,  e densitatea de probabilitate iar ci sunt punctele de discontinuitate
ale lui F
c)Formulele (3.4) pentru medie, momente, etc.
d) p (a  f < b) = F (b)

F (a) =

Rb
a

 (x) dx.

LECTIA
3.  CMPURI DE PROBABILITATE

3.7

39

Exercitii

1. Fie o variabila aleatoare :


f=

0
1
2 ::: n :::
0
p p p2 ::: pn :::

a)Sa se determine astfel ca diagrama de mai sus sa corespunda unei variabile aleatoare.
b) Sa se calculeze media P
, dispersia si functia caracteristica.
k
a . O problem
a analoag
a este rezolvat
a
Indicatie. Trebuie ca 1
k=0 p = 1. De aici rezult
n cadrul lectiei.
2. Fie variabila aleatoare uniforma


1 2 ::: k :: n
1
1
::: n1 :: n1
n
n

Sa se determine functia caracteristica, media si dispersia.


Indicatie. Se utilizeaz
a denitiile.
3. O urna contine s bile din care s-1 negre si una alba. Se fac extrageri din urna cu
punerea bilei napoi pna se extrage bila alba. Fie variabila aleatoare f care ia valoarea k daca
bila alba apare la extragerea k. Se cere valoarea medie a lui X.
Indicatie. Probabilitatea de a extrage o bil
a alb
a este p=1/s iar probabilitatea de a extrage
o bil
a neagr
a este q=(s-1)/s. Probabilitatea ca bila alb
a s
a apar
a abia la extragerea k este

s 1 k 1 1
pk = s
 s . Mai departe problema seam
an
a cu 1).
4. Un jucator trage la o tinta; probabilitatea de a o nimeri este p 2 (0; 1) iar probabilitatea
de a rata lovitura este q = 1 p. Partida se termina cnd e numarul lovirilor este cu 2 mai
mare ca al ratarilor, caz n care cstiga partida, e cnd numarul ratarilor este cu 2 mai mare
ca numarul lovirilor, caz n care pierde partida. Fie An evenimentul care consta n a cstiga
la tragerea n iar Bn evenimentul care consta n a pierde la tragerea n.
a) p(A2n+1 ) =? p(B2n+1 ) =?.
b) Care e probabilitatea ca jucatorul sa cstige?
c) Care e probabilitatea ca jucatorul sa piarda?
d) Care e probabilitatea ca partida sa nu se termine niciodata?
e)Fie X variabila aleatoare care ia valoarea k daca partida se termina la tragerea k. Se ce
probabilitatile p(X=k) si valoarea medie a lui X.
Indicatie. Dac
a juc
atorul cstig
a (sau pierde) la mutarea k, atunci nimereste (sau rateaz
a)
cu dou
a lovituri n plus fata de situatia contrar
a. Prin urmare num
arul loviturilor este par,
deci p(A2n+1 ) = p(B2n+1 ) = 0. Fie p2l probabilitatea ca partida s
a e cstigat
a la tragerea 2l,
e q2l probabilitatea ca partida s
a e pierdut
a la tragere 2l si e r2l probabilitatea de remiz
a
la tragerea 2l. Avem p2l = r2l 2  p2 q2l = r2l 2  q 2 r2l = r2l 2  (1 p2 q 2 ).
5. a)Pentru care  functia

 ( x2 + 1)
x 2 [ 1; 1]
(x) =
0
x2
= [ 1; 1]

LECTIA
3.  CMPURI DE PROBABILITATE

40

este o densitate de probabilitate?


b) Se cere media si dispersia variabilei cu densitatea .
c) Care este probabilitatea ca
R 1o v.a. cu densitatea  sa ia valori ntre 0,2 si 0,5?
Indicatie.  rezult
a din 1 (x)dx = 1. In rest se folosesc formulele (3.4).
6. a)O variabila aleatoare f are densitatea

0; x < 0
(x) =
e x; x  0

Care este functia de repartitie si densitatea de probabilitate a variabilelor f 2 ; 2f + 1; ef .


b) Sa se arate ca daca o v.a. f are densitatea  (x) iar g : R ! R este bijectie derivabila
cu g 0 > 0; atunci variabila aleatoare g  f are densitatea  (g 1 (t)) g01(t) .
Indicatie. Fie G functia de repartitie a variabilei f 2 . Avem
Z pt
p
p
2
t < f < t) = p (x)dx =
G(t) = p(f < t) = p(
=

e x dx = 1

pentru t  0

In mod evident G(t)=0 pentru t 0. Densitatea lui f 2 se obtine prin derivarea lui G. Analog
se procedeaz
a si cu celelalte expresii de f.
7. Se da functia
8
0
x<0
>
>
<
x 1 0x1
f (x) =
x2
1<x<2
>
>
:
5 x x2
R5
Sa se calculeze 1 (2 + x)df (x).
Indicatie. Se aplic
a tehnicile de calcul ale integralei Stieltjes din lectie.
8. Functia de repartitie a unei v.a. continue este
8
< a; x  0
bx2 ; x 2 (0; 1)
F (x) =
:
c; x  1

Se cer a,b,c, si P (1=4  f  1=2)).


9. Sa admitem ca timpul de asteptare ntr-o statie de metrou este o v.a. cu functia de
repartitie:
8
0; t  0
>
>
>
>
< t=4; 0 < t  2
1=2; 1 < t  4
F (t) =
>
>
t=8; 4 < t  8
>
>
:
1; t > 8

LECTIA
3.  CMPURI DE PROBABILITATE

41

a) Se cere densitatea de probabilitate.


b) Care este probabilitatea ca un calator sa astepte mai mult de 3 minute?
c) Care este probabilitatea ca un calator sa atepte mai mult de 3 minute stiind ca a asteptat
mai mult de 1 minut?
d) Care este probabilitatea ca un calator sa atepte mai putin de 3 minute stiind ca a asteptat
mai mult de 1 minut?
10. Functia de repartitie a unei v.a. X este
8
< 0; t < 0
x2 ; t 2 (0; 1]
FX (t) =
:
1; t > 1

Se cer M (X), D (X), X (t), F3X+2 (t), FX 2 (t).


ca

11. Fie o v.a. cu functia de repartitie F care admite medie si dispersie nite. Sa se arate
Z 1
(x a)2 dF (x)
1

este minima cnd a=M (f


).
R1
Indicatie. Fie i(a) = 1 (x a)2 dF (x). La extrem trebuie s
a avem i0 (a) = 0.
12. O variabila aleatoare f ia valori n intervalul [a; b]. Sa se arate ca M (f ) 2 [a; b] si
D(f ) 2 [0; (b a)2 =4].
Indicatie. Se exprim
a media si dispersia prin integrale Stieltjes apoi se majoreaz
a corespunz
ator m
arimile de sub integral
a. Se poate utiliza problema precedent
a.
13. Intr-un sistem de axe rectangulare xOy se dau A(2,0), B(0,1), O(0,0). Se iau la
ntmplare A0 2 [O; A] si B 0 2 [O; B]. A0 si B 0 au repartitii uniforme. Se cer:
a) Valoarea medie a ariei triunghiului OA0 B 0 .
b) Valoarea medie a perimetrului triunghiului OA0 B 0 .
c) Valoarea medie a lungimii segmentului A0 B 0 .
Indicatie. Se procedeaz
a ca n exemplul 7).

14. Se iau la ntmplare doua puncte n intervalul [0; 1]. Care este functia de repartitie a
distantei dintre ele? Care e valoarea medie a acestei distante?
Indicatie. Se procedeaz
a ca la problema 7).
1
15. O variabila aleatoare f are densitatea (x) = 1 1+x
Se cere repartitia variabilei
2.
g=min(jf j ; 1) precum si media lui g.
Indicatie. Fie G functia de repartitie a lui g. Dac
a t  1 atunci

G(t) = p(g < t) = p(min(jf j ; 1) < t) = p(;) = 0

LECTIA
3.  CMPURI DE PROBABILITATE

42

In mod analog G(t) = 1 pentru t > 1. Dac


a t 2 (0; 1) atunci
G(t) = p(g < t) = p(min(jf j ; 1) <t) = p(jf j < t)
Z t
1 1
2
= p( t < f < t) =
dx = arctan(t)
2

t 1+x
Asem
an
ator se poate calcula G(1) si apoi media cu formulele3.4
16. Doi jucatori A si B, avnd ecare un capital de a respectiv b lei, joaca pna la ruina
unuia din ei. La un joc sansele de cstig sunt p pentru jucatorul A si q=1-p pentru jucatorul
B. La ecare joc, cel ce pierde plateste 1 leu cstigatorului. Care sunt sansele de cstig ale
ecaruia?
17. Problema lui Buon. Pe un plan orizontal sunt trasate drepte paralele ntre ele la
aceeasi distanta 2d. Se arunca pe acest plan un ac de lungime 2l < 2d. Care este probabilitatea
ca acul sa intersecteze o paralela oarecare?
Indicatie. Starea de intersectie a acului cu reteaua de linii depinde de orientarea acului,
; si de distanta x a mijlocului acului fata de cea mai apropiat
a linie (vezi gura).

2l
x

2d

 2 [0; ) iar x 2 [0; d]. Pentru intersectie trebuie ca x  d cos . Spatiul pozitiilor
posibile este X = [0; )  [0; d], iar multimea pozitiilor favorabile intersectiei este A =
f(; x) 2 X j x  d cos g. In cazul cnd toate pozitiile sunt egal probabile, probabilitatea
unui eveniment este proportional
a cu aria multimii punctelor prin care se reprezint
a acel
eveniment.

Lectia 4
Legi clasice
Am v
azut c
a valorile caracteristice ale unei variabile aleatoare sunt determinate de functia
de repartitie (sau de densitatea de probabilitate, dac
a exist
a). In cazul variabilelor simple,
caracteristicile numerice sunt determinate de diagrama asociat
a lor. In cele ce urmeaz
a sunt
studiate cteva legi frecvent ntlnite n aplicatii. Cnd discut
am o asemenea lege subntelegem
c
a exist
a un cmp de probabilitate (X;
; p) si o functie f : X ! R care are ca functie de
repartitie pe F si ca densitate pe . Pentru calcule nu este nevoie s
a avem explicit date X;
; p
si f; ci numai pe F sau .

4.1

Repartitia binomial
a

Fie variabila aleatoare simpl


a

0
1
f=
o 0 n
1 1 n
Cn p q Cn p q
unde p 2 [0; 1] p+q = 1
Functia caracteristic
a este

:::
1

k
k k n
Cn p q

n
X

eitk Cnk pk q n

= peit + q

k=0

a)

1 2 C. De aici obtinem:

0
M (f ) = 1i fc (0) = 1i
M2 (f ) = i12 fc00 (0) =

n
n n 0
Cn p q

n 2 N . O asemenea variabil
a aleatoare se numeste binomial
a.

fc (t) =
unde i =

:::

it

n (pe + q)

n 1

it

pie = np
t=0

n

b)
n2 p2 + npq
c) D = M2 (f ) (M (f ))2 = npq
Fie p probabilitatea cu care apare A ntr-o experienta independent
a. Atunci n n experiente
k
independente aparitia de k ori a evenimentului A se poate face n Cn feluri, egal cu num
arul de
43

LECTIA
4. LEGI CLASICE

44

variante n care sunt plasate cele k experiente unde apare A printre toate cele n experiente.
Probabilitatea ec
arui sir de n experiente, cu k aparitii ale evenimentului A, este pk q n k ,
q = 1 p. Sumnd probabilit
atile tuturor acestor siruri favorabile g
asim c
a probabilitatea ca
n k
k k
a distributie a fost studiat
a intensiv
evenimentul A s
a apar
a de k ori este Cn p (1 p) . Aceast
de Bernoulli si se mai numeste si repartitie Bernoulli. Pentru n=20 si p=3/4 probabilit
atile
a astfel:
Cnk pk (1 p)n k arat
0.2

0.15

0.1

0.05

10


3 k

k
Valorile pentru C20

15

1
220

20

Se vede c
a probabilit
atile care difer
a substantial de 0 apar pentru valori ale lui k n jurul
lui np, care n acest caz este 15. In lectia 5 vom demonstra c
a acest lucru are loc pentru orice
p 2 (0; 1) si n sucient de mare.

4.2

Repartitia Poisson

Spunem c
a f este o varibil
a aleatoare de tip Poisson dac
a ia valori ntregi pozitive si p(f =
k e 
k) = k! unde  > 0. Diagrama unei asemenea variabile aleatoare este
f=

0
e

1



1!

 2
2!

:::
n
:::
 n
::: e n! :::

 se numeste parametrul variabilei aleatoare. Functia caracteristic


a este
fc (t) =

1
X
k=0

Prin urmare:
a) M (f ) = 1i fc0 (0) = 

eitk e



k!

=e

1
k
X
(eit )
k=0

k!

=e

 eit

it

= e(e

1)

LECTIA
4. LEGI CLASICE

45

b) M2 (f ) = i12 fc00 (0) = 2 + 


c) D = M2 M 2 = 
k
Probabilit
atile e  k! apar n felul urm
ator:
Propozitia 4.1 Fie un sir de variabile aleatoare binomiale


0
1
:::
k
::: n
fn =
q n Cn1 pq n 1 ::: Cnk pk q n k ::: pn
n care np !  cnd n ! 1. Atunci p(fn = k) ! e

 k
k!

cnd n ! 1.

Demonstratie.Vom demonstra aceast


a armatie pentru np = . Avem

n(n 1)(n

p(fn = k) = Cnk pk q n k = k!(nn! k)! pk q n k =


1
nk (1 n
)(1 n2 ):::(1 k n 1 ) k
2)::(n k+1) k n k
1
p q
=
k!
k!
nk
k

! k! e


 n k
n

QED.
Prin urmare k e  =k! reprezint
a probabilitatea ca un anumit eveniment A s
a apar
a de k ori
ntr-un sir foarte mare de n experiente independente, probabilitatea de aparitie a evenimentului A ntr-o singur
a experienta nd foarte mic
a, de tipul =n. Valoarea medie a num
arului
de aparitii este np = . Valorile p (f = k) pentru k = 0; 1; ::10, la o valoare a parametrului
 = 6 se reprezint
a astfel:

0.15

0.125

0.1

0.075

0.05

0.025

10

Valorile pentru e

15

20

6 6k
k!

Se vede c
a valorile p (f = k) care difer
a substantial de zero se concentreaz
a n jurul valorii
k= = 6.

LECTIA
4. LEGI CLASICE

46

Propozitia 4.2 Fie f si g doua variabile Poisson independente, de parametri  si  . Atunci


f + g este o variabila Poisson de parametru  + .
Demonstratie.Deoarece f si g sunt independente avem
it

(f + g)c (t) = fc (t)  gc (t) = e(e


it
= ei(+)(e 1)

1)

it

 ei(e

1)

Deoarece functia caracteristic


a determin
a complet functia de repartitie rezult
a c
a f +g
este o variabil
a Posson de parametru  + .
QED

4.3

Repartitia uniform
a

Spunem c
a o v.a. are o repartitie uniform
a dac
a densitatea ei este:
 1
x 2 [a; b]
b a
(x) =
0 x2
= [a; b]
unde a < b sunt reale. Functia caracteristic
a este
etc.

4.4

Rb
a

eitx b 1 a dx =

eibt eiat
,
it

media este

b+a
,
2

Repartitia Normal
a

Spunem c
a o variabil
a aleatoare f admite o repartitie normal
a de parametri m si  > 0 dac
a
densitatea ei de probabilitate este:
1
(x) = p e
 2

(x m)2
2 2

O variabil
a aleatoare cu repartitia normal
a, de medie m si dispersie  2 o vom numi de
tipul N (m; ). Gracul  pentru m = 0 si  = 1 al densit
atii de probabilitate si al functiei
de repartitie, arat
a astfel:

LECTIA
4. LEGI CLASICE

47

0.4

0.8
0.3

0.6
0.2
0.4

0.1
0.2

-4

-2

-4

-2

Densitatea de probabilitate si functia de repartitie a unei variabile normale


R1
(x m)2
Deoarece 1 p12 e 22 dx = (prin schimbarea t =
c
a  este o densitate de probabilitate.
Vom determina la nceput functia caracteristic
a.

= p12

Am folosit

. Acest lucru se arat


a astfel:
RR

e
R

x2
2

(y it)2
2

dy =

R1

e
1

t2
2

dt = 1, rezult
a

(x m)2

1
p1
eitx e 22 dx =
1
 2
R1
(schimbarea y = x m ) = p12 1 eit(m+y)
R1
(y it)2
 2 t2
2
= eitm 2 p12 1 e
dy = eitm

fc (t) =

x m
)


y2
2

dy =

y2
2

dy =

 2 t2
2

(4.1)

2

0 = 2i Res e
R R it z2
R R
dx + R
e 2 dz
R

z2
2

; zk =

it

Suma reziduurilor este n dreptunghiul [ R; R; R

z2
2

dz +

R
R it

z2
2

(4.2)
dz

it]: Pe latura [R; R it]


R R it z2
putem scrie z = R ist cu 0  s  t deci z = R s t  i2Rst deci R
e 2 dz =
R
R2 =2 t s2 t2  2 =2 i2Rst
e
e
e
( it) ds ! 0 cnd R ! 1. Pe latura [ R it; R] se procedeaz
a
0
analog si se g
aseste limita integrale tot zero. Trecnd la limit
a R ! 0 n (4.2) g
asim prima
egalitate din (4.1). A doua egalitate se stie din anul I.
Cunoscnd functia caracteristic
a se pot determina caracteristicile numerice:
1 0
a) M (f ) = i fc (0) = m
b)M2 (f ) = i12 fc00 (0) =  2 + m2
2

it;

2 2 2

LECTIA
4. LEGI CLASICE

48

c) D(f ) = M2 M 2 =  2
d) 2k+1 = 0 2k = (2k)!
 2k . (exercitiu)
2k k!
In anumite conditii avem urm
atoarea relatie ntre dou
a variabile norale:
Propozitia 4.3 a) Fie f1 si f2 doua variabile aleatoare normale independente, de parametri
m
p1 ;  1 respectiv m2 ;  2 . Atunci f1 + f2 este normala de parametri m = m1 + m2 ;  =
 21 +  22 .
n
b) Daca f1 ; f2 :::fn sunt v.a. independente
si normale de tip N (m; ), atunci f1 +f2 +:::+f
n

este v.a. normala de tip N m; pn .
Demonstratie.a)f1c (f ) = eim1 t

2
1
1t
2

f2c (t) = eim2

(f1 + f2 )c (t) = f1c (t)f2c (t) = ei(m1 +m2 )t


cu m = m1 + m2

=

2
2
2t
2

(21 +22 )t2

p
 21 +  22 .

= eimt

 2 t2
2

n 2 2

b) Ca la punctul a) g
asim (f1 + f2 + :::fn )c (t) = einmt 2 t . Din teorema 3, lectia 2,
rezult
a

 


2
f1 + f2 + :: + fn
t
imt 12 pn t2
(t) = (f1 + f2 + :: + fn )c
=e
n
n
c

Cu aceasta b) este demonstrat.


QED.
Pentru  = 1; 2; 3; 4 gracele densit
atilor apar n continuare. Se vede c
a pentru  mare
(adic
a dispersie mare) gracul este mai mpr
astiat (aplatizat) n jurul mediei m = 0.

Gracele densit
atilor unor variabile normale
pentru diverse valori ale lui 

LECTIA
4. LEGI CLASICE

49

Legea normal
a a ap
arut n leg
atur
a cu teoria erorilor de m
asurare. S
a presupunem c
ao
m
arime z este determinat
a prin m
asur
atori. In mod normal se vor face erori. Fie p(z; x)dx
probabilitatea ca s
a obtinem rezultatul ntre x s x+dx, dac
a valoarea exact
a este z. p(z,x)
este deci densitatea de probabilitate a rezultatului m
asur
atorii . Dac
a facem n m
asur
atori
independente atunci probabilitatea ca s
a obtinem rezultatele n intervalele [x1 + dx1 ], [x2 +
dx2 ],..[xn + dxn ] este
p(z; x1 )dx1 p(z; x2 )dx2  ::p(z; xn )dxn = F (z; x1 ; x2 ; ::xn )dx1 ::dxn

(4.3)

Care este expresia cea mai potrivit


a pentru functia p(z; x)? In mare Gauss a plecat de la
urm
atoarele ipoteze pentru a determina pe p(z; x):1
1) p(z; x) = (z x) (adic
a erori se fac cu aceeasi probabilitate n stnga ca si n dreapta
valorii exacte si probabilitatea de a obtine prin m
asurare o anumit
a valoare x depinde doar
de dep
artarea fata de valoarea exact
a z).
2) Coecientul lui dx1 dx2 ::dxn n n m
asur
atori independente (4.3) este maxim pentru
z = (x1 + x2 + :: + xn )=n.
3)  este cel putin de clas
a C 2.
Cu aceste ipoteze g
asim astfel legea erorilor p(z,x):
F (z; x1 ; :::) = (z x1 )(z x2 )  ::  (z xn ) > 0 este maxim n acelasi timp cu
ln(F (z; x1 ; x2 ; ::)):
Prin urmare:
(ln(F (z; x1 ; ::))0x

0 (z
=
(z

x1 )
0 (z
+ :: +
x1 )
(z
0 (z x)
(z x)

pentru z = (x1 + x2 + ::: + xn )=n. Notnd g(x) =

xn )
=0
xn )

avem

g(x1 ) + g(x2 ) + :::g(xn ) = 0


de ecare dat
a cnd
x1 + x2 + ::: + xn = nz
adic
a
g(x1 ) + g(x2 ) + :: + g(xn 1 ) + g(nz

x1

x2

::

Prin derivare dup


a x1 obtinem:
g 0 (x1 )

g 0 (nz

si datorit
a arbitrarit
atii valorilor x1 ; ::xn

x1

::

xn 1 )  0

xn 1 )  0

g
asim c
a

g 0 (x)  a = const
1

Demonstratia este adaptat


a dup
a H. Poincar-Calcul des probabilits, Gauthiers-Villars,Paris,1912

LECTIA
4. LEGI CLASICE

50

de unde
g(x) = ax + b
Deoarece 0 = g(x1 ) + g(x2 ) + :: + g(nz

x1

0 (z
(z
sau

xn 1 ) = anz + nb rezult
ab=

::

x)
= a(x
x)
0 (t)
=
(t)

az, deci:

z)

at

de unde
ln((t)) =

(t) = ec e

t2
+c
2
2

a t2

Deci:
p(z; x) = (z

x) = ke

(z

x)2
2

Deoarece p(z; x) este o densitate de probabilitate trebuie ca


Z 1
p(z; x)dx = 1
Aceasta implic
a a > 0 si k =

a
.
2

Dac
a lu
am a =

p(z; x) = p

1
e
2

1
2

atunci densitatea p devine:

(x z)2
2 2

adic
a ceea ce am numit legea normal
a.
Alte motive pentru care legea normal
a este important
a vom vedea la considerarea teoremelor de tip limit
a central
a. Fiind frecvent folosit
a valorile functiei de repartitie pentru
Rt
x2
1
m = 0 ,  = 1, adic
a 1 p2 e 2 dx au fost tabelate. Mai precis s-a introdus functia
Z t
x2
1
p e 2 dx
(t) =
2
0
. Cu ajutorul acestei functii avem

p(a  f < b) =

(x)dx = (b)

(a)

pentru o v.a. de tipul N (0; 1).  este o functie antisimetric


a,  (a) =  ( a). Valorile
functiei  s-au tabelat pentru diverse valori ale lui t. Dac
a f este o v.a. normal
a de parametri
f m
m si  atunci variabila Z =  este normal
a cu media 0 si dispersia 1 (exercitiu), deci cu
functia de repartitie tabelat
a.

LECTIA
4. LEGI CLASICE

4.5

51

Repartitia exponential
a negativ
a

Se numeste astfel o repartitie cu densitatea



0
(x) =
e x
unde  > 0.
Plecnd de la denitie se g
aseste fc (t) =
calcule sunt l
asate ca exercitiu.

4.6


 it

x<0
x0
M=

1


M2 =

2
2

D=

1
.
2

Toate aceste

Repartitia Gamma

Se numte astfel o repartitie cu densitatea


(
 ; (x) =

unde >

1
x e
( +1) +1

x0
x>0

1 si > 0. Cel mai frecvent se foloseste cazul = 1 + 1 = m, cnd avem



0
x0
(x) == m+1;0 (x) =
1
m 1
x
x
e
x>0
(m)

Reamintim c
a functia gamma se deneste astfel
Z 1
e t tx 1 dx
(x) =
0

pentru x > 0. Urm


atoarele propriet
ati se cunosc de la cursul de analiz
a:
(x + 1) = x (x)
p
( 21 ) = 
Functia caracteristic
a se calculeaza
a astfel:

LECTIA
4. LEGI CLASICE

fc (t) =

52

1
( + 1) +1

eitx x e

dx

1
1X

(itx)n x
x e dx
n!
0
n=0
Z
1
X
1
(it)n 1 n+ x
=
x e dx
( + 1) +1 n=0 n! 0
Z
1
X
1
n+ +1 1 n+ y
n
y
e dy
=
(it)
+1
n!
(
+
1)
0
n=0
=

1
( + 1) +1

1
X

(it)n

n=0
1
X

1
n+ +1
(n + + 1)
( + 1) +1 n!

n+ +1 (n + ) (n + 1)    ( + 1) ( + 1)
=
(it)
( + 1) +1 n!
n=0
=

1
X
n=0

( it )n 

1) (
n!

2)    (

n)

= (1

i t)

Am folosit aici dezvoltarea



( 1) 2
( 1) ::: ( n + 1) n
(1 + x) = 1 + x +
x + ::: +
x + ::
1!
2!
n!
Caracterisicile numerice sunt:
a) M (f ) = 1i fc0 (0) = ( + 1)
b) M2 (f ) = i12 fc00 (0) = 2 ( + 1) ( + 2)
c) D(f ) = M2 (f ) M (f ) = 2 ( + 1)
In cazul = 1 = m 1 se obtine fc (t) = (1 mt) m , media=m; dispersia=m. Tipul
de mai sus de variabil
a aleatoare l vom numi ( ; ) iar n cazul particular considerat l vom
numi (m). Pentru m = 0 si m = 2 gracele densit
atilor apar n continuare:
0.35
0.5
0.3
0.4
0.25
0.2

0.3

0.15
0.2
0.1
0.1
0.05

-2

10

-2

10

LECTIA
4. LEGI CLASICE

53

Densit
atile (m) pentru m = 0 si m = 2.
Propozitia urm
atoare este simplu de demonstrat:
Propozitia 4.4 Daca f si g sunt variabile aleatoare independente de tipurile (m1 ) respectiv
(m2 ) atunci f + g este de tipul (m1 + m2 ).
Demonstratie.Exercitiu
QED.

4.7

Repartitia X2(hi p
atrat)

Se numete astfel o v.a. cu densitatea :


(
(x) =

2 2  s ( 2s )

0
s
x2

x0
x>0

x
2 2

s este un num
ar natural numit num
arul gradelor de libertate, iar  > 0. Acest tip de variabil
a
s
2
aleatoare l vom numi H(s; ); se vede imediat c
a este acelasi cu ( 2 1; 2 ). Prin urmare
avem:
s
a) fc (t) = (1 2 2 it) 2
b) M = s 2
c) M2 = s (s + 2)  4
c) D = 2s 4
Iat
a cum se poate ajunge la o distributie X2 placnd de la distributii normale:
Propozitia 4.5 Fie f1 ; f2 ; ::fs variabile aleatoare independente de tipu N (0; ). Atunci variabila aleatoare g = f12 + f22 + :: + fs2 este de tipul H(s; ).
Demonstratie.Fie Fi (t) functia de repartitie a variabilei fi2 . Avem
Fi (t) = p(fi2 < t) = p(

t < fi <
R pt
= p22 0 e

t) =

x2
2 2

p1
2

dx

R pt

e
t

x2
2 2

dx =

De aici prin derivare determin


am densit
atile pentru fi2 ; notate i . Avem
0

i (t) = Fi (t) =

1
( 21 ) (2 2 )1=2

1
2

t
2 2

pentru t > 0 ceea ce pune n evidenta faptul c


a fi2 sunt distributii de tip (
1
2

. Deoarece f12 ; f22 ; ::fs2 sunt independente rezult


a c
a





f12 + f22 + :: + fs2 c (t) = f12 c (t)  f22 c (t)    fs2 c (t) = 1 2 2 ti

(fi2 )c (t) = (1

2 2 it)

1
; 2 2 ),
2

s
2

deci

LECTIA
4. LEGI CLASICE

54

care este chiar functia caracteristic


a a unei distributii H(m; ).
QED.
Pentru  = 1 si s = 6 grade de libertate, gracul densit
atii arat
a astfel:

0.12

0.1

0.08

0.06

0.04

0.02

10

15

20

Densitatea  pentru s = 6 si  = 1.
2

4.8

Repartitia Student

O v.a. f, cu densitatea de probabilitate


 (x) = p

s+1
2

s

 

x2
 1+
s
s
2

s+1
2

se numeste variabil
a Student. Tipul acesta de v.a. l vom nota S (s). Demonstratiile armatiilor de mai jos n leg
atur
a cu distributiile Student se vor da n lectia 6.
a) M (f ) = 0 si n general 2k+1 (f ) = 0 pentru 0  k < 2s . Pentru k  2s ; 2k+1 (f ) nu
exist
a.
k 13::(2k 1)
r
(k+ 12 ) ( 2s k)
b) 2k (f ) = M2k (f ) = ps 
= (s s2)(s
.
s
4)::(s 2k)
(2)
c) Dac
a  este o v.a. de tip normal N (0; ) si  este de tip 2 cu s grade de libertate, adic
a
de tip H (s; ) atunci v.a. p  este de tip Student S (s). Pentru s = 6, gracul densit
atii este
urm
atorul:

LECTIA
4. LEGI CLASICE

55

0.15

0.1

0.05

-4

-2

Densitatea Student pentru s = 6


Aceast
a repartitie este frecvent ntlnit
a n Statistic
a si este tabelat
a pentru diverse valori
ale lui s.

4.9

Rezumat

Variabilele aleatoare anterioare apar n multe modele de probleme reale. De aceea au fost
studiate mai n detaliu.
i) Modelul binomial descrie probabilitatea de aparitie de k ori a unui eveniment ntrun sir de n experiente independente, dac
a probabilitatea de aparitie a evenimentului ntr-o
experienta este p. Aceast
a probabilitate este Cnk pk (1 p)n k .
ii) Modelul Poisson descrie probabilitatea de aparitie de k ori a unui eveniment ntr-un
sir mare de n experiente independente, dac
a probabilitatea de aparitie a evenimentului ntro experienta este foarte mic
a, de tipul =n. Num
arul mediu de aparitii este acelasi, ; iar
probabilitatea este e  k =k!.
(x m)2

1
a de distributia erorilor de
iii) Legea norml
a, cu densitatea (x) = p2
e 22 este legat
2
m
asurare. m este valoarea medie a valorii m
asurate iar  este m
asura dispersiei valorilor
g
asite n jurul mediei.
iv) Distributia 2 cu s grade de libertate are densitatea
(
0
x0
x
s
(x) =
1
1
2
x>0
x 2 e 2
s
s
2 s
2 

(2)

si este distributia sumei p


atratelor a s variabile aleatoare normale independente, de medie 0
si dispersie  2 . Aceast
a distributie apare frecvent n statistic
a.

LECTIA
4. LEGI CLASICE

56

Alte legi clasice sunt date n exercitii sau vor studiate mai trziu, pe m
asur
a ce vor folosite. E de remarcat utilitatea functiei caracteristice n calculul
momentelor.
________________________________

4.10

Exercitii

1. Sa se arate ca
2k

1
= p
 2

(x

m)2k e

(x m)2
2 2

1)  2 2k

dx = (2k

de unde

(2k)!
2k k!
Indicatie. Cu substitutia t = x m se g
aseste
Z 1
Z 1
x2
1
1
2k
2k = p
x e 2 dx = p
x2k
2 1
2 1
2k =

1
2. Fie o v.a. cu densitatea (x) = 2
e
imt
e
a)Sa se arate ca fc (t) = 1+2 t2 .
b) Sa se determine media si dispersia.
Indicatie. Se aplic
a denitiile.

jx mj


x2
2

0

dx = :::

_ > 0 (distributia lui Laplace).

3. Sa se arate ca daca o v.a. f este de tipul N (m;  2 ); atunci g = (f 2m)


este de tipul
2
1
1
( 2 ) = ( 2 ; 0).
Indicatie. Se arat
a mai nti c
a h= f m este de tipul N (0; 1). Pe urm
a dup
a modelul de
la distributia 2 se arat
a c
a g = h2 e de tipul cerut.
4. Fie f1 ; f2 ; ::fk variabile aleatoare independente, ecare avand o repartitie exponentiala
negativa.
k
a) Sa se arate ca f=f1 + f2 + :: + fk are ca functie caracteristica fc (t) = ( it)k .
k

b) Fie variabila aleatoare g cu densitatea (x) = (k) xk e x daca x  0 si (x) = 0 daca


x < 0. Sa se arate ca g este de tipul ( ; ) pentru un si . Sa se determine functia
caracteristica a lui g.
c) Sa se arate ca f1 + f2 + :: + fk si g au aceleasi repartitii.
Indicatie. Utiliz
am functiile caracteristice. Functia caracteristic
a a lui f1 + f2 + :: + fn
este produsul functiilor caracteristice ale variabilelor f1 ; ::fn . Aceste functii caracteristice sunt

LECTIA
4. LEGI CLASICE

57

calculate n lectia prezent


a.
5. Sa se arate ca ntr-o distributie Poisson de parametru  valoarea k cea mai probabila
satisface inegalitatea  1  k  .
Indicatie. Se face raportul a dou
a probabilit
ati vecine, p(f = k) si p(f = k + 1).
6. Viteza absoluta a unei molecule ntr-un gaz prfect este o marime aleatoare. Conform
teoriei lui Maxwell densitatea de probabilitate a acestei viteze este:
x2
4x2
c2 , pentru x > 0
p
e
c3 
(x) = 0, pentru x  0

(x) =

unde c este o constanta. Sa se determine viteza medie, energia cinetica medie si dispersiile
lor.
Indicatie. Pentru c=100, gracul distributiei vitezelor este:
0.008

0.006

0.004

0.002

100

200

300

400

Distributia vitezelor ntr-un gaz perfect la c=100


R1
R1
2
Viteza medie= 1 x(x)dx, energia cinetic
a medie= 1 mx
(x)dx, unde m este masa
2
unei molecule. Integralele se fac prin p
arti sau se folosesc rezultatele de la legea normal
a (pb.
1).
7. Distributia cu densitatea
(x) =

0
1
p
e
x 2

(ln x )2
2 2

x0
x>0

se numeste normal logaritmica. Se cere media si dispersia unei astfel de distributii.

LECTIA
4. LEGI CLASICE

58

Indicatie. Dac
a  este o v.a. cu astfel de lege atunci:
Z 1
(ln x )2
1
x p e 2 2 dx
M () =
x 2
0
Z 1
(t )2
2
1
t
= p
e 2 2 dt = e + 2 :
2 1
 2

2
1 A.N. Kolmogorov
Analog se procedeaz
a pentru dispersie, g
asindu-se D (f ) = e2 + e
a ar
atat c
a aceasta este legea de distributie a diametrelor particulelor ntr-un proces de
m
acinare.
8. O variabila aleatoare f cu densitatea

0
(x) =
1
c x e

cx

x0
x>0

se numste variabila Weibull.


a) Care media lui f?
b) Care e dispersia lui f?
c) Care este momentul de ordin k al lui f?
Indicatie. Folosind formulele din lectia 3 pentru momentul de ordin k si utiliznd schimbarea x = t ajungem la o functie . Acum media si dispersia se calculeaz
a imediat. In gura
urm
atoare sunt reprezentate gracele densit
atilor pentru = 0; 5; 1; 2; 3 la c=1.
10

0.8

0.6

0.4

0.2

0.4

0.4
0.3

0.3

0.2

0.2

0.1

0.1

Densitatea Weibull pentru = 0; 5; 1; 2; 3.


9. Sa se arate ca functia  (x) care maximizeaza expresia
Z 1
 (x) ln ( (x)) dx
I=
1

LECTIA
4. LEGI CLASICE
cu conditiile

x2
2 2

1
1

59

 (x) dx = 1si

x2  (x) dx =  2

este  (x) = p12 e


. ( I se numeste entropia densitatii . Prin urmare distributia normala
are entropie maxima, la o dispersie data).
Indicatie. Se stie din Calculul Variational c
a functia  (x) carerealizeaz
a extremul functionalei

@F
@
@F
I; cu cele dou
a constrngeri, trebuie s
a satisfac
a ecuatia @ @ @0 = 0, unde F (x; ; 0 ) =
 ln  + 1  + 2 x2 .

10. Sa se arate ca distributia pe [0; 1) care maximizeaza entropia si are media m > 0;
x
este este exponentiala negativa  (x) = m1 e m . R
R1
1
 (x) dx =

(x)
ln

(x)
dx
n
condi
t
iile
Indica
t
ie.
Trebuie
maximizat
a
integrala
I
=
0
0
R1
1, 0 x (x) dx = m. (vezi problema 9).
11. Sa se arate ca distributia pe intervalul [a,b] care maximizeaza entropia, este distributia
uniforma.

12. Intr-o urna se gasesc a bile albe si b bile negre. Se extrag n bile din care k sunt albe
si n k sunt negre ( k  a, n k  b). Extragerea se face fara punerea bilei napoi (schema

bilei nentoarse). Sa se arate ca probabilitatea acestui eveniment este


pentru variabila aleatoare
!
:::
k
:::
f=
CkCn k
::: aC nb
:::

Cak Cbn
n
Ca+b

. Sa se arate ca

a+b

a
cu k 2 [max (0; n b), min (a; n)] media este M (f ) = n a+b
si dispersia este D (f ) =
a+b n
a
b
n
.
a+b 1 a+b a+b
P
n
unde nsumarea se face ntre limIndicatie. Se utilizeaz
a identitatea k Cak Cbn k = Ca+b
itele specicate n problem
a pentru k (identitatea se poate obtine egalnd coecientii lui xn n
(1 + x)a (1 + x)b = (1 + x)a+b ). Pentru medie se utilizeaz
a kCak = aCak 11 iar pentru dispersie
se utilizeaz
a k (k 1) Cak = a (a 1) Cak 22 .

13. Fata de un adversar la fel de tare ce este mai probabil sa se cstige: trei partide din
patru sau cinci partide din opt?
14. Pentru o variabila aleatoare se deneste asimetria prin 1 = p3 3 si excesul prin

2 = 24
2
lectie.

2

3. Sa se calculeze valorile acestor marimi pentru variabilele aleatoare din acesta

Lectia 5
Legi limit
a
In cele ce urmeaz
a vom studia semnicatia dispersiei, precum si importanta repartitiei normale
pentru probabilit
ati. Incepem cu inegalitatea lui Cebsev.
Teorema 5.1 Fie f o variabila aleatoare cu medie si dispersie nite. Atunci pentru a > 0
avem:
D(f )
p (jf M (f )j > a) 
a2
sau
D(f )
p (jf M (f )j  a)  1
(5.1)
a2
Demonstratie.
R
R
2
p (jf M (f )j > a) = jx M (f )j>a dF (x)  jx M (f )j>a (x Ma2(f )) dF (x) 


1
a2

jx M (f )j>a

(x

M (f ))2 dF (x) 

1
a2

R1

(x

M (f ))2 dF (x) =

D(f )
a2

QED.
p
Putem pune acest lucru si n alt mod dac
a scriem a =  =  D. In acest caz avem
1
. Inegalitatea devine
2

D
a2

1
sau
2
1
p (jf M (f )j  )  1
v2
Aceasta nseamn
a c
a variabila aleatoare ia valori n intervalul [M (f ) ; M (f ) + ] cu
o probabilitate mai mare ca 1 12 . In cazul particular al unei variabile normale f 2 N (m; )
g
asim c
a f ia valori n intervalul [m 3; m + 3] cu probabilitatea  1 19 = 0; 88:: adic
a
p (jf

M (f )j > ) 

(x m)2

aria de sub gracul densit


atii (x) = p12 e 22 cuprins ntre x = m 3 si x = m + 3
este cel putin 0; 88::.Cu ct  este mai mic, cu att mai mic este intervalul n care functia ia
valori cu probabilitate mare (valori n jurul mediei m).
60


LECTIA
5. LEGI LIMITA

61

Observatia 5.2 Estimarea data de inegalitatea lui Cebsev este destul de grosiera n cazuri
practice si se nlocuieste cu alte estimari mai eciente. De exemplu
p( 3 < f < 3) = (3)

( 3) = 2(3) = 0; 9973::

pentru f 2 N (0; 1) este o estimare mai buna ca cea data de inegalitatea lui Cebsev
p( 3 < f < 3)  0; 88::

5.1

Legea numerelor mari

Urm
atoare teorem
a este o ilustrare a aplic
arii inegalit
atii lui Cebsev.
Teorema 5.3 (Legea numerelor mari)Fie f1 ; f2 ; :::fn ; :: un sir de v.a. independente doua
cte doua si cu dispersiile marginite de aceeasi constanta: D(fn )  C; pentru orice n 2 N .
Atunci pentru orice  > 0 avem:



f1 + f2 + ::: + fn M (f1 ) + ::: + M (fn )
 =1
lim p
(5.2)

n!1
n
n

Mai precis


f1 + f2 + ::: + fn
p
n



M (f1 ) + ::: + M (fn )
 1
n

C
n2

(5.3)

(fn )
n
Demonstratie. Fie gn = f1 +f2 +:::+f
. Avem M (gn ) = M (f1 )+:::+M
si D(gn ) =
n
n
1
C
(D(f
)
+
:::
+
D(f
))

.
Inegalitatea
lui
Ceb
s
ev
pentru
g
d
a
(5.3)
iar
prin
trecere la
1
n
n
n2
n2
limit
a se obtine (5.2).
QED.
Teorema se interpreteaz
a astfel: oricare ar  > 0, dac
a n este sucient de mare, atunci
functia (f1 + f2 + ::: + fn )=n difer
a cu mai putin de  de constanta (M (f1 ) + ::: + M (fn )) =n
pe o multime cu probabilitate foarte aproape de 1. Dac
a f1 ; :::fn ; :: au aceeasi medie m atunci
avem:

Corolarul 5.4 Fie v.a f1 ; f2 ; :::fn ; :: cu aceeasi medie m si dispersiile marginite de C. Atunci
pentru orice  > 0 avem:



f1 + f2 + ::: + fn



lim p
m   = 1
(5.4)
n!1
n
Un alt caz particular este:


LECTIA
5. LEGI LIMITA

62

Corolarul 5.5 (teorema lui Bernoulli) Fie n numarul de aparitii ale unui eveniment A n
n experiente independente. Probabilitatea de realizare a lui A ntr-o singura experienta este
2 [0; 1]. Atunci pentru orice  > 0 avem

 



lim p n   = 1
(5.5)
n!1
n
Observatia 5.6 Cu alte cuvinte pentru un  > 0 orict de mic, daca numarul de experiente
n este sucient de mare atunci frecventa relativa nn este aproape sigur n jurul probabilitatii
p de aparitie a evenimentului ntr-o singura experienta.
Demonstrtie. Fie sirul de v.a.

1 ,dac
a la experienta n s-a realizat A
fn (!) =

0 ; dac
a la experinta n s-a realizat A

(5.6)

Aici ! este un sir de experiente independente. Fiecare v.a. fn are diagrama




1 0
fn

cu = 1

. Toate variabilele fn au mediile si dispersiile . Tinnd

seama c
a
(f1 + f2 + :: + fn ) = n

prin aplicarea formulei (5.4) rezult


a teorema lui Bernoulli.
O alt
a demunstratie se poate da astfel:
i) n are o distributie Bernoulli cu p(n = k) = Cnk k n k .
ii)M (n ) = n si D(n ) = n deci M ( nn ) = si D( nn ) =
.
n
iii)Aplicnd teorema lui Cebsev lui n =n g
asim


D(n )


1  p( n  )  1
n
2
pq
1
= 1
1
!1
2
n
4n2
cnd n ! 1, pentru c
a = (1 )  41 atunci cnd 0   1.
QED.
Observatia 5.7 Avem
X

sau

j nk

Cnk k n

pj

k
n



= p( n
n

j>

Cnk k n



 )  1
k

(5.7)

1
4n2

(5.8)

1
4n2

Datorit
a frecventei schemei binomiale si dicult
atii de a calcula Cnk k n
tehnici de calcul aproximativ, mai rapide, pentru aceste m
arimi.

(5.9)
k

s-au dezvoltat


LECTIA
5. LEGI LIMITA

5.2

63

Teoreme limit
a central
a

Avem nevoie n continuare de urm


atoarea formul
a pentru factorial:


p
n n n
n! = 2n
 e 12n , 0 < n < 1
e

numit
a formula lui Stirling. Demonstratia acestei formule se poate g
asi ntr-un curs de
Analiz
a matematic
a.
Teorema 5.8 (fornula locala de Moivre-Laplace)Fie 0 < p < 1 si xk =
Atunci
Cnk pk q n k
!1
x2
k
1
1
p
2
p
e
npq 2

k np
p
,
npq

q = 1

p.

(5.10)

cnd n ! 1 , uniform pentru a  xk  b, cu a si b nite.


Demonstratie. Avem:
p

npqCnk pk q n k

npq

n
2k(n

n n pk q n k
k) k k (n k)n

 en;k

(5.11)

unde n;k = nn kk nn kk .


np
i) Din a  kpnpq
 b deducem:

r
q
p
k  np + a npq = np(1 + a
)
np
r
q
p
k  nq b npq = nq(1 b
)
nq

deci:
n k
n k
1 1 1
1
+
+
< ( + +
)<
n
k
n k
12 n! k n k
1
1
p pq +
p pq
1+
p+a n
q
n

0 < jn;k j <


<

1
12n

Prin urmare n;k tinde uniform la zero cnd n ! 1 si a  xk  b, deci en;k tinde uniform la
1.
p
asim:
ii) Scriind c
a k = np + xk npq, g
r v
r
n
1u
1
1
p
u
npq
=
q 
q !p
t
q
q
2k(n k)
2
2
1 + xk np
1 xk np


LECTIA
5. LEGI LIMITA

64

uniform pentru a  xk  b.
iii) Mai avem n (5.11) de aat limita lui
n n pk q n

An;k =
Avem:
ln(An;k ) =
=
=

k)n

k k (n

!
 np k  nq n k
ln

k
n k
 


k
n k
k ln
(n k) ln
np
nq


p
np + xk npq
p
(np + xk npq) ln
np


p
nq xk npq
p
(nq xk npq) ln
nq

r 
q
p
(np + xk npq) ln 1 + xk
np

r 
p
p
(nq xk npq) ln 1 xk
nq

Dezvoltnd Taylor cei doi logaritmi, g


asim:
ln(An;k ) =



 r
q
1
1 x2k q
(np + xk npq) xk
+O
np 2 np
n3=2



r
1
1 x2k p
p
p
(nq xk npq)
+O
xk
nq 2 nq
n3=2
p

deoarece xk sunt m
arginiti de a si b. Dup
a ce facem nmultirile si reducem termenii rezult
a:


x2k
1
ln (An;k ) =
+O p
2
n

Deci

An;k = e

x2
k
2

eO(1=

Folosind limitele de la i), ii), iii) g


asim:
p

npqCnk pk q n

n)

!e

1
!p e
2

x2
k
2

x2
k
2

uniform pentru a  xk  b.
QED.
In gura urm
atoare apar pentru n = 20 si n = 40, p = 3=4, q = 1=4 att valorile Cnk pk q n
ct si gracelel functiilor

p 1 p1 e
npq 2

(x np)2
2npq

care pentru x = xk au ca valoare

p 1 p1 e
npq 2

x2
k
2


LECTIA
5. LEGI LIMITA

65
0.2

0.2
0.175
0.15

0.15

0.125
0.1

0.1

0.075
0.05

0.05

0.025
0
5

10

15

20

10

15

20

1 p1
Probabilit
atile Cnk pk q n k si gracele functiilor pnpq
e
2
pentru p=3/4 si n=20 respectiv n=40

25

30

35

40

(x np)2
2npq

Teorema de Moivre-Laplace local


a se mai poate scrie
p
npqCnk pk q n

1
=p e
2

x2
k
2

(1 + n;k )

cu n;k ! 0 cnd n ! 1; uniform pentru k astfel nct -1 < a  xk  b < 1.


Forma sub care se utilizeaz
a cel mai frecvent acest rezultat este:
Teorema 5.9 (formula integrala de Moivre-Laplace) Fie 0 < p < 1; q = 1
Z b
X
x2
1
k k n k
lim
Cn p q
=p
e 2 dx
n!1
2 a
k np

p. Atunci:
(5.12)

a pnpq b

limita ind uniforma n -1  a  b  1.


Demonstratie(schita) Consider
am cazul a si b nite. Fie xk =
se scrie:
X p
1
npqCnk pk q n k p
npq
ax b

k np
p
.
npq

Suma din teorem


a
(5.13)

x2
p
k
Dar conform formulei locale npqCnk pk q n k = p12 e 2 (1 + n;k ) cu jn;k j  n ! 0 indepen1
dent de k, dac
a a  xk  b si xk xk 1 = pnpq
. Deci

npqCnk pk q n

1
= p e
2
1
= p e
2

x2
k
2
x2
k
2

+ n;k e
+ 0n;k

x2
k
2


LECTIA
5. LEGI LIMITA

66

Deci suma (5.13) se scrie:


X

1
p e
2
axk b

x2
k
2

(xk

xk 1 ) +

n;k e

x2
k
2

(xk

xk 1 )

axk b

Rb
x2
Prima sum
a de mai sus tinde cnd n ! 1 c
atre a p12 e 2 dx = (b) (a) iar a doua e
majorat
a de n (b a) deci tinde la zero cnd n ! 1. Prin urmare teorema e demonstrat
a
pentru a si b nite. O examinare mai atent
a a situatiei arat
a c
a teorema este adev
arat
a si
pentru a sau b innite, iar limita este uniform
a n a si b.
QED.
Care sunt valorile n pentru care aproximarea probabilit
atilor Cnk pk q n k prin formulele de
Moivre-Laplace este sucient de bun
a? In general se consider
a c
a:
1
i) n 30 p 2 , atunci formulele de Moivre-Laplace dau o aproximatie satisf
ac
atoare.
1
ii) n 30 , p 10
np =   10 atunci formulele distributiei Poisson dau o
k
aproximatie sucient de bun
a: Cnk pk q n k  e  k! .
1
iii)n  30 p  10
np  10 atunci sunt satif
ac
atoare formulele de MoivreLaplace, adic
a Cnk pk q n

'

x2
k
2

p 1 p1 e
npq 2

Exemplul 5.10 O rma de asigurari a distribuit polite de asigurare la 10.000 de persoane


de aceeasi vrsta si grup social contra unei sume de 20.000 lei si n caz de accident rma i
plateste persoanei 2.000.000 lei. Probabilitatea de accident pentru acest grup de persoane este
p=6/1000.
a)Care este probabilitatea ca rma sa dea faliment?
b)Care e probabilitatea ca rma sa cstige cel putin 50 milioane lei?
Solutie. a)Firma ncaseaz
a 200 milioane lei. Probabilitatea de a da faliment este probabilitatea ca s
a pl
ateasc
a mai mult de 200 milioane lei, adic
a num
arul celor accidentati s
a
dep
aseasc
a 100. Avem o schem
a binomial
a cu n=10.000, p=0,006, np=60, q=0,994. Se cere
suma probabilit
atilor Cnk pk q n k pentru k 100. Conform formulei de Moivre-Laplace avem:
X
X
Cnk pk q n k
Cnk pk q n k =
k100

100 np
np
np
p
p
 kpnpq
n
npq
npq

p
p

10000 60
100000;0060;994

100 60
100000;0060;994

= (1287)

1
p e
2

x2
2

dx

(5; 17)  0; 5

Probabilitatea de a da faliment este aproape zero.

0; 5 = 0


LECTIA
5. LEGI LIMITA

67

b) Firma cstig
a cel putin 50 milioane dac
a pl
ateste sub 150 milioane, deci dac
a num
arul
celor accidentati este sub 75. Probabilitatea cerut
a este deci

p =

k np
np
p
p
= 75
npq
npq

Cnk pk q n

k75

Cnk pk q n

k np
0 np
p
=p
npq
npq

75 100000;006
x= p100000;0060;994

0 100000;006
x= p100000;0060;994

1
p e
2

x2
2

dx =

1;371
5;485

1
p e
2

x2
2

dx

= (1; 942) ( 7; 769) = (1; 942) + (7; 769)


= 0; 474 + 0; 5 = 0; 974
Prin urmare c
astigul va de peste 50 milioane cu o probabilitate foarte mare.
Alte exemple de aplicare a formulelor de Moivre-Laplace sunt date n exercitii.
Teoremele de Moivre-Laplace fac parte dintr-o clas
a mai larg
a de teoreme cunoscute sub
numele de teoreme limit
a central
a. S
tim c
a n anumite conditii media unui sir de variabile
aleatoare independente tinde spre o constant
a (legea numerelor mari). Cum tinde aceast
a
medie de variabile aleatoare spre o constant
a? Fie sirul de v.a independente fn dat de (5.6).
Atunci n = f1 + f2 + ::: + fn are o distributie Bernoulli, deci p(n = k) = Cnk pk q n k . Pe de
n
! p. Pe de alt
a parte
o parte stim din legea numerelor mari c
a f1 +f2 +:::+f
n
!
(f1 M (f1 )) + (f2 M (f2 )) + ::: + (fn M (fn ))
pPn
p a
<b
k=1 D(fk )




M (f1 )+::+M (fn )
f
+::+f
n
n
1
= p a  pPn
<b
n
n
k=1 D(fk )
!
f1 + f2 + :: + fn np
pPn
<b
= p a
k=1 pq



r 
n f1 + f2 + :: + fn
= p a
p <b
pq
n


X
n np
= p a p
p (n = k)
<b =
npq
k np
a pnpq b

np
a kpnpq
b

Cnk pk q n k

1
!p
2

x2
2

dx. (cf. 5.12)

n
Prin urmare variabila aleatoare f1 +f2 +:::+f
p se comport
a, pentru valori mari ale lui n
n
p
ca o variabil
a aleatoare normal
a, de tip N (0; 1) multiplicat
a cu pq
. Acest fenomen este mai
n
general.


LECTIA
5. LEGI LIMITA

68

Anume, relatia:
p a


(f1

M (f1 )) + (f2 M (f2 )) + ::: + (fn


pPn
k=1 D(fk )


n

= p a  pPn
k=1 D(fk )
Z b
x2
1
n!1
! p
e 2 dx
2 a

f1 +::+fn
n

M (f1 )+::+M (fn )


n

M (fn ))

<b

<b

!
(5.14)

are loc dac


a:
Varianta I: (fk )k2N este un sir de v.a. pe acelasi cmp X, independente dou
a
cte dou
a, cu aceeasi functie de repartitie, cu dispersie nit
a si nenul
a.
Varianta II: (fk )k2N este un sir de v.a. pe acelasi cmp X, independente dou
a
cte dou
a si
q


3
M jf1 M (f1 )j3 + ::: + M jfn M (fn )j3
pPn
=0
lim
n!1
k=1 D(fk )

Mai exist
a si alte variante de conditii necesare pentru ca relatia (5.14) s
a aib
a loc. Asemenea teoreme poart
a numele de teoreme limit
a central
a si pun n evidenta c
a n conditii foarte
generale medierea unui num
ar mare de v.a. independente conduce la o constant
a plus o
variabil
a aleatoare normal
a. Forma exact
a este relatia (5.14).

5.3

Rezumat

Prima carte de probabilit


ati a fost publicat
a n 1704 de J. Bernoulli unde a fost demonstrat
a
legea numerelor mari sub forma (5.5) si unde arm
a c
a s-a gndit 20 de ani la aceast
a teorem
a..
Ulterior au ap
arut generaliz
ari ale ei sub diverse forme, ca de exemplu (5.2). O demonstratie
elegant
a a acestor teoreme se bazeaza pe inegalitatea lui Cebsev (5.1).
In esenta legea numerelor mari spune c
a n conditii generale media unui num
ar mare de
v.a. independente difer
a putin de o constant
a. Acest lucru este exprimat precis prin formula
(5.3).
Teoremele de tip limit
a central
a aduc o pecizare legii numerelor mari. Anume, diferenta
dintre media unui sir de v.a. independente si constanta la care convege aceast
a medie este
aproximativ o v.a. normal
a, de tip N (0; 1) nmultit
a cu o constant
a care la rndul ei tinde la
zero. Forma matematic
a a acestui enunt este (5.14).
In aplicatii apare frecvent schema Bernoulli si deci calculul probabilit
atilor Cnk pk q n k .
Formulele de Moivre-Laplace (local
a 5.10 si global
a 5.12) ne pemit s
a calcul
am aproximativ
aceste probabilit
ati cu ajutorul densit
atii normale

p1 e
2

x2
2

(cazul local) sau primitivei ei,


LECTIA
5. LEGI LIMITA

69

atile legii
functia  (cazul global). In unele cazuri Cnk pk q n k se pot aproxima prin probabilit
k k n k
prin legea normal
a sau
Poisson. Limitele n care aproximatiile probabilit
atilor Cn p q
Poisson sunt considerate satisf
ac
atoare sunt date n pag. ??.
Formula lui Stirling este frecvent folosit
a pentru evaluarea factorialelor. Exist
a si o generalizare a ei pentru evaluarea functiei Gamma.
________________________________
FORMULE UTILIZATE FRECVENT:
)
a) Inegalitatea lui Cebsev: p (jf M (f )j  )  1 D(f
.
2


M (f1 )+:::+M (fn )
n
b) Legea numerelor mari: lim p f1 +f2 +:::+f


 1 nC2 dac
a

n
n
n!1



toate dispersiile sunt m
arginite de C; varianta Bernoulli: lim nn p   = 1
n!1
unde n este num
arul de aparitii ale unui eveniment A n n experiente independente iar p este probabilitatea de aparitie a lui
A ntr-un singur experiment.
p
k pk q n k
npqCn
c) Formula local
a de Moivre-Laplace: lim
= 1.
x2
n!1

d) Formula global
a de Moivre-Laplace: lim
n!1
0<p<1, q=1-p.

5.4

p1 e
2

k
2

np
a kpnpq
b

Cnk pk q n

p1
2

Rb
a

x2
2

dx,

Exercitii

1. Se arunca o moneda de 10000 ori. Care e probabilitatea ca banul sa apara de mai putin
4550 ori?
Indicatie. Se procedeaz
a ca n exemplul din lectie.
2. Probabilitatea de a lovi o tinta este p=1/1000. Care e probabilitatea ca din 5000 de
lovituri, tinta sa e atinsa de cel putin 2 ori?
Indicatie. Se utilizeaz
a de Moivre-Laplace.
3. Probabilitatea ca un anumit produs sa e defect este p=0,005. Care e probabilitatea ca
dintr-un lot de 10000 produse luate la ntmplare sa e mai putin de 70 defecte?
Indicatie. Se utilizeaz
a formula de Moivre-Laplace.
4. O rma de asigurari are m salariati cu un salariu mediu de s lei pe an. O persoana
asigurata cu a lei primeste o despagubire de d lei daca pateste ceva. Probabilitatea de a pati
ceva este p. a)Care este probabilitatea ca veniturile companiei sa e n acel an mai mari sau
egale cu c0 .b) Care e numarul minim de asigurati de la care rma nregistreaza un venit brut
mai mare ca c0 cu probabilitatea de cel putin 0,99?
Indicatie. Se utilizeaz
a formula de Moivre-Laplace.


LECTIA
5. LEGI LIMITA

70

5. Sa se demonstreze ca pentru x > 0 functia (x) =


x
e
1 + x2

x2
2

 (x) 

1
e
x

R1
x

t2
2

dt, satisface inegalitatile:

x2
2

x2

x
2
Indicatie. Pentru prima inegalitate se considet
a f (x) = 1+x
(x). Avem f (0) = 0.
2e
Se deriveaz
a si se studiaz
a variatia lui f. Analog pentru a doua inegalitate.

6. Doua vase identice contin ecare 1022 molecule. Vasele sunt puse n contact si moleculele se misca liber ntre vase. Dupa omogenizare, care e probabilitatea ca n vasul A sa e
cu a zece miliarda parte mai multe molecule ca n B? (admitem ca pentru ecare molecula
probabilitatea de a n A este egala cu probabilitatea de a n B si este 1/2).
Indicatie. Se utilizeaz
a formula de Moivre-Laplace si ex. precedent.
7. Pe scara unui bloc sunt 40 apartamente si n ecare apartament este cate un frigider
de putere 0,6 kW. In medie un frigider consuma energie electrica 3 ore din 24. Care este
probabilitatea ca la un moment dat sa e absorbita de la retea, de ctre frigidere, o putere mai
mare de 4 kW?
Indicatie. Se utilizeaz
a de Moivre-Laplace.
8. a) Sa se arate ca daca  > 0 si  > 0 sunt date ,iar n 
j

k
n

Cnk xk (1

x)n

xj>

1
42

atunci:



unde x 2 [0; 1].


b) Sa se arate ca daca f : [0; 1] ! R este continua, deci marginita jf j  M atunci ;  si
n ind ca la pct. a) avem:


X
k
n k
k k
2M  
Cn x (1 x)
f ( ) f (x)  2M 
n
k
j n xj>
c) Sa se arate ca n conditiile de la pct. b)
0
B X
! x;  @
Cnk xk (1 x)n
j nk xj

unde ! x;e este oscilatia functiei f pe intervalul [x


maximul functiei pe acest interval.

k
f( )
n

C
f (x) A  ! x;

; x + ], adica diferenta ntre minimul si


LECTIA
5. LEGI LIMITA

71

d) Folosind a), b) si c) sa se arate ca sirul de polinoame


Bn (x) =

Cnk xk (1

x)n

k=0::n

k
f( )
n

converge uniform la f pe [0; 1] oricare ar functia continua f. (polinoamele lui Bernstein).


Indicatie. a) Se utilizeaz
a inegalitatea lui Cebsev pentru schema Bernoulli (vezi
obs. 5.9).
k

b) Se tine seama de si de jf j  M . c) Se tine seama de f ( n ) f (x)  ! x; si
P
k k
x)n k = 1.
k=0::n Cn x (1
d) Se pune diferenta f (x) Bn (x) ca n b) si c) apoi se tine seama c
a f e uniform continu
a.
9. Sa presupunem ca f este o variabila aleatoare nenegativa, cu media m. Sa se arate ca
este adevarata inegalitatea
m
p (f  c) 
c
(inegalitatea lui Markov).
10. Fie  r momentul centrat absolut de ordin r al unei variabile aleatoare f care are
media m, denit prin  r = M (jf mjr ). Sa se arate ca
p (jf

mj  ") 

r
"r

11. Vrem sa vericam daca un zar este falsicat sau nu, cautnd care este probabilitatea
r de aparitie a fetei sase . Pentru aceasta alegem " = 0; 01, aruncam zarul de un numar n
de ori si observam care este numarul k de aparitii ale fetei sase.



Sa se determine o valoare ct mai mica pentru n astfel ca probabilitatea p nk r  "
sa e cel putin 0; 99 utiliznd:
a) inegalitatea lui Cebsev
b) formula integrala de Moivre-Laplace.
12. In problema acului lui Buon (vezi lectia 3, exercitii), probabilitatea de intersectare
2l
a paraleleor este p = a
unde l este lungimea acului iar
a este distanta dintre paralele. De
< 0; 01 sa e cel putin 0; 99. ( n este
cte aruncari este nevoie ca probabilitatea ca  2ln
ak
numarul de aruncari iar k este numarul de intersectari ale retelei de drepte paralele).

Lectia 6
Dependenta ntre variabilele aleatoare
6.1

Coecientul de corelatie

Denitia 6.1 Fie f1 ; f2 : X ! R doua v.a.


cu mediile m1 ; m2 si dispersiile D1 =  21 =

2
2
M (f1 m1 ) ; D2 =  22 = M (f2 m2 ) . Se numeste coecient de corelatie al variabilelor
aleatoare f1 ; f2 numarul:
c(f1 ; f2 ) =
Marimea cov (f1 ; f2 ) = M ((f1

M ((f1

m1 )  (f2

m )  (f2
p 1
D1  D2

m2 ))

(6.1)

m2 )) se numeste covarianta lui f1 si f2 .

Spunem c
a dou
a functii f1 ; si f2 coincid aproape peste tot (a.p.t.) dac
a p(f1 6= f2 ) = 0.
Importanta acestui coecient se va vedea n continuare.
Teorema 6.2 (Inegalitatea Cauchy-Buniakovski). Fie f1 ; f2 : X ! R doua v.a . cu momente
de ordinul doi nite. Atunci:


M 2 (f1 f2 )  M f12  M f22
(6.2)

Egalitatea poate avea loc daca si numai daca f2 = af1 sau f1 = af2 a.p.t. cu a=const.

Demonstratie. M (f1 + xf2 )2  0 pentru orice x 2 R, deci M (f12 ) + 2M (f1 f2 ) x +
M (f22 ) x2  0 pentru orice x. De aici rezult
a c
a discriminantul functiei de gradul doi este
2
2
2
a tocmai inegalitatea Cauchy-Buniakovski.
negativ:  = M (f1 f2 ) M (f1 ) M (f2 )  0 adic
Dac
a  = 0 atunci exist
a un x0 real, solutie a ecuatiei de gradul doi

M (f1 + x0 f2 )2 = 0
de unde rezul
a c
a (f1 + x0 f2 )2 ia valoarea zero pe o multime cu probabilitatea 1, adic
a f1 =
x0 f2 a.p.t.
72

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

73

a f2 = 0 a.p.t.,
In cazul n care inecuatia nu ar de gradul 2, deci M (f22 ) = 0, rezult
deci f1 f2 = 0 a.p.t., deci (6.2) are din nou loc deoarece ambii membri sunt 0. In acest caz
f2 = 0  f1 .
Teorema 6.3 Fie f1 ; f2 : X ! R doua v.a.
cu mediile m1 ; m2 si dispersiile D1 =  21 =

2
2
M (f1 m1 ) ; D2 =  22 = M (f2 m2 ) nite. Atunci:
a) c(f1 ; f2 ) 2 [ 1; 1].
b) c(f1 ; f2 ) = 1 este echivalent cu f1 = af2 + b sau f2 = af1 + b a.p.t. pentru niste
constante a si b potrivit alese.
c) f1 si f2 independente implica c(f1 ; f2 ) = 0 (dar nu si invers).
Demonstratie. a) Se aplic
a inegalitatea Cauchy-Buniakovski pentru f1 m1 si f2 m2 .
b) Dac
a c(f1 ; f2 ) = 1 atunci n inegalitatea Cauchy-Buniakovski semnul  devine = si
teorema precedent
a implic
a (f2 m2 ) = a (f1 m1 ) deci f2 = af1 +m2 am1 sau (f1 m1 ) =
a  (f2 m2 ) de unde rezult
a f1 = af2 + b pentru a si b potrivit alese.
c) f1 si f2 independente implic
a (f1 m1 ) si (f2 m2 ) independente deci:
M ((f1

m1 ) (f2

m2 )) = M (f1

m1 ) M (f2

m2 ) = 0  0 = 0

Prin urmare c (f1 ; f2 ) = 0.


QED.
Exemplul 6.4 Fie doua siruri nite de numere (xi )1in si (yi )1in . Sa consideram o
partitie a unei multimi X astfel: X = A1 [ A2 [ A3 [ :: [ An cu toate multimile Ai 6= ;.
Denim pe X o probabilitate prin p (Ai ) = n1 si e variabilele aleatoare f1 ; f2 : X ! R,
denite prin f1 (!) = xi daca ! 2 Ai si f2 (!) = yi daca ! 2 Ai . Avem :
Pn
Pn
yi
i=1 xi
m1 = M (f1 ) =
; m2 = M (f2 ) = i=1
n P
Pn n
2
n
(xi m1 )
(yi m2 )2
D1 = D (f1 ) = i=1
; D2 = D (f2 ) = i=1
n
n
Pn
(xi m1 ) (yi m2 )
m1;2 = M ((f1 m1 ) (f2 m2 )) = i=1
n
Pn
(x
m
)
(y
m
m1;2
i
1
i
2)
i=1
qP
c (f1 ; f2 ) = p
= qP
(6.3)
n
2
n
2
D1 D2
m1 )
m2 )
i=1 (xi
i=1 (yi

Conform teoremei precedente, egalitatea cu 1 a coecientului 6.3 este echivalent


a cu
f2 = af1 + b sau cu alte cuvinte yi = axi + b pentru toate valorile 1  i  n. Dac
a
jc (f1 ; f2 )j este sucient de aproape de unu atunci punctele (xi ; yi ) sunt aproximativ pe o
dreapt
a. Dreapta ce aproximeaz
a cel mai bine acest nor de puncte se numeste dreapta de
regresie a lui y n x si se determin
a prin metoda celor mai mici p
atrate. Aceast
a dreapt
a de

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

74

P
forma y = ax + b se determin
a din conditia ca
(yi axi b)2 s
a e minim
a (a se vedea
axi
lectia 8 sau lectia 14). Dac
a se caut
a dependente de forma yi = be , prin logaritmare se
g
aseste ln (yi ) = axi + ln (b). O asemenea dependenta exist
a, conform celor de mai sus dac
a
c (f1 ; ln (f2 )) = 1. Dac
a jc (f1 ; ln (f2 ))j este sucient de aproape de unu atunci punctele
(xi ; ln (yi )) sunt aproximativ pe o dreapt
a care se determin
a prin metoda celor mai mici
p
atrate.G
asim astfel a si ln (b) care ne dau dependenta ln (yi ) = axi + ln (b), adic
a yi = beaxi .

6.2

Variabile aleatoare bidimensionale

Fie (X;
; p) un  cmp de probabilitate si e f1 ; f2 : X ! R dou
a variabile aleatoare.
Leg
atura ntre variabilele aleatoare este pus
a n evidenta prin functia lor comun
a de repartitie.
2
2
S
a consider
am f : X ! R , denit
a prin f (!) = (f1 (!); f2 (!)) 2 R . Functia f are calitatea
c
a pentru orice produs de intervale I1  I2  R2 multimea f 1 (I1  I2 ) = f1 1 (I1 ) \ f2 1 (I2 ) 2

.
Denitia 6.5 Se numeste v.a. bidimensionala pe cmpul de probabilitate (X;
; p) o functie
f : X ! R2 cu proprietatea ca pentru orice intervale I1 si I2 din R, rezulta f 1 (I1  I2 ) 2
.
Vom mai spune uneori variabil
a aleatoare dubl
a n loc de variabil
a aleatoare bidimensional
a. Notnd f1 (!) si f2 (!) cele dou
a componente ale lui f , vedem c
a o v.a. bidimensional
a
este asociat
a unei perechi de v.a. unidimensionale.
Denitia 6.6 Se numeste functie de repartitie bidimensionala a lui f , functia F : R2 ! R
denita prin:

F (x1 ; x2 ) = p f 1 (( 1; x1 )  ( 1; x2 ))
= p ((f1 < x1 ) \ (f2 < x2 ))
Teorema 6.7 1)Functia de repartitie bidimensionala are proprietatile:
a) F este crescatoare n ecare argument.
b) F (x1 ; 1) = 0; F ( 1; x2 ) = 0; F (1; 1) = 1.
c) F este continua la stnga n ecare argument.
d) Pentru orice a1 < b1 si a2 < b2 avem
p ((a1  f1 < b1 ) \ (a2  f2 < b2 ))
= F (b1 ; b2 ) F (a1 ; b2 ) F (b1 ; a2 ) + F (a1 ; a2 )  0

(6.4)

2) Reciproc, orice functie F : R2 ! R cu proprietatile a)-d) de mai sus este functie de


repartitie pentru o v.a. bidimensionala potrivit aleasa.

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

75

a ff1 < x1 \ f2 < x2 g  ff1 < x01 \ f2 < x2 g. Lund


Demonstratie.a) x1 < x01 implic
a monotonia n
probabilit
atile ambilor membri g
asim F (x1 ; x2 )  F (x01 ; x2 ). Analog se arat
x2 :
b) Prin denitie F (x1 ; 1) = lim F (x1 ; x2 ). Ins
a pentru orice sir monoton x2;n ! 1
x2 ! 1

avem ff1 < x1 \ f2 < x2;n+1 g  ff1 < x1 \ f2 < x2;n g si

\ ff1 < x1 \ f2 < x2;n g = ; , deci

n=1;1

F (x1 ; x2;n ) ! 0, deci F (x1 ; 1) = 0. Analog se arat


a si celelalte egalit
ati.
c) Continuitatea la stnga se arat
a ca pentru v.a. unidimensionale (lectia 3).
d) Fie regiunile din x1 Ox2 ca n gura urm
atoare:
A = f(x1 ; x2 ) j
1 < x1 < a1 , a2  x2 < b2 g, etc.(vezi gura). Fie evenimentele:
A0 = f! 2 X j (f1 (!) ; f2 (!)) 2 Ag si analog B 0 , C 0 , D0 . Observ
am c
a D0 = (a1  f1 < b1 )\
(a2  f2 < b2 ). Avem p (A0 ) = F (a1 ; b2 ) F (a1 ; a2 ), p (C 0 ) = F (a1 ; a2 ), p (B 0 ) = F (b1 ; a2 )
F (a1 ; a2 ).
(a1,b2)

D
(a1,a2)

(b1,a2)

Scriem acum
F (b1 ; b2 ) = p (A0 [ B 0 [ C 0 [ D0 ) = p (A0 ) + p (B 0 ) + p (C 0 ) + p (D0 )
= F (a1 ; b2 ) F (a1 ; a2 ) + +F (b1 ; a2 ) F (a1 ; a2 ) + F (a1 ; a2 ) + p (D0 )
de unde rezult
a pentru p (D0 ) formula 6.4.
QED.
2
2
Denitia 6.8 Se numeste densitate
R x1 R x2de probabilitate a v.a. f : X ! R o functie  :2R ! R
pozitiva, integrabila, astfel ca 1 1 (t1 ; t2 )dt1 dt2 = F (x1 ; x2 ) pentru (x1 ; x2 ) 2 R F ind
functia de repartitie a lui f.

Vom mai numi  densitatea mixt


a a variabilelor f1 si f2 unde f = (f1 ; f2 ).
Teorema
R 1 6.9
R 1 1) Densitatea de probabilitate  are propriatatile:
a) 1 1 (t1 ; t2 )dt1 dt2 = 1.

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

76

Rb Rb
b) p ((a1  f1 < b1 ) \ (a2  f2 < b2 )) = a11 a22 (x1 ; x2 )dx1 dx2 .
2) Invers, orice functie  : R2 ! R pozitiva si integrabila cu proprietea a) de mai sus este
densitate de probabilitate pentru o v.a. bidimensionala potrivit aleasa.
Demonstratie. a), b) sunt evidente din denitie. Punctul 2) se poate demonstra lund
RbRd
X = R2 , probabilitatea unui paralelipiped [a; b)[c; d) se deneste prin a c (x1 ; x2 )dx1 dx2 ,
iar cele dou
a variabile aleatoare sunt f1 ; f2 : R2 ! R, f1 (x1 ; x2 ) = x1 , f (x1 ; x2 ) = x2 .
QED.
Cunoscnd F =functia de repartitie si  =densitatea de probabilitate bidimensional
a a lui
f = (f1 ; f2 ) putem calcula relativ usor diverse m
arimi legate de f1si f2 .
1. Functia F1 de repartitie a lui f1 este
Z 1
Z x1
(t1 ; x2 )dx2
(6.5)
F1 (x1 ) = p (f1 < x1 ) = F (x1 ; 1) =
dt1
1

iar densitatea este

1 (x1 ) =
2. Media lui f1 este
m1 = M (f1 ) =
3. Dispersia este

D (f1 ) =

x1 1 (x1 ) dx1 =

1
1

(6.6)

(x1 ; x2 )dx2 :

(x1

1
1

x1 (x1 ; x2 )dx1 dx2

(6.7)

m1 )2  (x1 ; x2 ) dx1 dx2 :

(6.8)

4. Formule analoage sunt valabile si pentru f2 . De exemplu


Z 1Z 1
x2 (x1 ; x2 )dx1 dx2
m2 = M (f2 ) =
1

5. Dac
a g : R2 ! R este o functie continu
a, atunci g (f1 ; f2 ) : X ! R dat
a de
g (f1 ; f2 ) (!) = g (f1 (!) ; f2 (!)) este o v.a. Media acestei v.a. se calculeaz
a cu densitatea
mixt
a prin
Z Z
M (g) =

6. In particular lund g = (f1 m1 ) (f2


g
asim pentru coecientul de corelatie:
c (f1 ; f2 ) = q
=

(6.9)

g(x1 ; x2 ) (x1 ; x2 ) dx1 dx2


m2 ) apoi g = (f1

m1 ) (f2 m2 ))
q

m1 ) 2
M (f2 m2 )2

m1 )2 si g = (f2

m2 )2

M ((f1

M (f1
R1 R1
(x1
1
1

m1 ) (x2 m2 )  (x1 ; x2 ) dx1 dx2


p
p
D (f1 ) D (f2 )

(6.10)

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

77

7. Dac
a f1 si f2 sunt independente atunci
F (x1 ; x2 ) = p (f < x1 \ f2 < x2 ) = p (f1 < x1 )  p (f2 < x2 ) = F1 (x1 )  F2 (x2 )

(6.11)

De aici rezult
a
 (x1 ; x2 ) = 1 (x1 )  2 (x2 ) :

(6.12)

Se vede usor c
a si reciproc este adev
arat: dac
a functia de repartitie ori densitatea de probabilitate se descompune n produs de dou
a functii, una depinznd de x1 si cealalt
a depinznd
de x2 atunci f1 si f2 sunt independente (exercitiu).
Dintre formulele de mai sus doar (6.9) mai necesit
a demonstratie, celelalte ind evidente.
a) Consider
am cazul cnd f1si f2 sunt m
arginite, deci f = (f1 ; f2 ) : X ! [a; b)  [c; d).
Diviz
am intervalele [a; b] si [c; d] prin x = (xi )0in respectiv y = (yj )0jmsi not
am
1
 = x  y ; jj = maxfjx j ; jy jg; Dij = [xi 1 ; xi )  [yj 1 ; yj ), Aij = f (Dij )  X.
Variabila aleatoare

g (xi ; yj ) dac
a ! 2 Aij
g (!) =
0
n caz contrar
este simpl
a, si tinde la g (f1 ; f2 ) atunci cnd jx j ! 0 si jy j ! 0. Deci
X
M (g ) =
g (xi ; yj ) p (Aij )
Z Z
X
=
g (xi ; yj )
 (x; y) dxdy
Dij
|
{z
}
=

p(Aij )


g (xi ; yj )   i ;  j (xi xi 1 ) (yj yj 1 )
|
{z
}
din teorema de medie
Z Z
g (x; y)  (x; y) dxdy
!

jj!0

[a;b][c;d]

b) Demonstratia se poate extinde acum si la cazul cnd f1si f2 nu sunt m


arginite dar
integrala (6:9) este convergent
a. Argumentele ind lungi, ns
a standard, nu le reproducem
aici.
Repartitiile pentru f1 si f2 se mai numesc repartitii marginale ale lui f ..
Exemplul 6.10 Fie D = [a; b]  [c; d]. O variabila aleatoare f = (f1 ; f2 ) cu valori n D care
are densitatea:

0
(x1 ; x2 ) 2
=D
 (x1 ; x2 ) =
1
(x1 ; x2 ) 2 D
aria(D)
se numeste uniforma. Conform celor de la pct. 6) rezulta ca f1 s f2 sunt independente.

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

78

Exemplul 6.11 Fie o v.a. (f1 ; f2 )bidimensionala cu densitatea:


p
det (A) 1 Q(x1 ;x2 )
 (x1 ; x2 ) =
e 2
2


a11 a12
este o matrice pozitiv denita iar
unde A =
a21 a22
Q (x1 ; x2 ) =

2
X

ai;j (xi

mi ) (xj

mj )

i;j=1

O astfel de variabila aleatoare se numeste normala. Se cere:


a)  21 = D (f1 ) si  22 = D (f2 ); b) c (f1 ; f2 ).
RR
Solutie. a) Avem nevoie de M (f1 ) =
x1  (x1 ; x2 ) dx1 dx2 . Se stie c
a matricea A este
simetric
a. Pentru aceste integrale este util
a urm
atoarea schimbare de coordonate:
i) Se determin
a 1 si 2 valorile proprii ale matricei A, din ecuatia:



a11  a12
=0

a21
a22 

ii) Se determin
a vectorii proprii ai matricei
normalizeaz
a. Acesti vectori pusi pe
 A si se 
r11 r12
; Rt = R 1 .
dou
a coloane dau o matrice ortogonal
aR=
r
21 r22


 0 


1 0
x1
x1 m1
t
iii) Se stie c
a R AR =
. Prin
=R
. Facem schimbarea
x2 m2
0 2
x02
D(x1 ;x2 )
02
aceast
a schimbare Q devine Q (x1 ; x2 ) = 1 x02
1 + 2 x2 iar iacobianul D(x0 ;x0 ) = det (R) = 1.
1 2
Avem de asemenea det (A) = 1 2 . Toate aceste lucruri se studiaz
a la cursul de algebr
a
R1
R 1 2 x2
R1
x2
x2
1
1
1
2
liniar
a. Utiliznd p2 1 e 22 dx = 1, p2 1 x e 22 dx =  , p2 1 xe 22 dx = 0,
(a se vedea lectia 4, legea normal
a) g
asim:
iv)
p

Z
Z
1 02 2 02
1 2 1 0 1
M (f1 ) =
(m1 + r11 x01 + r12 x02 ) e 2 x1 2 x2 dx02
dx1
2
1
p
p 1
Z 1
Z 1
2 02
1 02
1
2
x1
0
2
e 2 x2 dx02 = m1
dx1 
= p  p  m1 
e
2
2
1
1
Analog g
asim M (f2 ) = m2 .
Putem acum calcula dispersiile.

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

79

a)
Z Z

(x1 m1 )2  (x1 ; x2 ) dx1 dx2


p
Z Z
1 x02
1
1 2
2
2
=
(r11 x01 + r12 x02 ) e
2
1
1
2
2
= r11

+ r12

1
2

 21

2 x02
2

dx01 dx02

2
2
 11 + r22
In mod analog g
asim  22 = r21
 12
b) Covarianta lui f1si f2 este:
p
Z Z
02
1 x02
1 2 x 2
1 2
2
cov (f1 ; f2 ) =
dx01 dx02
(r11 x01 + r12 x02 ) (r21 x01 + r22 x02 ) e
2
p
Z Z
 1 x021 2 x022 0 0
1 2
02
2
dx1 dx2
r11 r21 x02
+
r
r
x
=
12 22 2 e
1
2
1
1
= r11 r21 
+ r12 r22 
1
2

. De aici 
rezult
a c (f1 ; f2 ) si punctul b) e terminat. Mai remarc
am c
a deoarece Rt AR =
1 0
, rezult
a
0 2
A

6.3

=R

1
1

0
1
2

R =

 21
cov (f1 ; f2 )
cov (f1 ; f2 )
 22

Functia de repartitie conditionat


a

In aceast
a sectiune (X;
; p) este un cmp de probabilitate, f : X ! R o v.a. cu functia de
repartitie F;iar ; sunt numere reale pozitive. Dac
a exist
a urm
atoarea limit
a
p (B \ (x  f < x + ))
; !0
p (x  f < x + )
p (B \ (x  f < x + ))
= lim
; !0
F (x + ) F (x )
lim

atunci o not
am p (Bjf = x). Putem da acum denitia:
Denitia 6.12 Daca x 2 R si B 2
, numim probabilitatea lui B conditionata de f = x
marimea p (B j f = x).

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

80

=x))
E posibil ca p (f = x) = 0 si deci s
a nu putem deni p (Bjf = x) = p(B\(f
asa ca
p(f =x)
n lectia 1. In asemenea situatie aplic
am trecerea la limit
a de mai sus. Ca functie de B,
p ( jf = x) este o probabilitate nit aditiv
a pe o subalgebr
a a lui
. Dac
a nu exist
a pericol
de confuzie vom scrie p (B j x) n loc de p (B j f = x).
Fie g : X ! R este o v.a. iar h : X ! R2 h = (f; g) o v.a. dubl
a care are functia de
repartitie H: Vom nota cu f densit
atile care se refer
a la f , cu g densit
atile care se refer
a la
g, cu  densitatea variabilei bidimensionale (f; g). Not
am

G (t j f = x) = p (g < tjf = x)
p ((g < t) \ (x  f < x + ))
= lim
; !0
p ((x  f < x + ))
H (x + ; t) H (x ; t)
= lim
; !0 H (x + ; 1)
H (x ; 1)

(6.13)

dac
a limita exist
a. Dac
a limita exist
a n orice t 2 R si are ca functie de t propriet
atile unei
functii de repartitie, atunci denim:
Denitia 6.13 Se numeste functia de repartitie a lui g conditionata de f = x functia
G (  jf = x) : R ! R denita prin (6:13).
Se vede c
a dac
a H este derivabil
a, cu densitatea  avem
Rt
@H(x;t)
 (x; y) dy
@x
G (tjf = x) = @H(x;1) = R 11
 (x; y) dy
1
@x

(6.14)

Functiile G () si G (  jf = x) sunt diferite. Se utilizeaz


a frecvent deosebirea functiilor prin
semn
atura lor, adic
a prin tipul de argumente, chiar dac
a pentru nume se utilizeaz
a acelasi
simbol. Dac
a nu exist
a pericol de confuzie vom scrie si G (tjx) n loc de G (tjf = x).
Denitia 6.14 Se numeste densitate de probabilitate
R t a lui g conditionata de f = x o functie
reala g ( jf = x), integrabila, pozitiva, astfel ca 1 g (yjf = x) dy = G (tjf = x).
O asemenea densitate nu exist
a ntotdeauna. Dac
a exist
a atunci n punctele ei de continuitate avem:
@G (tjf = x)
 (x; t)
(cf. 6.14)
= g (tjf = x) = R 1
@t
 (x; y) dy
1

S
i aici vom scrie g (tjx) sau  (tjx)n loc de g (tjf = x) dac
a nu exist
a pericol de confuzie.
In studiul probabilit
atilor conditionate din lectia 1, cele mai importante formule studiate au fost formula probabilit
atii totale si formula lui Bayes. Cum arat
a aceste formule n
contextul prezent?
1. Formula probabilit
atii totale:

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
Dac
a p (Bjx) este o functie continu
a atunci
Z
Z 1
p (Bjf = x) dF (x) =
p (B) =
1

81

p (Bjf = x) f (x) dx

n particular
G (t) =

G (tjf = x) dF (x) =

G (tjf = x) f (x) dx

1. Formula lui Bayes


f (x) g (yjf = x)
 (yjf = x) f (x) dx
1 g

f (xjg = y) = R 1

Dac
a nu exist
a pericol de confuzie putem scrie:

 (x)  (yjx)
 (yjx)  (x) dx
1

 (xjy) = R 1

Nu insist
am asupra demonstratiilor acestor formule. Ele se pot obtine prin divizarea intervalului unde se g
asesc valorile lui x, aplicarea formulei clasice a probabilit
atii totale sau a lui
Bayes asa cum au fost studiate n lectia 1 si trecerea la limit
a pentru diviziuni din ce n ce
mai ne.

6.4

Distributia sumei si ctului

Fie f; g : X ! R dou
a v.a. si h : X ! R2 ; h = (f; g) cu repartitia H si densitatea . Care
este repartitia sumei f+g si a ctului fg n eventualitatea c
a g 6= 0? In general dac
a r este o
2
functie continu
a r : R ! R atunci repartitia lui r (f; g) este:
Z Z
Fr(f;g) (t) = p (r (f; g) < t) =
 (x; y) dxdy
(6.15)
r(x;y)<t

Pentru sum
a si produs avem formule mai precise. Alte exemple sunt date la exercitii.

6.4.1

Distributia sumei

In conditiile de mai sus suma f + g are distributia


Z Z
Z
Ff +g (t) = p (f + g < t) =
 (x; y) dxdy =
x+y<t

du
1

1
1

 (v; u

v) dv

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

82

Am utilizat schimbarea u = x + y; v = x. Dac


a f; g sunt independente atunci  (x; y) =
f (x) g (y) si densitatea sumei devine
Z 1
0
f (v) g (t v) dv
(6.16)
f +g (t) = Ff +g (t) =
1

ceea ce se numeste produsul de convolutie al densit


atilor f si g .

6.4.2

Distributia ctului

Fie f si g ca mai nainte si n plus g6= 0. In aceste conditii ctul fg are distributia:


Z Z
Z Z
f
F f (t) = p
<t =
 (x; y) dxdy +
 (x; y) dxdy
g
g
=

dy

y>0;x<ty

ty

 (x; y) dx +
1

dy

y<0;x>ty
1

 (x; y) dx

ty

Prin derivare n raport cu t g


asim
 f (t) =
g

1
1

jyj  (ty; y) dy

In particular pentru f si g independente g


asim:
Z 1
 f (t) =
jyj  f (ty)  g (y)  dy
g

6.5

(6.17)

(6.18)

Distributia Student

Exemplul 6.15 Fie f normala de tipul N (0; ) iar g o variabila 2 de tipul H (s; ), independenta de f. Se cer:p
a) Densitatea lui gs :
b) Densitatea lui h = pf g .
s

c) Momentele lui h.

Solutie. Densitatea lui f este


f (x) = p

1
e
2

x2
2 2

iar a lui g este


g (y) =

1
2

s
2

s

s
2

y 2

y
2 2

pentru y>0 si 0 n caz contrar:

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

83


< y = p (g < y 2 s) = Fg (y 2 s) ; pentru y > 0 si 0 pentru y  0. Prin
s
p
urmare densitatea lui gs este
a) Fp g (y) = p

pg


d p
F g (y) = 2syFg0 y 2 s
s
dy

s
2sy
= 2syg y 2 s = s s s  y 2 s 2
22 
2

p g (y) =
s

pentru y>0 s 0 pentru y 0.


b) Conform cu (6.18) avem pentru h = pf

g=s

h (t) =
=

yp

=
=

1
e
2
s

2s 2
2
2
2

s+1 p
 s+1
2

s+1
2

s+1
2

y2 s
2 2

densitatea

jyj  f (ty)  g (y)  dy

1
1

p
p

( 2s )

sy 2
2sy
s 2 2s 1
2 2 dy

e
y
s
2  s 2s
Z 1 (t2 +s)y2
2 2
y s dy (schimb
am sy 2 = u)
e

t2 y 2
2 2

1
s s+1

s
2

1
s s+1

s
2

s
2



2
1+ ts
2 2



s+1
2
2

1+ ts
2 2

s+1
2

du

s+1
2

=p
 s+1
s
2

 

t2
 1+
s
s
2

s+1
2

c) Media lui h, M (h) ; este zero, h avnd densitatea par


a. Pentru momentele lui h folosim
denitia:
Z
Z
Mk (h) =

x h (x) dx =

(x

M (h))k h (x) dx = k (h)

Rezult
a momente de ordin impar zero. Inlocuind pe h (x) cu expresia de mai nainte s
2
u
f
acnd schimbarea xs = u si apoi 1+u
= y ajungem la
 k+ 1 Z 1
s+1
s
s 2
1
2

2k = p
y (k+ 2 ) 1 (1 y)( 2 k) 1 dy
s
s 2 2 0
 k+ 1


s+1
s
k + 12
s 2
k
2
2


= p
s+1
s 2s 2

2
s
1
k
k
+
k
s
2
2
= p
s

2
=

(s

sk 1  3  ::  (2k 1)
2)  (s 4)  ::  (s 2k)

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

84

dac
a 2k < s. Pentru celelalte valori ale lui k momentele nu exist
a.
Denitia 6.16 O variabila aleatoare cu densitatea
 (t) = p

s+1
2

s

 

t2
 1+
s
s
2

s+1
2

se numeste variabila Student.Tipul acesta de v.a. l notam S (s). Gracul acestei densitati
se gaseste la lectia 4.
O asemennea variabila aleatoare
este raportul dintre o variabila normala cu media zero si
pg
2
dispersia  pe de o parte si
unde g este o variabila de tipul H (s; ) adica 2 cu s grade
s
de libertate obtinuta ca suma a s patrate de variabile normale de tip N (0; ) (vezi lectia 4),
pe de alta parte.

6.6

Distributia Snedecor-Fisher

Exemplul 6.17 Fie f1 si f2 doua variabile aleatoare independente de tip H (n1 ; ) si H (n2 ; ).
=n1
Se cere densitatea variabilei g = ff21 =n
.
2
Solutie. f1 si f2 sunt variabile 2 . Deoarece ele sunt independente densitatea variabilei
h = (f1 ; f2 ) este
(
n1
n
x+y
1
1 22 1
y
e 2 , x; y > 0
n1 +n2 n +n
n2 x 2
n1
1
2 (

)
(
)
2
2
 (x; y) = f1 (x) f2 (y) =
2 2
0;
^{n rest
dac
a x  0 , y  0 si 0 n rest. Aplicnd aceeasi tehnic
a precum n exemplul precedent rezult
a
:
8   n1

 n1 +n
2
2
< n1 2
2
( n1 +n
) n21 1
n1
2
1 + n2 x
;x>0
x
n2
(6.19)
g (x) =
( n21 ) ( n22 )
:
0;
in rest

dac
a x  0 si 0 n caz contrar.

Denitia 6.18 O variabila aleatoare cu densitatea (6.19) se numeste variabila SnedecorFisher. Acest tip l vom nota S (n1 ; n2 ).

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

6.7

85

Exercitii

1. Fie sirul de date


x= 1 3
y= 0 4

1 4 7 9
3 8 12 18

a)Care este coecientul de corelatie ntre aceste siruri de date?


b) Daca este mai mare de 0.95, sa se determine prin metoda celor mai mici patrate dreapta
de regresie a lui y n x.
Indicatie. Coecientul de corelatie (6.3) este 0; 99 deci punctele sunt aproximativ pe o
dreapt
a.
2. Fie sirul de date
x = 1
1; 5
2
2; 5
3
y = 3; 3 4; 23 5; 44 6; 98 8; 96
Sa se studieze existenta unei dependente de forma y = beax ntre date.
Indicatie. Valorile lui ln (y) sunt
1; 19 1; 44 1; 69 1; 94 2; 19
Coecientul de corelatie ntre x s ln (y) este aproximativ 1, prin urmare ln (y) = ax + d deci
y = ed eax = beax . Prin metoda celor mai mici p
atrate g
asim a = 0; 5 d = 0; 69 deci b = 2.
3. Variabilele aleatoare independente f 1 si f2 sunt uniform distribuite n [0; 1]. Se cer:
a) Distributiile pentru min(f1 ; f2 ) si max(f1 ; f2 ).
b) Distributia sumei f1 + f2 .
Indicatie. Variabila dubl
a (f1 ; f2 ) are densitatea  (x; y) = 1 n (0; 1)  (0; 1) si 0 n rest.
Fie F functia de repartitie a lui min(f1 ; f2 ). Avem

F (x) = p (f1 < x [ f2 < x) = 1 p f1 < x [ f2 < x
= 1 p (f1  x \ f2  x) = 1 p (f1  x)  p (f2  x)
= 1 (1 x) (1 x)
pentru x 2 [0; 1]. In mod analog se calculeaz
a repartitia lui mmax(f1 ; f2 ). Pentru sum
a se
foloseste formula (6.16)
4. Fie X si Y doua v.a. cu coecientul de corelatie r. Care este coecientul de corelatie
al variabilelor aX + b si cY + d, unde a; b; c; d 2 R ?
5. Numarul de masini pe soseaua Bucuresti-Ploiesti, dinspre Bucuresti spre Ploiesti, ntrun interval de timp I este o variabila Poisson cu parametrul 1 , iar numarul de masini n

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

86

sens contrar, n acelasi interval de timp, este o variabila Poisson cu parametrul 2 . Daca
cele doua v.a. sunt independente, care este distributia numarului total de masini pe sosea n
acelasi interval de timp?
6. Un cuplu de v.a. f = (f1 ; f2 ) are densitatea dubla
 4(x+3y)e x 3y
; dac
a x0 y0
5
 (x; y) =
0
^{n caz contrar
i) Sa se determine densitatile marginale pentru f1 si f2 .
ii) Sa se calculeze densitatea conditionala a lui X daca Y=y.
ii) Sa se calculeze coecientul de corelatie dintre X si Y.
7. Se trage asupra unei tinte plane asezate n (0; 0). Masuratorile indica o distributie
normala a absciselor X a punctelor de impact de tip N (0; 2) si la fel pentru ordonatele Y .
De asemenea X si Y sunt
p independente. Se cer:
a) Distributia distantei X 2 + Y 2 de la punctul de impact pna la tinta.
b) Probabilitatea ca o lovitura specicata sa cada n discul X 2 + Y 2  4.
c) Probabilitatea ca din 4 lovituri cel putin una sa cada n discul X 2 + Y 2  4.
d) Probabilitatea ca din 100 lovituri cel putin 25 sa cada n discul X 2 + Y 2  4.
x2

y2

x2 +y 2

1
1
1
2 (x) = p22
Indicatie. a) 1 (x) = p22
e 8
e 8 deci  (x; y) = 8
e 8 . Fie F (t)
p
functia de repartitie a lui X 2 + Y 2 . Avem pentru F (t) = 0 pentru t < 0 iar pentru t  0:
Z Z

x2 +y 2
1
2
2
2
F (t) = p X + Y < t =
e 8 dxdy
8
x2 +y 2 <t2

si se trece la coordonate polare. b) Probabilitatea


este p = F (2). c) Probabilitatea c
autat
a
P100
n k
4
k
k
si se foloseste formula integral
a
este 1 (1 p) . d) R
aspunsul este k=25 C100 p (1 p)
de Moivre-Laplace.
8. Perechea de v.a. (f1 ; f2 ) admite densitatea dubla  (x; y) =

1
1
.
2 (1+x2 +y 2 )3=2

Se cere:

a) Sa se arate ca f1 si f2 sunt v.a. de tip Cauchy, adica au densitatea  (x) =


b) Sa se calculeze p (f12 + Rf22  4).
1
Indicatie. a) 1 (x) = 1  (x; y) dy = :::. b) Se procedeaz
a ca la punctul a) de la problema precedent
a.
1 1
.
 1+x2

9. Durata de viata a unui bec ce functioneaza continuu este o variabila aleatoare cu


densitatea

e t t  0
 (t) =
0
t<0

Intr-un anumit loc trebuie sa functioneze continuu un bec si se dispune de un numar de 10


becuri pentru nlocuire n caz ca cel n functiune se defecteaza. Se cer:

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE

87

a) Valoarea lui  daca durata medie de viata a unui bec este de 20 zile (ziua va n problema
unitatea de masura pentru timp).
b) Sa se arate ca daca f1 si f2 sunt independente, cu densitatea  atunci f1 +f2 are densitatea
 2 t
 te
t0
1 (t) =
0
t<0
c) Sa se arate ca daca f1 ; f2 ; :::fn sunt independente si au densitatea  de mai sus, atunci
f1 + f2 + ::: + fn are densitatea
( nn 1
 t
e t t  0
(n 1)!
n (t) =
0
t<0
d) Care e probabilitatea ca prin nlocuirea becurilor arse sa poata mentinuta lumina aprinsa
peste 200 zile?
1
Indicatie. a) M (f1 ) = 1 deci  = 20
. b,c) Se aplic
a (5.13) sau se procedeaz
a ca n lectia
1
4, exercitiul nr. 4. d) In datele de la c) avem  = 20 , n = 10, iar probabilitatea cerut
a este:
Z 1
t
1
P = p (f1 + f2 + ::: + f10  200) =
t9 e 20 dt
10
200 20  9!
10 Z 1
10
=
u9 e 10u du ' 0; 457
9! 1
10) Doua variabile aleatoare independente f1 si f2 au distributii normale N (0; ). Sa se
arate ca f12 + f22 si ff21 sunt independente.
Indicatie. (f1 ; f2 ) are densitatea
0. Fie  : R2
D(r;s)
D(x;y)

1
e
4 2

x2 +y 2
2 2

f1
f2

este denit
a a.p.t. deoarece p (f2 = 0) =



x
2
2
2
f(x; 0) jx 2 Rg ! R denit
a prin (x; y) ! r = x + y ; s = y . Avem
2

rs
r
= 2 (s2 + 1). De asemenea x2 = 1+s
y 2 = 1+s
a pentru orice pereche
2
2 . Vedem c
(r; s) exist
a dou
a perechi (x; y) ce i corespund prin transformarea dat
a. Pentru D  R2
1
sucient de mic  (D) = D1 [ D2 cu D1 si D2 disjuncte n corespondenta bijectiv
a si
diferentiabil
a cu D. Avem



2
2 f1
p
f1 + f2 ;
2D
f2

= p (f1 ; f2 ) 2  1 (D)
Z Z
Z Z
x2 +y 2
x2 +y 2
1
1
2
2
2 2 dxdy
=
dxdy
+
e
e
2
4 2
4
D2
ZD1Z
r
1
1
= 2
e 22
drds
4 2
2 (s2 + 1)
D

LECTIA
6. DEPENDENTA
NTRE VARIABILELE ALEATOARE
Prin urmare perechea de v.a.

si remarcii de dup
a ea rezult
a c
a

+ f22 ; ff21
f12 + f22 ; ff21

f12

are densitatea

1
e
4 2

sunt independente.

r
2 2

88


1
.
1+s2

Conform (6.12)

11. Sa se arate ca daca f : X ! R2 este o v.a. bidimensionala cu densitatea f (x1 ; x2 ) si


g : R2 ! R2 este o bijectie de clasa C 1 cu iacobianul nenul atunci densitatea variabilei duble
1 ;x2 )
g  f este gf (y1 ; y2 ) = f (g 1 (y1 ; y2 )) D(x
.
D(y1 ;y2 )
12. Sa se calculeze mediile, dispersiile, corelatia distributiilor marginale pentru densitatea
dubla
p
12 2(x21 +x1 x2 +x22 )
 (x1 ; x2 ) =
e
2
Indicatie. A se vedea exemplul 3.
13. O variabila aleatoare bidimensionala Z are densitatea dubla

(x1 + x2 + 2) dac
a (x1 ; x2 ) 2 [0; 2]  [1; 3]
 (x1 ; x2 ) =
0, in rest
Sa se determine:
i) .
ii) Densitatile distributiilor marginale
iii) p (Z 2 f(x1 ; x2 ) j x2 > x1 + 1g).
iv) Fie Z1 si Z2 cele doua distributii marginale. Care este media lui Z1 + Z2 .
RR
 (x1 ; x2 ) dx1 dx2 = 1. Se utilizeaz
a formula 6.9
Indicatie.
R2
14. O anumita lungime este mprtita n doua si sunt masurate cele doua portiuni de
catre doua persoane nmod independent. Eroarea de masurare este o variabila aleatoare
3
(1 x2 ) pentru x 2 [ 1; 1]
4
pentru ecare persoana. Care este
cu densitatea  (x) =
0 n rest
probabilitatea ca eroarea n masurarea ntregii lungimi sa e mai mare ca 1?
Indicatie. Cunoastem densit
atile a dou
a variabile aleatoare independente. Deci rezult
a
imediat densitatea sumei si de aici r
aspunsul la ntrebare. Altfel, putem folosi formula 6.9

Lectia 7
Procese aleatoare
In modelarea probabilistic
a a unor fenomene, presupunem implicit existenta unei multimi X
de factori necontrolabili, multime care nu poate exact denit
a, ce afecteaz
a desf
asurarea
fenomenelor, precum si existenta unei probabilit
ati pe aceast
a multime. Rezultatul observatiei unui fenomen l reprezent
am printr-un num
ar sau mai multe numere. Observnd de
mai multe ori acelasi fenomen, chiar reproducnd conditiile de desf
asurare ct mai del posibil, rezultatele numerice pot iesi diferite. Intervin aici acei factori necontrolabili care fac s
a
uctueze rezultatele numerice ale experientei ntr-o anumit
a zon
a de valori. De exemplu,
m
asurnd independent cu o rulet
a obisnuit
a de 2m o distanta destul de lung
a, s
a zicem n
jur de 100 m, persoane diferite vor ajunge la rezultate diferite. Nu putem specica exact ce
factori contribuie la aparitia diferentei ntre rezultate si care este contributia ec
aruia, dar
putem admite existenta unei probabilit
ati pe aceast
a multime X de factori necontrolabili.
Fie acea m
arime numeric
a pe care o urm
arim, egal
a cu . Dup
a ce x
am valorile factorilor
controlabili,  devine o functie  : X ! R, pe multimea factorilor necontrolabili, adic
a o
variabil
a aleatoare. Dac
a  reprezint
a o m
arime ce evolueaz
a n timp atunci  : T  X ! R,
deci variabila aleatoare este  (t;  ) : X ! R, pentru ecare t 2 T  R. Mai not
am aceast
a
variabil
a aleatoare prin  t .
Denitia 7.1 O asemenea familie de variabile aleatoare, ce depinde de un parametru t 2
T  R se numeste proces aleator sau proces stochastic.
Fie F (t; x) sau functia de repartitie a acestei variabile aleatoare, adic
a:
F (t; x) = p (f! 2 Xj  (t; !) < xg)
sau pe scurt
F (t; x) = p ( (t; ) < x) = p ( t < x)

Uneori vom mai nota aceast


a functie Ft (x) pentru a sublinia c
a e functie de repartitie n x
si depinde de parametrul t. In timp ce  nu poate specicat
a exact, neavnd o descriere a
89

LECTIA
7. PROCESE ALEATOARE

90

multimii X, F este o functie de variabilele reale t; x. Cum functia de repartitie contine toate
informatiile probabilistice despre o v.a., un proces stochastic va descris prin functia sa de
repartitie F (t; x). Vom caracteriza procesul stochastic prin Ft (x) sau derivata ei  (t; x) =
(t;x)
t (x) = @F@x
. Dac
a  t ia o valori ntr-o multime discret
a fv1 ; ::vn ; ::g atunci
functia de
P
repartitie este complet determinat
a de pk (t) = p ( t = vk ) sau prin Ft (x) = vk <x pk (t) deci,
procesul stochastic va descris prin aceste functii. Mai jos studiem cteva tipuri de procese
stochastice.

7.1

Procese Poisson

S
a consider
am num
arul particulelor cosmice care p
atrund ntr-un anumit volum V, ntr-un
interval de timp. Acest num
ar depinde de factori incontrolabili si apare ca o valoare aleatoare.
Presupunem c
a  t este un proces aleator pentru valori ale timpului t 2 [0; 1) care ia doar
valori naturale 0,1,2,...k,... , si anume pentru t > 0,  t ia valoarea k dac
a n intervalul de
timp (0; t] au p
atruns n volumul V, k particule cosmice. Pentru ecare t  0,  t este o
variabil
a aleatoare. Pentru t < t + t; variabila aleatoare  t+t  t reprezint
a num
arul de
particule cosmice care au p
atruns n volumul V n intervalul de timp (t; t + t]. Variabilele
 t nu sunt independente deoarece valoarea lui  t+t depinde de valoarea lui  t . Urm
atoarele
ipoteze asupra variabilelor  t apar ca naturale:
a) Absenta post efectului, adic
a num
arul de particole care n intervalul de timp [a; b) intr
a
n volumul V este independent de num
arul de particule care au p
atruns anterior n acest
volum si de momentele la care au p
atruns. Exprim
am acest fapt astfel: dac
a 0  a1 < b1 
arul de
a2 < b2  ::an < bn atunci avem v.a.  b1  a1 , ... bn  an care au ca valoare num
particule ce au p
atruns n V n intervalele de timp (a1 ; b1 ], ... (an ; bn ]; ipoteza a) nseamn
a c
a
aceste v.a. sunt independente, adic
a

p  b1  a1 = k1 ;  b2  a2 = k2 ; :::;  bn  an = kn



(7.1)
= p  b1  a1 = k1  p  b2  a2 = k2  :::  p  bn  an = kn

pentru orice k1 ; :::kn 2 N si orice num


ar n de intervale.
b) Stationaritatea, nseamn
a c
a num
arul de particule ce p
atrunde n volum ntr-un interval
de timp depinde doar de lungimea intervalului de timp si nu de plasarea acelui interval pe
axa timpului. Exprim
am acest lucru prin:

p ( b  a = k) = p  a+T  b+T = k
(7.2)

oricare ar 0  a < b , T  0 si oricare ar k 2 N .


c) Ordinaritatea, adic
a probabilitatea ca n intervalul [t; t + t) s
a p
atrund
a n volum mai
mult de o particul
a este zero n raport cu t. Mai precis:

p  t+t  t > 1 = O (t)
O(t)
t!0 t

Prin O(t) se ntelege o functie real


a O de argument t, astfel ca lim

= 0.

LECTIA
7. PROCESE ALEATOARE

91

Denitia 7.2 Un proces aleator  t , t 2 [0; 1) unde  t ia valori numere naturale si unde sunt
satisfacute conditiile a), b), c) de mai sus se numeste proces Poisson.
Multe alte fenomene din natur
a apar ca satisf
acnd cerintele a), b), c) : dezintegrarea
spontan
a a nucleelor radioactive, venirea la coad
a a masinilor la o statie de benzin
a, num
arul
de apeluri la o central
a telefonic
a etc.
Problema pe care vrem
s
a
o
rezolv
am n continuare este de a determina probabilit
atile

pk (t) = p  a+t  a = k , adic
a probabilitatea ca n intr-un interval de lungime t s
a intre k
particule cosmice n volumul V. Conform cu b) aceste probabilit
ati nu depind de a.
Teorema 7.3 Fie un proces Poisson ca mai sus. Atunci exista  > 0 astfel ca p1 (t) =
t + 0 (t) si
(t)k t
pk (t) =
e
(7.3)
k!
Demonstratie.(Schita) Fie r = p0 (1). Imp
artim intervalul [0; 1] prin
0<

1
2
n
< < :: <
n
n
n

, pentru un n 2 N . Din stationaritate rezult


a
 

1
p0
= p  1=n  0 = 0 = p  2=n
n



 1=n = 0 = ::: = p  1

n

1
n

=0

Utiliznd acum faptul c


a nu exist
a post efect, avem:


r = p0 (1) = p  1=n  0 = 0;  2=n  1=n = 0;  1  n 1 = 0 =
n




= p  1=n  0 = 0  p  2=n  1=n = 0  :::  p  1  n 1 = 0 =
n
n
n
= p  1=n  0 = 0
= (p0 (1=n))


1
a n intervalul (0; nk ] nu intr
De aici rezult
a p0 n1 = r n Evenimentul c
a nici o particul
a n
V, este echivalent cu intersectia evenimentelor n intervalul ( i n1 ; ni ] nu intr
a vreo particul
 a
k
n V, pentru 1  i  k. Cum aceste evenimente sunt independente, rezult
a p0 n =
k
k
1
p0 n
atoare n t, rezult
a usor c
a p0 (t) = rt . Cum
= r n . Acum, deoarece p0 (t) este cresc
r este o probabilitate, r 2 (0; 1), deci r = e  pentru un  > 0, deci p0 (t) = e t . Am
demonstrat deci formula 7.3 pentru k=0.
Mai departe avem
X
pk (t) = 1
p0 (t) + p1 (t) +
k>1

{z

=0(t) conform cu c)

LECTIA
7. PROCESE ALEATOARE
adic
ae

t

92

+ p1 (t) + 0 (t) = 1. De aici rezult


a
p1 (t) = 1

t

+ O (t) = t + O (t)

Pentru a determina pk (t) este usor de justicat formula


pk (t + t) =

k
X

pi (t) pk

(t)

i=0

= e

t

pk (t) + (t + 0(t) pk

(t) +

k
X
i=2

pi (t) pk
{z

(t)
}

=0(t) conform cu c)

= pk (t)

tpk (t) + tpk

(t) + 0 (t)

pentru k 1. Prin trecerea lui pk (t) n membrul stng si divizarea la t, apoi trecerea la
limit
a t ! 0, rezult
a
dpk (t)
= pk (t) + pk 1 (t)
(7.4)
dt
Dac
a tinem seama de conditiile p0 (t) = e t , pk (0) = 0 (din ordinaritate), atunci sistemul
k
7.4 se rezolv
a si se g
aseste pk (t) = (t)
e t .
k!
QED.
Probabilit
atile pk (t) = p ( t = k) sunt la fel ca la o v.a. Poisson (vezi lectia 4), deci media
lui  t este M ( t ) = t si dispersia D ( t ) = t.

7.2

Procese Markov discrete

Denitia 7.4 Un proces stochastic se numeste proces Markov discret daca  t poate lua un
numar nit de valori V = fv1 ; v2 ; :::vn g, timpul t variaza ntr-o multime discreta de valori
T = ft1 ; t2 ; :::tn ; :::g si




p  tk = v j  tk 1 = vik 1 ;  tk 2 = vik 2 ; ::;  t1 = vi1 = p  tk = v j  tk 1 = vik 1
pentru orice v; vik 1 ; :::vi1 2 V .

Cu alte cuvinte probabilitatea ca sistemul (variabila aleatoare ) s


a ajung
a n momentul tk
n starea vik depinde doar de starea vik 1 de la momentul imediat anterior, tk 1 ; si nu depinde
de st
arile la momentele tk 2 ; tk 3 ; ::: t1 . F
ar
a a pierde din generalitate putem considera
multimea st
arilor V = f1; 2; :::ng, iarmultime valorilor temporale T = f0; 1; 2; :::n; :::g. Vom
nota cu pi;j (k) = p  k = j j  k 1 = i , adic
a pi;j (k) este probabilitatea ca n cazul cnd la
momentul k-1 sistemul este n starea i, el s
a ajung
a n starea j la momentul urm
ator, k. Aceste

LECTIA
7. PROCESE ALEATOARE

93

m
arimi se numesc probabilitati de tranzitie. Deoarece din starea i se poate ajunge la momentul
urm
ator doar n st
arile 1,2,3,...n, trebuie s
a avem pi;1 (k) + pi;2 (k) + ::: + pi;n (k) = 1. Cel
mai simplu proces de acest tip este acela n care probabilit
atile de tranzitie pi;j (k) nu depind
de momentul k. In acest caz avem pi;j (k) = pP
ste
i;j . Matricea p cu elementele pi;j se nume
n
matricea de tranzitie. Intr-o astfel de matrice j=1 pi;j = 1, pi;j  0.

Exemplul 7.5 Sa presupunem ca o particula se poate misca ntre doua bariere a < b trecnd
prin puncte intermediare
a = x1 < x2 < ::: < xn = b
Daca particula se gaseste n pozitia xi atunci cu probabilitatea r se deplaseaza nainte n
pozitia xi+1 si cu probabilitatea s = 1 p se deplaseaza napoi n pozitia xi 1 . In capetele a
si b particula este respinsa n pozitia imediat vecina. Pentru 4 pozitii posibile, matricea de
tranzitie este
0
1
0 1 0 0
B s 0 r 0 C
C
p=B
@ 0 s 0 r A
0 0 1 0
(k)

(k)

Fie acum pi;j = p ( k = j j  0 = i), adic


a pi;j este probabilitatea ca sistemul s
a se g
aseasc
a
(k)
la momentul k n starea j, dac
a la momentul nitial 0 s-a g
asit n starea i. Fie p matricea de
(k)
tranzitie de la momentul 0 la momentul k, avnd elementele pi;j . Din formula probabilit
atii


Pn
totale P
g
asim p ( k = j j  0 = i)= l=0 p  k 1 = l j  0 = i  p  k = j j  k 1 = l;  0 = i
= nl=0 p  k 1 = l j  0 = i  p  k = j j  k 1 = l
altfel spus
n
X
(k 1)
(k)
pi;l  pl;j
pi;j =
l=0

Din aceast
a formul
a rezult
a prin inductie

p(k) = pk
adic
a p(k) este puterea de ordinul k a matricei de tranzitie.
Exemplul 7.6 Pentru matricea de tranzitie din exemplul 1 gasim
1
0
s
0
r
0
B 0 s+rs
0
r2 C
C
p2 = B
2
@ s
0
r+rs 0 A
0
s
0
r

LECTIA
7. PROCESE ALEATOARE

94

Pentru r=3/4 si s=1/4 matricea de tranzitie devine:


0
0
1
0
0
B 1=4 0 3=4 0
p=B
@ 0 1=4 0 3=4
0
0
1
0

1
C
C
A

Pentru valori mari ale lui k gasim:


0
0; 0769231
0
0; 923077
0
B
0
0; 307692
0
0; 692308
p(100) = B
@ 0:0769231
0
0; 923077
0
0
0; 307692
0
0; 692308
(k)

1
C
C
A

Cum arat
a probabilit
atile pi;j pentru valori mari ale lui k? Urm
atoarea teorem
a aduce
l
amuriri n aceast
a privinta.
(m)

Teorema 7.7 Daca pentru m 2 N are loc inegalitatea pi;j > 0 pentru orice i; j, atunci exista
lim p(k) si
k!1

(k)

lim pi;j = pj

k!1

independent de i.
Altfel spus, probabilit
atile de tranzitie de la starea i n momentul 0, la starea j n momentul
k, se stabilizeaz
a pentru k ! 1 la valori independente de starea la momentul 0.
Pentru demonstratie se poate consulta bibliograa.
Exemplul 7.8 Fie matricea de tranzitie
0
1=8
B 1=4
p=B
@ 1=10
7=20
Utiliznd calculatorul gasim
0
0; 214013
B
0; 21402
p7 = B
@ 0; 214014
0; 214024

2=8
1=4
5=10
3=20

0; 283041
0; 283038
0; 28304
0; 283037

2=8
1=4
2=10
5=20

1
3=8
1=4 C
C
2=10 A
5=20

0; 238095
0; 238095
0; 238095
0; 238095

1
0; 264851
0; 264846 C
C
0; 26485 A
0; 264844

LECTIA
7. PROCESE ALEATOARE

p100

0; 214018
B 0; 214018
=B
@ 0; 214018
0; 214018

95

0; 283039
0; 283039
0; 283039
0; 283039

0; 238095
0; 238095
0; 238095
0; 238095

1
0; 264848
0; 264848 C
C
0; 264848 A
0; 264848

Se vede cum de la p7 se stabilizeaza primele trei zecimale ale probabilitatilor limita, la p100
ind stabilizate cel putin 6 zecimale.

7.3

Procese de nastere si moarte

S
a presupunem c
a ntr-un proces stochastic  t ia valori numere naturale si c
a urm
atoarele
conditii sunt ndeplinite:

i) p  t+t = k + 1j t = k = k  t + O (t) ;  > 0;(aceasta este probabilitatea unui
proces de nastere n intervalul (t; t + t))
ii) p  t+t = k 1j t = k = k  t + O (t) ;  > 0; k  1( aceasta este probabilitatea
unui proces
n intervalul (t; t + t).
de moarte
iii) p  t+t  t > 1 = O (t) (aceasta este probabilitatea a mai mult de o nastere sau
o moarte n intervalul (t; t + t))
Denitia 7.9 Un proces stochastic cu valori naturale si care ndeplineste conditiile i)-iii) de
mai sus se numeste proces de nastere si moarte.

Dac
a k = 0 atunci procesul se numeste proces de nastere iar dac
a k = 0 se numeste
proces de moarte. Deoarece pentru k  1 avem
1 =

1
X
n=0

p  t+t = nj t = k



= p  t+t = k 1j t = k + p  t+t = kj t = k





+p  t+t = k + 1j t = k + p  t+t k  2 j t = k

rezult
a imediat din i). ii),iii) c
a
iv) p  t+t = kj t = k = 1 k t k t + O (t).
Problema care se pune la aceste procese const
a n determinarea probabilit
atilor
p ( t = k) = pk (t) cunoscnd pk (0) = p ( 0 = k).
Solutie. Deoarece evenimentele f t = kgk2N sunt disjuncte avem conform formulei probabilit
atii totale pentru k  1


p  t+t = k = p ( t = k)  p  t+t = kj t = k
(7.5)

+p ( t = k + 1)  p  t+t = kj t = k + 1
(7.6)

+p ( t = k 1)  p  t+t = kj t = k 1
(7.7)

+p (j t kj  2)  p  t+t = kj j t kj  2
(7.8)

LECTIA
7. PROCESE ALEATOARE

96

Folosind relatia iv) n (7:5), relatia ii) n (7:6), relatia i) n (7:7), relatia iii) n (7:8) g
asim:
pk (t + t) = pk (t)  (1 k t k t + O (t))

+pk+1 (t)  k+1 t + O (t)
+pk 1 (t)  (k 1 t + O (t))
+O (t)
Trecnd pk (t) n membrul stng, diviznd prin t, apoi trecnd la limit
a t ! 0 g
asim
p0k (t) = k 1 pk

(t)

(7.9)

(k + k ) pk (t) + k+1 pk+1 (t)

Pentru cazul k = 0 o analiz


a similar
a conduce la:
p00 (t) =

0 p0 (t) + 1 p1 (t)

(7.10)

Rezolvarea acestui sistem innit de ecuatii diferentiale este anevoioas


a, ns
a n practic
a
dup
a un proces de tranzitie haotic urmeaz
a o stabilizare, n care pk (t) sunt constante. Ecuatiile n acest caz sunt

0 =  0 p 0 + 1 p 1
(7.11)
0 = k 1 pk 1 (k + k ) pk + k+1 pk+1
Din prima ecuatie rezult
a p1 =
s.a.m.d. In general obtinem:

0
p.
1 0

Folosind celelalte ecuatii g


asim succesiv p1 =

pn =

0 1 :::  n 1
p0
1 2 :::  n

Valoarea lui p0 se determin


a din conditia

1
X

pi = 1

0 1
,
1 2

(7.12)

(7.13)

i=0

P
n 1
si acest lucru este posibil numai dac
a n 0 1 :::
< 1.
1 2 :::n
In acest fel poate modelat fenomenul de asteptat la coad
a.

7.3.1

Model de asteptare cu o singur


a statie de deservire si un
num
ar mare de unit
ati ce au nevoie de serviciile statiei

Se poate imagina o astfel de situatie la o benzin


arie cu o singur
a statie la care vin aleator
masini pentru alimentare. Masinile provin dintr-o populatie mare astfel nct coada nu este
inuentat
a de diminuarea num
arului de masini care necesit
a alimentare.

LECTIA
7. PROCESE ALEATOARE

97

Prima problem
a care se pune este modelarea caracterului ntmpl
ator al venirilor n statie
si al plec
arilor din statie. Fie  num
arul mediu de veniri n unitatea de timp. Deci ntrun timp t vor n medie t veniri. Dac
a num
arul de masini din care se vine la coad
a
este n iar nevoia de benzin
a este ntmpl
atoare si independent
a de la o masin
a la alta atunci
k k n k
unde p este
probabilitatea de a veni la coad
a k masini n intervalul (t; t + t) este Cn p q
probabilitatea ca o masin
a s
a aib
a nevoie de benzin
a iar q = 1 p (vezi legea binomial
a).
t
Num
arul mediu de veniri este np iar pe de alt
a parte este   t. Deci np = t ) p = n .
k

In aceste conditii stim lectia 4 c


a c
a Cnk pk q n k ! e t (t)
atunci cnd n ! 1 . Cum
k!
n este mare, putem considera c
a probabilitatea ca la coad
a s
a vin
a k masni n intervalul
k
t (t)
(t; t + t) este e
. Num
arul de veniri la coad
a n intervalul de timp t poate
k!
considerat ca o variabil
a aleatoare de tip Poisson:
!
0
1
:::
k
:::
k
e t e t t
::: e t (t)
:::
1
k!

Prin urmare :
a) Probabilitatea ca n intervalul (t; t + t) sa vina n statie o masina este e t t
=
1
  t + O(t).
b) Probabilitatea ca sa nu vina n statie nici o masina n intervalul (t; t + t) este e t =
1   t + O(t).
c) Probabilitatea ca n intervalul (t; t + t) sa vina n statie mai mult de o masina este
k
P
t (t)
= O(t).
k2 e
k!
In mod analog, e  num
arul mediu de masini deservite de o statie n unitatea de
timp(presupunnd c
a are continuu de lucru). Intr-un interval de lungime t vor n medie
deservite   t masini. Num
arul real al celor deservite poate mai mare sau mai mic dect
media si depinde de factori ntmpl
atori, ca necesarul de benzin
a, ntrzieri produse de sofer,
etc. Admitem c
a:
a) Probabilitatea ca n intervalul (t; t + t) sa plece din statie o masina, daca exista
vreuna, este t + O (t)
b) Probabilitatea ca n intervalul (t; t + t) sa nu plece din statie nici o masina, daca
exista vreuna, este 1 t + O (t)
c) Probabilitatea ca n intervalul (t; t + t) sa plece din statie mai mult de o masina este
O(t).
Ipotezele f
acute asupra plec
arilor din statie sunt asem
an
atoare cu conditiile a), b),c) ndeplinite de probabilit
atile de venire n statie.
Fie acum familia de variabile aleatoare  t ; t 2 T = [0; 1) , unde valoarea lui  t este egal
a
cu num
arul de masini n statie la momentul t. Ipotezele f
acute asupra venirilor si plec
arilor,
independente unele de altele, se mai scriu:

LECTIA
7. PROCESE ALEATOARE

98

i)
p  t+t = k + 1j t = k
+

O (t)
| {z }

= (  t + O (t)) (1
|
{z
}|

t O (t)) +
{z
}

= (  t + O (t))  (1
|
{z
} |

t O (t)) +
{z
}

o venire

=   t + O (t)

nici o plecare

mai mult de o venire sau o plecare

ii)

p  t+t = k
+

1j t = k

O (t)
| {z }

o plecare

=   t + O (t)

nici o venire

mai mult de o plecare sau venire

din condit ia a) de la plec


ari si conditia a) de la veniri (o plecare si nici o venire).
ari
iii) p  t+t  t > 1 = O (t) din conditiile c) de la veniri si c) de la plec
Prin urmare avem de a face cu un proces de nastere si moarte. M
arimile pk (t) = p ( t = k)
satisfac deci ecuatiile (7:9)-(7:10), iar la stabilizare ecuatiile (7:11). Solutia la stabilizare este
(7.12) unde k =  si k = , adic
a
 k

pk =
p0
(7.14)

iar din 1 = p0

P1   k
k=0

a
= p0 1 1  rezult





p0 = 1
Stabilizarea se poate face doar cu conditia 0 <
gent
a.

7.3.2




< 1 astfel nct seria

P   k


s
a e conver-

Model de asteptare cu o singur


a statie
iar num
arul de unit
ati care au nevoie de serviciile statiei este
limitat la o valoare dat
a.

Presupunem acum c
a populatia de unde provin masinile (unit
atile) n asteptare este limitat
a
la un num
ar de N exemplare. Coada care se formeaz
a depinde de ct de des au nevoie
masinile de serviciile statiei si ct de prompte sunt aceste servicii. In ce priveste capacitatea
de deservire a statiei, nu apar elemente care s
a modice ipotezele a), b), c) anterioare.
In ce priveste venirile n statie, ele apar n mod normal proportionale cu num
arul masinilor

LECTIA
7. PROCESE ALEATOARE

99

n activitate (deci care nu sunt asezate la coad


a). Vom face ipoteza c
a masinile au nevoie
independent de serviciile statiei, si dac
a n statie sunt k masini, atunci probabilitatea ca s
a
mai vin
a una n urm
atoarele t unit
ati de timp este (N k) t + 0 (t) dac
a k < N si zero
dac
a k = N . Astfel familia de variabile aleatoare  t care au ca valoare num
arul de masini n
statie este un proces de nastere si moarte cu k = (N k)  ,iar k =  pentru 0  k  N .
Prin urmare, conform formulelor (7.12) rezult
a
pk =

N (N

1)  ::: (N
k

k + 1) k

p0 ;

0kN

(7.15)

P
Valoarea lui p0 se determin
a din conditia ca nk=0 pk = 1.
Un asemenea proces ar putea modela de exemplu coada la reparatii ntr-o intreprindere
cu N masini dac
a serviciul de reparatii are doar un mecanic. Un model mai realist este:

7.3.3

Model de asteptare cu n statii de deservire si cu N unit


ati ce
trebuie deservite (1<n<N)

In acest caz avem de a face cu un proces de nastere si moarte n care k = N k pentru


0  k  N (probabilit
atile de a se veni la statie pentru alimentare, reparatii etc. sunt
proportionale cu num
arul unit
atilor n serviciu), si k = k dac
a 1  k < n , k = n dac
a
n  k  N (probabilitatea ca o unitate s
a p
ar
aseasc
a statia este proportional
a cu num
arul
celor n curs de deservire). Conform formulei (7.12) g
asim
8
 k
>
< C k  p0
pentru 1  k < n 1
N 
 k
pk =
(7.16)
>
: n!nk!k n CNk  p0 pentru n  k  N
P
Si aici p0 se determin
a din conditia ca
pk = 1.

7.4

Procese aleatoare stationare

Un proces aleator se numeste stationar dac


a propriet
atile sale statistice sunt invariante la o
translatie a timpului. Fie Ft functia de repartitie a v.a.  t si e i densitatea de probabilitate
dac
a exist
a. In continuare n aceast
a sectiune timpul t apartine multimii T = ( 1; 1) sau
multimii T = [0; 1), n afar
a de cazul cnd se specic
a o alt
a situatie.
Denitia 7.10 Procesul aleator  t se numeste stationar de ordinul nti daca Ft = Ft+
pentru orice  .

Prin urmare pentru procese stationare de ordinul unu, functia de repartitie este aceeasi
pentru toate variabilele  t .

S
a consider
am acum pentru dou
a valori t1 ; t2 vectorul aleator  t1 ;  t2 . Acest vector are
o functie de repartitie mixt
a (vezi lectia 6) denit
a prin Ft1 ;t2 (x; y) = p  t1 < x;  t2 < y .

LECTIA
7. PROCESE ALEATOARE

100

Denitia 7.11 Spunem ca procesul aleator  t este stationar de ordinul doi daca functia de
repartitie mixta este invarianta la o translatie a timpului. Mai precis Ft1 ;t2 = Ft1 + ;t2 + pentru
orice  .
In mod analog se poate deni un proces stationar
de ordinul n, prin functia de repartitie

a un proces aleator este stationar de
n dimensional
a a vectorului aleator  t1 ;  t2 ; ::: tn . Dac
ordin n, atunci el este stationar de orice ordin 0  k  n.
Pentru un proces stationar media,dispersia, momentele de diverse ordine ale variabilei  t
nu depind de t.Variabilele aleatoare  t nu sunt n general independente. Dac
a m este media
variabilei  t (independent de t) atunci coecientul de corelatie



M  t1 m   t2 m
c  t1 ;  t2 = r 

2 
2 
M  t1 m
 M  t2 m



(vezi lectia 6) este si el invariant la o translatie n timp, adic
a c  t1 ;  t2 = c  t1 + ;  t2 +
pentru orice  . Ins
a n multe aplicatii ale probabilit
atilor se utilizeaz
a doar media, dispersia
pentru variabilele aleatoare individuale si coecientul de corelatie pentru perechile de variabile
aleatoare. Aceste m
arimi pot invariante la o translatie a timpului f
ar
a ca functia de repartitie
s
a e. De aceea s-au studiat n mod special procesele aleatoare pentru care aceste m
arimi
sunt invariante la o translatie a timpului, f
ar
a s
a se cear
a si invarianta functiei de repartitie.
Denitia 7.12 Un proces aleator ( t )t2T se numeste stationar n sens larg daca
a) media M ( t ) = m este independenta de t 2 T .
b) dispersiaM ( t ) =  2 esteindependenta de t 2 T .
c) c  t1 ;  t2 = c  t1 + ;  t1 + pentru orice t1 ; t2 ; t1 +  ; t2 +  2 T .

Observatia 7.13 Conditiile de mai sus sunt echivalente cu


a) media M (
 t ) = m este independenta de t 2 T .
b) M  t  t+ este functie doar de  (deci independenta de t)
Demonstratia echivalentei celor doua seturi de conditii este lasata ca exercitiu.

In continuare vom nota R (t1 ; t2 ) = M  t1  t2 si o vom numi functia de autocorelatie a
procesului aleator. Dac
a procesul este stationar n sens larg, aceast
a functie este invariant
a
la o translatie n timp, deci depinde doar de diferenta t2 t1 . Vom nota n acest caz functia
de autocorelatie prin R ( ) = M  t  t+ = M ( 0   ). Cteva din propriet
atile functiei de
autocorelatie pentru procese stationare n sens larg, apar n continuare:
1.
R (0) = M2 ( t )

pentru c
a R (0) = M  t  t+0 = M2 ( t ).
2.
R (  ) = R ( )

LECTIA
7. PROCESE ALEATOARE
pentru c
a R (  ) = M tt
3.


101


= M  t   t = R ( ).

2 

R (0)  jR ( )j



 0 rezult
a M  2t + M  2t+  2M  t  t+  0, sau

pentru c
a din M  t   t+
2R (0)  2R ( )  0.
4. Pentru orice n 2 N si  1 ;  2 ; :: n 2 R forma p
atratic
a
n
X

R ( i

 j ) xi x j

i;j=1

este pozitiv denit


a pentru c
a este egal
a cu M
t +  i 2 T pentru orice i.

 P
n

i=1 xi  t+ i

2 

 0, oricare ar t astfel ca

Denitia 7.14 Procesul aleator stationar n sens larg, ( t )t2T


ste continuu daca
 , se nume
2 
2
limM ( t  0 ) = 0. Acest lucru este echivalent cu lim M  t  t0
= 0 pentru orice
t!0

t!t0

t0 2 T .

Se mai spune c
a procesul aleator este continuu n medie p
atratic
a.
5. Dac
a procesul aleator stationar n sens larg ( t )t2T este continuu atunci functia de
autocorelatie R ( ) este continu
a (exercitiu).
6. Functia de autocorelare a unui proces stationar n sens larg, continuu, se poate pune
sub forma
Z 1
ei ! dF (!)
R ( ) =
1

unde F (x) este m


arginit
a, monoton cresc
atoare, continu
a la stnga. Dac
a F admite o
derivat
a, Rf , ceea ce se ntmpl
a dac
a jRj scade destul de rapid cnd j j ! 1, atunci
1
i !
R ( ) =
e
f
(!)
d!.
Demonstra
tia acestui nu face obiectul acestui curs. F (!) se
1
numeste functia spectral
a a procesului ( t ) iar f (!) se numeste densitatea spectral
a. Din
formulele de inversiune ale transform
arii Fourier g
asim c
a
Z 1
1
f (!) =
e i ! R ( ) d
2 1
Mai mult, tinnd seama c
a R ( ) este par
a se poate ar
ata c
a
Z 1
cos ( !) dF (!)
R ( ) =
1

7. Orice proces aleator continuu stationar n sens larg se poate aproxima prin procese
aleatoare standard. Anume, pentru orice A > 0 si orice " > 0 exist
a un num
ar nit n de

LECTIA
7. PROCESE ALEATOARE

102

variabile aleatoare 1 ,  1 , 2 ,  2 ,...n ,  n independente dou


a cte dou
a si exist
a n numere
reale 1 , 2 , ...n astfel ca pentru orice t 2 [ A; A] are loc relatia
0
!2 1
n
X
(k cos k t +  k sin k t) A < "
M @ t
k=1

7.5

Exercitii

1. Care este probabilitatea ca n cazul unui serviciu cu 5 statii de deservire a 20 de unitati si


cu raportul ntre coecientii de venire si deservire  =  = 15 ; sa nu poata la un moment
dat satisfacuta o cerere? Dar daca  = 54 ? (o asemenea situatie poate ntr-o intreprindere
unde o 5 mecanici ntretin 20 de masini).
Solutie. Avem un proces de asteptare cu n=5 statii si N=20 unit
ati, deci putem aplica
formulele (7.16), pentru k = n, de unde
P20
k!
k k
k=5 n!nk n C20 
p = P4
P
20
k!
k k
k k
k=5 n!nk n C20 
k=0 C20  +
Cu un computer, pentru  = 1=5 g
asim p = 0; 275, iar pentru  = 4=5 g
asim p = 0; 9993.

2. Sa presupunem ca numarul de statii este n iar solicitarile vin dintr-o populatie foarte
mare, deci numarul de veniri nu este inuentat de numarul de unitati n asteptare. Care este
probabilitatea ca o solicitare sa poata satisfacuta imediat? Caz particular n = 5,  =  = 12 ?
Solutie. In acest caz avem un proces de nastere si moarte n care k =  si n care
k = k   pentru 0  k  n si k = n pentru k  n (probabilitatea de a iesi o unitate
din sistem este proportional
a cu num
arul unit
atilor n curs de deservire). G
asim, conform cu
(7.12)
(
k
p , pentru k  n
k! 0
pk =
k
p , pentru k > n
n!nk n 0
P
pk = 1 conduce la
Conditia
p0 = Pn

k

k=0 k!

1
P1

nn
n!

k=n+1

 = Pn
 k

k
k=0 k!

n+1
n!(n )

In cazul concret al problemei, o solicitare poate satisf


acut
a dac
a num
arul de unit
ati din
sistem este mai mic de n. Probabilitatea c
autat
a este
Pn 1 k
n 1
X
k!
pk = Pn k=0
p=
k
n+1
+
k=0 k!
k=0
n!(n )

LECTIA
7. PROCESE ALEATOARE

103

Pentru n = 5,  = 1=2 g
asim p = 0; 998. Dac
a venirile sunt mai pronuntate, de exemplu

 =  = 3 (probabilitatea de solicitare a unui serviciu ntr-un interval scurt t este de trei
ori mai mare ca probabilitatea de iesire de la un server n lucru), atunci g
asim o probabilitate
de satisfacere imediat
a a cererii mai mic
a, p = 263
=
0;
7638.
343
3. La o centrala telefonica vin apeluri aleatoare, independente. Centrala poate deservi
simultan n = 50 de cereri, iar apelurile care vin cnd centrala este ocupata se anuleaza.
Presupunnd ca raportul  =  dintre probabilitatea t de venire a unui apel ntr-un timp
scurt t si probabilitatea t de eliberare ntr-un timp scurt t a unui circuit ocupat este
 = 50, sa se calculeze probabilitatea ca un apel telefonic sa e anulat.
Solutie. S
i n acest caz avem un proces de nastere si moarte. Fie pk probabilitatea ca n
central
a s
a e k circuite ocupate. Coecientul k pentru nastera unui apel este x, egal cu
. Coecientul k pentru moartea unui apel este k = k  , pentru c
a dac
a sunt k circuite
ocupate atunci probabilitatea de eliberare a unui circuit creste de k ori fata de cazul unui
singur circuit ocupat. Conform cu formulele (7.12) avem
pk
pk
Din conditia

Pn

k=0

0 1 :::  k 1
k
k
=
p
=
p0 , pentru 0  k  n
p0 =
0
1 2 :::  k
k!k
k!
= 0, pentru k > n
pk = 1 rezult
a
p0 = Pn

k
k=0 k!

Probabilitatea cerut
a n problem
a este

p = pn =

n
n!
Pn k
k=0 k!

unde trebuie luat n = 50,  = 50. Cu calculatorul se obtine p = 0:104787.


Pe m
asur
a ce solicitarea centralei creste, adic
a  creste, devine din ce n ce mai mare
probabilitatea ca un apel s
a e anulat. Mai jos apare gracul acestei probabilit
ati n functie
de gradul de nc
arcare  al centralei.

LECTIA
7. PROCESE ALEATOARE

104

0.5

0.4

0.3

0.2

0.1

20

40

60

80

100

Cresterea probabilit
atii p (vertical
a) de refuz a unui apel
cu cresterea factorului  (orizontal
a) de nc
arcare al centralei
4. O particula se misca ntre doi pereti doar prin pozitiile x1 < x2 < x3 < x4 astfel: daca
este ntr-o pozitie interioara atunci cu probabilitatea 34 face un salt n pozitia din fata si cu
probabilitatea 41 n pozitia imediat din spate; daca se gaseste n prima sau n ultima pozitie,
ramne denitiv acolo.
Sa se descrie comportarea particulei dupa un numar mare de salturi.
Indicatie. Matricea probabilit
atilor de trecere din o pozitie n alta este:
0
1
1
0
0
0
B 1=4 0 3=4 0 C
C
p=B
@ 0 1=4 0 3=4 A
0
0
0
1
Cu calculatorul g
asim de exemplu
0
1
0
B
0:30769
4:4679  10
p100 = B
@ 0; 07692
0
0
0

37

0
0
4; 4679  10
0

37

1
0
0; 692308 C
C
0; 923077 A
0

Aspectul matricei p100 pune n evidenta c


a dup
a un num
ar mare de salturi particula este
captat
a de un perete sau altul, probabilit
atile de a r
amne n pozitii intermediare ind foarte
mici. Care este valoarea exact
a a matricei p1 ?
5. Fie ( i )i2Z o familie de variabile aleatoare independente, care au toate repartitia


1
1
1
2

1
2

LECTIA
7. PROCESE ALEATOARE

105

1, t 2 ( 2b ; 2b ]
Fie f : R ! R prin f (t) =
. Denim acum procesul aleator ( t )t2R
0, n caz contrar
P
prin  t = i2Z f (t i  b)  i . Sa se calculeze functia de autocorelatie R (t1 ; t2 ). Este procesul
stationar n sens larg?
Solutie. Pe intervalul ( 2b ; 2b ] ,  t =  0 ; pe intervalul ( 2b ; 3b
],  t =  1 ; ... pe intervalul
2
Ii = (ib 2b ; ib + 2b ] ,  t =  i . Prin urmare  t1  t2 = i  j dac
a t1 2 Ii si t2 2 Ij . Deoarece
a de zero doar
variabilele  i sunt independente rezult
a c
a M  t1  t2 = M  i  j este diferit
2
dac
a i = j, adic
a t1 ; t2 2 Ii , caz n care avem R (t1 ; t2 ) = M ( i ) = 1. Functia de autocorelatie
nu este invariant
a la o translatie n timp deci procesul nu este stationar n sens larg.
P
6. Fie procesul aleator  t = nk=1 ak (k cos k t +  k sin k t) unde ak si k 2 R, iar k si
 k sunt variabile aleatoare independente, de medie 0 si dispersie 1, pentru k=1,2,...n. Sa se
arate ca procesul este sta
n sens larg si sa se determine autocorelatia procesului.
Ptionar
2
R
aspuns. R ( ) = ak cos k  .

Partea II
Statistic
a

106

Lectia 8
Statistica descriptiv
a
In cele ce urmeaz
a vom ncerca s
a explic
am ce este statistica, cum difer
a ea de teoria probabilit
atilor, ce o leag
a de aceasta, care sunt p
artile ei componente si cum ncepe demersul practic
ntr-o problem
a de statistic
a (adic
a vom spune cteva cuvinte despre statistica descriptiv
a).
Atunci cnd omul nu a mai putut intui a nceput s
a masoare. M
asur
atorile si observatiile au devenit prima treapt
a spre ntelegerea legilor naturii. Dar, n acest fel, omul nu
mai poate s
a cunoasc
a direct realitatea, el poate numai s
a o aproximeze succesiv prin modele
zice si apoi prin modele matematice. Dar aceste modele nu descriu exact Realitatea. Ele o
aproximeaz
a si apar asa numitele erori. Unele erori sunt previzibile, altele ns
a sunt ntmpl
atoare (aleatoare). Aceste ultime erori (aleatoare) au si ele legile lor de manifestare. Apar
deci fenomenele aleatoare descrise prin variabilele aleatoare. Teoria probabilit
atilor pleac
a de
la ipoteza c
a se cunosc exact aceste variabile aleatoare (prin functiile de probabilitate, prin
functiile de repartitie, prin functiile caracteristice, etc.). Statistica pleac
a de la m
asuratorile brute si caut
a s
a reg
aseasc
a modelul probabilistic teoretic exact care se a
a n spatele
acestor m
asuratori. Partea empiric
a a statisticii care se ocup
a de prelucrarea datelor obtinute prin m
asuratori sau observatii se numeste statistica descriptiva. Aparatul matematic al
teoriei probabilit
atilor, pus n functiune pentru a studia si interpreta aceste date, n dorinta
de a recupera modelul probabilistic real, care guverneaz
a fenomenul m
asurat sau observat,
formeaz
a inferenta statistica. Dup
a ce cercet
atorul cap
at
a informatii sucient de clare despre
fenomenul probabilistic studiat, el va trebui s
a actioneze optim potrivit acestor informatii.
Apare deci teoria deciziei statistice, care este o ramur
a important
a a statisticii.

8.1

Statistica unei variabile

Multimea de obiecte studiat


a se numeste populatie. Un obiect separat dintr-o populatie
dat
a se numeste individ sau membru al populatiei. Tr
as
atura comun
a a tuturor membrilor
populatiei care ne intereseaz
a n studiul nostru se numeste caracteristica. Caracteristicile
pot cantitative (naltime, greutate, not
a la examen, abscisa unui punct n plan, etc...) sau
107


LECTIA
8. STATISTICA DESCRIPTIVA

108

calitative (culoarea ochilor, sex, loc de nastere, etc...). Oricum statistica lucreaz
a cu numere,
caracteristicilor calitative li se atasaz
a coduri numerice.
Exemplul 8.1 Ne intereseaza statistica ploilor n Bucuresti pe anul 1995, zilnic. Aici populatia este multimea zilelor din anul 1995, un individ al populatiei este o zi anume din acest an,
de exemplu 3 ianuarie, iar caracteristica calitativa este faptul ca a plouat sau nu n acea zi.
Daca a plouat punem 1 si daca nu, putem 0. Numerele 1 si 0 reprezinta coduri n statistica
respectiva.
Presupunem n continuare c
a avem numai caracteristici cantitative ale unor populatii, mai
exact avem multimi brute de numere reale, sau tabele de numere reale. Privim aceste numere
atasate unei populatii ca ind valori ale unei variabile aleatoare X. Vom spune pe scur: e
populatia X .
Exemplul 8.2 O masina produce piese cilindrice ne, cu diametru standard xat = 3 cm.
Fiecare piesa are o abatere de la acest diametru, masurata n microni. Aceste abateri formeaza
o populatie n sensul de mai sus, mai bine zis valorile unei variabile aleatoare X. Noi nu
putem sa precizam de la nceput ce abatere va avea o piesa luata la ntmplare, dar putem
face o selectie de n piese si putem masura abaterile lor: x1 ; x2 ; :::; xn . Fiecare xi reprezinta
o valoare a v.a. X care, teoretic vorbind, are o densitate de probabilitate (x) si o functie de
repartitie F (x).
Denitia 8.3 O multime de n observatii independente asupra unei caracteristici numerice X
a unei populatii P, care ne da n valori x1 ; x2 ; :::xn , se numeste selectie de volum n. Sirul

de
valori (xi )1in l vom numi serie statistica discreta.
In exemplul de mai sus facem o selectie de volum n din multimea pieselor si construim asa
numita functie de repartitie empirica Fn (x).
Denitia 8.4 Se numeste functie de repartitie empirica asociata unei variabile aleatoare X
si unei selectii fx1 ; x2 ; :::; xn g;functia Fn : R ! R
Fn (x) =

nr. de valori xj < x


kx
=
n
n

Teorema de mai jos pune n evidenta c


a functiile de repartitie empirice aproximeaz
a orict
de bine functia real
a de repartitie.
Teorema 8.5 Fie P o populatie statistica si X variabila aleatoare atasata ei cu functia de
repartitie F (x). Pentru o selectie de volum n: {x1 ; x2 ; :::; xn g construim ca mai sus functia
de repartitie empirica Fn (x). Atunci
Pr ob fj F (x)

Fn (x) j g ! 0

cnd n ! 1; pentru orice  > 0, xat. Altfel spus Fn (x) ! F (x) n probabilitate.


LECTIA
8. STATISTICA DESCRIPTIVA

109

Demonstratie S
a not
am cu p =ProbfX < xg = F (x), si cu Fn (x) = knx (vezi denitia de
mai sus). Not
am cu  1 ; :::;  n v.a. construite astfel:  j are valoarea 1 dac
a xj < x si 0 n caz
contrar. Variabilele  1 ; ::: n sunt independente (ca valori ale unor observatii independente) si
au distributia


1 0
p 1-p
Avem M ( i ) = p; D ( i ) = p(1
D(Yn ) =

p). Este clar c


a v.a. Yn =

 1 ++ n
n

are media p si dispersia

1
p(1 p)
(D ( 1 ) + ::: + D ( n )) =
2
n
n

(a se vedea propriet
atile mediei si dispersiei, Lectia 2). Aplic
am acum inegalitatea lui Cebsev
lui Yn si g
asim c
a
Prob (j Fn (x)
= Prob (jYn

F (x) j )
D (Yn )
p2 (1 p)2
pj  ) 
=
2
n2

Cum partea dreapt


a tinde la 0 cnd n ! 1 rezult
a c
a Fn (x) ! F (x) n probabilitate,
cnd n ! 1.
QED.
In urma oric
arei selectii de volum n dintr-o populatie de numere se obtine un sir nit de
n numere numit serie statistica (de volum n). Cum construim o densitate de probabilitate
empiric
a? Pentru a r
aspunde la aceast
a ntrebare grup
am termenii unei serii statistice n
intervale disjuncte: I1 ,I2 ,...,Ik , dup
a criterii mai mult sau mai putin subiective. Asociem
ec
arui interval Ij mijlocul lui, Mj . Punctului Mj i asociem frecventa relativa a v.a. empirice
pe intervalul Ij , adic
a ctul dintre num
arul nj al acelor xi care se 
a
a n I
j si n (volumul
x
ej
en
j = 1; 2; :::; k,
ntregii selectii): nj =n. Este clar c
a n felul acesta obtinem o v.a. X
nj =n
en se numeste
unde xej este abscisa punctului Mj . Gracul functiei de probabilitate al v.a. X
histograma asociat
a selectiei x1 ; :::; xn si mp
artirii n intervale I1 ,...,Ik . Dac
a unim printro linie poligonal
a punctele de coordonate (e
xj ; nj =n) obtinem un poligon al frecventelor ce
aproximeaz
a de fapt gracul functiei densitate de probabilitate al v.a. X pe un interval nit
(I1 [I2 [    [Ik ) care contine numerele x1 ,...,xn .
Pentru o selectie dat
a fx1 ; :::; xn g se introduc diferiti indicatori empirici care dau anumite
informatii despre ntreaga populatie.
Denitia 8.6 Fie fx1 ; x2 ; ::xn g o selectie de volum n.
i) m = x1 +xn2 +::xn se numeste media empirica.
ii) mr =
iii) k =

xk1 +xk2 +::+xkn


se numeste momentul empiric de ordinul r.
n
(x1 m )k +(x2 m )k +:::+(xn m )k
se numeste momentul empiric
n

centrat de ordin k.


LECTIA
8. STATISTICA DESCRIPTIVA
 2

110

 2

 2

iv) S 2 =D =  2 = (x1 m ) +(x2 mn ) +:::+(xn m ) se numeste dispersia empirica sau varianta empirica.   se numeste deviatia standard.
 2
 2
 2
v) S 02 = (x1 m ) +(x2 nm 1) +:::+(xn m ) se numeste dispersia empirica modicata.
vi) Valoarea 2 R astfel ca numarul de valori xi  este egal cu numarul de valori
xi  , se numeste mediana. Daca exista mai multe asemenea valori pentru , atunci ele
formeaza un interval si mediana este prin denitie mijlocul acestui interval.
vii) Valoarea xi cu frecventa maxima de aparitie se numeste modul selectiei. (este posibil
sa nu e unic)
viii) Se numeste prima cvartila a selectiei, cel mai mic x astfel ca numarul de valori xj  x
sa e  41 n . A treia cvartila este cea mai mica valoare xi astfel ca numarul de valori xj  xi
sa e  34 n. Analog se deneste a p-a cuantila de ordin q ca cea mai mica valoare xi astfel
ca numarul de valori xj  xi sa e  pq n.
Observatia 8.7 In cazul cnd datele sunt grupate pe intervale, denitiile de mai sus se
refera la mijloacele intervalelor, ecare mijloc ind considerat de attea ori cte valori se aa
n el.
In general daca o valoare xi se repeta atunci vom nota cu ni numarul
P de apari
Ptii, si
ni xi
ni

cu fi = n frecventa relativa. Formulele de mai sus pot scrise m = n =
fi xi ,
P
2
 2
 =
fi (xi m ) , etc. Insumarea se face acum numai dupa valorile xi distincte. Seria
statistica o vom nota n acest caz (xi ; ni )1ip , punnd n evidenta de cte ori apare ecare
valoare.
 Media si mediana descriu centrul valorilor de selectie iar dispersia este o masura a
mprastierii acestor valori n jurul centrului. Modul indica n ce zona sunt cele mai probabile
valori. Cuantilele indica n ce zone se aa un anumit procent de valori.
Propozitia 8.8 Urmatoarele formule au loc:
P
n x2i
2
S =
S

0 2

0 2

n2

xi ) 2

P
( xi )2
1)

x2i
n(n

x2i
=
n 1

n
n

(8.1)

(8.2)

m2

(8.3)

Demonstratie. Sunt calcule simple l


asate ca exercitiu.
Observatia 8.9 In general n calcule nu utilizam notatiile m ; D ; etc. ci m, D, ... Am introdus aici notatiile m ; D ; :: pentru a le distinge de m=media teoretica, D=dispersia teoretica,
etc., care se vor introduce n lectia urmatoare.


LECTIA
8. STATISTICA DESCRIPTIVA

111

Exemplul 8.10 O rma este interesata de timpul mediu al convorbirilor telefonice si de


distributia acestor timpi fata de timpul mediu (dispersia) pe durata a 40 convorbiri telefonice
consecutive. Timpii s-au rotunjit n minute si rezultatul sondajului a dat urmatorii timpi: 4,
6, 4, 4, 7, 2, 3, 1, 2, 1, 1, 4, 9, 8, 11, 12, 3, 2, 1, 1, 3, 9, 4, 5, 7, 7, 9, 10, 10, 1, 2, 2, 3, 11,
12, 10, 1, 1, 3, 4. Sa se faca si o histograma a frecventelor relative si un grac al functiei de
repartitie pentru acest sondaj.
Solutie Facem mai nti urm
atorul tabel :
timpi de
numarul
frecv. relativa
convorbire ti convorbirilor ni
fi = ni =n
1 min
8
8=40
2 min
5
5=40
3 min
5
5=40
4 min
6
6=40
5 min
1
1=40
6 min
1
1=40
7 min
3
3=40
8 min
1
1=40
9 min
3
3=40
10 min
3
3=40
11 min
2
2=40
12 min
2
2=40

frecv. cumulata
F(ti )
8=40
8
5
+ 40
= 13
40
40
8
5
5
+ 40 + 40
= 18
40
40
24=40
25=40
26=40
29=40
30=40
33=40
36=40
38=40
40=40 = 1

 media convorbirilor este


m =

ti  ni =n =

1X
ti  fi
n

1
(1  8 + 2  5 + 3  5 + 4  6 + 5  1 + +6  1
40
+7  3 + 8  1 + 9  3 + 10  3 + 11  2 + 12  2)
= 5
=

 dispersia empiric
a este
X
(ti m )2  ni =n

1
=
(1 m )2  8 + (2
40
= 13; 179

 2

m )  5 + (3

 2

m )  5 +    + (12

 2

m ) 2

 mediana este 4, prima cvartil


a este 2, a treia cvartil
a este 8,25, modul este 1.
 histograma frecventelor este


LECTIA
8. STATISTICA DESCRIPTIVA

112

0,6
0,5
0,4
0,3
0,2
0,1
0
1

10 11 12

10 11 12

 histograma frecventelor cumulate este:


1
0,8
0,6
0,4
0,2
0
1

Exemplul 8.11 Se da o selectie de 150 de numere fx1 ; x2 ; :::; x150 g cu media de selectie
m=102, 42. Aceste numere se grupeaza n 8 intervale [81; 5; 87; 5); [87; 5; 93; 5); :::; [123; 5; 129; 5),
de lungime 6 unitati. Ele se repartizeaza n aceste intervale dupa cum urmeaza: n primul
interval avem 2 numere (n1 =2), n al doilea 23 de numere (n2 =23), f3 =22, n4 =65, n5 =20,
n6 =10, n7 =0, n8 =8.a) Sa se calculeze media selectiei. b) Sa se calculeze dispersia selectiei.
Solutie a) este l
asat ca exercitiu; se g
aseste m = 102; 42:
b) Se face urm
atorul tabel de calcule:


LECTIA
8. STATISTICA DESCRIPTIVA

xj

113

m (xj

nj xj

m )2

(xj

m ) 2 nj

(mijlocul int:)

84; 5
90; 5
96; 5
102; 5
108; 5
114; 5
120; 5
126; 5

G
asim S2 =
x2j nj
n

8.2

2
23
22
65
20
10
0
8

P
(xj m)2 nj
n

17; 92
11; 92
5; 92
0; 08
6; 08
12; 08
18; 08
24; 08

11519;04
150

321; 1264
142; 0864
35; 0464
0; 0064
36; 9664
145; 9264
326; 8864
579; 8464

642; 2528
3267; 9872
771; 0208
0; 4160
739; 3280
1459; 2640
0; 0006
4638; 7712
__________
11519; 0400

= 76; 79. Pentru vericare putem folosi formula S2 =

m2 care este mai comod


a, dar cere o coloan
a separat
a cu calculul lui x2j .

Statistica a dou
a variabile

S
a presupunem c
a avem dou
a caracteristici numerice care se urm
aresc, de exemplu n
altimea
si greutatea. Prin testare se g
aseste urm
atoarea situatie: xi sunt greut
atile, yj sunt n
altimile
observate (grupate pe intervale), iar la ntret
aierea coloanei i cu linia j se a
a num
arul de
cazuri observate, ni;j .
xi !
yj #

152
157
162
167
ni;:

43
20
2
0
0
22

48
8
18
1
1
28

53
2
1
10
4
16

58
0
4
4
15
23

n:;j
30
25
15
20
N=80

Not
am o asemenea serie de observatii prin (xi ; yj ; ni;j ) 1ip . Avem de exemplu la x2 =48
1jq

si y1 =152 un num
ar de n2;1 =8 cazuri nregistrate.
Se denesc
atoareleP
m
arimi: P
P urm
a n
i) ni;: = j ni;j , n:;j = i ni;j , N= i;j ni;j . Seria (xi ; ni;: ) se numeste seria marginal
n
n
x, iar seria (yj ; n:;j ) se numeste seria marginal
a n y. fi;: = Ni;: si f:;j = N:;j se numesc frecvente
n
marginale, iar
f = Ni;j se numeste frecven
ta dubl
a.P
P i;j
P
ii) mx =
ii)

ni;j xi
N

i;j

 2
x

i;j

ni;: xi
N

ni;j (xi
N

si my =
mx )2

ni;j yj
N

i;j

ni;: (xi
N

n:;j yj
N

mx )2

se numesc medii marginale.


=

ni;: x2i
N

m2
x


LECTIA
8. STATISTICA DESCRIPTIVA
si

114

2
P
P
2
ni;j (yj my )2
my
j n:;j yj
j n:;j yj
=
=
=
m2
y
N
N
N
se numesc dispersii (variante) marginale.
iv) Covarianta seriei este num
arul

P
P


n
(x
m
)
y
m
i;j
i
j
x
y
i;j
i;j ni;j xi yj
cov(x; y) =
=
mx my :
N
N
 2
y

i;j

v) Coecienrtul de corelatie liniar


a al seriei este x;y =
In cazul de mai sus g
asim
mx =

cov(x;y)
.
 x  y

22  43 + 28  48 + 16  53 + 23  58
= 49; 438;
80

30  152 + 25  157 + 15  162 + 20  167


= 157; 313;
80
22  (43 49; 438)2 + 28  (48 49; 438)2 +
+16  (53 49; 438)2 + 23  (58 49; 438)2
2
x =
= 28; 246;
80
30  (152 157; 313)2 + 25  (157 157; 313)2 +
+15  (162 157; 313)2 + 20  (167 157; 313)2
 2
= 26; 465;
y
80
20  (43 49; 438)  (152 157; 313)+
+8  (48 49; 38)  (152 157; 313)+
::: + 15  (58 49; 438)  (167 157; 313)
= 18; 926;
cov(x; y) =
80
18; 926
x;y = p
= 0; 692:
28; 246  26; 465
my =

Reprezentarea grac
a a datelor se face prin discuri pline: n punctul (xi ; yj ) se pune un
disc cu aria proportional
a cu num
arul de observatii care au dat greutatea xi si n
altimea yj .
Se obtine histograma:


LECTIA
8. STATISTICA DESCRIPTIVA

115

167.5

165

162.5

160

157.5

155

152.5

42.5

45

47.5

50

52.5

55

57.5

( dreapta nu face parte din histograma; vezi n continuare)


Doua selectii de acelasi volum n din doua populatii diferite, fx1 ; :::; xn g si fy1 ; :::; yn g se
zic corelate prin functia y = f (x) daca yk = f (xk ), pentru k = 1; 2; :::; n.
Dac
a f (x) = ax + b, corelatia se zice liniara. Am v
azut n lectia 6 c
a  x;y = 1 este

echivalent cu faptul c
a punctele (xi ; yj ) sunt de-a lungul unei drepte. Dac
a x;y este apropiat
de 1 atunci datele (xi ; yj ) sunt aproximativ pe o dreapt
a y = ax + b. Relu
am aici, n varianta
folosit
a n aplicatii acest lucru.
Teorema 8.12 Fie (xi ; yj ; ni;j ) 1ip o selectie dubla. Atunci:
1jq

a) 1  x;y  1 si semnul egal apare daca si numai daca punctele (xi ; yj ), pentru ni;j 6= 0;
sunt coliniare.
b) Ecuatia dreptei y = ax+b, unde coecientii a; b sunt determinati de conditia ca expresia
X
X
(yj axi b)2 =
ni;j (yj axi b)2
(a; b) =
(xi ;yj )=observat

i;j

sa e minima, este:
y=

cov(x; y)
(x
 2
x

mx ) + my

(8.4)

Aceasta dreapta se numeste dreapta de regresie a lui y n x.


Demonstratie.
2
P
a
a) Deoarece ni;j  0, atunci expresia E = i;j ni;j t(yj my ) + (xi mx ) este pozitiv
2
2 2
pentru orice t 2 R. Ridicnd la p
atrat, g
asim: t  y +2cov (x; y) t+ x  0 pentru orice t 2 R.
2
2
2 2
a
asim 2x;y  1, adic
artire cu  2
Prin urmare  = 4cov (x; y) 4 y  x  0. Prin mp
x  y g
1  x;y  1: Dac
a  = 1 atunci  = 0 deci exist
a t0 astfel ca E = 0, deci ecare parantez
a


LECTIA
8. STATISTICA DESCRIPTIVA

116


este egal
a cu 0, deci pentru orice i; j, pentru care ni;j 6= 0 avem t0 yj my + xi mx = 0,
deci punctele (xi ; yj ) cu ni;j 6= 0 sunt coliniare.
b) @(a;b)
= 0; @(a;b)
= 0 formeaz
a un sistem liniar n a si b cu solutiile a = cov(x;y)
,
@a
@b
 2
x
b = my amx .
QED.
Analog se determin
a dreapta de regresie a lui x n y. Cele dou
a drepte sunt distincte. Ele
coincid doar dac
a datele (xi ; yj ) sunt coliniare. In cazul de mai sus g
asim y = 0; 67x+124; 188,
dreapt
a care este reprezentat
a pe histograma datelor.
Dac
a f (x) =Pax2 +bx+c, corelatia se zice parabolica. Coecientii se determin
a din conditia
2
2
a e minim
a.
ca  (a; b; c) = i;j ni;j (yj axi bxi c) s
bx
Dac
a f (x) = ae , corelatia se zice exponentiala si se reduce prin logaritmare tot la o
corelatie liniar
a: ln (f (x)) = ln (a) + bx. Coecientii = ln (a) si b se determin
a din conditia
P
a e minim
a.
ca  ( ; b) = i;j ni;j (ln (yj ) bxi )2 s
Dac
a f (x) = axb , atunci avem prin logaritmare ln(f (x)) = P
ln(a) + b ln (x), si, la fel ca mai
sus se deduc coecientii = ln (a) si b din conditia  ( ; b) = i;j ni;j (ln(yj ) b ln(xi ))2
s
a e minim
a.
In multe situatii pentru ecare xi avem doar o valoare y pe care o not
am yi , deci valorile
(xi ; yi ) sunt pe gracul unei functii. Determinarea unei functii care ajusteaz
a datele respective
prin metoda celor mai mici patrate const
a n propunerea unui model
de
func
tie, f (x; a; b; ::);
P
f (xi ; a; b; ::))2 s
a e
si determinarea parametrilor a; b; :: din conditia  (a; b; ::) =
i (yi
minim
a.

8.3

Exercitii

1. S-a facut un sondaj preelectoral pe un esantion de 100 persoane. Am notat cu A, B, C,


D, E candidatii, cu F raspunsul nedecis si cu G raspunsul nu intentionez sa votez. Sa se
construiasca o histograma cu functia de distributie si alta histograma cu functia de repartitie
(frecventa cumulata) pentru acest sondaj daca raspunsurile sunt date n urmatorul tabel: C,
A, A, B, E, F, F, C, C, C, A, B, A, A, A, E, F, A, B, G, D, B, B, C, F, G, G, D, D, D,
B, A, B, B, B, F, G, B, C, A, E, C, C, D, G, A, A, E, E, E, C, D, D, E, G, G, A, B, B,
A, F, F, G, G, G, G, A, A, A, B, B, C, C, A, A, D, D, E, F, G, A, B, C, C, D, A, E, F,
A, B, F, G, A, B, C, D, A, A, B, E.
Solutie Aici trebuie mai nti s
a codic
am numeric literele (optiunile electoratului) A, B,
C, D, F, G. De exremplu, propunem urm
atoarea codicare:
G !0
F !1
A !4
B !5
C !6


LECTIA
8. STATISTICA DESCRIPTIVA

117

D !7
2. Doua grupe de 10 studenti A si B au obtinut urmatoarele note la examenul de statistica:
A : 8, 5, 6, 6, 7, 9, 4, 3, 5, 6
B : 9, 6, 7, 8, 6, 10, 5, 4, 6 ,7.
Sa se gaseasca cea mai buna corelatie liniara ntre cele doua selectii. Sa se gaseasca valoarea deviatiei patratice. Sa se faca acelasi lucru pentru o corelatie de tip parabolic si sa se
compare deviatiile patratice.
3. Fie selectia {0, 1, -1, -1, -2, 1, 1, -1, 2, 3, 1, 4, 3, -1, 0, 0, 3, -1, -2, -2} dintr-o
populatie anume. Fie X v.a. care guverneaza populatia. Sa se aproximeze cu ajutorul selectiei numarul P (0 X  2). Se cere gracul functiei de repartitie pentru aceasta selectie si o
histograma a frecventelor.
4. S-a facut un sondaj asupra pretului (n centi) galonului de benzina premium asupra a
30 statii luate la ntmplare. De aici a rezultat selectia: 65, 58, 64, 68 , 52, 48, 59, 59, 56, 63,
61, 66, 52, 57, 60, 62, 55, 55, 64, 71, 61, 63, 46, 53, 60, 57, 58, 57, 54, 58. Se cere gracul
poligonului de frecventa (relativa) daca: a) grupam datele n intervale de lungime 3, cu 60
centrul unui asemenea interval; b) grupam datele n intervale de lungime 5, cu 60 ca centru al
unui asemenea interval. Calculati pentru aceste grupari media si dispersia de selectie. Gasiti
gracul functiilor de repartitie empirice.
5. La un concurs 12 studenti au obtinut urmatorele punctaje: 18, 15, 19, 27, 13, 30, 24,
11, 5, 16, 17, 20. Calculati media, mediana, deviatia standard si deviatia absoluta medie.
Construiti functia empirica de frecventa cumulata (f. de repartitie) si interpretati rezultatele
obtinute.

Lectia 9
Statistici. Estimarea parametrilor
Amintim c
a o populatie P este o multime de obiecte din care se fac selectii nite (de volum
n < 1). Populatia se poate identica cu multimea tuturor observatiilor potentiale pe care
le putem face asupra obiectelor ei. Pentru ecare obiect al selectiei se testeaz
a valoarea unei
caracteristici numerice, X. Admitem c
a pe P exist
a o probabilitate si c
a X este o variabil
a
aleatoare. Distributia (functia de repartitie) a v.a. X se numeste distributia populatiei dupa
caracteristica X.
Exemplul 9.1 Intr-o magazie grul este amestecat cu neghina. Populatia P este aici totalitatea boabelor din magazie ( cteva sute de milioane). Fie X : P ! R,

1 daca e grau
X(bob) =
0 daca e neghina
Probabilitatea p ca un bob sa e de tip A este denita prin:
p(A) =

nr. de boabe de tipul A


;
nr. de boabe din magazie

AP

Aici p nu se poate determina experimental exact din cauza numarului mare de boabe, dar
teoretic p exista. Valoarea medie a lui X nmultita cu 100 este procentul de boabe de gru din
magazie, lucru important.
Exemplul 9.2 Sa presupunem ca mai multe persoane, sau aceeasi persoana n mai multe
rnduri, masoara independent o lungime, de aproximativ 1 km folosind o ruleta de 2 m.
Evident ca se vor obtine rezultate diferite datorita unei game largi de cauze incontrolabile.
Putem n acest caz considera P ca multimea tuturor complexelor de cauze necontrolabile care
inuenteaza rezultatul masuratorii sau putem considera P ca multimea tuturor masuratorilor
posibile. Oricum P nu este o multime pe care o putem explicita ca n cazul precedent. Admitem
nsa ca pe P exista o probabilitate iar o masuratoare nseamna o manifestare a unui complex
! de cauze necontrolabile care conduc la un rezultat X(!) , n cazul nostru X ind o lungime.
118

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

119

Prin urmare caracteristica lungime apare ca o functie X : P ! R: Admitem ca X este o


variabila aleatoare, adica (vezi lectiile 2, 3) f! 2 P j X(!) < rg  P este o multime pe care
este denita probabilitatea p.
Statistica Matematic
a se ocup
a, printre altele, cu problema determin
arii repartitiei unei
variabile aleatoare X ca n exemplele de mai sus, prin experimente. In general n experimente
conduc la n valori numerice x1 ; :::xn . Ce operatii trebuie f
acute cu valorile x1 ; :::xn pentru a
g
asi caracteristici ale lui X si ce ncredere putem avea n rezultatele obtinute?
In continuare prezent
am felul n care putem considera rezultatele x1 ; x2 ; :: xn ale lui X n
n experiente independente ca valori a n variabile aleatoare independente X1 ; X2 ; ::: Xn . La o
prim
a lectur
a se poate s
ari peste aceast
a parte, remarcndu-se doar concluziile.
Fie P ca mai nainte spatiul probabilizat al cauzelor incontrolabile, e
 P (P )  algebra
submultimilor lui P pentru care e denit
a  probabilitatea p. Not
am P 1 sirurile de elemente
din P . Deci ! 2 P 1 dac
a si numai dac
a ! = (! k )k2N si pentru orice k, ! k 2 P . Urm
atoarele
submultimi ale lui P 1 :
A = A1  A2  :::  An  P  P  :::
= f(! k )k2N j ! k 2 Ak pentru 1  k  n g

(9.1)

unde Ak 2
pentru orice k, se numesc paralelipipede. Aici n nu este xat ci poate orice
num
ar natural. Fie
1 submultimile lui P 1 care sunt reuniuni nite de paralelipipede.
Se arat
a c
a aceaste multimi formeaz
a o algebr
a. Pe aceast
a algebr
a putem deni o unic
a
0
probabilitate p astfel ca pentru paralelipipede s
a avem:
p0 (A) = p (A1 )  p (A2 )  :::p (An )

(9.2)

unde p este probabilitatea pe P. Denitia seam


an
a cu denitia volumului unui paralelipiped
n functie de lungimile laturilor sale. Asemenea probabilit
ati nu sunt suciente pentru nevoile
de calcul. E nevoie de o proprietate de continuitate de genul: B1  B2  :::Bk  ::: cu
B = [k=1;1 Bk implic
a p (B) = lim p (Bk ). Constructia unei astfel de probabilit
ati peP 1 se
n!1
realizeaz
a astfel:
a) Se extinde
1 la cea mai mic
a  algebr
a (deci algebr
a de multimi nchis
a si la reuniuni
(1)
num
arabile) notat
a

b) Probabilitatea p0 denit
a pe
1 ese extinde unic la o  probabilitate pe
(1) notat
a
(1)
p
Probabilitatea p(1) se numeste probabilitate produs. Detaliile de constructie nu fac obiectul acestui curs. Putem remarca asem
anarea constructiei probabilit
atii produs cu a volumului
corpurilor plecnd de la lungime. Asa cum n afar
a de reuniuni nite de paralelipipede exist
a
(1)
si alte corpuri cu volum, tot asa apar n

si alte multimi care au probabilitate, n afar


a
de reuniunile nite de tipul (9.1).
Denitia 9.3 Multimea P 1 mpreuna cu
(1)  P (P 1 ) si cu probabilitatea p(1) :
(1) !
R se numeste produsul innit al cmpului de probabilitate (P;
; p).

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

120

Observatia 9.4 In lectia 2 am introdus produsul nit al unor cmpuri de probabilitate. Fata
de cazul considerat acolo, aici avem doua lucruri n plus:
a) pentru a avea o  probabilitate pe produs trebuie extinsa algebra de multimi formata din
reuniuni nite de multimi paralelipipedice la o  algebra
b) Am luat n consideratie o innitate de factori n produs .
Observatia 9.5 In principiu nu e nevoie de o cunoastere detaliata a produsului de cmpuri
de probabilitate. Este sucient sa stim ca el exista si ca probabilitatea unei multimi paralelipipedice este produsul probabilitatilor factorilor (formula 9.2).
Fie acum X o v.a. pe P , X : P ! R. In aceste conditii pe P 1 avem un sir de v.a. denite
prin:

Xi : P 1 ! R; Xi (!) = Xi (! k )k2N = X (! i )

pentru orice i 2 N . Prin urmare Xi aplicat


a unui sir este valoarea lui X pe componenta a i a
1
sirului ! = (! k )k2N 2 P . Aceste v.a. sunt independente si la fel distribuite (adic
a au aceeasi
functie de repartitie, deci aceleasi caracteristici numerice). Pe produsul nit P n = P P:::P
avem n mod analog variabilele aleatoare Xi denite prin formula de mai sus dar cu ! 2 P n .
Ele sunt independente si la fel distribuite.
In concluzie, mai multe masuratori ale unei marimi apar n statistica astfel:
a) Urmarim o componenta numerica a unui fenomen, sa zicem notata cu X.
b) Acea caracteristica depinde de o seama de factori dintr-o multime P, n general neexplicita.
c) Admitem ca pe P exista o probabilitate p, iar X:P! R este o variabila aleatoare.
d) Prin n experiente independente gasim pentru X valorile x1 ; x2 ; :::xn .
e) x1 ; x2 ; :::xn apar ca valorile a n variabile aleatoare X1 ; X2 ; :::Xn denite pe spatiul
produs P n sau pe P 1 . Aceste v.a. sunt independente si la fel distribuite ca X. Vom numi
X1 ; X2 ; :::Xn variabile aleatoare de selectie asociate lui X. X i reprezinta rezultatul experientei
i. In cele ce urmeaza vom considera toate variabilele X i denite pe aceeasi multime P 1 .
Ne ocup
am n continuare de operatiile pe care le facem cu rezultatele x1 ; x2 ; :::xn pentru a
obtine caracteristici ale variabilei aleatoare X. Vom folosi doar acele operatii n care multimea
P, care nu este explicit
a, nu intervine efectiv. Probabilitatea pe P 1 o vom nota uneori cu
Prob alteori cu p.
Denitia 9.6 Se numeste statistica un sir (Gn )n2N de variabile aleatoare Gn : P 1 ! R.
Toate statisticile utilizate de noi vor de forma urmatoare:
i) se da un sir de functii gn : Rn ! R
ii) avem o v.a. X : P ! R
Fie X1 , X2 ,...Xn ,... variabilele aleatoare asociate. Denim statistica:
gn (X1 ; X2 ; :::Xn ) : P 1 ! R

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

121

, astfel
gn (X1 ; X2 ; ::Xn ) (!) = gn (X1 (!) ; X2 (!) ; :::Xn (!)) pentru ! 2 P 1

Uneori vom folosi termenul de statistica pentru sirul de variabile aleatoare construite mai sus
pe P 1 .
Exemple de statistici frecvent folosite
Fie X o v.a. cu functia de repartitie F : R ! R, si X1 ; X2 ; :::Xn variabilele de selectie
asociate. Vom
atoarele notatii:
R 1 folosi urm
a1) m= 1 xdF (x) = media lui X (Lectia 3)
 (n) = X1 +X2 +:::+Xn : P 1 ! R; o v.a. numit
b1) M(X1 ; X2 ; :::Xn ) = X
a media de selectie.
n

Uneori o vom nota cu X(n) pentru a pune n evidenta dependenta de n, alteori o vom nota
 Astfel,
simplu X.
n
c1) m = m (x1 ; x2 ; :::xn ) = x1 +x2 +:::+x
este valoarea mediei de selectie pentru rezultatele
n
x1 ; x2 ; :::xn ob
n cele n experiente, numit
a si media empirica (Lectia 8).
Rtinute
1
ak) mk = 1 xk dF (x) =momentul de ordin k al lui X (Lectia 3)
X1k +X2k +:::+Xnk
; o v.a. numit
a momentul de selectie de ordin k.
n
xk1 +xk2 +:::+xkn


ck) mk = mk (x1 ; x2 ; :::xn ) =
=momentul empiric de ordin k (Lectia 8)
n
R1
k
ak0) k = 1 (x m) dF (x) = momentul centrat de ordin k al lui X (Lectia 3)
k
k
k
(X1 X ) +(X2 X ) +:::+(Xn X )
bk0) M0k (X1 ; X2 ; :::Xn ) =
: P 1 ! R; o v.a. numit
a mon

bk) Mk (X1 ; X2 ; :::Xn ) =

mentul centrat de ordin k.


 k
 k
 k
ck0) k = k (x1 ; x2 :::xn ) = (x1 m ) +(x2 mn ) +:::+(xn m ) =momentul centrat de ordin k,
empiric (Lectia 8).
R1
a20) D= 2 = 1 (x m)2 dF (x) = dispersia lui X (Lectia 3).
2
2
2
(X1 X ) +(X2 X ) +:::+(Xn X )
2
b20) D(X1 ; :::Xn ) = S (X1 ; :::Xn ) =
:P1 ! R; o v.a. nun
mita dispersia de selectie.



 2 + X2 X
 2 + ::: + Xn X
 2
X1 X
02
S (X1 ; X2 ; :::Xn ) =
: P1 ! R
n 1
se numeste dispersia de selectie modicata.
 2
c20) s2 =D = D (x1 ; x2 ; :::xn ) = (x1 m ) +(x2
 2

m )2 +:::+(xn m )2
= dispersia empirica de
n
m )2 +:::+(xn m )2
se numeste dispersia empirica modn 1

selectie (Lectia 8), iar s02 = (x1 m ) +(x2


icata.
E de asteptat ca v.a. de selectie de mai sus s
a aproximeze ntr-un fel sau altul marimile
corespunz
atoare ale variabilei X.
Propozitia 9.7 Avem relatia
S 2 (X1 ; X2 ; :::; Xn ) = M2 (X1 ; X2 ; :::; Xn )

(9.3)

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

122

Demonstratie
2

S (X1 ; X2 ; :::; Xn ) =
=
=
=


2
1X
1 X 2
2
Xi 2XXi + X
Xi X =
n
n
X
1X 2 2
1
2
Xi +  nX
X 
Xi
n
n
n
1X 2
2
Xi 2  X  X + X
n
2
M2 (X1 ; X2 ; :::; Xn ) X

QED.
Fie X o v.a. si X1 ; X2 ; :::; Xn ::: variabilele de selectie asociate. Fie de asemenea A2 R.
Denitia 9.8 Se numeste estimator sau functie de estimatie pentru A, o statistica (gn )n2N
astfel ca pentru orice  > 0 sa avem:
lim Prob( jgn (X1 ; X2 ; :::Xn )

n!1

Aj > ) = 0

Cu alte cuvinte,  > 0 ind dat, pentru valori mari ale lui n este foarte putin probabil ca
variabila aleatoare gn (X1 ; X2 ; :::Xn ) s
a ia valori n afara intervalului [A ; A + ], adic
a este
foarte putin probabil ca num
arul
gn (x1 ; x2 ; :::xn ) s
a e n afara intervalului [A ; A + ]. In aceste conditii, dup
a un num
ar de
n experiente, consider
am pe gn (x1 ; x2 ; :::xn ) ca o aproximatie bun
a pentru A. Este posibil s
a
ne nsel
am, dar probabilitatea de a ne nsela este mic
a, pentru n mare. Statistica nu ne ofer
a
r
aspunsuri sigure ci doar aproximatii n care putem avea un grad mai mic sau mai mare de
ncredere. Se accept
a acele aproximatii n care avem un grad mai mare de ncredere.
Denitia 9.9 O statistica (gn (X1 ; :::Xn ))n2N se numeste corecta sau deplasata relativ la valoarea A daca avem:
1) lim M(gn (X1 ; X2 ; :::; Xn )) = A:
n!1

2) lim D (gn (X1 ; X2 ; :::; Xn )) = 0:


n!1

si se numeste absolut corecta sau nedeplasata dac


a n plus M(gn (X1 ; X2 ; :::; Xn )) = A.
Conditiile 1) si 2) din denitia de mai sus pun n evidenta situatii n care o statistic
a
oarecare (gn )n2N este un estimator pentru o valoare A. Teorema de mai jos pune n evidenta
importanta conditiilor din denitia anterioar
a.
Teorema 9.10 Daca statistica (gn (X1 ; X2 ; :::; Xn ))n2N este corecta relativ la A atunci ea este
un estimator al lui A, adica pentru orice  > 0 avem
lim P rob(jgn (X1 ; X2 ; :::Xn )

n!1

Aj > ) = 0:

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

123

Demonstratie. Conform cu inegalitatea lui Cebsev (Lectia 5) pentru un  > 0 avem:


Prob(jgn (X1 ; X2 ; :::Xn )


M (gn (X1 ; X2 ; :::Xn ))j>)

D(gn (X1 ;X2 ;:::Xn ))


2

Acum tinnd seama de 1) si 2) din denitia corectitudinii rezult


a
P rob(jgn (X1 ; X2 ; :::Xn )

Aj > ) ! 0

cnd n ! 1, deci statistica (gn (X1 ; X2 ; :::; Xn ))n2N este un estimator al lui A.
QED.
Ar
at
am acum c
a functiile de selectie introduse cu ocazia notatiilor precedente sunt estimatori pentru valorile corespunz
atoare ale variabilei X.
Teorema 9.11 a) Statistica media de selectie:
 (n) = (X1 + X2 +    + Xn ) =n
gn (X1 ; X2 ; :::; Xn ) = X
estimeaza media m =M(X) a v.a. X absolut corect.
b) Statistica

1X r
Xi
n
estimeaza absolut corect momentul de ordin r, mr , al v.a. X.
c) Statistica
2
1X
S 2 (X1 ; X2 ; :::; Xn ) =
Xi X (n)
n
estimeaza corect dar nu absolut corect dispersia v.a. X,  2 =D(X).
n
2
P
d) S0 2 (X1 ; X2 ; :::; Xn ) = n 1 1
Xi X (n) , adica dispersia de selectie modicata, aproxhn (X1 ; X2 ; :::; Xn ) =

i=1

imeaza absolut corect dispersia v.a. X.

Demonstratie Trebuie vericate


conditiile 1 si 2 din denitia statisticii corecte.
P
a) Veric
am 1): M(gn )= n1 M(Xi )= n1  n  m = m =M(X).
P
Veric
am 2): D(gn )= n12 D(Xi )= D(X)
, deoarece X1 ; X2 ; :::; Xn sunt independente. Prin
n
urmare D(gn )! 0, cnd n ! 1.
P
1
b) Veric
am 1): M(hn )=P
M(Xri )= n1  n  mr = mr
n
Veric
am 2): D(hn )= n12 D(Xri )= n1 D(Xr )! 0, cnd n ! 1. Retinem formula:
D(X(n) = D(X)=n

(9.4)

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

124

c) ncerc
am s
a veric
am 1):

 din 9.3
= M M2 (X1 ; X2 ; :::; Xn )
X  
2
1
= M (M2 (X1 ; X2 ; :::; Xn ))
X
M
i
n2

X  X 
1
M
Xi
Xj
= M (X 2 )
n2
!
X 
X
1
1
2
2
= M (X )
Xi Xj
M
M
Xi
n2
n2
i6=j

n
1X
2
= M (X 2 )
M (Xi Xj )
M
X
n2
n2 i6=j
M S 2 (X1 ; X2 ; :::; Xn )

Xi ;Xj independente:

1
n

M(X2 )

M (X 2 )

 n
M(X)2 =

X (n)

1
 n(n 1)M (X)2
n2
1
D(X) ! D (X)

Prin urmare S2 nu estimeaz


a absolut corect dispersia v.a. X. Retinem formula deja g
asit
a:
 n
M S2 (X1 ; X2 ; :::; Xn ) =

1
n

D(X)

E clar c
a M (S 02 (X1 ; X2 ; :::; Xn )) = D (X).
Veric
am 2): l
as
am ca exercitiu pentru cititor vericarea formulei


1
n 3
2
02
D(S ) =
[D(X)]
m4
n
n 1

(9.5)

(9.6)

unde m4 este momentul de ordin 4 al v.a. X.


2
Se vede clar de aici c
a D(S0 2 )! 0, cnd n ! 1. De asemenea D (S 2 ) = nn 1 D (S 02 ) !
0 cnd n ! 1.
QED.
Observatia 9.12 In practica se foloseste S0 2 n locul lui S2 deoarece da rezultate mai bune
dupa cum ne arata teorema 2. Totusi formula (9.6) ne spune ca pentru n sucient de mare
si statistica S2 poate folosita ca estimator al dispersiei v.a. X. Din denitia lui S0 2 si din
formula (9.6) gasim formula utila:

D(S ) =

1)2

(n
n3

m4

n
n

3
[D(X)]2
1

(9.7)

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

125

Exercitiul 9.13 Fie selectia {0, 1, 1, 0, 1, 1, 2, 0, 0, 2}. Sa se estimeze absolut corect


dispersia populatiei din care provine aceasta selectie.
Solutie. Media este estimat
a absolut corect de media empiric
a m = 8=10 = 0; 8:
Dispersia este estimat
a absolut corect de dispersia modicat
a empiric
a
1
[(0 0; 8)2 + (1
9
+(1 0; 8)2 + +2
= 0; 56

s0 *2 =

0; 8)2 + (1

0; 8)2 + (0

0; 8)2 + (1

0; 8)2

0; 8)2 + (0

0; 8)2 + (0

0; 8)2 + (2

0; 8)2 ]

Observatia 9.14 Deoarece dispersia se mai numeste si varianta vom folosi si noi uneori
varianta de selectie pentru dispersia de selectie.

9.1

Principiul verosimilit
atii maxime

Presupunem c
a P este o populatie unde se urm
areste caracteristica numeric
a X; care este o
variabil
a aleatoare cu densitatea de probabilitate f (x; ),  ind un parametru necunoscut.
Cunoastem doar forma matematic
a a functiei f (x; ). De exemplu dac
a stim c
a X este
2
o v.a. normal
a cu media , necunoscut
a dar cu dispersia  cunoscut
a, atunci f (x; m) =
p1 e
2

(x m)2
2 2

.
Pentru determinarea lui  facem o selectie care d
a rezultatele fx1 ; :::; xn gsi ncerc
am pe
baza lor s
a estim
am pe . Deoarece v.a. de selectie X1 ; :::; Xn sunt independente, probabilitatea ca X1 s
a ia valoari n intervalul [x1 ; x1 + dx1 ), X2 s
a ia valori n [x2 ; x2 + dx2 ), ...,
Xn s
a ia valori n [xn ; xn + dxn ) este dat
a de f (x1 ; ) f (x2 ; )    f (xn ; )dx1 dx2 :::dxn =
L (x1 ; :::; xn ; ) dx1 dx2 ::::dxn . Aceast
a functie L se numeste functia de verosimilitate si va
folosit
a pentru estimarea lui .
Dac
a X ia valori discrete, atunci f (x; ) este probabilitatea ca X s
a ia valoarea x: De
 x
exemplu, n cazul distributiei Poisson, f (x; ) = e  x! , cu x 2 N, reprezint
a probabilitatea ca
X = x, iar  este parametrul necunoscut ( pe care urmeaz
a s
a-l estim
am!). Probabilitatea ca n
n selectii independente s
a se obtin
a rezultatele x1 ; x2 ; :::xn este f (x1 ; )f (x2 ; ) :::f (xn ; ) =
L (x1 ; x2 ; :::xn ; ) care se numeste si n acest caz functia de verosimilitate.
Functia L este determinat
a de volumul selectiei n si depinde de . Metoda verosimilt
atii
maxime const
a n urm
atorul principiu (axiom
a): valoarea cea mai verosimila (cea mai
potrivita n acest sens!) a parametrului  este aceea pentru care functia L (x1 ; :::; xn ; ) este
maxima. Dup
a cum stim de la Analiza matematic
a, aceast
a cerint
a are loc dac
a avem:
@L (x1 ; :::; xn ; )
=0
@
adic
a  este un punct crirtic pentru L (x1 ; :::; xn ; ).

(9.8)

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

126

Ecuatia (9.8) n practic


a se dovedeste dicil
a. De aceea cel mai des se foloseste observatia: L (x1 ; :::; xn ; ) este maxim
a dac
a si numai dac
a ln L (x1 ; :::; xn ; ) este maxim
a (functia
logaritmic
a este strict cresc
atoare). Deci (9.8) este echivalent
a cu :
@ ln L (x1 ; :::; xn ; )
=0
@

(9.9)

care poart
a numele de ecuatie a verosimilitatii maxime. Rezolv
am ecuatia (9.9), sau ecuatia
(9.8) si g
asim  = n (x1 ; :::xn ). Ca estimator (functie de estimare) pentru  lu
am variabila
aleatoare n (X1 ; X2 ; :::Xn ); care, pentru selectia fx1 ; x2 ; :::xn g d
a rezultatul n (x1 ; x2 ; :::xn ).
Se poate demonstra ca n conditii foarte generale, pentru selectii mari, statistica (X1 ; X2 ; :::Xn )
obtinuta prin metoda verosimilitatii maxime, are o distributie aproximativ normala, cu media
egala cu =valoarea adevarata a parametrului si dispersia
D () =
n

1
R 1  @ 2 ln(f (x;)) 
1

@

=
f (x; ) dx

R 1  @ ln
1

1
f (x;)
@ 

2

f (x; ) dx

Daca distributia este discreta atunci integralele din formula precedenta devin sume.
Exemplul 9.15 Presupunem ca populatia are distributia Poisson (cazul evenimentelor rare).
k
Functia de probabilitate este f (k; ) = e   k! , k =0, 1, 2, .... Ne intereseaza sa estimam parametrul  prin metoda verosimilitatii maxime. Pentru aceasta facem o selectie
fx1 ; x2 ; :::; xn g  f0; 1; 2; :::g.
L (x1 ; :::; xn ; ) = f (x1 ; )  f (x2 ; )      f (xn ; ) = e
ln L (x1 ; :::; xn ; ) =

n +

X


xk ln 

n

 xk

x1 !x2 !:::xn !

ln (xk !)

= 0 ne furnizeaza  = nxk , deci un estimator pentru  este


n (X1 ; ::Xn ) = X1 +X2n+:::Xn adica media de selectie. Deoarece  este media lui X (variabila
Poisson), n este un estimator absolut corect pentru .
@ ln L
@

Este el oare si cel mai ecient, n sensul c


a are dispersia cea mai mic
a? Este greu de
r
aspuns la aceast
a ntrebare. Totusi avem un rezultat puternic care face oarecare lumin
a:
Teorema 9.16 (Rao-Cramer) Daca statistica gn (X1 ; :::; Xn ) da un estimator ecient (cu
dispersia minima , n multimea tuturor estimatorilor absolut corecti pentru ), atunci
D (gn (X1 ; :::; Xn )) =
n

1
R

1
@ ln f (x;)
@ 

2

f (x; )dx

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR
sau
D (gn (X1 ; :::; Xn )) =
n

1
P

x=0

daca distributia este cu valori discrete.

1
@ ln f (x;)
@ 

2

127

(9.10)
f (x; )

F
ar
a demonstratie.
P 
Xk
Ne ntoarcem la exemplul anterior. Stim c
a D(n ) = D
=
n

e x
,
x!

deci

@ ln f (x;))
@

x=0
1 
X
x=0

= e

@

x x2
2 + 2
 

B1 x
BX 
B
B
@ x=0 x!
| {z }
=e

1


= n . f (x; ) =

1 + x . De aici rezult
a

2
1 
X
@ ln f (x; )
=

D(X)
n

f (x; )
e



x!

1
1
X
X
x 1
x 2
(x
2
+
(x 1)! x=1 (x 1)!
x=1
|
{z
|
{z
}
1
=e

=e +  e

C
C
1 + 1)C
C
}A

1
= n = D (n ). Rezult
a din teorema Rao-Cramer c
a statistica
2
( @ ln @f(x;) ) f (x;)
x=0
P
medie de selectie este si un estimator ecient pentru . Putem spune acum c
a  = ( xk ) =n
este o estimatie foarte bun
a n toate sensurile.

Prin urmare

1
P

Exemplul 9.17 Sa se estimeze parametrul p al unei distributii Bernoulli




1
0
p 1 p
prin metoda verosimilitatii maxime.
Solutie.
f (x; p) =

p dac
a x=1
1 p dac
a x=0

Functia de verosimilitate este L (x1 ; x2 ; :::xn ) = pn1 (1 p)n n1 unde n1 este num
arul de real@(n1 ln p+(n n1 ) ln(1 p))
n1
n n1
@ ln L
iz
ari ale lui 1. @p = 0 devine
= 0 adic
a p
= 0 care are solutia
@p
1 p
n1
p = n . Valoarea n1 este valoarea variabilei X1 + X2 + ::: + Xn , unde Xi este variabila de

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

128

selectie a c
arei valoare este 1 dac
a la experienta i se obtine rezultatul 1 si are valoarea 0 n
caz contrar. Prin urmare statistica ce estimeaz
a parametrul p este
P=

X1 + X2 + ::: + Xn
n

care este chiar media de selectie. La fel ca n cazul repartitiei Poisson se arat
a c
a
D (P) =

pq
n

=
n

P1

x=0

1
@ ln f (x;p)
@p

2

=
f (x; p)



@ ln (1 p)
@p

2

1
(1

p) +

@ ln p
@p

2 
p

deci estimarea lui p este absolut corect


a (exercitiu).
Dac
a avem de estimat mai multi parametri 1 ; 2 ; ::p , stiind c
a densitatea de probabilitate
a variabilei aleatoare X este f (x; 1 ; :::p ), atunci n mod analog cu cazul unui singur parametru, principiul verosimilit
atii maxime spune c
a n urma a n experiente independente care
dau rezultatele x1 ; x2 ; :::xn , se aleg pentru parametri acele valori care maximizeaz
a functia
de verosimilitate L (x1 ; ::xn ; 1 ; ::p ) = f (x1 ; 1 ; 2 ; :::p )  f (x2 ; 1 ; ::p )  ::f (xn ; 1 ; 2 ; ::p ) sau
ceea ce este acelasi lucru acele valori care maximizeaz
a ln L (x1 ; x2 ; ::xn ; 1 ; :::p ). Aceasta
implic
a:
8 @ ln L(x ;x ;::xn ; ;:::p )
1 2
1
>
=0
>
@1
>
< @ ln L(x1 ;x2 ;::xn ;1 ;:::p )
=0
@2
(9.11)
>
:::::
>
>
: @ ln L(x1 ;x2 ;::xn ;1 ;:::p ) = 0
@p
Exemplul 9.18 Sa presupunem ca v.a. X are o distributie normala cu

1
f (x; m; ) = p2
e
(9.11) devine:

(x m)2
2 2

. In acest caz avem ln L =




care are ca solutii m =

xi
n

1
2
n


n
2

ln (2)

n ln 

m) = 0
+
=0
qP
 2
i (xi m )
= m (x1 ; ::xn ) si  =
.
n

P
(xi m)2
.
2 2

Sistemul

(x
Pi

(xi m)2
3

 (n) = X1 +X2 +:::+Xn si D(X1 ; :::Xn ) =


S
tim din aceast
a lectie c
a M(X1 ; X2 ; :::Xn ) = X
n
2
2
2
(X1 X ) +(X2 X ) +:::+(Xn X )
sunt estimatii corecte pentru media si dispersia unei variabile
n
aleatoare, n cazul nostru pentru m si  2 .

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

9.2

129

Metoda momentelor (K. Pearson)


P k
xi

Dat
a selectia fx1 ; :::; xn g noi putem calcula momentul de ordin k al selectiei:
= in ,
pentru orice k =0, 1, 2, .... Obtinem astfel estimatori pentru medie, dispersie ,momente de
(k)
diferite ordine. Functia caracteristic
a Xc (t) are toate derivatele n t = 0 date de Xc (0) =
ik M k (X). Prin urmare n conditii foarte generale, care asigur
a c
a Xc (t) este analitic
a (se
poate dezvolta n serie convergent
a de puteri n jurul oric
arui punct), rezult
a c
a momentele
k
M (X) determin
a pe Xc (t) care la rndul ei determin
a repartitia lui X (vezi Lectia 3).
Aceast
a observatie a fost folosit
a de K. Pearson pentru a g
asi estimatori pentru parametrii
unei legi de probabilitate.
Fie  (x; 1 ; 2 ; :::p ) densitatea Rde probabilitate a v.a. X, unde parametrii 1 ; :::p sunt
1
necunoscuti. Exist
a relatiile:mk = 1  (x; 1 ; 2 ; :::p ) xk dx pentru orice k. Am v
azut c
a mk


este estimat de mk . Egalnd valoarea teoretic exact
a cu estimarea practic
a, mk = mk , adic
a:
(Z
Pi=n k
1
x
k
x   (x; 1 ; 2 ; :::p ) dx = i=1 i
(9.12)
n
1
mk

pentru k=1,2,...p, obtinem un sistem care d


a prin rezolvare k = n (x1 ; x2 ; :::xn ), pentru
k=1,2,..p.
Ca estimatori pentru k se iau v.a. k (X1 ; X2 ; :::Xn ).
Dac
a v.a. X este dicret
a atunci integrala dim (9.12) devine sum
a, la fel ca n cazul metodei
verosimilit
atii maxime.
1
Exemplul 9.19 Fie v.a. cu densitatea  (x; ) = ()
x 1 e x , pentru  > 0 x > 0. Aici
parametrul este . Se cere o metoda de a estima pe  prin selectii. Daca folosim metoda
momentelor gasim
Z 1
1  1 x
x1 + x2 + :::xn
x
x e dx =
()
n
0

adica  =

x1 +x2 +:::xn
.
n

Exemplul 9.20 Densitatea de probabilitate a unei v.a. X are forma:



a + 2bx; x 2 [0; c]
f (x; a; b; c) =
0; n rest
Rezultatele unei selectii de volum n=3 dau pentru X valorile {x1 ; x2 ; x3 }={-1,0,1} . S
a se
estimeze papametrii a; b; c prin metoda momentelor.
1
R
Mai nti punem conditia ca
f (x; a; b; c) dx = 1, de unde g
asim relatia:
1

ac + bc2 = 1

(9.13)

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

130

Calcul
am acum media v.a. X:
M (X) =

Zc

x(a + 2bx)dx =

Zc

x2 (a + 2bx)dx =

ac2 2bc3
+
2
3

(9.14)

momentul de ordin 2:
M2 (X) =

ac3 2bc4
+
3
4

(9.15)


Momentele de selectie m1 =(-1+0+1)/3=0 si m2 = (-1)2 +02 +12 /3=2/3 vor estima pe
M (X) si pe M2 (X). Deci vom obtine sistemul nelinear de ecuatii:
8
2
< ac + bc = 1
2
2
ac
+ 2bc3 = 0
(9.16)
2
: ac3 2bc4
2
+ 4 =3
3

In general rezolvarea acestor sisteme (care se obtin folosind metoda momentelor) este
foarte complicat
a. Din ecuatia a doua g
asim c = 3a
. nlocuim expresia lui c n prima si n
4b
ultima ecuatie si g
asim:
2
3a2
+ 9a
=1
4b
16b
(9.17)
81a4
2
9a4
+
=
3
3
64b
512b
3
2

Din prima ecuatie a sistemului (9.17) g


asim b = 3a
. Inlocuim expresia lui b n ecuatia
16
2
a doua si g
asim c
a 2a = 8, lucru imposibil. Concluzia este c
a selectia {-1,0,1} nu poate
pentru variabila X. Sodajul respectiv este eronat sau X nu are densitatea de probabilitate
propus
a. De altfel, examinnd cu atentie rezultatele sondajului vedem c
a valoarea -1 n
principiu nu ar trebuit s
a se obtin
a deoarece X are densitatea pozitiv
a pe [0,c].

9.3

Exercitii

1. Pentru o selectie de volum n dintr-o distributie exponentiala( (t) = e t , daca t  0 si 0


n rest) cu parametrul , sa se gaseasca un estimator pentru  folosind metoda verosimilitatii
maxime. Presupunem ca  (t) este densitatea de probabilitate a duratei dintre doua sosiri
succesive la o staie de benzina. Se cronometreaza 11 sosiri si se gasesc urmatorii timpi ntre
ele 4, 3, 6, 1, 1, 4, 2, 6, 1, 3. Calculati prin metoda verosimilitatii maxime pe  .
2. Consideram o selectie de volum n dintr-o populatie cu distributia gama ( f (t) =
(t)r 1 e t  (r 11)! , daca t  0 si 0 n rest). Gasiti un estimator pentru  prin metoda
verosimilitatii maxime si un altul prin metoda momentelor.

LECTIA
9. STATISTICI. ESTIMAREA PARAMETRILOR

131

3. Viata unui bec electric, masurata n numarul de ore de functionare continua pna cnd
se arde, se presupune uniform distribuita cu parametrii a si b:

1=(b a) ; a  x  b
f (x) =
0 ; n rest.
Se face o selectie de n becuri si se noteaza cu x1 ; :::; xn timpii de functionare ai acestora
pna cnd se ard. Determinati estimatori pentru a si b prin metoda momentelor.
4. Functia de probabilitate a v.a. X este data de
 2b(c bx)
; dac
a0x
c2
f (x) =
0; n rest

c
b

c
c
: Stim ca media M(X)= 3b
si  2X = 18b
2.
i) daca c=3, este oare media de selectie M a unui esantion de volum n un estimator
nedeplasat pentru parametrul b?
ii) daca b=1/3, este M un estimator pentru c? (P( jM-cj < ) ! 1, cnd n ! 1). Indicatie: folositi inegalitatea lui Cebsev sau teoria din aceasta lectie.

5. Fie statistica g (X1 ; X2 ; :::; Xn ) = a1 X1 + a2 X2 +    + an Xn , cu a1 ; :::; an 2 R. Cum


trebuie sa e numerele a1 ; :::; an , astfel nct g sa e un estimator nedeplasat pentru media m
a populatiei? Indicatie: cereti M( g)=m.
6. Daca g (X1 ; X2 ; :::; Xn ) este un estimator nedeplasat pentru parametrul , este adevarat
ca si g 2 este un estimator nedeplasat pentru 2 ?
7. Greutatea unor utilaje produse de o rma este distribuita normal cu dispersia cunoscuta
dar cu media m necunoscuta. Fie statisticile
2
G= (X 1 +X 2 +X 3n+X 4 +:::+X n ) si H=(X1 +2X2 +3X3 +4X4 + ::: + nXn )  n(n+1)
, n 2 N.
a) Sa se arate ca G si H sunt estimatori nedeplasati pentru m.
b) Care estimator are dispersia mai mica?

 2X ,

Lectia 10
Intervale de ncredere
Denitia 10.1 Fie P o populatie,  un parametru al ei si g = g (X1 ; :::; Xn ), h = h (X1 ; :::; Xn )
doua statistici astfel nct g (X1 ; :::; Xn )  h (X1 ; :::; Xn ), adica oricare ar selectia fx1 ; :::; xn g
sa avem ca g (x1 ; :::; xn )  h (x1 ; :::; xn ). Spunem ca intervalul [g; h] este un interval de ncredere pentru parametrul  , de nivel de ncredere daca avem relatia:
P rob fg    hg 

(10.1)

Num
arul "=1 se mai numeste prag de ncredere. De obicei se
exprim
a n procente, de exemplu pentru =0,95 putem scrie =95%.
Cerinta (10.1) trebuie nteleas
a astfel: dac
a dup
a un num
ar mare de selectii fx1 ; :::; xn g, s
a
zicem N, K dintre ele dau intervale [g(x1 ; x2 ::xn ); h(x1 ; x2 ; :::xn )] cu proprietatea c
a  2 [g; h]
(pentru ecare selectie xat
a, intervalul devine interval obisnuit, numeric), atunci K/N .
Altfel spus, intervalele [g; h] acoper
a pe  n proportie de cel putin %(de exemplu ,dac
a
= 1=5 = 20=100, = 20%).
Denitia 10.2 Pentru un , un interval de ncredere [g ; h ] de lungime minima, astfel
nct Probfg    h g = , se zice interval de ncredere ecient, relativ la ncrederea .
Pentru calculele urm
atoare vom avea nevoie de teorema:
Teorema 10.3 Fie X o v.a. normala, de tip N (m; ). Fie X1 ; X2 ; :::Xn variabilele de
selectie asociate cu X. Atunci avem:


 = X1 +X2 +:::+Xn este de tipul N m; p .
a) Variabila X
n
n



X1 m 2
X2 m 2
Xn m 2
b) Variabila
+
+ ::: +
este de tip H (n) adica este o variabila



2 standard cu n gradede libertate.




c) Variabila


X1 X



X2 X



Xn X


este de tip H (n

 cu n-1 grade de libertate si este independenta fata de variabila X.
+

+ ::: +

132

1) adica este de tip

LECTIA
10. INTERVALE DE NCREDERE
d) Variabila
libertate.

(n

1) n q
(X1

133

 m
X
 )2 +(X2 X
 )2 +:::+(Xn X
 )2
X

este de tip Student cu n-1 grade de

Demonstratie. a) Aceast
a armatie este demonstrat
a n lectia 4, sectiunea Repartitia
normal
a.

b) Deoarece Xi m sunt normale de tip N (0; 1) si independente, armatia de la acest
punct rezult
a din lect
ia 4, sec
tia 2 .
 Distribu
t2iunea
2



 2
X1 X
X2 X
Xn X

+
+ ::: +
sunt independente nu se demonc) Faptul c
a X si





 + X
 m , de unde P (Xi m)2 =
streaz
a n acest curs. Acum scriem c
a Xi m = Xi X




P
P
 2+P X
 m 2 + 2(X

 . Dar P Xi X
 = 0, deoarece
Xi PX
m)
Xi X
= 1
X
Xi . Prin urmare
n
X  Xi m 2
X  Xi X
 m)2
 2 n(X
+
=
=


2
X  Xi X
 m 2
 2  X
p
+

= n

Membrul stng este de tip H (n), iar n membrul doi avem o sum
a de v.a. independente, dintre
care a doua este de tip H (1) ind p
atratul unei v.a. normale, de tip N (0; 1) (vezi lectia 4).
2
2
Prin urmare am g
asit (n) =? + (1) .Comparnd aceast
a relatie cu 2(p+q) = 2(p) + 2(q) , unde
P  Xi X 2
este
indicii de jos indic
a num
arul de grade de libertate (vezi lectia 4), g
asim c
a


de tip 2(n 1) .
d) Conform cu lectia 6, sectiunea Distributia Student, variabila aleatoare
 m
X
p
= n
r 
P
Xi


 2
X

n 1

1) n q

(n


X
X1


X

2

+ X2

m

 2 + ::: + Xn
X

ind de tipul p f g ; cu f de tipul N (0; 1) si g de tipul H (n


n 1

are o distributie Student cu n


QED.

10.1

1) = H (n


X

2

1; 1) , rezult
a c
a

1 grade de libertate.

Intervale de ncredere pentru medie

S
a consider
am o caracteristic
a numeric
a X care are o disributie normala de medie m si
2
dispersie  . Dac
a n urma unei selectii de volum n s-au obtinut rezultatele x1 ; x2 ; :::xn
pentru X; atunci, conform celor ar
atate n lectia trecut
a valoarea x1 +xn2 +::xn este o estimare
2

bun
a pentru m iar (x1 x) +(x2 nx) +:::(xn x) este o estimare bun
a pentru  2 . Ce ncredere putem
avea n aceste estim
ari? In continuare vom da un r
aspuns la aceast
a ntrebare?

LECTIA
10. INTERVALE DE NCREDERE

10.1.1

134

Dispersia este cunoscut


a

S
a consider
am cazul cnd dispersia  2 este cunoscut
a. Valorile x1 ; x2 ; :::xn sunt valorile variabilelor aleatoare de selectie, independente, X1 ; X2 ; :::Xn , care au aceeasi distributie normal
a
X1 +X2 +:::Xn
2

ca X. Deoarece variabila X =
este normal
a cu media m si dispersia n rezult
a c
a
n
 m
X
variabila Z = =pn este normal
a cu media 0 si dispersia 1. Ca urmare:
P ( a  Z  a) =  (a)
Dac
a nlocuim pe Z cu


X1 +X2 +:::Xn
n p

= n

 ( a) = 2 (a)

g
asim:



X1 + X2 + ::: + Xn

P
ap  m 
+ ap
= 2 (a)
n
n
n
h
i
x1 +x2 +:::xn
 x1 +x2 +:::xn

p
p
Prin urmare intervalul intervalul
a n;
+ a n este un interval de nn
n
credere pentru m cu nivelul de ncredere 2 (a). Introducnd pragul de ncredere ", avem
1 " = 2 (a) sau  (a) = 1 2 " . Am demonstrat deci:
X1 + X2 + ::: + Xn
n

Propozitia 10.4 Fie X o variabila normala de dispersie cunoscuta  2 si de medie m necunoscuta. Dac
h a " 2 (0; 1) si a i2 R + , atunci, la selectii de volum n, o conditie sucienta
ca intervalul X a pn ; X + a pn sa e interval de ncredere de nivel 1 " pentru media m,
este ca a sa verice ecuatia  (a)  21 (1

").

QED.
Observatia 10.5 La acelasi prag de ncredere ", cresterea volumului n de selectie conduce la
un interval de ncredere mai scurt.
Exemplul 10.6 Fie P o populatie normala de varianta (dispersie) cunoscuta  2 si de medie
m necunoscuta (de estimat). Consideram selectii de volum xat n. Vom gasi un interval de
95
ncredere,de nivel de ncredere 95% pentru medie, daca alegem astfel pe a nct  (a)  12 100
.
Din tabelul pentru  gasim a  1; 96. Deci un interval de ncredere de nivel 95% va de
forma:




X 1; 96 p ; X + 1; 96 p :
n
n
Exemplul 10.7 O rma produce piese cilindrice de diametru  =10 mm. Abaterile de la
acest diametru impus respecta o lege normala de variatie (dispersie) egala cu 0,04 mm (practica a aratat acest lucru). Se face un sondaj pe 100 de piese si se gaseste ca media de selectie
(empirica) este de 10,01 mm. Sa se gaseasca un interval de estimatie pentru media reala cu
nivelul de ncredere de 90%.

LECTIA
10. INTERVALE DE NCREDERE

135

Solutie Aici n=100, =0,2, X (100) =0,01, (1-")=0,90, deci " =0,10. Din tabelul functiei
90
 g
asim  (a)
45 pentru  1; 65. Deci,
un interval de estimatie pentru media
  2100 = 0; 0;2

0;2
real
a este: 10; 01 1; 65  10 ; 10; 01 + 1; 65  10 = [9; 977; 10; 043].
Ce informatie obtine de aici produc
atorul? El este sigur n proportie de 90% c
a abaterea
medie de la diametru real  =10 mm este de cel mult 0,043 mm.

10.1.2

Dispersia este necunoscut


a

Am v
azut pn
a acum c
a dac
a dispersia unei populatii normale este cunoscut
a putem estima
 m
p ,
prin intervale de ncredere media populatiei cu ajutorul v.a. normale standard Z = X
= n
unde X este media de selectie, iar m este media real
a a populatiei.
Dac
a media m nu este cunoscut
a atunci putem folosi punctul d) al teoremei precedente
care spune c
a variabila

T =

(n

1) n q

X


X
X1


X

2

+ X2

m

 2 + ::: + Xn
X


X

2

are o distributie Student cu n-1 grade de libertate. Aici utilizat notatia (vezi lectia 9) S 2 =
2
2
2
(X1 X ) +(X2 X ) +:::+(Xn X )
. Asa cum se vede n lectia 4, densitatea de probabilitate este
n
simetric
a fata de x=0, deci pentru functia de repartitie F (t) avem relatia F ( t) = 1 F (t).
Aceast
a observatie ne ajut
a s
a folosim tabelul II pentru g
asirea cuantilelor corespunz
atoare
acestei distributii. Pe coloana din stnga a tabelului avem gradele de libertate  = n 1 (n
volumul selectiei), pe prima linie orizontal
a avem valorile functiei F(t) de la 0,60 pn
a la 0,999.
Fie de aat la  = n 1 = 4 valoarea lui a astfel ca F(a)=0,40. Avem 1-F(a)=F( a)=0,60
si pentru 0,60 avem cuantila n tabel: a=0,271. Deci a = 0; 271.
S
a punem aceste rezultate n urm
atoarea propozitie:
Propozitia 10.8 Fie P o populatie normala cu media m si dispersia  2 necunoscute. Pentru
orice n, pentru un prag " 2 (0; 1) si a 2 R + , o conditie sucienta ca intervalul


S
S
X ap
; X + ap
n 1
n 1
sa e interval de ncredere de nivel 1 " (sau de prag ") pentru media m, este ca a sa e
cuantila de ordin 1 "=2 a distributiei Student cu n 1 grade de libertate (adica F (a) =
1 "=2).

LECTIA
10. INTERVALE DE NCREDERE


Demonstratie. Relatia P X
P

a pnS 1

p
a n

136

mX+


X

a pnS 1


a
= 1

S
sau P ( a  T  a) = 1

=1

" se mai poate scrie

";
"

Dar
P ( a  T  a) = F (a) F ( a) =
F (a) 1 + F (a) = 2F (a) 1 = 2 (1

"=2)

1=1

"

QED.
Exemplul 10.9 Presupunem ca n exemplul precedent nu cunoastem dispersia 0,04 mm si
2
2
2
(X1 X ) +(X2 X ) +:::+(Xn X )
ca o estimam cu formula S 2 =
gasind-o ca ind egala cu 0,09
n
mm. Avem 1 ("=2) = 0; 95, n = 100, S = 0; 3 (n cazul nostru). Cuantila corespunzatoare
lui 0,95 o gasim din tabelul cu distributia Student. La  = n 1 = 99 nu gasim date dar
putem folosi linia lui  = 120, deoarece cuantilele vecine difera putin unele de altele (pentru
acelasi
prag binenteles). Aici gasim
h
i a=1,1658. Cu acest a gasit, intervalul de ncredere va :
0,3
0,3
10,01-1,658 p99 ; 10,01+1,658 p99 , adica [9,9798,10,0599]. Sa observam ca a=1,65 pentru
situatia cnd am folosit v.a. Z si a=1,658 pentru situatia cnd am folosit v.a. T. Acest lucru
se explica, deoarece pentru n mare (mai mare ca 40), n cazul nostru 100, cele doua cuantile
difera foarte putin.

10.2

Intervale de ncredere pentru dispersie

Dac
a media m a variabilei aleatoare X este cunoscut
a, atunci putem folosi punctul b) al

2
2
X1 m 2
teoremei precedente care spune c
a variabila
+ X2 m + ::: + Xn m este de tip

H (n) iar dac
a media m nu este cunoscut
a putem folosi punctul c) al teoremei, anume c
a






 2
 2
 2
X1 X
X2 X
Xn X
variabila aleatoare
+
+ ::: +
este de tip H (n 1), n scopul de a



determina intervale de ncredere pentru dispersie.
nS 2
= 2(n
2

(10.2)

1)

adic
a nS
este v.a 2 cu n 1 grade de libertate. Dac
a n loc de S 2 se foloseste estimatorul
2
02
nedeplasat S se obtine formula
(n

1)S 0 2
= 2(n
2


1)

(10.3)

LECTIA
10. INTERVALE DE NCREDERE

137

Teorema 10.10 Fie " 2 (0; 1). Un interval de ncredere de nivel 100(1 ") procente pentru
dispersia  2 a unei populatii normale cu media cunoscuta m, n cazul selectiilor de volum n
, este


(n

1)S 0 2 (n
;
b

1)S 0 2
a

(10.4)

unde a este cuantila de ordin "=2 si b este cuantila de ordin 1 ("=2) a distributiei 2 cu n 1
grade de libertate.
Demonstratie Not
am cu F (t) functia de repartitie a v.a. 2(n 1) . Avem F (a) = "=2 si


0 2
F (b) = 1 ("=2). Atunci P a  (n 1)S

b
= F (b) F (a) = 1 ("=2) ("=2) = 1 ".
2
0 2

0 2

Dar, din a  (n 1)S


 2 
 b g
asim c
a (n 1)S
2
b
(10.4) acoper
a pe  2 cu probabilitatea 1 ".
QED.

(n 1)S 0
a

. Prin urmare, intervalul din

Exemplul 10.11 Media erorilor de masurare a lungimilor unor baghete metalice este de 3
mm. Presupunem ca aceste erori respecta legea normala cu media 3 mm si dispersia necunoscuta. Se face o selectie de volum 4: {-1, 4, 4, 1}. Se cere un interval de estimatie pentru  2
cu pragul de ncredere de 90%.
Solutie n cazul nostru aplic
am Teorema 10.9 cu 1-" =0,90, deci " =0,10. C
aut
am cuantilele pentru "=2 =0,05 si 1-("=2)=0,95, cnd n-1=3 (grade de libertate). G
asim a=0,351846 si
1
02
2
2
b=7,81473 n Tabelul III.
aim acum S = 3 (( 1 3) + (4 3) + (4 3)2 + (1 3)2 ) =
h Calcul
22
.
3

Intervalul va deci

22
; 22
7,81 0,35

= [2,81;62,85]. Se observ
a c
a intervalul este destul de mare,

deci precizia pentru  2 este mic


a, chiar dac
a apare cu probabilitate mare!

10.3

Intervale de ncredere pentru ctul a dou


a dispersii

Fie acum dou


a populatii distincte, normal distribuite. Facem o selectie de volum n1 din prima
populatie si o selectie de volum n2 din a doua populatie. Stim din formula (10.3) c
a
(n1

1)S10 2
 21

(n2

1)S20 2
 22

= 2(n1

1)

= 2(n2

1)

(10.5)

a
unde  1 ; S10 2 si  2 ; S20 2 sunt dispersiile si dispersiile de selectie modicate pentru cele dou
populatii. Not
am cu  1 = n1 1 si cu  2 = n2 1. Not
am cu F (de la Fischer) v.a.

LECTIA
10. INTERVALE DE NCREDERE

S10 2 = 21
S20 2 = 22

=h

138

2( 1 ) = 1
2( 2 ) = 2

(10.6)

Aceast
a v.a. are o densitate de probabilitate ce depinde de doi parametri  1 si  2 iar formula
ei este complicat
a din punct de vedere matematic (vezi lectia 4). Ea apare ca un ct de v.a.
2 , nmultit cu un num
ar care depinde de  1 si  2 , adic
a  2 = 1 . Vom mai nota o asemenea
variabil
a F 1 ; 2 pentru a pune n evidenta cei doi parametri de care depinde. Tabelul IV ne
furnizeaz
a fractilele acestei distributii numai pentru ordinele 0,95; 0,975 si 0,99. Pe coloane
apar valorile parametrului  1 si pe linii apar valorile parametrului  2 . De exemplu, pentru
n1 = 10; n2 = 6;  1 = 9;  2 = 5; presupunem c
a dup
a selectie am obtinut F =7. Ne uit
am la
cuantila de ordin 0,95 si g
asim valoarea 3,48. Valoarea selectiei, 7, este mai mare dect 3,48,
deci cade n partea opus
a, adic
a n partea cu probabilitatea 5%. Prin urmare inferenta
S10 2
noastr
a asupra ctului S 0 2 nu este adev
arat
a cu 95% probabilitate. n practic
a este util
a
2
relatia:



1
P F( 1 ; 2 )  c = P F( 2 ; 1 ) 
(10.7)
c
Aici F( 2 ; 1 ) se numeste inversa v.a. F( 1 ; 2 ) .
Din aceste observatii rezult
a imediat:

Teorema 10.12 Avem relatia


 02



aS2
 22
bS20 2
S10 2 = 21
P
 2  02
= P a 02 2 b =
S10 2
1
S1
S2 = 2
F 1 ; 2 (b) F 1 ; 2 (a) = 1 "
daca a si b sunt alese astfel ca F 1 ; 2 (b) = 1

si F (a) =h 2" . In aceste


i conditii un interval
 21
aS20 2 bS20 2
de ncredere pentru 2 , cu nivelul de ncredere (1 ") este S 0 2 ; S 0 2 .
2

"
2

QED.

10.4

Intervale de ncredere n cazul unor selectii mari

R1
Dac
a f (x; ) este densitatea de probabilitate a variabilei aleatoare X atunci din 1 f (x; )dx =
R
R1
1 rezult
a prin derivare n raport cu  c
a 1 @f
(x; ) d = 0 sau @ ln(f@(x;)) f (x; )dx = 0.
@
R 1  @ ln(f (x;)) 2
@ ln(f (x;))
Deci variabila aleatoare
f (x; )dx. Preare media 0 si dispersia 1
@
@
supunnd c
a dispersia este nit
a , rezult
a din legea limit
a central
a (vezi lectia 5) c
a pentru n

LECTIA
10. INTERVALE DE NCREDERE

139

mare, variabila aleatoare


@ ln(f (X1 ;))
@

(X1 ;))
+ ::: + @ ln(f@
r
2
R1 
n 1 @ ln(f@(x;)) f (x; )dx

@ ln(f (X1 ;))


@

unde X1 , X2 ,... Xn sunt variabilele de selectie asociate cu X, are o distributie aproximativ


normal
a cu media 0 si dispersia 1. Avem deci:
0
1
Z b
@ ln(f (X1 ;))
(X1 ;))
(X1 ;))
B
C
+ @ ln(f@
+ ::: + @ ln(f@
x2
1
@
B
C
2 dx
r
p
(10.8)
Pr ob @a <
<
b
t
e
A
R 1  @ ln(f (x;)) 2
2
a
f (x; )dx
n 1
@
Un interval de ncredere pentru ;cu nivelul de ncredere , se poate obtine pentru n mare
astfel:
- Se determin
a prin n experiente independente valorile x1 ,.. xn pentru X1 ,.. Xn .
Rb
x2
- Se determin
a a si b astfel ca a p12 e 2 dx = .
- Din formula 10.8 rezult
a c
a multimea valorilor  care veric
a inegalitatea
a<

@ ln(f (X1 ;))


@

(X1 ;))
(X1 ;))
+ @ ln(f@
+ ::: + @ ln(f@
r
<b
R 1  @ ln(f (x;)) 2
n
f (x; )dx
@
1

este o multime de ncredere pentru  cu ncrederea . In unele cazuri aceast


a multime este
un interval.

10.5

Rezumat

1: Fie " > 0; " 2 (0; 1). Vom numi interval de ncredere de prag " (sau de nivel de ncredere
1 ") pentru parametrul  dou
a statistici 1 = f1 (X1 ; :::; Xn ) si 2 = f2 (X1 ; :::; Xn ) astfel
nct P (1    2 )  1 ".
b1si a statisticii 2
Pentru selectii efectivehx1 ; :::;ixn ; vom nota valoarea statisticii 1 cu 
b2 . Intervalul numeric 
b1 ; 
b2 este considerat nc
cu 
a ca interval de ncredere de nivel 1 "
(se mai spune de prag ") pentru parametrul estimat .
2: Dac
a exist
a dou
a statistici Y = f (X1 ; :::; Xn ) si Z = g (X1 ; :::; Xn ) astfel nct v.a.
Y 
T = Z s
a e normal
a redus
a sau Student cu d grade de libertate si t" un num
ar pozitiv
astfel nct P(jTj > t" )  ", atunci [Y t" jZj ; Y + t" jZj] este un interval de ncredere de prag
" pentru media , adic
a:
P (Y

t" jZj    Y + t" jZj)  1

"

LECTIA
10. INTERVALE DE NCREDERE

140

 Fie acum de estimat  2 a v.a. X. Presupunem c


a am g
asit o statistic
a Y a.. T= Y2 are
distributia 2 cu d grade de libertate
a numere t0" si t00" astfel nct P(T  t0" ) 
i si e dou
h
"
si P(T  t00" )  2" . Atunci tY0 ; tY00 este un interval de ncredere pentru  2 de prag ":
2
"
"


Y
Y
2
P t0    t00  1 ".
"
"
Se alege Y a.. s
a aib
a ct mai multe grade de libertate.
FORMULE UTILIZATE FRECVENT
In formulele de mai jos nivelul de ncredere este 1 ", iar rezultatele a n
m
asur
atori independente ale unei caracteristici numerice cu distributie normal
a
sunt x1 ; x2 ; :::xn .
1. Un interval de ncredere pentru media m a unei variabile aleatoare normale,
dac
a se cunoaste dispersia  2 este:


x1 + x2 + :::xn
 x1 + x2 + :::xn

ap ;
+ ap
n
n
n
n
unde a se alege astfel ca  (a) = 0; 5 2" .
2. Un interval de ncredere pentru media m a unei v.a. normale, dac
a nu se
cunoaste dispersia, este:


s
s


m
ap
; m + ap
n 1
n 1
q
(x1 m )2 +(x2 m )2 +:::(xn m )2
x1 +x2 +:::xn


unde m =
,
s
=
, iar a se alege astfel ca F (a) =
n
n
1 2" , F ind functia de repartitie a unei variabile Student cu n 1 grade de
libertate.
3. Un interval de ncredere pentru dispersia  2 a unei v.a. normale este:
"
#
(x1 m )2 + ::: + (xn m )2 (x1 m )2 + ::: + (xn m )2
;
b
a
unde F (a) = 2" ; iar F (b) = 1 2" , F ind functia de repartitie a unei variabile 2 cu
n 1 grade de libertate.
2
4. Un interval de ncredere pentru ctul dispersiilor 22 a dou
a v.a. indepen1
dente este:
2 Pn2
3
Pn2
0 2
0 2
x +x +:::xn1

unde m = 1 2n1
 1 = n1 1,  2 = n2

4a 

i=1 (yi
n2
Pn1
i=1 (xi

n1

m )
1
m )2
1

y +y +:::y

;b 

i=1 (yi
n2
Pn1
i=1 (xi

n1

m )
1
m )2
1

, m0 = 1 2n2 n2 , n1si n2 sunt volumele celor dou


a selectii,
"
"
1, iar a si b sunt alese astfel ca 1 2 = F 1 ; 2 (b) , 2 = F 1 ; 2 (a)

LECTIA
10. INTERVALE DE NCREDERE

10.6

141

Exercitii rezolvate

1. Atunci cnd se nasc 2 copii simultan (gemeni) probabiliatea ca ei sa e gemeni adevarati


este . Se presupune ca:
a) 2 gemeni adevarati au ntotdeauna acelasi sex si probabilitatea ca ei sa e baieti este 12 ;
b) 2 gemeni falsi au sexe diferite si probabilitatea ca unul dintre ei sa baiat este 21 ;
i)n cursul nasterii a 2 gemeni se considera evenimentele: A= (2 baieti); B= (2 fete);
C= (1 baiat si 1 fata). Calculati n functie de  probabilitatile p(A), p(B), p(C).
ii) n cursul a 1000 de nasteri se realizeaza evenimentul C de 328 de ori. Dati pentru 
un interval de ncredere de prag "=0,05.
iii) Observam acum n nasteri de gemeni si notam cu Y C numarul de realizari ale evenimentului C. Ce lege guverneaza v.a. Y C ? Deniti cu ajutorul lui Y C un esantion nedeplasat
Z pentru . Calculati varianta lui Z. Dati pentru n mare o conditie independenta de  si
sucienta pentru a putea deni cu ajutorul lui Z un interval de ncredere de prag "=0,05 a
1
carui lungime sa e mai mica dect un a 2 R , dat. Caz particular a = 100
.
Solutie i) Not
am cu V evenimentul: << gemeni adev
arati >> si cu F: << gemeni falsi
>>. Atunci A=(A\V)[(A\F) si p(A)=p(V)pV (A)+p(F)pF (A)=  12 + (1 ) 14 = +1
. La
4
1 
fel p(B)= +1

s
i
p(C)=
.
4
2
ii) Fie X v.a. care are valoarea 1, dac
a se realizeaz
a evenimentul C, si 0 altfel. Este
328
clar c
a M(X)== 1 2  . X = n1 YC = 1000
= 0; 328. Cum X=Xi , avem c
a X2i =Xi , deci

P
S2 = n1 X2i (X)2 = X 1 X . Cum T= XpM(X)
este practic normal
a redus
a, egalitatea
2
i

S =n

P(jTj  1; 96) = 0; 05 d
a pentru  intervalul de ncredere cerut: X 1; 96 pSn    X+1; 96 pSn ,
sau 0; 299  1 2   0; 357. De aici rezult
a intervalul de ncredere c
autat pentru : 0; 286 
  0; 402:
2
iii) YC este binomial
a cu p= 1 2  . Avem deci M(YC )= n(12 ) si D(YC )= n(1 4  ) . Egalitatea
2
 = 1 n2 M(YC ) d
a pentru  estimatorul nedeplasat Z=1- n2 YC de dispersie n42 D(YC )= 1 n .
Cnd n ! 1, YC este practic gaussian
a (normal
a), deci si Z este la fel. Consider
am
Z

deci T= q
care este gaussian
a redus
a. Egalitatea P(jTj  1; 96) = 0; 05 ne per(1 2 )=n
q
q

p
 

1 2 =n  1=n avem
mite s
a scriem P jZ j  1; 96 1 2 =n = 0; 05, si cum
p
p
p . Lungimea lui va mai mic
P(jZ j  1; 96= n) < 0; 05, de unde Z- 1;96
  Z+ 1;96
a
n
n

2
21;96
3;92
1
dect a atunci cnd a  pn , sau n  a . Pentru a = 100
g
asim n  153664.

2. Se masoara forta de compresiune X (n Kg/cm 3 ) a cimentului din care sunt confectionati cilindri mici, limita de la care ei se sparg. Pentru n=10 cilindri se observa urmatoarele
presiuni:
19,6 19,9 20,4 19,8 20,5
21,0 18,5 19,7 18,4 19,4

LECTIA
10. INTERVALE DE NCREDERE

142

Presupunem ca X are o lege gaussiana (normala).


i) Dati un interval de ncredere de prag " = 0; 1 pentru M(X).
ii) Dati o estimare nedeplasata 
b2 pentru varianta  2 a v.a. X, gasiti apoi un interval de
ncredere de prag 0,1 pentru  2 .
iii) Presupunem ca  2 =0,69. Gasiti pentru M(X) un nou interval de ncredere de prag
0,1. Comparati cu rezultatul de la 1).
Solutie i) Calcul
am X = 19; 72 si nS2 = 6; 0960. T= pX 2 M(X) este o v.a. Student cu
S =(n 1)

n 1 = 9 grade de libertate, avem P(jTj > t" ) = 0; 1 pentru t" = 1; 833. Intervalul de
ncredere cerut este deci X t" pnS 1 M(X) X + t" pnS 1 , sau 19; 243 M(X) 20; 197.
2

ii) O estimatie nedeplasat


a a lui  2 este 
b2 = nnS 1 = 0; 6773. Pe de alt
a parte stim c
a U= nS
2
2
0
are distributia  (Pearson) cu n 1 = 9 grade de libertate. Avem deci P(U > t" ) = 0; 05
2
2
asim pentru  2 intervalul de ncredere: nS
pentru t00" = 3; 33. De aici g
  2  nS
, adic
a
t0"
t00
"
2
0; 36    1; 83.


2
2
iii) Dac
a stim dispersia  = 0; 69 putem folosi faptul c
a X este gaussian
a N ; n si deci
T0 = Xp M(X)
este gaussian
a redus
a. Egalitatea P(jT0 j > t0" ) = 0; 1 ne conduce la t0" = 1; 6449.
 2 =n
p
1
Prin urmare, g
asim un interval de ncredere de prag 10
pentru M(X): X t0"  2 =n M(X)
p
X + t0"  2 =n, sau 19; 287 M(X) 20; 153. Acest interval este mai mic dect acela g
asit la
1) deoarece acum avem dispersia dat
a.

10.7

Exercitii

1. Notam cu X vrsta n ani la care un om devine bunic. Presupunem ca X are distributia


normala cu varianta 225. 9 persoane luate la nmplare au declarat ca au devenit bunici la:
42, 56, 68, 56, 48, 36, 45, 71 si 64 ani.
a) Calculati media si dispersia de selectie.
b) Gasiti un interval de ncredere de 80% pentru medie.
c) Gasiti un interval de ncredere de 95% pentru medie.
2. n cadrul unui proces de estimare a mediei unei populatii oarecare, un statistician vrea
ca probabilitatea ca media de selectie sa difere de media adevarata cu mai putin de 0,2  sa
e mai mare de 0,95.
a) Ce volum de selectie trebuie sa foloseasca?
b) Dar daca volumul de selectie este 100, care este marja de aproximare (n  unitati) a
mediei reale cu media de selectie, pentru ca sa se obtina un prag de ncredere de 0,95?
c) Dar daca se stie ca populatia este normala care trebuie sa e volumul de selectie ca



 m  0; 2    0; 95
Pr ob X

LECTIA
10. INTERVALE DE NCREDERE

143

?
3. Fie distributia student T cu 12 grade de libertate.
a) gasiti fractile pentru 0,10; 0,60 si 0,95.
b) gasiti media si dispersia.
c) P(T <-0,695).
d)P(-2,179 <T <1,356).
4. Fie distributia T cu 6 grade de libertate.
a) gasiti P(T  1).
b) gasiti fractila pentru 0,20.
5. Fie P o populatie distribuita normal. Se face selectia: -2, -1, 0, 0, 1, 2, 2, 3, 0. Sa
se gaseasca un interval de ncredere pentru media populatiei cu pragul de ncredere de 80%,
folosind distributia T.
6. Dintr-un lot de 100 piese, 4 sunt gasite defecte. Presupunem ca procesul de productie
se comporta ca un proce de tip Bernoulli. Determinati intervale de ncredere de 95% si de
99% pentru probabilitatea ca lund o piesa la ntmplare ea sa e defecta.
7. Se urmareste indicatorul Dow-Jones (indicator la bursa americana) la stocurile industriale de la o zi la alta. Se presupune ca acesta variaza dupa o distributie normala. Se face
un sondaj pe parcursul a 81 de zile si se obtine o medie de selectie de 0,20 si o dispersie de
selectie de 1,50. Gasiti un interval de ncredere pentru medie de 90%.
8. Dintr-o populatie noramla ( m=24,  2 =9)
de volum 8. Notam cu W
 se ia un esantion


2
suma patratelor celor 8 valori standardizate Zi2 = Xi m
. Gasiti: a) P(W 20,09); b)
P(2,73 <W <5,07); c) P(W >2,18).
11. Pentru distributia F cu 5 grade de libertate la numarator si cu 8 grade de libertate la
numitor, gasiti : a) fractilele de ordin 0,025 si 0,99; b) P( F 3,69); c) P( F 1,22).
12. Durata de viata a unui bec electric este o variabila aleatoare normala. Testul pe 16
becuri a aratat o valoare medie de viata de 3000 ore si o abatere standard   = 20. Sa se
determine intervale de ncredere pentru medie si abatere standard cu pragul de risc " = 0; 1.
13. Un producator de rulmenti pretinde ca diametrul mediu al rulmentilor, n mm este de
10 mm cu o dispersie de 10 4 . Admitem ca diametrul este o v.a. normala. Pe un lot de 20
rulmenti masurati s-a gasit ca diametrul mediu 9; 98 mm si o dispersie empirica 0; 0002. Sa
se determine intervale de ncredere pentru diametrul mediu si dispersie cu ncrederea 0; 99.
Valorile pretinse de fabricant se aa n aceste intervale?

Lectia 11
Ipoteze statistice. Teste statistice
11.1

Ipoteze si testarea lor

n continuare vom face ipoteze asupra parametrilor unor populatii, stiind n prealabil clasa
de distributii din care fac parte (de exemplu: normal
a, Bernoulli, Poisson, etc.). Vom folosi
rezultatele obtinute n Lectia 10 asupra estim
arii prin intervale de ncredere a unor parametri
remarcabili pentru distributii cunoscute (media si dispersia pentru populatii normale, de
exemplu).
O ipotez
a statistic
a este o ipotez
a f
acut
a asupra unor nsusiri statistice ale unei populatii
P.Ea este simpla, dac
a se refer
a la ntreaga informatie care determin
a distributia populatiei,
de exemplu ipoteza:
H: populatia este normal
a de medie m=10 si dispersie  2 =225, sau
H: populatia este Bernoulli cu p=0,3.
Ipoteza poate compusa dac
a se refer
a numai la o parte din informatiiile ce ar putea
determina distributia populatiei. Iat
a un exemplu de distributie compus
a:
H: populatia este normal
a de medie 40, sau
H: populatia este Poisson (nu facem nici o ipotez
a asupra mediei ).
In cazul ipotezelor compuse, ceilalti parametrii care impreuna cu cei testati ar duce la
determinarea completa a distributiei, se estimeaza dintr-o selectie (sau mai multe) facuta
asupra populatiei.
O ipotez
a poate exacta,de exemplu ipoteza H: media populatiei Poisson este =3, sau
poate inexacta : H: media populatiei normale este m  5.
n aparent
a noi lucrm cu o singur
a ipotez
a H. De fapt lucr
am cu dou
a ipoteze: H=H0 si
H1 , ipoteza contrar
a ipotezei H0 . n cele ce urmeaz
a vom considera dou
a ipoteze alternative
H0 si H1 . Nu intotdeauna ipoteza H1 reprezinta negatia logica obisnuita a ipotezei H0 . De
exemplu, H0 : media populatiei este m=30, H1 : media populatiei s-a micsorat, adica este
m<30.
Operatia de comparare a dou
a ipoteze statistice n lumina informatiilor furnizate de selectie
144

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

145

se numeste test statistic. Dac


a testul statistic se refer
a la unul sau mai multi parametri ce apar
n legea ce deneste populatia spunem c
a testul este parametric. Dintre cele dou
a ipoteze H0
si H1 , una dintre ele, notat
a cu H0 , ocup
a locul central: test
am pe H0 mpotriva alternativei
H1 . La nalul test
arii statisticianul, e accept
a pe H0 , e c
a respinge pe H0 n favoarea ipotezei
H1 . Oricum el trebuie s
a ia o decizie. Fiecare test statistic implic
a o statistic
a de selectie,
adic
a o functie continu
a de tipul g (X1 ; :::; Xn ), unde n este volumul selectiei, iar X1 ; :::; Xn
sunt variabilele de selectie. Anumite valori ale statisticii conduc la acceptarea ipotezei H0 ,
alte valori ale ei conduc la respingerea acestei ipoteze. Vom vorbi deci de un domeniu de
respingere (de neacceptare). Regula de decizie este dat
a de fapt de specicarea domeniului
de respingere al ipotezei H0 , deoarece se consider
a c
a domeniul complementar domeniului de
respingere este exact domeniul de acceptare pentru ipoteza H0 .
Mai exact, daca ipoteza H0 , numita si ipoteza nula, este adevarata atunci, in urma unei
selectii concrete, este foarte probabil ca valoarea calculata pentru v.a. g (X1 ; :::; Xn ) sa se
gaseasca intr-un interval de probabilitate mare. Acest lucru se intampla deoarece statistica
g (X1 ; :::; Xn ) are o repartitie bine determinata de ipoteza H0 si eventual de unele estimari
facute in urma selectiei concrete ce apare in problema. Deci noi trebuie sa stabilim o zona de
acceptare, adica o submultime A din R a.i. probabilitatea ca o valoare a v.a. g (X1 ; :::; Xn ) sa
apartina multimii A sa e destul de mare (de obicei se ia ca ind  0; 9). Multimea RnA
se zice zona de respingere si probabilitatea ca v.a. g (X1 ; :::; Xn ) sa ia o valoare in RnA
este foarte mica ( 0; 1). Numarul " = prob (g (X1 ; :::; Xn ) 2 RnA) se numeste prag de
semnicatie pentru testul pe care il vom constitui, iar statistica g (X1 ; :::; Xn ) este o v.a. care
depinde de v.a. de selectie X1 ; :::; Xn si este legata de ipoteza H0 . De exemplu, daca H0 se
pm ,
refera la media populatiei, g (X1 ; :::; Xn ) va media de selectie standardizata, adica Z = X
= n
unde m este media ce rezulta din ipoteza H0 ,  este deviatia standard (presupusa cunoscuta),
n este volumul selectiei, iar X = (X1 + X2 +    + Xn ) =n, este v.a. media de selectie. Ipoteza
alternativa, H1 este ipoteza ce rezulta natural in urma negarii ipotezei H 0 . De exemplu, daca
H0 este "m = 30" si noi stim sigur ca media nu poate sa creasca in urma experimentului
ce apare in problema, atunci H1 va "m < 30". Daca nu stim nimic despre modul in care
se schimba media, este natural sa consideram ipoteza alternativa ca ind "m 6= 30", adica
"m < 30" sau "m > 30". Iata deci cum functioneaza in general un test parametric referitor
la parametrul  al unei populatii P:
1) construim ipotezele H0 (ipoteza nula) si H1 (ipoteza alternativa) asupra parametrului
.
2) construim v.a. g (X1 ; :::; Xn ) care are o distributie (repartitie) cunoscuta daca consideram pe H0 adevarata.
3) precizam pragul de semnicatie " pentru v.a. g (X1 ; :::; Xn ) (" este mic,  0; 1).
4) reprezentam grac (schematic si nu exact) zonele de respingere si respectiv de acceptare,
(g) =densitatea de probabilitate a v.a. g.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

146

Zona tipica de respingere a unui test


Aria hasurata este "=2 + "=2 = " = prob(g sa ia valori in zona de respingere).
5) calculam gcalc: = g (x1 ; :::; xn ) pentru valorile efective ale unei selectii furnizate de problema. Daca gcalc 2 fzonei de acceptareg vom spune ca acceptam ipoteza H0 cu pragul de
semnicatie ". Daca gcalc 2 fzonei de respingereg acceptam ipoteza alternativa H1 cu pragul
de semnicatie ":

11.1.1

Testul Z privind media unei populatii normale cu dispersia


cunoscuta  2

Vrem sa testam ipoteza:


 H0 : m = m0 , m0 specicat (m este media populatiei)
H1 : m 6= m0
 Consideram statistica Z = X=pmn0 . Stim ca Z este o v.a. normala redusa (are media 0 si
dispersia 1), pentru n mare. Aici  este precizat de problema.
 Fie " 2 (0; 0; 1] pragul de semnicatie ales (" = 0; 05; 0; 01; etc.)


LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

147

Zona de respingere pentru un test bilateral

I)

Calculam pe Z"=2 ca ind cuantila de ordin "=2, adica F (Z"=2 ) = 1

"=2 (vezi TABELUL

 calculam Zcalc = X=pmn0 pentru selectia din problema.


Daca jZcalc j  Z =2 , acceptam ipoteza H0 cu pragul de semnicatie ".
Daca jZcalc j > Z =2 , respingem ipoteza H0 (acceptam H1 ) cu pragul de semnicatie ".
Exemplul 11.1 Testati cu un prag (nivel) de semnicatie de 5% daca o selectie de volum 1,
x1 = 172 provine dintr-o populatie normala cu media m = 150 si dispersia xata (cunoscuta)
 2 = 100.
pm = X m , deoarece n = 1 si X = X1 = X.
Solutie H0 : m = 150; H1 : m 6= 150; Z = X

= n
F (Z0;025 ) = 1 0; 025 = 0; 975:

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

148

Deci, din TABELUL I gasim ca Z0;025 (cuantila de ordin 0,025) este 1,96.
Zcalc = 17210150 = 2; 2. Deoarece jZcalc j > 1; 96 respingem H0 (acceptam H1 ) cu pragul de
semnicatie de 5%. Adica este putin probabil ca selectia sa provina dintr-o populatie normala
cu media m = 150 si dispersia  2 = 100.
Aici am folosit un test bilateral (zona de respingere este simetrica fata de origine, adica
are 2 cozi) deoarece pentru H1 ; m poate tot asa de bine < 150 sau > 150.
Exemplul 11.2 Testati cu un prag de semnicatie " = 1% daca selectia de volum 1, x1 = 54,
a fost facuta dintr-o populatie normala cu media m = 65 si dispersia  2 = 30, sau daca media
este mai mica decat 65.
Solutie H0 : m = 65; H1 : m < 65. Vom avea deci un test unilateral (la stanga, cu o
pm = X m .
singura coada).Z = X

= n

Zona de respingere pentru un test unilateral


Deoarece in tabelele statistice se dau numai valorile functiei de repartitie normala, F(z),
pentru z  0, va trebui sa folosim proprietatile de simetrie ale densitatii de probabilitate (z).
Avem ca P(Z < Z0;01 ) =F(Z0;01 ) = 0; 01. Deci F( Z0;01 ) =P(Z < Z0;01 ) = 1 P(Z < Z0;01 ) =
1 0; 01 = 0; 99, deci, din TABELUL I gasim ca Z0;01 = 2; 33, adica Z0;01 = 2; 33.
Calculam Zcalc = 54p3065 = 2; 01. Cum 2; 01 > 2; 33 vom accepta ipoteza H0 cu pragul
de semnicatie de 1%. Cum pragul este mic si Zcalc este foarte aproape de valoarea critica
2; 33 statisticianul are dubii serioase asupra rezultatului si va trebui sa considere si alta
selectie si sa foloseasca un test cu semnicatie mai mare, de exemplu de 5% pentru a mai
sigur de concluzia pe care o da.
Exemplul 11.3 Din 100 de seminte plantate 83 au germinat. Folositi aproximarea distributiei binomiala cu o distribatie normala pentru a testa pretentia comerciantului ca 90% din

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

149

seminte germineaza. Folositi doua teste: unul cu pragul de semnicatie de 5%, altul cu pragul
de 1%.
Solutie Fie X v.a. care numara cate seminte au germinat din cele n. X  Bin(n; p),
unde n = 100.
H0 : p = 0; 9 (rata de germinare este de 90%).
H1 : p < 0; 9 (rata de germinare este mai mica de 90%).
Vom avea deci un test unilateral, deoarece este putin probabil ca vanzatorul sa sustina o
rata de germinare mai mica decat aceea reala.
Pentru pragul " = 0; 05 avem:

P(Z < Z0;05 ) = 0; 05; deci P(Z < Z0;05 ) = 0; 95 =F( Z0;05 ).
Din TABELUL I gasim ca Z0;05 = 1; 65, deci Z0;05 = 1; 65.
np
Cum H0 : X  Bin(100; 0; 9) avem ca X N(np; npq) =N(90; 9), deci Zcalc = Xpnpq
=
83 90
= 2; 33.
3
Dar Zcalc = 2; 33 < 1; 65 si deci va trebui sa resping H0 cu pragul de 5%. Adica
fabricantul de seminte... minte!
Pentru pragul " = 0; 01;  ( Z0;01 ) 0; 99, deci Z0;01 = 2; 32, sau Z0;01 = 2; 32.
Cum Zcalc = 2; 33 < 2; 32, dar aproape insensibil mai mic, testul in acst caz nu poate
concludent deoarece valoarea calculata Zcalc este prea aproape de valoarea critica 2; 32. Prin
urmare, fabricantul... minte, dar nu minte prea mult! Este nevoie de alte solutii pentru a
capata o certitudine mai mare.
Exemplul 11.4 O masina produce benzi elastice cu tensiuni de rupere normal distribuite cu
media m = 45N si  = 4; 36N . Intr-o zi s-a facut o selectie de volum 50 si s-a gasit media
selectiei x = 43; 46N . Testati cu un prag de semnicatie de 5% daca acest lucru indica sau
nu o schimbare a mediei tensiunilor de rupere.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

150

Solutie H0 : m = 45 (media nu s-a schimbat)


H1 : m 6= 45 (media s-a schimbat)-test bilateral!



2
X N m; n , m = 45N;  = 4; 36; n = 50.

43;46 p45
x pm
Zcalc = =
= 43;36=
= 2; 4975 < 1; 96. Prin urmare respingem ipoteza H0 cu
n
50
pragul de semnicatie de 5%.
Un interval de incredere de nivel 95% pentru medie este x  1; 96 pn = (42; 25; 44; 67).
Vedem ca 45 2
= (42; 25; 44; 67). Cea mai mica valoare a lui  astfel incat 45 sa e in intervalul
de incredere x  1; 96 pn este  = 5; 56 (vezi ecuatia 43; 46 + 1; 96 p50 = 45).

Exemplul 11.5 Tensiunea de rupere a unor cabluri produse de o fabrica este normal distribuita cu media 6000N si deviatia standard  = 150N. Gasiti probabilitatea ca un cablu luat
la intamplare se aiba tensiunea de rupere > 6200N.
S-a modicat procesul de productie si media tensiunilor de rupere se modica. Se aleg
6 cabluri la intamplare dupa aceasta modicare, se testeaza si se gaseste o medie de rupere
x = 5920N. Testati cu un prag de 5% daca dupa modicare media tensiunilor s-a micsorat.
Gasiti o constanta C a.i. noi sa putem spune cu un nivel de incredere de 90% ca media de
rupere este mai mare decat C.
Solu
tie X N(6000; 1502 );


X m
6200 m
P (X > 6200) = P
>
= P (Z > 1; 333) = 1 P (Z  1; 333)


= 1 F (1; 333) = 1 0; 90 = 0; 1:
x = 5920N;
H0 : m= 6000N; 
H1 : m < 6000N;

1502
2
X N m; n =N 6000; 6 ;

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

151

x pm
6000
p
Zcalc = =
= 5920
= 1; 306 > 1; 65, deci acceptam ipoteza H0 cu pragul de
n
150= 6
semnicatie 5%.
 C a.i. P(C < m < 1) = 0; 9, sau P( C > m) = 0; 9, sau inca
  Trebuie sa gasim
X pC
X pm
X pC
X pC
P = 6 > = 6 = Z = 0; 9. Deci F =
> Z = 0; 9 si de aici gasim ca =
= Z0;9 =
6
6

1; 29. Prin urmare C= x

p .
1; 29 150
6

Exemplul 11.6 O distributie normala se crede a avea media 50. Se face o selectie de volum
100 si se gaseste o medie de 52,6 si o deviatie standard de selectie de 14,5. Testati cu nivelul
de 5% daca media populatiei a crescut.
p
Solutie Fie m media reala si  2 dispersia reala a populatiei. x = 52; 6, iar s = s2 =
14; 5,
P
unde s2 = n1
(x x)2 .
H0 : m = 50 (nu exista o schimbare a mediei)
H1 : m> 50 (media
populatiei a crescut)

2
2
X N m; n . Estimam pe  2 cu 
b2 = nns 1  s2 , deoarece n = 100 este considerat mare
(100 > 30). Folosim deci statistica Z =

X pm

b= n

si calculam Zcalc =

52;6p50
14;5= 100

= 1; 793.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

152

Cum Zcalc = 1; 793 > 1; 645, vom respinge H0 , adica acceptam H1 cu pragul de semnicatie
de 5%. Deci acceptam ca mesia a crescut cu pragul de semnicatie de 5%.

11.1.2

Testul T privind media unei populatii normale cu dispersia


estimata prin estimatorul nedeplasat S 02

Ipoteza nula H0 : m = m0 se refera la o populatie normala careia


nu ii cunoastem dispersia.
P
Aceasta se va estima e prin estimatorul deplasat S 2 = n1
(x x)2 , e prin estimatorul
P
nedeplasat S = 2 = n 1 1 (x x)2 . Daca volumul selectiei n este mare (n  30) atunci
S = 2  S 2 si putem folosi ca statistica pentru un test de semnicatie, statistica Z (vezi
Exemplul 11.1.6). Daca insa volumul selectiei este mic nu mai putem folosi aceasta statistica
m0
ci este indicat sa folosim statistica Student cu n 1 grade de libertate, T = SX= =p
, unde
n
p
S = = S = 2.
In rest, testul lucreaza exact ca testele de la 11.1.1.
Exemplul 11.7 Se testeaza rezistenta in ohmi pentru 5 bucati de cablu si se gasesc valorile:
1,51; 1,49; 1,54; 1,52; 1,54. Daca cablul ar din argint pur,rezistenta lui ar de 1,5 ohmi.
Daca argintul nu este pur, rezistenta creste. Testati cu un nivel de semnicatie de 5% faptul
ca argintul din cablu nu este pur.
Solutie H0 : m = 1; 5 ohmi.
H1 : m > 1; 5 ohmi (test unilateral)
Deoarece esantionul selectiei este mic (n = 5) vom folosi statistica student T = SX= =pmn =
Xp m
,
S= n 1

cu n

1 = 4 grade de libertate.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

153

F(T0;05 ) =P(T<T0;05 ) = 0,95. Din TABELUL II, pentru  = 4 grade de libertate gasim
ca T0;05 = 2; 132.
P
1;50
7;6
1
2
Tcalc = S=xpnm 1 = 1;52
x
=
=
2;
105,
deoarece
=
1;
52,
iar
S
=
(x x)2 =
0;019=2
5
n
0;0018
5

= 0; 00036, sau S = 0; 019.


Deoarece Tcalc < 2; 132, valoarea critica a testului, atunci trebuie sa acceptam ipoteza H0
cu nivelul de semnicatie 5%.
Exemplul 11.8 Se fac 8 observatii dintr-o populatie normala si gasim x = 4; 65 si
0; 74. Testati cu nivelul de semnicatie de 2% daca media distributiei este 4,3.
Solutie H0 : m = 4; 3
H1 : m 6= 4; 3 (test bilateral)
4;3
T= S=Xpnm 1 ; Tcalc = 4;650;74
= 3; 05.
p
8 7

(x

x)2 =

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

154

Cum Tcalc > 2; 998, resping H0 cu nivelul de semnicatie de 2%.

11.1.3

Test pentru proportia de succese

Sa notam cu Ps =(numarul de realizari ale 


evenimentului
A din n incercari)=n, adica proportia

1 0
, unde q = 1 p, iar p este probabilitatea
de realizari a evenimentului A, cu X v.a.
p q
teoretica pentru a se realiza evenimentul A la o incercare. Daca punem X1 = X2 =    = Xn =
X, este clar ca Ps este chiar X = X1 +X2n++Xn . Pentru n mare, stim ca X N(M (Ps ) ; D (Ps )),


2
dar M(Ps ) =M X = p, D(Ps ) =D X = D(X)
= p np = pq
. Deci
n
n

pq
P
p
s
Ps =proportia de succeseN p; n . Fie Z = p pq N(0; 1). Testul proportiei de
n

succese se realizeaza cu ajutorul statisticii Z dupa cum se va vedea in exemplul urmator.

Exemplul 11.9 La o universitate americana senatul sustine ca nu se face discriminare sexuala la admitere. Se aleg 500 studenti si se gasesc 267 baieti. Testati cu nivelul de semnicatie
5% daca senatul universitatii spune adevarul sau nu.
Solutie H0 : p = 0; 5=probabilitatea ca un student sa e baiat;
H1 : p 6= 0; 5 (test bilateral)
267
0;5
500
Z = Pps pqp ; zcalc = p
= 1; 52.
0;50;5
n

500

Cum zcalc = 1; 52 < 1; 96, acceptam ipoteza H0 cu pragul de semnicatie de 5%. Prin
urmare este foarte probabil ca senatul sa spuna adevarul.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

155

Exemplul 11.10 ([Hays], pag. 447) Un producator de frigidere pretinde ca temperatura


medie n compartimentul de congelare este de 10 grade Fahrenheit (aproximativ -12,3 grade
Celsius). Vrem sa vedem adevarul acestei armatii si facem ipotezele: H0 : m  10 (ipoteza
nula), versus H1 : m = 10 (ipoteza alternativa). Facem un sondaj pe un lot de 16 frigidere
alese la ntmplare si masuram temperaturile n congelatoarele acestora. Gasim ca media
selectiei este 10,24 grade, iar dispersia de selectie modicata (nedeplasata) este de S 0 2 =0,36.
Presupunem ca distributia temperaturilor este normala (deoarece apare un fenomen de repartitie de erori). Cum dispersia este calculata tot din selectie folosim v.a. de selectie T .
10
Calculam t = 10;24
= 1; 6.Vrem sa folosim statistica T cu pragul de semnicatie de 5%
0;6=4
pentru a vedea daca producatorul are dreptate sau nu.Testul va unilateral deoarece zona de
respingere este data de m > 10: T0;95 = 1; 753 pentru 15 grade de libertate,dupa cum se poate
constata in TABELUL II. Tcalc = 1; 6 < 1; 753: Prin urmare acceptam ipoteza H0 cu pragul
de 5%.
Observatia 11.11 a) n exemplul de mai sus regiunea de respingere este: m > 10, concentrata ntr-o singura directie, adica la dreapta lui 10. Un astfel de test se zice directional (sau
unilateral).
b) Daca vrem sa testam o ipoteza despre dispersia unei populatii: H0 :  2 =  20 , unde  0
este data, va trebui sa utilizam testul 2 (vezi Lectia 12). Aici H1 :  2 6=  20 , si este dat.
0 2
Cele doua ( si H1 ) descriu regiunea de respingere. Statistica folosita este 2(n 1) = (n 1)S
,
2
0
unde (n 1) reprezinta numarul gradelor de libertate. Se urmeaza apoi aceeasi cale ca si n
cazul mediei (vezi Rezumatul si exemplele date acolo).

11.1.4

Testul T pentru compararea a dou


a esantioane

Fie fx1 ; :::; xn g si fx01 ; :::; x0m g dou


a esantioane. H0 :<<cele dou
a esantioane provin din aceeasi
populatie>>.
0p
P
nm
Fie 2(0,1) un prag de semnicatie. Not
am cu T = X S 0X n+m
, unde X = ( xi ) =n,


2 P  0
P
P 0
0
0 2
1
02
xi X
X = ( xi ) =m, S = 
, iar  = n + m 2. R. A. Fisher
xi X +

a ar
atat c
a T tinde c
atre o repartitie Student cu  grade de liberate. Calcul
am T . G
asim
cuantila de ordin 1 =2 n Tabelul corespunz
ator lui T pentru  grade de libertate si o not
am
cu T =2 . Testul functioneaz
a astfel:
 Dac
a jT j > T =2 atunci vom respinge ipoteza H0 cu pragul de semnicatie .
 Dac
a jT j  T =2 atunci vom accepta ipoteza H0 cu pragul de semnicatie .
Exemplul 11.12 (R. A. Fisher) 8 ghivece cu re de orez au fost supuse la descarcari
electrice. Altele 9 au fost ferite de descarcari. Rezultatul recoltei a fost (numar de spice):
Izolate: 17, 27, 18, 25, 27, 29, 27, 23, 17;
Electrizate: 16, 16, 20, 16, 20, 17 ,15, 21.
Sa se testeze ipoteza H0 :<<electricitatea inuenteaza cresterea orezului>>.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

11.2

156

Tipuri de erori. Reguli de decizie

Vom incepe cu un exemplu.


Exemplul 11.13 ([Hays], pag. 404) Un economist are doua ipoteze asupra implicatiilor
ce deriva din cresterea impozitelor la un anumit moment dat. Prima ipoteza este ca dupa
aceasta crestere 80% din populatie va trebui sa-si reduca economiile. A doua ipoteza este ca
numai 40% din populatie va trebui sa faca acest lucru. Cum s-ar putea aa care ipoteza este
adevarata?
Solutie. S-ar putea ca nici una dintre cele dou
a ipoteze s
a nu e adev
arat
a. Totusi, aici,
noi vom considera c
a sigur una ditre ele este adev
arat
a. Vom nota:
H0 : p=0,8
H1 : p=0,4, unde p este proportia de consumatori care urmeaz
a s
a-si reduc
a economiile
datorit
a cresterii impozitelor. Iat
a c
a impozitele au crescut si economistul nostru vrea s
a vad
a
care dintre cele dou
a ipoteze ale sale (ecare are n spatele ei rationamente si teorii economice
sosticate) este adev
arat
a. Pentru aceasta face un sondaj pe un esantion de n consumatori.
Deoarece ecare din consumatori spune DA sau NU (si-a redus sau nu si-a redus economiile)
avem un proces de tip Bernoulli cu n dat si p dat. Pentru H0 trebuie s
a consider
am p=0,8, iar
pentru H1 trebuie s
a consider
am p=0,4. Presupunem, pentru usurint
a, c
a n=10. Not
am cu
r num
arul acelor consumatori care au r
aspuns cu DA (dintre cei n chestionati). Statistica de
seletie care poate comparat
a cu p este R=n, unde R este v.a. ce pate lua valorile r: 0,1,...,n.
Valorile teoretice pe care le poate lua R=n si probabilit
atile lor le g
asim n urm
atorul tabel
(am folosit distributia binomial
a, vezi Tabelul V):
r

r=n

0
1
2
3
4
5
6
7
8
9
10

0
0; 1
0; 2
0; 3
0; 4
0; 5
0; 6
0; 7
0; 8
0; 9
1

P (r=n j p = 0; 8)
aprox. 4 zecimale
0
0
0
0; 001
0; 006
0; 026
0; 088
0; 201
0; 302
0; 268
0; 107

P (r=n j p = 0; 4)
aprox. 4 zecimale
0; 006
0; 040
0; 121
0; 215
0; 251
0; 2
0; 111
0; 042
0; 011
0; 002
0; 0001

(11.1)

S
a presupunem c
a statisticianul are datele de selectie ale sondajului, are deci raportul
R=n calculat din sondaj. El are nevoie de o REGUL DE DECIZIE pentru a putea alege
H0 sau H1 . Exist
a foarte multe posibilit
ati de a construi astfel de reguli de decizie. Unele

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

157

sunt mai bune, altele nu sunt asa de bune. Vom alege acum urm
atoarea regul
a: <<Dac
a
R=n <0,8, alegem H1 ; dac
a R=n 0,8, alegem H0 >>(REGULA 1).
Ce se poate ntmpla dup
a ce statisticianul a folosit aceast
a regul
a?
El poate gresi sau nu. S
a calcul
am probabilit
atile n toate cele patru cazuri care pot s
a
apar
a:

Decizia H0
luata H1

Situatia
reala
H0
H1
corect eroare II
eroare I corect

(11.2)

De exemplu, s
a presupunem c
a din selectie am obtinut R=n 0,8 si totusi n realitate
p=0,4. Deci am ales H0 si totusi H1 este adev
arat
a. Apare al doilea tip de eroare (eroare II).
S
a calcul
am probabiltatea acestei erori (folosind tabelul de mai sus):
P (R=n  0,8 j p=0,4)
= P (R=n=0,8 j p=0,4) + P (R=n=0,9 j p=0,4) + P (R=n=1 j p=0,4)
= 0; 011 + 0; 002 + 0; 0001  0; 013:
Primul tip de eroare (eroare I) apare dac
a alegem H1 si totusi H0 este adev
arat
a. Probabilitatea acesteia este:
P (R=n < 0,8 j p=0,8)
= +0 + 0 + 0; 001 + 0; 006 + 0; 026 + 0; 088 + 0; 201 = 0; 322:
Cele dou
a situatii corecte au urm
atoarele probabilit
ati:
P(R=n  0,8 j p=0,8) =0,677,
P(R=n < 0,8 j p=0,4) =0,987.
Punem aceste rezultate n urm
atorul tabel:

Decizia H0
luata H1

Situatia reala
H0
H1
0,677 0,013
0,323 0,987

(11.3)

Ce spune acest tabel? Dac


a dup
a selectie R=n <0,8, este foarte probabil ca p=0,4. Oricum
este mai probabil acest lucru dect faptul c
a R=n 0,8 si p=0,8. Este foarte putin probabil
s
a gresim cu aceast
a regul
a de decizie, deoarece 0,323+0,013<0,677+0,987.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

158

Iat
a o alt
a regul
a de decizie: <<Dac
a R=n <0,6, alegem H1 ; dac
a R=n 0,6, alegem
H0 >>(REGULA 2). Tabelul corespunz
ator acestei reguli este urm
atorul:

Decizia H0
luata H1

Situatia reala
H0
H1
0,966 0,116
0,034 0,834

(11.4)

Este clar c
a dintre cele dou
a reguli de decizie este mai bun
a a doua regul
a deoarece
probabilit
atile de eroare sunt mici.
n prima regul
a de decizie valoarea lui R=n=0,8 (care face trecerea de la zona ipotezei H0
la zona ipotezei H1 ) se numeste valoarea critica a lui R=n (adic
a a statisticii R=n).
Pentru a doua regul
a de decizie valoarea critic
a a statisticii R=n este 0,6.
 n general, frontiera dintre domeniul de acceptare D si domeniul de respingere D,
formeaz
a multimea de puncte n care statistica de testare g (X1 ; :::; Xn ) ia valoarea critica
C0 .
n gura urm
atoare avem reprezentarea grac
a a domeniului de acceptare D pentru ipoteza
H0 , a domeniului de respingere D pentru ipoteza H0 si a multimii punctelor de valoare
critic
a pentru urm
atoarea regul
a de decizie: <<Dac
a g (X1 ; :::; Xn ) C0 , accept
a H0 ; dac
a
g (X1 ; :::; Xn ) <C0 , accept
a H1 >>. Aici C0 este valoarea critic
a a testului.

Regiunea de acceptare si regiunea de respingere a unui test


Desigur c
a statistica g (X1 ; :::; Xn ) este aleas
a astfel nct s
a e o leg
atur
a natural
a ntre ea

si ipotezele H0 si H1 . Se consider
a, de asemenea, c
a H0 si H1 se exclud reciproc D \ D = ; .
Vom presupune n continuare c
a H0 este ipoteza care se testeaza . Statisticianul poate face
dou
a tipuri de erori:

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

159

 Eroare de tipul I dac


a respinge H0 , ea ind adev
arat
a;
 Eroare de tipul II dac
a accept
a H0 , ea neind neadev
arat
a.
Not
am cu = P (eroare de tipul I)= P (respinge H0 jH0 este adev
arat
a);
= P (eroare de tipul II)= P (accept
a H0 jH0 este fals
a).
Tabelele (11.3) si (11.4) din Exemplul 11.1 se generalizeaz
a la urm
atorul tabel:

Decizia Accept H0
luata Resping H0

Situatia reala
H0
H1
1-


1-

(11.5)

Orice regul
a de decizie are un cuplu de numere ( ; ).
Idealul ar ca si s
a e 0, sau foarte mici.
Dintre dou
a reguli de decizie cu( 1 ; 1 ) si ( 2 ; 2 ) astfel nct 1  2 , 1  2 , vom
elimina pe cea de-a doua. Spunem c
a regula de decizie cu ( 1 ; 1 ) domina (este mai tare)
regula de decizie cu ( 2 ; 2 ). n cazul Exemplului 11.1 cele dou
a reguli nu se pot compara,
ele nu se domin
a una pe alta.
O regul
a de decizie dominat
a de o alt
a regul
a de decize se zice inadmisibila.
Vom da acum un exemplu de regul
a de decizie inadmisibil
a: <<Dac
a R=n 2 ( 1; 0; 2) [
(0; 8; 1), alegem H1 ; dac
a R=n 2 [0; 2; 0; 8], alegem H0 >>(REGULA III).
Tabelul corespunz
ator ei este:

Decizia Accept H0
luata Resping H0

Situatia reala
H0
H1
0,625 0,952
0,375 0,048

(11.6)

Aici 2 =0,375, 2 =0,952. Cum 1 =0,323 si 1 =0,013 erau probabilitatile de eroare pentru
prima regul
a, rezult
a c
a regula <<Dac
a R=n 2 ( 1; 0; 2) [ (0; 8; 1), alegem H1 ; dac
a
R=n 2 [0; 2; 0; 8], alegem H0 >>(REGULA III) este inadmisibil
a deoarece este dominat
a de
prima regul
a de decizie. Nu vom lucra niciodat
a cu reguli de decizie despre care stim c
a sunt
inadmisibile. Dac
a se analizeaz
a ndeaproape regula <<Dac
a R=n 2 ( 1; 0; 2) [ (0; 8; 1),
alegem H1 ; dac
a R=n 2 [0; 2; 0; 8], alegem H0 >>(REGULA III) se constat
a c
a ea contrazice
chiar bunul simt probabilistic (De ce?).
n general statisticianul este interesat de modul in care variaza probabilitatile de eroare
si atunci cnd el schimba legea de decizie. Evident c
a pentru orice statistica de testare
g (X1 ; :::; Xn ) si pentru orice lege de decizie xat
a avem un si un bine determinati. P
astr
am
statistica de testare xat
a si variem legile de decizie. Se obtine un domeniu al probabilitatilor
de eroare (un domeniu de risc) dac
a se consider
a abscisa si ordonata punctului ( , )
vezi gura urm
atoare:

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

160

Domeniul probabilit
atilor de eroare
d din gura anterioar
Curba groas
a AB
a este curba corespunz
atoare tuturor cuplurilor ( , )
care deriv
a din decizii bune sau admisibile. Oricare alt punct ( 1 , 1 ) din domeniul de
d provine dintr-o decizie inadmisibil
risc care nu se a
a pe curba AB
a, deoarece aceasta este
d si aat la intersectia
dominat
a de decizia corespunz
atoare punctului ( 2 , 2 ) de pe curba AB
dintre aceast
a curb
a si segmentul OM.
d se apropie de
Experienta arat
a c
a dac
a volumul de selectie n creste, atunci curba AB
origine, adic
a riscul devine mai mic cel putin pentru deciziile admisibile (deoarece precizia de
predictie asupra populatiei creste odat
a cu n).
Singura problem
a care r
amne pentru statistician este aceea legat
a de alegerea regulii de
decizie admisibile. Aici intervine negocierea ntre cazurile mare, mic, sau invers,
d
mic, mare, ( , )2 AB.
Situatia neutr
a este aceea cnd = . n practic
a aceast
a negociere depinde de factori
subiectivi sau obiectivi dar.
 Din punct de vedere istoric ipoteza H0 se numeste ipoteza nula (nevinov
atia prezumtiv
a
n cazul unui acuzat!), iar ipoteza H1 se zice ipoteza alternativa (vinov
atia acuzatului). n
practic
a, num
arul (notat uneori si cu ") se d
a ca ind 0,05 sau 0,01 (rareori se utilizeaz
a
alt
a valoare). reprezint
a probabilitatea de a respinge H0 cu toate c
a H0 este adev
arat
a.
Presupunem c
a H0 este adev
arat
a si alegem asa numita regiune (domeniu) de respingere
n concordant
a cu ipoteza H1 . S
a not
am domeniul de respingere cu Res = facele valori ale
statisticii de testare g (X1 ; :::; Xn ) pentru care H 1 este adevarata g. G
asim multimea Res din
ipoteza:
P (g (X1 ; :::; Xn ) 2 Res j H0 =adev
arat
a) = (dat)

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

161

Dac
a la o selectie de volum n: X1 ; :::; Xn ; valoarea v.a. g (X1 ; :::; Xn ) 2 Res, spunem c
a
ipoteza H1 este adevarata cu pragul de semnicatie (cu conditia ca s
a e mic, ca mai sus).
Vom da acum cteva exemple de testare a unor ipoteze statistice n lumina celor spuse
mai sus.
Exemplul 11.14 ([Hays], pag. 415) Un muncitor poate sa realizeze X piese pe ora.
Dupa ndelungate cercetari statistice s-a stabilit ca X este o v.a. normala cu media m=138 si
deviatia standard =20. Un inginer pretinde ca poate aduce o inovatie n procesul de productie
astfel nct sa ridice media la m=142 piese pe ora, fara a perturba normalitatea v.a. X si pe
. Este chemat un statistician sa testeze pretentia inginerului.
Solutie Introducem dou
a ipoteze:
H0 : m=138
H1 : m=142
Facem o selectie de 100 muncitori care lucreaz
a cte o or
a ecare. Alegem pragul de
semnicatie =0,05=P(respingem H0 jH0 este adev
arat
a). Vrem acum s
a g
asim regiunea de
respingere n acest caz concret. Stim c
a un estimator bun pentru media m este media de
selectie X = (X1 + X2 +    + Xn ) =n, care este normal
a cu media m si deviatia
p distribuit
standard (pentru selectia noastr
a n=100)  X = 20= 100 = 2. Chiar dac
a ipoteza de normalitate a v.a. X nu este ntrutotul adev
arat
a (sau chiar fals
a!), deoarece n=100 este mare,
din teorema limit
a central
a, rezult
a c
a X este distribuit
a normal. Dac
a H0 este adev
arat
a,
atunci X este normal distribuit
a cu media 138 si deviatia standard 2, pe cnd, dac
a H1 este
adev
arat
a, m=142 si deviatia standard tot egal
a cu 2. Vedem de aici c
a valorile mari ale v.a.
X favorizeaz
a ipoteza H1 , iar valorile mici ale v.a. X favorizeaz
a ipoteza H0 .
Regiunea de respingere va deci de forma: <<Respinge H0 dac
a X  C >>. Aici C
reprezint
a valoarea critic
a a regulii de decizie: <<Dac
a X < C, alegem H0 ; dac
a X  C,
alegem H1 >>.
Vrem acum s
a determin
am valoarea critic
a C a statisticii X dac
a stim pe =0,05. Scriem
c
a =P(respinge H0 jH0 =adev
arat
a)=P(X  C j m=138)=0,05. Dar P(X  C j m=138)=

C 138
X 138
P Z  2 , unde Z =  2 este v.a. standard normal
 a cu media 0 si cu deviatia standard
1. Vrem ca P Z  C 2138 = 0; 05 = 1 F C 2138 , unde F (z) este functia de repartitie
(functia de distributie cumulat
a) a v.a. normale stanard Z. Din Tabelul I g
asim c
a C 2138
este 1,65, adic
a cuantila de ordin 1-0,05=0,95 a v.a. Z. De aici rezult
a c
a punctul critic
C=141,30. Acum putem calcula si probabilitatea
= P (accept H0 j H1 = adev
arat
a) = P (X < 141; 30 j m = 142)


141; 30 142
= P Z<
= P (Z < 0; 35) = F ( 0; 35) = 1 F (0; 35) = 0; 36:
2

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

162

Tabelul corespunz
ator regulii de decizie de mai sus este:

Decizia Accept H0
luata Resping H0

Situatia reala
H0
H1
0,95
0,36
=0,05 0,64

(11.7)

Dac
a din calcule X < 141; 30, atunci alegem H0 , adic
a r
amnem la vechiul procedeu de
lucru.
S
a coment
am putin rezultatele din tabelul (11.7). =0,05 , chiar dac
a X  141; 30, adic
a
aleg H1 si resping H0 , probabilitatea de eroare n cazul cnd H0 este adev
arat
a, este foarte
mic
a. Prin urmare, dac
a alegem noul procedeu si-l nlocuiesc cu primul (primul ind mai
amnem la
bun) riscul este mai mic, aproape zero. Totusi, dac
a alegem H0 (X < 141; 30) r
vechiul procedeu n timp ce noul procedeu este mai bun, riscul este mai mare: =0,36.
Statisticianul vrea s
a micsoreze si acest risc f
ar
a ns
a a m
ari pe =0,05 (putem micsora
pe dac
a reducem valoarea critic
a la 140, de exemplu; dar, n acest caz creste si ). Teoretic
stim c
a si se micsoreaz
a dac
a m
arim volumul selectiei.
p
Vom m
ari pe n la 400. n acest caz deviatia standard a v.a. X devine  X = 20= 400 = 1.
Determin
am valoarea critic
a ca mai sus si g
asim C = 139; 65. n acest caz
= P (accept
a H0 j H1 = adev
arat
a) = P (X < 139; 65 j m = 142)


139; 65 142
= P Z<
= P (Z < 2; 35) = 0; 01:
1
Iat
a deci c
a am redus pe de la 0,36 (cnd n=100) la 0,01 (cnd n=400).
Acum statiticianul poate s
a r
aspund
a cu riscuri foarte mici ( ; mici) dac
a este bine s
a
schimb
am procedeul de producere al pieselor (accept H1 si resping H0 ) sau, dimpotriv
a, s
a
lucr
am dup
a acelasi procedeu (accept H0 si resping H1 ).
n primul caz pot gresi cu 5%, iar n al doilea caz cu 1%. Facem deci un sondaj de 400
a X < 139; 65 sau X  139; 65.
muncitori/or
a. Calcul
am X si vedem dac
Observatia 11.15 Pentru valoarea critica C=141,30, regiunea de respingere este [141,30;1),
pe cnd pentru valoarea critica C=139,65, regiunea de respingere este [139,65;1).

11.3

Puterea unui test statistic

Fie  un parametru al unei populatii si ipoteza: H0 :  = 0


Pentru o regiune de respingere dat
a si pentru o valoare particular
a a lui , de exemplu 1 ,
putem calcula P(resping H0 j  = 1 ). Dar, dac
a 1 = 0 , aceast
a ultim
a probabilitate este
chiar . Dac
a 1 6= 0 not
am cu H1 :  = 1 si probabilitatea de mai sus devine P(resping
H0 jH1 =adev
arat
a)=1-P(accept
a H0 jH1 =adev
arat
a)=1- .

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

163

Denitia 11.16 Numarul P(resping H0 j  = 1 ), calculat mai sus, se numeste puterea


testului ipotezei H0 contra alternativei H1 .
n Exemplul 11.2 puterea testului H0 : m = 138 contra alternativei H1 : m = 142 este
egal
a cu 1- =1-0,36=0,64, dac
a regiunea de respingere este [141,30;1). Un test este cu att
mai puternic cu ct ipoteza H0 :  = 0 este mai departe dect valoarea real
a a lui ,
H1 :  = 1 . Mai mult, 1- mare nseamn
a mic, adic
a un test este cu att mai puternic
cu ct este mai putin probabil s
a accept H0 cnd ea de fapt nu este adev
arat
a. S
a amintim
c
a noi alegem foarte mic. Acest determin
a zona de respingere (regiunea de respingere).
Pentru aceast
a zon
a de respingere determin
am pe dac
a stim pe 1 . Prin urmare puterea
unui test 1- depinde de 1 . Ea va maxim
a pentru acel 1 pentru care riscul de a accepta
pe H0 cnd ea este fals
a, comparativ cu H1 , este minim (aici H1 este considerat
a adev
arat
a!).
Exemplul 11.17 Sa reluam exemplul anterior ntr-un cadru mai general. Presupunem ca
vrem sa studiem media unei populatii si facem ipoteza nula (initiala, sau de baza): H0 : m =
m0 , si ipoteza alternativa: H1 : m = m1 . Presupunem ca m1 > m0 si ca v.a. media de selectie
X = (X1 + X2 +    + Xn ) =n este normala (pentru n mare X poate considerata normala)
cu deviatia standard  X cunoscuta. Deoarece valorile mari ale v.a. X favorizeaza H1 si
valorile mici ale v.a. X favorizeaza H0 , este natural sa cautam zona de respingere de forma
X  C, unde C este valoarea critica a regulii de decizie:<<respinge H0 , daca X  C; accepta
H0 , daca X < C >>. Ca si n exemplul 11.2 gasim ca pentru pentru =0,05 valoarea critica
C = m0 + 1; 65 X . Acum putem calcula puterea acestui test pentru orice valoare data lui m1 .
De exemplu, daca m1 = m0 +  X 
puterea testului este P(respinge
H0 j m = m0 +  X )=P(X 

(m0 +1;65 X ) (m0 + X )
m0 + 1; 65 X j m = m0 +  X )=P Z 
=P(Z  0; 65)=0,26.
X
Daca m1 = m0 + 3 X , puterea testului creste: P(respinge H0 j m = m0 + 3 X )=P(Z 
1; 35)= 0,91. Aceasta ultima valoare este mare, deci, daca cumva media m = m0 + 3 X ,
atunci testul de mai sus poate detecta acest lucru cu o probabiltate de 0,91.
 Numim curba de putere a testului de mai sus gracul functiei de putere P(X  m0 +
1; 65 X j m = m1 ), ca functie de variabila m1 . S
a o not
am cu p(m1 ).
Dou
a teste se pot compara si putem spune care dintre ele este mai tare. Mai mult, n
anumite conditii putem alege testul cel mai puternic. Noi ns
a nu ne ocup
am aici de aceste
lucruri. n cadrul rezumatului vom lucra cu functia p(m1 ) si vom construi cel mai puternic
test n sensul precizat acolo. Ne limit
am la analiza functiei de putere din gura urm
atoare:

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

164

Curba de putere depinde de alegerea pragului de semnicatie . Este natural ca pentru


mai mare puterea testului s
a creasc
a, dup
a cum se vede n gur
a. De asemenea, dac
a m
arim
volumul de selectie n, puterea testului creste pentru valori m1 > m0 si scade pentru valori
m1 < m0 (de ce?).
 n exemplele 2 si 3 s-a testat media n cazul cnd dispersia populatiei era cunoscut
a.
Putem observa c
a dac
a micsor
am dispersia, puterea testului creste. Pe baza teoriei intervalelor
de ncredere (Lectia 10) se pot construi teste parametrice n care si dispersia este necunoscut
a.

11.4

Rezumat

 Partea teoretica
Fie X un model statistic pentru o populatie P, model care depinde de un parametru  2 .
Fie H o submultime specicat
a n . Ea va numit
a ipotez
a. Fie K=nH. Spunem c
a:
H se realizeaz
a dac
a  2H (prin natura lucrurilor)
H nu se realizeaz
a dac
a  2K.
n Lectia 11 am notat H cu H0 si K cu H1 .
S
a not
am cu
spatiul tuturor observatiilor pe care le vom face asupra populatiei P (spatiul
de selectie). Pentru ecare  2  avem o distributie p pentru X. Dac
a pentru un sondaj
! 2
, g
asim c
a  2H, spunem c
a accept
am ipoteza H, dac
a  2K spunem c
a respingem
ipoteza H. Spatiul de selectie se mparte n dou
a p
arti distincte:
=A[R, unde A este zona
de acceptare a ipotezei H, adic
a A=f! 2
j  2Hg, iar R=f! 2
j  2Kg este zona de
respingere a ipotezei H.
S
a not
am cu p (R) =  =probabilitatea de a respinge ipoteza H cnd de fapt  este bine
ales de natur
a. Se zice eroare de primul tip respingerea ipotezei H cnd ea este adev
arat
a:

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

165

 2H si ! 2R. Ea are probabilitatea  .


Se zice eroare de al doilea tip acceptarea ipotezei H cnd ea de fapt nu este adev
arat
a:
 2H si ! 2A. Testul are pragul " dac
a   ", (8)  2H. Functia 
 ,  2K se zice
puterea testului:
Pentru a face un test se alege o statistic
a Y care este mic
a cnd H se realizeaz
a si este
mai mare cnd H nu se realizeaz
a. Se alege un num
ar y: Regiunea de respingere este de
forma: Resping H()Y y. Testul este de prag " dac
a  2H implic
a p (Y  y)  ". Dac
a
nu se d
a dinainte pragul ", se observ
a valorile y ale statisticii Y si maximul probabilit
atii
p (Y  y) cnd  2H. Dac
a acest maxim este mic se respinge ipoteza H. Dac
a acest maxim
este mare se accept
a ipoteza H.
Partea practica
1) Test asupra mediei m a unei populatii normale cu dispersia cunoscuta  2
pm  N (0; 1) ; H0 : m = m0 ; H1 : m 6= m0 (test bilateral), sau H1 : m > m0 (sau
Z= X
= n
m < m0 ) (test unilateral)
2) Test asupra mediei m cu dispersia  2 necunoscuta ( n  30)
P
Se estimeaza  2 cu S 2 = n1
(x x)2 si se foloseste statistica Z =
H1 apar exact ca la 1).

X pm
S= n

 N (0; 1). H0 si

3) Test asupra mediei m cu dispersia


 2 necunoscuta ( n  30)
P
2
1
2
=2
Se estimeaza  cu S = n 1 (x x)2 = nnS 1 si se foloseste statistica
X m
T = p
S= n 1

adic
a distributia Student cu n



X m
= = p
 t (n
S = n

1)

1 grade de libertate. H0 si H1 apar exact ca la 1).

4) Test pentru
 proportia de succese
pq
Ps  N p; n ; q = 1 p: Z = Pps pqp  N (0; 1). H0 si H1 apar exact ca la 1).
n

5) Erori de tipul I si erori de tipul II


Situatia reala
Concluzia noastra
(1) H0 este adevarata Acceptam H0
(2) H0 este adevarata Respingem H0
(3) H0 este falsa
Acceptam H0
(4) H0 este falsa
Respingem H0

Decizie
Decizie
Decizie
Decizie

corecta
falsa
Eroare I
falsa
Eroare II
corecta

= P (Eroare de tipul I)= P (resping H0 j H0 = adevarata)


= P (Eroare de tipul II)= P (accept H0 j H1 = adevarata)

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

11.5

166

Exercitii rezolvate (mai dicile)

1.Fie X o v.a. Poisson de medie . Consideram ipoteza H:   0; 5. Fie X 1 ,...,X 20 un


esantion din X si punem Y=X 1 +X 2 +    +X 20 . Deniti cu ajutorul lui Y (care are tot o
distributie Poisson) cel mai puternic test posibil de prag 0,05. Pentru aces test determinati:
1) Probabilitatea erorii de primul tip pentru  = 0; 3.
2) Probabilitatea erorii de al doilea tip pentru  = 0; 8.
Presupunem ca gasim Y=20. Cu ce prag se poate accepta H?
Solutie. Cum Y=20X este natural s
a consider
am un test de forma: Respinge H()Y y.
Cnd H se veric
a, cea mai mare probabilitate de a respinge H se obtine pentru  = 0; 5.
n acest caz Y este Poisson de parametru 20  0; 5 = 10. Tabelul arat
a ca P(Y y) 0; 05
pentru y  16. Testul cerut se obtine pentru cel mai mic y posibil (pentru a avea puterea
maxim
a). Deci testul este: Respinge H()Y 16. Pentru  = 0; 3, Y este Poisson de
parametru 20  0; 3 = 6 si probabiliatea erorii de primul tip este P(Y 16)=0,0005. Pentru
 = 0; 8, Y este Poisson de parametru 20  0; 8 = 16 si probabilitatea erorii de al doilea tip
este P(Y 15)=0,4667.
Presupunem c
a Y=20. Maximul lui P(Y 20), cnd H este vericat
a, se obtine pentru  =
0; 5. n acest caz Y este Poisson de parametru 10. Se g
aseste n acest caz P(Y 20)=0,0035
si trebuie s
a accept
am ipoteza pentru un prag  0; 0035.
2.Fie X o v.a. gaussiana de dispersie 1 si de medie 0 sau 1. Vrem sa testam ipoteza H:
M(X)=0 contra alternativei M(X)=1 cu un prag " = 0; 05. Se ia pentru acesta un esantion
de volum n.
1) Deniti un test (cel mai puternic posibil).
2) Plecnd de la ce valoare a lui n testul obtinut va avea puterea  0; 9?
Solutie. Consider
p am un test de forma: Respinge H() X  y. Fie  =M(X). Variabila aleatoare T= n X  este gaussian
a redus
a. n tabele g
asim P(T t)=0,05 pentru
t=1,6449. P(T u)=0,05 pentru u=1,2816.
1) n este p
considerat x. S
a g
asim y astfel nct testul s
a e de prag ". Dac
a,
pa H se veric

=
0

s
i
T=
n

X.
Testul
va
avea
pragul
"
dac
a
P(X

y)
",
sau
P(T
ny)
",
adic
a
p
t
ny  t. Testul va cel mai puternic dac
a y = pn , deci avem testul:
1;6449
Respinge H() X  pn .
p
p
2) Presupunem c
a H nu se veric
a  = 1 si p
T= nX
n. Se comite o eroare de
pa, adic
p
n. Puterea testului va deci  0; 9
al doilea tip pentru
p X  y sau
p T ny p n = t
dac
a P(T t
n), sau t
n < u, deci n > t u = 2; 9265. Cel mai mic n pentru care
puterea testului este  0; 9 este n = 9.
3. Fie X pretul aceluiasi articol luat la ntmplare din 15 magazine. Gasim tabelul acestor

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
preturi n $:

167

42,7 42,6 43,0 43,5 42,8


43,1 43,6 42,9 41,6 42,8 :
42,9 43,2 42,6 43,1 43,1

a) Se poate admite ipoteza M(X)=43,0?


b) Se poate admite ipoteza D(X)=0,1? n ambele cazuri se ia pragul " = 0; 05 si se
considera legea gaussiana pentru X.
jX 43j
Solutie. 1) Avem c
a n = 15, X = 42; 9, S2 = 0; 2. De aici deducem c
=
a jT0 j = p 2
S =(n 1)

0; 8366. O variabil
a aleatoare cu n 1=14 grade de libertate are o probabilitate de cel putin
0,40 pentru a lua o astfel de valoare. Ipoteza M(X)=43 este perfect acceptabil
a.
2) O estimare nedeplasat
a pentru  2 =D(X) este nn 1 S2 = 0; 21. Aceast
a valoare este
dublul valorii testate 0,1. Vrem s
a vedem dac
a nu cumva ea este prea mare. Pentru aceasta
nS 2
2
folosim faptul c
a 2 are o distributie  (Pearson) cu n 1 grade de libertate. G
asim c
a
nS 2
2
= 30. Dar  cu 14 grade de libertate are o probabilitate < 0; 01 pentru a lua o astfel de
0;1
valoare ridicat
a. Cu pragul 0,05 va trebui deci s
a respingem ipoteza  2 = 0; 1.

4. ntr-un oras A, 300 de locuitori din 1500 interogati declara ca nu s-au uitat niciodata
la TV. ntr-un alt oras B, 320 din 1800 declara acelasi lucru. Ce credeti despre ipoteza H:
proportia de locuitori care nu se uita la TV este aceeasi n ambele orase. (pragul 0,05).
Solutie Vom accepta pentru cele dou
a v.a. X si Y ce reprezint
a num
arul acelora care nu
se uit
a deloc la TV c
a au o distributie uniform
a. Presupunem c
a X1 ,...,X1500 si Y1 ,...,Y1800
300
320
sunt independente. Avem c
a m = 1500, n = 1800, X = 1500
= 0; 2, Y = 1800
= 0; 172;


P
Y
X
2
2
j
j
S2X = m1
Xi X = X 1 X , S2Y = Y 1 Y ; jT0 j = p 1 2 1 2 = 1; 61.
S + n SY
m X

O variabil
a gaussian
a redus
a are o probabilitate mai mare dect 0,1 pentru a lua o valoare
att de mare. Prin urmare, la pragul de 0,05 ipoteza H se accept
a.

5. Pentru a masura o masa  putem folosi doua procedee A si B. Rezultatul masuratorii lui
 prin procedeul A este o v.a. gaussiana X cu media  si cu dispersia  2X . Prin procedeul B,
avem o variabila gaussiana Y cu media  si dispersia  2Y . S-au facut 8 masuri independente
pentru  prin procedeul A care au condus, la o dispersie de selectie empirica egala cu 0,24.
S-au facut apoi 12 masuratori independente pentru aceeasi masa  prin procedeul B si s-a
obtinut dispersia de selectie 0,08. Ce credeti despre ipoteza H: cele doua procedee A si B au
aceeasi precizie? (prag " = 0; 05)
Solutie. Testul se refer
a la ipoteza H:  2X =  2Y , cu m = 8, n = 12, S2X = 0; 24, S2Y = 0; 08.
S2
De aici s-ar putea crede c
a  2X >  2Y . Vrem s
a vedem dac
a nu cumva raportul SX2 nu este prea
Y
mare (relativ la pragul ") pentru ca ipoteza H s
a e vericat
a.
mS 2
nS 2
Stim c
a variabilele aleatoare 2X si 2Y sunt 2 cu m 1 = 7 si respectiv n 1 = 11
X

mS 2 (m 1)
1)
Y

grade de libertate. Dac


a cumva ipoteza H ar vericat
a v.a. U= nSX2 (n

ar avea o

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE
distributie F (Fisher-Snedecor) cu

m
n

1
1

7
11

168

grade de libertate. n cazul nostru

80;24=7
U= 120;08=11
= 3; 14.
Se vede din cercetarea direct
a a tabelului pentru distributia F c
a probabilitatea ca v.a.
acesta s
a ia o astfel de valoare este ceva mai mic
a dect 0,05. Vom deci obligati s
a respingem
ipoteza c
a  2X este cu mult mai mare dect  2Y . Totusi nu putem avea mare certitudine c
a  2X
= 2Y .

11.6

Exercitii propuse

1. Se arunca o moneda de 64 de ori. Testati la un nivel de semnicatie de 5% daca moneda


este corecta, sau daca moneda este contrafacuta in favoarea capului, sau daca
a) apare capul de 38 ori;
b) apare capul de 42 ori.
R: a) z=1,5, corecta; b) z=2,5, contrafacuta.
2. Un producator de hrana pentru caini pretinde ca 8 din 10 caini prefera hrana produsa
de el hranei produse de alti producatori. Se aleg 120 de caini si se gasesc 88 care sa prefere
aceasta hrana. Testati cu un nivel de 5% daca pretentia producatorului este corecta.
R: z=-1,826, armatia producatorului se respinge.
3. O masina produce componente a caror greutati variaza dupa o lege normala cu greutatea
medie de 15,4 g si cu deviatia standard  = 2; 3 g. Masina s-a uzat cu timpul si se banuieste
ca greutatea medie a pieselor produse de ea s-a micsorat. Se face o selectie aleatoare de 81
de piese si se gaseste ca masa medie a lor x = 15 g. Oare acest lucru ne indreptateste pe
noi sa credem cu un nivel de semnicatie de 5% ca greutatea medie a pieselor s-a micsorat?
Presupunem ca deviatia standard  nu s-a schimbat.
R: z=-1,565, Nu.
4. Un producator de castet audio pretinde ca o caseta care dureaza 90 min. de obicei,
dureaza de fapt 92 min. in medie cu deviatia standard  = 1; 8 min. Se selecteaza 36 de benzi
si se incearca. Cel care verica casetele respinge pretentia producatorului la un nivel de 5%
si spune ca media de timp al unei casete este mai mica decat 92 min. Ce puteti spune despre
valoarea mediei de selectie pe care a cercetat-o statisticianul, valoare care l-a condus la decizia
luata?
R: x < 91; 51 min.
5. Dupa un sondaj facut asupra a 300 de studenti s-a gasit ca 35% fumeaza. Se poate respinge ipoteza H 0 : p = 0; 4 n favoarea ipotezei H 1 : p 6= 0; 4 la un prag de semnicatie de 0,05?

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

169

6. Un esantion de volum 25 a fost extras dintr-o populatie normala, X  N (m; 4). Media
de selectie x este 10,72. Fie ipoteza nula H 0 : m = 10 si ipoteza alternativa: a) H 1 : m > 10;
b) H 1 : m 6= 10. Gasiti in ambele cazuri nivelul de semnicatie la acre trebuie sa respingem
ipoteza nula in favoarea ipotezei alternative.
R: a) "  3; 59%; b) "  7; 18%:
7. Un producator de becuri sustine ca media de viata a unui bec electric produs de el este
de 2000 de ore.
la intamplare si se testeaza viata lor in ore, x.
P Se iau 64 de becuri
P
Se obtine
x = 127808,
(x x)2 = 9694; 6. Oare la un nivel de semnicatie de 2%
putem spune ca producatorul si-a supraestimat produsul? Presupunem ca durata de viata a
unui bec are distributia normala.
qP
(x x)2 =n.
R: n = 64 > 30 este mai mare; deci estimam  cu 
b=S=
pm si gasim zcalc =
Folosim statistica Z = X

b= n
supraestimat produsul la nivelul de 2%.

1; 95 (test unilateral). Producatorul nu si-a

P
8.
Dintr-o
populatie
normala
X
se
extrage
un
esantion
de
volum
40
cu
x = 24 si
P 2
x = 596: Testati (test bilateral) la nivelul de semnicatie de 5% daca media populatiei
este 0 (estimati  cu S).
R: z = 0; 995. Se accepta armatia.
9. La un examen se analizeaza
punctajul
P
Px 2obtinut de ecare candidat in parte. Se aleg 250
de candidati si gasim ca
x = 11872 si
x = 646193. Gasiti un interval de incredere de
nivel 90% pentru media m. Testati ipoteza H 0 : m = 49; 5 impotriva ipotezei H 1 : m < 49; 5
cu nivelul de semnicatie % si gasiti a.i. H 0 sa e respinsa.
R: (45; 6; 49; 4) ; > 4:
P
10. Un esantion de volum 8 dintr-o populatie normala are x = 4; 65,
(x x)2 = 0; 74.
Testati la un nivel de semnicatie de 2% daca media distributiei este 4,3.
R: Folositi statistica T= S=Xpnm 1 2 t(n
1), deoarece esantionul este mic (8 < 30);
tcalc = 3; 05 (test bilateral). Respingem armatia.
11. O masina produce ace de otel de lungume 2 cm. Se face o selectie de 10 ace si se
gaseste: 1,98; 1,96; 1,99; 2,00; 2,01; 1,95; 1,97; 1,96; 1,97; 1,99. Presupunand ca lungimile
acelor sunt normal distribuite, testati cu 1% daca masina functioneaza bine sau nu.
R: n = 10 < 30; folosim deci statistica T; tcalc = 3; 601: Nu functioneaza bine.
12. Se aleg 8 femei la intamplare si li se masoara nivelul de colesterol: 3,1; 2,8; 1,5; 1,7;
2,4; 1,9; 3,3; 1,6.
Vrem sa testam daca nivelul mediu de colesterol este 3,1.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

170

a) Presupunand ca selectia face parte dintr-o populatie normala aratati de ce testul T este
cel mai potrivit.
b) Aplicati testul asupra mediei 3,1 si gasiti cu nivelul de semnicatie de 2% daca media
3,1 este corecta sau nu.
c) Fasiti un interval de incredere de 90% pentru nivelul mediu al colesterolului.
R: b) Resping H 0 (m=3,1); c) (1,81;2,72).
13. Teoria prezice realizarea unui eveniment A cu probabilitatea p=0,4. Se experimenteaza
realizarea evenimentului A de 400 de ori. Din cele 400 de incercari A se realizeaza de 140 de
ori. Testati cu nivelul de semnicatie de 1% daca p este mai
sau nu decat 0,4.
 mica
P
s p
p
R: Se modeleaza cu proportia de succese: P s  N p; pq
;
Z=
2; 04: Nu.
pq ; zcalc =
n
n

14. Se cerceteaza proportia de studenti care au un calculator personal. Din 200 de studenti,
143 au un calculator personal. Testati cu un nivel de 5% ipoteza H 0 :p=75% (probabilitatea
ca un student sa aiba un calculator) contra ipotezei H 1 : probabilitatea p este mai mica decat
75%.
R: z calc = 1; 143: Se accepta.
15. Gasiti probabilitatile erorilor de tipul I si celor de tipul II in testarea urmatoarelor
ipoteze. Se stie ca o cutie poate sa contina e (H 0 ) 10 jetoane albe si 90 negre, e (H 1 ) 50
jetoane albe si 50 negre. Pentru a testa ipoteza H 0 impotriva ipotezei H 1 se aleg 4 jetoane
din cutie fara a le pune inapoi. Daca toate 4 jetoane sunt negre, accept H 0 . Altfel, o resping
(regula de decizie a testului).
Indicatie H 0 : cutia contine 10 jetoane albe si 90 negre.
H 1 : cutia contine 50 jetoane albe si 50 negre.
P(Eroare I)=P(resping H 0 j H0 este adevarata)=P(cel putinun jetoneste albjin cutie sunt
90 89 88 87
10 albe si 90 negre)=1-P(toate 4 sunt negrejin cutie sunt 10 albe si 90 negre)=1 100
 99  98  97 =
1 0; 652 = 0; 348:
P(Eroare II)=0; 059:
16. Pentru datarea specimenelor arheologice se foloseste faptul ca aceste specimene emit
particule radioactive. Numarul de particule emise in n minute are o distributie Poiison cu
parametrul n, unde  este un parametru ce depinde de varsta specimenului.
Se fac doua ipoteze asupra varstei unui specimen
H 0 : specimenul este de 7000 de ani (  = 0; 1)
H 1 : specimenul este de 15000 de ani (  = 4; 0)
S-a decis sa se contorizeze numarul X al particulelor radioactive emise in n minute de
specimen si
Acceptam H 0 ; daca X  1 (respingem H 1 )
Acceptam H 1 ; daca X  2 (respingem H 0 )
Daca n = 1; se cere: a) P(resping H 0 j H 0 =adevarata) si b) P(resping H 1 j H 1 =adevarata).

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

171

Presupunem acum ca P(resping H 1 j H 1 =adevarata) 0; 001; aratati ca numarul minim


de minute complete necesare inregistrarii este de 3 minute.
Pentru acest numar de 3 minute sa se calculeze P(resping H 0 j H 0 =adevarata).
Indicatie X  P o (n). Daca n = 1; X  P o () si a) P(resping H 0 j H 0 =adevarata)=P( X 
2 j X  P o (1; 0)). P(X  2) = 1 P(X = 0) P(X = 1) = 1 e 1 e 1 = 1 2e 1 =
1 0; 736 = 0; 264. Deci P(resping H 0 j H 0 = adevarata)= 0; 246:
b) P(resping H 1 j H 1 =adevarata)=P(X  1 j X  P o (4)) = 5e 4 = 0; 092: Daca P(resping
H 1 j H 1 =adevarata) 0; 001; atunci P(X  1 j X  P o (4n))  0; 01. Daca X  P o (4n) ;
atunci P (X  1) = e 4n (1 + 4n)  0; 001 si gasim n = 3 si P(resping H 0 j H 0 =adevarata)=
P (X  2 j X  P o (3  1)) = 1 4e 3 = 0; 801.
17. Se fac doua ipoteze
 1 asupra functiei densitate de probabilitate pentru o v.a. X:
(x + 1) ; 0 < x < 2
4
H 0 : f (x) =
 1 3 0; altf el
x ;0 < x < 2
4
H 1 : f (x) =
0; altf el
Se construieste urmatorul test. Se face o singura observatie asupra v.a. X si daca X <
k; cu k dat, 0 < k < 2; atunci H 0 se accepta. Altfel H 1 se accepta: a) Gasiti k a.i.
P(Eroare I ) = 0; 1. b) Cu valoarea lui k de la a) gasiti P(Eroare II )
Indicatie Faceti gracele pentru f (x) in ecare din cazurile
H 0 siR H 1 . P(accept H 1 j

2
H 0 =adevarata)= 0; 1 implica P X  k j f (x) = 14 (x + 1) = 0; 1 sau k 14 (x + 1) dx = 0; 1,
de unde k = 1; 86.
 R 1;86
P(Eroare II ) = P X < 1; 86 j f (x) = 41 x3 = 0 14 x3 dx = 0; 748.

18. Dintr-o populatie normala N (m; 36) se ia un esantion de volum 100. Un cercetator
vrea sa testeze ipotezele H 0 : m = 65, H 1 : m > 65: El decise sa foloseasca urmatoarea regula
de decizie:
accept H 0 daca media de selectie x  66; 5
resping H 0 daca x > 66; 5:
a) Gasiti P(Eroare I ) ;
b) Daca el foloseste alternativa H 1 : m = 67; 9; gasiti P(Eroare II ).
c) Ce valoare critica trebuie sa considere el pentru media de selectie daca vrea ca

P (Eroare I ) = P (Eroare II )

36
Indicatie a) Sub H 0 avem: X  N 65; 100
: El respinge H 0 daca x > 66; 5; adica

P X > 66; 5 = P (Z > 2; 5) = 0; 00621: Deci P(Eroare I ) = 0; 00621:

36
b) Daca el considera H 1 : m = 67; 9; atunci sub H 1 avem ca X  N 67; 9; 100
si
P (Eroare II ) = P (accept H 0 j H 1 este adevarata) = P X  66; 5 j m = 67; 9

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

172


P X  66; 5 j m = 67; 9 = P (Z  2; 333) = 0; 00982:


c) P X > x j H 0 este adevarata = P X  x j H 1 este adevarata ; deci x se aa la mijlocul segmentului [65; 67; 9], adica x = 66; 45.
19. Ingredientele care se amesteca pentru a forma betonul au asemenea proportii incat
rezistenta medie la rupere sa e de 2000N. Daca rezistenta medie la rupere cade sub 1800N
atunci compozitia trebuie schimbata. Distributia rezistentei de rupere este normal distribuita
cu deviatia standard de 200N.
Se iau esantioane pentru a se cerceta ipotezele:
H 0 : m = 2000N
H 1 : m = 1800N
Cate esantioane trebuie testate pentru ca sa avem:
P(Eroare I ) = = 0; 05 si
P(Eroare II ) = = 0; 1:


2
Indicatie Sub H 0 avem ca X  N (2000; 2002 ) ; deci X  N 2000; 200
n

Daca Z este cuantila ce corespunde lui =


05; avem ca Z = 1; 645 si valoarea

 0; 
2
200
corespunzatoare a lui X este a = 2000 1; 645 pn : Sub H 1 ; X  N 1800; 200
; deci,
n
 
p
pentru Z = 1; 282 ( = 0; 1) avem ca b = 1800 + 1; 282 200
: Din a = b gasim n = 8; 57;
n
deci vom lua 9 probe.

LECTIA
11. IPOTEZE STATISTICE. TESTE STATISTICE

173

20. Se aleg aleator esantioane de 400 seminte dintr-un anumit sortiment. Probabilitatea
ca o seminta sa germineze este egala cu . Sa notam cu X v.a. ce reprezinta numarul de
seminte care au germinat din totalul semintelor dintr-un esantion.
Folositi o aproximare convenabila a modelului probabilistic cu un model normal pentru a
determina:
a) P(X  340 j = 0; 9)
b) P(X  340 j = 0; 8)
c) Controlorul de calitate al semintelor stie ca este e 0; 8; e 0; 9: Sa presupunem
ca, de fapt, din totalul de 400 de semninte dintr-un esantion au germinat numai x. Controlorul decide ca valoarea lui este 0; 8 daca
Z = P (X  x j = 0; 8)

P (X  x j = 0; 9)

este pozitiv. Altfel el decide ca = 0; 9: Gasiti care este decizia controlorului pentru ecare
dintre cazurile x = 330; x = 340; x = 350:
R: a) 0,000577; b)0,00738; c)0,8; 0,8; 0,9.

Lectia 12
Testul neparametric 2
12.1

Principiul testului 2

Vom introduce acest test prin analiza atent


a a unui exemplu.
Exemplul 12.1 (ctiv) S-a facut un sondaj ntr-un oras din Romnia pe un esantion de
200 de tineri barbati de 27 de ani, n 1985, asupra situatiei pregatirii lor scolare. Ei au fost
mpartiti n 6 categorii dupa cum urmeaza:
1. cu studii superioare terminate;
2. cu studii superioare neterminate dar ncepute;
3. cu liceul de 12 ani terminat;
4. cu liceul de 12 ani neterminat dar nceput;
5. cu scoala generala de 8 ani terminata;
6. cu scoala generala de 8 ani nceputa si neterminata.
Acelasi sondaj se repeta (n aceleasi conditii) n 1995. Vom nota cu fo;j ; j = 1; 2; :::; 6
frecventa (absoluta) observata n 1995 pentru categoria j din cele 6 expuse mai sus. Vom
nota cu fs;j frecventa (sperata, la care ne asteptam si n 1995!) gasita n 1985. Iata tabelul
cu cele doua sondaje:
categoria j
1
2
3
4
5
6

Frecventa observata
n 1995, fo;j
35
40
83
16
26
0

Frecventa
observata n 1985, fs;j
36
34
64
26
34
6

200

200
174

LECTIA
12. TESTUL NEPARAMETRIC 2

175

Facem urmatoarea ipoteza statistica (inferenta statistica) H0 :<<distributia populatiei n


1995 este aceeasi cu distributia populatiei din 1985>>.
Este natural (de ce?) ca discrepanta sau deviatia dintre cele dou
a situatii s
a o m
asur
am prin suma
6
X
(fo;j
j=1

fs;j )2

(12.1)

fs;j

Se arat
a (Teorema lui K. Pearson) c
a pentru n mare (cel putin 20-25), n cazul nostru
n=200, aceast
a sum
a tinde c
atre valoarea distributiei 2 cu 6-1 grade de libertate n ipoteza c
a
H0 este adev
arat
a: avem aceiasi distributie, adic
a distributiile celor dou
a sondaje concord
a. n
general, dac
a am repartizat elementele din selectie n J clase, pentru un volum mare (n  25)
suma (12.1) cu J n loc de 6, este aproximativ egal
a cu valoarea distributiei 2 cu J 1 grade
de libertate.
Ipoteza H0 are sanse s
a e adev
arat
a dac
a valoarea sumei (12.1) este mic
a. G
asim
2 =

(35

36)2 (40 34)2


(0 6)2
+
+  +
= 18; 46
36
34
6

C
aut
am n Tabelul III pe linia corespunz
atoare  = 5 (grade de libertate) si g
asim c
a
16,749618.4620,515.
Dar
P (16; 7496  2  20; 515)
= F (20; 515) F (16; 7496) = 0; 999

0; 995 = 0; 004

deci extrem de mic


a. Prin urmare, este foarte putin probabil ca cele dou
a distributii s
a
concorde. Deci se respinge ipoteza H0 cu probabilitatea 1-0,004=0,986.
Retinem din Exemplul 1 c
a ori de cte ori vrem s
a facem o ipotez
a asupra probabilit
atii ca
2
dou
a distributii s
a concorde putem folosi testul  , adic
a metodologia din 12.1, cu conditia
ca num
arul observatiilor s
a e mare (n  25), grupele de divizare ale sondajului s
a e disjuncte
si num
arul lor k s
a respecte urm
atoarele reguli:
25
100
200
400
1000

<
<




n  100; k 2 (10; 15)


n < 200; k 2 (15; 18)
n < 400; k 2 (18; 20)
n < 1000; k 2 (25; 30)
n < 2000; k 2 (35; 40)

Aceste reguli au fost deduse din practic


a si nu teoretic.

LECTIA
12. TESTUL NEPARAMETRIC 2

176

Prezent
am acum situatia general
a n care putem utiliza testul de concordanta 2 . Facem
urm
atoarea ipotez
a: H0 :<<Presupunem c
a populatia P are o functie de probabilitate g(x),
specicat
a (de exemplu normal
a cu m = 0 si  = 2)>>.
Vrem s
a folosim testul 2 pentru a m
asura ct
a dreptate avem s
a presupunem acest
lucru pornind de la un sondaj de volum n: x1 ; x2 ; :::; xn din populatia P. Dup
a regulile de
mai sus mp
artim datele x1 ; x2 ; :::; xn n J grupe disjuncte. Not
am cu  j frecventa absolut
a n
grupa j(num
arul acelor xi care se a
a n grupa j). Not
am cu pj probabilitatea teoretic
a
(obtinut
a cu ajutorul functiei de probabilitate g(x); sau cu ajutorul functiei de repartitie
corespunz
atoare G(x)) ca un element x din populatia P s
a se ae n grupa j. Atunci frecventa
teoretic
a este npj , si suma care m
asoar
a deviatia din formula (12.1) devine:
d=

J
X
( j
j=1

npj )2
npj

(12.2)

Calcul
am acest num
ar d. Privim Tabelul III si ncerc
am s
a estim
am probabilitatea ca 2
s
a aib
a valoarea d. De obicei se xeaz
a un prag de semnicatie 2 (0; 1). Se caut
a cuantila
2
2
 corespunz
atoare acestui prag, adic
a acea valoare a lui  astfel nct functia de repartitie
a lui 2 s
a aib
a valoarea . Cum P(2  2 ) = , din denitia functiei de repartitie, vom
face urm
atorul rationament:
 dac
a d  2 , vom accepta ipoteza H0 (distributia populatiei este de forma prescris
a) cu
pragul de semnicatie .
 dac
a d < 2 , vom respinge ipoteza H0 cu pragul de semnicatie .
Acesta este testul de concordant
a 2 . De obicei se ia mic: =0,05; 0,01; 0,001.
Exemplul 12.2 Se fac 500 de masuratori asupra erorilor date de un aparat de masura de la
bordul unui avion. Ele se mpart n 8 intervale consecutive. Freventele absolute cu care apar
aceste erori pe un interval sunt date n urmatorul tabel:
Ij : [ 4; 3) [ 3; 2) [ 2; 1) [ 1; 0) [0; 1) [1; 2) [2; 3) [3; 4)
j :
6
25
72
133
120
88
46
10
Utiliznd testul 2 sa se verice cu pragul de semnictie = 0; 95 daca distributia erorilor
este normala cu media estimata la m = 0; 168 si dispersia estimata la  2 = 14482 .
Solutie Aici avem un exemplu mai complicat deoarece P
cei doi parametri auPdeja estim
ari
1
1
date. Vom avea mereu dou
a relatii de leg
atur
a: 0; 168 = 500
xi si 14482 = 500
(xi 0; 168)2 .
Deci numarul gradelor de libertate va sc
adea cu doi. Prin urmare 2 va avea 8-1-2=5
grade de libertate.
Calcul
am probabilitatea teoretic
a pe ecare interval [xi ; xi+1 ):




xj+1 m
xj m

pj = 



LECTIA
12. TESTUL NEPARAMETRIC 2

177

, unde  este functia lui Laplace. G


asim pentru npj urm
atoarele valori (corespunz
atoare
intervalelor precizate deja n tabelul de mai sus): 6,2; 26,2; 71,2; .122,2; 131,8; 90,5; 32,8;
8
P
(vj npj )2
10,5. Calcul
am d =
= 3; 94:
npj
j=1

Cuantila 20;95 pentru 5 grade de libertate este 11,0705 (vezi Tabelul III). Deci P(2 
11; 0705)=0,95,adic
a P(2 > 11; 0705)=0,05.
Cum d = 3; 94 < 11; 0705 accept
am ipoteza de normalitate cu probabilitatea 0,95 (adic
a
cu 95%), sau cu pragul = 0; 05.
Vom prezenta acum testul 2 (se citeste chi p
atrat sau chi doi) dintr-un punct de vedere
mai general.
Fie evenimentele fA1 ;A2 ; :::;Ar g P
cu probabilitatea pi =P(Ai ), i = 1; r, cunoscute mai
mult sau mai putin. Putem cere ca
pi = 1, adic
a fA1 ;A2 ; :::;Ar g s
a e o descompunere a
2
evenimentului singur. n esent
a testul  si propune s
a testeze o ipotez
a oarecare H privind
probabilit
aile p1 ; :::; pr . Se fac sondaje de volum mare pentru ecare Ai , i = 1; r. Se noteaz
a
cu Yi num
arul acelor probe care sunt favorabile evenimentului
A
.
i
P 0
Cazul I Se dau numerele p01 ; p02 ; :::; p0r  0 cu
pi = 1 si se consider
a ipoteza H: p1 = p01 ,
0
0
a de concordant
a). Dac
a H este adev
arat
a statistica (Helmertp2 = p2 ; :::; pr = pr (problem
Pearson)
!
X (Yi np0 )2
X Y2
i
i
T =
=
n
(12.3)
0
0
np
np
i
i
i
1ir

are practic (adic


a pentru n mare) distributia 2 P
cu r 1 grade
ata
Pde libertate. Pentru a ar
ultima egalitate n (12.3) am folosit egalit
atile Yi = n si
pi = 1. Testul const
a n a
respinge ipoteza H dac
a T ia o valoare semnicativ prea mare relativ la 2 (vezi exemplul
12.1). De exemplu dac
a se dau v.a. X si legea Q cunoscut
a, pentru a testa dac
a H: X are
distributia Q, descompunem dreapta real
a R n subintervale disjuncte: R =A1 [A2 [    [Ar ,
consider
am evenimentele (X 2 Ai )i=1;r si punem p0i =Q(Ai ).
Cazul II Fie acum r functii pozitive f1 (x1 ; :::; xs ) ; :::; fr (x1 ; :::; xs ) de variabile x1 ; :::; xs
cu s < r, astfel nct f1 (x1 ; :::; xs ) +    + fr (x1 ; :::; xs ) = 1. Consider
am ipoteaza H: Exist
a
numerele 1 ; :::; s (estimate printr-un procedeu oarecare) astfel nct pi = fi (1 ; :::; s ) pentru
1  i  r. Dac
a H este adev
arat
a se pot deni (plecnd de la valorile Y1 ; :::;Yr ) estimatori
b1 = gi (Y1 ; :::; Yr ), 1  i  s, un estimator pentru i . De
convenabili pentru 1 ; :::; s . Fie 


b
b
aici g
asim estimtori convenabili ai probabilit
atilor pi : pbi = fi 1 ; :::; s pentru 1  i  r.
Statisica
!
X (Yi nb
X Y2
pi )2
i
T =
n
(12.4)
=
nb
p
nb
p
i
i
i
1ir
are practic o distributie 2 cu r s 1 grade de libertate (apar nc
a s leg
aturi datorit
a
relatiilor de estimare). Testul const
a n a respinge ipoteza H dac
a T ia o valoare semnicativ

LECTIA
12. TESTUL NEPARAMETRIC 2

178

prea mare relativ la 2 (vezi Exemplul 2). Se pune acum problema de a g


asi estimtori buni
pentru 1 ; :::; n . Iat
a cteva reguli bazate pe ns
asi denitia formulei de deviatie (HelmertPearson) dat
a n (12.1) si (12.2) si pe alte notiuni ce apar n Lectia 9.
b1 ; :::; 
bs acele functii de Y1 ; :::;Yr care minimizeaz
Regula I (2 minim) Se iau pentru 
a
expresia (deviatia):
d=

X (Yi
i

nb
pi )2
= min
nb
pi

(12.5)

b1 ; :::; 
bs care veric
adic
a acele 
a ecuatiile diferentiale.

1:

X Y2 @ pbi
i
= 0; 0  j  s
(12.6)

2
bj
pb 
1ir i


P
P
b1 ; :::; 
bs = 0si se foloseste faptul c
Se pune conditia grad d 
a @@bpbi = 0;deoarece j pbj =
i

Regula II (verosimilitatea maxim


a) Dup
a un rationament asem
an
ator cu acela din
b
b
Lectia 9 (Principiul verosimilit
atii maxime) se deduce c
a 1 ; :::; n trebuie s
a verice ecuatiile
diferentiale:
X Yi @ pbi

=0
bj
p
b
i
@

1ir

(12.7)

pentru 1  j  s.
Regula III n locul formulelor (12.6) se pot folosi formulele:
X pbi @ pbi

=0
b
Y
1ir i @ j

(12.8)

pentru 1  j  s
(2 minim modicat).
Aceast
a distributie att de folosit
a are pentru diverse valori ale lui n, densit
atile ca n
gracul urm
ator:

LECTIA
12. TESTUL NEPARAMETRIC 2

179

0.175
0.15
0.125
0.1
0.075
0.05
0.025

10

15

20

25

30

Densit
atile 2 pentru n=4, 6, 8, 10, 12, 14, 16, 18, 20
S
a aplic
am acum cele de mai sus la cteva tipuri de probleme.

12.1.1

Teste asupra formei unei distributii

Fie P=Q(1 ; :::; s ) o familie de legi pe R care depinde de s parametrii 1 ; :::; s si X o v.a.
aleatoare. Pentru a testa ipoteza: H: X se supune unei anume legi din familia P, mp
artim
pe R n r subintervale: R =A1 [    [Ar , si punem fi (1 ; :::; s ) =Q(1 ; :::; s ) (Ai ).
Exemplul 12.3 Fie X o v.a. ce poate lua valorile 0, 1, 2,..., k,.... Testam ipoteza: H: X se
supune unei legi Poisson.
Familia legilor Poisson depinde de un singur parametru  > 0. Ca estimator bun pentru
b media de selectie (eventual dup
 se alege =
a grupaje convenabile). Avem s = 1 n acest
caz.

Exemplul 12.4 Vrem sa testam pentru o v.a. X continua urmatoarea ipoteza H: X se supune
unei legi gaussiene. Aici P este familia N(;  2 ) care depinde de doi parametri:  si  2 . Dupa
cum stim este convenabil sa estimam media  cu media de selectie si pe  2 cu S0 2 . Aici s = 2.

12.1.2

Teste de independent
a

Fie X si Y dou
a v.a. denite pe aceeasi categorie de probe. Pentru a testa ipoteza H: X si
Y sunt independente, se descompune R n dou
a partitii: R =E1 [    [Ea =F1 [    [Fb si
consider
am cele r = a  b evenimente: X2Ei si Y2Fj , pentru 1  i  a, 1  j  b.

LECTIA
12. TESTUL NEPARAMETRIC 2

180

Se face un num
ar mare de sondaje independente de tipul (X1 ,Y1 ),... (Xn ; Yn ). Not
am cu
Nij num
arul realiz
arilor X2Ei si Y2Fj . Se introduc statisticile
e i =
N

Nij

1jb

T = n


X Nij
i;j

e j =
N

(12.9)

Nij

1ia

1e e
N N
n i j

e i N
e j
N

X
2

=n

"

X N2ij
e i N
e j
N
i;j

(12.10)

Dac
a H este adev
arat
a, T se supune practic unei legi 2 cu (a 1)(b 1) grade de libertate.
Testul const
a n a respinge ipoteza H dac
a T ia o valoare semnicativ prea mare relativ la
e i N
e j este un estimator bun pentru
2 . Dac
a ipoteza H este vericat
a num
arul pbij = n12 N
probabilitatea pij =P(X 2 Eisi Y 2 Fj ).

12.1.3

Teste de omogenitate

Se consider
a t variabile aleatoare X1 ; :::;Xt . Pentru a testa ipoteza H: X1 ; :::;Xt satisfac aceeasi
lege, se face partitia R =A1 [A2 [    [Ar , pentru ecare i se ia un esantion (Xi1 ; :::; Xini ) de
volum mare, xi 2Xi , n = n1 +  +ni , v.a. X11 ; :::;Xini ind considerate independente. Pentru
1  i  t se noteaz
a Yij num
arul de indici k astfel nct Xik 2Aj . Se introduc statisticile

2
"
#
ni e
Y
X Yij
X
X Y2ij
n j
e ij
e j =
Y
T =
Y
=n
1 :
(12.11)
ni e
e j
ni Y
Yj
1it

1it
1ir

i;j

Dac
a H este adev
arat
a, T se supune practic unei legi 2 cu (t 1) (r 1) grade de libertate. Testul const
a n a respinge H atunci cnd T ia o valoare semnicativ mare relativ la 2 .
e j este un estimator bun pentru P(Xi 2Aj ) si nici nu depinde
Dac
a H este adev
arat
a pbj = n1 Y
de i. Dac
a r = 2 (12.10) devine
n2 X Y2i1
T =
e 1 Y
e 2
ni
Y
i

e 1
Y
e 2
Y

(12.12)

Exemplul 12.5 Teoria lui Mendel asupra ereditatii ne previne ca daca crestem 2 tipuri de
plante va trebui sa obtinem produse de tipul A, B, C, D n proportie de 9, 3, 3 si 1. Dupa
experiente se observa ca s-au obtinut 154 produse de tipul A, 44 de tip B, 63 de tip C si 21
de tip D. Ce parere aveti n acest caz de teoria lui Mendel (prag " = 0; 05)?
Solutie Aici evenimentele A1 , A2 , A3 , A4 sunt A, B, C si D. Teoria lui Mendel prevede c
a
9
3
3
1
p1 = 16
, p2 = 16
, p3 = 16
, p4 = 16
(deoarece 9+3+3+1=16). Suntem n Cazul I al testului 2

LECTIA
12. TESTUL NEPARAMETRIC 2

181

9
3
3
1
cu: p01 = 16
, p02 = 16
, p03 = 16
, p04 = 16
. Experientele conduc la , Y1 = 154, Y2 = 44, Y3 = 63,
Y4 = 21, n = 154 + 44 + 63 + 21 = 282.
Dac
a U este variabila 2 cu r 1 = 3 grade de libertate, avem c
a P(U 7; 81)=0,05. Testul
2
de prag 0,05 se scrie: Respinge H()   7; 81. n cazul nostru avem np01 , np02 = np03 = 53,
np04 = 18 si

159)2 (44 53)2 (63 53)2 (21 18)2


+
+
+
= 4; 06 < 7; 81
159
53
53
18
. Se accept
a deci teoria lui Mendel ca ind adev
arat
a cu 0,95=1-0,05.
2 =

(154

Exemplul 12.6 Fie p probabilitatea pentru ca o piesa din echipamentul fabricat de o anumita
masina sa aiba defecte. Vrem sa testam ipoteza H: p = 0; 2. Pentru aceasta luam 100 de piese
si constatam ca 22 dintre ele au defecte. Care este probabilitatea, daca ipoteza este adevarata,
pentru ca 2 sa aiba o valoare mare? Cum interpretati acest lucru?
Solutie Aici A1 =succes si A2 =esec. Fie p1 = p =P(A1 ) si p = 1 p = q =P(A2 ). Vom
arul de succese n cursul a n ncerc
ari(=Y) si
avea p01 = p0 si p02 = q 0 = 1 p0 . Fie Y1 =num
Y2 =n Y. Avem
T =

(Y

np0 )2 [n
+
np0

Y n (1 p0 )]2
(Y np0 )2
=
= Z2
0
0
0
n (1 p )
np q

Y np
2
at
a deci urm
atoarea form
a: Respinge H() (T  y) ; sau dac
a
unde Z= p
0 0 . Testul  cap
p np q
jZj  y. Se stie c
a dac
a H este adev
arat
a Z este practic gaussian
a redus
a (teorema limit
a
central
a).
(22 20)2
Aplicatie numeric
a: p0 = 0; 2, n = 100, Y= 22. Valoarea lui Z2 este Z2 = 1000;20;8
= 41 .
q
Probabilitatea ca variabila gaussian
a redus
a s
a ia o valoare absolut
a > 14 = 0; 5 este 0,616.
Se accept
a deci aceast
a ipotez
a H.

Exemplul 12.7 O v.a. X ia numai valorile 0, 1, 2, 3 ,4. Vrem sa testam daca aceasta v.a.
se spune legii binomiale cu p = 13 si n = 4 (numarul de probe). S-au facut pentru aceasta 324
ncercari independente care au condus la urmatoarele rezultate, fi ind frecventa absoluta a
valorii i:
i 0
1
2 3 4
fi 67 122 94 38 3
Ce concluzie trageti?
i
4 i
Solutie Fie Ai evenimentul: X=i; P(Ai )=Ci4  31  23
, pentru 0  i  4. Avem
16
24
8
1
0
0
0
deci p00 = 81
; p01 = 32
;
p
=
;
p
=
;
p
=
;
Y
=
67;
Y
0
1 = 122; Y2 = 94; Y3 = 38;
2
3
4
81
81
81
81
Y4 = 3. Deoarece Y4 este mic se grupeaz
a A3 cu A4 si g
asim A0 , A1 , A2 si B=(A3 [ A4 ) cu
p00 , p01 , p02 si q 0 = p03 + p04 . Experienta a condus la Y0 , Y1 , Y2 si Z=Y3 +Y4 . Se obtine 2 =1,15.
Probabilitatea ca 2 cu 4-1=3 grade de libertate s
a ia o valoare de aceast
a m
arime este > 0; 1.
Deci ipoteza se accept
a.

LECTIA
12. TESTUL NEPARAMETRIC 2

182

Exemplul 12.8 Gazul de esapament al unui motor contine particule solide. Se considera
ipoteza H: numarul X al acestor particule continut ntr-un volum mic V de gaz se supune
unei legi Poisson. Pentru a testa aceasta ipoteza luam 400 esantioane de acelasi volum V
si se gasesc 1872 de particule reprezentate dupa urmatorul tabel (ni reprezinta numarul de
esantione care au continut i particule):
i
ni

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 20 43 53 86 70 54 37 18 10 5 2 2 0 0

Aceste rezultate permit


a accept
am ipoteza H?
P oare s
Solutie X = n1
=
4;
68. Se grupeaz
a clasele corespunz
atoare lui i = 0 si
ini = 1872
400
i = 1, ct si clasele corespunz
atoare lui i  10. Se obtin n nal 10 clase numerotate de la 1
la 10 care au probabilit
atile estimate prin pbi :
i
4;68
pbi = e
(1 + 4; 68), pbi = e 4;68  (4;68)
, pentru 2  i  9, pbi = 4;68
pbi 1 , pentru
i!
i
3  i  9.
P
pbi . Avem urm
atorul tabel:
si pb10 = 1
1i9

i
Yi
0 sau 1 20
2
43
3
53
4
86
5
70
6
54
7
37
8
18
9
10
 10
9

pbi
0,0527
0,1016
0,1585
0,1855
0,1736
0,1354
0,0905
0,0529
0,0275
0,0218

nb
p1
21,1
40,6
63,4
74,2
69,4
54,1
36,2
21,1
11,0
8,7

(Y i nb
pi )2
nb
pi

0,0552
0,1372
1,7060
1,8764
0,0044
0,0004
0,0176
0,4720
0,0908
0,0152
4,3772

Deci suma termenilor de pe ultima coloan


a este chiar 2  4; 38. Probabilitatea pentru
ca o variabil
a 2 cu r s 1 = 10 1 1 = 8 grade de libertate s
a e  4; 38 este > 0; 1.
Prin urmare H se va accepta.
Exemplul 12.9 Vrem sa examinam daca aptitudinile manuale ale unui individ sunt independente de vedere. Pentru aceasta se denesc 2 caractere X si Y:X ia valorile 1, 2 sau 3 care
corespund faptului ca individul este mai abil cu mna stnga, la fel de abil cu ambele mini,
sau mai abil cu mna dreapta. Y ia valorile 1, 2 sau 3 dupa cum individul vede mai bine cu
ochiul stng, cu ambii ochi sau vede mai bine cu ochiul drept. Facem deci ipoteza ca X si Y
sunt v.a. independente. n tabelul urmator avem rezultatele observatiilor facute asupra a 413

LECTIA
12. TESTUL NEPARAMETRIC 2

183

persoane. De exemplu, am gasit 20 persoane cu X=2 si Y=3, etc.


Y
X
1
2
3

34 62 28
27 28 20
57 105 52

.
Solutie Cu notatiile din Aplicatia 2 din aceast
a lectie avem
e 1 = 34 + 62 + 28 = 124
N
e 2 = 75; N
e 3 = 214
N

e 1 = 34 + 27 + 57 = 118
N

e 2 = 196; N
e 3 = 52in = 34 + 62 +    + 52 = 413:
N
e i N
e j avem tabelul:
Pentru numerele n1 N
j

i
1
2
3
si

35 59 30
21 35 18
61 101 52

2 = (34 3535) +    + (52 5252) = 3; 5. Cum v.a. 2 are (a 1) (b


libertate, ipoteza de independent
a se accept
a (vezi Tabelul ?).

1) = 2  2 = 4 grade de

Exemplul 12.10 Inteligenta unui copil se claseaza n 6 nivele: de la A foarte slaba, pna
la F foarte buna. S-au clasat 1725 copii la ntmplare alesi din 8 scoli numerotate de la 1
la 8 si s-au obtinut rezultate urmatoare:

LECTIA
12. TESTUL NEPARAMETRIC 2
nivelul
scoala
1
2
3
4
5
6
7
8

184

6
14

14
33
45

18

18 36 43 39 4
25 52 87 54 13
1
8 37
19 60 94 73 12
69 132 187 85 14
50 69 72 66 15
6 20
8
9 1
32 37 36 12

Aceste rezultate ne permit oare s


a accept
am ipoteza dup
a care repartitia nivelelor de
inteligenta este aceeasi n oricare dintre scoli?
Solutie Este vorba despre un test de omogenitate (vezi Aplicatia 3 ). Aici t = 8, r = 6,
numerele Yij se a
a n tabel la intersectia liniei i cu coloana j, de exemplu Y23 = 52. Avem
n1 = 6+18+36+43+39+4 = 146, n2 = 243, n3 = 46, n4 = 272, n5 = 520, n6 = 317, n7 = 44,
e 1 = 6 + 14 + 14 + 33 + 44 + 18 = 130, Y
e 2 = 219, Y
e 3 = 407, Y
e 4 = 535,
n8 = 135. La fel Y
2
2
Y
Y
e 5 = 375, Y
e 6 = 59. Calcul
Y
am acum numerele n Ye11 = 0; 001897,..., n Ye85 = 0; 002844 si
1 1
8 5
2
P Y ij
2
suma lor
= 1; 0784. De aici g
asim c
a  = 1725  (1; 0784 1) = 135. Variabila
e
nY
i;j
2

j

aleatoare  cu (t 1)(r 1) = 35 grade de libertate are o probabilitate mai mic


a dect 0,001
ca s
a e  135. Deci ipoteza va trebui categoric respins
a.

12.2

Rezumat

Fie X o v.a. ce guverneaz


a populatia P. Nu cunoastem legea statistic
a a v.a. X si vrem
s
a test
am dac
a aceast
a lege este o lege cunoscut
a Q (dat
a). Pentru aceasta consider
am un
esantion de volum n (n  25): x1 ; x2 ; :::; xn . Grup
am aceste date n intervale J1 ; J2 ; :::; Jr
astfel nct Ji \ Jj = , pentru i 6= j si J1 [ J2 [    [P
Jr = R s
a ia valoarea n intervalul Ji .
Este clar c
a nu cunoastem aceste pi -uri. Stim doar c
a
pi = 1. Fie p0i probabilitatea ca v.a.
X s
a ia valoarea n intervalul Ji dac
a am presupune c
a X are legea Q. Aceste numere se pot
calcula folosind tabelele distributiei cunoscute Q. Not
am cu Yi num
arul acelor xj -uri care se
a
a n intervalul Ji . Yi este de fapt frecventa absolut
a empiric
a de selectie pe intervalul Ji .
Frecventa absolut
a teoretic
a (potrivit legii Q) pe intervalul Ji este egal
a cu np0i . Ipoteza pe
0
care o facem este urm
atoarea: H: pi = pi , (8) i = 1; r.
r Y np0 2
P
( i i)
Construim acum statistica Helmert-Pearson: T=
. Ea m
asoar
a deviatia legii
np0
i=1

reale a v.a. X de la legea presupus


a Q. Pentru n mare T tinde s
a aib
a distributia 2 (Pearson)
cu r 1 grade de libertate dac
a cumva X ar avea ntr-adev
ar legea de distributie Q.
 Calcul
am num
arul T n cazul nostru si l not
am cu  .

LECTIA
12. TESTUL NEPARAMETRIC 2

185

 Fie acum 2 (0; 1) (de odicei se ia mic =0,05; 0,01; 0,001), un num
ar real dat pe
care l vom numi prag de semnicatie.
a aceea valoare pentru care P(2 < 2 )=
 Fie 2 cuantila de ordin pentru v.a. 2 , adic
(vezi gura )

 Testul 2 functioneaz
a astfel:
Daca valoarea calculata din selectie  > 2 vom accepta ipoteza H cu pragul de
semnicatie , adic
a este foarte probabil ca ipoteza s
a e adev
arat
a.
Daca valoarea calculata   2 vom respinge ipoteza H cu pragul de semnicatie
.
Aceasta este testul 2 simplu (Cazul I)
 Dac
a ns
a legea Q are s parametri de estimat tot din selectie, atunci va trebui s
a micsor
am
num
arul gradelor
a s
a avem r s 1 grade de libertate, deoarece apar
P de libertate cu s, adic
s + 1 leg
aturi:
pi = 1 si cele s leg
aturi de estimare.

12.3

Exercitii rezolvate

1. Se arunca 4 monede simultan de 160 de ori. Se observa de ecare data de cate ori a aparut
capul.
x =de cate ori poate sa apara capul,
0 1 2 3 4
cand aruncam o data cele 4 monede
f =de cate ori s-a realizat x in cele 160
5 35 67 41 12
de aruncari x in cele 160 de aruncari
Sa se testeze ipoteza H0 : monedele nu sunt falsicate, cu pragul de 5%.
Solutie Fie X v.a. care ia valorile x = de cate ori apare capul cand aruncam o data
cele 4 monede (sau de 4 ori aceeasi moneda). Avem ca:

LECTIA
12. TESTUL NEPARAMETRIC 2

186

x
4 x
4
P (X = x) = C4x  12  12
= 12  C4x :
Prin urmare frecventa absoluta sperata (daca presupunem H0 adevarata) de aruncari pentru x este 160P (X = x) : Obtinem deci urmatorul tabel:
x
0
1
2
3
4
P (X = x)
1/16 4/16 6/16 4/16 1/16
Ei =fr. abs. sperata cand x = i
10
40
60
40
10
sperata cand x = i
Oi =fr. abs.
5
35
67
41
12
observata cand x = i
(Oi Ei )2
2,5
0,625 0,817 0,025 0,4
Ei
P
2
Folosim testul  cu  =5 clase-1 restrictie ( Oi = 160) =4 grade de libertate.
5
P
(Oi Ei )2
Avem deci 2calc =
= 4; 365 < 20;05 (4) = 9; 49: Prin urmare acceptam H0 cu
Ei

pragul de 95%.

i=1

2. La o fabrica de caramizi se aleg 500 de pachete de cate 5 caramizi la intervale regulate


de-a lungul unei saptamani si se numara de ecare data cate caramizi defecte sunt in ecare
pachet. S-au obtinut urmatoarele rezultate:
x =nr.de caramizi defecte
0
1
2
3 4 5
intr-un singur pachet
f =nr. de pachete care
170 180 120 20 8 2
au avut x caramizi defecte
Testati cu ajutorul testului 2 cu nivelul de semnicatie 5% daca numarul caramizilor
defecte urmeaza legea binomiala.
Solutie Deoarece in legea binomiala Bin(n = 5; p) nu stim pe p; trebuie sa-l estimam din
esantion:
P
np = x = Pffx = 1; 044; deci p = 0; 2088.
Am presupus ca H0 : legea este binomiala este adevarata. Atunci v.a. X = nr.
caramizilor defecte intr-un esantion de 5 caramizi va binomiala cu n = 5 si p = 0; 2088 
probabilitatea ca o caramida luata la intamplare sa e defecta. Avem ca frecventa absoluta
sperata de i caramizi defecte este Ei = 500  P (X = i) = 500  C5i (0; 2088)i (0; 7912)5 i ,
unde 0,7912=1-0,2088, iar i = 0; 1; 2; 3; 4; 5: Cum E4 = 4 si E5 = 0; clasele E3 ; E4 ; si E5 le
cumulam intr-o singura clasa renotata cu E3 (x  3) : La fel, cumulam pe O3 = 20; O4 = 8 si
O5 = 2 intr-o noua clasa O3 (x  3). Obtinem deci urmatorul tabel:
x
0
1
2
x3
Ei =fr. abs. sperata cand x = i;
155
205
108
32
daca acceptam legea binomiala
Oi =fr. abs. observata cand x = i;
170
180
120
30
data in datele problemei
2
(Oi Ei )
1,452 3,049 1,333 0,125
Ei

LECTIA
12. TESTUL NEPARAMETRIC 2

187

P
Folosim testul 2 cu  = 4 clase-2 restrictii( Oi = 500 si x = 1; 044 este impus prin
estimare)= 2 grade de libertate.
4
P
(Oi Ei )2
Avem deci 2calc = 5; 959 =
< 20;05 (2) = 5; 99: Acceptam deci ipoteza H0 (reparEi
i=1

titia este binomiala) cu pragul de semnicatie 5%. Avem o oarecare neincredere deoarece 5,959
este prea aproape de valoarea critica 5,99. Se indica sa se repete experienta pentru mai multa
siguranta.

3. In 100 de meciuri o echipa de fotbal a inscris goluri dupa cum urmeaza:


x =nr. de goluri
0 1 2 3 4 5 6 7
inscrise intr-un meci
f =nr. de meciuri in care
14 18 29 18 10 7 3 1
echipa a inscris x goluri
Testati cu 2 cu 5% daca golurile inscrise se repartizeaza dupa o lege Poisson.
Solutie Deoarece nu cunoastem pe  in legea lui Poisson P o () ; il vom estima din media
de selectie:
P
x = Pffx = 230
= 2; 3; deci   x = 2; 3:
100
2;3

P (X = x) = e x!(2;3) ; x = 0; 1; 2; :::.
Calculam Ei = 100P (X = i)  frecventa absoluta sperata (teoretica) a i goluri inscrise
de echipa in cele 100 de meciuri. Aici P (X = i) este probabilitatea ca echipaPsa inscrie i
goluri intr-un singur meci. Folosim testul 2 cu  = 6 clase - 2 restrictii ( Oi = 100 si
x = 2; 3 este impus)=4 grade de libertate. Teoretic avem 9 clase: E0 ; E1 ;..., E7 ; E8 (i  8):
Cum E5 = 5; 4; E6 = 2; 1; E7 = 0; 7; E8 = 0; 2; cumulam clasele E5 ; E6 ; E7 si E8 intr-una
singura, desemnata tot cu E5 = 8; 4: Vom obtine tabelul:
x
0
1
2
3
4
5
Ei
10,0 23,1 26,5 20,3 11,7 8,4
Oi
14
18
29
18
10
11
(Oi Ei )2
1,6 1,126 0,236 0,261 0,247 0,805
Ei
5
P
(Oi Ei )2
Folosim deci testul 2 cu 4 grade de libertate. Cum 2calc =
= 4; 275 <
Ei
i=0

20;05 (4) = 9; 49 vom accepta ipoteza H0 : distributia golurilor urmeaza o lege Poisson cu
nivelul de incredere de 95%.

12.4

Exercitii

1. Se testeaza greutatea unui grup de 50 de barbati si se obtin valorile (n Kg):

LECTIA
12. TESTUL NEPARAMETRIC 2

66
96
79
86
73

78
78
62
84
65

82
89
67
75
88

75
61
97
81
87

94
75
78
68
60

188

77
95
85
63
62

69
60
76
62
71

74
79
65
75
78

68
83
71
76
85

60
71
75
77
72

Folositi testul 2 pentru a decide cu pragul de =0,90 daca populatia este normala cu
media 75 si dispersia 625. Faceti acelasi lucru dar cu media si dispersia estimate din selectie.
mpartiti esantionul n zece intervale.
2. Se urmaresc accidentele mortale pe o portiune dintr-un drum national timp de 100 saptamni. Timp de 45 de saptamni nu a fost nici un accident mortal. n 29 de saptamni s-a
produs un accident, n 17 saptamni 2 accidente, iar n 9 saptamni au avut loc 3 accidente.
Folositi testele 2 si K-S pentru a vedea, cu pragul =0,90, daca distributia accidentelor
urmeaza modelul Poisson sau nu. Parametrul se estimeaza din selectie.
3. Se considera o prisma care are ca baze doua triunghiuri echilaterale B 1 si B 2 si ca fete
laterale A1 , A2 si A3 . Se arunca prisma de 500 de ori si se constata ca prisma a cazut de :
Y 1 = 111 ori pe fata A1
Y 2 = 113 ori pe fata A2
Y 3 = 118 ori pe fata A3
Z 1 = 81 ori pe fata B 1
Z 2 = 77 ori pe fata B 2 . Testati ipoteza dupa care cele 3 fete laterale si cele 2 baze au
aceeasi probabilitate 51 (pragul " = 0; 05 si " = 0; 01).
Indicatie. Avem Cazul I: r = 5 si p01 = p02 =    = p05 = 15 . Gasim 2 =15,04. Analiznd
tabelul vedem ca trebuie sa respingem ipoteza pentru cele doua praguri.
4. Vrem sa testam ipoteza H dupa care o anumita v.a. X este gaussiana cu media 1,1 si
dispersia 0,2. S-au facut 1000 de probe independente care au condus la rezultatele urmatoare:
0,6 0,7 0,8 0,9
1
1,1 1,2 1,3 1,4 1,5
26 51 107 168 200 193 138 80 29
8
adica X a luat de 26 de ori o valoare mai mica dect 0,6 si de 51 de ori o valoare cuprinsa
n intervalul [0; 6; 0; 7), etc. Testati ipoteza H cu pragurile " = 0; 05, " = 0; 01 si " = 0; 001.
Indicatie Se partitioneaza R dupa cum indica problema. Se gaseste 2 = 13; 97. Folosim
tabelul distributiei 2 cu 10 1 = 9 grade de libertate. Ipoteza trebuie respinsa cu pragul 0,05
si 0,01, dar trebuie sa o acceptam cu pragul 0,001.
5. Se testeaza ipoteza dupa care culoarea ochilor este independenta de culoarea parului.
Pentru aceasta se introduc 2 caractere X si Y:

LECTIA
12. TESTUL NEPARAMETRIC 2

189

X ia valorile 1, 2, 3, 4 dupa cum ochii sunt albastri, gri sau bruni.


Y ia valorile 1, 2, 3, 4 dupa cum parul este blond, brun, negru sau roscat. Se testeaza un
numar de persoane si rezultatele le gasim n tabelul urmator:
Y
X
1
2
3

1768 807 189 47


946 1387 746 53
1125 438 288 16

.
Indicatie Aici (a 1)(b
ipoteza nu este acceptabila.

1) = 2  3 = 6 si 2 = 1075. Chiar cu pragul de " = 0; 001

6. Un articol de calitatile A, B sau C poate fabricat dupa 2 metode numerotate cu 1 si


2. Se examineaza 100 de articole si se gaseste tabelul:
A B C
1 20 19 11
2 12 31 7
. Putem accepta oare ipoteza ca, calitatea articolului nu depinde de modul sau de fabricare
(se ia " = 0; 1 si " = 0; 01)?
Indicatie. Este vorba de un test de omogenitate cu r = 3 si t = 2. Avem ca 2 = 5; 77
pentru o variabila aleatoare 2 cu 2 grade de libertate. Cu pragul de 0,1 trebuie sa respingem
ipoteza, dar cu pragul de 0,01 trebuie sa o acceptam.

Lectia 13
Alte teste neparametrice
13.1

Testul de concordant
a Kolmogorov-Smirnov

Acest test este din multe puncte de vedere mai bun dect testul 2 . El se aplic
a bine si
pentru esantioanele mici (n  25). Dac
a pentru testul 2 trebuia s
a grup
am datele, pentru
testul K-S nu este nevie dect s
a calcul
am functia de repartitie empiric
a asociat
a selectiei
efectuate. El poate utilizat bine si pentru a compara dou
a distributii.
Presupunem c
a populatia P are ca functie de repartitie teoretic
a functia FT (x). Efectu
am
un sondaj de volum n: fx1 ; :::; xn g si not
am cu FS (x) functia de repartitie empiric
a asociat
a
acestui sondaj (vezi Lectia 8). Pentru a m
asura deviatia functiei FT (x) de la functia FS (x) se
introduce statistica lui Kolmogorov: D=max jFS (x)-FT (x)j. Dac
a populatia P are ntr-adev
ar
x

repartitia FT (x) atunci se cunoaste distributia v.a. D (vezi Tabelul XIX). Pe prima coloan
a
n acest tabel avem volumul de selectie. Pe prima linie orizontal
a avem 5 valori ale pragului
de semnicatie: =0,80; 0,85; 0,90; 0,95 si 0,99.
Tabelul XIX este construit pe baza teoremei lui A. N. Kolmogorov:

Teorema 13.1 Fie X o v.a., FT (x) functia ei de repartitie considerata continua si Fn (x) o
functie empirica de repartitie asociata unei selectii de volum n:fx1 ; :::; xn g; dintr-o populatie
cu v.a. X. Atunci avem relatia

lim P

n!1


Dp
n

= K() =

1
X
1

( 1)k  exp

pentru orice  > 0.


Gracul functiei K () apare n gura urm
atoare:

190

2k 2 2

(13.1)

LECTIA
13. ALTE TESTE NEPARAMETRICE

191

0.8

0.6

0.4

0.2

0.5

1.5

Gracul functiei K ()


Exemplul 13.2 Se face sondajul {-2, -1, -1, 0, 0, 1, 2, 2} dintr-o populatie P. Sa se testeze
cu testul K-S daca populatia este normala cu media 0 si dispersia 2 (date si nu estimate!) cu
pragul de semnicatie =0,80.
Solutie Trebuie s
a construim functia de repartitie empiric
a, FS (x) notat
a de noi cu
n Lectia 8.
8
0; x  2
>
>
>
1
>
; x 2 ( 2; 1]
>
>
< 83
; x 2 ( 1; 0]
8
FS (x) =
5
; x 2 (0; 1]
>
8
>
>
6
>
; x 2 (1; 2]
>
>
: 8
1; x>2

Fn (x)

Deoarece P(X< x)=FT (x) si cum v.a. X = pX2 este normal


a redus
a (de tipul N(0,1))



X
x
x
x
avem c
a P(X< x)=P  <  =  . Deci FT (x) =   ,unde
  este functia lui Laplace
tabelat
a n Tabelul I. Prin urmare va trebui s
a calcul
am  px2 n punctele x =-2, -1, 0, 1,
2. Cum
= 1 (y), r
amne numai (deoarece
= 0; 5) s
a calcul
am din Tabelul I
 ( y)

(0)
p 
p
 p22 = ( 2) = (1; 41) = 0; 92 si  p12 =  22 = (0; 70) = 0; 75. Prin urmare




2
1
p
p

= 1 0; 92 = 0; 08 si 
= 1 0; 75 = 0; 25. Calcul
am acum diferentele
2
2

LECTIA
13. ALTE TESTE NEPARAMETRICE

192

dintre FS (x) si FT (x) pe ecare interval ce apare n denitia functiei FS (x). G


asim
x
FS (x)
FT (x)
FS (x) FT (x)

1
0
0
0

2
0
0; 08
0; 08

1
1
8

0; 25
0; 125

3
8

5
8

0; 5
0; 125

0; 75
0; 125

1
1
0; 92
1
0; 170 0
2
6
8

.
Prin urmare D=max jFS (x)-FT (x)j = 0; 170. Cuantila pentru = 0; 80 si n = 8 (din
Tabelul XIX) este D = 0; 358. Cum P(D< 0; 358)=0,80 rezult
a c
a putem accepta ipoteza c
a
populatia P este normal
a cu pragul de semnicatie 80% (deoarece 0,170<0,358).
Observatia 13.3 Acest test se poate aplica cnd avem de comparat doua distributii:
D = max jFS1 (x)-FS2 (x)j
etc.,unde cele doua functii empirice de repartitie care apar corespund celor doua distributii.
Exercitiul 13.4 Folositi testul K-S pentru exemplul 12.1

13.2

Testul lungimilor (secventelor)

Fie X si Y dou
a variabile aleatoare. Vrem s
a test
am urm
atoarea ipotez
a:
H: X si Y au aceeasi lege de distributie.
Pentru aceasta consider
am un esantion de volum m al v.a. X:(X1 ; :::; Xm ) si un esantion
de volum n al v.a. Y:(Y1 ; :::; Y2 ). Consider
am acum sirul de m + n variabile aleatoare
(X1 ; :::; Xm ; Y1 ; :::; Yn ). Presupunem c
a ele sunt independente. Dac
a X si Y ar avea aceeasi
lege de distributie am putea amesteca oricum aceste variabile si rationamentele noastre nu
s-ar schimba la trecerea de la (X1 ; :::; Xn ) la (Y1 ; :::; Ym ).
Introducem urm
atoarea v.a. R. Facem cte o selectie de volum m din X: x1 ; :::; xm si
de volum n din Y: y1 ; :::; yn consider
am sirul de numere x1 ; :::; xm ; y1 ; :::; yn . Asez
am acum
aceste numere n ordinea cresc
atoare si nu ne intereseaz
a dect faptul c
a ele sunt din X sau
din Y. Vom nota o astfel de situatie sub forma: !=XXYXYYYXXXXYY. Aici m= num
arul
X-lor, adic
a m=7, n= num
arul Y-lor, adic
a n=6. n sirul ! cel mai mic num
ar din sirul
x1 ; :::; xm ; y1 ; :::; yn , este din (x1 ; :::; xm );urm
atorul n ordine cresc
atoare este tot din acest
sir,al treilea n ordine cresc
atoare este din (y1 ; :::; yn ),etc. Cel mai mare num
ar din ! este din
(y1 ; :::; yn ). Dac
a cumva xi1 = xi2 le asez
am unul dup
a altul n orice ordine, etc.
Vom numi secventa (lungime) n sirul ! orice subsir format numai din X sau numai din
Y. De exemplu n ! avem urm
atoarele secvente:
XX Y X YYY
XXXX YY
___ _ _ ____ _____ __
S1 S2 S3
S4
S5
S6

LECTIA
13. ALTE TESTE NEPARAMETRICE

193

Prima secventa este S1: XX


A doua secventa este S2: Y
A treia secventa este S3: X
..
..
.
.
A sasea secvent
a este S6: YY.
Pentru selectia noastr
a v.a. R ia valoarea 6, adic
a num
arul secventelor de X-si sau de Y-ci
care apar dup
a rearanjarea n ordine cresc
atoare a esantionului (x1 ; :::; xm ; y1 ; :::; yn ).
Dac
a ipoteza H este adev
arat
a, functia de repartitie a v.a. R, F(x)=P(R  x) se calculeaz
a
tinnd seama de urm
atoarele observatii de natur
a combinatoric
a:
Dac
a de exemplu m  n,
P (R = 2s) =
P (R = 2s + 1) =

1
m
Cm+n

2
m
Cm+n
s
 [Cm

s 1
s 1
 Cm
1  Cm 1 ; pentru 1  s  m;

s 1
s
 Cm
1 + Cn

P (R = 2m + 1) =

1
m
Cm+n

 Cns 11 ]; pentru 1  s  m;

 Cnm 1 ; dac
a m < n;

P (R = r) = 0
n toate celelalte cazuri r
amase.
Se demonstreaz
a c
a statistica v.a. R este asimptotic
a (m; n mari) gaussian
a cu
M (R) = 1 +
S
a not
am cu

2mn
2mn (2mn m n)
; D(R) =
m+n
(m + n)2 (m + n 1)
R-M(R)
T = p
D(R)

(13.2)

(13.3)

Variabila T tinde c
atre o v.a. gaussian
a redus
a.
Un test de preg  se construieste astfel:
Fie r cel mai mare ntreg x astfel nct F(x) .
Testul va : Respinge H()R  r, unde R este valoarea efectiv
a a v.a. R obtinut
a
din sondaje (= num
arul secventelor). Pragul este  si acest test este cel mai puternic pentru
acest prag.
Desigur c
a am putea construi si alte teste plecnd de la formula (13.3) n analogie cu
testele de semnicatie sau ca testul 2 . Pentru m si n mici se calculeaz
a direct F(x) dup
a
formulele (13.1), iar pentru m si n mari se foloseste (13.3).

LECTIA
13. ALTE TESTE NEPARAMETRICE

194

Exemplul 13.5 Se cntaresc 10 mere de doua calitati A si B si se gasesc urmatoarele rezultate (n grame):
A: 192 197 207 182 191
B: 212 201 209 214 203
Ne permit oare aceste rezultate sa respingem ipoteza H: greutatea unui mar urmeaza aceeasi
lege de distributie indiferent de calitatea lui A sau B (cu pragul =0,05)? Calculati probabilitea erorii de primul tip pentru acest test. Utilizati si aproximarea gaussiana si comparati
rezultatele.
m
= 252. S
a not
am
Solutie Aici avem m = n = 5; Cm+n

s 1 2
m
, pentru 1s5,
N(x)= Cm+n P(R=x)=225P(R=x). Avem N(2s)=2 C4
N(2s+1)=2C4s 1  C4s 1 , pentru 1s4 si N(x)=0 n celelalte cazuri. Deducem de
aici legea de distributie pentru v.a. R:

x
2 3 4 5 6 7 8 9 10
252  P(R=x) 2 8 32 48 72 48 32 8 2

C
aut
am cel mai mare x cu F(x)0,05, sau 252 F(x) 12; 60. Cum avem 252 F(x)=

N(i),

ix

g
asim c
a 252 F(2)=2; 252 F(3)=10; 252 F(4)=42.
Cel mai mare x este deci 3 si testul devine: Respinge H()R <3. Probabilitatea erorii de
10
primul tip pentru acest test este P(R3)=F(3)= 252
=0,0397. S
a utiliz
am acum aproximarea
gaussian
a estimnd M(R) si D(R) direct din selectie.
M (R) = 1 +

255
= 6:
5+5

2  5  5  40
= 2; 222:
10  9


R 6
2; 5
P (R  3; 5) = P p
p
= 0; 047
2; 222
2; 222
D(R) =

Avem c
a

S
a observ
am c
a rezulatele sunt comparabile chiar dac
a m si n si sunt mici.
n exemplul nostru !=XXXXYYXYYY, deoarece selectia ordonat
a este:
182 191 192 197 201 203 207 209 212 214
.
Avem deci 4 secvente. Cum R = 4 > 3 va trebui s
a accept
am ipoteza H cu pragul =0,05.

LECTIA
13. ALTE TESTE NEPARAMETRICE

13.3

195

Testul lui Wilcoxon I (cazul observatiilor necuplate)

Denitia 13.6 Fie X si Y doua v.a. Variabila aleatoare Y se zice stochastic superioara v.a.
X daca (8) z 2 R avem ca P(Y z)P(X z), cu inegalitate stricta cel putin pentru un
z = z1 . Presupunem ca avem alternativele:
sau X si Y au aceeasi lege
sau Y este stochastic superioar
a lui X.
Fie ipoteza H: X si Y au aceeasi lege. Ca si la testul secventelor construim sirul !=XXYX:::,
de exemplu !=XYXXYYXYY. Statistica lui Wilcoxon T este v.a. care are ca valoare T=
suma numerelor care arat
a locurile pe care le ocup
a X n sirul !. Aici avem T=1+3+4+7=15.
Testul este de forma: Respinge H()T t, unde t este valoarea lui T din selectie. Dac
aH
1
este vericat
a, P(T t)= C m nmultit cu num
arul probelor favorabile relatiei T t (pentru
m+n
m si n mici se poate calcula direct F(t) ). Aici lucr
am cu selectiile X1 ; :::;Xm ;Y1 ; :::;Yn . Dac
a
m si n sunt mari, T este aproape gaussian
a cu:
M (T ) =

m (m + n + 1)
2

D(T ) =

mn (m + n + 1)
12

(13.4)

Exemplul 13.7 Se ncearca un tratament mediacl nou asupra unui grup de persoane de aceesi
vrsta, bolnave grav cu o maladie de tip cardiac. S-a notat timpul (n ani) dupa care aceste
persoane tratate mai traiau nca, ct si timpul dupa care alte persoane de aceeasi vrsta,
bolnave de aceeasi boala, dar netratate, mai traiau. S-au obtinut urmatoarele rezultate:
Tratate: 1; 2 6; 3 6; 5 7; 8 11; 2 15; 6
Netratate: 0; 4 3; 5 4; 8 6; 7
Testati ipoteza H potrivit careia tratamentul nu prelungeste viata unui bolnav (prag 0,05).
Solutie Aplic
am testul lui Wilcoxon. X este v.a. care exprim
a durata de viat
a a unui
bolnav netratat si Y a unui bolnav tratat. Este clar c
a v.a. Y este stochastic superioar
a
v.a. X. Ordon
am cresc
ator sirul fx1 ; :::; xm ; y1 ; :::; yn g si g
asim !=XYXXYYXYYY. Aici
T=1+3+4+7=15. Avem m=4 si n=6. S
a num
ar
am cazurile favorabile conditiei T15. Un
caz l avem mai sus: (1, 3, 4, 7), adic
a am asezat ntr-un sir pozitiile lui X n !. Cazurile
favorabile vor : (1, 2, 3, 4), (1, 2, 3, 5), (1, 2, 3, 6), (1, 2, 3, 7), (1, 2, 3, 8), (1, 2, 3, 9), (1, 2,
4, 5), (1, 2, 4, 6), (1, 2, 4, 7), (1, 2, 4, 8), (1, 2, 5, 6), (1, 2, 5, 7), (1, 3, 4, 5), (1, 3, 4, 6), (1,
3, 4, 7) si (1, 3, 5, 6). Sunt n total 16 posibilit
ati favorabile. Num
arul tuturor posibilit
atilor
4
arul modurilor n care putem aseza patru litere X ntr-un sir de10
este C10 = 210 (= num
16
litere X si Y). Dac
a H ar adev
arat
a ar trebui s
a avem P(T15)= 210
=0,076. Prin urmare,
cum 0,076>0,05 trebuie s
a accept
am ipoteza H cu pragul 0,05 si trebuie s
a o respingem cu
pragul 0,1.

LECTIA
13. ALTE TESTE NEPARAMETRICE

13.4

196

Testul semnelor

Presupunem c
a avem dou
a dou
a v.a. X si Y denite pe aceeasi categorie de probe, astfel nct P(X=Y)=0. Vrem s
a test
am ipoteza: H: P(Y>X)P(X>Y) contra ipotezei K:
P(Y>X)<P(X>Y).
Pentru aceasta se fac n observatii independente (X1 ,Y1 ),..., (Xn ,Yn ) ale v.a. (X,Y). Se
noteaz
a cu V num
arul acelor cupluri (Xi ,Yi ) pentru care Yi <Xi . Testul este de forma:
Respinge H()V v, unde v este valoarea lui V din sondajul respectiv.
Dac
a H este adev
arat
a cea mai mare valoare posibil
a pentru P(V v) se obtine dac
a

1
presupunem c
a V satisface legea lui Bernoulli B n; 2 .
Exemplul 13.8 O rma vrea sa testeze un nou ingredient adaogat unei creme antisolare. Se
fac testari pe 7 voluntari si pe spatele ecaruia se aplica crema antisolara astfel: pe jumatatea
superioara se aplica crema veche, iar pe jumatatea inferioara se aplica crema cu ingredientul
respectiv. Se expun la soare cei 7 voluntari si se observa masura n care pielea lor se nnegreste.
Se obtine tabelul urmator:
Voluntarul nr. 1 2 3 4 5 6 7
crema veche 42 51 31 61 44 55 48
crema noua 38 53 36 52 33 49 36
.
Solutie Not
am cu Y v.a. corespunz
atoare nnegririi pielii cu vechea crem
a si cu X v.a.
pentru noua crem
a, deoarece se presupune c
a prin ad
aogarea ingredientului valorile lui X vor
n general mai mici dect cele ale lui Y. Avem n=7. Aplic
am testul semnelor. Num
arul
cuplurilor
a H este adev
arat
a V are o distributie
 (X,Y) pentru care Y<X este V=2. Dac
B 7; 12 si deci
 7

1  0
29
P (V  2) =
C7 + C71 + C72 =
= 0; 23 > 0; 1
2
128

Este deci foarte probabil s


a g
asim pentru V valori mai mari dect 2. Prin urmare, cu acest
test al semnelor (V reprezint
a cte semne + avem n diferenta X-Y) ipoteza H trebuie
acceptat
a (cu pragul 0,1).

13.5

Testul lui Wilcoxon II (cazul observatiilor cuplate)

Fie X, Y dou
a v.a. denite pe aceeasi ctegorie de probe. Fie Z=Y-X. Vrem s
a test
am ipoteza
H: Z este o variabil
a aleatoare simetric
a, adic
a are aceeasi lege ca si v.a. -Z, contra ipotezei
K: Z este stochastic superioar
a lui -Z. S
a observ
am c
a cele 2 ipoteze nu sunt contrare si deci
nu acoper
a gama de posibilit
ati.

LECTIA
13. ALTE TESTE NEPARAMETRICE

197

Pentru aceasta facem n observatii independente (X1 ,Y1 ),...,(Xn ,Yn ) ale v.a. (X,Y). Aranj
am apoi n ordinea cresc
atoare a modulelor lor diferentele Z=YX si nu retinem dect semnele
lor. G
asim de exemplu !=( + + + + +). Not
am cu W suma numerelor ce exprim
a
pozitia semnelor minus. n cazul nostru W=1+2+3+5=11. Testul are forma urm
atoare:
Respinge H()W w, unde w este valoarea v.a. W obtinut
a din sondaj.
Dac
a H este adev
arat
a, multimea
a celor 2n posibilit
ati pentru semnul este nzestrat
a
cu legea uniform
a (este unica lege probabilistic
a pe o multime nit
a de evenimente, care face
ca aceste evenimente s
a e egal probabile). Dac
a n nu este prea mare legea W se obtine prin
num
ararea direct
a a cazurilor favorabile. Dac
a n este mare W este aproximativ gaussian
a cu:
M (W ) =

n (n + 1)
n (n + 1) (2n + 1)
iD(W ) =
4
24

(13.5)

Exemplul 13.9 Reluam exemplul 13.6 si vrem sa-i aplicam testul Wilcoxon II (=0,1).
 Ordon
am valorile v.a. YX n ordinea cresc
atoare a valorilor lor absolute: 2, 4, 5, 6,
9, 11, 12. G
asim sirul de semne !=( + + + + +). Suma indicilor cu semnul minus este
W=1+3=4. Num
arul cazurilor posibile este 27 =128. Aici w=4. Cazurile favorabile (W4)
sunt: (+ + + + + + +), ( + + + + + +), (+ + + + + +), (+ + + + + +), (+ + +
7
+ + +), ( + + + + +), ( + + + + +), adic
a 7. De aici avem c
a P(W4)= 128
=0,054.
Cu pragul 0,1 va trebui s
a respingem ipoteza H.
Observatia 13.10 Daca comparam rezultatul obisnuit cu acela din Exemplul 13.6 aparent
gasim o contradictie. Aceasta se explica deoarece n testul semnelor nu tinem seama dect
de numarul semnelor minus si nu de pozitia lor n sirul !. n testul lui Wilcoxon se tine
seama ca aceste semne sunt plasate la nceput, si nu oriunde n sirul !. Acest lucru face ca
valoarea V sa e n general mult mai mare dect valoarea W. De aici apare clar ca rezultatul
testului Wilcoxon II sr trebui sa e mai demn de crezut de rma dect rezultatul testului
semnelor. Comparatia dintre cele doua teste se face de obicei de la caz la caz si se interpreteaza
rezultatul potrivit situatiei particulare studiate. Evident ca aici, pentru rma, este convenabil
testul Wilcoxon II si nu testul semnelor, care nu pare concludent. n plus, n testul Wilcoxon
II se presupune ceva n plus de la nceput (K nu este aplternativa ipotezei H).

13.6

Exercitii

1. Se dau doua esantioane independente de volum 20 din v.a. X si Y:

LECTIA
13. ALTE TESTE NEPARAMETRICE

198

X: 147 193 238 225 252 143 178 209


259 263 226 179 253 262 181 169
210 233 248 194
Y: 240 254 192 157 168 170 207 222
201 215 217 243 172 183 197 241
182 163 173 167
Cu ecare din pragurile =0,05; =0,1, testati ipoteza H: X si Y au aceeasi lege,
1) cu testul lungimilor;
2) cu testul Wilcoxon I.
Explicati eventualele contradictii.
Indicatie 1) R=15. Prin aproximarea gaussian
a pentru =0,05 g
asim
P(R  15) 
= 0,0388
Se respinge deci H.
2. Suma indicilor lui X este T=462. Folosim aproximarea gaussiana pentru =0,05 si
gasim
P(T  462) > 0,5 , deci ipoteza H se accepta. Aici trebuie sa respingem H deoarece se vede
clar ca cele doua legi sunt departe una de alta. Testul Wilcoxon I nu a mers deoarece
nerealizarea lui H =)Y este stochastic superioara lui X, lucru evident neadevarat, din sondaj.
Deci trebuie sa acceptam pe H, dar cu rezerve. Probabil ca cele doua legi nu sunt aceleasi dar
se ntrepatrund.
3. Se testeaza un medicament nou pe un lot de 13 soareci si se obtin urmatoarele rezultate
relative la o anumita analiza (mare nseamna nrautatirea starii individului):
soareci netratati: 45 88 16 6 28 122 62 13
soareci tratati: 23 104 2 9 30
Folositi testul lui Wilcoxon I pentru a testa ipoteza H: medicamentul nu da rezultate. (prag
=0,05 si =0,1).
Indicatie. Se foloseste aproximarea gaussian
a si se g
aseste c
a P(T30)0,255. Ipoteza se
accept
a.
4. Douazeci de stupi cu albine se lasa pe aceeasi perioada a anului n doua zone diferite A
(zece stupi) si B (zece stupi) timp de 20 de ani. Se observa cte kilograme de miere se obtin
de la ei n ecare an n cele 2 zone:

LECTIA
13. ALTE TESTE NEPARAMETRICE
Anul
1
2
3
4
5
6
7
8
9
10

A
68,3
60,1
52,2
41,7
32,0
30,9
39,3
42,0
37,7
33,5

199

B Anul A
B
72,5 11 32,2 31,9
56,0 12 63,3 58,1
55,8 13 54,2 52,7
39,2 14 47,0 46,2
31,4 15 91,9 90,2
35,5 16 56,1 55,4
39,2 17 79,6 75,1
41,1 18 81,2 86,6
43,3 19 78,4 75,3
31,7 20 46,6 43,8

Sa se testeze cu testul semnelor, apoi cu testul Wilcoxon II ( =0,05) ipoteza: H: cele doua
zone melifere A si B sunt tot att de productive.
Indicatie. Fie X v.a. ce m
asoar
a greutatea mierii provenit
a din zona A si Y v.a. corespunz
atoare zonei B.

Testul semnelor Z=YX conduce la legea binomial
a B 20; 12 si deci
P(V  4)=0,00591 < 0,05

, lucru ce conduce la respingerea ipotezei H.


Testul Wilcoxon II conduce la W=71. Aproxim
am W cu legea gaussian
a si g
asim


W 105
P(W  71)=P p
 1,27 =0,102 > 0,05
717; 5
, deci ipoteza H se accept
a n aces caz. Deoarece avem putine minusuri (doar 4) vom
prefera testul Wilcoxon II. Consider
am numai o pur
a ntmplare c
a avem putine minusuri.
n general, cnd num
arul minusurilor n testul semnelor este mic, nu putem s
a ne baz
am pe
acest test.El este slab n acest caz.

Lectia 14
Analiza dispersiei si analiza regresiei
14.1

Analiza dispersiei

Vom analiza aici cea mai simpl


a problem
a dispersional
a.
Problem
a Se consider
a s variabile aleatoare gaussiene X1 ,...,Xs de aceeasi dispersie ne2
cunoscut
a  . Se noteaz
a cu mi =M(Xi ). Vrem s
a test
am urm
atoarea ipotez
a: H: m1 = m2 =
   = ms , adic
a toate v.a. au aceeasi medie.
Presupunem c
a avem pentru ecare i = 1; :::; s cte un esantion de volum ni :Xi1 ;Xi2 ; :::;Xini ,
al v.a. Xi . Presupunem c
a toate cele n = n1 +n2 +  +ns v.a. X11 ,...,Xsns sunt independente.
Not
am cu


1
Xi =
Xi +    + Xini ; pentru i=1,...,s
(14.1)
ni 1
X=

X ni
1 X
Xi
Xij =
n 1is
n
1is

(14.2)

1jni

QA =

ni Xi

1is

QR =

1is
1jni

Xij

Xi

2
X =
2

1is

2
ni Xi

B X 2C
=B
Xij C
@
A
1is

1jni

ni Xi :

(14.4)

1in

 Se stie c
a statistica QR / 2 se spune unei legi Pearson cu n
variabila aleatoare.
200

(14.3)

nX

s grade de libertate si c
a

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
 Uij =

(ni +nj )(n s) [X i X j (mi mj )]


p
ni nj
Q

are o distributie Student cu n

201
s grade de liberate

pentru orice i; j ca mai sus.


s)Q A
se supune unei legi FisherSnedecor (distributia F)
 De asemenea, statistica W= (n
(s 1)Q R


s 1
grade de libertate, dac
a ipoteza H este adev
arat
a.
cu
n s
Aceast
a ultim
a observatie va constitui esenta testului urm
ator: Respinge H()W w,
unde w este cel mai 
mare num
ar astfel nct P(FS w) , unde FS este v.a. Fisher
s 1
grade de libertate, iar  este un prag de semnicatie, considerat mic,
Snedecor cu
n s
de exemplu =0,05; 0,1; etc. Este posibil ca n tabele s
a g
asim cuantilele de ordin 0,95; 0,9;
etc. Se trece atunci la probabilitatea evenimentului contrar, etc.
 Dac
a datele Xij sunt mari se nlocuiesc acestea cu datele aXij + b, unde a 6= 0, b 2 R
sunt alese astfel nct numerele aXij + b s
a devin
a mici. Prin aceast
a schimbare v.a. Uij si
W nu se modic
a, deci testul decurge exact ca mai sus pentru noile date.
Exemplul 14.1 Pe patru soluri diferite A1 , A2 , A3 , A4 se planteaza orz. Se fac selectii
de volume diferite din tulpini de orz ajunse la maturitate din cele patru soluri si se noteaza
lungimea acestora (n cm):
A1 A2 A3 A4
380 350 354 376
376 358 360 344
360 356 362 342
368 376 352 372
372 338 366 374
366 342 372 360
374 366 362
382 350 344
344 342
364 358
351
348
348
Se noteaza cu Xi lungimea aleatoare a unei tulpini de orz de pe terenul Ai . Se presupune ca
Xi sunt gaussiene cu aceeasi dispersie  2 . Fie pragul =0,05.
1) Testati ipoteza H: X1 , X2 , X3 , X4 au aceeasi medie.
2) Testati ipoteza H: X2 , X3 si X4 au aceeasi medie.
Solutie Deoarece datele sunt mari le centr
am cu ajutorul transform
arii Zi =Xi 330. Obtinem

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
un nou tabel:

A1
50
46
30
38
42
36
44
52

A2
20
28
26
46
8
12
36
20
14
34

A3
24
30
32
22
36
42
32
14
12
28
21
18
18

202

A4
46
14
12
42
44
30

1) Folosim o analiz
a dispersional
a pentru a testa ipoteza H. Aici avem s=4, n1 =8,
n2 =10, n3 =13, n4 =6, n=8+10+13+6=37; n1 Z1 =338; n2 Z2 =244; n3 Z3 =188; nZ=n1 Z1 +    +
n4 Z4 =1099.
P
P 2
2
2
Zij =38229, avem
ni Zi =34449, nZ =32640, deci QA =1809. Cum
Prin urmare
i;j

1i4

QR =3780. De aici W=5,26.


3
grade de libertate s
a ia o valoare
Probabilitatea ca o v.a. FisherSnedecor cu
33
asem
an
atoare lui W este inferioar
a lui 0,01. Prin urmare ipoteza H se respinge.
2) n acest caz s0 =3, n0 =n2 + n3 + n4 =29, Q0A =199; Q0R =3400 si W0 =0,76. Aceast
a
0
valoare a lui W este prea mic
a, deci ipoteza se accept
a n acest caz

14.2

Analiza regresiei

Fie X si Y dou
a variabile aleatoare si X1 ,...,Xn ,Y1 ,...,Yn v.a. de selectie de acelasi volum n.
Se pune problema de a studia legatura (dac
a exist
a) dintre cele dou
a v.a. X si Y numai din
analiza unor cupluri de selectie de tipul fx1 ; :::; xn g ; fy1 ; :::; yn g. Este posibil ca cele dou
a
M ((X X )(Y Y ))
cov(X;Y)
v.a. s
a nu e corelate, adic
a coecientul de corelatie XY = X Y =
s
a e
X Y
zero. Acest lucru nu nseamn
a c
a nu poate exista o relatie functional
a de forma F(X,Y)=0
ntre v.a. X si Y. Aceast
a egalitate poate s
a nu e determinist
a. Sau poate s
a e astfel,dar
noi s
a nu putem descrie matematic aceast
a functie de leg
atur
a. n Lectia 6 s-a ar
atat c
a
X si Y sunt legate ntre ele printro relatie liniar
a: Y=aX+b, sau X=cX+d, dac
a si numai
dac
a XY =1. De regul
a noi facem sondaje n urma c
arora estim
am coecientul de corelatie
printro formul
a empiric
a de forma:

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

XY

n
P

x
)  (yi

(xi

i=1

203

y)
(14.5)

n   x   y

n
n
P
P
qP
xi
yi
(xi x
 )2
i=1
i=1


x
=mx = n si y
=my = n ,  x =
,  y =
n
XY se apropie de +1 sau de 1 putem spera ca X si

unde
Dac
a
nu, se continu
a investigatia prin analize mai ne.
S
a ncepem prin a examina urm
atorul exemplu:

qP

(yi y)2
.
n

Y s
a e corelate liniar. Dac
a

Exemplul 14.2 Ne intereseaza care este legatura ntre numarul de ore afectate de un student
de inteligenta medie studiului Analizei matemetice (lunar) si rezultatele obtinute de acesta la
examen. n urma unui sondaj efectuat pe 10 studenti sau obtinut urmatoarele rezultate:
Student
1
2
3
4
5
6
7
8
9
10

Nr. ore: x Nota: y


5
4
7
4
8
5
10
5
13
6
15
6
16
7
17
9
20
9
30
10

Punem ntr-un grac aceste date:

10

10

15

20

Dreapta de regresie

25

30

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

204

Se pune problema daca aceste puncte sunt foarte apropiate de o dreapta. Mai exact, sa
notam cu (xi ; yi ), i = 1; n valorile obtinute dintr-un sondaj pentru v.a. X si Y. Exista b0 ; b1 2
R astfel nct diferentele ei = yi b0 b1 xi sa e mici? Care sunt cei mai buni
b0 si b1 care sa faca acest lucru? Sau poate exista b0 ; b1 ; :::; bk astfel nct diferentele ei =
yi b0 b1 xi b2 x2i    bk xki sa e mici pentru orice i = 1; n?
Denitia 14.3 Ecuatia

yi = 0 + 1 xi + ei ; i = 1; n

(14.6)

se numeste model de regresie simpla (sau liniara), iar ecuatia


yi = 0 + 1 xi + 2 x2i +    + k xki + ei

(14.7)

unde i = 1; n , se numeste model de regresie multipla.


De exemplu, pentru k = 2 se numeste regresie parabolica, etc.
Noi ne vom ocupa aici n exclusivitate cu regresia liniar
a (simpl
a). Vom interpreta yi ca
ind valorile unei v.a.. La fel vom interpreta valorile erorilor ei . De asemenea vom interpreta
0 si 1 ca ind valorile unor v.a. pe care le vom determina prin metoda celor mai mici
p
atrate.

14.2.1

Metoda celor mai mici p


atrate (C. F. Gauss)

Dac
a vrem s
a aproxim
am yi  0 + 1 xi eroarea comis
a este ei , i = 1; n. Vom pune conditia
ca suma p
atratelor erorilor ei s
a e minim
a:
S=

n
X

e2i =

i=1

n
X

(yi

1 xi )2 = minim
a.

(14.8)

i=1

(vezi si Lectia 8). Este usor de ar


atat c
a S=S( 0 ; 1 ) are un singur minim pentru 0 = b0 ,
1 = b1 , unde b0 si b1 reprezint
a solutia sistemului liniar
@S
=
@ 0

@S
=
@ 1

n
X

(yi

1 xi ) = 0

(14.9)

1 xi ) xi = 0

(14.10)

i=1

n
X
i=1

(yi

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

Not
am cu y = n

n
P

yi si cu x = n

i=1

n
P

205

xi .

i=1

Atunci, din (14.9) rezult


a c
a:

b0 = y

(14.11)

b1 x

Dar b0 si b1 veric
a si (14.10):
n
X

y 1 xi

nb0

b1

i=1

n
X

x2i = 0

(14.12)

i=1

(14.11) si (14.12) ne conduc la expresia lui b1 :

b1 =

n
X

y i xi

nxy 

i=1

n
X

x2i

nx

i=1

(14.13)

Nu este greu de ar
atat c
a b1 se mai poate scrie sub form
a centrat
a:

b1 =

n
P

y) (xi

(yi

x)

i=1
n
P

(xi

x)2

cov (x; y)
 2
x

(14.14)

i=1

Cu acest
a expresie a lui b1 venim n (14.11) si g
asim

b0 = y

n
X
i=1

(yi

y) (xi

x) 

n
X
i=1

(xi

x)2 = y

x

cov (x; y)
 2
x

(14.15)

(Vezi si formulele corespunz


atoare din Lectia 8). n exemplul 14.2 metoda celor mai mici
p
atrate ne d
a b0 = 2; 621, b1 = 0; 274, y = b0 + b1 x ind dreapta cea mai apropiat
a de norul
de puncte respectiv(vezi gura Dreapta de regresie).

14.2.2

Conditiile GaussMarkov pentru metoda celor mai mici


p
atrate

Conditiile GaussMarkov sunt conditii naturale care se impun v.a. ei , i = 1; n. Prima conditie
cere ca media v.a. ei s
a e zero:

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

S
a observ
am c
a oricum

M (ei ) = 0;

pentru orice i = 1; n

n
P

n
P

ei =0, deci

206

(14.16)

M(ei )=0, n general.

i=1

i=1

Figura urm
atoare ne arat
a un caz n care nu are loc (14.16).
25

20

15

10

-4

-2

Un caz n care nu este ndeplinit


a prima conditie Gauss-Markov
A doua conditie GaussMarkov cere ca dispersiile v.a. ei s
a e constante, adic
a
2
D(ei ) =  =constant
a, dar necunoscut
a
Figura urm
atoare ne prezint
a o situatie n care nu are loc (14.17) deoarece D(ei ) cresc
odat
a cu cresterea iurilor.
y

Un caz n care nu este ndeplinit


a a doua conditie Gauss Markov

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

207

Uneori chiar un singur punct poate s


a fac
a condtiile (14.16) sau (14.17) neadev
arate.
Dac
a observatiile noastre sunt corelate unele cu altele nu putem face mai trziu aprecieri
pertinente asupra lor. De aceea vom micsora num
arul acestor observatii pn
a cnd acestea
vor deveni necorelate.
Ultima conditie GaussMarkov se refer
a tocmai la acest lucru. Se cere ca cov (ei ; ej ) = 0.
Cum M(ei )=M(ej )=0, r
amne doar conditia:
M (ei ej ) = 0; pentru orice i 6= j:

(14.17)

Denitia 14.4 Metoda celor mai mici patrate se spune ca este o metoda buna daca variabilele
aleatoare erori, ei , i=1, 2,..., n ndeplinesc cele trei conditii GaussMarkov (14.16), (14.17)
si (14.18).

14.2.3

M
asura deviatiei la metoda celor mai mici p
atrate

Am v
azut mai sus c
a S=

n
P

i=1

asoar
a deviatia adev
aratelor yi de la valorile estimate prin
e2i m

metod
a , ybi = b0 + b1 xi , deoarece ei = yi ybi . Cum nu se doreste ca m
asura deviatiei s
a
depind
a de unitatea de m
asur
a, se lucreaz
a cu alt
a m
arime, oarecum relativ
a.

Denitia 14.5 Fie modelul de regresie liniara yi = 0 + 1 xi + ei , i = 1; 2; :::; n.


n
n
P
P
e2i  (yi y)2 .
a) Daca 0 6= 0 se ia ca masura a deviatiei expresia: R2 = 1
i=1
n
P
2
ei  yi2 .
i=1
i=1
i=1

b) Daca 0 = 0 se ia ca masura a deviatiei expresia: R = 1


2

n
P

 Media si varianta v.a. b0 si b1


S
a interpret
am acum pe yi si pe ei ca variabile aleatoare, pe 0 si 1 ca niste constante
(parametri), iar pe b0 si b1 ca variabile aleatoare care iau diferite valori la ecare selectie n
parte.
Teorema 14.6 Fie modelul de regresie liniara yi = 0 + 1 xi + ei , i = 1; n n care v.a. ei ,
i = 1; n verica cele 3 conditii GaussMarkov. Atunci avem relatiile

M (b0 ) = 0

6
D(b0 ) =  2 6
4n

+P
n

i=1

x2
(xi

x)

7
7
5
2

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

n
X
D(b1 ) =  2 
(xi

M (b1 ) = 1

208

x)2

(14.18)

i=1

Demonstratie Deoarece

n
P

(xi

i=1
n
X

(yi

x) = 0 rezult
a c
a
y) (xi

n
X

x) =

i=1

(14.19)

x)

yi (xi

i=1

Din (14.20) si (14.14) rezult


a c
a

b1 =

n
X

ci yi ; unde

(14.20)

i=1

x) 

ci = (xi

n
X

(xi

x)

i=1

Cu aceste notatii avem:


n
X

ci = 0

i=1

n
X

ci xi =

i=1
n
X
i=1

n
X

ci (xi

x) = 1 , de unde

i=1

1
i=1 (xi

c2i = Pn

x)2

De aici, aplicnd operatorul de medie relatiei (14.21) n care yi = 0 + 1 xi + ei g


asim:
M (b1 ) =

n
X

ci M (yi ) = 0

i=1

ci + 1

i=1

i=1

c2i D(yi ) =

ci xi +

| {z }

=0

n
X

n
X
i=1

| {z }

Calcul
am acum D(b1 ):
D(b1 ) =

n
X

=1

n
X
i=1

c2i

2 = P
n

i=1

ci M (ei ) = 1
| {z }

(14.21)

=0

2
(xi

x)2

(14.22)

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI
n
P

M (yi )

Acum, deoarece M(y)= i=1 n

a c
a
= 0 + 1 x, rezult

M (b0 ) = M (y

b1 x) = 0 + 1 x

Calcul
am acum D(b0 ):
n
n
n
P
P
P
b0 = n 1 y i x ci y i =
(n

xM (b1 ) = 0

xci ) yi , deci

n
X

D(b0 ) =
n

xci

i=1

= 2

n
X

n

2

D(yi )

2n 1 xci + x2 c2i

i=1

deoarece

n
P

(14.23)

i=1

i=1

i=1

209

6
= 2 6
4n

+P
n

x2
x)

(xi

i=1

7
7
5
2

ci = 0.

i=1
@S
@ 1

n cazul n care 0 = 0, avem direct din

b1 =


n general

n
P

i=1

ei 6= 0

n
P

= 0 c
a

yi x i

i=1
n
P

ei = y i

i=1

b1 x i

(14.24)

x2i

nlocuim n (14.25) pe yi cu 1 xi + ei si g
asim c
a
1
b1 =

n
P

i=1
n
P

i=1

De aici rezult
a c
a

x2i
+

x2i

n
P

ei xi

i=1
n
P

i=1

x2i

n
P

= 1 +

n
P

i=1

x2i
2
D(b1 ) =  
=

n
2
P
n
P
x2i
x2i
2

i=1

i=1

ei x i

i=1
n
P

i=1

(14.25)
x2i

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

210

si c
a M(b1 )= 1 , deoarece M(ei )=0, pentru orice i = 1; n.
Corolarul 14.7 Cu formele de mai sus, rezulta din Teorema 14.6 ca b0 este un estimator
nedeplasat al parametrului 0 si ca b1 este un estimator nedeplasat al parametrului 1 .
Formulele (14.19) arat
a c
a D(b0 ) si D(b1 ) contin pe  2 care este necunoscut. De obicei  2
se estimeaz
a cu estimatorul nedeplasat (vericarea nu este simpl
a!)
2

s = (n

1)

n
X

e2i

(14.26)

i=1

14.2.4

Intervale de ncredere si teste pentru 0 si 1

Presupunem c
a avem modelul de regresie liniar
a: yi = 0 + 1 xi + ei , i = 1; n, unde ( yi ) si
(ei ) sunt v.a., iar 0 si 1 sunt considerati parametri statistici care au fost estimati mai sus
prin b0 si b1 .
Presupunem c
a acest model ndeplineste conditiile GaussMarkov. De asemenea facem
presupunerea c
a v.a. (ei ) au o distributie normal
a N(0, 2 ). Atunci rezult
a (vezi Lectia 4) c
a
2
(yi ) au o distributie normal
a N( 0 + 1 xi ,  ). Cum b0 si b1 sunt combinatii liniare de (yi )-uri
rezult
a c
a si ele sunt v.a. cu mediile
 sipdispersiile date n formula (14.19).
Se poate ar
ata c
a v.a. bj j  D(bj ) este o v.a. Student cu n 2 grade de liberate,
pentru j = 0; 1 (dac
a 0 6= 0).
Folosim acum teoria testelor de semnicatie si g
asim c
a intervalul


q
q
bj
D(bj )Tn 2; =2
bj + D(bj )Tn 2; =2
este un interval de ncredere pentru j , j=0,1, de (1 )100 procente. Aici Tn 2 ; =2 este
cuantila de ordin =2 a distributiei Student cu n2 grade de libertate.
n lumina rezultatelor de mai sus vom studia pe scurt urm
atoarea situatie.
Fie X1 , X2 ,..., Xn variabile aleatoare gaussiene independente cu aceeasi dispersie  2 astfel
nct s
a existe dou
a constante a, b cu proprietatea: M(Xi )=a + bti , 1 i  n.
Ca si mai sus (nlocuim pe Yi cu M(Xi )!) introducem urm
atoarele notatii:
n

t =

St2

1X
1X
ti ; X =
Xi
n i=1
n i=1

1X
=
ti
n i=1

2
1X 2
t =
t
n i i

t;

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

211

n
2
1X
1X
2
Xi X =
Xi X
n i
n i=1

 1X
1X
=
ti t Xi X =
ti Xi tX
n i
n i

SX2 =

2
StX

Statisticile (care dau estimatori pentru a si b): bb =S2tX S2t si b


a=X tbb sunt v.a. gaussiene
cu M(bb)=b,
!
2
2
t
2
M (b
a) = a;
D(b
a) =
1+ 2 ;
D(bb) =
n
St
nS2t

(vezi Teorema 1). Se poate ar


ata c
a statistica
2tX

1X
=
Xi
n i

b
a

bbti

2

S2t  S2X

S2tX
S2t

2

= SX2

bbS 2
tX

este independent
a de statisticile b
a si bb. Se poate ar
ata de asemenea c
a n2 2tX se supune unei
legi Pearson (2 ) cu n2 grade de libertate. Aceast
a observatie ne permite s
a construim un
test de semnicatie si un nou tip de intervale de ncredere pentru parametrii a si b.
Mai mult, se poate ar
ata c
a statisticile



p 2
p
St bb b
n 2S2t bb b
T = q
=q
2
1
2

S2tX
S2t  S2X
n 2 tX

si

p 2
p
a a)
n(n 2)S2t (b
a a)
St (b
U = rP q
=r



2
2
2
1
2
t2i S2t  S2X
S2tX

St + t
n 2 tX
i

satisfac legea Student cu n2 grade de libertate. Si ele pot folosite pentru cei doi
parametri a si b.
Exemplul 14.8 Un biolog studiaza cresterea unei specii de plante, pe mai multe exemplare,
ntrun interval de timp dat. La nceputul perioadei planta avea (n mm) naltimea initiala t.
La sfrsitul perioadei ea a avut naltimea X. S-au facut 10 probe:
t 57 60 52 49 56 46 51 63 49 57
X 86 93 77 67 81 70 71 91 67 82
1) Gasiti estimatori punctuali pentru a, b si  2 .
2) Estimati naltimea unei plante la sfrsitul perioadei daca initial ea a avut 52 mm.
3) Dati pentru b un interval de ncredere de 95%.

LECTIA
14. ANALIZA DISPERSIEI SI ANALIZA REGRESIEI

212

10
P
Solutie 1) Folosim formulele de mai sus si g
asim: n=10; nt=540; nX=785; t2i =29426;
i=1
P
P 2
ti Xi =42836; t=54; X=78,5; nS2t =266; nS2tX =446; nS2X =836,5. De aici se
Xi =62459;
i

g
aseste pentru b estimarea bb=1,677 si pentru a, b
a=12,06.
n2tX
2
Dar ntX =88,5. Folosim acum faptul c
a 2 se supune unei legi Pearson cu n2=8 grade
n2

de libertate. Pentru  2 avem estimarea 


b2 = 8tX =11,06.
2) O plant
a cu t=52 la
perioadei, va avea la sfrsitul duratei lungimea b
a+52bb=75,14.
qnceputul
2

3) Dac
a Y=bb si Z= 2 tX , v.a. T= Y b se supune unei legi Student cu n2=8 grade
S t (n 2)

de libertate. Avem deci c


a P(jTj > t" )=0,05 (=95%) pentru t" =2,306. Se obtine
un
qde aici
2
n
interval de ncredere de prag 95% pentru b: bb t" jZj  b  bb + t" jZj. Dar Z= n(n tX2)S2 si
t
deci t" jZj=0,47. G
asim n nal intervalul 1,207 b 2,147.