Sei sulla pagina 1di 174

1

Gabriel V. ORMAN
Gabriel NEPOTU





























2008 2009
REPROGRAFIA UNIVERSITII TRANSILVANIA DIN BRAOV

2


3

CUPRINS
Prefata ................ .... 2
Introducere ........................ ............................................... ......................3
1. Preliminarii de teoria multimilor ........................ .............5
1.1. Elemente de teoria multimilor .................................. .......................5
1.2. Elemente de teoria semigrupurilor .......................... ........................13
2. Camp de Probabilitate . .......... ........................................... ......................17
2.1. Camp de evenimente ...............17
2.2. Probabilitate pe campuri finite de evenimente ........................28
2.3. Camp de probabilitate complet aditiv ...45
2.4. Metode clasice in teoria probabilitatilor ...............................50
2.5. Formule utile in aplicatiile teoriei probabilitatilor. .....................54
2.6. Independenta stochastica. Extractii repetate .61
2.7. Teorema Borel-Cantelli 69
2.8. Aplicatii 71
3. Variabile aleatoare. Caracteristici numerice. Functia de repartitie ...............80
3.1. Definitii. Exemple .................80
3.2. Valori medii .................87
3.3. Dispersia ...............92
3.4. Corelatia ...............93
3.5. Inegalitatea lui Cebsev . ..................97
3.6. Inegalitatea lui Kolmogorov ...................98
3.7. Raport de corelatie ..99
3.8. Variabile aleatoare pe un camp de probabilitate complet aditiv ..100
3.9. Functia de probabilitate .............103
3.10. Functia de repartitie .............104
4. Repartitia binomiala si repartitia Poisson ...................107
4.1. Repartitia binomiala ...............107
4.2. Legea numerelor mari ............111
4.3. Repartitia Poisson .................112
4.4. Repartitia multinomiala .............121
4.5. Repartitia normala. Teorema limita DeMoivre-Laplace ..................122
5. Elemente de teoria selectiei ..................136
5.1. Selectie.Repartitie empirica..............136
5.2. Valori tipice (empirice) de selectie...............141
5.3. Aplicatii.................145
6. Elemente de teoria estimatiei ...................151
6.1. Estimatii.Tipuri de estimatii..............151
6.2. Metode de determinare a estimatiilor............156
6.3. Aplicatii.............162
ANEXE ...168
BIBLIOGRAFIE ..... ...........172



4

PREFATA

Teoria probabilitatilor este o disciplina matematica avand scopuri asemenea acelora pe
care le are geometria sau mecanica aplicata, spre exemplu. De aceea, la fel ca oricare domeniu,
trebuiesc distinse, si in cadrul teoriei probabilitatilor trei aspecte ale teoriei: continutul logico-
formal, fundamentul intuitiv si aplicatiile. Fara considerarea acestor trei aspecte, atat in
totalitatea lor cat si in interdependenta dintre ele, nu pot fi apreciate caracterul si armonia intregii
structuri a domeniului.
Astazi, teoria probabilitatilor si statistica matematica sunt aplicate in atat de multe
domenii diferite, incat este necesara o teorie generala foarte flexibila pentru a putea prevedea
instrumentele de lucru cele mai potrivite pentru o varietate atat de mare de cerinte. Orientarea
empirica sau statistica, in directia probabilitatii, a fost dezvoltata, in special, de R.A. Fisher si R
von Mises. De altfel, una dintre notiunile fundamentale ale teoriei probabilitatilor, aceea de camp
de evenimente, o datoram lui R von Mises. Aceasta notiune a facut posibila constituirea unei
teorii a probabilitatilor riguroasa din punct de vedere matematic, bazata pe teoria mas urii.
O teorie, insa, devine matematica atunci cand ea poate furniza un model matematic al
fenomenelor de care se ocupa. Pe masura ce numarul fenomenelor, impreuna cu proprietatile lor
cunoscute a crescut, modelul matematic s-a dezvoltat, de la notiunile primare pe care s-a
construit intuitia noastra, in directia unei generalizari si abstractizari inalte. Dar, in acest fel,
consistenta intrinseca a modelului fenomenelor aleatoare a devenit indoielnica, ceea ce a impus o
reconstructie a intregii structuri in al doilea sfert al secolului nostru, incepand cu o definitie
axiomatica a insusi conceptului de probabilitate (datorata lui A.N. Kolmogorov).
Asa a aparut o ramura noua a matematicilor - teoria probabilitatilor - interesata in
construirea si studierea modelului matematic al intamplarii. Este, fara doar si poate, saltul
calitativ inregistrat in chiar istoria dezvoltarii acestei teorii. Conceptul lui Kolmogorov a fost
confirmat, destul de repede, de cercetarile si rezultatele obtinute mai ales de W. Feller, care
furnizeaza si o serie de exemple si aplicatii capabile sa intregeasca si sa completeze teoria.
Acest mod de abordare a teoriei s-a facut remarcat, in mod treptat, datorita influentei
multor cercetatori, dintre care mai amintim pe M. Love, P.P. Halmos, G.V. Gnedenko, I.I.
Gihman, A.V. Skorohod, M. Rosenblatt, ale caror rezultate au condus, pe parcursul anilor, la
consacrarea unei teorii moderne a probabilitatilor. In acest context, remarcam scoala
ramaneasca de teoria probablitatilor si statistica matematica creata, cu aproape sase decenii in
urma, de O. Onicescu si Gh. Mihoc.
In aplicatii, modelele matematice abstracte servesc ca instrumente, modele diferite putand
sa descrie aceeasi situatie empirica. Modul in care sunt aplicate teoriile matematice nu depinde
de idei preconcepute; aceasta este o tehnica aplicata cu premeditare, care depinde de experienta
si se schimba odata cu ea.
In lucrarea de fata ne-am oprit doar la cateva dintre problemele fundamentale care trebuie
sa intre in cultura unui intelectual.
5
Autorul
INTRODUCERE

Matematicile aplicate au devenit, de mai multi ani, un domeniu prioritar in intreaga lume,
atat in procesul de instruire a studentilor, cat si in cercetare si in specializarea de varf. Desi la
noi, in tara, se vorbeste de matematici aplicate, mai ales dupa 1990, adica de un timp relativ
scurt, totusi, handicapul fata de lumea avansata, in special din punct de vedere conceptual, a
fost, dupa parerea noastra depasit.
Vorbim si noi, acum, destul de mult, despre matematici aplicate care au fost introduse ca
domeniu prioritar chiar in specializarea de cel mai inalt nivel, cum este doctoratul. Dar cat de
cuprinzator este acest domeniu, ce directii de studiu si cercetare pot fi urmate, sau chiar create,
este o chestiune nu chiar atat de simpla.
Situatia credem ca este comparabila cu ceea ce se intampla in cazul studiului sistemelor.
De exemplu, se vorbeste destul de des despre systems theory, systems science si systems
engineering, existand evenimente internationale, de mare prestigiu, consacrate acestora. Dar
pana unde tine una dintre aceste directii si de unde incepe alta, este greu de spus. Cert este ca ele
pot fi privite atat din punct de vedere ingineresc (in sensul pe care l da computing engineering).
cat si din punctul de vedere al matematicianului interesat in cercetari de matematici aplicare.
In mod cert insa, cand vorbim de matematici aplicate intelegem atat cercetari de natura
sistemica (inclusiv sisteme de decizie si sisteme informatice), cat si cercetari operationale,
calculul probabilitatilor si statistica matematica, grafuri, programare matematica, fiabilitate,
structuri algebrice, optimizari, combinatorica si oper atori.
Din toate aspectele ce pot fi luate in discutie se detasaza, in literatura universala, tematici
care se refera, mai ales, la management, modele in economie, retele de comunicatii, probleme de
transport, fiabilitate, sisteme expert si inteligenta ar tificiala, simulare si calcul.
Lucrarea este conceputa pe baza prelegerilor tinute de autor, ca profesor la Universitatea
Transilvania din Brasov, studentilor de la specializarile matematica, informatica, matematica-
fizica, relatii internationale (profi l economic) si autovehicule rutiere (profil mecanic).
Ne referim, in aceasta lucrare, la cateva aspecte oferite de studiul unor elemente, de baza,
din teoria probabilitatilor si statistica matematica, instrument de lucru deosebit de fin care, in
mod clar, se evidentiaza printre studiile privind ceea ce ne-am obisnuit sa numim, in mod
cotidian, spre exemplu, proces economic. Nu ne referim, deci, la elemente de analiza matematica
domeniu in care exista o bogata literatura de specialitate si care consideram ca trebuie sa faca
parte din alfabetul fiecarui student care se specializeaza in sistemele economice, tehnice,
matematice, fizice, chimice, biologice (ca sa numin doar cateva) si al cercetatorilor interesati in
asemenea studii. Nu ne-am propus, de asemenea, sa rezolvam problemele specifice, dintr-un
anume domeniu de preocupari, ca cel economic sau social, de exemplu, aceasta fiind exclusiv
sarcina specialistilor din acel domeniu care, insa, nu vor putea obtine rezultate riguros
fundamentate stiintific fara a implica, in studiile lor, modele matematice ca cele pe care le
promovam aici, sau ca altele, dar, bineinteles la fel de eficiente.
6
Lucrarea este conceputa in patru capitole, capitolul preliminar fiind rezervat prezentarii
catorva elemente de teoria multimilor si a semigrupurilor. Acestea sunt de un real folos in
aplicatiile din informatica, studiul limbajelor formale si al automatelor, discipline care ofera
modele eficiente, si usor de manevrat, pentru diferite aspecte ale fenomenelor economice,
lingvistice, biologice, sociologice, etc.. Prin acest capitol preliminar speram sa acoperim, cel
putin partial, lipsa unor cunostinte temeinice in aceasta directie, pe care multi cititori o acuza. In
acest fel se inlesneste intelegerea faptelor, discutate in lucrare, de catre o categorie foarte larga
de cititori.
Celelalte trei capitole sunt dedicate unor probleme be baza din teoria probabilitatilor si
statistica matematica.
Istoria dezvoltarii teoriei probabilitatilor evidentiaza o armonioasa si stimulativa mbinare
intre teorie si aplicatii: progresul teoriei deschide noi campuri pentru aplicatii care, la randul lor,
conduc la noi probleme si cercetari fructuoase. Astazi teoria probabilitatilor este aplicata in atat
de multe domenii diferite incat este necesara o teorie generala foarte flexibila pentru a putea
prevedea instrumentele de lucru cele mai potrivite pentru o varietate atat de mare de cerinte.
La inceput, scopul teoriei probabilitatilor a fost de a descrie domeniul extrem de marginit
al experientei legata de jocul intamplarii, efortul principal fiind indreptat spre calcularea
anumitor probabilitati. Abia din deceniul al patrulea al secolului nostru putem vorbi de o tratare
axiomatica, reprezentand dezvoltarea moderna a teoriei probabilitatilor, si aceasta o datoram lui
A.N. Kolmogorov.
Aceasta linie este urmata si in lucrarea de fata. Pornind de la o serie de neclaritati privind
fenomenul probabilistic, constatate de autor din discutiile purtate cu diferite persoane, in lucrare
au fost introduse multe si variate exemple, culese cu deosebita grija, dar trebuie inteles faptul ca
probabilitatile numerice nu fac obiectul principal al teoriei. Scopul lor este de a scoate la iveala
legi generale si de a constitui modele teoretice satisfacatoare.
In capitolul 2 sunt introduse notiunile de camp de evenimente, probabilitate si camp de
probabilitate, sunt stabilite formule utile de calcul si se discuta unele probleme referitoare la
independenta stochastica. S-a pus accect, in acest capitol, pe conceptul de algebra booleana ca
model matematic adecvat studierii proprietatilor unui camp de evenimente. Multiplele exemple
prezentate au menirea de a stimula interesul cititorului pentru chestiunile discutate.
Capitolul urmator este dedicat repartitiilor binomiala, Poison, multinomiala si normala,
precum si discutarii unor aspecte privitoare la aproximarea normala a repartitiei binomiale.
Notiunea de variabila aleatoare este introdusa in capitolul 4 unde se definesc si
caracteristicile sale numerice. In final, se cerceteaza functia de probabilitate si functia de
repartitie a unei variabile aleatoare.
Lucrarea se adreseaza mai ales studentilor de la I.I.D, fie ca este vorba de specializari
economice, matematica si informatica, matematica-fizica, biologie, fizica, specializarile tehnice.
Desi este restrictiva ea poate fi folosita cu succes si de profesorii din invatamantul preuniversitar
(inclusiv pentru pregatirea examenelor in vederea obtinerii gradelor didactice), inginerilor,
7
economistilor, precum si cercetatorilor interesati in utilizarea modelelor matematice bazate pe
metode ale teoriei probabilitatilor si statisticii matematice.

CAPITOLUL 1
Preliminarii de teoria multimilor

OBIECTIVE

Elementele de teoria multimilor si teoria semigrupurior ancoreaza ulterioarele elemente
probabiliste in cadrul matematicii de termininiste. Astfel cele doua laturi, cea probabilista si cea
determinista, coexista si se completeaza reciproc.

La sfarsitul acestui capitol, studentii trebuie sa-si insuseasca:
- Operatiile cu multimi
- Indicatorul unei multimi.

Acest capitol contine notiuni de baza si unele rezultate relevante din teoria multimilor si
teoria semigrupurilor. El este introdus tinand seama de faptul ca nu toti cititorii poseda, in egala
masura, un fond matematic, de baza, in acest domeniu. Speram ca, prin notiunile si rezultatele
prezentate, sa reamintim, si sa fixam, chestiunile fundamentale inlesnind, astfel, unei categorii
foarte largi de cititori, intelegerea multora dintre faptele discutate.

1.1 Elemente de teoria multimilor
Notiunea de multime (sau de colectie, de familie) are un caracter primitiv si nu se
defineste. Ea se considera ca fiind deja cunoscuta.
O multime poate fi pusa in evidenta in doua moduri diferite. Astfel, putem insira
obiectele (elementele) multimii intre doua acolade, separandu-le prin virgula.
De exemplu:
{2,3,5}, {a,b,c,d,e}, {1,2,3,4,5,...., n}.
Mai putem indica o multime exprimand proprietatea care caracterizeaza elementele
multimii.
De exemplu :
{x , x este un numar intreg si x>2}.
Sa notam elementele multimii prin litere mici din alfabetul latin sau grec: a, b ,..., x, y, z;
o, |, , ... Multimile vom fi notate prin litere mari A, B, C, ... O multime de multimi se numeste
clasa sau familie. Clasele se noteaza prin litere mari ronde A, B, C, ... . Daca obiectul a este un
element al multimii A, se scrie aeA, in timp ce daca acesta nu apartine multimii A, se scrie aeA.
8
Vom nota o multime care nu are nici un obiect prin C si o vom numi multime vida.
De exemplu
C={x, x este un numar real ai x
2
<0}.
Pentru orice element a al multimii A, multimea {a} va insemna multimea care are un
singur element a. In sensul notatiilor introduse mai inainte, rezulta ca {a
1
, a
2
,...,a
n
} este
multimea ale carei elemente sunt a
1
, a
2
, ...,a
n
si nu altele.
Daca o multimea A este finita, numarul elementelor sale, deci cardinalul multimii, va fi
notat prin card A. Evident, card A este un numar intreg nenegativ.
Definitia 1.1. Daca A si B sunt doua multimi astfel incat pentru orice obiect a, aeA
implica aeB, atunci se spune ca A este o submultime a lui B. Se va scrie A.B sau BA.
In aceste cazuri se spune ca A este inclusa sau continuta in B (sau ca B include sau
contine pe A). In egala masura se poate utiliza exprimarea : A este o parte a lui B.
In particular, pentru orice multime avem A_A.
Ne referim la . ca fiind o relatie de incluziune, astfel ca ori de cate ori A.B spunem ca A
si B sunt legate prin relatia de incluziune.
Daca A.B si B.A, atunci A=B , adica multimea A este egala cu multimea B. In caz
contrar A=B. Daca A.B si A=B, se spune ca A este o submultime proprie a lui B. Acest fapt poate
fi precizat prin notatia A.B si A=B.
Definitia 1.2. Fie A si B doua multimi. Multimea {x , xeA sau xeB} se numeste
reuniunea multimilor A si B si se noteaza AB.
Daca A este o familie de multimi, atunci se defineste A ={x , xeA pentru AeA }. Daca
se considera o familie de multimi indexate dupa i, {A
i
}
ieI
, atunci se utilizeaza notatia
{ }
A x x A pentru un i I
i
i I
i
e
= e e
U
. In cazul in care I=N
*
, se scrie A n loc de A
n
n
n
n N =

e 1
U U
;
*
.
Definitia 1.3. Dandu-se multimile A si B, se numeste intersectia lor multimea {x , xeA
i xeB} si se noteaza AB.
Pentru o familie de multimi A se defineste A ={x, xeA pentru toate multimile AeA }.
Pentru familia de multimi {A
i
}
ieI
, avem =
e i I
i
A x { ,xeA
i
pentru toti ieI}. In mod analog se scrie

A
n
n 1
in loc de
e
A
n
n N
*
, daca I=N
*
.
De exemplu, daca A
n
={xeR,,x,<1/n}, neN
*
, atunci =
=

A
n
n 1
0 { }. Reamintim ca ,x, inseamna
valoarea absoluta a lui x definita astfel :
9
x
x daca x
daca x
x daca x
= =

, ,
, ,
, .
0
0 0
0

Fiind data o multime A, familia tuturor submultimilor lui A este o familie bine definita de
multimi, numita familia partilor multimii A.
Definitia 1.4. Multimile A si B se numesc disjuncte, daca AB=C.
Daca A este o familie de multimi astfel incat fiecare pereche de multimi distincte din A
sunt disjuncte, atunci se spune ca A este o familie disjuncta (sau ca A este o familie de multimi
disjuncte doua cate doua).
Prin urmare, o familie de multimi {A
i
}
ieI
, indexate dupa i, este disjuncta daca A
i
A
j
=C
pentru orice i=j.
Sa convenim ca multimile considerate sa fie submultimi ale unei multimi universale
care s-a fixat, E.
Definitia 1.5. Daca A.E, se numeste complementara multimii A (in raport cu E)
multimea {x , xeE si xeA}. Aceasta va fi notata CA sau A
c
.
Din aceasta definitie se deduce imediat ca
CC=E si CE=C.
Urmatorul rezultat este, de asemenea, bine sa fie retinut.
Teorema 1.1. Pentru orice submultimi A si B, ale multimii universale E, astfel incat
A.B, au loc incluziunile :
1) C
B
A.CA ; 2) CB.CA,
C
B
A fiind complementara multimii A in raport cu multimea B.
Urmeaza, deci, ca pentru orice A.E avem C(CA)=A.
Definitia 1.6. Dandu-se multimile A si B, multimea {x , xeA i xeB} se numeste
diferenta multimilor A si B. O vom nota A\B.
Operatiile definite pot fi exemplificate in felul urmator. Fie multimile A={a, b, c} si
B={b, d}. Atunci
AB={a, b, c, d} ; AB={b} . A\B={a, c} , C
A
B nu are sens.
Referitor la complementarele unor multimi sunt imediate relatiile din teorema urmatoare.
Teorema 1.2. (Relatiile lui De Morgan). Au loc urmatoarele relatii intre multimi:
a) C(AB)=CA CB ;
b) C(AB)=CA CB ;
10
c) C A CA
i
i I
i
i I e e
|
\

|
.
| = ;
d) C A CA
i I
i
i I
i
e
|
\

|
.
| =
e
.
Cu ajutorul operatiilor de reuniune si intersectie se poate defini o noua operatie
importanta cu multimi.
Definitia 1.7. Se numeste diferenta simetrica a multimilor A si B multimea {x,xeA sau
xeB si xeAB}. Se noteaza in felul urmator: A A B.
Prin urmare, un obiect x apartine diferentei simetrice a multimilor A si B daca x apartine
in mod precis uneia dintre multimile A si B (vezi fig, 1).


Definitia 1.8. Fie A si B doua multimi. Se numeste produsul cartezian al multimilor A si
B multimea tuturor perechilor ordonate (x,y) cu xeA si yeB. Se noteaza astfel A x B.
Este important de retinut ca in definitia produsului cartezian a doua multimi se tine seama
de ordinea in care sunt date acestea. Deci, se scrie (x,y)=(a,b) daca si numai daca x=a si y=b. De
exemplu, (2,5)=(5,2).
Definitia 1.8. poate fi extinsa la un numar arbitrar A
n
, n >1, de multimi. Astfel, produsul
cartezian al multimilor A
1
,A
2
,...,A
n
se defineste in felul urmator
A
1
A
2
... A
n
={(x
1
,x
2
,...,x
n
), x
i
eA
i
pentru orice i, 1s i s n}.
Daca A
1
=A
2
=...=A
n
=A se scrie
A
1
A
2
... A
n
=A
n
.
Apare, in acest fel, ca naturala urmatoarea definitie.
Definitia 1.9. O secventa ordonata de n obiecte (sau simplu secventa sau n-uplu) consta
dintr-un numar de n obiecte date intr-o anumita ordine.
Se intelege ca n nu poate fi zero si trebuie sa fie un numar finit. O secventa de doua
elemente se numeste pereche, o secventa de trei elemente se numeste triplet, etc.
Rezulta de aici ca diferenta
simetrica a multimilor A si B poate
fi exprimata fie prin egalitatea
A A B=(A\B)(B\A),
fie prin egalitatea
AA B=(ACB)(CAB).

A
B
A AB
Fig.1
11
Definitia 1.10 Se numeste relatie orice multime de perechi. Cu alte cuvinte, o relatie este
orice multime care este o submultime a produsului cartezian a doua multimi.
Din aceasta definitie se deduce ca C este o relatie.
O submultime R a produsului cartezian AB al multimilor A si B este o relatie de la A la B.
Fie A si B doua multimi arbitrare si fie o relatie de la AB la B. Daca fiecare pereche
ordonata (a
1
, a
2
)e AA apare numai intr-o singura pereche ((a
1
, a
2
), b) a acestei relatii, atunci
aceasta relatie este o operatie binara definita pe elementele multimii A cu valori in multimea B.
(Aici binar inseamna ca doua elemente din A produc un element din B.) Se scrie, in acest caz,
a
1
a
2
=b (buneinteles ca operatia

poate fi inlocuita dupa caz cu +, sau alta operatie cunoscuta).
Daca, de exemplu, A este multimea tuturor vectorilor din spatiul cu trei dimensiuni, iar B este
multimea tuturor numerelor reale, atunci o relatie binara este produsul scalar ((v
1
, v
2
), r), sau
scris in modul obisnuit v
1
v
2
=r. Daca, insa, B este de asemenea, multimea tuturor vectorilor
tridimensionali, atunci produsul vectorial ((v
1
, v
2
),v
3
), scris in mod obisnuit v
1
v
2
=v
3
, este, si
acesta, o relatie binara.
Este util de retinut, de aici, ca o operatie definita pe elementele unei multimi poate duce
la un rezultat din aceeasi multime sau dintr-o alta multime.
Definitia 1.11. Relatia f
2
este o extensie a relatiei f
1
daca f
1
.f
2
. Despre f
1
se spune, in
acest caz, ca este o restrictie a lui f
2
.
Prin conventie vom utiliza notatia xfy pentru a indica faptul ca (x,y)ef.
Un tip special de relatie deosebit de importanta este relatia de echivalenta.
Definitia 1.12. Fie X o multime. Se numeste relatie de echivalenta definita pe X o relatie
notata ~ care este o submultime a produsului cartezian X X si care, pentru orice x,yeX, are
proprietatile:
1) x~x (reflexivitate);
2) x~y implica y~x (simetrie);
3) x~y si y~z implica x~z (tranzitivitate).
De asemenea, definitia urmatoare are mare utilitate.
Definitia 1.13. Se numeste ordine partiala definita pe o multime A o relatie s care este o
submultime a produsului cartezian A A si satisface conditiile:
1) xsx (reflexiva);
2) xsy si ysx implica x=y (antisimetrica);
3) xsy si ysz implica xsz (tranzitiva).
Daca o relatie de ordine partiala satisface si conditia
12
4) x,y eA implica xsy sau ysx,
atunci aceasta se numeste relatie de ordine liniara definita pe A (numita si simpla, completa sau
totala).
Se scrie x<y ori de cate ori xsy si x=y (x>y inseamna ysx, iar x>y inseamna y<x).
Daca relatia s satisface, de asemenea, si conditia
5) C=B.A implica existenta unui element beB cu proprietatea ca bsx pentru fiecare xeB
(adica b este cel mai mic element din B), atunci A este o multime bine ordonata.
Prin urmare , o multime partial ordonata este o pereche ordonata (A,s), unde A este o
multime, iar s este o ordine partiala pe A. Analog, o multime liniar ordonata este o pereche
ordonata (A,s), unde A este o multime, iar s este o ordine liniara (sau simpla, completa, totala)
pe A. In sfarsit, (A,s) cu s o relatie de buna ordonare pe A este o multime bine ordonata.
Fie A o multime liniar ordonata si (x,y)eA. Daca xsy, atunci se defineste max{x,y}=y; iar
daca ysx, se defineste max{x,y}=x.
Daca {x
1
,x
2
,...,x
n
} este o submultime finita a lui A (cu elemente x
i
,i=1,2,...,n, nu in mod
necesar toate distincte) se defineste max{x
1
,x
2
,...,x
n
} ca fiind max{x
n
, max{x
1
,x
2
,...,x
n-1
}} .
In mod similar se definesc expresiile min{x,y} si min{x
1
,x
2
,...,x
n
}.
In sensul definitiilor date rezulta ca relatia de incluziune . este o relatie de ordine
partiala pe o familie A de multimi; iar perechea ordonata (A, .) este o multime partial ordonata.
Ori de cate ori vom intalni asemenea situatii, ne vom exprima spunand ca familia A de multimi
este partial ordonata prin relatia de incluziune.
Exemple:
1. Sa consideram multimea tuturor numerelor rationale nenegative
A={x,xeQ, x>0}
si fie s ordinea naturala definta pe A. Atunci, s este o relatie de ordine liniara pe A si cel mai mic
element al lui A este 0. Multimea A, insa, cu aceasta ordine, nu este bine ordonata deoarece
exista submultimi nevide ale lui A care nu contin un cel mai mic element. Astfel, considerand
multimea B={xeA , x= 0} , ori de cate ori xeB , avem x/2eB , deci B nu contine un cel mai mic
element.
2. Multimea N* a tututor numerelor intregi pozitive, cu relatia de ordine naturala, este o
multime liniar ordonata. De asemenea, N* este si o multime bine ordonata.
Daca f este o relatie si A o multime atunci, prin definitie, multimea
f(A)={y ,(x,y)ef pentru xeA}
poarta denumirea de imagine a lui A prin f.
13
Definitia 1.14. Daca f este o functie astfel incat dom f=X si codom f.Y, atunci se spune
ca f este o functie de la (pe) X in (la) Y. Se scrie f:XY. Daca codom f= Y, atunci se spune ca f
este o functie pe Y.
Revenind la definitia 1.9, se poate spune ca o secventa este o functie al carei domeniu de
definitie este N*. Daca x este o secventa, valoarea sa in n se noteaz x
n
sau x(n). Valoarea x
n
se
numeste al n-lea termen al secventei. Secventa x avand al n-lea termen x
n
se noteaza prin , , x
n
n=

1

sau simplu prin (x
n
). O secventa (x
n
) se spune ca este din X daca x
n
eX pentru orice neN*
1)
. Prin
abuz de notatie se scrie (x
n
).X.
Teorema 1.3. Fie F o familie de functii astfel incat f,g e F implica ori f.g, ori g.f,
adica F este ordonata liniar relativ la .. Sa notam h= F. Atunci:
1) h este o functie;
2) dom h={dom f , fe F };
3) xe dom h implica h(x)=f(x) pentru orice fe F astfel incat xe dom f;
4) codom h={codom f , fe F}.
Demonstratie:
1) In mod clar h este o relatie deoarece este o reuniune de multimi de perechi ordonate.
Ramane, deci, de aratat ca h este monovalenta. Fie (x,y)eh si (x,z)eh. Atunci exista f si g in F
astfel incat (x,y)ef si (x,z)eg . Se stie insa, din iopteza, ca f.g sau g.f. Sa presupunem ca f.g.
Atunci (x,y)eg si (x,z)eg, iar, pentru ca g este o functie, avem y=z. Prin urmare, h este o functie.
2) Aceasta rezulta din faptul ca urmatoarele afirmatii sunt doua cate doua echivalente: x
edom h; (x,y)eh pentru elemente y; (x,y)ef pentru feF; xe dom f pentru feF.
3) Fie xe dom h dom f = dom f, unde feF. Atunci, (x,f(x))ef.h si h este monovalenta
asa ca h(x)=f(x).
4) Are loc succesiunea de egalitati
codom h=h ( dom h) = h( { dom f , feF}) = {h (dom f) , feF}=
{f (dom f), feF} = {codom f, feF}.
In sfarsit, urmatoarea definitie introduce notiunea de functie caracteristica (sau
indicatorul ) unei multimi.
Definitia 1.15. Fie A o multime si B o submultime a sa. Functia I
B
, cu domeniul de
definitie A si domeniul de valori continut in {0,1} astfel incat
I
B
(x) =
1
0
,
,
daca x B
daca x A C B
A
e
e

,

1)
N*={1,2,3,...,n,...}, N={0,1,2,3,...,n,...}, Z={..., -n,...,-1,0,1,...,n,...}.
14
se numeste functia caracteristica ( sau indicatorul ) a multimii B.
Reciproc, fiecare functie de x care ia valori 0 sau 1 este o functie caracteristica a multimii
pentru punctele in care aceasta ia valoarea 1. Se verifica urmatoarele corespondente biunivoce si
relatii (: va insemna corespondenta biunivoca):
I
C
=0, I
E
=1, I
A
+ I
A
C
=1,
I
A
sI
B
: A .B, I
A
= I
B
: A=B,
I
AB
=0 : AB=C, I
An
=H I
An
,
daca A
n
sunt multimi disjuncte, atunci I
An
=_ I
an
,
I
An
= I I I I I I
A A A A A A
1 1 2 1 2 3
1 1 1 + + + ( ) ( )( ) ....... .
Exista o functie caracteristica particulara careia, datorita frecventei cu care este folosita, i
s-a atribuit un simbol special. In acest scop se defineste diagonala D a produsului cartezian
A A ca fiind multimea D={(x,x),xeA}. Valoarea functiei caracteristice a multimii D in (x,y) se
noteaza prin o
xy
si se numeste simbolul o al lui Kronecker. Astfel, pentru punctele arbitrare x si y
din A avem
o
xy
dac x y
dac x y
=
=
=

1
0
, \ ,
, \ .

Definitia 1.16. O multime se numeste recursiva daca are o functie caracteristica recursiva
2)
.
Cu alte cuvinte, o multime A este recursiva daca si numai daca exista o functie recursiva
f astfel incat, oricare ar fi x, atunci xeA implica f(x)=1 si xeCA implica f(x)=0.
Prin urmare, ori de cate ori exista un procedeu efectiv pentru a decide, dandu-se un x,
daca x este sau nu un element al multimii A, se va spune ca A este recursiva. De exemplu,
multimea numerelor intregi pozitive pare {0,2,4,...} este recursiva. In general, orice multime
finita este recursiva.
Definitia 1.17. Se spune ca multimea A este enumerabila recursiv daca ori are loc
egalitatea A=C, ori exista o functie recursiva f astfel incat A=codom f.
Prin urmare, o multime este enumerabila recursiv daca exista un procedeu efectiv pentru
inregistrarea elementelor multimii ( care se pot repeta).
Amintim urmatoarele doua rezultate importante.
Teorema 1.4. Daca A este o multime recursiva atunci, ea este o multime enumerabila
recursiv.

2)
O procedura consta, in general, dintr-o multime finita de instructiuni care pot fi executate intr-un interval fixat de
timp si cu un volum de munca, de asemenea, fixat. O procedura poate avea un numar arbitrar de intrari si iesiri. Ea
defineste o aplicatie de la multimea tuturor intrarilor permise la o multime de iesiri. Aplicatia definita de o
procedura se numeste functie partial recursiva sau functie recursiva.
15
Teorema 1.5. Multimea A este recursiva daca si numai daca A si CA sunt ambele
enumerabile recursiv.

1.2 Elemente de teoria semigrupurilor
O lege interna de compozitie (sau lege de compozitie) pe o multime A este o aplicatie a
produsului cartezian AA in A, adica o aplicatie care asigura fiecarei perechi ordonate (a,b), de
elemente din A, un element C din A, numit compusul lor.
In general, compusul elementelor a si b se noteaza a+b sau ab sau ab. In primul caz
compusul se numeste suma elementelor a si b si se va spune ca legea de compozitie este aditiva ;
iar in celelalte doua cazuri compusul se numeste produsul elementelor a si b si se va spune ca
legea de compozitie este multiplicativa.
Exista, insa, situatii in care nu se face distinctie intre legea aditiva de compozitie si cea
multiplicativa. In acest caz compusul elementelor a si b poate fi notat atb, acesta putand fi ori
suma ori produsul dintre a si b.
Se va spune despre o lege de compozitie t, definita pe multimea A, ca este asociativa
daca , , , , a b c a b c t t t t =
pentru toate elementele a, b si c din A.
Exemplu. Fie S o multime arbitrara si A multimea tuturor aplicatiilor lui S in ea insasi, cu legea
de compozitie (f,g) fg, unde (f g)(x)=f(g(x)) pentru orice xeS. Aceasta lege de compozitie
este asociativa intrucat daca f, g si h sunt elemente din A, atunci
, , , , , , , , , , , , , , , , , ,
f g h x f g h x f g h x = =
Si , , , , , , , , , , , , , , , , , ,
f g h x f g h x f g h x = = ,
oricare ar fi xeS, ceea ce dovedeste ca legea de compozitie data este asociativa. Un element e
se numeste element neutru, pentru o lege de compozitie t din A, daca
a e e a a t t = = ,
oricare ar fi aeA.
Teorema 2.1. Exista un element neutru si numai unul singur pentru o lege de compozitie
t pe A.
Demonstratie. Sa presupunem ca exista doua elemente neutre distincte e si e

. Atunci au
loc egalitatile ete

=e

si ete

=e , de unde rezulta e=e

.
Elementul neutru pentru o lege de compozitie aditiva se noteaza, de obicei, prin 0, in
timp ce elementul neutru pentru o lege de compozitie multiplicativa se obisnuieste sa se noteze
prin 1.
16
Definitia 2.1. Un semigrup este o pereche ordonata (A,), unde A este o multime nevida,
iar o operatie binara asociativa (adica o aplicatie a produsului cartezian AA in A).
Prin urmare, daca x
1
, x
2
, x
3
, sunt elemente arbitrare din A, are loc relatia
(x,x
2
)x
3
=x
1
(x
2
x
3
).
Ori de cate ori nu exista pericolul unei confuzii, vom nota semigrupul prin A in loc de (A,
) ; de asemenea, vom scrie x
1
x
2
in loc de x
1
x
2
.
Se va intelege prin ordinul semigrupului A cardinalul multimii A, care va fi notat prin
card A.
Elementul eeA este un idempotent daca si numai daca e
2
=e . Se va spune ca e este un
element unitate stang (drept) daca si numai daca pentru orice xeA, ex=x (xe=x) . In particular,
daca ex=e (xe=e) , se mai spune ca e este un zero stang (drept). Evident, orice element unitate
(in particular zero) este idempotent. Daca pentru orice xeA are loc dubla egalitate xe=x=ex ,
atunci eeA este un element unitate (daca xe=e=ex, atunci eeA este un zero).
Definitia 2.2. Un monoid este un semigrup cu element unitate. Un grup este un monoid A
astfel incat pentru fiecare xeA exista un elemet x
-1
eA , numit invers lui x , cu proprietatea ca xx
-
1
=e=x
-1
x, unde e este elementul unitate al lui A.
Se observa fara dificultate ca daca x
1
si x
2
ar fi doua inverse distincte ale elementului
xeA, atunci x
1
=xxx
2
=(x
1
x)x
2
=ex
2
=x
2
. Prin urmare, orice element xeA are cel mult un invers.
Un semigrup A este comunicativ sau abelian daca si numai daca x
1
x
2
=x
2
x
1
pentru orice
x
1
,x
2
eA .
Daca (x
1
, . . . , x
n
) este o secventa finita de elemente din A, atunci
x
1
x
2
. . . x
n
= x
1
(x
2
. . . (x
n-1
x
n
) . . . ).
Definitia 2.3. Fie semigrupul A. Atunci S_A este un subsemigrup al lui A daca si numai
daca S=C si, pentru orice s
1
,s
2
eS, s
1
s
2
eS,. Se spune ca S este un subsemigrup propriu maximal
al lui A daca si numai daca S=A si, ori de cate ori au loc incluziunile S_V_A cu V un semigrup al
lui A, atunci S= V sau V= S.
Daca X este o submultime nevida a lui A atunci, se obisnuieste sa se noteze prin <X>
subsemigrupul generat de X , adica cel mai mic subsemigrup al lui A care contine pe X. Cu alte
cuvinte, subsemigrupul generat de X este intersectia tuturor subsemigrupurilor lui A care contin
pe X. Este vizibil ca intersectia subsemigrupurilor unui semigrup este vida sau este un alt
subsemigrup. <X> este, atunci, multimea tuturor produselor finite x
1
x
2
. . . x
n
ale elementelor lui
X.
Se va spune ca X genereaza multimea A daca si numai daca <X> =A. Este evident ca <A> = A.
17
Definitia 2.4. Fie A
1
si A
2
doua semigrupuri. Atunci aplicatia h:A
1
A
2
este un
omomorfism daca si numai daca h(x
1
x
2
)=h(x
1
)h(x
2
) pentru orice x
1
,x
2
eA
1
. Daca X_A
1
, se va nota
prin h(X) multimea {yeA
2
, y=h(x) pentru xeX}.
Avand in vedere clasificarea aplicatiilor, se poate face o clasificare a omomorfismelor.
Astfel, un omomorfism care este injectiv se numeste monomorfism (adica daca pentru orice
x
1
,x
2
eA
1
, x
1
=x
2
implica h(x
1
)=h(x
2
) ). Un omomorfism care este surjectiv se numeste epimorfism
(adica daca h(A
1
)=A
2
); in acest caz se va spune despre A
2
ca este imaginea omomorfa a lui A
1
. Un
omomorfism care este o bijectie poarta numele de izomorfism. Se va spune ca A
1
este izomorf cu
A
2
(se scrie A
1
~A
2
) daca si numai daca exista un izomorfism h al lui A
1
cu A
2
.
Daca h este un izomorfism, atunci se poate defini inversul lui h, notat h
-1
, astfel: pentru
fiecare xeA
2
, h
-1
(x) este unicul element din A
1
astfel incat h|h
-1
(x)] = x. Cum h
-1
este
un izomorfism, nu este greu de observat ca ~ este o relatie de echivalenta pe clasa
semigrupurilor.
Un omomorfism al unui semigrup A in el insusi poarta denumirea de endomorfism al lui
A; in cazul in care acesta este un izomorfism al lui A cu el insusi, se numeste un automorfism al
lui A.
Teorema 2.2. Fie h un omomorfism al lui A
1
in A
2
si se presupune ca exista o aplicatie f
a lui A
2
in A
1
cu urmatoarele proprietati: f

h este aplicatia identitate a lui A


1
si h

f este
aplicatia identitate a lui A
2
. Atunci h este un izomorfism al lui A
1
cu A
2
.
Demonstatie. Fie pentru aceasta x
1
si x
2
elemente din A
1
astfel incat h(x
1
)=h(x
2
). Atunci x
1
= (f

h)(x
1
)=f(h(x
1
))=f(h(x
2
))=(f

h)(x
2
)=x
2
, ceea ce dovedeste ca h este o injectie. Fie x
3
un
element oarecare din A
2
astfel incat f(x
3
)=x. Atunci h(x)=h(f(x
3
))=(h

f)(x
3
)=x
3
, de unde rezulta ca
h este o surjectie. Prin urmare, h este un izomorfism.
Exemple:
1. Fie X o multime data. Printr-o relatie R definita pe X se intelege orice submultime
R_XX (conform definitiei 1.10). Pentru x
1
,x
2
eX se va scrie x
1
Rx
2
sau x
1
x
2
(mod R) daca
si numai daca (x
1
,x
2
)eR. Atunci semigrupul tuturor relatiilor definite pe X, adica (2
XX
, ) are
legea de compozitie
R
1
R
2
={(x,y) , exista zeX, (x,z)eR
1
,(z,y)eR
2
}.
Fie R o relatie si sa notam R
-1
={(y,x), (x,y)eR}. Atunci (RT)
-1
=T
-1
R
-1
pentru toate
relatiile T, R definite pe X. Se poate defini pe X o relatie identica I(X)={(x,x) , xeX}.
Incluziunea este o relatie de ordine partiala pe multimea tuturor relatiilor definite pe X
(conform cu 1.1.); aceasta ordine partiala formeaza o latice cand este limitata la relatii de
echivalenta. Astfel, o latice este o relatie de ordine partiala pentru care orice pereche de elemente
are o cea mai mica margine superioara (M) si o cea mai mare margine inferioara (m). Daca R
1
si
R
2
sunt relatii de echivalenta, m(R
1
,R
2
)=R
1
R
2
, iar M(R
1
,R
2
)={(R
1
R
2
)
n
, 1s n< },
18
inchiderea tranzitiva a lui R
1
R
2
. Deci x este echivalent cu y in M(R
1
,R
2
) daca si numai daca
exista secventa x=x
0
,x
1
,....,x
n
=y astfel incat x
i
R
1
x
i+1
sau x
i
R
2
x
i+1
pentru i=0,1,2,...,n-1. Daca R
1
si
R
2
sunt relatii de echivalenta pentru care R
1
R
2
=R
2
R
1
atunci, se observa ca R
1
R
2
este o relatie de
echivalenta si R
1
R
2
=M(R
1
R
2
) de asemenea.
2. Fie S o multime nevida. Atunci semigrupul liber necomutativ fara element unitate
generat de S, notat _S, este multimea tuturor multimilor finite nevide ordonate de elemente ale
lui S cu operatia de semigrup definita prin concatenare, adica (x
1
,...,x
n
)
(y
1
,...,y
m
)=(x
1
,...,x
n
,y
1
,...,y
m
) . _S este un semigrup infinit.
Se spune ca _S este semigrupul liber generat de S, deoarece orice aplicatie a multimii S
intr-un semigrup A are o extensie unica
I
la un omomorfism al lui _S in A, definit prin relatia

I
(x
1
,...,x
n
)=(x
1
)...(x
n
). In particular, daca S este o multime de generatori ai lui A, iar
aplicatia identica atunci,
I
> _S A este un epimorfism astfel incat fiecare semigrup este o
imagine omomorfa a unui semigrup liber.
3. Fie A un semigrup. a) Se defineste semigrupul A
1
dupa cum urmeaza. Daca A este
monoid, A
1
=A. Daca A nu este un monoid atunci, A
1
=A{1}, unde 1eA, operatia de multiplicare
in A ramane neschimbata si 1 opereaza ca un element unitate pentru A{1}. b) Se defineste
semigrupul A
0
in felul urmator. Daca A are un zero si card A>1 atunci, A
0
=A. In caz contrar,
A
0
=A{0}, unde oeA, operatia de multiplicare in A ramane neschimbata, iar 0 actioneaza ca un
zero pentru A{0}. c) Se defineste semigrupul A
I
ca fiind A{I}, unde IeA, operatia de
multiplicare in A ramane neschimbata, iar I actioneaza ca un element unitate pentru A{I}. De
retinut ca A=A
I
, chiar daca A este un monoid. De asemenea, A este un subsemigrup al lui A
1
, A
0
si A
I
.
Elementul 1 din (_A)
1
va fi identificat cu multimea vida. Vom utiliza pentru ( _A)
1
notatia A
*
.
4. Fie A si B multimi nevide si F(A,B) multimea tuturor functiilor de la A la B. Se scrie
F(A) in loc de F(A, B). Se noteaza prin F
S
(A) semigrupul (F(A),) unde (fg)(a)=f(g(a)) pentru
aeA. In mod similar F
D
(A) este semigrupul (F(a),

), unde (f

g)(a)=g(f(a)). In cazul
semigrupului F
D
(A) se mai obisnuieste sa de scrie (a)f in loc de f(a) , astfel ca (a)(f

g)=(((a)f)g).
Fie A un semigrup. Se defineste aplicatia S:F
S
(A
1
) prin S(x)(y)=xy pentru xeA si yeA
1
.
Aplicatia S este un omomorfism injectiv deoarece S(x
1
x
2
)(y)=x
1
x
2
y=S(x
1
)|S(x
2
)(y)]=S(x
1
)S(x
2
)(y)
si S(x)(1)=x pentru orice x, x
1
, x
2
eA si yeA
1
. Monomorfismul S se numeste reprezentarea
regulata stanga a lui A. Prin urmare, fiecare semigrup este izomorf cu un semigrup al lui F
S
(A)
pentru o multime A.
Analog se defineste aplicatia D:AF
D
(A
1
) data prin (y)D(x)=yx pentru yeA
1
si xeA. De
asemenea, D este un momomorfism numit reprezentarea regulata dreapta a lui A.
Este bine de retinut ca F
D
(X) este izomorf cu subsemigrupul semigrupului (2
XX
, ), care
consta din toate relatiile R avand proprietatea ca, pentru fiecare x, (x,y)eR pentru un singur y.
Analog, F
S
(X) este izomorf cu subsemigrupul care consta din toate relatiile R cu proprietatea ca,
pentru orice y, (x, y)eR pentru un singur x.
19
CAPITOLUL 2
CAMP DE PROBABILITATE

OBIECTIVE

Elementele de baza ale Teoriei Probabilitatii:(camp de evenimente, camp de
probabilitate, scheme probabiliste) sunt de natura pragmatica. Este facuta legatura intre multime
si probabilitate. Se face trecerea spre abstract.

La sfarsitul acestui capitol, studentii trebuie sa-si insuseasca:
- Definitia empirica a Probabilitatii
- Probabilitate ca functie de multime si proprietatile ei
- Probabilitati conditionate
- Scheme de probabilitate

2.1. Camp de evenimente

In acest paragraf se arata ca multimea evenimentelor asociata unei experiente provocate
sau nu, in care apar fenomene intamplatoare, are o structura algebrica asemanatoare cu structura
algebrica a partilor unei multimi, anume are o structura de algebra Boole. Rezultatul central este
exprimat in teorema care afirma ca orice camp de evenimente finit, este izomorf cu algebra
Boole a multimii partilor unei multimi finite. De asemenea, se pun in evidenta particularitatile
care diferentiaza algebra Boole asociata unui camp de evenimente infinit si algebra Boole a
multimii partilor unei multimi de cardinal transfinit (multime infinita).
Sa efectuam, de exemplu, experienta aruncarii, pe o suprafata plana, a unui zar. Acest
obiect paralelipipedic regulat are fetele numerotate de la unu la sase. Aruncandu-l pe suprafata
considerata, el se va opri aratand una din fete; iar aparitia acesteia este un fapt intamplator, caci
putem fi in prezenta fetei 1, sau 2, sau ... a fetei 6.
Aparitia fetei numerotata cu numarul natural i, 1s i s6, este un eveniment si l notam cu
E
i
.
Sa asociem experientei unele reguli de joc. De exemplu, sa cerem ca declarat castigator
sa fie cel care obtine o fata numerotata cu un numar par. Sa indicam acest eveniment cu litera A.
Daca apare o fata pe care figureaza un numar impar zicem ca suntem in prezenta evenimentului
non A pe care l indicam prin A (numit si eveniment comlementar sau contrar).
Evident nu putem avea in acelasi timp A si A, insa are loc cu siguranta evenimentul A
sau evenimentulA. Ne vom exprima spunand ca evenimentul A si A este evenimentul imposibil
si ca A sau A este evenimentul sigur. Observand ca aparitia fetei 2 atrage dupa sine
realizarea evenimentului A, spunem ca evenimentul E
2
implica evenimentul A si scriem E
2
A.
20
Astfel, E
2
A , E
4
A , E
6
A , E
3
A etc.; insa E
2
nu implica evenimentul A si scriem
E
2
/ A.
Asociind jocului de fata si regula: jucatorul primeste dublul mizei daca are loc
evenimentul E
i
cu is 3, eveniment pe care l desemnam prin litera B, rezulta ca evenimentul E
2

este privilegiat si are loc, daca si numai daca au loc evenimentele A si B.
Imaginand diverse reguli de joc se vede ca experientei aruncarii cu zarul i putem asocia
o multime de evenimente. Sa indicam aceasta multime prin litera P.
Daca facem conventia, de altfel naturala, sa consideram ca doua evenimente sunt identice
(egale) daca se implica reciproc, observam ca implicatia este o relatie binara pe multimea
P care are urmatoarele proprietati:
1. Orice AeP se autoimplica, adica avem A A.
2. Daca A
1
, A
2
e P si A
1
A
2
, A
2
A
1
atunci A
1
= A
2
.
3. Daca A
1
, A
2
, A
3
e P si A
1
A
2
, A
2
A
3
atunci A
1
A
3
fapt care ne permite sa spunem ca
implicatia este o relatie de ordine pe P.
De asemenea, observand ca odata cu evenimentele A
1
, A
2
e P apartin multimii P si
evenimentele A
1
sau A
2
, respectiv A
1
si A
2
, ultimul putand fi si evenimentul imposibil, pe care l
desemnam prin simbolul C , primul putand fi si evenimentul sigur pe care l desemnam prin E,
suntem in prezenta a doua legi de compozitie interne definite pe multimea P , disjunctia sau si
conjunctia si.
Punand s in loc de , v in loc de sau si . in loc de si, se poate constata,
fara dificultate ca :
Oricare ar fi evenimentele A, A
1
, A
2
, A
3
e P avem :
a. A
1
s A
1
v A
2
, A
2
s A
1
v A
2
;
b. Daca A
1
s A, A
2
s A atunci A
1
v A
2
s A;
c. A
1
. A
2
s A
1
, A
1
. A
2
s A
2
;
d. Daca A s A
1
, A s A
2
atunci A s A
1
. A
2
;
e. A
1
. ( A
2
v A
3
) = (A
1
. A
2
)v (A
1
. A
3
);
f. Odata cu Ae P, A apartine lui P si A vA =E, A .A = C,
fapte care au loc pe multimea evenimentelor asociate oricarei experiente in care intervin
fenomene intamplatoare.
Pentru a fixa ideile introducem
Definitia 2.1.1 O multime L se numeste latice daca pe L s-a dat o relatie s numita
relatie de ordine si doua operatii v, . numite supremum si infimum, care satisfac
urmatoarele axiome:
L
1
. Oricare ar fi elementele m,n,p e L avem :
a. m s m;
b. daca m s n si n s m atunci m=n;
c. daca m s n si n s p atunci m s p.
21
L
2
. Oricare ar fi elementele m,n,p e L avem :
a. m s m v n, n s mv n;
b. relatiile m s p, n s p implica mv n s p;
c. m . n s m, m . n s n;
d. relatiile p s m, p s n implica p s m. n .
O latice L se zice ca este distributiva daca oricare ar fi m,n,pe L avem
m . (nv p) = (m . n )v (m . p).
O latice L se zice ca este complementata daca in L exista :
e. un element T numit element total cu proprietatea ca orice le L satisface conditia lsT;
f. un element C numit element nul cu proprietatea ca orice le L satisface conditia C s
l si
g. pentru orice leL exista cel putin un l din L numit complementul elementului l, astfel
incat sa avem
l .l =C, l v l=T.
O latice L complementata si distributiva se numeste algebra Boole.
Indicand, in general, cu K multimea evenimentelor asociate unei experiente, in care
intervin fenomene intamplatoare, avem
Teorema 2.1.1. Multimea K are o structura de algebra Boole in raport cu implicatia
considerata drept relatie de ordine, disjunctia, respectiv conjunctia evenimentelor considerate
drept supremum si infimum, rolul elementului total fiind jucat de evenimentul sigur, iar cel al
elementului nul de evenimentul imposibil.
Un exemplu tipic de algebra Boole l constituie multimea partilor unei multimi finite sau
infinite X notata de obicei cu P(X). Incluziunea joaca rolul de relatie de ordine, reuniunea rolul
de supremum, intersectia de infimum, elementul total fiind insasi multimea X, iar elementul nul
multimea vida.
Definitia 2.1.2. Algebra Boole K asociata unei experiente in care intervin fenomene
aleatoare (intamplatoare) poarta numele de camp de evenimente. Campul de evenimente se spune
ca este finit daca cardinalul multimii K este un numar natural, si se spune ca este infinit in cazul
contrar.
Astfel, algebra Boole apare ca un model matematic al notiunii noastre intuitive de camp
de evenimente.
Un exemplu de camp de evenimente finit este campul P asociat experientei aruncarii cu
zarul.
In adevar P este multimea alcatuita din 6 evenimente de tipul E
i
, 15 evenimente de tipul
E E i i
i i
1 2
1 2
v = , 20 evenimente de tipul E E E i i i
i i i
1 2 3
1 2 3
v v = = , 15 evenimente de tipul
E E E E i i i i
i i i i
1 2 3 4
1 2 3 4
v v v = = = , 6 evenimente de tipul
E E E E E i i i i i
i i i i i
1 2 3 4 5
1 2 3 4 5
v v v v = = = = , evenimentul
22
E E E E E E
i i i i i i
1 2 3 4 5 6
v v v v v care este, de fapt, evenimentul total si evenimentul imposibil
C, cum se constata imediat daca observam ca in orice algebra Boole L avem :
mv m = m ; m . m = m ; m v (n v p) = (m v n )v p ; m . (n . p) = (m . n ) . p ;
m v (n . p) = (m v n ) . (m v p) oricare ar fi m, n, p eL.
Numarul total de evenimente care alcatuiesc acest sistem este egal cu 2
6
. Vom spune ca
multimea P, considerata mai sus, formeaza un sistem complet de evenimente.
De asemenea, campul de evenimente asociat experientei aruncarii cu banul este finit si
este alcatuit din evenimentele: E
1
(stema), E
2
(banul), E
1
v E
2
evenimentul total si E
1
. E
2
= C
evenimentul imposibil.
Campul de evenimente asociat experientei urmatoare nu este finit. Se considera un
recipient umplut cu un fluid. In acest recipient sa distingem unele portiuni delimitate prin
membrane permeabile. Aparitia unei particole intr-o portiune S este un eveniment intamplator.
Pozitia particolei intr-un punct oarecare din recipient este un eveniment si, cum
recipientul are o infinitate de puncte, campul evenimentelor asociat experientei este infinit.
Evenimentul sigur este SvS, iar cel imposibil este, de exemplu, S.S deoarece particola nu
poate fi in acelasi timp si in portiunea S si in afara ei.
Definitia 2.1.3. Fie L o algebra Boole. Un element aeL, nenul, (a= C), daca exista, se
numeste atom daca relatia x< a , (xs a, x=a), implica x= C.
Astfel, in algebra Boole asociata experientei aruncarii cu zarul, evenimentele E
1
,E
2
,...,E
6

sunt atomi.
In algebra Boole P(X) a partilor unei multimi X, multimile {x} cu xe X sunt atomi.
Definitia 2.1.4. O algebra Boole se zice ca este elementara daca are atomi si daca orice
element al algebrei se exprima ca supremul atomilor care l preced, anume daca
{ }
x L x p A
o o
o e s e , este multimea tuturor atomilor care preced elementul p, avem
p x
A
=
v
e o
o
. Aici A este o multime de indici care indexeaza atomi ce preced elementul p.
Algebra partilor unei multimi este elementara. De asemenea un alt exemplu este dat in
Teorema 2.1.1 Orice algebra Boole finita este elementara.
In adevar, fie L o algebra finita. Sa numerotam elementele nenule ale lui L astfel x
1
, x
2
, ...,
x
n
. Daca elementul x
1
nu are precedenti el este un atom. Daca x
1
are precedenti, renumerotand
elementele x
i
cu i=1 convenabil, putem presupune ca x
2
este unul dintre acestia. Daca x
2
nu are
precedenti el este un atom. Daca are precedenti, putem proceda cu acesta asa cum am procedat
cu x
1
. In acest mod putem afirma ca oricare ar fi elementul xeL, exista un atom aeL cu
proprietatea as x.
Fie
{ }
a
A
o
oe
familia tuturor atomilor care preced elementul x. Multimea A este o multime
finita. Afirmam ca x a
A
= v
e o
o
. Sa presupunem contrarul, adica v s
e o
o
A
a x. Indicand cu
23
v
e o
o
A
a complementul elementului v
e o
o
A
a trebuie sa avem x a
A
. v
|
\

|
.
|
= C
e o
o
. Conform celor de
mai sus, exista un atom a cu proprietatea a x a
A
s . v
|
\

|
.
|
e o
o
.
De aici rezulta ca asx si contrazicem faptul ca familia
{ }
a
A
o
oe
este alcatuita din toti
atomii care-l preced pe x.
O consecinta importanta a rezultatului infatisat in teorema 2.1.1. l exprimam in
Teorema 2.1.2. Orice algebra Boole finita este izomorfa cu algebra partilor unei multimi
finite X, convenebil aleasa.
Inainte de a da demonstratia teoremei 2.1.2 vom preciza termenii si vom da un rezultat
exprimat in propozitia 2.1.1 privind izomorfismele algebrelor Boole.
Spunem ca doua algebre Boole L
1
, L
2
sunt izomorfe daca pot fi puse in corespondenta
bijectiva printr-o aplicatie : L
1
L
2
astfel incat pentru orice x, y eL
1
sa avem
, x.y, =, x, ., y,
, xvy, =, x, v, y, .
Propozitia 2.1.1. Conditia necesara si suficienta ca doua algebre Boole L
1
, L
2
sa fie
izomorfe este sa existe o bijectie : L
1
L
2
astfel incat pentru orice x, y eL
1
, din xs y sa rezulte
, x)s (y) si din (x)s (y) sa rezulte xs y.
In adevar, sa presupunem ca : L
1
L
2
este un izomorf. Deoarece relatia xsy este
echivalenta cu x=x.y, avem (x)=(x).(y), deci (x)s (y). Deoarece relatia (x)s(y) este
echivalenta cu (x)=(x).(y) si (x).(y)=(x.y) rezulta (x)=(x. y). Ca urmare x=x.y de
unde xs y.
Reciproc, sa aratam ca ansamblul implicatiilor ( xs y implica (x) s(y)) si ((x)s(y)
implica xsy) implica calitatea bijectiei : L
1
L
2
de a fi un izomorfism.
Din x.ys x, x.ys y rezulta (x.y) s (x), (x.y) s (y) de unde (x.y) s (x) . (y).
Insa (x) . (y) s (x), (x) . (y) s (y). Cum (x) . (y) e L
2
exista z e L
1
astfel
incat sa avem (z) =(x) . (y). Asadar (z) s (x), (z) s (y) de unde z s x, z s y, fapt care ne
spune ca z s x.y. Drept urmare (z) s (x . y). Deci (x) . (y) s (x . y). Dar, dupa cum am
aratat, (x.y) s (x) . (y), de unde rezulta (x.y) = (x) . (y).
Procedand asemanator, lasam in seama cititorului sa arate ca are loc si relatia (xvy) =
(x) v (y).
Acestea fiind spuse, sa trecem la demonstratia teoremei 2.1.2.
Fie L o algebra Boole finita. Sa notam cu X multimea atomilor ei. Daca pe L sa notam cu
X
p
multimea
{ }
x X x p e s . Evident X
p
eP(x), unde P(x) este multimea partilor lui X.
Considerand aplicatia : L P(x) definita prin conditia (p)=x
p
, suntem in prezenta unui
izomorfism intre algebrele L si P(x).
Evident imaginea elementului nul este multimea vida, iar imaginea elementului total T
este X. In plus (pv q) = X
p
X
q
, (x.y) = X
p
X
q
.
24
Drept consecinte ale teoremelor 2.1.1, 2.1.2 avem
Teorema 2.1.3 Orice camp de evenimente poate fi identificat cu algebra Boole a partilor
unei multimi finite, convenabil aleasa.
In aceasta identificare atomii campului se identifica cu multimile alcatuite din cate un
element, implicatia se inlocuieste cu relatia de incluziune, supremul cu reuniunea iar infimul cu
intersectia.
Definitia 2.1.5. Daca admitem ca atomii campului sunt evenimente elementare ale
acestuia, campul evenimentelor asociat experientei aruncarii cu zarul se identifica cu algebra
Boole a partilor multimii E ={1,2,3,4,5,6} care joaca rolul evenimentului sigur. Multimile
{1},{2},...,{6}, se identifica cu evenimentele elementare. Sa cercetam acum cazul algebrelor
Boole infinite. Un exemplu de algebra Boole infinita este algebra partilor unei multimi infinite
1)

. Fie X o astfel de multime si P(x) algebra Boole a partilor ei.
O particularitate deja semnalata a acestei algebre este aceea ca este o algebra elementara,
sau punctuala daca vrem sa ne apropiem de limbajul geometric punand atom punct.
O alta particularitate a acestei algebre este aceea ca este o algebra completa.
Prin definitie o algebra Boole infinita L se zice ca este completa daca oricare ar fi familia
{P
o
}
oeA
cu P
o
eL elementele v .
e e o
o
o
o
A A
P P , numite supremul si infimul familiei {P
o
}
oeA
exista si
apartin algebrei L.
2)
Astfel daca {X
o
}
oeA
este o familie arbitrara de parti ale lui X,
o
o
eA
X si
o
o
eA
X exista si apartin multimii P(x).
Fie, acum, o latice infinita oarecare L, de exemplu un camp de evenimente infinit.
In general algebrele Boole infinite nu sunt elementare (punctuale) si nici complete.
In cele ce urmeaza, din consideratii de natura practica, vom lua in consideratie numai
campuri de evenimente infinite care sunt algebre Boole elementare o - complete.
Definitia 2.1.6. O algebra Boole infinita L se zice o - completa daca odata cu orice
familie {P
o
}
oeA
, cel mult numerabila
3)
, cu P
o
e L, v .
e e o
o
o
o
A A
P P , exista si apartin algebrei.
Fie L o algebra elementara o - completa si O multimea atomilor (punctelor) ei. Daca pe L, fie
O
p
={e eO , e s p} multimea tuturor atomilor lui L care preced elementul p. Din modul cum a
fost definita O
p
eP(O) si p = v
e p
p
p
O
O , considerand aplicatia : L P(O) definita prin conditia
(p)=O
p
, suntem in prezenta unei aplicatii injective a algebrei Boole L pe multimea (L) . P(O).

1)
Amintim ca, daca indicam prin card X numarul elementelor unei multimi X, cardinalul
multimii P(X) se calculeaza dupa formula P(X)=2
card X
.
2)
v
e
P
A
o
o
se defineste astfel: pentru orice oeA avem P
o
sv
e
P
A
o
o
si, daca pentru orice oeA, avem P
o
s
p eL, atunci v
e
P
A
o
o
sp ; .
e
P
A
o
o
se defineste astfel: pentru orice oeA avem .
e
P
A
o
o
sP
o
si, daca pentru
orice oeA avem ps P
o
(peL), atunci ps .
e
P
A
o
o
.
3)
Adica multimea A este finita sau in corespondenta biunivica cu multimea numerelor naturale.
25
Injectivitatea aplicatiei confera multimii (L) o structura de algebra Boole in raport cu
. incluziunea, intersectia, si reuniunea de elemente care organizeaza multimea
partilor lui O drept algebra Boole.
Cum (L) este izomorfa cu L prin , (L) este o algebra o - completa. Ca urmare (L)
este o familie de parti ale multimii O care are proprietatile
- C e( ) L
- odata cu Xe (L), complementara multimii X apartine lui (L) si
-
o
o

e
e
I
X L ( ) pentru orice oeI ,unde I este o multime cel mult numarabila. Am
demonstrat astfel
Teorema 2.1.4. Orice algebra Boole L o - completa este izomorfa cu un corp o -
complet (corp borelian) de parti ale unei multimi O convenabil aleasa.
Definitia 2.1.7. Intelegem prin corp o - complet (corp borelian) de parti ale unei
multimi infinite O, orice familie K(O) . P(O) de parti ale lui O care satisface conditiile:
a) C e K(O) ( C multimea vida );
b) odata cu X e K(O), complementara X a lui X, apartine lui K(O);
c) oricare ar fi familia ce l mult numarabila {X
o
}
oeI
cu X
o
e K(O) avem
o
o
e
e
I
X K(O).
Rezultatele formulate in teoremele 2.1.3, 2.1.4., ne permit sa identificam campurile de
evenimente cu care lucram fie cu algebra Boole a partilor unei multimi finite O, fie cu un corp
borelian al unei multimi infinite O.. De aceea, de acum incolo vom desemna aceste campuri de
evenimente prin (O, P(O)), respectiv (O, K(O)), punand in evidenta multimea O gandita ca
ansamblul evenimentelor elementare, care este totodata evenimentul sigur. Deci, in general un
camp de evenimente nu este izomorf cu familia partilor unei multimi infinite. Cuplul (O, K(O))
l vom numi camp borelian de evenimente.
Exemplul 2.1.1. (Distributia a trei bile in trei urne).
Tabelul de mai jos infatiseaza toate situatiile posibile care apar in experimentul constand
din asezarea a trei bile in trei urne.
1. {abc, - , - } 10. {a , bc , - } 19. {- , a , bc }
2. {- , abc, - } 11. { b , ac , - } 20. { - , b , ac }
3. { - , - ,abc} 12. { c , ab , - } 21. { - , c , ab }
4. {ab , c , - } 13. { a , - , bc } 22. { a , b , c }
5. {ab , b , - } 14. { b , - , ac } 23. { a , c , b }
6. {bc , a , - } 15. { c , - , ab } 24. { b , a , c }
7. {ab , - , c } 16. { - , ab, c } 25. { b , c , a }
8. {ac , - , b } 17. { - , ac, b } 26. { c , a , b }
9. {bc , - , a } 18. { - , bc, a } 27. { c , b , a }
Tabelul 2.1
26
Fiecare dintre aceste aranjamente reprezinta un eveniment simplu, adica un punct.
Evenimentul A intr-o urna se afla un produs este realizat in grupele 1-21 si exprimam acest fapt
spunand ca evenimentul A este totalitatea punctelor 1-21. In mod similar, evenimentul B prima
urna nu este goala este totalitatea punctelor 1, 4-15, 22-27. In sfarsit, evenimentul C definit
astfel evenimentele A si B se realizeaza simultan este totalitatea celor treisprezece puncte 1, 4-15.
In acest exemplu particular s-a intamplat ca fiecare din cele 27 de puncte sa apartina fie lui A, fie
lui B, fie ambelor evenimente. Prin urmare, evenimentul ori A ori B ori ambele se realizeaza
este tot spatiul simplu si se realizeaza cu certitudine. Evenimentul D definit prin A nu se
realizeaza consta din punctele 22-27 si poate fi descris prin conditia ca nici o urna nu ramane
goala. Evenimentul prima urna este goala iar in celelalte nu se afla vreun produs este imposibil
(adica nu se realizeaza) deoarece nici un punct nu satisface aceste conditii.
Exemplul 2.1.2. (Distribuirea a r bile in n urne).
Cazul general al repartizarii a r bile in n urne poate fi studiat in acelasi mod, doar ca
numarul aranjamentelor creste rapid mpreuna cu r si n. Pentru r=3 bile si n=4 urne, spatiul
simplu contine deja 64 puncte; iar pentru r=n=10 sunt 10
10
puncte.
Folosim acest exemplu pentru a ilustra faptul important ca natura punctelor este
neesentiala din punct de vedere al teoriei. La noi spatiul simplu (mpreuna cu probabilitatea de
distributie definita in el) defineste experimentul idealizat. Utilizam limbajul pitoresc al bilelor si
urnelor dar, de fapt, acelasi spatiu simplu admite o mare varietate de interpretari practice diferite.
De aceea, atat pentru a clarifica acest aspect, cat si in vederea referirilor noastre ulterioare,
prezentam, mai jos, un numar de situatii in care fundamentul intuitiv variaza. Toate sunt, insa,
prin abstractizare echivalente cu schema plasarii a r bile in n urne, in sensul ca rezultatele difera
numai prin descrierea lor verbala. Atribuirea adecvata a probabilitatilor nu este aceeasi in toate
cazurile, dar aceasta chestiune o vom discuta mai tarziu.
a. Zile de nastere. Configuratiile posibile ale zilelor de nastere a r oameni corespunde
diferitelor aranjamente a r bile in n=365 urne (presupunand ca anul are 365 zile).
b. Accidente. Clasificarea a r accidente dupa zilele din saptamana, in care ele s-au
produs, este echivalenta cu introducerea a r bile in n=7 urne.
c. In tragerea asupra a n tinte loviturile corespund bilelor, iar tintele urnelor.
d. Oameni si profesii. Fie un grup de oameni clasificati dupa profesia pe care o au.
Clasele joaca rolul urnelor, iar oamenii pe acela al bilelor.
e. Iradiatia in biologie. Atunci cand celulele din retina ochiului sunt expuse luminii,
particulele de lumina joaca rolul bilelor, iar celulele sunt urnele modelului nostru. In
mod similar, in studiul efectului genetic al iradiatiei, cromozomii corespund urnelor
din modelul discutat iar particulele o bilelor.
f. In experimentele cu raze cosmice particulele care lovesc contoarele Geiger reprezinta
bilele, in timp ce contoarele functioneaza ca urne.
g. Un lift porneste cu r persoane si se opreste la n etaje. Diferitele aranjamente in care
coboara persoanele corespunde diferitelor distribuiri a r bile in n urne.
27
h. Zarul. Rezultatele posibile ale unei aruncari cu r zaruri corespund plasarii a r bile in
n=6 urne. In cazul aruncarii unei monede, insa, avem numai n=2 urne.
i. Cifre aleatoare. Posibilitatile de ordonare a unei secvente de r cifre corespund
distribuirii a r bile (corespunzatoare locurilor pe care le ocupa cifrele in secventa) in
zece urne numite 0,1,...,9.
j. Distribuirea dupa sex a r persoane. In aceasta situatie avem n=2 urne si r bile.
k. Colectie de timbre. Diferitele feluri de timbre reprezinta urnele, iar timbrele
colectionate reprezinta bilele.
l. Distributia genelor. Fiecare descendent dintr-un individ (persoana, planta sau animal)
mosteneste de la stramosi anumite gene. Daca o gena particulara poate sa apara in n
forme A
1
, ..., A
n
, atunci descendentii pot fi clasificati dupa tipul de gena. Descendentii
corespund bilelor, in timp ce genotipurile A
1
, ..., A
n
corespund urnelor.
m. Chimie. Presupunem ca un lung lant de polimeri reactioneaza cu oxigenul. Un lant
partal al acestuia poate reactiona cu 0,1,2,3,... molecule de oxigen. Aici, moleculele de
oxigen cu care se reactioneaza joaca rolul bilelor, iar lanturile de polimeri rolul urnelor
in care sunt puse bilele.
n. Greseli de tipar. Distributiile posibile a r greseli de tipar in cele n pagini ale unei carti
corespund tuturor distributiilor diferite a r bile in n urne, cu conditia ca r sa fie mai
mic decat numarul de litere pe pagina.
Exemplul 2.1.3. (Cazul bilelor care nu se pot distinge).
Sa ne intoarcem la exemnlul 2.1.1 si sa presupunem ca cele trei bile nu sunt
distincte. Aceasta inseamna ca nu mai putem distinge intre trei aranjamente cum ar fi, de
exemplu, 4,5,6 din tabelul 2.1, si, prin urmare, tabelul 2.1 se reduce la urmatoru l
1. {xxx, - , - } 6. {x , xx , - }
2. {- , xxx, - } 7. { x , - , xx }
3. { - , - ,xxx} 8. { - , xx , x }
4. {xx , x , - } 9. { - , x , xx }
5. {xx , - , x } 10. { x , x , x }

Tabelul 2.2.
Tabelul 2.2 defineste spatiul simplu al experimentului idealizat pe care l numim
plaseaza trei bile nedistincte in trei urne. Un procedeu similar se aplica in cazul distribuirii a r
bile in n urne.
Daca bilele pot sau nu pot fi distincte, in practica nu este un fapt semnificativ din punctul
de vedere al teoriei. Chiar daca ele sunt distincte, putem decide sa le tratam ca nedistincte si
vice-versa. Persoanele dintr-un lift (exemplul 2.1.2.g) evident ca sunt distincte si totusi adesea
este preferabil sa le tratam ca nedistincte. De asemenea, zarurile din exemplul 2.1.2.h pot fi
colorate pentru a le face distincte dar, daca in discutarea unei probleme particulare, folosim
modelul bilelor distincte sau nedistincte, aceasta este numai o chestiune dependenta de scopul
28
urmarit si de comoditate. Alegerea poate fi dictata de natura unei probleme concrete, dar in toate
mprejurarile teoria incepe numai dupa ce a fost ales modelul adecvat, adica dupa ce a fost
definit spatiul simplu.
In schema de mai sus am considerat bilele nedistincte, dar tabelul 2.2 inca se mai refera la
prima, a doua, a treia urna, ordinea lor fiind esentiala. Sa mergem, acuma, mai departe si sa
presupunem ca nici urnele nu sunt distincte ( adica urna poate fi alesa la intamplare fara a privi
continutul ei). Atunci, daca bilele si urnele sunt nedistincte , sunt posibile numai trei
aranjamente diferite, adica {xxx, - , - }, {xx , x , - }, { x , x , x }.
Exemplul 2.1.4. (Selectia).
Presupunem ca se ia o selectie de 100 oameni pentru a estima cati oameni fumeza.
Singura proprietate a selectiei care intereseaza, in aceasta ordine de idei, este numarul x de
fumatori, care poate fi orice intreg intre 0 si 100. In acest caz putem accepta ca spatiul nostru
abstract consta din cele 101 puncte 0, 1, ..., 100. Fiecare selectie particulara sau observatie este
descrisa complet prin indicarea punctului corespunzator x. Un exemplu de eveniment compus
este realizarea evenimentului majoritatea oamenilor selectionati sunt fumatori. Aceasta
inseamna ca experimentul se realizeaza intr-unul din cele 50 de evenimente simple 51, ..., 100,
dar nu se precizeaza in care. In mod similar fiecare proprietate a selectiei poate fi descrisa prin
enumerarea cazurilor corespunzatoare sau a punctelor. Pentru uniformitate, vom folosi termenul
de evenimente in loc de proprietati ale selectiei. Matematic, un eveniment este pur si simplu
totalitatea punctelor corespunzatoare.
Sa presupunem, acum, ca cei 100 de oameni din selectia noastra sunt clasificati nu numai
ca fumatori sau nefumatori dar si dupa sex. Selectia poate fi caracterizata, deci, printr-un
cvadruplu (B
f
, F
f
, B
n
, F
n
) de intregi reprezentand, in ordine, numarul de barbati si femei care
fumeaza, barbati si femei care nu fumeaza. Putem lua ca puncte cvadruplele de intregi situati
intre 0 si 100. Acestea constituie spatiul abstract. Evenimentul sunt mai multi fumatori barbati
decat femei inseamna ca in modelul nostru raportul B
f
/ B
n
este mai mare decat F
f
/ F
n
. Punctul
(73, 2, 8, 17) are aceasta proprietate, in timp ce (0, 1, 50, 49) nu o are. Evenimentul formula t
anterior poate fi descris in principiu prin enumerarea tuturor cvadruplelor avand proprietatea
specificata.
Exemplul 2.1.5. (Aruncarea monedei).
Considerand experimentul constand din aruncarea unei monede de trei ori, spatiul
abstract consta din opt puncte care pot fi reprezentate astfel: BBB, BBM, BMB, MBB, BMM,
MBM, MMB, MMM. Evenimentul A apare banul de cel putin doua ori este totalitatea primelor
patru punte; iar evenimentul C apare o singura data marca inseamna ori BBM ori BMB ori MBB,
deci A contine aceste trei puncte.
Dupa cum s-a vazut, nu ne referim la probabilitati decat in legatura cu un spatiu abstract
dat. Pornim, deci, de la notiunea de spatiu abstract si puncte ale sale pe care le vom considera, de
acum incolo, ca fiind date. Ele constituie notiuni primitive si nedefinite ale teoriei, asa cum
notiunile de punct si dreapta, de exemplu, raman nedefinite in tratarea axiomatica a geometriei
euclidiene. Natura punctelor nu priveste teoria. Spatiul abstract reprezinta un model de
29
experiment ideal in sensul ca, prin definitie, fiecare rezultat imaginabil al experimenului este
complet descris printr-un punct si numai unul singur. Are sens sa se vorbeasca despre un
eveniment A numai atunci cand este clar pentru fiecare rezultat al experimentului daca
evenimentul A s-a realizat sau nu. Colectia tuturor acelor puncte care reprezinta rezultatele in
care A s-a realizat descrie complet evenimentul. Invers, orice colectie data A care contine unul
sau mai multe puncte se poate numi un eveniment; acest eveniment poate sau nu sa se realizeze
dupa cum rezultatul experimentului este sau nu este reprezentat printr-un punct al colectiei A.
Prin urmare, definim cuvantul eveniment pentru a insemna acelasi lucru ca o totalitate de puncte.
Vom spune ca un eveniment A consta din anumite puncte, anume acelea care reprezinta
rezultatele experimentului ideal in care se realizeaza A.
Exemplul 2.1.6.
In spatiul abstract din exemplul 2.1.1. sa consideram evenimentul U constand din
punctele numerotate 1, 7, 13. Evident aceasta este o definitie formala si simpla, dar U poate fi
descris in multe moduri echivalente. De exemplu, U poate fi definit ca eveniment pentru care
sunt satisfacute urmatoarele trei conditii:
1
0
urna a doua este goala,
2
0
bila a se gaseste in prima urna,
3
0
bila b nu apare dupa c.
Fiecare dintre aceste conditii descrie ea insasi un eveniment. Evenimentul U
1
definit prin
conditia 1
0
consta din punctele 1, 3, 7-9, 13-15. Evenimentul U
2
definit numai prin conditia 2
0

consta din punctele 1, 4, 5, 7, 8, 10, 13, 22, 23. In sfarsit , evenimentul U
3
definit prin conditia 3
0

contine punctele 1-4, 6, 7, 9-11, 13, 14, 16, 18-20, 22, 24, 25. Evenimentul U poate fi descris, de
asemenea, ca realizarea simultana a celor trei evenimente U
1
, U
2
, U
3
.

Aplicatii
2.1. Fie L o algebra Boole elementara. Sa se arate ca, daca a, b sunt atomi si a=b, atunci
a.b=C.
2.2. Fie (O, P(O)), (O, K(O)) un camp de probabilitate finit, respectiv infinit. Sa se arate
ca o conditie necesara si suficienta ca un eveniment oe P(O), (oeK(O)) sa fie un eveniment
elementar este ca, dat fiind Xe P(O), (XeK(O)), sa avem: sau Xo= C sau oe X.
Solutii.
2.1. Evident a.bsa, a.bsb. Daca am avea a.b=a, atunci asb. Cum a=b rezulta a= C,
fapt care nu poate avea loc. Asadar a.b=a, deci a.b=C.
In limbajul campurilor de evenimente aplicatia 2.1 poate fi formulata si astfel: in orice camp de
evenimente, orice doua evenimente elementare sunt incompatibile. Spunem ca doua evenimente
X,YeP(O) sau X,YeK(O) sunt incompatibile daca XY = C. Cu alte cuvinte doua evenimente
sunt incompatibile daca realizarea unuia exclude posibilitatea realizarii celuilalt in aceeasi proba.
2.2. Sa presupunem ca o este un eveniment elementar. Atunci, dandu-se X arbitrar, avem
Xo . o. De aici rezulta ca: Xo = C; sau Xo =o de unde urmeaza o.X.
30
Reciproc, sa presupunem ca o= C si ca X fiind dat, avem: sau Xo = C sau o.X.
Luand X.o cu X=o, avem Xo = X . Daca Xo = C, rezulta X= C; iar daca o.X rezulta X=o
fapt care trebuie exclus. Asadar, pentru orice X=o cu X.o rezulta X=C si deci o este un
eveniment elementar.
Observatie. Se poate face, deci, o prima clasificare a evenimentelor: sigure, imposibile,
intamplatoare.
De asemenea, drept consecinta a aplicatiei 2.1 avem o a doua clasificare a evenimentelor:
compatibile si incompatibile.

2.2. Probabilitate pe campuri finite de evenimente
In paragraful precedent s-au introdus notiunile de camp de evenimente finit si infinit. In
acest paragraf subiectul fundamental il constituie studiul campurilor finite de evenimente
inzestrate cu o posibilitate de evaluare a sansei, evaluare care sa dea o idee asupra realizarii sau
nerealizarii intr-o experienta a unui eveniment dorit. Amintim ca orice camp finit de evenimente
se identifica cu algebra Boole a multimii partilor unei multimi finite O, multime care este
evenimentul sigur. In aceasta identificare, rolul evenimentelor elementare este jucat de multimile
alcatuite din cate un element din multimea O, rolul evenimentelor oarecare este jucat de partile
lui O, rolul implicatiei de incluziune, al disjunctiei evenimentelor de catre reuniune, iar cel al
conjunctiei evenimentelor de intersectia lor.
Probabilitatile diferitelor evenimente sunt numere de aceeasi natura ca si distantele in
geometrie sau masele in mecanica. Teoria le presupune ca fiind date, dar nu presupune numic
referitor la valoarea lor numerica reala sau la modul in care ele sunt masurate in practica. Unele
dintre cele mai importante aplicatii sunt de natura calitativa si nu depind de valorile numerice.
Concluziile generale ale teoriei sunt aplicate in multe moduri, tot asa cum teoremele geometriei,
spre exemplu, servesc ca o baza temeinica pentru teorii fizice sau pentru aplicatii tehnice. In
relativ putinele exemple unde sunt necesare valori numerice pentru probabilitati, metodele de
procedura variaza la fel de mult ca si metodele de determinare a distantelor. Spre exemplu, sunt
putine elemente comune in practica masurarii distantelor de catre un tamplar, un topograf, un
pilot sau un astronom. In contextul nostru, insa, putem considera gradul de difuzie constant, care
este o notiune a teoriei probabilitatilor. Pentru a gasi valoarea sa numerica sunt necesare
consideratii fizice care sa o lege cu alte teorii, o masurare directa fiind imposibila. Din contra,
tabelele privind procesul mortalitatii se intocmesc pe baza unor observatii neprelucrate. In cele
mai multe aplicatii concrete determinarea probabilitatilor, sau compararea teoriei si observatiei,
necesita metode statistice mai rafinate care, la randul lor, se bazeaza pe o teorie a probabilitatilor
perfectionata.
Cand aruncam o moneda perfecta, obisnuim sa asociem probabilitatea ori cu banul
ori cu stema. Aceasta este echivalent cu a spune ca, atunci cand se arunca o moneda de n ori
toate cele 2
n
rezultate posibile au aceeasI probabilitate. Din punct de vedere teoretic aceasta este
o conventie. In mod frecvent s-a sustinut ca aceasta conventie este in mod logic inevitabila si
singura posibila, desi unii statisticieni au desconsiderat aceasta conventie, luand ca punct de
31
plecare presupuneri contradictorii (uniformitatea sau neuniformitatea din natura). De asemenea,
s-a revendicat faptul ca probabilitatile se datoresc experientei. De fapt, ori de cate ori s-au
folosit metode statistice rafinate pentru a descrie o aruncare reala a monedei, rezultatul a fost
invariabil pentru ca banul si stema nu sunt egal probabile . Si totusi, asociem modelului nostru o
moneda ideala, chiar daca nu exista monede perfecte. Astfel ca vom mentine acest model nu
numai pentru simplitatea sa logica ci, in special pentru utilitatea si aplicabilitatea sa. Desi in
multe aplicatii este suficienta o descriere exacta a realitatii, mai important este, insa, faptul
empiric ca abaterile de la schema noastra sunt totdeauna cuplate cu fenomene ca acela al pozitiei
excentrice a centrului de gravitate, spre exemplu. In acest mod, modelul nostru idealizat poate fi
extrem de folositor chiar daca el nu se aplica niciodata exact. De exemplu, in controlul statistic
de calitate modern, bazat pe metodele lui Shewhart, modelele probabiliste idealizate sunt folosite
pentru a descoperi cauzele plauzibile ale abaterilor flagrante de la aceste modele si, astfel, a le
reduce cat mai mult intr-o etapa urmatoare.
Observatii similare se pot face si in alte cazuri.
Exemplul 2.2.1. (Bile care se pot distinge).
In exemplul 2.1.1. apare cu totul natural sa se presupuna ca toate evenimentele
elementare sunt egal probabile, adica fiecare eveniment elementar are probabilitatea 1/27. Sa
consideram ca punct de pornire aceasta definitie si sa cercetam consecintele sale. Daca modelul
nostru va deveni sau nu suficient de adecvat unei experiente reale, va depinde de tipul de
fenomene la care el este aplicat. In unele aplicatii, presupunerea probabilitatilor egale este
impusa de consideratii fizice; in altele ea se introduce pentru a servi ca cel mai simplu model
pentru o orientare generala chiar daca, in mod cu totul evident, ea reprezinta numai o prima
aproximatie bruta (spre ilustrare pot fi considerate exemplele 2.1.2.(a) - zilele de nastere;
2.1.2.(g) - liftul; 2.1.2.(k) - colectia de timbre).
Exemplul 2.2.2. (Bile care nu se pot distinge; statistica Bose-Einstein).
Sa ne intoarcem la exemplul 2.1.3. al repartizarii a trei bile nedistincte in trei urne. Se
poate arata ca experimentul fazic real nu este afectat de neputinta noastra de a distinge bilele
intre ele; din punct de vedere fizic raman 27 de posibilitati diferite, chiar daca se pot distinge
numai zece forme diferite. Aceasta consideratie ne conduce sa atribuim urmatoarele probabilitati
celor zece puncte din tabelul 2.

Numarul de
ordine al
punctului
1 2 3 4 5 6 7 8 9 10
Probabilitatea 1/27 1/27 1/27 1/9 1/9 1/9 1/9 1/9 1/9 2/9

Trebuie remarcat ca pentru cele mai multe dintre aplicatiile care urmeaza exemplului
2.1.2. acest rationament apare logic, iar atribuirea probabilitatilor rezonabila. Din punct de
vedere istoric acest rationament a fost acceptat multa vreme fara rezerve si a servit in mecanica
statistica drept baza pentru derivarea statisticii Maxwell-Boltzmann pentru repartizarea a r bile in
32
n urne. In acest context a fost, evident, o surpriza cand Bose si Einstein au aratat ca anumite
particule se supun statisticii Bose-Einstein (vezi aplicatii). In cazul nostru, cu r=n=3 modelul
Bose-Einstein atribuie probabilitatea 1/10 fiecaruia dintre cele zece puncte.
Acest exemplu arata ca atribuirea diferitelor probabilitati este compatibila cu aceeasi
multime de evenimente elementare si ilustreaza complicata corelatie dintre teorie si experienta.
In particular, el ne invata sa nu avem incredere prea mare in rationamente a priori, ci sa fim
pregatiti sa acceptam scheme noi si neprevazute.
Exemplul 2.2.3. (Aruncarea monedei).
O frecventa interpretare a postulatului probabilitatilor egale necesita informatii cu privire
la experiente reale. Dar, in realitate, fiecare moneda sufera influente si este posibil sa se
conceapa experimente fizice care sa fie mult mai apropiate de modelul ideal al aruncarii monedei
decat ar face-o monedele adevarate vreodata. Pentru a avea o idee asupra fluctuatiilor la care ne
putem astepta, prezentam rezultatele unui astfel de experiment simulat care corespunde unui
numar de 10000 probe cu o moneda. Tabelul de mai jos contine numarul de aparitii ale
banuluiintr-o serie de 100 experiemente., fiecare corespunzand unei secvente de 100 probe cu
o moneda. Totalul general este 4979. Privind aceste rezultate este foarte probabil ca cititorul, la
prima vedere, sa se intrebe: este necesara, oare, o teorie mai avansata pentru a judeca in ce
masura asemenea date empirice concorda cu modelul nostru abstract? Vom reveni, deci, asupra
acestei chestiuni.

Numarul
probelor
Numarul de ori in care a aparut banul Total
0 - 1000 54 46 53 55 46 54 41 48 51 53 501
- 2000 48 46 40 53 49 49 48 54 53 45 485
- 3000 43 52 58 51 51 50 52 50 53 49 509
- 4000 58 60 54 55 50 48 47 57 52 55 536
- 5000 48 51 51 49 44 52 50 46 53 41 485
- 6000 49 50 45 52 52 48 47 47 47 51 488
- 7000 47 47 41 51 49 59 50 55 53 50 500
- 8000 53 52 46 52 44 51 48 51 46 54 497
- 9000 45 47 46 52 47 48 59 57 45 48 494
- 10000 47 41 51 48 59 51 52 55 39 41 484
Tabelul 2.3

Sa ne oprim, acum, asupra definirii probabilitatii unui eveniment oarecare si sa stabilim
cateva reguli importante de calcul.
Fie , , { }
O O , P un camp finit de evenimente asociat unei experiente.
33
Fiind dat un eveniment AeP(O) se ridica intrebarile: Efectuand experienta, evenimentul
A va avea loc sau nu ? Care este sansa ca evenimentul A sa aiba loc ? Ce se intelege prin sansa si
cum o evaluam ?
Pentru a preciza ideile sa consideram, de exemplu, experienta aruncarii cu banul. Campul
asociat experientei in cauza este alcatuit din partile multimii { } { } O = 1 2 1 , unde este evenimentul
care marcheaza aparitia stemei, iar {2} este evenimentul care marcheaza aparitia valorii.
Alegand evenimenul { } 1 , la intrebarea: care este sansa ca aruncand moneda, aceasta sa
prezinte fata marcata cu stema? Credem ca oricine va raspunde: sansele aparitiei stemei, sau fetei
pe care este marcata valoarea monedei, sunt egale.
In esenta, cel chestionat, gandeste sansa aparitiei evenimentului { } 1 , sau a evenimentului
{ } 2 , ca numar.
Definitia 2.2.1. Se numeste probabilitate (dupa matematicianul A.A. Kolmogorov) a
evenimentului AeP(O) o functie nenegativa P(A)>0, care satisface axiomele:
a) P(O) = 1;
b) Daca A,B , , . P O si A B = | , atunci are loc relatia , , , , , , P A B P A P B = + .
Definitia 2.2.2 . Orice pereche de evenimente A,BeP(O) care satisfac conditia
A B = C se spune ca sunt evenimente incompatibile.
Proprietati ale probabilitatii.
Luand in definitia 2.2.1. b) A B = = C obtinem
, , , , , , , , , , P P P P P C = CC = C + C = C 2
de unde rezulta
(2.1) P(|)=0,
fapt care ne spune ca evenimentul imposibil are probabil itatea nula.
Luand, acum, in 2.2.1. b), B A = , unde A este evenimentul contrar
4)
evenimentului A,
obtinem relatia
(2.2)
, ,
, , P A P A = = 1
formula care exprima legatura intre probabilitatea evenimentului A si probabilitatea
evenimentului contrar.
Definitia 2.2.3 . Evenimentele A
1
, . . . ,A
n
din , , P O se spune ca sunt evenimente
incompatibile daca oricare ar fi numerele i,j e{1,2, ..., n} in relatia i =j, avem A A
i j
= C.
Fara dificultate, prin inductie, se poate demonstra
Teorema 2.2.1. Daca , , A P i n
1
1 e = O , ,..., sunt n evenimente incompatibile, atunci
, , P A P A
i
i
n
i
i
n
=
=
|
\

|
.
| =
_
1
1
U
.

4)
Unii autori utilizeaza notatia CA sau A
c
pentru a desemna evenimentul contrar (numit si complementar) al
evenimentului A.
34
Sa observam ca aceasta egalitate ramane adevarata si in cazul cand se ia o multime de
indici I infinita, adica
, , P A P A
I
I
o
o
o
o
e
e
|
\

|
.
|
=
_ U
.
Intr-adevar, daca I este o multime infinita de indici, atunci, deoarece , , P O este o
multime finita, cel putin unul dintre evenimentele A se repeta de mai multe ori. Dar
evenimentele care se repeta trebuie sa coincida cu evenimentul imposibil C; iar evenimentele
care nu se repeta sunt in numar finit. Fie J multimea indicilor o pentru care evenimentul A nu se
repeta. Atunci, daca o e I J urmeaza ca A
n
=C si, prin urmare,
P A
I
o
oe
|
\

|
.
|
=
U
P A P A P A
J J I
o
o
o
o
o
o e e e
|
\

|
.
| = = _ _ ( ) ( ) .
Teorema 2.2.2. Daca , , A B P , e O si A.B atunci, P(A) s P(B) si exprimam acest fapt
spunand ca probabilitatea este functie monotona peste P(O) .
In adevar, observand ca O=A(BA)B si ca evenimentele A, BA B , sunt
evenimente incompatibile, aplicand teorema 2.2.1. rezulta
, ,
, , , ,
P A P B A P B + + = 1
Dar
, ,
, , P B P B = 1
astfel ca
, ,
, ,
, , P A P B A P B + = .
Cum numerele P(A), P(B), P(B A) sunt numere pozitive, rezulta
P(A) s P(B) .
Fie A, Be P (O) si A . B. Atunci,
, , B A B A =
si cum , , A B A = C obtinem
, , , , , , P B P A P B A = +
sau
, , , , , , P B A P B P A = .
Sa ne reamintim ca, in acest paragraf, campurile de evenimente luate in consideratie, sunt
campuri finite. Aceasta inseamna ca multimea O este o multime finita. Indicand prin x
1
, . . . , x
n

elementele ei, O= {x
1
, . . . , x
n
}, evenimentele elementare {x
1
}, {x
j
}, i=j, sunt incompatibile.
Daca P este o probabilitate pe campul (O,P(O)) atunci, punand P({x
1
})=p
i
, avem

(2.3)
P P P
n 1 2
1 + + + = ...
,
iar daca Ae P(O) este evenimentul A=
{ }
x x
i i
p 1
,..., atunci
(2.4) P(A) = P P
i i
p 1
+ + ... .
35
Acest fapt ne spune ca putem intotdeauna defini o probabilitate P peste un camp finit de
evenimente (O,P(O)), O= {x
1
, . . . , x
n
}, daca luam P(x
i
) = p
i
, unde p
i
sunt numere reale

arbitrare
supuse conditiei p
i
e|0,1], astfel incat sa avem indeplinita conditia (2.3) si, daca pentru orice A=
{ }
x x
i i
p 1
,..., e P(O), calculam probabilitatea evenimentului A cu (2.4).
In particular, daca presupunem ca evenimentele elementare ale campului de evenimente
(O= {x
1
, . . . , x
n
}, P(O)) , sunt egal probabile, deci daca luam
{ } , , { } , , { } , , | ]
P x P x P x p p p
n 1 2
0 01 = = == = = e .... , , , , atunci np=1 deci p=1/n ,
(adica probabilitatile evenimentelor sunt egale intre ele) si
(2.5) , , P A
cardA
card
num rul elemntelor ml imii A
num rul elemntelor ml imii
= =
O
O
\ ]
\ ]

formula care poate fi luata drept definitie a probabilitatii unui eveniment oarecare A apartinand
unui camp finit cu evenimente. Aceasta este definiia clasica a probabilitatii.
Ne referim la cardA ca fiind numarul rezultatelor favorabile realizarii evenumentului A,
iar la cardO ca fiind numarul rezultatelor incompatibile egal posibile ale experimentului in urma
caruia se poate realiza evenimentul A (cardA s cardO).
Exista situatii, insa, in care aceasta definitie clasica a probabilitatii se dovedeste
insuficienta, manifestand lipsuri care nu pot sa nu fie luate in seama. Ne vom referi aici, pe scurt,
la trei aspecte care vor evidentia fie imposibilitatea clasificarii evenimentelor in cazuri egal
posibile, atunci cand se aplica definitia clasica a probabilitatii, fie neputinta de a determina, in
general, numarul cazurilor.
Am vazut ca notiunea de probabilitate apare in legatura cu procesul efectuarii unei
experiente. Dar, cand se arunca zarul, sa zicem de 100 de ori, se poate numara efectiv de cate ori
a aparut fata sase. Suntem, astfel, in prezenta unei noi notiuni numita frecventa relativa, definita
in modul urmator: Daca in n experiente un eveniment s-a produs de v ori, raportul v/n se
numeste frecventa relativa a evenimentului considerat in seria de experiente efectuate.
Daca experienta se repeta de un numar mare de ori, atunci se constata ca frecventele
relative ale unor evenimente oscileaza in jurul unor anumite valori. Deci, se poate vorbi despre o
stabilitate a frecventelor relative, notiunea teoretica de probabilitate a unui eveniment neputand
fi despartita de notiunea de frecventa relativa. Mai mult chiar, se poate spune ca teoria
probabilitatilor se poate aplica numai acelor fenomene pentru care exista o stabilitate a
frecventelor relative in jurul probabilitatii. Aici este esenta legilor de probabilitate dupa care se
desfasoara o multime de fenomene ale naturii si ale vietii sociale. Dar, pentru multe fenomene,
indeplinirea unui sistem de conditii nu conduce in mod necesar la un eveniment A. In schimb,
daca se repeta experienta de un numar de ori, cu indeplinirea de fiecare data a conditiilor date, se
va observa o anumita legitate exprimata prin oscilarea frecventei relative in jurul unui numar
reprezentand elementul stabil, pe care obisnuim sa-l notam cu p. Se va spune ca, pentru aceste
fenomene, probabilitatea ca la indeplinirea sistemului de conditii date sa se realizeze
evenimentul A este egala cu p.
36
Prin urmare probabilitatea unui eveniment are sens numai atata timp cat nu se schimba
conditiile in care are loc experienta respectiva. Schimbarea acestor conditii implica schimbarea
probabilitatii. In acest sens, apare deja o prima deficienta a definitiei clasice a probabilitatii
anume, aceea de a fi rupta de realitate.
Dar numai atat. Prin relatia (2.5) se defineste probabilitatea unui eveniment A prin
raportul dintre numarul cazurilor favorabile realizarii lui A si numarul cazurilor egal posibile. Or,
o astfel de definitie are la baza tocmai posibilitatea de a discrimina aceste cazuri egal posibile.
Dar, daca ne gandim nu la fenomene mai complexe, ci doar la aceeasi experienta simpla care
consta din aruncarea cu zarul, acest zar, presupus ipotetic perfect construit si omogen, in realitate
nu poseda aceste calitati relative la perfectiunea sa. Deci in conditiile realitatii dispare chiar
probabilitatea de clasificare a fetelor zarului in cazuri egal posibile astfel ca, nici atunci cand se
considera un numar finit de cazuri posibile, de cele mai multe ori nu se poate face discriminarea
lor in cazuri egal posibile.
In sfarsit, al treilea aspect pe care-l discutam se refera la situatiile in care trebuie
considerat un numar infinit de cazuri. Sa presupunem, de exemplu, ca vrem sa determinam
probabilitatea de a obtine un numar prim luand la intamplare un numar din sirul numerelor
naturale. Este clar ca in acest caz, nu numai ca nu putem discrimina numarul cazurilor posibile,
dar ne lovim de dificultatea determinarii chiar a numarului total de cazuri.
Daca, in plus, ne gandim si la faptul ca definitia clasica a probabilitatii nu se poate aplica
unei categorii largi de fenomene naturale si sociale, tocmai din cauza imposibilitatii de a
determina numarul cazurilor favorabile sau al tuturor cazurilor egal posibile, ajungem la
concluzia ca aceste neajunsuri ale definitiei clasice a probabilitatii trebuiesc inlaturate pentru a
putea vorbi de o teorie a probabilitatii consistenta, puternic ancorata in realitate si aplicabila
fenomenelor care apar in natura si societate.
Iata doar cateva aspecte care justifica, pe deplin, incercarile facute de-a lungul timpului
pentru a da o definitie a probabilitatii care sa raspunda acestor cerinte si de construi o teorie a
probabilitatilor bazata pe algebra si analiza moderna (ne gandim la cercetarile care au urmat
orientarilor date de Banach si Lebesgue).
Asa cum s-a putut constata pana acum, una din notiunile fundamentale ale teoriei
probabilitatilor este aceea de camp de evenimente datorata initial lui von Mises
5)
. Aceasta
notiune a facut posibila construirea unei teorii a probabilitatilor riguroasa din punct de vedere
matematic, bazata pe teoria masurii. Acest mod de abordare a teoriei s-a facut remarcat in mod
treptat datorita influentei multor autori.
O tratare axiomatizata, reprezentand dezvoltarea moderna a teoriei probabilitatilor a fost
realizata de A. N. Kolmogorov
6)
caruia i se datoreste definitia 2.2.1, capabila sa elimine
neajunsurile definitiei clasice a probabilitatii. De aceea, si in expunerea de fata s-a preferat

5)
Este vorba de cartea sa Wahrscheinlichkeitsrechnung, Leipzig ind Wien , 1931 cu referiri la articolele sale
originale datand din jurul anului 1921.
6)
A.Kolmogoroff ,Grundhegriffe der Wahrscheinlichkeitsrechnung, fasc..3, vol.2 din Ergebnisse der Mathematic,
Berlin, 1933,
37
obtinerea formulei (2.5) ca o consecinta a definitiei axiomatice 2.2.1, in locul introducerii ei
apriori, prin definitie.
Revenind la cazul experientei aruncarii cu zarul nefalsificat, avem
{ } { } , ,
O = = = 1 23 4 56
1
6
1 2 6 , , , , , , , ,..., P pentru i
i
si, de exemplu, daca { } A = 235 , , , atunci

{ }
P A
card
card
( )
, ,
= = =
235
3
6
1
2 O
, adica P A ( ) = + + = =
1
6
1
6
1
6
3
6
1
2
.
Definitia 2.2.4 . Un camp finit de evenimente , , , ,
O O P inzestrat cu o probabilitate P
poarta numele de camp finit de probabilitate si se noteaza astfel:
(O, P(O), P)
Tehnica prin care putem defini o probabilitate pe un camp finit de evenimente (O, P(O)),
indicand probabilitatile evenimentelor elementare supuse conditiilor exprimate in formulele
(2.3), (2.4), poate fi utilizata cu succes intr -o gama de probleme cu caracter aplicativ.
De exemplu sa incercam sa rezolvam urmatoarea problema: Se stie ca un electromotor, o
masina unealta, un automobil etc., este un asamblaj de piese numit repere . Sa indicam cu R
1
,
R
2
, . . . , R
n
reperele din care este asamblata o masina M. In depozitul uzinei, r
i
% din piesele
marcate R
i
au defecte. Indicand cu r% numarul masinilor M la care se constata greseli de montaj,
intrebarea care se ridica este urmatoarea: care este probabilitatea ca luand la intamplare o masina
M, aceasta sa nu aiba nici un defect ?
Luata ca atare, problema de mai sus pare dificil de rezolvat. Lucrurile nu stau, insa, chiar
asa ea reducandu-se, in esenta la urmatoarea:
Fie , , , , , , , ,
O O O O
1 1 1 2 2 2
, , , , P P P P doua campuri finite de probabilitate . Sa asociem
campurilor de evenimente , , , , , , , ,
O O O O
1 1 2 2
, , , P P campul de evenimente
, , , ,
O O O O
1 2 1 2
, P unde O O
1 2
este produsul cartezian al multimilor O
1
, O
2
7)
. Sa se
defineasca pe campul , , , ,
O O O O
1 2 1 2
, P o probabilitate intim legata de probabilitatile P
1
,

P
2
.
Urmarind scopul propus, sa presupunem ca
{ } O
1 1
= x x
n
,..., , O
2
= {y
1
, ..., y
m
),
P
1
({x
i
})=p
i
, ieI={1,2, ..., n}, P
2
({y
j
})=q
j
, jeJ={1,2, ..., m}.
Observand ca

7)
Produsul cartezian a doua multimi X,Y este multimea
, , { }
X Y x y x X y Y = e e , ,
38
, ,
, , { }
{ }
{ }
, , , ,
, , { }
O O
O O O O
O O
1 2
1 2 1 2
1 2
= e e
=

=
e e
x y i I j J
x y x y
sunt evenimentele elementare ale campului P
x y
i j
i j i j
i j
i J i I
, , ,
,
,
,
U U

punand
(2.6)
{ } , ,
{ } , , { } , ,
P x y P x P y p q
i j i j i j
, = =
1 2
8)

si cerand sa avem
(2.7)
, , { }
P x y p q
i j
j J J i I I
i j
i I j J e . e . e e
|
\

|
.
| = _
' ' ' '
U U

pentru orice I

.I , J

.J, alcatuite din elemente distincte, functia


P : P, , | ]
O O
1 2
01 ,
definita mai sus, este probabilitate pe campul
, , O O O O
1 2 1 2

|
\

|
.
|
|
, P ,
numita produsul cartezian al pobabilitatilor P
1
, P
2
. Va fi notat P P P =
1 2
.
Verificarea ca functia P este o probabilitate se face fara dificultate astfel:
a) Aratam ca , , P O O
1 2
1 = . In adevar
, , { }
O O
1 2
=
e e
x y
i j
j J i I
,
U U
si tinand seama de
formula (2.7) avem
, ,
{ } , , { } , ,
P P x y P x y p q p q
i j
j J i I
i j
j
m
i
n
i j
j
m
i
n
i
i
n
j
j
m
O O
1 2
1 1 1 1 1 1
1 1 1 = _ _ = _ _ = = _ _ _
|
\

|
.
| _
|
\

|
.
|
= =
e e = = = = = =
, , .
b) Aratam ca, daca

8)
In virtutea relatiei (2.5) avem

{ } , ,
{ } { }
{ } , ,
{ } { }
p P x
card x
card
card x
m
q P j
card y
card
card y
m
i i
i i
j j
j j
= = =
= = =
1
1
2
2
O
O

Dar, fiecare din cele n rezultate incompatibile egal posibille ale experimentului in care poate sa se produca x
i
poate
fi asociat cu fiecare din cele m rezultate incompatibile egal posibile ale experimentului in care poate sa se produca x
j,

astfel

ca numarul rezultatelor incompatibile egal posibile ale experimentului in care se produc x
i
si x
j
este egal cu
nm . Din aceste nm rezultate egal posibile se deduce, rationand analog, ca sunt favorabile producerii simultane a
evenimentelor x
i
si x
j
un numar de card{x
i
} card{x
j
} rezultate. Prin urmare
39
(X
1
Y
1
)(X
2
Y
2
) = C unde X
1
, X
2
eP(O
1
) , Y
1
, Y
2
eP(O
2
)
rezulta
P((X
1
Y
1
) (X
2
Y
2
)) = P(X
1
Y
1
) +P(X
2
Y
2
).
In adevar, din teoria multimilor se stie ca
, , , , , , , , X Y X Y X X Y Y
1 1 2 2 1 2 1 2
=
si ca relatia XY=C implica X=C sau Y=C sau X=Y=C.
Aceste fapte amintite, din
, , , , X Y X Y
1 1 2 2
= C
rezulta ca
(X
1
X
2
) (Y
1
Y
2
) = C
si deci sau
X X sau Y Y sau X X Y Y
1 2 1 2 1 2 1 2
= C = C = = C , , .
Pentru a face o alegere sa luam X
1
X
2
=C si sa punem
, ,
{ }
, ,
{ }
, ,
{ }
, ,
{ }
X x x I a I
X x x I a I
Y y y J b J
Y y y J b J
a
a
ba
b
1 11 1
1
1 1
2 21 2
2
2 2
1 11
1
1 1
2 21 2
2
2 2
1
1
1
1
= = .
= = .
= = .
= = .
,..., , ,...,
,..., , ,...,
,..., , ,...,
,..., , ,...,

In virtutea ipotezei X
1
X
2
=C, avem x
1i
=x
2i
oricare ar fi ieI
1
, i eI
2
.
Asadar
, , , ,
, ,
, ,
, , , , , , { }
, , , ,
, ,
, ,
, , , , , , { }
, , , ,
, , , ,
X Y x y x y x y x y x y x y x y
X Y x y x y x y x y x y x y x y
X Y X Y
x y x y x y
b b a a b
b b a a b
1 1 11 11 11 12 11 1
1
12 11 12 1
1
1
1
11 1
1
1
1
2 2 21 21 21 22 21 2
2
21 21 21 2
2
2
2
21 2
2
2
2
1 1 2 2
11 11 11 12 11
=
=
=
=
, , , ,..., , , , ,..., , ,..., , ,..., ,
, , , ,..., , , , ,..., , ,..., , ,..., ,
, , , ,..., ,
U
, ,
, ,
, , , , , ,
, ,
, , , , , ,
, ,
, ,
, , , , , ,
1
1
12 11 12 1
1
1
1
11 1
1
1
1
21 21
21 22 21 21 21 22 21 2
2
21 21 21 2
2
2
2
21 2
2
2
2
b b a a b
b b a a b
x y x y x y x y x y
x y x y x y x y x y x y x y x y
, , ,..., , ,..., , ,..., , , , ,
, , , , , ,..., , , , ,..., , ,..., , ,..., ,
Or,

, , { } , , { }
x y x y
i j i j 1 1 1 1
, , = C


, , { } , ,
{ }
{ } { } { }
{ } { }
P x y
card x card x
nm
card x
n
card y
m
card x
card
card y
card
p q
i j
i j
i
j
i
j
i j
, = = =
= =
O O
1 2

40
unde i i I j j J daca i i sau j j , , , , e e = =
1 1


, , { }
x y x y
i j
i j
2 2
2 2 '' '
'
' , ,
|
\

|
.
|


`
)
= C
unde i i I j j J daca i i sau j j , , , ,
'
'
'
'
'
,
e e = =
2 2


, , { }
x y x y
i j
i j
1 1
2 2
, ,
' '

|
\

|
.
|


`
)
= C
pentru ca x x oricare ar fi i I i I
i
i
1
2
1 2
= e e
'
'
, .
Ca urmare,

, ,
, ,
, , , ,
P X Y p q
P X Y p q
P X Y X Y p q p q p q
i I
i j
j J
i I
i j
j J
a b a b
1 1
1
1 1
1
2 2
1
2 2
1
1 1 2 2 11 11 1
1
1
1
2
2
2
2
= _ _
= _ _
= + + + +
e e
e e '
' '
'
... ...

unde am pus { } , , { } , ,
P x p P x p
i i i i 1 1 1 2 2 2
= = , '
'
.
Asadar
, , , , , , , , , , P X Y X Y p q p q P X Y X Y
i I
i j
j J i I
i j
j J
1 1 2 2
1
1 1
1 2
2 2
2
1 1 2 2
= _ _
|
\

|
.
|
+ _ _
|
\

|
.
|
= +
e e e e '
'
'
' ceea
ce era de aratat.
Observand ca notiunea de produs cartezian a doua campuri de probabilitate poate fi
extins la un numar finit de campuri, raspunsul la problema pusa privind probabilitatea ca masina
M sa nu aiba nici un defect poate fi dat in felul urmator.
Fie { } , , , ,
O O
i i i i
E E P =
1 2 1
, , campul de probabilitate asociat extragerii unei piese dintr-un
numar de o suta piese purtand indicativul R
i
, unde E
i1
este evenimentul ca piesa extrasa sa fie
fara defect, iar E
i2
=E
i1
evenimentul contrar.
Sa luam , , , , , , P E r si P E P E r
i i i i i i i 2 1 2
100 1 1 100 = = = / / .
Notand cu (O
0
={E
01
, E
02
}, P( O
0
)) campul de evenimente corespunzator extragerii unei
masini M luata la intamplare, dintr-un lot de 100 bucati , unde E
01
este evenimentul ca masina sa
nu aiba vicii de montaj, luand , , , , P E E r P E r
0 02 01 0 01
100 1 100 = = = / / , P
0
este o
probabilitate pe acest camp.
Fie , , , , O O O O O O
0 1 0 1 0 1
=
|
\

|
.
| ... , ... , ...
n n n
P P P P P campul de
probabilitate produs cartezian al campurilor (O
k
, P(O
k
), P
k
) k = 0, 1, . . . ...,n . Ca urmare,
probabilitatea ca masina M sa nu aiba nici un defect este
41
, , { } , ,
{ } , ,
{ } , , { } , ,
P E E P E
P E P E
r r r
E
n
n n
n
0 11
1
0 01
1 11 1
1
1
100
1
100
1
100
,
... ... .
,...,
=
=
|
\

|
.
|

|
\

|
.
|


Aplicatie la problema distributiei bilelor.
Exemplele din paragraful 2.1 indica larga aplicabilitate a modelului privind introducerea
in mod aleator a r bile in n une. Ne propunem, acuma, o discutie pe baza acestui model
presupunand, fireste, ca fiecare dintre cele n
r
distributii posibile au probabilitatea n
-r
. Cele mai
importante proprietati ale unei distributii particulare sunt exprimate prin numerele de
reprezentare r
1
, . . . , r
n
unde r
i
este numarul de bile din urna i. Avem
(2.8) r
1
+ r
2
+ .... r
n
= r , r
i
> 0 ; 1 s i s n .
Convenim sa tratam bilele in ideea ca nu le putem distinge. Atunci, distributia lor este
complet descrisa de numerele de reprezentare r
i
, 1 s i s n; iar doua distributii se pot distinge
numai daca n-uplele ordonate corespunzatoare (r
1
, . . . , r
n
) nu sunt identice. Un prim rezultat este
continut in lema urmatoare.
Lema 2.2.1. Numarul de distributii distincte (adica numarul de solutii diferite ale
ecuatiei (2.8) este
A
n r
r
n r
n
r n ,
=
+
|
\

|
.
|
=
+

|
\

|
.
|
1 1
1

Numarul de distributii distincte in care nici o urna nu ramane vida este
r
n

|
\

|
.
|
1
1
.
Demonstratie. Cazul r = 100, n = 4, a fost folosit in partea a doua a exemplului 2.1.4. Sa
folosim, acum, forma simpla a reprezentarii celor n urne prin spatii situate intre n+1 bare, iar
bilele prin asteriscuri . Astfel, scrierea ---- ---- este folosita in mod simbolic pentru o
distributie a r = 8 bile in n = 6 urne cu numerele de reprezentare 3, 1, 0, 0, 0, 4. Un asemenea
simbol in mod necesar incepe si se termina cu o bara, dar cele n - 1 bare care raman si cele r
asteriscuri pot sa apara intr-o ordine arbitrara. In acest fel, apare clar ca numarul de distributii
distincte este egal cu numarul de moduri in care se pot selectiona r locuri din n + r - 1 posibilitati,
adica
n r
r
+
|
\

|
.
|
1
. Pentru a doua parte a lemei se observa ca, prin conditia ca nici o urna sa nu fie
vida, se impune ca doua bare sa nu fie adiacente. Cele r asteriscuri permit r-1 spatii, din care n-1
ar fi ocupate de bare. Astfel avem
r
n

|
\

|
.
|
1
1
posibilitati si lema este dovedita.
Exemplul 2.2.4. Exista
r +
|
\

|
.
|
5
5
rezultate distincte ale unei aruncari cu r zaruri identice.
Exemplul 2.2.5. (Derivatii partiale).
42
Derivatiile partiale de ordinul r ale unei functii analitice , , f x x
n 1
,..., de n variabile nu
depinde de ordinea de derivare ci numai de numarul de ori in care apare fiecare variabila. Astfel,
fiecare variabila corespunde unei urne si, deci, exista
n r
r
+
|
\

|
.
|
1
derivate partiale diferite de
ordinul r. De exemplu o functie de trei variabile are 15 derivate partiale de ordinul patru si 21
derivate partiale de ordinul cinci.
Exemplul urmator ilustreaza o metoda extrem de simpla si obisnuita in rezolvarea multor
probleme de analiza combinatorie.
Exemplul 2.2.6. (Configuratiile a r=7 bile in n=7 urne).
[Urnele ar putea fi interpretate ca zile ale saptamanii, iar bilele ca vizite, scrisori,
accidente etc.t. Sa consideram distributiile cu numerele de reprezentare 2, 2, 1, 1, 1, 0, 0, care
apar intr-o ordine arbitrara . Aceate sapte numere de reprezentare indica o partitie a celor sapte
urne in trei subpopulatii (categorii) constand respectiv din cele doua ocupate de cate doua bile,
urmatoarele trei ocupate de cate o bila si ultimele doua urne goale. O asemenea partitie in trei
grupe de marimi 2,3 si 2 se poate efectua in
7
2!3! 2!
!
moduri. Fiecarei atribuiri particulare a
numerelor de reprezentare celor sapte urne ii corespund
7
2! 2!1!1!1!0 0
7
2! 2!
!
! !
!
= distributii
diferite ale celor r=7 bile in cele sapte urne. In consecinta, numarul total de distributii astfel incat
numerele de reprezentare sa coincida cu 2,2,1,1,1,0,0, intr-o ordine este
7
2!3! 2!
7
2! 2!
!
.
Este bine de retinut ca acest rezultat a fost obtinut printr -o dubla aplicare a formulei
(2.9)
n
r r r
k
!
! !... !
1 2

adica, atat bilelor cat si urnelor. Bineinteles ca acelasi rezultat poate fi obtinut si scris in mai
multe moduri, dar metoda prezentata furnizeaza cea mai simpla tehnica, obisnuita pentru o mare
varietate de probleme. Pentru completa ilustrare a metodei dam, in tabelul de mai jos, toate
configuratiile posibile ale numerelor de reprezentare in cazul r n = = 7 si probabilitatile
corespunzatoare.

Numere de
reprezentare
Numarul de aranjamente egale
cu 7! 7! impartite prin
Probabilitatea (Numarul
de aranjamente impartit
prin 7
7
)
1,1,1,1,1,1,1 7! .1! 0,006120
2,1,1,1,1,1,0 5! . 2! 0,128518
2,2,1,1,1,0,0 2!3!2! . 2!2! 0,321295
2,2,2,1,0,0,0 3!3! . 2!2!2! 0,107098
3,1,1,1,1,0,0 4!2! . 3! 0,107098
3,2,1,1,0,0,0 2!3! . 3!2! 0,214197
43
3,2,2,0,0,0,0 2!4! . 3!2!2! 0,026775
3,3,1,0,0,0,0 2!4! . 3!3! 0,017850
4,1,1,1,0,0,0 3!3! . 4! 0,035699
4,2,1,0,0,0,0 4! . 4!2! 0,026775
4,3,0,0,0,0,0 5! . 4!3! 0,001785
5,1,1,0,0,0,0 2!4! . 5! 0,005355
5,2,0,0,0,0,0 5! . 5!2! 0,001071
6,1,0,0,0,0,0 5! . 6! 0,000357
7,0,0,0,0,0,0 6! . 7! 0,000008
Tabelul 2.4
Distributiile aleatoare a 7 bile in 7 urne

Observatii.
1
0
. Am folosit mai sus termenul de populatie nu n indivizi pentru a semnifica o totalitate
de n elemente fara a lua in consideratie ordinea lor. Astfel, doua populatii sunt considerate
diferite daca exista un element continut in una, dar nu si in cealalta. Extragand r elemente dintr-o
populatie data cu n indivizi se formeaza o subpopulatie cu r indivizi. Se poate arata fara
dificultate ca o populatie cu n indivizi poseda
n
r
|
\

|
.
|
subpopulatii diferite cu r < n indivizi.
2
0
. Referitor la numerele (2.2), numite si coeficienti multinomiali si care se intalnesc
frecvent in statistica matematica, precizam ca acestea se leaga de urmatoarea teorema: fie r
1
, . . .
,r
k
intregi astfel incat r r r n
k 1 2
+ + + = ... . Numarul de moduri in care o populatie cu n indivizi
poate fi impartita in k parti ordonate (adica partitionata in k subpopulatii) din care prima
contine r
1
elemente, a doua r
2
elemente, etc. este

n
r r r
k
!
! !... !
1 2

adica tocmai (2.9).
In incheierea acestui paragraf vom da cateva detalii referitor la statisticile Bose-Einstein
si Fermi-Dirac, prima invocata deja la inceputul paragrafului.
Am presupus mai sus, ca fiecare dintre cele n
r
distributii posibile are probabilitatea n
-r
.
Este interesant ca faptele si experientele i-au constrans pe fizicieni sa abandoneze aceasta ipoteza
si sa atribuie probabilitatile in diferite moduri.
Sa consideram un sistem mecanic din r particule care nu se pot distinge intre ele. In
mecanica statistica se obisnuieste sa se subimparta spatiul fazelor intr-un numar mare, n, de
regiuni mici sau celule astfel incat fiecare particula este repartizata intr-o celula. In acest mod,
starea intregului sistem este descrisa in termenii unei distributii aleatoare a r particule in n celule.
Pentru moment, s-ar parea (cel putin cu o definitie adecvat a celor n celule) ca toate cele n
r

aranjamente ar avea probabilitati egale. Daca acest lucru este adevarat, fizicienii vorbesc despre
statistica Maxwell-Boltzmann (evident, termenul statistica are aici un sens specific fizicii). S-au
44
facut numeroase incercari pentru a dovedi ca particulele fizice se comporta potrivit statisticii
Maxwell-Boltzmann, dar teoriile moderne au aratat, fara indoiala ca aceasta statistica nu se
aplica oricaror particule cunoscute. Deci, in nici un caz, nu ne putem astepta ca toate
aranjamentele n
r
sa fie aproximativ egal probabile. Au fost astfel introduse doua modele
probabiliste diferite, fiecare descriind in mod satisfacator comportarea unui tip de particule. Nici
unul dintre ele nu are caracter universal si cum, justificarea oricarui model depinde de succesul
pe care-l are, este posibil ca intr-o buna zi sa se introduca un al treilea model pentru anumite
feluri de particule.
Prin urmare, consideram r particule nedistincte intre ele si n celule. Prin statistica Bose-
Einstein se intelege ca se considera numai aranjamente distincte si ca fiecaruia i se atribuie
probabilitatea (2.10)
n r 1
r
1
+

|
\

|
.
|
|
|

Din mecanica statistica se stie ca aceasta presupunere ramane adevarata pentru fotoni,
nuclei si atomi care contin un numar par de particule elementare. Pentru a descrie alte particule
trebuie sa se introduca o noua posibilitate de atribuire a probabilitatilor.
Statistica Fermi-Dirac se bazeaza pe urmatoarele ipoteze: 1
0
este imposibil ca doua sau
mai multe particule sa fie in aceeasi celula; 2
0
toate aranjamentele distincte care satisfac prima
conditie au probabilitati egale. Prima ipoteza cere ca r s n. Un aranjament este atunci
descris complet enuntand care dintre cele n celule contine o particula si, intrucat exista r
particule, celulele corespunzatoare pot fi alese in
n
r
|
\

|
.
|
moduri. Deci, exista in total
n
r
|
\

|
.
|
aranjamente posibile, fiecare avand probabilitatea
n
r
|
\

|
.
|
1
. Acest model se aplica la electroni,
neutroni si protoni.
Avem, prin urmare, un exemplu instructiv privitor la imposibilitatea selectionarii sau
justificarii modelelor probabilitate prin discutii purtate apriori in conditii cu totul generale. De
fapt, prin nici un rationament pur nu s-ar putea spune ca fotonii si protonii nu s-ar supune
acelorasi legi de probabilitate.
In concluzie, deci, putem spune ca probabilitatea ca celulele cu numarul de ordine 1, 2, 3
, ..., n sa contina r
1
, r
2
, r
3
, . . . , r
n
bile respectiv (unde r
1
+ r
2
+ r
3
+ . . . + r
n
=1) este egala cu

r
r r r
n
n
r
!
! !... !
1 2


in cazul statisticii Maxwell-Boltzmann (este bine de retinut ca statistica Maxwell-Boltzmann
este, de altfel, termenul folosit de fizicieni pentru ceea ce noi numim introducerea in mod
intamplator a bilelor in urne). Aceasta probabilitate este dat de (2.10) in cazul statisticii Bose-
Einstein si este egala cu
n
r
|
\

|
.
|
1
din statistica Fermi-Dirac cu conditia ca fiecare r
j
sa fie egal cu 0
sau 1.
45
Exemplul 2.2.7.
Fie n=5, r=3. Atunci aranjamentul
, ,
* * * are probabilitatea
6
125
1
35
1
10
, ,sau
dupa cum se considera statistica Maxwell-Boltzmann, Bose-Einstein sau Fermi-Dirac respectiv.
Exemplul 2.2.8.
O carte contine n simboluri (litere), din care r sunt tiparite gresit. Distributia greselilor
de tipar corespunde unei distributii a r bile in n urne, nici o urna necontinand mai mult de o bila.
Este, prin urmare, normal sa presupunem ca, aproximativ, greselile de tipar se supun, statisticii
Fermi-Dirac .

Aplicatii
2.3. Se arunca doua zaruri. Care este probabilitatea ca la o aruncare sa apara dubla (6,6) ?
Solutie. Se considera campul de evenimente
, , , , , , , , { } , ,
, ,
O O = 11 16 61 6 6 , ,..., , ,..., , ,..., , , P
si se presupune ca evenimentele elementare sunt egal probabile. Or, card O = 36. Ca urmare,
, , { } , ,
P 6 6
1
36
, = .
Se putea proceda la rezolvarea acestei probleme considerand campul
{ } , ,
, ,
O O ' , ,... , , ' = 1 2 6 P P unde { } , ,
P i ' =
1
6
, asociat experientei aruncarii unui zar si campul
produs , ,
, ,
O O O O ' ' , ' ' , ' ' P P P . .
Ca urmare, { } , , { } , , { } , ,
P P P P ' ' , ' ' = = = 6 6 6 6
1
6
1
6
1
36
.
2.4. Se arunca doua zaruri. Care este probabilitatea ca la o aruncare ambele zaruri sa
prezinte fete avand un numar par de puncte.
Solutie. In campul , , , ,
O O , , P P considerat in problema precedenta, evenimentul in cauza
este , , , , , , , , , , , , , , , , , , { }
A = 2 2 2 4 26 4 2 4 4 4 6 6 2 6 4 6 6 , , , , , , , , , , , , , , , , , .
Ca urmare, , , P A
cardA
card
= = =
O
9
36
1
4
.
Daca consideram campurile , , , ,
O O ' , ' , ' P P , ,
, ,
O O O O ' ' , ' ' , ' ' P P P evenimentul
care ne intereseaza este
A= ({2}{2}) ({2}{4}) ({2}{6}) ... ({6}{2}) ... ({6}{6})
Deci
PP(A) = PP({2}{2}) + ... + PP({6}{6}) = 9((1/6).(1/6)) = 1/4 .
2.5. Se presupune ca numerele 1,2, . . . , n sunt asezate la intamplare. Care este
probabilitatea ca numerele 1, 2 sa fie asezate consecutiv in ordine crescatoare ?
46
Solutie. Sa indicam cu , , , ,
O O ,P campul de evenimente asociat problemei. Un
eveniment elementar este , , , , , , { }
t t 1 ,..., n unde t este o permutare a numerelor 1, 2, . . .
, n . Ca urmare, cardO=n! . Sa observam, in continuare, ca perechea 1, 2 poate ocupa n-1 locuri
in sirul celor n numere si ca alaturi de numerele 1, 2 celelalte numere pot fi asezate in (n-2)!
moduri.
Asadar indicand cu A evenimentul respectiv, avem cardA=(n-1).(n-2)! = (n-1)!. Prin
urmare, P(A) =cardA / cardO = (n-1)! / n! = 1/n.
2.6. O carte de telefon contine toate numerele formate cu cate sase cifre dintre cifrele 0,
1, 2, ..., 9. Sa se determine probabilitatea ca un numar ales la ;intamplare sa fie alcatuit:
a) din cifre distincte;
b) din cifre consecutive;
c) prima cifra sa fie 1.
Solutie. Sa indicam cu O multimea tuturor numerelor de telefon. Numarul elementelor lui
O este 10
6
si reprezinta numarul aranjamentelor cu repetitie care se pot forma cu 10 cifre luate
cate 6. Sa notam acest numar prin simbolul (A
6
10
).
Pentru a da raspunsul la punctul
a) trebuie sa determinam numarul elementelor multimii A alcatuita din toate numerele de
telefon formate cu cate 6 cifre distincte din cele 10 numere. Acest numar coincide cu numarul
aranjamentelor ce se pot forma cu 10 elemente luate cate 6, adica cu numarul A
10
6
1098765 = . . . . . .
Ca urmare, , ,
, ,
P A
cardA
card
A
A
= = =
O
10
6
10
6
01512 , .
b). Fie B multimea numerelor de telefon alcatuita din sase cifre consecutive.
Evident, , , , , , , , , { }
B = 01 23 4 5 5 4 3 210 4 56 7 8 9 98 7 6 5 4 , , , , , , , , , , , ,..., , , , , , , , , , , , .Deci cardB=10.
Asadar, , , P B
cardB
card
= = = =

O
10
10
10 0 00001
6
5
, .
c). Fie C multimea tuturor numerelor care incep cu cifra 1. Numarul elementelor
multimii C este egal cu numarul aranjamentelor cu repetitie a cifrelor 0,2,3,4,5,6,7,8,9 luate cate
cinci.
Prin urmare,
, ,
cardC
A
= =
9
5
5
9 , de unde , , P C
cardC
card
= = =

O
9 10 0 059049
5 6
, .
2.7. Cu liftul unei cladiri, avand n etaje, urca k persoane, k s n. Care este probabilitatea
ca la fiecare etaj sa opreasca cel mult o persoana ?.
Solutie. Sa notam cu e
1
, . . . , e
n
etajele si cu x
1
, . . . , x
k
personale. Fie O multimea
tuturor opririlor posibile ale liftului dictate de cele k persoane. Aceasta multime coincide cu
multimea aplicatiilor multimii K = {1, ..., k} in multimea { } N n = 1,..., ; deci
, , card cardN n
k
O = = .
47
Deoarece la fiecare etaj poate opri cel mult o persoana, numarul opririlor este dat de
, , n
k
A
. Prin urmare, p
A
n
n
k
k
= .

2.3. Camp de probabilitate complet aditiv
In paragraful 2.1 am aratat ca orice algebra Boole L, ocompleta, poate fi aplicata
izomorf pe un corp ocomplet (corp borelian) de parti ale unei multimi infinite O, convenabil
aleasa. Astfel, teorema 2.1.4 ne-a permis sa luam drept model, care sa descrie campurile de
evenimente cu un numar infinit de stari, campurile (O, K(O)) unde K(O) sunt corpuri
ocomplete de parti ale multimii P(O) a partilor multimii O.
Or, prin izomorfismul de care este vorba in teorema invocata, algebra L se identifica cu
K(O) si, ca urmare, K(O) afortiori este ea insasi o algebra boole ocompleta, deci are
proprietati mult mai tari decat cele cerute in definitia 2.1.7.
Faptul este aparent deoarece se pote demonstra urmatorul rezultat pe care il formulam in
Teorema 2.3.1. Orice ocorp complet K(O) de parti ale unei multimi infinite este o
oalgebra completa.
Faptul rezulta direct din definitia 2.1.7 observand ca avem x x
I I
o
o
o
o e e
= pentru orice
familie cel mult numerabila {X
o
}
oeI
de elemente X
o
eK(O), ( vezi definitia 2.1.6).
De asemenea, din O =C rezulta Oe K(O) si ca O joaca rolul elementului total;
distributivitatea operatiei fata de apare ca o proprietate naturala a operatiilor , ,
in K(O).
In plus, in K(O) se gasesc si multimile

lim sup
lim inf
o
o o
o
o
o o
o

=
=
x x
x x
r r
1
1

daca {X
o
}
oeI
este o familie cel mult numerabila de elemente din K(O).
Un mijloc cu ajutorul caruia putem asocia la familii de parti ale unei multimi
infinite O, ocorpuri complete, este urmatorul :
Fie F o familie arbitrara de parti ale multimii O . Cum intersectia unui numar oarecare de
ocorpuri complete ale multimii O este un ocorp complet, ocorpul pe care il asociem, in
mod unic, familiei F este intersectia tuturor ocorpurilor multimii O care cuprind familia F.
Acest ocorp complet este cunoscut sub numele de ocorpul generat de familia F.
Definitia 2.3.1. Fie (O, K(O)) un camp infinit de evenimente. O probabilitate pe campul
(O, K(O)) este, prin definitie, o aplicatie P : K(O) [0, 1]
cu proprietatile
a) P(O)=1
48
b) P ( ) ( ) x P x
I I
o
o
o
o e e
= _
oricare ar fi familia {X
o
}
oeI
cel mult numerabila de evenimente incompatibile din K(O)
9)
.
Direct din definitia 2.3.1 rezulta ca aplicatia P : K( O)|0,1] are urmatoarele proprietati :
Teorema 2.3.2. 1) P( ) C = 0;
2) Daca X.Y si X,Y eP(O), atunci P(X)s P(Y) ;
2) Daca X.Y si X,Y eP(O), atunci P(Y-X)= P(Y)-P(X) ;
3) P X P X ( ) ( ) = 1 ;
4) Daca multimea I este numerabila, seria P x
I
( )
o
oe
_ este convergenta.
Proprietatile 1), 2), 3) ale probabiltatii P rezulta imediat deoarece, daca luam card I<
0
,
deci daca presupunem ca multimea I este finita, conform lui b) rezult a
P P P ( ) ( ) ( ) C = C C = C 2
de unde P( ) C = 0.
Din P X X P X P X ( ) ( ) ( ) = + = 1 rezulta 3); iar 2) urmeaza din observatia ca avem
Y X Y X Y = ( ) .
Daca in 2) luam Y=O, avem P(X)sP(O)s1 si, deci, 4) are loc daca avem card I=
0
. In
adevar, pentru orice numar natural n
X X
n
I
o
o
o
o = e
.
1

si, ca urmare, sirul
S P X P X
n
n
I
= _ s s
= e
( ) ( )
o
o
o
o 1
1
este monoton si marginit, deci convergent.
O proprietate importanta a probabilitatii P, pe (O, K(O)), este exprimata in teorema 2.3.3.
cunoscuta sub numele de teorema de continuitate.
Teorema 2.3.3. Daca {X
o
}
oeN

10)
este un sir monoton descrescator de elemente
apartinand campului (O,K(O)), deci daca X
1
>X
2
> ... >X
n
> ... si daca X
N
o
oe
= C, atunci
lim ( )
o
o

= P X 0.
Demonstratie. Intr-adevar, este lesne de vazut ca dandu-se neN avem
X X X X X
o o o o o
=
+ + +
( ) ( )
1 1 2

si, in particular,
X X X X X
1 1 2 2 3
= ( ) ( )

9

)
Familia {X

}
eI
se spune ca este alcatuita din evenimente incompatibile daca pentru orice o
1
, o
2
e

I , cu o
1
=o
2

avem X
o1
X
o2
= C.
10)
N = {1,2,3, ...}
49
Insa evenimentele {X
o
X
o+1
}
oeN
fiind incompatibile, avem
P X P X X
i i
i
( ) ( )
1 1
1
= _
+
=


ceea ce ne spune ca seria P X X
i i
i
( )
+
=

_
1
1
este convergenta. Drept urmare,
lim ( ) lim( ( ))
o
o
o
o o
o

+
=

= _ P X P X X
i
1
0
ceea ce era de aratat.
Corolarul 2.3.1. Daca {X
o
}
oeN
este un sir monoton descrescator, atunci
lim ( ) ( )
o
o o
o

e
= P X P X
N
.
Pentru a verifica ca proprietatea exprimata in corolarul 2.3.1. este adevarata sa punem
X X
N
o
oe
= si sa observam ca sirul {Y
o
}
oeN
cu Y X X
o o
= este un sir care indeplineste
conditiile teoremei 2.3.3. Drept urmare,
lim ( )
o
o

= P Y 0.
Insa
P Y P X X P X P X ( ) ( ) ( ) ( )
o o o
= = .
In adevar,
X X X X X
o o o
= ( ) ( )
de unde P X P X P X X ( ) ( ) ( )
o o
= + pentru ca X.X
o
.
Asadar P X X P X P X ( ) ( ) ( )
o o
= si trecand la limita obtinem
lim ( ) ( )
o
o

= P X P X 0
adica lim ( ) ( ) ( )
o
o o
o

e
= = P X P X P X
N
.
Sa presupunem, acum, ca se da un sir monoton crescator, adica X
o
.X
o+1
, oeN. Atunci,
sirul evenimentelor contrare ( ) ( ) X K
o
. O este monoton descrescator, adica
( ) , X X N
o o
o
+
. e
1
. Deci , pentru acest sir, in virtutea corolarului 2.3.1. avem
lim ( ) ( )
o
o o
o

e
= P X P X
N
.
Deoarece
X X N
N N
o
o
o
o
o
e e
= e ,
si P X P X N ( ) ( ),
o o
o = e 1
rezulta ca P X P X P X
N N N
( ) ( ) ( )
o
o
o
o
o
o e e e
= = 1 .
50
Deci
lim ( ) lim( ( )) ( )
o
o
o
o o
o

e
= = P XX P X P X
N
1 1
adica
lim ( ) ( )
o
o o
o

e
= P X P X
N
.
Obtinem astfel
Corolarul 2.3.2. Daca {X
o
}
oeN
este un sir monoton crescator, atunci
lim ( ) ( )
o
o o
o

e
= P X P X
N
.
Corolarul 2.3.3. Daca {X
o
}
oeN
este o multime cel mult numerabila de evenimente
apartinand campului de evenimente (O,K(O)), atunci P X P X
I I
( ) ( )
o
o
o
o e e
s _ .
Demonstratie. Daca multimea I este finita, proprietatea este evidenta si ne convingem
imediat daca observam ca, in cazul a doua evenimente X
1
,X
2
avem
P X P X X X P X X ( ) ( ( )) ( )
1 1 1 2 1 2
= +
P X P X X X P X X ( ) ( ( )) ( )
2 2 1 2 1 2
= +
P X X P X X X P X X P X X X ( ) ( ( )) ( ) ( ( ))
1 2 1 1 2 1 2 2 1 2
= + + .
Daca I=N, sirul X
n
n N
o
o=
e


`
) 1
este un sir monoton crescator deci, conform corolarului 2.3.2. ,
lim ( ) ( )
n
n
P X P X

= =

=
o
o
o
o 1 1
.
Insa P X P X
n n
( ) ( )
o
o
o
o = =
s _
1 1

astfel ca P X P X P X P X
n
n
n
( ) lim ( ) lim ( ) ( )
o
o
o
o
o
o
o
o
o =

=

= =

= s _ = _
1 1 1 1

ceea ce era de aratat.
Prin urmare, probabilitatea este o functie subaditiva daca evenimentele considerate sunt
oarecare si este complet aditiva in cazul evenimentelor incompatibile doua cate doua.
Definitia 2.3.2. Campurile de evenimente (O, K(O)), pe care s-a definit o probabilitate P
in sensul definitiei 2.3.1, se noteaza (O, K(O), P) si se numesc campuri de probabilitate complet
aditive.

Exemple
2.3.1. Fie R multimea numerelor reale si fie B corpul borelian (o - corpul) generat de
multimea intervalelor deschise. (R, B) este un camp de evenimente. Daca Xe B si este
indicatorul multimii, aplicatia
P : B R
51
definita prin conditia P X x e dx
x
x
R
( ) ( ) =
}

1
2
t

este o probabilitate pe campul (R, B), deoarece e dx
x

}
=
2
t si
o
o o
o
X
I
X
I e e
= _ daca
multimea I este cel mult numarabila, iar familia {X
o
}
oeI
este alcatuita din evenimente
incompatibile .
2.3.2. Fie R
n
= R ... R
n
(n factori) spatiul euclidian n dimensional si fie B
n
corpul
borelian (o - corpul) generat de multimea intervalelor deschise
11)
din R
n
. (R
n
, B
n
) este un camp
de evenimente. Daca f este o functie reala definita pe R
n
si, daca f este integrabila Riemann astfel
incat sa avem
(2.11) f x x dx dx
n n
R
n
( ,..., ) ...
1 1
1 =
}

si daca punem
(2.12) P X x x f x x dx dx
n n n
R
n
( ) ( ,..., ) ( ,..., ) ... =
}
1 1 1

unde
x
este indicatorul multimii XeB
n
atunci, P este o probabilitate pe (R
n
,B
n
).
Daca E este o multime boreliana din R
n
(adica daca EeB
n
) si f este o functie reala
integrabila Reimann definita pe E, care satisface la conditia (2.11) definind P(X) conform
formulei (2.12), unde
XeK={XeB
n
|X.E}}
atunci, {E,K,P} este un camp de probabilitate complet aditiv.
2.3.3. Daca E este o multime boreliana din R
n
si daca dx dx
n
E
1
...
}
este finita atunci, daca
punem P x
dx dx
dx dx
n
x
n
E
( )
...
...
=
}
}
1
1
unde XeK={XeB
n
|X.E} atunci, {E,K,P} este un camp de
probabilitate complet aditiv. Acest rezultat sta la baza teoriei probabilitatilor in geometrie.
[Integrala dx dx
n
E
1
... } este gandita, aici, ca integrala de volum in sensul analizei clasice. Anumite
considerente de natura generala au impus, drept instrument eficient de investigare in teoria
probabilitatilor, integrala in sensul lui Lebesgue.]
2.3.4. Fie E={
i
}
ieI
o multime numerabila si {p
i
}
ieI
o multime de numere reale pozitive
cu proprietatea p
i
i I e
_ = 1. Daca, pentru orice XeP(E), punem P x p
j
j J
( ) = _
e
unde
J.I este multimea care indexeaza submultimea X.E atunci, (E, P(E), P) este un camp de
probabilitate complet aditiv.


11

)
Un interval deschis este o multime I = {x
1
... x
n
: a
1
<x
1
<b
1
, ..., a
n
<x
n
<b
n
} unde a
1
, ..., a
n
, b
1
, ..., b
n
sunt numere
reale
52
2.4. Modele clasice in teoria probabilitatil or
In acest paragraf se considera unele modele din teoria probabilitatilor, anume: Modelul
lui Bernoulli, modelul lui Poisson, modelul bilei neintoarse. Aceste modele cunoscute si sub
numele de scheme clasice, apar frecvent in aplicatii.
Modelul lui Bernoulli consta dintr-o urna in care se afla N bile, din care n sunt de culoare
alba, iar restul de culoare neagra, bilele neputandu-se distinge decat prin culoare. Se extrag
succesiv din urna N
1
bile punandu-se de fiecare data bila inapoi in urna. Se cere probabilitatea
evenimentului ca, printre cele N
1
bile extrase, n
1
sa fie de culoare alba.
Pentru a evalua probabilitatea evenimentului in cauza sa observam, mai intai, ca
probabilitatea de a extrage din urna bila alba este p
n
N
= . Evenimentul contrar are deci
probabilitatea q=1-p.
Asociem problemei campul de probabilitate (O={A, A }, P(O), P), unde A este
evenimentul bila extrasa este alba, A este evenimentul contrar, P(A) = p, P( A )=1-p=q si
consideram campul produs
) ( ... ) , ) ( , (
1
1 1 1 1
factori N unde P P
N N N N
O O O = O O O
Un eveniment elementar apartinand acestui camp este de forma
{ }
( , , ) x x
N 1
1
unde x
i

este sau o bila alba sau o bila neagra si, drept urmare,
, ,
P x x p q
N
N
n N n
1
1
1 1 1
1
, , =

daca
extractia
{ }
( , , ) x x
N 1
1
cuprinde n
1
bile albe.
In campul ( , ( ) ) O O
N N
P
1 1
exista C
N
n
1
1 12)
evenimente elementare de tipul indicat mai sus
si fie E multimea aceastora. E fiind evenimentul care ne intereseaza, avem
P E C p q
N
N
n n N n
1
1
1 1 1 1
( ) =

ceea ce constituie raspunsul la chestiunea pusa.
In esenta modelul lui Bernoulli poate fi asimilat cu orice experienta careia ii corespunde
un camp de probabilitate finit (O={A, A }, P(O), P), unde A si A sunt evenimente contrare,
P(A) = p, P( A )=q, cu p+q=1, impreuna cu problema determinarii probabilitatii evenimentului E,
repetand experienta in aceleasi conditii de N ori ( adica evenimentul A sa aiba loc de nsN ori).
Notand cu P
N
(n,p) probabilitatea evenimentului E avem
(2.13) P n p C p q
N N
n n N n
( , ) =

.
Inainte de a trece la o generalizare a modelului lui Bernouli observam ca numarul P
N
(n,p)
este termenul n+1 in dezvoltarea binomului (p+q)
N
sau este tocmai coeficientul puterii a n-a a
variabilei t in dezvoltarea binomului (pt+q)
N
.

12)
C
N
n
1
1
reprezinta numarul combinarilor ce se pot forma cu N
1
obiecte luate cate n
1
sN
1
:
C
A
n
N
n N n
N
n
N
n
1
1
1
1
1
1
1 1 1
= =
!
!
!( )!



53
Fie dat un sir cunoscut de probabilitati
(2.14) P
0
, P
1
, P
2
, ..., P
n

si 0 s s n acel numar intreg pentru care P

, din sirul precedent, are cea mai mare valoare, cu


alte cuvinte evenimentul cu probabilitatea P

are cea mai mare sansa de realizare. Numarul se


numeste, din acest motiv, valoarea cea mai probabila. Ne propunem sa cercetam cate valori
corespund acesteia.
Fie o un element din sirul 0,1,2,...,n. Atunci,
P C p q i P C p q
n
n
n
n
o
o o o
o
o o o
= =

+
[
1
1 1 1

de unde se obtine
P
P
C p q
C p q
n
n
p q
n
n p q
n p
q
n
n
n
n
n
n
o
o
o o o
o o o
o
o o
o o
o o o
o

+

+
= =

+
=
+
1
1 1 1
2
1 1
1 1 1 !
!( )!
( )!( )!
!
.
Prin urmare, daca

P
P
n p
q
o
o
o
o

=
+
>
1
1
1
sirul initial de proba bilitati (2.14) este crescator. Deci, in acest caz avem oqsnp-op+p. Dar
p+q=1, astfel ca o(1-q)snp-op+p, adica o<np+p.
Daca, insa,

P
P
n p
q
o
o
o
o

=
+
s
1
1
1
se obtine, in aceeasi maniera, o>np+p, caz in care sirul initial de probabilitati (2.14) este
descrescator.
Dar, in general, np+p este un numar intreg. Deoarece P

este cea mai mare valoare din


sirul (2.14), rezulta ca este numarul intreg cel mai apropiat de valoarea np+p care indeplineate
conditia s np+p. Prin urmare, avem np-qs s np+p, adica se gaseste pentru o valoare
unica. Se gasesc doua valori numai intr-un singur caz, anume cand np+p este intreg, caz in care
si np-q este numar intreg. Deci, valoarea cea mai probabila se apropie foarte mult de valoarea
medie np care, insa, nu corespunde unei proprietati generale a variabilelor aleatoare.
Modelul general al lui Bernoulli priveste extractiile repetate dintr-o urna alcatuita din bile
de diverse culori. Stiind ca probabilitatea scoaterii bilei de culoarea i=1,2,...,k este p
i
,
(p
1
+...p
k
=1), se cere probabilitatea ca, in N extractii succesive, cu reintroducerea bilei extrase, n
1

bile sa aiba culoarea 1, n
2
bile sa aiba culoarea 2, ..., n
k
bile sa aiba culoarea k. Evident,
N=n
1
+...+n
k
.
Indicand cu P
N
(n
1
,...,n
k
) probabilitatea evenimentului in discutie avem
(2.15) P n n
N
n n
p p
N k
k
n
k
n
k
( ,..., )
!
!... !
...
1
1
1
1
= .
Se obtine aceasta formula luand produsul cartezian de N ori al campului (O={A
1
,...,A
k
},
P(O), P) unde P(A
i
)=p
i
, i=1,2,...,k si calculand probabilitatea evenimentului elementar de forma
(x
1
, ..., x
N
) unde n
1
dintre evenimentele x
1
, ..., x
N
coincid cu evenimentul A
1
, n
2
coincid cu
54
evenimentul A
2
, etc. Expresia din (2.15) este tocmai termenul general din dezvoltarea
polinomului (p
1
+ ... +p
k
)
N
.
Modelul lui Poisson.
Se considera N urne U
1
,...,U
N
, fiecare continand bile de doua culori, de exemplu albe si
negre. Presupunand ca probabilitatea evenimentului A
i
, de a extrage o bila alba din urna U
i
, este
p
i
, iar a evenimentului contrar A
i
este q
i
(p
i
+q
i
=1), se cere probabilitatea evenimentului ca,
extragand din cele N urne cate o bila, sa ontinem n bile albe.
Indicand cu E acest eveniment, determinarea probabilitatii acestuia se obtine imediat
aplicand, din nou, tehnica produselor carteziene. Este sufucient sa asociem campurilor
{O
i
={A
i
, A
i
}, P(O
i
), P
i
(A
i
)=p
i
, P
i
(A
i
)=q
i
}
campul
{O
1
... O
N
, P(O
1
...O
N
), P
1
...P
N
}.
Se constata ca
(2.16) P E p p q q
i i
n
i
n
i
N
( ) ... ... = _
+ 1 1

unde suma se ia dupa toate combinarile in ordine naturala ale numerelor 1,2,...,N.
De exemplu, pentru N=4, n=2, avem
P(E)=p
1
p
2
q
3
q
4
+p
1
p
3
q
2
q
4
+p
1
p
4
q
2
q
3
+p
2
p
3
q
1
q
4
+p
2
p
4
q
1
q
3
+p
3
p
4
q
1
q
2
.
Sa observam ca, in formula (2.16), P(E) este coeficientul puterii a n-a a nedeterminatei t
in produsul
(p
1
t+q
1
)(p
2
t+q
2
) ... (p
N
t+q
N
)
si ca modelul lui Bernouli se obtine din cel al lui Poisson daca se considera urnele U
1
,...,U
N

identice.
Modelul bilei neintoarse.
Se considera o urna care contine N bile din care a sunt de culoare alba iar celelalte de
culoare neagra. Din urna se extrag dintr-o data n bile. Se cere sa se calculeze probabilitatea ca
printre cele n bile extrase o sa fie albe. Altfel spus: se fac n extrageri, dupa fiecare extragere
neintroducandu-se bila inapoi in urna. Indicand cu E evenimentul in cauza, obtinem
(2.17) P E
C C
C
a N a
n
N
n
( ) =

o o
.
Justificarea acestei formule se poate face imediat daca apelam la calculul probabilitatilor
in campuri de evenimente cu evenimente egal posibile. Pentru aceasta sa numerotam bilele
punand A
1
, ..., A
a
, B
a+1
, ..., B
N
. Numarul extragerilor a n bile din N este dat de C
N
n
.
Asociind problemei campul de evenimente (O, P(O)), unde O este multimea tuturor n-
plelor alcatuite cu cate n bile din cele N, un eveniment elementar are drept probabilitate numarul
1
C
N
n
.
55
Un caz favorabil, deci un eveniment elementar apartinand evenimentului E, este alcatuit
dintr-o combinatie de o elemente din cele a bile albe urmata de o combinatie de n-o bile din cele
N-a bile negre. Asadar card E C C
a N a
n
=

o o
si, drept urmare, P(E)= (card E)/(card O) =
C C
C
a N a
n
N
n
o o

,
ceea ce era de aratat.
Modelul bilei neintoarse se poate generaliza. Aceasta generalizare se refera la o urna
alcatuita din bile de culorile 1,2,...,k. Daca n
i
desemneaza numarul bilelor de culoarea i si
n
1
+...+n
k
=N, se cere probabilitatea evenimentului ca intr-o extractie, dintr-o data, a n s N bile ,
o
1
bile sa fie de culoarea 1, o
2
de culoarea 2, ... , o
k
de culoarea k, (o
1
+...+o
k
=n).
Procedand la fel ca in cazul precedent se constata ca probabilitatea evenimentului
respectiv E este data de formula
(2.18) P E
C C C
C
n n n
k
k
n n
k
k
( ) =
+
+ +
1
1
2
2
1
1
o o o
o o

Aplicatii

2.8. Se arunca o moneda de 8 ori. Care este probabilitatea ca stema sa apara de 6 ori?
Solutie. Se aplica schema lui Bernoulli. Probabilitatea ceruta este coeficientul puterii a 6-
a a nedeterminateei t in
1
2
1
2
8
t +
|
\

|
.
| . Deci, p C =
|
\

|
.
|
|
\

|
.
|
8
6
6 4
1
2
1
2
.
2.9. Un tintas nimereste tinta de 7 ori din 9 trageri. Sa se calculeze probabilitatea ca el sa
nimereasca tinta de 8 ori consecutiv.
Solutie. Schema lui Bernoulli ne da pentru p=7/9, q=2/9, N=8 : p=(7/9)
8
.
2.10. Se arunca doua zaruri de 15 ori. Sa se calculeze probabilitatea ca dubla 6 sa apara
cel putin o data. Sa se determine si probabilitatea ca dubla 6 sa apara cel putin de doua ori.
Solutie. Se considera campul de probabilitate (O={A, A}, P(O), P). Daca A este
evenimentul ca dubla 6 sa apara cel putin o data, iar A evenimentul ca dubla 6 sa nu apara
niciodata atunci, deoarece aruncarile sunt independente, avem P(A)=(35/36)
15
. Ca urmare,
P(A)=1-P(A)=1-(35/36)
15
. Pentru a da raspunsul la cel de-al doilea punct fie E evenimentul ca
dubla 6 sa apara cel mult o data si E
1
evenimentul ca dubla 6 sa apara o singura data. Deoarece
evenimentele E
1
si A sunt incompatibile rezulta P(E)=P(E
1
A)=P(E)+P(A).
Prin urmare, obtinem P(E)=(35/36)
15
+ C
15
1
14
1
36
35
26
|
\

|
.
| .
Asadar, notand cu D evenimentul ca dubla 6 sa apara cel putin de doua ori rezulta, in fina l,
P(D)=1-
14
1
15
15
36
35
36
1
36
35
|
.
|

\
|

|
.
|

\
|
C
2.11. O urna contine 5 bile albe si 3 negre, o alta urna 6 bile albe si 2 negre, iar a treia, 7
albe si una neagra. Sa se determine probabilitatea evenimentului ca, extragand din fiecare urna
cate o bila, sa obtinem doua bile albe si una neagra.
56
Solutie. Se aplica schema lui Poisson. Se ia p
1
=5/8, q
1
=3/8, p
2
=6/8, p
3
=7/8, q
3
=1/8 si se
inlocuiesc in formula p=p
1
p
2
q
3
+p
1
p
3
q
2
+p
2
p
3
q
1

lucru echivalent cu determinarea coeficientului puterii a doua a variabilei t din produsul

5
8
3
8
6
8
2
8
7
8
1
8
t t t +
|
\

|
.
| +
|
\

|
.
| +
|
\

|
.
|.
2.12.. Un magazin vinde in cursul unei saptamani 2600 bucati dintr-o marfa primita de la
fabricile A, B, C in urmatoarele cantitati. De la fabrica A 3600 bucati, de la fabrica B 2000
bucati, iar de la fabrica C 4200 bucati. Marfa fiind de aceeasi calitate, sa se determine
probabilitatea ca 820 bucati din marfa vanduta sa fie de la fabrica A, 500 bucati de la fabrica B si
restul de, 1280 bucati, de la fabrica C.
Solutie. Se aplica schema lui Bernoulli, cazul general. Se ia p
1
=3000/9800=15/49,
p
2
=2600/9800=13/48, p
3
=4200/9800=21/49, n
1
=820, n
2
=500, n
3
=1280 si se aplica formula
P n n n
N
n n n
N
( , , )
!
! ! !
1 2 3
1 2 3
= , unde N=n
1
+n
2
+n
3
.
2.13..Intr-un lot de 100 piese, sase piese au defecte remarcabile, patru piese sunt rebuturi,
iar restul sunt piese bune. Din acest lot se iau, la intamplare, 10 piese. Care este probabilitatea ca
din piesele extrase sapte sa fie bune, doua sa aiba defecte remarcabile si una sa fie rebut ?
Solutie. Se aplica schema bilei neintoarse, cazul general (urna cu bile de mai multe
culori). Se ia in formula (2.18), k=3, n
1
=6, n
2
=4, n
3
=90, o
1
=1, o
2
=2, o
3
=7.
2.14. Intr-o grupa de 30 studenti, 18 sunt baieti, iar restul fete. La un examen sunt
introdusi in sala loturi de cate 10 candidati. Care este probabilitatea ca intr-un lot sa fie 4 fete si
restul baieti?
Solutie. Se aplica schema bilei neintoarse. Se ia in formula (2.18), k=2, n
1
=18, n
2
=12,
o
1
=6, o
2
=4. Obtinem p
C C
C
= ~
18
6
12
4
30
10
0 9 , .
2.15. La loterie, din N numere se extrag n. Care este probabilitatea de a obtine o numere
stabilite dinainte?
Solutie. Se aplica formula (2.17), unde luam n=o. In cazul extragerii Loto, N=90, n=45,
o=3, daca se participa la joc cu un bilet de trei numere.

2.5. Formule utile in aplicatiile teoriei probabilitatilor. Probabilit ati conditionate.
In acest paragraf se prezinta situatii tipice care pot sa apara in aplicatii. Se introduc, in
continuare, notiunile de probabilitate conditionata, de evenimente independente si se da formula
lui Bayes. Se stabileste, de asemenea, inegalitatea lui Boole.
Fie (O, P(O), P) un camp finit de probabilitate si fie A
1
, ...,A
n
un sistem de n evenimente
din acest camp, (A
i
e P(O)). Se stie ca, daca evenimentele A
1
,...,A
n
sunt incompatibile, avem
(2.19) P A P A
i
i
n
i
i
n
= =
|
\

|
.
| =
_
1 1
( ) .
57
Problema care se pune este aceea de a vedea ce se intampla in cazul general, anume in
cazul cand evenimentele A
1
, ..., A
n
sunt oarecare.
Pentru simplificare sa luam cazul a doua evenimente A
1
, A
2
si fie A
1
A
2
intersectia lor.
Observam ca
A A A A A
1 1 2 1 2
= ( ) ( )
A A A A A
2 2 1 1 2
= ( ) ( )
A A A A A A A A
1 2 1 2 2 1 1 2
= ( ) ( ) ( )
In virtutea formulei (2.19) avem
(2.19) P A P A A P A A ( ) ( ) ( )
1 1 2 1 2
= +
(2.19) P A P A A P A A ( ) ( ) ( )
2 2 1 1 2
= +
(2.19) P A A P A A P A A P A A ( ) ( ) ( ) ( )
1 2 1 2 2 1 1 2
= + +
deci
(2.20) P A A P A P A P A A ( ) ( ) ( ) ( )
1 2 1 2 1 2
= +
formula care leaga, intre ele, probabili tatile evenimentelor A
1
, A
2
, A
1
A
2
, A
1
A
2
.
In cazul a trei evenimente avem
(2.21) P(A
1
A
2
A
3
) = P(A
1
) + P(A
2
) + P(A
3
) -
- P(A
1
A
2
) - P(A
1
A
3
) -P(A
2
A
3
) +
+ P(A
1
A
2
A
3
) ;
iar in cazul a n evenimente A
1
,...,A
n
, prin recurenta, obtinem formula lui Poincar
(2.22)
) ... ( ) 1 ( ...
) ( ) ( ) (
2 1
1
1
1
2 1 3 2 1
3 2 1 2 1
n
n
n
i i
n
i i i
i i i i i
n
i
i
n
i
i
A A A P
A A A P A A P A P A P
I I I
I I I
U

( ( ( =
=
+ +
+
|
|
.
|

\
|
+ =
|
.
|

\
|
_ _ _

formula care arata ca, in calculul evenimentului A
i
i
n
=1
, este necesara cunoasterea tuturor
evenimentelor intersectiei. Atragem atentia ca formula (2.22) poate fi utilizata si in cazul cand
evenimentele A
1
,...,A
n
sunt luate dintr-un camp de probalibitate complet aditiv (vezi paragraful
2.3).
O margine inferioara a probabilitatii intersectiei a n evenimente A
1
,...,A
n
e P(O) este data
de inegalitatea
(2.23)
_
=
>
n
i
i n
n A P A A A P
1
2 1
) 1 ( ) ( ) .. ( I I I
cunoscuta sub numele de inegalitatea lui Boole.
Pentru a o obtine sa punem formula (2.20) sub forma
(2.24) P A A P A P A P A A ( ) ( ) ( ) ( )
1 2 1 2 1 2
= +
si sa tinem seama ca 0sP(A
1
A
2
)s1.
Ca urmare, avem
(2.25) P A A P A P A ( ) ( ) ( )
1 2 1 2
1 > + .
58
Aplicand inegalitatea (2.25) in cazul a trei evenimente A
1
, A
2
, A
3
, gasim
(2.26) P A A A P A P A P A ( ) ( ) ( ) ( )
1 2 3 1 2 3
2 > + +
si, prin inductie, rezulta inegalitatea (2.23).
Un exemplu de aplicare a acestei inegalitati, in cazul n=3, este urmatorul.
La un examen un candidat trebuie sa treaca trei probe A,B,C. Stiind ca sansa acestuia de
a trece proba A este de 0,92, proba B este de 0,86 si proba C este de 0,98, candidatul se intreaba
ce sansa globala are de a promova exemenul. Pentru evaluarea sansei, aplicand inegalitatea lui
Boole, el constata ca
p>0,92+0,86+0,89-2=0,66
fapt care spune ca pregatirea sa nu este prea stralucita.
Aplicatie.
O forma echivalenta a inegalitatii lui Boole se obtine utilizand contrarele evenimentelor
considerate. Astfel , P(A
i
) = 1 P A
i
( ) si, deci,

| ]
P A P A n P A
i
i
n
i
i
n
i
i
n
( ) ( ) ( )
= = =
_ _ _
= =
1 1 1
1 .
Atunci,

_ _
= =
= + >
n
i
n
i
i i n
A P n A P n A A A P
1 1
2 1
) ( 1 1 ) ( ) ... ( I I I
Prin urmare, inegalitatea lui Boole se mai poate scrie in felul urmator
(2.27)
_
=
>
n
i
i n
A P A A A P
1
2 1
) ( 1 ) ... ( I I I .
Sa revenim, acum, la formula (2.19) pe care sa o scriem astfel
(2.19
IV
) P A A P A P A A ( ) ( ) ( )
1 2 1 1 2
= .
Avem, astfel, o formula care evalueaza probabilitatea ca, din ansamblul de evenimente
A
1
, A
2
, numai evenimentul A
1
sa aiba loc.
Daca suntem in prezenta a trei evenimente A
1
, A
2
, A
3
, probabilitatea ca dintre aceste
evenimente sa aiba loc numai evenimentul A
1
este data de
| ]
| ]
| ] ) ( ) ( ) ( ) (
) ( ) ( ) ( ) (
) ( ) ( ) ( )) ( ( ) ( )) ( (
3 2 1 3 1 2 1 1
3 2 1 3 1 2 1 1
3 1 2 1 1 3 2 1 1 3 2 1
A A A P A A P A A P A P
A A A P A A P A A P A P
A A A A P A P A A A P A P A A A P
I I I I
I I I I
I U I U I U I
+ + =
= + =
= = =


iar, in cazul a n evenimente A
1
, A
2
, ..., A
n
, obtinem
(2.28)
) ... ( ) 1 (
... ) ( ) ( ) ( )) ... ( (
2 1
1
1 1
2
1 2 1
2 1
2 1
n
n
i i
i i
i
n
i
n
A A A P
A A A P A A P A P A A A P
I I I
I I I U U I

( =
+
+ + + =
_ _


sumele fiind luate de la 2 la n.
59
Daca ne intereseaza probabilitatea realizarii unui eveniment oarecare din cele n
evenimente A
1
, A
2
, ..., A
n
, de exemplu a evenimentului A
k
, si numai a acestuia, consideram
formula
(2.28)
) ... ... ( ) (
... ) ( ) ( ) (
) ( )) ... ... ( (
2 1
1
1
1 1 1
3 2 1
1
3 2 1
2 1
1
2 1 1
n k
n
i i i k
k i
i i i
i i k
k i
i i
i k
n
k i
i
k n k k k
A A A A P i
A A A A P A A A P A A P
A P A A A A A P
I I I I I
I I I I I I
U U U U U I

=
( (
=
(
=
=
+
+
+ + +
=
_ _ _

Rationamentele facute mai sus pot fi adaptate imediat la perechi de evenimente, terne de
evenimente, etc.
De exemplu, daca ne intereseaza probabilitatea ca din ansamblul evenimentelor A
1
,...,A
n

sa se realizeze evenimentul A
1
A
2
, problema se rezolva imediat si avem

) ... ( ) 1 ( ) (
) ( ) ( )) ... ( ) (
2 1
1
2 1
3
2 1
3
2 1 1 4 3 2 1
2 1
2 1
1
n
n
i i
i i
i
n
i
n n
A A A P A A A A P
A A A P A A P A A A A A A P
I I I I I I
I I I I I I I I I

( s
=

+
+ =
_
_

Notand cu )) ... ... ( (
1 1 1 ) ( n i i i i
A A A A A P P U U U U U I
+
= probabilitatea ca, dintre
evenimentele A
1
,...,A
n
, sa aiba loc numai evenimentul A
i
, numarul
(2.29) P
(1)
= P
(1)
+...+ P
(n)

evalueaza probabilitatea ca, din ansamblul evenimentelor A
1
,...,A
n
, sa se verifice unul si numai
unul, fara ca acesta sa fie explicitat in mod expres.
Inlocuind in (2.29) valorile probabilitatilor P
(i)
, obtinem
(2.29) P
(1)
= T
1
- 2T
2
+ 3T
3
-4T
4
+ ...+(-1)
n-1
nT
n

unde T P A T P A A T P A A
i i
i i
i n n 1 2 1
1
1 2
2
= = =
(
_ _
( ), ( ), , ( ) si avem expresia
explicita a numarului P
(1)
.
Indicand cu P
(i,j)
probabilitatea ca, din ansamblul evenimentelor A
1
,...,A
n
, sa se realizeze
simultan numai evenimentele A
i
, A
j
, numarul
P
(2)
= P
(1,1)
+ P
(1,2)
+...+ P
(n-1,n)

desemneaza probabilitatea ca numai doua dintre evenimentele A
1
,...,A
n
sa se verifice simultan,
fara ca acestea sa fie specificate in mod expres.
Procedand la fel se pot introduce probabilitatile
P
(i,j,k)
, P
(i,j,k,l)
, ....,P
(3)
, P
(4)
, .... , etc.
Astfel numarul
(2.30) P
r
=P
(r)
+P
(r+1)
+ ... + P
(n)

evalueaza probabilitatea ca cel putin r dintre evenimentele A
1
,...,A
n
sa se verifice. Determinarea
efectiva, pe cale directa, a acestei probabilitati este dificila si va fi data mai tarziu. Exprimarea ei
ca functie de probabilitatile T
1
, T
2
, ..., T
n
, introduse mai sus, este
(2.31)
n
r n
n
r n s
s r
s
r r r r
T C C T C T P

+ +
+ + + + =
1 1 1
1
) 1 ( ... ) 1 ( ... .
60
In particular, pentru r=1, obtinem
(2.31)
n
n
T T T T P
1
3 2 1 1
) 1 ( ...

+ + + =
formula care evalueaza probabilitatea ca cel putin unul dintre evenimentele A
1
,...,A
n
sa se
realizeze.
Sa revenim la campul de probabilitate (O, P(O), P) si fie Ae P(O) supus conditiei P(A)
=0.
Daca indicam prin P
A
aplicatia P
A
: P(O) R definita prin conditia
(2.32) P B
P A B
P A
B
A
( )
( )
( )
, = e P(O) ,
P
A
este o probabilitate pe campul de evenimente (O, P(O)).
Definitia 2.5.1. Probabilitatea P
A
introdusa mai sus, pe campul de evenimente (O, P(O)),
poarta numele de probabilitate indusa de evenimentul A, iar (O, P(O), P
A
) se numeste camp de
probabilitate indus de evenimentul Ae P(O) pe campul de evenimente (O, P(O)).
Numarul P
A
(B), asociat evenimentului Be P(O), exprimat in formula (2.32) poarta
numele de probabilitate a evenimentului B conditionata de evenimentul A.
Conform formulei (2.32) avem
(2.33) P(AB)=P(A) P
A
(B)=P(B) P
B
(A)
daca A,Be P(O) si P(A) P(B)=0; iar, daca A
1
,...A
n
sunt n evenimente apartinand campului de
evenimente (O, P(O)), printr-un calcul direct se poate arata ca avem
(2.34)
0 ) ... (
) ( )... ( ) ( ) ( ) ... (
1 2 1
... 3 2 1 1
1 1 2 1 1
=
=

n
n A A A A A n
A A A dacaP
A P A P A P A P A A P
n
I I I
I I
I I I

In adevar, conditia
0 ) ... (
1 2 1
=
n
A A A P I I I
implica ,..., 0 ) ( , 0 ) (
2 1 1
= = A A P A P I 0 ) ... (
1 2 1
=
n
A A A P I I I
13)
.
Deci
P(A
1
) =P(A
1
)

) ... ( / ) ... ( ) (
....... .......... .......... .......... .......... .......... ..........
) ( / ) ( ) (
) ( / ) ( ) (
1 1 1 ...
2 1 3 2 1 3
1 2 1 2
1 1
2 1
1

=
=
=

n n n A A
A A
A
A A P A A P A P
A A P A A A P A P
A P A A P A P
n
I I I I
I I I
I
I I
I

de unde prin simpla inmultire obtinem formula (2.34). Aceasta formula mai este cunoscuta ca
formula de inmultire a probabilitatilor.
Fie, din nou campul de probabilitate complet aditiv (O, P(O), P) si fie O=E
1
E
2
...E
n

o descompunere a evenimentului sigur in evenimente i ncompatibile.

13)
Daca P(A
1
A
2
... A
n-1
)=0, inseamna ca A
1
A
2
... A
n-1
=C (adica nu este un eveniment imposibil). Deci,
exista cel putin un eveniment care apartine fiecaruia dintre evenimentele A
1
, A
2
, ..., A
n-1
si P()=0. Aceasta implica
P(A
1
)=0, P(A
1
A
2
)=0, ..., P(A
1
A
2
... A
n-2
)=0, P(A
1
A
2
...

A
n-1
)=0.
61
Definitia 2.5.4. Un sistem de n evenimente incompatibile E
1
,...E
n
e P(O), care realizeaza
o descompunere a evenimentului sigur, se spune ca constituie un sistem complet de evenimente
in campul de probabilitate (O, P(O), P).
Daca AeP(O) atunci, A=(AE
1
)(AE
2
)...(AE
n
) si suntem in prezenta
descompunerii evenimentului A in evenimentele incompatibile AE
1
, ..., AE
n
( vezi definitia
2.2.3).
Cu alte cuvinte, evenimentele E
1
,

...,

E
n
alcatuiesc un sistem complet de evenimente daca
un experiment pune in evidenta unul si numai unul dintre ele.
Drept urmare,
P(A)=P(AE
1
)+...+P(AE
n
)
si, deoarece
(2.32) P(AE
i
)=P(A) P
A
(E
i
)=P(E
i
) P
Ei
(A)
rezulta formula
(2.35) P A P E P A
i E
i
n
i
( ) ( ) ( ) =
=
_
1

numita formula probabilitatii totale, cu ajutorul careia se poate determina probabilitatea unui
eveniment A daca se cunosc probabilitatile evenimentelor E
i
, (P(E
i
)=0), si probabilitatile
evenimentului A conditionate de evenimentele E
i
.
Daca in (2.33) tinem seama de (2.35) obtinem
(2.36) P E
P E P A
P E P A
A i
i E
i
i
n
E
i
i
( )
( ) ( )
( ) ( )
=
=
_
1

egalitate care in literatura de specialitate este cunoscuta sub numele de formula lui Bayes, prin
care avem probabilitatile evenimentelor E
i
conditionate de evenimentul A.
In unele aplicatii este util sa punem formula (2.36) sub forma
(2.36) P E
P A E
P A E
A i
i
i
i
n
( )
( )
( )
=
=
_
1

Sa revenim, din nou, la campul de probabilitate (O, P(O), P) si fie AeP(O) un
eveniment supus conditiei P(A)=0. Odata cu campul de probabilitate indus de evenimentul A
peste (O, P(O)), adica odata cu campul (O, P(O), P
A
) sa consideram si campul (A , P(A), P
A
).
Cum, P A
P A A
P A
A
( )
( )
( )
= = 1, in acest camp rolul evenimentului sigur este jucat de evenimentul
A. Daca Be P(O) atunci, ABe P(O) si P
A
(B)=P
A
(AB). Insa AB.B. Ca urmare,
probabilitatea evenimentului B conditionata de evenimentul A, deci numarul P
A
(B) poate fi
interpretat ca masurand sansa realizarii evenimentului B dupa ce evenimentul A a avut loc.
Aceasta interpretare este deosebit de utila in explicatii.
Consideratiile facute mai sus pot fi adaptate, cu unele modificari specifice, si la campuri
de probabilitate complet aditive.
62
Fie (O, P(O), P) un astfel de camp si fie Ae K(O) un eveniment cu proprietatea P(A)=0.
Atunci fiecarui Be K(O) i se poate asocia numarul
P B A P B
P A B
P A
A
( / ) ( )
( )
( )
= =
care, si in acest caz, poarta numele de probabilitatea evenimentului B conditionata de
evenimentul A.
Sa observam ca P i P B P B
A A
I
A
I
( ) [ ( ( ) O = =
e e
_
1
o
o
o
o
oricare ar fi familia cel mult
numerabila
{ }
B
I
o
oe
de evenimente incompatibile din K(O).
Intr-adevar,
_
_
e
e
e
e
e
= =
|
.
|

\
|
= =
= =
O
= O
I
A
I
I
I
I
A
A
B P
A P
B A P
A P
B A P
A P
B A P
B P
si
A P
A P
A P
A P
P
o
o
o
o
o
o
o
o
o
o
) (
) (
) (
) (
(
) (
) (
) (
1
) (
) (
) (
) (
) (
I I
I
I
U
U
U

Prin urmare , (O, K(O), P
A
), este un camp de probabilitate complet aditiv, pe care il vom
numi, la fel cum am facut in cazul campurilor de probabilitate finite (definitia 2.5.1.), camp de
probabilitate indus de evenimentul A pe campul borelian de evenimente (O, K(O)), iar P
A

probabilitatea indusa de evenimentul A.
Presupunand ca o familie cel mult numerabila
{ }
E
I
o
oe
, de evenimente incompatibile,
realizeaza o descompunere a evenimentului sigur O, daca O =
e
E
I
o
o
atunci, oricare ar fi
aeK(O) avem
(2.35) P A P B P A
B
I
( ) ( ) ( ) =
e
_
o
o
o

si suntem in prezenta formulei totale adaptata cazului campurilor complet adtive. Ne dam seama
de valabilitatea formulei (2.36) daca observam ca
A A B
I
=
e
( )
o
o

si, astfel, formula lui Bayes are un corespondent in cazul campurilor de probabilitate complet
aditive.
In adevar, daca P(A)=0 si P(B
o
)=0 pentru toti oeI, atunci, din
P A P B P B P A
A B
( ) ( ) ( ) ( )
o o
o
= ,
conform formulei (2.35) obtinem
(2.36) P B
P B P A
P B P A
A
B
B
I
( )
( ) ( )
( ) ( )
o
o
o
o
o
o
=
e
_
.
63
De asemenea, se poate formula inegalitatea lui Boole intr-un camp de probabilitate
complet aditiv dupa cum urmeaza:
Daca {Xo}
oeI
este o familie numerabila de evenimente din campul de probabilitate complet
aditiv (O, K(O), P), atunci
P X P X
I I
o
o
o
o e e
|
\

|
.
| >
_
1 ( ) .
Intr-adevar, se stie ca X X
I I
o
o
o
o e e
= .
Deci, 1
|
\

|
.
| =
|
\

|
.
| =
|
\

|
.
|
e e e
P X P X P X
I I I
o
o
o
o
o
o
.
Dar, in virtutea corolarului 2.3.3, avem
P X P X
I I
o
o
o
o e e
|
\

|
.
| s
_
( ).
In felul acesta, se obtine
1
|
\

|
.
| s
e e
_
P X P X
I I
o
o
o
o
( )
sau
P X X
I I
o
o
o
o e e
|
\

|
.
| >
_
1 .

2.6. Independenta stochastica. Extractii repetate.
Din formula (2.32) se poate constata ca, dandu-se evenimentele A si H, probabilitatea
P(A|H) nu este, in general, egala cu probabilitatea absoluta P(A). In termeni mai putin precisi se
poate spune ca, daca H se realizeaza, informatia obtinuta influenteaza felul in care privim
evenimentul A. Numai cand P(A|H)=P(A) aceasta informatie nu permite nici o interpretare
asupra aparitiei lui A. In acest caz, vom spune ca A este independent stochastic de H. Putem
scrie conditia P(A|H)=P(A) in forma
(2.37) P(AH)=P(A)P(H) .
Aceasta ecuatie este simetrica in A si H si arata ca, daca A este independent stochastic de H, la
fel este si H fata de A. Este preferabil, deci, sa pornim de la
Definitia 2.6.1. Doua evenimente A si H se spune ca sunt stochastic independente ( pe
scurt independente) daca are loc relatia (2.37).
Aceasta definitie este, de asemenea, acceptata daca P(H)=0, caz in care P(A|H) nu este
definita. Precizam ca termenul independent statistic, intalnit, uneori, in literatura, este sinonim cu
independent stochastic.
Exemplul 2.6.1. Se consideram un pachet cu carti de joc din care sa scoatem o carte la
intamplare. Din motive de simetrie ne asteptam ca evenimentele trefla si as sa fie
64
independente. De fapt, probabilitatile lor sunt 1/4 si 1/13, iar probabilitatea realizarii lor
simultane este 1/52.
Exemplul 2.6.2. Se arunca doua zaruri identice. Evenimentele fata 1 la primul zar si fata cu
un numar par la al doilea zar sunt independente. Probabilitatea realizarii lor simultane este 3/36,
adica 1/12, si reprezinta produsul probabilitatilor acestor evenimente, adica 1/6 si respectiv 3/6.
Exemplul 2.6.3. (Distributia sexelor).
Sa consideram familiile care au trei copii si sa notam prin b si f un baiat si respectiv o
fata. Sa presupunem ca fiecare dintre cele 2
3
posibilitati bbb,bbf,...,fff are probabilitatea 1/8. Fie
H evenimentul familia are copii de ambe sexe si A evenimentul exista cel mult o fata.
Atunci , P(H)=6/8 si P(A)=4/8. Realizarea simultana a evenimentelor A si H inseamna una dintre
posibilitatile bbf, bfb, fbb astfel ca P(HA)=3/8=P(H)P(A). Deci, in familiile cu trei copii, cele
doua evenimente sunt independente.
Este bine sa se retina ca aceasta concluzie nu mai ramane adevarata pentru familiile cu
doi sau patru copii. De exemplu, considerand familiile care au exact doi copii, sa presupunem ca
prima litera indica copilul cel mai mare. Exista urmatoarele patru posibilitati bb, bf, fb, ff , care
constituie evenimente elementare, fiecare avand probabilitatea 1/4. Stiind ca o familie are un
baiat (evenimentul H), care este probabilitatea ca ambii copii sa fie baieti (evenimentul A)? Prin
urmare, evenimentul AH inseamna bb, iar evenimentul H inseamna bb sau bf sau fb. Rezulta,
deci, P(AH)=1/4, in timp ce P(H)=3/4. Atunci, din P(AH)=P(H)P(A|H) se obtine
P(A|H)=1/3. Cu alte cuvinte, o treime dintre familiile cu caracteristica H se pot astepte ca si
evenimentul A sa se realizeze. Este interesant faptul ca multi s-ar astepta ca raspunsul la
intrebarea de mai sus sa fie 1/2. Acesta este,intr-adevar, un raspuns corect dar la alta intrebare,
anume un baiat este ales la intamplare si se gaseste ca el provine dintr-o familie cu doi copii;
care este probabilitatea ca celalat copil sa fie un baiat? Acum, diferenta dintre cele doua
chestiuni este explicabila. Nu avem decat sa consideram o lista a familiilor si o lista a copiilor de
sex masculuin. In ultima fiecare familie cu doi copii va fi reprezentata de doua ori, ceeace
explica diferenta dintre cele doua rezultate.
Prin urmare, nu totdeauna este evident daca avem sau nu independenta evenimentelor.
Daca evenimentul H se realizeaza, evenimentul contrar H nu se realizeza si reciproc.
Independenaa stochastica implica faptul ca, din realizarea evenimentului H, nu se poate trage
nici o concluzie relativ la A. Deci, independenta stochastica a evenimentelor A si H ar insemna
acelasi lucru ca si independenta lui A si H (in virtutea simetriei, la fel ca a evenimentelor A si
H si a evenimentelor A si H). Aceasta rezulta cu usurinta folosind relatia P(H)=1-P(A). Daca
relatia (2.37) se pastreaza atunci, pentru ca AH = A-(AH), se obtine
P(AH)=P(A)-P(AH)=P(A)-P(A)P(H)=P(A)(1-P(H))=P(A)P(H),
cum era de asteptat.
Sa presupunem, acum, ca trei evenimente A,B si C sunt independente astfel incat
P(AB)=P(A) P(B)
(2.38) P(AC)=P(A) P(C)
P(BC)=P(B) P(C)
65
S-ar putea crede ca aceasta implica totdeauna independenta unor asemenea perechi de
evenimente cum ar fi A, B, si C. Din pacate , nu totdeauna se intampla astfel. Urmatorul
exemplu va arata ca relatiile (2.38) sunt adevarate dar realizarea simultana a evenimentelor A, B
si C este imposibila, astfel ca A , B si C nu pot fi independente.
Exemplul 2.6.4.
Se arunca doua zaruri si se definesc urmatoarele trei evenimente: A inseamna fata cu un
numar impar la primul zar; B inseamna fata cu numar impar la al doilea zar; iar C inseamna
suma impara ( adica o fata cu un numar par, iar cealalta cu numar impar). Daca fiecare dintre
cele 36 de evenimente elementare are probabilitatea 1/36 atunci, P(A)=3/6=1/2, P(B)=3/6=1/2, si
P(C)=3/6=1/2. Deci, considerand oricare doua evenimente dintre A, B si C ele vor fi
independente pentru ca
P(AB)=1/4=P(A) P(B)
P(AC)= 1/4=P(A) P(C)
P(BC)= 1/4=P(B) P(C)
Prin urmare, probabilitatea conditionata a fiecaruia dintre evenimentele A, B si C este
egala cu , presupunand ca s-a realizat unul dintre celelalte doua evenimente. Totusi, cele trei
evenimente nu pot sa se realizeze simultan pentru ca apaarand la primul zar un numar impar si la
al doilea tot un numar impar, suma lor nu poate fi tot un numar impar. Cu alte cuvinte,
informatia ca evenimentul A s-a realizat iar B nu s-a realizat, asigura realizarea lui C si
rationamentul poate fi continuat pentru celelalte combinatii.
Este de dorit sa se rezerve termenul de independenta stochastica pentru cazul cand nu
este posibila nici o implicatie. In aceasta situatie nu este suficient sa se pastreze numai egalitatile
(2.38) ci trebuie, in plus, sa avem si
(2.39) P(ABC)= P(A) P(B) P(C).
Aceasta ecuatie asigura independenta evenimentelor A si BC, a evenimentelor B si
AB si a evenimentelor C si AB. Mai mult chiar, acuma se poate dovedi ca si evenimentele A
B si C sunt independente. Pentru aceasta, n-avem decat sa consideram relatia de baza
cunoscuta
P(A
1
A
2
)=P(A
1
)+P(A
2
)-P(A
1
A
2
)
din care deducem
P|(AB)C]=P|(AC)(BC)]=P(AC)+P(BC)-P(ABC).
Aplicand (2.38) si (2.39) in partea dreapta acestei egalitati se obtine
P|(AB)C]=|P(A)+P(B)-P(A) P(B)] P(C)
adica
P|(AB)C]=P(AB) P(C)
Se poate spune, deci, ca orice eveniment care se poate exprima in termeni ai lui A si B va
fi independent de C.
In cazul general a n evenimente, se poate enunta urmatoarea definitie.
66
Definitia 2.6.2. Evenimentele A
1
, A
2
, ..., A
n
se numesc independente in totalitate daca,
pentru toate combinatiile 1s i< j< ... s n, se aplica regulile de inmultire urmatoare
(2.40)
) ( )... ( ) ( ) (
........ .......... .......... .......... .......... ..........
) ( ) ( ) ( ) (
) ( ) ( ) (
2 1 2 1 n n
k j i k j i
j i j i
A P A P A P A A A P
A P A P A P A A A P
A P A P A A P
=
=
=
I K I I
I I
I

Prima linie din (2.40) este valabila pentru
, , 2
n
ecuatti, a doua pentru
, , 3
n
ecuatii etc. Prin
urmare, exista
, , , , , , , , , , 2 3 1 0
1 1 2 1
n n
n
n n n n n
n + + + = + = .... ( ) conditii care trebuie sa fie
satisfacute. Pe de alta parte, cele
, , 2
n
conditii, continute in prima linie, sunt suficiente pentru a
asigura independenta doua cate doua a evenimentelor. Intregul sistem (2.40) pare sa fie o
multime complicata de conditii dar, de fapt, ne este deloc asa.
Se observa fara greutate, prin inductie, (pornind de la n=2 si P(AH)=P(A) P(H)), ca in
definitia 2.6.2 sistemul (2.40) poate fi inlocuit prin sistemul celor 2
n
ecuatii obtinute din ultima
ecuatie a sistemului (2.40) prin inlocuirea unui numar arbitrar de evenimente A
j
cu evenimentele
lor contrare A
j
.
Deosebirea intre independenta in totalitate si independenta doua cate doua a
evenimentelor este de importanta mai mult teoretica decat practica. Ezemple practice de
evenimente independente doua cate doua care nu sunt independente in totalitate, in mod aparent,
nu exista. Posibilitatea unei astfel de aparitii a fost descoperita de S.N. Bernstein si este ilustrata
in exemplul de mai jos.
Exemplul 2.6.5 (S.N. Bernstein).
Fie multimea de evenimente elementare O={
1
,
2
,
3
,
4
} cu P(
i
)=1/4, pentru i=1,2,3,4.
Sa consideram evenimentele A={
1
,
2
}, B={
1
,
3
}, C={
1
,
4
}. Avem, atunci, P(A) = P(B) =P(C)
=1/2 si P(AB)= P(BC)= P(CA) =1/4 =(1/2)(1/2), ceea ce arata ca evenimentele A, B si C
sunt independente doua cate doua. In schimb,
P(ABC)=1/4=(1/2)
3
=P(A) P(B) P(C) ,
de unde rezulta ca evenimentele A, B si C nu sunt independente in totalitate (sau, pe scurt, nu
sunt independente).
Din definitia 2.6.1 rezulta ca doua evenimente A, B incompatibile, care satisfac conditiei
P(A) P(B)=0, nu sunt evenimente independente.
In adevar A,B fiind evenimente incompatibile, avem AB=C, deci P(AB)=0 si, ca
urmare, egalitatea (2.39) nu poate avea loc.
Pentru ca doua evenimente A, B incompatibile sa fie independente trebuie sa avem
(P(A))
2
+(P(B))
2
=0.
In adevar, AB=C implica P(AB)=0, deci P(A) P(B)=0 de unde avem P(A)=0 sau
P(B)=0 sau P(A)=P(B)=0, ceeace conduce la (P(A))
2
+(P(B))
2
=0.
67
Direct din definitia 2.6.1 rezulta ca, daca P(A) P(B)=0, conditia necesara si suficienta ca
evenimentele A, B sa fie independente este sa avem (folosind relatia (2.32))
P
A
(B)=P(B) respectiv P
B
(A)=P(A).
In particular, invocand definitia 2.6.2 avem
Teorema 2.6.1 Daca A
1
, A
2
, ..., A
n
e P(O) sunt evenimente independente atunci, oricare
ar fi subsirul 1s i
1
< i
2
< ...< i
n
s n, are loc egelitatea
(2.41) P(A
1
A
2
....A
n
)= P(A
1
) P(A
2
)... P(A
n
).
Sa stabilim, acum, formula (2.31). De la inceput trebuie sa observam ca probabilitatiile
P
(r)
, P
(r+1)
, ..., P
(n)
sunt functii liniare de T
r
, T
r+1
, ..., T
n
si, deci,
P
r
=a
r
T
r
+a
r+1
T
r+1
+... + a
n
T
n
unde a
r
, ..., a
n
sunt constante.
Presupunand ca evenimentele A
1
, ..., A
n
sunt independente si ca P
1
=P
2
= .. .=P
r
=1, P
r
=1
=0, ..., P
n
=0, obtinem P
r
=1=a
r
1, deci a
r
=1. Daca luam P
1
=P
2
=...=P
r
=P
r+1
=1, P
r +2
=...=P
n
=0
obtinem
P C a a
r r r r
= = +
+ +
1
1
1
1
.
In general, daca P
1
=P
2
=...=P
r
=P
r+1
=... = P
r+k
=1, P
r +k+1
=...=P
n
=0 obtinem
1=C a C a C a
r k
r
r r k
r
r r k
r k
r k + +
=
+ +
+
+
+ + +
1
1
... .
Continuand procesul constatam ca constantele a
1
, ..., a
n
sunt solutiile sistemului

1 ...
....... .......... .......... ..........
1
1
2
2
1
1
2 1
1
2
2
2
1
1
1
= + + + +
= + +
= +
=
+

+

+ + + +
+ +
n r
r n
n r
r n
n
r n
n
r r r r
r r
r
a a C a C C
a a C C
a C
a

de unde rezulta ca
a C
r s
s
r s
s
+ +
= ( ) 1
1

si formula este dovedita.
In continuare, ne vom referi la problema extractiilor repetate. Sa observam, in acest scop,
ca notiunea de independenta stochastica, in final, ne da posibilitatea sa formulam, in mod
analitic, conceptul intuitiv de experimente repetate in conditii identice.
Fie O un camp de evenimente realizat de un anumit experiment. Fie E
1
,E
2
,...
evenimentele elementare ale campului si p
1
,p
2
,... probabilitatile lor. Rezultatele posibile a doua
experimente succesive sunt perechile (E
j
,E
k
), care formeaza un nou camp de evenimente. In
acesta, probabilitatile pot fi atribuite in multe moduri. Daca, insa, experimentatorul precizeaza ca
doua masuratori sunt efectuate in conditii identice atunci, el implica independenta; primul
rezultat, in aceasta situatie, n-ar avea nici o influenta asupra celui de al doilea. Aceasta inseamna
ca cele doua evenimente primul rezultat este E
j
si al doilea rezultat este E
k
ar fi independente
stochastic sau ca
(2.42) P E E p p
j k j k
( , ) = .
68
Aceasta egalitate atribuie o probabilitate fiecarei perechi (E
j
,E
k
). Mai inainte, insa, de a
putea folosi relatia (2.42) ca o definitie a probabilitatilor in noul camp de evenimente, trebuie
aratat ca suma cantitatilor p
j
p
k
este egala cu unitatea. Pentru acestea n-avem decat sa observam
ca in suma p p
j k
k j
_ _
fiecare termen apare odata si numai odata, astfel ca
1 ...) ...)( (
2 1 2 1
= + + + + =
__
p p p p p p
j k
k j
.
Abia apoi putem accepta (2.42) ca o definitie a probabilitatilor mentionate.
Sa notam prin A si B doua evenimente arbitrare ale campului initial de evenimente, iar
prin (A,B) evenimentul A a aparut la prima extragere si B la a doua extragere. Sa presupunem,
mai departe, ca A contine punctele E E
a a
1 2
, , in timp ce B contine punctele E E
b b
1 2
, ,
Atunci, evenimentul (A,B) este reuniunea tuturor perechilor ( , ) E E
a b
j k
si, ca mai inainte, se
observa ca
(2.43) , ,
| ]
P A B p p p p P A P B
a b a b
k j k j
j k j k
, ( )( ) ( ) ( ) = = =
_ _ _ _
.
Deci evenimetele A si B sunt independente. Se vede ca (2.42), acceptata ca definitie, impune ca
toate evenimentele la a doua extragere sa fie independente de evenimentele la prima extragere.
Pentru scopurile pe care le urmareste teoria probabilitatilor aceasta descrie experimente
identice.
Aceste consideratii se pot aplica, desigur, la r experimente succesive ceeace ne conduce
la definitia urmatoare.
Definitia 2.6.3. Fie O multimea evenimentelor elementare E
1
, E
2
, ... ale caror
probabilitati corespunzatoare sunt p
1
, p
2
, .... Se intelege prin n extractii independente care
corespund campului de evenimente respectiv, acel camp de evenimente ale carui puncte sunt n-
uplele ( , ,..., ) E E E
j j j
n 1 2
cu probabilitatile
(2.44) P[ ( , ,..., ) E E E
j j j
n 1 2
]= p p p
j j j
n 1 1
... .
Cu alte cuvinte, fiecare punct al noului camp este o selectie de volum n (cu posibile
repetari) de puncte ale campului initial, probabilitatile fiind definite prin relatia (2.44).
Reamintim ca (2.44) nu este singura definitie posibila a acestor probabilitati. Cu alte cuvinte,
extractiile repetate nu sunt in mod necesar independente. Deci, (2.44) defineste extractii
independente sau, in alti termeni, extractii repetate in conditii identice.
Adevarul stabilit in relatia (2.43) poate fi gasit, intr-o forma mai generala, in urmatoarea
teorema privitoare la extractii independente.
Teorema 2.6.1. Presupunem ca un sistem de evenimente A
1
,A
2
,...,A
n
este astfel incat
extragerea k decide singura daca evenimentul A
k
se realizeaza sau nu; atunci evenimentele
A
1
,....,A
n
sunt independente in totalitate daca extragerile sunt independente, adica daca (2.44)
ramane adevarata.
Daca O contine un numar finit N, de puncte, atunci exista N
n
evenimente elementare
( , ,..., ) E E E
j j j
n 1 2
. Daca fiecare punct din O are probabilitatea 1/N atunci, (2.44) asociaza
69
probabilitatea N
-n
cu fiecare punct ( , ,..., ) E E E
j j j
n 1 2
. Noua abordare este, in mod conceptural,
preferabila unei asocieri formale de probabilitati egale deoarece ea se aplica atat campurilor de
evenimente cu probabilitati neegale cat si campurilor de evenimente infinite. Ea este
indispensabila teoriei generale a probabilitatilor, unde se considera chiar si o singura extractie ca
fiind prima intr-o secventa eventual infinita. Avem, atunci, de-a face numai cu secvente infinite
(E
j1
, E
j2
, .....) de rezultate posibile, in acest nou camp probabilitatile fiind definite in conformitate
cu (2.44). Dar la acest aspect ne vom referi mai tarziu.
In discutia de mai sus, s-su considerat numai repetari ale aceluiasi experiment, dar, in
acelasi mod, se pot trata si secventele unor experimente diferite. Daca aruncam, spre exemplu,
mai intai o moneda si, apoi, un zar, presupunem, in mod natural, ca cele doua experimente sunt
independente. Aceasta revine la asocierea probabilitatilor dupa regula produsului. Astfel,
P[(ban,unu)] =
1
2
1
6

|
\

|
.
|
, etc. In acest caz particular, aceasta echivaleaza cu asocierea de
probabilitati egale tuturor celor douasprezece evenimente elementare dar, in general, trebuie
procedat conform cu (2.44).
Definitia 2.6.4. Fie O si O doua multimi de evenimente E E i E E
1 2 1 2
' ' " "
, ,... [ , ,...
respectiv. Se noteaza probabilitatile corespunzatoare lor prin p p i p p
1 2 1 2
' ' " "
, ,... [ , ,... Secventa
celor doua experimente este descrisa de campul ale carui puncte sunt
, ,
E E
j k
' "
, . A spune ca cele
doua experiente succesive sunt independente insemna a defini probabilitatile prin
(2.45)
, ,
| ]
P E E p p
j k j k
' " ' "
, = .
Observatie. Notiunile pe care le-am introdus nu sunt specifice teoriei probabilitatilor.
Dandu-se doua multimi de evenimente O si O cu punctele, notate in general E si E, multimea
tuturor perechilor (E,E) se numeste produsul cartezian al lui O si O si se noteaza prin
OO. Relatia (2.45) defineste ceeace in mod obisnuit se numeste masura produs a
probabilitatilor evenimentelor din O si O. Am folosit in mod curent cuvantul experiment ca
echivalentul unui camp de evenimente in care s-a definit o probabilitate. In mod similar, secventa
a doua evenimente independente este prescurtarea folosita pentru produsul cartezian al
campurilor de evenimente corespunzatoare cu probabilitati definite de (2.45).
Este bine de retinut si faptul ca reuniunea tuturor perechilor (i,j), unde i si j sunt intregi
pozitivi de la 1 pana la n, formeaza produsul multimii de intregi 1,2,..., n cu ea insasi . De
asemenea, in selectia nerepetata, perechi de forma (i,i) nu sunt permise totusi, asa cum va reiesi
din exemplele urmatoare. Metoda indicata mai sus se aplica si in cazuri ma i complicate.
Exemplul 2.6.6 (Permutari).
Considerand n! permutari ale elementelor a
1
,a
2
,....,a
n
, alese ca puncte ale unui camp de
evenimente, putem atribui fiecaruia probabilitatea 1/n!. Putem, insa, considera acelasi camp de
evenimente ca reprezentand n-1 experimente succesive dupa cum urmeaza. Incepem prin a-l scrie
de a
1
. Primul experiment consta in a-l pune pe a
2
ori inainte, ori dupa a
1
. Odata realizat acest
70
lucru, vom avea trei posibilitati pentru a
3
si al doilea experiment consta in a alege dintre acestea,
decizand asupra ordinei relative a lui a
1
,a
2
si a
3
. In general, dupa ce a
1
,a
2
,...,a
k
sunt asezate intr-o
ordine relativa, se trece la experimentul numarul k constand din selectionarea unuia dintre cele k
+1 locuri pentru a
k+1
. Cu alte cuvinte, avem o succesiune de n-1 experiente din care experimentul
numarul k poate avea drept rezultat k alegeri diferite (evenimente elementare), fiecare avand
probabilitatea 1/k. Experimentele sunt independente, adica se inmultesc. Fiecare permutare a
celor n elemente are probabilitatea
1
2
1
3
1
...
n
, in concordanta cu definitia de baza.
Exemplu 2.6.7 (Selectie nerepetata).
Fie populatia (a
1
,a
2
,...,a
n
). In selectia nerepetata fiecare alegere elimina un element. Dupa
k pasi mai raman n-k elemente si urmatoarea alegere poate fi descrisa prin specificarea
numarului de locuri ale elementului ales (v=1,2,...,n-k). In cest mod, considerarea unei selectii
nerepetate de volum r revine la o secventa de r experimente unde primul are n rezultate posibile,
al doilea n-1, al treilea n-2 etc. Atribuim probabilitati egale tuturor rezultatelor experimentelor
individuale si admitem ca cele r experimente sunt independente. Aceasta se rezuma la atribuirea
probabilitatii
1
( ) n
r
fiecarei selectii, in concordanta cu definitia selectiilor aleatoare. (Retinem ca
pentru n=100 si r=3, selectia (a
13
,a
40
,a
81
) inseamna alegerea numarului 13, a lui 39 si respevtiv
79. La al treilea experiment a fost ales elementul 79 din populatia redusa de n-2 elemente,
rezultatul experimentului al treilea depinzand de primele doua alegeri). Dupa cum se vede,
notiunea de experimente independente repetate ne permite sa studiem selectia ca o secventa de
operatii individuale.
La fel ca in cazul finit, vom spune ca evenimentele A,B, eK(O) sunt independente, daca
P(AB)=P(A) P(B) .
Generalizand, evenimentele A
1
,...,A
n
sunt independente daca oricare ar fi i
1
,i
2
,...,i
p
in
relatia 1si
1
<i
2
<...<i
p
s n, avem

[
=
=
= |
.
|

\
|
p
k
i
p
k
i
k k
A P A P
1
1
) (
I

unde am pus
[
=
=
n
k
i i i
k p
A P A P A P
1
) ( ) ( ).... (
1

Este clar ca aceasta relatie este necesara pentru independenta evenimentelor A
1
,A
2
,...,A
n

oricare ar fi 1si
1
<i
2
<...i
p
s n. Pentru a arata ca ea este si suficienta trebuie dovedit ca, pentru n
evenimente X
1
,X
2
,...,X
n
, unde
{ }
x A A
i i
e , are loc egalitatea
P X X X P X P X P X
n n
( ... ) ( ) ( )... ( )
1 2 1 2
= .
Daca X
1
=A
1
, X
2
=A
2
,...,X
n
=A
n
, atunci aceasta egalitate rezulta din ipoteza.
Sa presupunem, deci, ca X
1
=A
1
, X
2
=A
2
,... X
n-1
=A
n-1
, X
n
=A
n
, celelalte cazuri dovedindu-
se in acelasi fel. Avem, astfel:
71
| ] ) ( ) ( )... ( ) ( 1 ) ( )... (
) ( ) ( )... ( ) ( )... (
) ... ( ) ... (
) ... ( ) ... (
) ... (
)) ( ... ( ) ... (
) ... ( ) ... ( ) ... (
1 1 1 1
1 1 1 1
1 2 1 1 2 1
1 2 1 1 2 1
1 2 1
1 2 1 1 2 1
1 2 1 1 2 1 1 2 1
n n n n
n n n
n n n
n n n
n n
n n n n n
n n n n n
A P A P A P A P A P A P
A P A P A P A P A P
A A A A P A A A P
A A A A P A A A P
A A A A P
A A A A A P A A A A P
A A A A P A A A A P A A A A P





= =
= =
= =
= O =
=
=
+ =
I I I I I I I
I I I I I I I I
I I I I
U I I I I I I I I
I I I I I I I I I I I I
Notiunea de
independenta a unei familii numerabile de evenimente
{ }
X
I
o
oe
din (O, K(O), P), este data in
Definitie 2.6.5. Vom spune ca familia numerabila de evenimente
{ }
X
I
o
oe
este alcatuita
dun evenimente independente, daca oricare ar fi submultimea finita J.I avem
P( X
J
o
o e
) = P X
J
( )
o
o e
[

Teorema 2.6.2. Daca {X
i
}
ieN
este un sir de evenimente independente atunci,
P( X
i
i =

1
) = P X
i
i
( )
=

[
1

Demonstatie Acest rezultat este o consecinta imediata a corolarului 2.3.1. Pentru aceasta
sa punem Y
n
= X
i
i
n
=1
.
Conform definitiei 2.5.4. avem
P(Y
n
) = P X
i
i
n
( )
=
[
1
.
Pe de alta parte , sirul { } Y
i
i N e
fiind monoton descrescator, avem
lim ( ) (
n
n i
i
P Y P X

=
1

si teorema este demonstrata.
2.7. Teorema Borel-Cantelli
Corespondentul proprietatii ascunsa in formula (2.30) este dat, in cazul infinit, in teorema
cunoscuta in literatura de specialitate sub numele de teorema Borel-Cantelli, pe care o formulam
mai jos.
Teorema 2.7.1. (Teorema Borel-Cantelli) Fie
{ } X
i
i N e
un sir de evenimente apartinand
unui camp de probabilitate (O, K(O), P) complet aditiv.
(i) Daca seria P X
i
i
( )
=

_
1
este convergenta atunci, probabilitatea realizarii unei
infinitati de evenimente X
i
este zero.
(ii) Daca seria P X
i
i
( )
=

_
1
nu este convergenta si daca evenimentele
{ } X
i
i N e
sunt
independente atunci, probabilitatea realizarii unei infinitati de evenimente X
i
este egala cu
unitatea.
72
Demonstatie. Sa observam, mai intai, ca realizarea unei infinitati de evenimente X
i
,
i=1,2,3, ... , echivaleaza cu realizarea evenimentului
A= limsup
i
i j
j i i
X X

=
|
\

|
.
|
1
,
astfel ca, pentru a demonstra teorema, este suficient sa aratam ca P(A)=0 in primul caz si ca
P(A)=1 in al doilea caz .
(i) Cum A . X
j
j i =

pentru orice ieN, conform corolarului 2.3.3, avem


P(A) s P X P X
j
j i
j
j i =

|
\

|
.
|
s _ ( ) .
Seria P X
i
i
( )
=

_
1
fiind presupusa convergenta, lim (
i
j
j i
P X

_ = 0. Ca urmare, prin trecere la limita,


rezulta P(A) = lim ( )
i
j
j i
P X

_ = 0
si prima parte a teoremei este dovedita.
(ii) In cazul al doilea avem succesiv
P(A)= lim limlim limlim limlim
i
j
j i
i s
j
j i
s
i s
j
j i
s
i s
j
j i
s
P X P X P C X P CX


=

=

=
|
\

|
.
|
=
|
\

|
.
|
=
|
\

|
.
|
|
\

|
.
| =
|
\

|
.
|
|
\

|
.
| 1 1
Dar, evenimentele
{ } X
i
i N e
fiind presupuse independente, vor fi independente si evenimentele
contrare astfel ca rezulta
P CX P CX P X
j
j i
s
j
j i
s
j
j i
s
= = =
= =
[ [
( ) ( ( )) 1 .
Insa, din analiza matematica se stie ca, pentru orice 0 <x<1 avem 1-x< e
-x
si, deoarece,
P(X
j
) satisface aceasta conditie, urmeaza ca 1-P(X
j
)<e
P X
j
( )
. Dar, atunci, vom avea
( ( )
( )
1
_
=

[
=
P X e
j
j i
s
P X
j
j i
s
,
si, cum, prin ipoteza seria P X
i
i
( )
=

_
1
nu este convergenta, avem
limlim
( )
i s
P X
e
j
j i
s

=
_
= 0
Asadar,
limlim ( ( ))
i s
j
j i
s
P X

=
=
[
1 0
de unde rezulta
limlim
i s
j
j i
s
P CX

=
|
\

|
.
|
= 0 .
Dar, in acest caz, P(A)=1 si teorema este complet demonstrata.
73
Nota. Este important de retinut ca partea a doua a teoremei Borel-Cantelli are loc pentru
evenimente independente, ea putand sa nu fie adevarata pentru evenimente arbitrare. De
exemplu, daca X
i
=Y pentru orice ieN atunci, daca luam 0<P(Y)<1, rezulta 0<P(A)<1, caz in care
partea a doua a teoremei nu mai este adevarata.

2.8. Aplicatii
In paragraful de fata ne vom referi la unele aplicatii in teoria ereditatii, care furnizeaza
ilustrari instructive pentru aplicarea modelelor probabiliste simple. Tinand seama de scopul
urmarit, ne vom limita la acele aspecte susceptibile unei tratari din punct de vedere matematic.
Caracterele care se mostenesc depind de purtatori speciali numiti gene. Se impune o
succinta prezentare a unor aspecte legate de structura celulelor pentru a putea avea o privire clara
asupra genelor. celulele somatice sle corpului omenesc au in structura lor 44 de cromozomi
somatici (22 de perechi) si doi cromozomi sexuali: XX pentru femei si XY pentru barbati. Pe
cromozomi se gasesc structuri liniare numite gene. Genele, care sunt raspunzatoare de
transmiterea carcaterelor mostenite, se afla pe cromozomii somatici si pe cei doi cromozomi X.
Se pare ca pe cromozomul Y se gasesc foarte putine gene somatice (daca nu cumva nu se gasesc
de loc; s-ar putea sa se gaseasca o gena anormala care ar transmite caracterul de a vaea par in
cantitate mare in urechi). Astfel, pe cromozomii somatici si pe cei doi comozomi XX, genele
somatice apar perechi. In cel mai simplu caz, gena unei perechi particulare poate admite doua
forme A si a. Atunci, se pot forma trei perechi diferite si, in raport cu aceasta pereche particulara,
organismul apartine unuia dintre cele trei genotipuri AA, Aa, aa (nu exista distinctie, intre Aa si
aA). Fiecare pereche de gene determina un factor transmisibil dar, majoritatea proprietatilor
observabile ale organismelor depind de diversi factori. Pentru unele caracteristici (cum ar fi, spre
exemplu, culoarea ochilor si aceea de a fi stangaci) influenta unei perechi particulare de
gene este predominanta, in timp ce pentru altele, ca de exemplu inaltimea, efectul este cumulat
de la un numar foarte mare de gene. Ne vom margini, aici, la studiul genotipurilor si mostenirii
caracterelor numai pentru o pereche particulara de gene relativ la care avem trei genotipuri AA,
Aa, aa. In mod frecvent exista N forme diferite A
1
,A
2
,...,A
N
pentru cele doua gene si,
corespunzator
N +
|
\

|
.
|
1
2
, genotipuri A
1
A
1
, A
1
A
2
, ..., A
N
A
N
. Bineinteles ca teoria se aplica, in acest
caz, cu unele modificari. Calculul urmator se va aplica, de asemenea, intr-un caz special, anume
cand forma A este predominanta si a este respinsa. Se intelege, deci, ca indivizii Aa au aceleasi
proprietati observabile ca si AA, astfel ca numai tipul pur aa prezinta o influenta observabila a
formei a. In natura apar toate nuantele de predominare partiala. Proprietati tipice numai partial
respinse sunt, spre exemplu, ochi albast ri, stangacia etc.
Celulele reproductive, sau gametii, se formeza printr-un proces complex in urma caruia
numarul de cromozomi se va reduce la jumatate. Pentru ovule vom avea 22 de cromozomi
somatici si un cromozom sexual X, iar pentru spermatozoizi vom putea avea doua variante: 22
cromozomi somatici si un cromozom sexual X, sau 22 cromozomi somatici si un cromozom
sexual Y. Organismele de genotipurile pure AA si aa (sau homozigoti) produc, deci, gameti
74
numai de un singur fel, iar organismele de tipul Aa (hibrizi sau heterozigoti) produc gameti A si
a in numar egal. Organismele noi sunt derivate din doi gameti parinti de la care primesc genele.
Prin urmare, fiecare pereche include o gena paterna si una materna, si orice gena poate fi
observata la un stramos particular, in orice generatie, insa eventual mai putin accentuata.
Genotipurilor urmasilor sunt dependente de un proces aleator. In orice imprejurare,
fiecare gena parinteasca poate fi transmisa cu probabilitatea , si suntem in cazul cand mai
multe probe succesive sunt independente. Cu alte cuvinte, ne putem imagina genotipurile a n
urmasi ca rezultatul a n probe independente, fiecare dintre ele corespunzand cazului in care sunt
aruncate doua monede. Spre exemplu, genotipurile descendentilor unei imperecheri AaAa sunt
AA, Aa, aa cu probabilitatile respective , , . O unire de tipul AAaa poate avea numai Aa-
urmasi, etc.
Privind populatia ca un tot, ne putem imagina unirea partilor ca rezultatul unui al doilea
proces aleator. Ne vom referi aici numai la asa numita imperechere aleatoare definita prin
conditia urmatoare: daca se aleg la intamplare r descendenti din prima generatie filiala atunci,
parintii lor formeaza o selectie aleatoare de volum r, cu eventuale repetari, a populatiei tuturor
perechilor posibile de parinti. Cu alte cuvinte, fiecare descendent este privit ca fiind produsul
unei selectii aleatoare a parintilor, toate selectiile fiind independente in totalitate. Imperecherea
aleatoare este un model idealizat al situatiilor care se intalnesc in multe populatii naturale si in
campul experimental. Insa este de asteptat ca selectivitatea preferentiala (cum ar fi faptul ca
blondul prefera tot blond) este de asteptat sa violeze conditia imperecherii aleatoare. Si
bineinteles ca mai exista asemenea situatii, ele putand fi analizate matematic. Tinand seama de
scopul pe care ni l-am propus vom ramane, insa, in cadrul aspectului aleator.
Deci, genotipul unui urmas este rezultatul a patru alegeri aleatoare independente.
Genotipurile celor doi parinti pot fi selectionate in 33 moduri, iar genele lor in 22 moduri. Insa,
putem sa combinam doua selectii si sa descriem procesul drept unul dintr-o selectie dubla astfel:
genele paterne si materne sunt selectionate fiecare independent si la intamplare din populatia
tuturor genelor purtate de barbati si femei din populatia sursa.
Sa presupunem ca cele trei genotipuri AA, Aa, aa apar printre barbati si femei in aceeasi
proportie u:2v:w. Vom presupune ca u+2v+w=1 si vom spune ca u, 2v, w sunt frecventele
genotip. Sa punem
(2.46) p=u+v, q=v+w.
In acest fel, numarul genelor de formele A si a sunt ca p:q si, deoarece p+q=1, vom numi
p si q frecventele gena de forma A si respectiv a. In fiecare dintre cele doua selectii o gena de
forma A este selectata cu probabilitatea p si astfel, datorita presupunerii independentei,
probabilitatea ca un urmas sa fie AA este p
2
. Genotipul Aa poate sa apara in doua moduri si, prin
urmare, probabilitatea sa este 2pq. Astfel, sub conditia imperecherii aleatoare, un urmas va
apartine genotipurilor AA, Aa sau aa cu probabilitatile
(2.47) u
1
=p
2
, 2v
1
=2pq si respectiv w
1
=q
2
.
Exemplul 2.8.1.
(i) Toti parintii sunt Aa (heterozigoti); atunci u=w=0, 2v=1 si p=q=1/2.
75
(ii) Parintii AA si aa sunt combinati in proportii egale. Atunci, u=w=1/2, v=0 si, din nou,
p=q=1/2.
(iii) In sfarsit, u=w=1/4, 2v=1/2 si iarasi p=q=1/2. Deci, in toate cele trei cazuri se obtine, pentru
generatia filiala, u
1
=1/4, 2v
1
=1/2, w
1
=1/4.
Pentru o mai buna intelegere a implicatiilor relatiilor (2.47) sa fixam frecventele gena p si
q (p+q= =1) si sa consideram toate sistemele de frecvente genotip u, 2v, w, pentru care u+v=p si
v+w=q. Toate conduc la acesleasi probabilitati (2.47) pentru prima generatie filiala. Printre ele
exista distributia particulara
(2.48) u=p
2
, 2v=2pq, w =q
2
.
Daca frecventele u,v,w din generatia initiala se afla in relatia particulara (2.48) - ca in
cazul (iii) de mai sus - atunci se gaseste, pentru probabilitatile genotipurilor din prima generatie,
u
1
=u, v
1
=v si w
1
=w. Prin urmare, vom spune ca distributiile genotip de forma (2.48) sunt
stationare. Fiecarui raport p:q ii corespunde o distributie stationara (sau un echilibru).
Relatiile (2.47) dau probabilitatile genotipurilor pentru un individ selectat aleator din
generatia a doua. Intr-o populatie numeroasa trebuie sa ne asteptam ca frecventele genotip reale
sa se apropie de distributia teoretica (o formulare precisa se da cu ajutorul legii numerelor mari si
a teoremei limita centrala care permit sa se estimeze efectul fluctuatiei sansei). Oricare ar fi
distributia u:2v:w in generatia parinteasca, relatiile (2.47) definesc o distributie stationara; in ea
genele A si a apar cu frecventele u
1
+v
1
=u+v=p si v
1
+w
1
=v+w=q (conform (2.46)). Cu alte
cuvinte, daca frecventele observate coincid cu probabilitatile calculate atunci, prima generatie
filiala ar avea o distributie genotip stationara care s-ar perpetua fara schimbare in toate
generatiile care o succed. Astfel, pentru populatii numeroase se poate spune ca oricare ar fi
compozitia populatiei sursa realizarea imperecherii aleatoare intr-o generatie produce
aproximativ o distributie genotip stationara cu frecvente gena neschimbate.
De la a doua generatie, nu exista nici o tendinta catre o schimbare sistematica. In
particular, urmeaza ca, pe baza conditiei de imperechere aleatoare, frecventele celor trei
genotipuri trebuie sa fie in proportia p
2
:2pq:q
2
. Aceasta poate fi folosita, acum, in sens invers
pentru verificarea presupunerii asupra imperecherii aleatoare. [G. H. Hardy a aratat ca
frecventele celor trei genotipuri in a n-a generatie sunt trei variabile ale caror valori presupuse
sunt date de (2.47) si nu depind de n. Valorile lor reale vor varia de la generatie la generatie si
formeaza un proces stochastic de tip Markov].
In formularea de mai sus, accentul trebuie pus pe cuvantul aproximativ (cum preciza
Hardy). Chiar cu o distributie stationara trebuie sa ne asteptam la putine schimbari de la o
generatie la alta, fapt care sugereaza urmatoarea imagine. Pornind de la o populatie sursa,
imperecherea aleatoare tinde sa stabileasca distributia stationara (2.48) intr-o generatie. Pentru o
distributie stationara, nu exista nici o tendinta spre schimbare sistematica de vreun fel. Insa,
fluctuatiile sansei vor schimba frecventele gena p si q de la generatie la generatie, astfel incat
compozitia genetica va fi usor influentata; nu exista posibilitatea de restabilire a frecventelor
initiale. Din contra, modelul simplificat la care s-a recurs pana acum, ne conduce la concluzia ca,
pentru o populatie limitata ca marime, un genotip Aa pana la urma piere, astfel ca populatia ar
76
apartine eventual unuia dintre tipurile pure AA sau aa. In natura aceasta situatie nu apare in mod
necesar din cauza aparitiei de noi gene prin mutatii, selectie si alte multe efecte. Acestea, pot fi
studiate prin mijloace matematice mai rafinate ( ca lanturi Markov, teoria difuziei).
Este o eroare sa se creada ca legea numerelor mari actioneaza ca un dispozitiv inzestrat
cu memorie care cauta sa se intoarca la starea initiala, multe concluzii gresite putand sa se traga
dintr-o asemenea presupunere (procesele biologice considerate aici sunt tipice unei clase
importante de procese Markov la care, insa, nu ne vom referi aici). Remarcam faptul ca legea lui
Hardy nu se aplica distributiei a doua perechi de gene (spre exemplu culoarea ochilor si a fi
stangaci) cu noua genotipuri AABB, AABb, ..., aabb. Se manifesta inca o tendinta spre o
distributie stationara, dar echilibrul nu este atins la prima generatie.
Sa ne referim, acum, la cromozomii sexualii X si Y. Astfel, sexul este determinat de doi
cromozomi: femeile sunt XX, iar barbatii XY. Mama transmit, in mod necesar, un cromozom X
(ovulele sunt toate de forma 22+X) si sexul urmasului depinde de cromozomul transmis de tata.
Spermatozoizii se formeaza in numar egal 22+X sau 22+Y. Daca urmasul este baiat sau fata,
aceasta se explica prin variatia sanselor in perioada existentei prenatale.
Se stie ca genele somatice apar in perechi atat pe cromozomii somatici cat si pe
cromozomii X, insa la barbat, care are un singur cromozom X, genele somatice de pe acest
cromozom apar singure. S-a stabilit ca pe cromozomii X sunt situate gene care determina
daltonismul si gene care determina hemofilia. Cu privire la fiecare dintre ele, femeile pot fi inca
clasificate in trei genotipui AA, Aa, aa dar, avand numai o gena, barbatii au numai cele doua
genotipuri A si a. Notam ca un fiu are totdeauna cromozomul Y al tatalui asa incat caracterul
de sex nu poate fi mostenit de la tata la fiu. Insa, el poate sa treaca de la tata la fiica si de la ea
la nepot.
In continuare, sa generalizam analiza facuta in prima parte a acestui paragraf. Sa
presupunem, din nou, imperecherea aleatoare si fie u, 2v, w respectiv, frecventele genotipurilor
AA, Aa, aa in populatia feminina. Sa presupunem, ca si mai inainte, p=u+w, q=v+w. Frecventele
celor doua genotipuri masculine A si a sa le notam prin p si q (1=p+q). Atunci, p si p sunt
frecventele genei de forma A in populatia feminina si respectiv masculina. Probabilitatea ca un
descendent feminin sa fie din genotipul AA, Aa, aa va fi notata prin u
1
, 2v
1
, w
1
; probabilitatile
analoage pentru tipurile masculine A si a sunt
/
1
/
1
q si p . Deci, un urmas masculin primeste
cromozomul X de la parintele de sex feminin si rezulta
(2.49) q q si p p = =
/
1
/
1
.
Pentru cele trei genotipuri feminine se gaseste ca si in cazul genelor
(2.50) u
1
=pp, 2v
1
=pq+qp, w
1
=qq.
Prin urmare
(2.51) p
1
=u
1
+v
1
=(1/2)(p +p), q
1
=v
1
+w
1
=(1/2)(q +q).
Acestea pot fi interpretate astfel. Printre descendentii masculini genele A si a apar
aproximativ cu frecventele p si q din populatia materna; frecventele gena printre descendentii de
sex feminin sunt aproximativ p
1
si q
1
, sau semisuma dintre acelea ale populatiilor paterna si
77
materna. Se simte o tendinta spre egalizarea frecventelor gena. De fapt, din (2.49) si (2.51) se
obtine
(2.52) p p p p
1 1
1
2
'
( ' ) = , q q q q
1 1
1
2
'
( ' ) = .
Aceasta inseamna ca imperecherea aleatoare determina intr-o generatie reducerea aproximativ cu
jumatate a diferentelor intre frecventele gena dintre femei si barbati. Insa ea nu elimina
diferentele, ci subzista doar o tendinta spre o reducere urmatoare. In contrast cu legea lui Hardy,
aici nu se intalneste o situatie stationara dupa o generatie. Se pot urmari sistematic schimbarile
de la generatie la generatie omitand fluctuatiile sansei si identificand probabilitatile teoretice
(2.50) si (2.51) cu frecventele corespunzatoare reale in prima generatie filiala. Pentru a doua
generatie se va obtine, prin acelasi procedeu,
(2.53)
p p p p p
q q q q q
2 1 1
2 1 1
1
2
3
4
1
4
1
2
3
4
1
4
= + = +
= + = +
( ) '
( ) '
'
'

si, bineinteles, p p q q
2 1 2 1
' '
, = = . Un numar mai mare de probe ne va conduce la expresia
generala a probabilitatilor p
n
si q
n
pentru cazul femeilor descendente din a n-a generatie. Sa
punem
(2.54) = (1/3)(2p+p) , | = (1/3)(2q+q)
(retinem ca +|=1). Atunci
(2.55)
p
p p p p
q
q q q q
i p p q q
n
n n n
n
n
n n n
n
n
n
n n
=
+
= +

=
+
= +

= =


1 1
1 1
1
1
2
1
3 2
2
1
3 2
'
'
' '
( )
'
( )
'
[ ,
|
|
Deci (2.56) p p q q
n n n n
| | , , ,
' '
.
Frecventele genotip in populatia feminina, ca cele date prin (2.50), sunt
u p p v p q q p w q q
n n n n n n n n n n n
= = + =
1 1 1 1 1 1 1 1
2
' ' ' '
, , .
Prin urmare, (2.57) u v w
n n n
| |
2 2
2 2 , , .
Aceste relatii arata ca exista o tendinta sistematica puternica, de la generatie la generatie, catre o
situatie in care genotipurile A si a apar printre barbati cu frecventele si | , genotipurile
feminine AA, Aa, aa avand probabilitatile
2
, 2|, |
2
, respectiv. Convergenta este foarte rapida,
asa cum reiese si din (2.54). Practic, echilibrul va fi atins la a treia sau a patra generatie. Cu
siguranta, putine fluctuatii se vor suprapune peste schimbarile descrise, ultima insa reprezinta
tendinta predominanta.
Concluzia principala este ca, in iopteza imperecherii aleatoare, ne putem astepta ca
genotipurile de sex A si a la barbati si AA, Aa, aa la femei sa apara aproximativ cu frecventele ,
|,
2
, 2|, |
2
respectiv, unde +|=1.
78
Exemplul 2.8.2.
Multe gene sunt respinse, ceea ce cauzeaza defecte. Fie a o asemenea gena. Atunci toate
a-masculine si aa- feminine fac sa apara defecte. Femeile de tipul Aa pot transmite defectul
urmasului lor fara sa fie afectate ele insele. Deci este de asteptat ca un defect respins care apare
printre barbati cu frecventa sa apara printre femei cu frecventa
2
. Deci, daca, spre exemplu, un
barbat dintr-o suta este daltonist, o femeie ar fi afectata din 10.000.
Un exemplu tipic de influenta a selectiei il constituie cazul in care indivizii aa nu pot
reproduce. Aceasta se intampla cand gena a este respinsa in asa fel incat indivizii aa se nasc dar
nu pot supravietui.
Sa presupunem ca are loc imperecherea aleatoare intre indivizii AA si Aa, dar nu de tipul
aa. Fie u, 2v, w frecventele cu care apar genotipurile AA, Aa, aa in populatia totala. Frecventele
corespunzatoare pentru parinti sunt atunci
(2.58) u
*
=u/(1-w) , 2v
*
=2v(1-w), w
*
=0.
Se poate proceda ca in prima parte a acestui paragraf, dar folosind relatiile (2.58) in loc
de u, 2v, w. Prin urmare, (2.46) se inlocuieste cu
(2.59) p
u v
w
q
v
w
=
+

=
1 1
, .
Probabilitatile celor trei genotipuri in prima generatie filiala sunt, din nou, date de (2.47)
sau u
1
=p
2
, 2v
1
=2pq, w
1
=q
2
.
Ca si mai inainte, pentru a studia schimbarile sistematice de la generatie la generatie,
avem de inlocuit u, v, w, prin u
1
, v
1
, w
1
obtinand, astfel, probabilitatile u
2
, v
2
, w
2
pentru a doua
generatie descendenta, etc.
In general, din (2.59) se obtine
(2.60) p
u v
w
q
v
w
n
n n
n
n
n
n
=
+

=
1 1
,
Si (2.61) u p v p q w q
n n n n n n n + + +
= = =
1
2
1 1
2
2 2 , , .
Compararea relatiilor (2.60) si (2.61) arata ca
p
u v
w
p
q
q
n
n n
n
n
n
n
+
+ +
+
=
+

=
+
1
1 1
1
2
1
1
1
1

si, analog
(2.62) q
v
w
q
q
n
n
n
n
n
+
+
+
=

=
+
1
1
1
1
1
.
Din (2.62) se poate calcula, in mod explicit, q
n
. Avem
1
1
1
1
q q
n n +
= +
de unde rezulta succesiv

1
1
1 1
2
1 1 1
1 1
1 2
1
2
q q q q q
n
q
sau q
q
nq
w
q
nq
n
n n
= + = + = + =
+
=
+
|
\

|
.
|
+
, , , , .
79
Se observa ca, incetul cu incetul, genotipul neproductiv (sau nedorit) se elimina dar
procesul este extrem de lent. Pentru q=0 sunt necesare zece generatii pentru a reduce frecventa
genelor a la jumatate; frecventa tipului aa se reduce, in acest fel, aproximativ de la 1 la la suta.

Alte exemple
2.8.3. Se da o urna cu n bile numerotate de la 1 la n. Din urna se extrag succesiv cele n
bile. Numerotand extractiile se cere probabilitatea ca in peocesul extractiei sa se obtina cel putin
o concordanta, anume, ca cel putin o data, la o bila, rangul extractiei sa coincida cu numarul
marcat pe bila.
Solutie. Sa notam cu A
i
evenimentul ca la extaractia de indice i sa obtinem bila marcata
cu numarul i. Evenimentul ca in procesul extractiei sa avem cel putin o concordanta este
A
1
A
2
..A
n
.. Ca urmare, este indicat sa utilizam formula (2.40) si este, deci, necesar sa
determinam probabilitatile evenimentelor A
i
, i=1,...,n
A A A A A A A A
i i i i i k
k 1 2 1 2
1 2
,..., ... ,..., ... .
Calculul probabilitatii evenimentului A
i
. Cele n bile pot fi extrase in n moduri. Cazurile
favorabile evenimentului A
i
sunt in numar de (n-1)! deoarece bilele 1,2,...,i-1,i+1,...,n pot fi
extrase in (n-1) moduri. Deci
P A
n
n n
i
( )
( )!
!
=

=
1 1
.
Calculul probabilitatii evenimentului A A i i n
i i
1 2
1
1 2
, s ( s poate fi efectuat ovservand
ca numarul cazurilor favorabile acestui eveniment este (n-2)! pentruca bilele 1,2,...,i
1
-1 ,i
1
+1, ...,
i
2
-1,i
2

+1, ..., n pot fi extrase in (n-2)! moduri. Ca urmare
P A A
n
n n n
i i
( )
( )!
! ( )
1 2
2 1
1
=

=

.
Procedand la fel, avem
P A A A
n k
n n k n
i i i
k
( ... )
( )!
! ( )...
1 2
1
1
=

=
+

Observand ca
P(A
i
)=n(1/n)=1
P A A C
n n
i i n
i i
( )
( ) !
1 2
1 2
2
1
1
1
2
=

= _
.....................................................................
_
( (
=
+
=
i i
i i i n
k
k
k
P A A A C
n k n k
1
1 2
1
1
1
...
( ... )
( )... !
, etc.
rezulta
P A A A
n
n
n
( ... )
! !
... ( )
!
1 2
1
1
1
2
1
3
1
1
= + +

.
2.8.4. Trei muncitori depasesc norma de lucru cu probabilitatile p
1
=0,65, p
2
=0,70,
p
3
=0,80. Lucrand in echipa ne intrebam:
80
a) Care este probabilitatea ca cel putin unul din muncitori sa depaseasca norma ?
b) Care este probabilitatea ca cel putin doi dintre ei sa depaseasca norma ?
c) Care este probabilitatea ca numai primul sa depaseasca norma ?
d) Care este probabilitatea ca echipa sa nu depaseasca norma ?
Solutie. Fie A
i
, i=1,2,3, evenimentele ca fiecare muncitor sa depaseasca norma, deci P(A
i
)
=p
i
. Pentru solutionarea problemei adoptam ipoteza ca evenimentele A
i
sunt independente, deci
P(A
1
A
2
) =

p
1
p
2
= 0,455, P(A
1
A
3
) =p
1
p
3
=0,52, P(A
2
A
3
) =p
2
p
3
=0,56 si
P(A
1
A
2
A
3
)=p
1
p
2
p
3
=0,364.
Pentru a raspunde la prima intrebare vom calcula probabilitatea evenimentului
A
1
A
2
A
3
.
Utilizand formula (2.22) obtinem P(A
1
A
2
A
3
)=p
1
+p
2
+p
3
-(p
1
p
2
+p
1
p
3
+p
2
p
3
)+p
1
p
2
p
3
=0,979.
Pentru a raspunde la cea de a doua intrebare, utilizand formula (2.31) unde luam r=2,
n=3, obtinem
P
2
=p
1
p
2
+p
1
p
3
+p
2
p
3
- C
2
1
p
1
p
2
p
3
=0,804.
Utilizand formula (2.28), unde luam n=3, obtinem raspunsul la intrebarea a treia, adica
P=p
1
-(p
1
p
2
+p
1
p
3
) +p
1
p
2
p
3
=0,039.
In ce priveste raspunsul la ultima intrebare, calculam probabilitatea evenimentului
A A A
1 2 3
si avem
P( A A A
1 2 3
)=1-P( A A A
1 2 3
)= 0,029.
2.8.5. Fie A,BeP(O) sau A,BeK(O). Sa se arate ca urmatoarele propozitii sunt
echivalente
a) Evenimentele A, B sunt independente;
b) Evenimentele A, B sunt independente;
c) Evenimentele A , B sunt independente;
d) Evenimentele A B , sunt independente.
Sa se generalizeze problema la cazul a n evenimente si la cazul a unei infinitati numerabile de
evenimente din K(O).
Solutie. ab. Din A=(A B)(AB) rezulta P(A)=P(A B)+P(AB)=
P(A B)+P(A)P(B). Ca urmare, P(A B)=P(A)(1-P(B))= P(A)P( B).
bc. Se inlocuiesc A cu A si B cu B in formula P(A B)=P(A) P(B).
cd. Rezulta direct din formula P( A B)=P( A ) P(B).
da. Rezulta direct din formula P( A B)=P( A ) P( B) inlocuind A cu A si B cu B.
Trecerea la cazul general {X
o
}
oeI
este imediat, unde I este o multime cel mult
numerabila. Se arata ca, daca X X
i i
p 1
,..., este un numar finit arbitrar de evenimente din familia
{X
o
}
oeI
, independenta familiei {X
o
}
oeI
implica independenta femiliei {Y
o
}
oeI
unde X
o
=Y
o

sau Y
o
= X
o
, alegerea fiind facuta in toate modurile posibile.
De exemplu
81
) ( )... ( ) ( ) ( )... ( )) ( 1 (
) ( )... ( ) ( ) ( )... (
) ... ( ) ... ( ) ... (
2 1 2 1
2 1 2
2 1 2 1
p p
p p
p p p
i i i i i i
i i i i i
i i i i i i i
X P X P X P X P X P X P
X P X P X P X P X P
X X X P X X P X X P
= =
= =
= = I I I I I I I


In acest calcul s-a utilizat formula P( A B)=P(B)-P(AB).
2.8.6. Se considera patru urne cu infatisari identice. Se stie ca urna U
1
contine 7 bile albe
si 2 negre, U
2
contine 8 bile albe si 4 negre, U
3
contine 10 bile albe si 12 negre iar U
4
contine 8
bile albe si 12 negre. Se alege la intamplare o urna si se extrage o bila. Se cere probabilitatea ca
bila extrasa sa fie alba.
Solutie Fie A evenimentul ca bila extrasa sa fie alba si E
i
, i=1,2,3,4, evenimentul ca bila
extrasa sa fie din urna U
i
. Din datele problemei avem P(E
1
)=P(E
2
) =P(E
3
) =P(E
4
)= 1/4. P(A)
se obtine aplicand formula probabilitatii totale.
P(A) = P(E
1
)P
E1
(A)+P(E
2
)P
E2
(A)+P(E
3
)P
E#
(A)+P(E
4
)P
E4
(A)
unde P
E1
(A) inseamna probabilitatea ca bila alba sa fie scoasa din urna U
1
, etc.. In cazul de fata
P
E1
(A)=7/9, P
E2
(A)=8/12, P
E3
(A)=10/22, P
E4
(A)=8/20.
2.8.7. Trei centre de productie fabrica piese de acelasi tip cu rebuturi de 3%, 2%, 3%.
Piesele se depoziteaza in acelasi loc. Se ia o piesa la intamplare si se constata ca aceasta nu
corespunde stasului. Se intreaba care este probabilitatea ca piesa in cauza sa fi fost fabricata de
cel de-al doilea centru stiind ca o piesa luata la intamplare, din stoc, provine de la primul centru
cu probabilitatea de 0,2, de la al doilea centru cu probabilitatea 0,7, iar de la cel de-al treilea
centru cu probabilitatea 0,1.
Solutie. Fie A evenimentul ca piesa sa fie un rebut si E
1
, E
2
, E
3
evenimentul ca piesa sa
fie fabricata la centrul C
1
, C
2
, C
3
respectiv. Evenimentele E
1
, E
2
, E
3
sunt incompatibile si
formeza un sistem complet. Se aplica formula lui Bayes (2.36), pentru a obtine P
A
(E
2
), unde
P(E
1
) =0,2, P(E
2
) =0,7, P(E
3
)=0,1, iar P A P A P A
E E E
1 2 3
3 100 2 100 3 100 ( ) / , ( ) / , ( ) / = = = .














82
CAPITOLUL 3
VARIABILE ALEATOARE. CARACTERISTICI NUMERICE.
FUNCTIA DE REPARTITIE.

OBIECTIVE

Variabilele aleatoare, functia de repartitie ale variabilelor aleatoare reprezinta un puternic
instrument de reprezentare a evenimentelor. Gradul de abstractizare este mare. Media si dispersia
unei variabile aleatoare sunt elemente centrale ce caracterizeaza o vari abila aleatoare.

La sfarsitul acestui capitol, studentii trebuie sa-si insuseasca:
- Variabile aleatoare: discrete, continue. Operatii cu variabile aleatoare
- Valori medii, dispersii, corelatie
- Functia de repartitie

3.1. Definitii. Exemple.
In capitolul 2 s-au considerat campuri (finite , infinite) de evenimente asociate unor
experiente a caror realizare are caracter aleator. Pe aceste campuri s-a introdus notiunea de
probabilitate, notiune care permite sa masoare numeric sansa de realizare a fenomentului dorit.
Fie (O, P(O)) un camp finit de evenimente si P o probabilitate pe acest camp. Sa ne
amintim ca probabilitatea P este o aplicatie
P: P(O) |0,1]
care satisface cerintele definitiei 2.2.1
Este vorba, deci, de o functie reala definita pe multimea partilor multimii O, deci a unei
functii de multime care asociaza unui xeP(O), numarul real P(X)e|0,1].
Interesant de semnalat este faptul ca, dat fiind numarul real oe|0,1], multimea
{ }
P x P x

= e =
1
( ) ( ) o o O are un numar finit de elemente sau, eventual, este vida si avem
P

.
1
( ) o O.
Sa consideram acum functii reale definite pe multimea O a evenimentelor elementare,
f : O R.
Desigur, daca o este un numar real oarecare (oeR), multimea
{ }
f x f x

= e =
1
( ) ( ) o o O este un element al multimii care, eventual, poate fi multimea vida si
putem vorbi de probabilitatea evenimentului f P

e
1
( ) ( ) o O .
Definitia 3.1.1. O functie reala definita pe o multime de evenimente elementare se
numeste variabila aleatoare.
In capitolele precedente variabilele aleatoare au constituit o preocupare permanenta cu
toate ca n-a fost folosit acest termen. Variabile aleatoare sunt numarul zilelor de nastere multiple
83
intr-o societate cu n indivizi, al seriilor de realizari in n probe Bernoulli etc. In fiecare caz, exista
o regula unica ce asociaza un numar x cu orice eveniment elementar. Teoria clasica a
probabilitatilor s-a ocupat destul de mult cu studiul posibilitatilor de castig ale unui jucator la un
anume joc, care este din nou o variabila aleatoare. De altfel, fiecare variabila aleatoare poate fi
interpretata ca un castig (sau reusita) al unui jucator real sau imaginar intr -un joc convenabil ales.
Tot variabile aleatoare sunt, spre exemplu, pozitia unei particule care difuzeaza energia,
temperatura etc., din sistemele fizice, dar ele sunt definite in campuri de evenimente care nu mai
sunt discrete.
In cazul unui camp de evenimente discret
1)
se poate reprezenta orice variabila aleatoare
X printr-un tablou in care se enumera intr-o anume ordine toate punctele campului si se asociaza,
apoi, cu fiecare, valoarea corespunzatoare a lui X. [Termenul de variabila aleatoare este putin
confuz, termenul de functie aleatoare parand a fi adecvat intrucat variabila independenta este un
punct in campul de evenimente, adica rezultat al unui experiment].
Fie X o variabila aleatoare si x
1
,x
2
,... valorile sale posibile (evitam termenul de domeniu
al lui X pentru multimea punctelor x
1
,x
2
,... deoarece in literatura statistica acest termen este
folosit pentru diferenta dintre maximum si minimum lui X). In multe din situatiile urmatoare x
j

vor fi intregi. Reuniunea tuturor evenimentelor elementare pe care X admite valoarea fixata x
j

formeaza evenimentul care consta in faptul ca X=x
j
; probabilitatea sa va fi notata prin P(X=x
j
).
Definitia 3.1.2. Functia
(3.1) P (X=x
j
) =f(x
j
), j=1,2,...
se numeste distributia (probabilista) a variabilei aleatoare X.
Evident,
(3.2) f(x
j
) > 0, f x
j
j
( ) =
=
_
1
1
.
Observatie. Pentru o variabila discreta X distributia probabilista este functia f(x
j
) definita
pe reuniunea valorilor x
j
admise de X. Atragem atentia asupra distinctiei care trebuie facuta intre
aceasta notiune si notiunea de functie de repartitie care este rezervata functiilor nedescrescatoare
care tind la 0 cand x - si la 1 cand x . Functia de repartitie F(x) a variabilei aleatoare X se
defineste prin relatia
F(x)=P(Xs x)= f x
j
x x
j
( )
s
_

suma extinzandu-se peste toti x
j
care nu-l depasesc pe x. Astfel, functia de repartitie a unei
variabile aleatoare poate fi calculata din distributia sa probabilista si reciproc.
Cu terminologia din definitia 3.1.2. putem spune ca, in cazul cand se considera probe
Bernoulli, numarul de realizari S
n
este o variabila aleatoare cu distributia probabilista {P(k;n.p)},
in timp ce numarul probelor pana la prima realizare inclusiv este o variabila aleatoare cu
distribuaia (q
k-1
p).
Sa consideram, acum, doua variabile aleatoare X si Y definite pe acelasi camp de
evenimente si sa notam valorile pe care ele le admit respectiv prin x
1
,x
2
,..., si y
1
,y
2
,...; fie {f(x
j
)}

1)
Intelegem prin camp discret de evenimente un camp finit sau numerabil de evenimente.
84
si {g(y
k
)} distributiile probabiliste corespunzatoare. Reuniunea punctelor in care sunt satisfacute
ambele conditii X=x
j
si Y=y
k
formeaza un eveniment a carui probabilitate va fi notata prin
P(X=x
j,
Y=y
k
).
Functia
(3.3) P(X=x
j
,Y=y
k
)=p(x
j
,y
k
), (j,k = 1,2,3,....)
poarta numele de distributia probabilista comuna a variabilelor X si Y. Ea este cel mai bine
exprimata in forma unui tabel cu doua intrari asa cum sunt exemplificate din tabelele 3.1 si 3.2
de mai jos. In mod evident avem
(3.4) p x y p x y
j k
j k
j k
( , ) , (( , )
,
> =
_
0 1
De altfel, pentru fieacre j fixat
(3.5) p(x
j
,y
1
) +p(x
j
,y
2
)+p(x
j
,y
3
)+...=P(X=x
j
)=f(x
j
)
si, pentru fiecare k fixat,
(3.6) p(x
1
,y
k
) +p(x
2
,y
k
)+p(x
3
,y
k
)+...=P(Y=y
k
)=g(y
k
).
Cu alte cuvinte, adunand probabilitatile din linii si coloane separate se obtin distributiile
probabiliste ale lui X si Y. Ele pot fi exprimate asa cum se arata in tabelele 3.1 si 3.2 si convenim
sa le numim distributii marginale. Adjectivul marginal se refera la forma exterioara a tabelului
cu doua intrari, dar el ne permite si o claritate de ordin stilistic atunci cand distributia comuna a
doua variabile si distributiile individuale (marginale) ale lor apar in acelasi context.
Notiunea de distributie comuna se extinde la sisteme cu mai mult decat doua variabile
aleatoare.
Exemplul 3.1.1. (Distributia aleatoare a 3 bile in 3 urne).
Sa consideram campul de evenimente compus din 27 de puncte definit formal in tabelul
2.1 si sa asociem fiecarui punct probabilitatea 1/27. Sa notam prin N numarul urnelor ocupate si
pentru fiecare i =1,2,3 fie X
i
numarul de bile din celula numarului i. Avem astfel o prezenare
descriptiva a problemei. Formal, insa, N este functia care admite valoarea 1 pentru punctele cu
numerele de ordine 1-3; valoarea 2 pentru punctele cu numerele 4-21; iar valoarea 3 pentru
punctele cu numerele 22-27. Prin urmare , distributia probabilista a lui N este definita prin
P(N=1) =1/9, P(N=3) =2/3, P(N=3) =2/9. Distributiile comune ale lui (N,X
1
) si ale lui (X
1
, X
2
)
sunt date in tabelele 3.1 si 3.2.

X
1

0 1 2 3 Distributia lui N
1 2q 0 0 q 3q=1/9
N 2 6q 6q 6q 0 18q=2/3
3 0 6q 0 0 6q=2/9
Distributia lui X
1
8q 12q 6q q

Tabelul 3.1
Distributia comuna a lui N si X
1

85
Se obvserva din tabelul 3.1 cateva dintre valorile caracteristice pe care le vom defini in
acest capitol
M(N) =19/9, M(X
1
) =1, M(N,X
1
) =19/9, M(N
2
) =129/27, M(X
2
1
)=45/27,

2
(N) =26/81,
2
(X
1
)=2/3, C(N,X
1
) =0
unde N reprezinta numarul de urne ocupate, X
1
numarul de bile din prima urna cand 3 bile sunt
distribuite aleator in 3 urne. Pentru prescurtare q=1/27.

X
1

0 1 2 3 Distributia lui X
2

0 q 3q 3q q 8q
1 3q 6q 3q 0 12q
X
2
2 3q 3q 0 0 6q
3 q 0 0 0 q
Distributia lui X
1
8q 12q 6q q
Tabelul 3.2
Distributia comuna a lui X
1
si X
2

Si din acest tabel rezulta urmatoarele valori caracteristice
M(X
1
) =1, M(X
2
) =1, M(X
1
X
2
) =2/3, M(X
2
1
)=45/27, M(X
2
2
)=45/27,

2
(X
1
) =2/3,
2
(X
2
) =2/3, C(X
1
,X
2
) =-1/3.
Aici X
i
(i=1,2) inseamna numarul de bile din celula i cand se distribuie aleator 3 bile ;n 3
urne. Pentru prescurtare q=1/27.
Exemplul 3.1.2. (Aruncarea cu zarul).
In cazul aruncarii unui zar ideal de n ori, sa notam cu X
1
, X
2
, X
3
respectiv, numarul de
aparitii ale fetei unu, doi si trei. Probabilitatea p(k
1
,k
2
,k
3
) ca in urma celor n aruncari sa rezulte
de k
1
ori fata 1, de k
2
ori fata doi, de k
3
ori fata 3 si de n-k
1
-k
2
-k
3
ori celelalte fete este data de
repartitia multinomiala pentru p
1
=p
2
=p
3
=1/6, p
4
=1/2, adica
(3.7)
, ,
p k k k
n
k k k n k k k
n k k k n
( , , )
!
! ! ! !
1 2 3
1 2 3 1 2 3
3 6
1 2 3
=


.
Aceasta este distributia comuna a lui X
1
,X
2
,X
3
. Pastrand k
1
, k
2
fixati si insumand (3.7) pentru
valorile posibile k
3
=0,1,2,...,n-k
1
-k
2
, se obtine, folosind teorema binomului ,
(3.8)
, ,
p k k
n
k k n k k
n k k n
( , )
!
! ! !
1 2
1 2 1 2
4 6
1 2
=



Aceasta este distributia comuna a lui (X
1
,X
2
) care acum apare ca distributie marginala pentru
distributia tripletului X
1
,X
2
,X
3
. [Nu este greu de remarcat ca (3.8) ar fi putut fi obtinuta direct din
repartitia multinomiala]. Sumand (3.8) inca odata pentru toti k
2
= 0,1,..., n-k
1
, rezulta distributia
lui X
1
, adica repartitia binomiala cu p=1/6.
Exemplul 3.1.3.
Sa consideram o populatie de n elemente impartita in trei clase de volum, respectiv,
n
1
=np
1
, n
2
=np
2
si n
3
=np
3
(unde p
1
+p
2
+p
3
=1). Sa presupunem ca se alege, la intamplare, o selectie
86
de volum r , si sa notam prin X
1
si X
2
numarul reprezentantilor in selectie din prima si, respectiv,
a doua clasa. Daca selectia este repetata, P(X
1
=k
1
, X
2
=k
2
) este data de repartitia multinomiala
(3.9)
, ,
f k k
r
k k r k k
p p p
k k r k k
( , )
!
! ! !
1 2
1 2 1 2
1 2 3
1 2 1 2
=



(conform (3.30)). Variabila X
i
are repartitia binomiala P(k;r,p
i
). Daca selectia este nerepetata,
atunci P(X
1
=k
1
, X
2
=k
2
) este data de repartitia hipergeometrica dubla

n
k
n
k
n n n
r k k
n
r
1
1
2
2
1 2
1 2
|
\

|
.
|
|
\

|
.
|


|
\

|
.
|
|
\

|
.
|

(unde k
1
sn
1
, k
2
sn
2
, r-k
1
-k
2
sn-n
1
-n
2
) iar X
1
are repartitia hipergeomatrica simpla

n
k
n n
r k
n
r
1
1 |
\

|
.
|

|
\

|
.
|
|
\

|
.
|
.
Exemplul 3.1.4.
Sa consideram , din nou, exemplul precedent dar sa presupunem ca, selectia de volum r,
in loc sa fie fixata apriori, depinde de rezultatul unui experiment aleator. Mai exact, sa
presupunem ca volumul selectiei depinde de o repartitie Poisson. Probabilitatea ca volumul
selectiei sa fie r este p r e
n
n
( , )
!

=

si, dandu-se selectia de volum r, probabilitatea
(conditionata) ca X
1
=k
1
si X
2
=k
2
este f(k
1
,k
2
) din (3.9). Pentru repartitia probabilista comuna a lui
(X
1
,X
2
) avem, atunci
(3.10)
P X k X k e
f k k
r
e
p p
k k
p
k
e
p p
k k
r
r k k
k k k
k
p
k k
( , )
( , )
!
( ) ( )
! !
( )
!
( ) ( )
! !
( )
1 1 2 2
1 2
1 2
1 2
3
3 0
1 1 2
1 2
1 2
1 2 3
3
3
1 2
= = = =
= =
=

= +


_
_




Sau P(X
1
=k
1
,X
2
=k
2
) =p(k
1
;p
1
)p(k
2
;p
2
).
Sumand dupa k
2
se gaseste ca X
1
are repartitia Poisson p(k;p
1
). Repartitia comuna a lui (X
1
,X
2
)
ia forma tablei inmultirii celor doua repartitii marginale p(k;p
1
) si p(k;p
2
). Exprimam acest
fapt spunand ca X
1
si X
2
sunt independente.
Cu notatia (3.3) probabilitatea evenimentului Y=y
k
, conditionata de X=x
j
(cu f(x
j
)>0)
devine
(3.11)
) (
) , (
) (
j
k j
j k
x f
y x p
x X y Y P = = = .
87
Este convenabila o forma prescurtata a relatiei (3.11) cum este P(Y=y
k
,X); aceasta
defineste probabilitatea lui Y conditionata de X. Observand tabelele 3.1 si 3.2 se constata ca
probabilitatea conditionata (3.11) este, in general, definita de g(y
k
). Acaesta arata ca implicatia
poate avea loc de la valorile lui X spre cele ale lui Y si vice versa; cele doua variabile sunt
dependente stochastic. Dependenta cea mai tare se realizeaza cand Y este functie de X, adica
atunci cand valoarea lui X determina in mod unic pe Y. Spre exemplu, daca se arunca o moneda
de n ori, iar X si Y reprezinta numarul de realizari ale valorii si respectiv pajurei, atunci Y=n-X.
Analog, cand Y=X
2
se poate calcula Y cu ajutorul lui X. In termenii distributiei comune aceasta
inseamna ca pe fiecare linie toate intrarile, cu exceptia uneia, sunt zero. Daca, pe de alta parte,
p(x
j
,y
k
) =f(x
j
)g(y
k
) pentru toate combinatiile dintre x
j
si y
k
, atunci evenimentele X=x
j
si Y=y
k

sunt independente; distributia comuna ia forma unui table a inmultiri. In acest caz vorbin despre
variabile aleatoare independente. Ele apar, in special, legate de probe independente; de exemplu,
numerele castigatoare in doua aruncari ale unui zar sunt independente.
Este bine de retinut ca distributia comuna a lui X si Y determina distributiile lui X si Y, dar
distributia comuna a lui X si Y nu poate fi calculata din distributiile lor marginale. Daca doua
variabile aleatoare X si Y au aceeasi distributie, ele pot sau nu pot sa fie independente. Ca
ilustrare, cele doua variabile X
1
si X
2
din tabelul 3.2 au aceeasi distributie si sunt dependente.
Evident, toate rationamentele facute raman valabile si in cazul mai multor variabile
aleatoare. Sa restrangem totul in definitia urmatoare
Definitia 3.1.3. O variabila aleatoare X este o functie reala definita pe o multime de
evenimente elementare data. Distributia probabilista a lui X este functia definita in (3.1). Daca
doua variabile aleatoare X si Y sunt definite pe aceeasi multime de evenimente elementare,
distributia lor comuna este data de (3.3) si atribuie probabilitati tuturor combinatiilor (x
j
,y
k
) de
valori admise de X si Y. Acest concept se extinde, in mod evident, la orice multime finita de
variabile aleatoare X
1
, X
2
, ..., X
n
definite pe aceeasi multime de evenimente elementare. Aceste
variabile aleatoare se spune ca sunt independente in totalitate daca, pentru orice combinatie a
valorilor (x
1
,x
2
,...,x
n
) admise de ele, are loc relatia
(3.12) P(X
1
=x
1
,X
2
=x
2
,...,X
n
=x
n
) =P(X
1
=x
1
)P(X
2
=x
2
)...P(X
n
=x
n
) .
In capitolul 2 am definit campul de evenimente care corespunde la n probe independente.
Comparand aceasta cu (3.12) se observa ca, daca X
k
depinde numai de rezultatul celei de a k
probe atunci, variabilele X
1
,...,X
n
sunt independente in totalitate. Mai general, daca o variabila
aleatoare U depinde numai de rezultatele primelor k probe, iar o alta variabila V depinde numai
de rezultatele ultimelor n-k probe, atunci U si V sunt independente.
Ne putem imagina o variabila aleatoare ca un marcaj, sau un indicator al punctelor
campului de evenimente. Acest procedeu este obisnuit in aruncarea cu zarul unde fetele sunt
numerotate si se vorbeste despre numere ca fiind rezultatele posibile ale probelor individuale. S-
ar putea spune, deci, ca o variabila aleatoare X este o aplicatie a multimii initiale de evenimente
elementare pe o noua multime ale carei puncte sunt x
1
, x
2
,... .
Prin urmare, ori de cate ori f(x
j
) satisface conditiile (3.2), este natural sa se vorbeasca
despre o variabila aleatoare X, care admite valorile x
1
,x
2
,... cu probabilitatile f(x
1
),f(x
2
),..., fara
88
alte referiri la vechiul camp de evenimente; campul nou contine punctele x
1
,x
2
,... . A preciza o
distributie probabilista inseamna a preciza un camp de evenimente ale carui puncte sunt numere
reale. A vorbi despre doua variabile aleatoare X si Y, cu distributiile f(x
j
) si g(y
k
), este alelasi
lucru cu a face referire la un camp de evenimente ale carui puncte sunt perechi de numere (x
j
,y
k
)
cu probabilitatile date de relatia P(x
j
,y
k
) =f(x
j
)g(y
k
). In mod similar, pentru campul de
evenimente care corespunde unei multimii de n variabile aleatoare (X
1
, X
2
, ..., X
n
) se poate lua o
reuniune de puncte (x
1
,x
2
,...,x
n
) din spatiul n-dimensional avand probabilitatile asociate prin
distributia lor comuna. Variabilele aleatoare sunt independente in totalitate daca distributia lor
comuna este data de (3.12).
Exemplul 3.1.5. (Probe Bernoulli cu probabilitati variabile).
Sa consideram n probe independente, fiecare dintre ele avand numai doua rezultate
posibile S (succes, realizare) ai I (nerealizare, insucces). Probabilitatea unei realizari S la proba
de rang k este p
k
, iar a unei nerealizari I este q
k
=1-p
k
. Daca p
k
=p, aceasta schema se reduce la
probe de tip Bernoulli. Cel mai simplu mod de a o descrie este de a atribui valorile 1 si 0 lui S si
respectiv I . Modelul este atunci descris in intregime daca spunem ca avem n variabile aleatoare
independente in totalitate X
k
cu distributiile P(X
k
=1) =p
k
, P(Y
k
=0) =q
k
. Aceasta schema este
cunoscuta sub numele de probe de tip Poisson .
Este clar ca aceeasi distributie poate sa apara in legatura cu diferite campuri de
evenimente. Daca, spre exemplu, se spune ca variabila aleatoare X admite valorile 0 si 1 cu
probabilitatile , inseamna ca se face referire tacita la un camp de evenimente care consta din
doua puncte 0 si 1. Insa, variabila aleatoare X poate fi definita specificand ca este egala cu 0 sau
1 dupa cum a zecea aruncare a unei monede ( ca sa ne referim la experimentul constand din
aruncarea monedei), face sa se realizeze valoarea (B) sau pajura (M); in acest caz X este definita
intr-un camp de evenimente constand din secvente (BBM...) si avand 2
10
puncte.
In principiu, exista posibilitatea de a restrange teoria probabilitatilor la campuri de
evenimente definite in termeni ai distributiilor probabiliste de variabile aleatoare. Reducerea
teoriei probabilitatilor la astfel de studii ofera posibilitatea folosirii analizei matematice si
simplificarea teoriei din multe puncte de vedere.
Exemplul 3.1.6.
Fie X o variabila aleatoare cu valorile posibile x
1
,x
2
,... si probabilitatile corespunzatoare
f(x
1
),f(x
2
),... Oricand ne putem imagina un experiment care sa conduca la X. Spre exemplu, se
imparte discul unei rulete in arcele l
1,
l
2
,... ale caror lungimi se raporta ca f(x
1
):f(x
2
): ... Sa ne
imaginam un jucator care primeste suma x
j
daca ruleta se opreste in dreptul unui punct al arcului
l
j
. Atunci X reprezinta castigul jucatorului.
In n probe castigurile se presupun a fi n variabile independente cu distributia comuna
f(x
j
). Pentru a obtine doua variabile cu o distributie comuna data, p(x
j
,y
k
), n-avem decat sa
consideram ca la fiecare combinatie (x
j
,y
k
) corespunde un arc si sa ne gandim la doi jucatori care
primesc sumele x
j
si respectiv y
k
.
Daca X, Y, Z, ... sunt variabile aleatoare definite pe acelasi camp de evenimente, atunci
orice functie F(X,Y,Z,...) este, de asemenea, o variabila aleatoare. Distributia sa poate fi obtinuta
89
din distributia comuna a lui X, Y, Z,... selectionand termenii care corespund combinatiilor lui (X,
Y, Z,... care dau aceeasi valoare a lui F(X,Y,Z,...).
Exemplul 3.1.7.
In exemplul ilustrat prin tabelul 3.2, de mai inainte, suma X
1
+X
2
este o variabila aleatoare
care admite valorile 0,1,2,3 cu probabilitatile q, 6q, 12q, 8q (unde q=1/27). Produsul X
1
X
2
admite
valorile 0,1,2 cu probabilitatile 15q, 6q, 6q.

3.2. Valori medii
Pentru a simplifica in mod rezonabil lucrurile adesea este necesar sa se descrie
distributiile probabiliste, mai pe scurt, cu ajutorul catorva valori tipice. Mediana x
m
a distributiei
(3.1) este aceea valoare admisa de X pentru care P(Xsx
m
)s si P(X>x
m
)s . Cu alte cuvinte,
x
m
este ales astfel incat probabilitatile lui X care depasesc pe x
m
sau sunt mai mici decat x
m
, sunt
oricat de apropiate de .
Insa, dintre valorile tipice media este, de departe, cea mai importanta. Ea permite cea mai
buna tratare din punct de vedere analitic si este preferata de statisticieni datorita propriet atilor
sale. Daca intr-o anumita populatie n
k
familii au exact k copii, numarul total al familiilor este
n=n
0
+n
1
+n
2
+... si numarul total al copiilor m=n
1
+2n
2
+3n
3
+... Numarul mediu al copiilor per
familie este m/n. Analogia intre probabilitati si frecvente sugereaza urmatoarea definitie
Defintia 3.2.1. Fie X o variabila aleatoare care admite valorile x
1
,x
2
,... cu probabilitatile
corespunzatoare f(x
1
), f(x
2
)... Valoarea medie (sau media) a lui X este definita prin
M(X) =
_
x f x
k k
( )
cu conditia ca seria sa fie absolut convergenta. In acest caz se spune ca X are o medie finita.
Daca x f x
k k
( )
_
este divergenta, atunci se spune ca X nu are o medie finita.
Se intelege de la sine ca cele mai multe variabile aleatoare obisnuite au mediile finite
Astfel conceptul n-ar fi practic. Totusi, in legatura cu unele probleme importante de recurenta din
fizica apar variabile aleatoare care nu au medii finite. Vom obisnui, de asemenea, sa vorbim
despre media unei repartitii in loc sa ne referim la o variabila aleatoare corespunzatoare. De
asemenea, notatia M(X) este , in general, acceptata in matematica si statistica. In fizica, ea este
mai suplinita prin notatiile X x ,( ) .
Sa ne propunem, acum, sa calculam mediile functiilor de tipul X
2
. O astfel de functie este
o noua variabila aleatoare care admite valorile x
k
2
; in general, probabilitatea lui X
2
=x
k
2
nu este
f(x
k
) ci f(x
k
)+f(-x
k
) si M(X
2
) este definita ca o suma de
| ]
x f x f x
k k k
2
( ) ( ) + pentru orice k astfel
incat x
k
>0. In mod evident
(3.14) M(X
2
) =
_
x f x
k
k
2
( )
admitand ca seria este convergenta. Acelasi procedeu de selectionare a termenilor conduce la
Teorema 3.2.1. Orice functie g(x) defineste o noua variabila aleatoare g(X). Daca g(X)
are media finita, atunci
(3.15) M(g(X)) =
_
g x f x
k k
( ) ( ) ;
90
seria este absolut convergenta daca si numai daca M(g(X)) exista. Pentru orice constanta a
avem M(aX)=aM(X).
Daca pe acelasi camp de evenimente sunt definite mai multe variabile aleatoare X
1
,...,X
n
,
atunci suma lor X
1
+...+X
n
este o variabila aleatoare. Valorile posibile ale lor si probabilitatiile
corespunzatoare se pot gasi repede din distributia comuna a variabilelor aleatoare, astfel ca se
poate calcula si M(X
1
+...+X
n
). Un procedeu simplu este furnizat de urmatoarea teorema
Teorema 3.2.2. Daca X
1
, X
2
, ..., X
n
sunt variabile aleatoare cu mediile cunoscute , atunci
valoarea medie a sumei acestor variabile aleatoare exista si este egala cu suma valorilor medii,
(3.16) M(X
1
+...+X
n
) =M(X
1
)+...+M(X
n
) .
Demonstatie Este suficient sa se dovedeasca (3.16) pentru doua variabile aleatoare X si
Y, rezultatul general putand fi obtinut prin inductie pe n . Folosind notatia (3.3) putem scrie
M(X)+M(Y) = +
_ _
x p x y y p x y
j j k
j k
k j k
j k
( , ) ( , )
, ,

sumarea extinzandu-se peste toate valorile posibile x
j
, y
k
(care nu este necesar sa fie toate
diferite). Cele doua serii sunt convergente; prin urmare , suma lor poate fi rearanjata ca sa devina
( ) ( , )
,
x y p x y
j k j k
j k
+
_
care este , prin definitie, media variabilei X+Y, teorema fiind, astfel,
dovedita.
In mod evident teorema nu mai este adevarata, in general, pentru produsul variabilelor
aleatoare. Spre exemplu, M(X
2
) este, in general, diferita de (M(X))
2
. Astfel, daca se considera
experimentul constand din aruncarea unui zar perfect atunci, fie X variabila aleatoare care ia
valorile de la 1 la 6, fiecare valoare fiind luata cu probabilitatea 1/6. Valoarea medie a lui X este
M(X)=(1+2+3+4+5+6)/6=7/2
in timp ce
M(X
2
)=(1+4+9+16+25+36)/6=91/6 .
Totusi, regula de inmultire se pastreaza pent ru variabile aleatoare independente.
Teorema 3.2.3. Daca X si Y sunt variabile aleatoare independente cu mediile M(X) si
respectiv M(Y) atunci, produsul lor este o variabila aleatoare cu media finita si
(3.17) M(XY)=M(X)M(Y) .
Demonstatie Pentru a calcula M(XY) vom inmulti fiecare valoare posibila x
j
y
k
cu
probabilitatea corespunzatoare. Am remarcat anterior faptul ca valorile x
k
din definitia (3.13) nu
sunt, in mod necesar, diferite. Deci
M XY x y f x g y x f x y g y
j k j k
j k
j j
j
k k
k
( ) ( ) ( ) ( ) ( )
,
= =

(
(

(
_ _ _

rearanjarea dezvoltarii justificandu-se prin faptul ca seriile converg in mod absolut. Teorema este
astfel dovedita. Prin inductie, ea se poate dovedi pentru un numar arbitrar de variabile aleatoare
independente.
91
Desigur ca ar fi foarte util sa dispunem de o relatie care sa dea media unei distributii
probabilistice conditionate. Fie, in acest sens, X si Y doua variabile aleatoare cu distributia
comuna (3.3). Atunci, media conditionata M(Y,X) a lui Y de catre X este functia
(3.18) y p Y y X x
y p x y
f x
k k j
k
k j k
k
j
( )
( , )
( )
= = =
_
_

cu conditia ca seriile sa convearga in mod absolut si f(x
j
)>0 pentru orice j.
Exemplul 3.2.1. (Distributia binomiala). Fie S
n
numarul de realizari in n probe Bernoulli cu
probabilitatea p pentru o realizare. Se stie ca S
n
are distributia binomiala b(k;n,p), de unde
M(S
n
)= kb k n p np b k n p ( ; , ) ( ; , ) = _ _ 1 1 . Ultima suma include toti termenii repartitiei
binomiale pentru n-1 si, deci, este egala cu 1. Prin urmare , media repartitiei binomiale este
(3.19) M(S
n
)=np .
Acelasi rezultat ar fi putut fi gasit si printr-o alta metoda care de cele mai multe ori este
foarte comoda. Fie X
k
numarul de realizari obtinute in proba de rang k. Aceasta variabila
aleatoare admite numai valorile 0 si 1 cu probabilitatile corespunzatoare q si p. Deci
M(X
k
)=0q+1p=p, si, deci,
S
n
=X
1
+X
2
+ ... +X
n
.
Se regaseste (3.19) direct din (3.16).
Exemplul 3.2.2. (Repartitia Poisson).
Daca variabila aleatoare X urmeaza repartitia Poisson p(k;) =


k
k
e
!

, ( unde
k=0,1,2,...) atunci,
M X kp k p k ( ) ( , ) ( , ) = =
_ _
1 .
Ultima suma contine toti termenii repartitiei si, prin urmare, este egala cu unitatea. Astfel,
repartitia Poisson are media .
Exemplul 3.2.3. (Repartitia binomiala negativa).
Fie X o variabila aleatoare cu repartitia geometrica P(X=k) =q
k
p unde k=0,1,2,... Atunci
M(X) =qp(1+2q+3q
2
+...). Dar paranteza din membrul dreapt al acestei egalitati reprezinta
derivata progresiei geometrice q+q
2
+q
3
+... a carei suma este
q
q 1
. Deci, M(X)=qp(1-q)
-2
=q/p.
Am vazut, insa, in capitolul precedent, ca putem interpreta X ca fiind numarul de nerealizari care
preced prima realizare intr-o secventa de probe Bernoulli. Mai general, s-a studiat campul de
evenimente corespunzator probelor Bernoulli care sunt continuate pana la a n-a realizare. Pentru
r<n, fie X
1
=X si fie X
r
numarul de nerealizari care urmeaza pe cea de a r-1 realizare si o precede
pe cea de a r-a realizare. Atunci, fiecare X
v
are repartitia geometrica q
k
p si M(X
v
)=q/p. Suma
Y
r
=X
1
+..+X
r
este numarul de nerealizari care preced cea de a r-a realizare. Cu alte cuvinte, Y
r

este o variabila aleatoare care urmeaza repartitia binomiala negativa definita printr-una din cele
doua formule (3.24) sau (3.25). Urmeaza ca media acestei repartitii binomiale negative este rq/p.
Aceasta se poate verifica prin calcul direct. Din capitolul precedent se observa ca kf(k;r,p) =
92
rp
-1
qf(k-1;r+1,p), iar suma termenilor repartitiei f(k-1;r+1,p) este egala cu unitatea. Si primul
rationament prezinta avantaj intrucat el conduce la rezultat fara sa necesite cunoasterea formei
explicite a distributiei variabilei aleatoare X
1
+...+X
r
.
Exemplul 3.2.4.
Sa consideram o selectie repetata a unei populatii cu N elemente distincte. Datorita
repetitiilor, o selectie aleatoare de volum r va contine, in general, mai putin decat r elemente
distincte. Pe masura ce volumul selectiei creste , elemente noi vor intra in selectie din ce in ce
mai rar. Sa ne indreptam atentia spre selectia de volum S
r
necesara pentru a dobandi r elemente
distincte. [Ca un caz special, se poate considera populatia a N=365 zile de nastere posibile; aici
S
r
reprezinta numarul de oameni selectionati pana in momentul cand selectia contine r zile de
nastere diferite. O interpretare similara este posibila cu introducerea aleatoare a bilelor in urne].
Primul element intra in selectie la prima extragere. Numarul extragerilor de la a doua
extragere pana la extragerea la care un nou element intra in selectie, inclusiv aceasta extragere,
este o variabila aleatoare X; in general, fie X
r
numarul extragerilor care urmeaza selectionarii
elementului de rang r pana la selectionarea urmatorului element nou, inclusiv. Atunci,
S
r
=1+X
1
+...+X
r-1
este volumul selectiei la momentul cand elementul de rang r intra in selectie.
Odata ce selectia contine k elemente diferite, probabilitatea extragerii unuia nou este, la fiecare
extragere, p
N k
N
=

. Numarul X
k
al extragerilor pana la extragerea unui nou element, inclusiv
aceasta extragere, este egal cu unu plus numarul nerealizarilor care preced prima realizare in
probele Bernoulli cu p
N k
N
=

. Prin urmare, M X
q
p
N
N k
k
( ) =
+
=

1
si, din teorema adunarii
(3.16), rezulta
(3.20)
(

+
+ +

+ =
1
1
...
2
1
1
1 1
) (
r N N N N
N S M
r
.
Pentru r=N se obtine numarul mediu de extrageri necesar pentru a epuiza intreaga
populatie. Pentru N=10 avem M(S
10
) =29,29,..., iar M(S
5
) =6,46 ... . Aceasta inseamna ca ne
putem astepta sa acoperim jumatate din populatie in aproximativ sase sau sapte extrageri, in timp
ce pentru a doua jumatate sunt necesare ceva mai mult de 29 extrageri. O aproximare acceptabila
a relatiei (3.20), pentru un N suficient de ma re, este
(3.21) M S N
N
N r
r
( ) ln ~
+ 1
.
In particular, pentru orice raport o<1 numarul mediu de extrageri necesare pentru a obtine o
selectie care contine aproximativ raportul o din intreaga populatie este, pentru N suficient de
mare, cu aproximatie, N ln
1
1 o
; numarul mediu de extrageri necesare pentru a avea toate
cele N elemente incluse in selectie este, aproximativ, N lnN. Aceste rezultate, dupa cum se
observa, sunt obtinute fara folosirea repartitiei.
Exemplul 3.2.5. (O problema de estimatie).
93
O urna contine bile numerotate de la 1 la N. Fie X cel mai mare numar extras in n
extrageri cand se aplica o selectie repetata. Evenimentul Xs k inseamna faptul ca fiecare dintre
cele n numere extrase este mai mic sau egal cu k si, prin urmare, P X k
k
N
n
( ) s =
|
\

|
.
|
. Deci
distributia probabilista a lui X este data prin
p
k
= P(X=k) = P(Xsk)-P(Xsk-1) = [k
n
-(k-1)
n
]N
-n
. .
Rezulta
| ]
M X kp N k k k N N k
k
n n n n n n n
k
N
k
N
k
N
( ) ( ) ( ) ( ) = = =

(
+ + +
= = =
_ _ _
1 1 1
1 1 1
1 1 1 .
Pentru N sufiicient de mare ultima suma este aproximativ aria marginita de curba y=x
n
de la x=0
la x=N, adica
N
n
n+
+
1
1
. Urmeaza ca pentru N suficient de mare
M(X) ~
+
n
n
N
1
.
Dupa cum se vede aceasta metoda are mare utilitate practica.
Exemplul 3.2.6. (Problema lui Banach).
Reamintim ca in capitolul precedent s-a gasit distributia
u
r
=
2
1
2
2
N r
N
N r
|
\

|
.
|


pentru numarul X de chibrituri ramase in momentul cand fumatorul a constatat ca prima cutie
este goala. Nu avem posibilitatea sa calculam media M(X)=m in mod direct dar, urmatoarea cale,
indirecta, pe care o expunem, se aplica in multe cazuri similare. Folosind faptul ca suma valorilor
u
r
este egala cu unitatea (care nu este prea usor de verificat), se gaseste
(3.22) N m N r u N r
N r
N r
r
N r
r
N
r
N
= =

|
\

|
.
|

=

_ _
( ) ( )
2
1
2
2
0
1
0
1
.
Operand asupra coeficientilor binomiali, ultima suma se transforma in
(3.23) ( ) ( ) 2
2 1
1
1
2
2 1
2
1
2
1
2N
0
1
1
0
1
1
0
1
N r
N r
N r
N
u r u
r
r
N
r
r
N
r
r
N



|
\

|
.
|
=
+
+

+
=

+
=

_ _ _
.
Ultima suma este identica cu suma care definese M(X)=m.. In prima suma apar toti u
r
, cu
exceptia lui u
0
si, deci, termenii adunati dau 1-u
0
. Astfel, din (3.22) si (3.23) avem
N m
N
u
m
=
+

2 1
2
1
2
0
( )
Sau m = (2N+1)u
0
- 1 =
2 1
2
2
1
2
N
N
N
N
+
|
\

|
.
| .
Folosind formula lui Stirling ( n n e
n
n
! ( ) ~
+

2
1
2
1
2
t ) se obtine
m ~ 2 1
1
2
N
t
|
\

|
.
| .
94
In particular, pentru N=50, caz considerat cu ocazia discutiei problemei lui Banach in capitolul
pecedent, se gaseste m=7,04... si mediana 6.

3.3. Dispersia
Fie X o variabia aleatoare cu distributia f(x
j
), si fie r>0 un intreg. Daca media variabilei
aleatoare X
r
, adica
(3.24) M X x f x
r
j
r
j
( ) ( ) =
_

exista, atunci ea se numeste momentul de ordin r al lui X in jurul originii. Daca seria nu este
absolut convergenta, spunem ca momentul de ordin r nu exista. Deoarece X X
r r
s +
1
1,
urmeaza ca ori de cate ori exista momentul de ordin r, exista si cel de ordin r-1 si, deci, toate
momentele precedente.
Momentele joaca un rol important in teoria generala dar, in cele ce urmeaza vom folosi
numai momentul de ordinul al doilea. Daca el exista, atunci exista si media
m=M(X).
Este, deci, natural sa se intrduca, in locul variabilei aleatoare, abaterea sa de la medie,
adica X-M(X)=X-m. Deoarece (x-m)
2
s2(x
2
+m
2
) se vede ca momentul de ordinul al doilea al
variabilei aleatoare X-m exista ori de cate ori M(X
2
) exista. Rezulta, atunci
M((X-m)
2
) = ( ) ( ) x mx m f x
j j j
j
2 2
2 + _ .
Impartind membrul din dreapta in trei sume partiale, rezulta ca el este egal cu M(X
2
)-
2mM(X)+m
2
=M(X
2
)-m
2
=M(X
2
)-(M(X))
2
.
Definitia 3.3.1. Fie X o variabila aleatoare cu momentul de ordinul al doilea M(X
2
) si fie
m=M(X) media sa. Se defineste, atunci, un numar numit dispersia lui X prin
(3.25)
2
(X)=M((X-m)
2
)=M(X
2
)-m
2
.
Radacina patrata pozitiva a sa (sau zero) se numeste abaterea patratica medie a lui X.
Din comoditate, vom vorbi deseori despre dispersia unei distributii fara a mentiona
variabila aleatoare.
Exemple . (i) Daca X admite valorile c, fiecare cu probabilitatea , atunci

2
(X)=c
2
.
(ii) Daca X este numarul de puncte obtinute la aruncarea unui zar perfect,
atunci
2
(X) = 1/6(1
2
+2
2
+3
2
+...+6
2
)-(7/2)
2
=35/12.
(iii) Pentru repartitia Poisson p(k;) media este (conform exemplului
3.2.2) si, deci, dispersia este
_k
2
p(k;)-
2
=_kp(k-1;)-
2
=_(k-1)p(k-1;)+_p(k-1;)-
2
=
2
+-
2
=.
In acest caz media si dispersia sunt egale.
(iv) Pentru repartitia binomiala (conform exemplului 3.2.1) un calcul
similar arata ca dispersia este
_k
2
b(k;n,p)-(np)
2
=np_kb(k-1;n-1,p)-(np)
2
=np[(n-1)p+1]-(np)
2
=np[(n-1)p+1-np]=npq.
95
Utilizarea notiunii de dispersie va apare treptat, in special, in legatura cu teoremele limita
din capitolul urmator. Deocamdata, se poate constata ca dispersia este o masura mai putin fina a
gradului de imprastiere. De altfel, daca
2
(X) =_(x
j
-m)
2
f(x
j
) este mic atunci, fiecare termen al
sumei este mic. O valoare x
j
pentru care ,x
j
-m, este mare trebuie, prin urmare, sa aiba o
probabilitate mica f(x
j
). Cu alte cuvinte, in cazul unor dispersii mici sunt improbabile deviatii
mari, de la media m, ale lui X. Invers, insa, o dispersie mare indica faptul ca nu toate valorile
admise de X se gasesc in apropierea mediei.
Urmatoarea interpretare din mecanica este folositoare pentru intelegerea conceptului. Sa
presupunem ca o masa unitate este distribuita pe axa x astfel incat masa f(x
j
) sa fie concentrata in
punctul x
j
. Atunci, media m este abcisa centrului de greutate, iar dispersia este momentul de
inertie. In mod clar, distributii diferite de masa pot avea acelasi centru de greutate si acelasi
moment de inertie, dar este bine cunoscut ca cele mai importante proprietati mecanice pot fi
descrise in termeni ai acestor doua cantitati.
Daca X reprezinta o cantitate masurabila, asemenea lungmii sau temperaturii, atunci
valorile sale numerice depind de origine si unitatea de masura. O schimbare a unitatii de masura
inseamna trecerea de la X la o noua variabila aX+b, unde a si b sunt constante. Evident ca

2
(X+b) =
2
(X) si, deci,
(3.26)
2
(aX+b) =a
2

2
(X) .
Alegerea originii si unitatii de masura este destul de arbitara , astfel ca de multe ori este
cel mai convenabil sa se ia media ca origine si abaterea patratica medie drept unitate. In acest fel
s-a procedat in capitolul precedent cand s-a introdus numarul normalizat de realizari
S
S np
npq
n
n *
/
( )
=

1 2
. In general, daca X are media m si dispersia o
2
(o>0), atunci X-m are media zero
si dispersia o
2
. Deci variabila aleatoare
(3.27) X
X m
*
=

o

are media zero si dipersia 1. Ea poarta numele de variabila aleatoare normalizata
corespunzatoare lui X. In limbaj fizic, trecerea de la X la X
*
ar putea fi interpretata ca
introducerea unor cantitati reduse.

3.4. Corelatie
Fie X si Y doua valiabile aleatoare definite pe acelasi camp de evenimente. Atunci X+Y
si XY sunt, de asemenea, variabile aleatoare si distributiile lor se pot obtine printr-un
rearanjament simplu al distributiei comune a lui X si Y. Ne propunem sa calculam dispersia
sumei acestor variabile, adica
2
(X+Y). In acest scop, vom introduce notiunea de corelatie
asupra careia vom reveni in acest capitol. Daca distributia coumna a lui X si Y este p(x
j
,y
k
)
atunci, media lui XY este data de relatia
(3.28) M(XY)=_x
j
y
k
p(x
j
,y
k
),
96
bineinteles cu conditia ca seria sa fie absolut convergenta. Dar x y
x y
j k
j k
s
+
2 2
2
si, prin urmare,
M(XY) exista in mod sigur daca M(X
2
) si M(Y
2
) exista. In acest caz exista, de asemenea,
mediile
m
x
=M(X), m
y
=M(Y),
iar variabilele X-m
x
si Y-m
y
au mediile egale cu zero. Pentru produsul lor se obtine
M[(X-m
x
)(Y-m
y
)] =M(XY)-m
x
M(Y)-m
y
M(X)+m
x
m
y
=M(XY)-m
x
m
y
.
Definitia 3.4.1. Corelatia variabilelor aleatoare X si Y se defineste prin relatia
(3.29) C(X,Y) =M[(X-m
x
)(Y-m
y
)] =M(XY)-m
x
m
y
.
Aceasta definitie are sens ori de cate ori X si Y au dispersii finite. Se stie, insa, din
paragraful 3.2 ca, pentru variabile independente, se are M(XY) = M(X)M(Y). Rezulta, deci, din
(3.29)
Teorema 3.4.1. Daca X si Y sunt variabile aleatoare independente atunci, C(X,Y) =0.
Precizam, insa, ca reciproca teoremei nu este adevarata. Spre exemplu, o privire asupra
tabelului 3.1 arata ca cele doua variabile sunt dependente, si totusi corelatia lor tinde catre zero.
Vom reveni asupra acestei chestiuni. Acum vom da o teorema importanta care evidentiaza o
regula de calcul pentru dispersia unei sume de variabile aleatoare independente, cu mare
aplicabilitate practica.
Teorema 3.4.2. Daca X
1
,...,X
n
sunt variabile aleatoare cu dispersii finite

1
2 2
,...,
n
,
iar
S
n
=X
1
+...+X
n
, atunci
(3.30)
2
(S
n
) =
k
k
n
j k
j k
C X X
2
1
2
=
_ _ + ( , )
,

ultima suma extinzandu-se peste fiecare dintre cele
n
2
|
\

|
.
|
perechi (X
j
,X
k
) cu j<k. In particular,
daca variabilele X
j
sunt independente in totalitate atunci, are loc urmatoarea regula de adunare
(3.31)
2
(S
n
)=
1
2
2
2 2
+ + + ...
n
.
Demonstratie. Sa punem m
k
=M(X
k
) si m
(n)
=m
1
+...+m
n
=M(S
n
). Atunci S
n
- m
(n)
=
( ) X m
k k
k
_
Si (S
n
- m
(n)
)
2
= ( ) ( )( )
,
X m X m X m
k k
k
j j k k
j k
+ _ _
2
2 .
Luand mediile si aplicand regula de adunare se obtine tocmai (3.30). Atunci (3.31) urmeaza din
teorema 3.3.1.
Exemplul 3.4.1. (Repartitia binomiala b(k;n,p)).
In exemplul 3.2.1. variabilele X
k
sunt independente in totalitate. Avem
M( X
k
2
)=0
2
q+1
2
p=p si M(X
k
) =p. Deci
k
p p pq
2 2
= = si din (3.31) se observa ca dispersia
repartitiei binomiale este npq. Acelasi rezultat a fost obtinut prin calcul direct in exemplul (iv)
din paragraful precedent.
Exemplul 3.4.2. (Probe Bernoulli cu probabilitati variabile).
97
Fie X
1
, ...,X
n
vairabile aleatoare independente in totalitate astfel incat X
k
sa admita
valorile 1 si 0 cu probabilitatile p
k
si q
k
=1-p
k
respectiv. Atunci M(X
k
) =p
k
si

2 2
( ) X p p p q
k k k k k
= = . Punand, din nou, S
n
=X
1
+...+X
n
, rezulta din (3.31)
(3.32)
2
1
( ) S p q
n k k
k
n
=
=
_
.
Ca si in exemplul 3.1.5, variabila S
n
poate fi interpretata ca numarul total al realizarilor
din n probe independente, fiecare dintre ele avand drept rezultat o realizare sau o nerealizare.
Atunci p
p p
n
n
=
+ +
1
...
este probabilitatea medie a realizarilor si , deci, apare ca naturala
compararea situatiei de fata cu aceea a probelor Bernoulli in care probabilitatea p a unei realizari
ramane constanta. O astfel de comparatie conduce la un rezultat remarcabil. Se poate rescrie
(3.32) sub forma
2 2
( ) S np p
n
k
=
_
. Apoi, este usor de observat (prin calul elementar) ca,
dintre toate combinatiile {p
k
} astfel incat _p
k
=np, suma _p
k
2
admite o valoare minima cand toti
p
k
sunt egali. Urmeaza ca, daca probabilitatea medie p a realizarilor este mentinuta constanta,

2
(S
n
) admite valoarea minima cand p
1
= ... =p
n
=p. Se obtine, astfel, rezultatul surprinzator ca
variabilitatea lui p
k
, sau lipsa uniformitatii, micsoreaza marimea fluctuatiilor sansei, asa cum
este calculata cu ajutorul dispersiei. De exemplu, numarul anual al incendiilor intr-o comunitate
de oameni poate fi tratat ca o variabila aleatoare; pentru un numar mediu dat, variabilitatea este
maxima daca toate gospodariile au aceeasi probabilitate de a fi cuprinse de incendiu. Sau, dandu-
se o anumita calitate medie p, a n masini, randamentul va fi cel mai neuniform daca toate
masinile sunt la fel.
Exemplul 3.4.3.
Un pachet cu n carti de joc numerotate se aseaza intr-o ordine la intamplare astfel incat
toate cele n! aranjamente sa aiba probabilitati egale. Numarul de perechi (cartile sa se gaseasca
pe locul lor natural) este o variabila aleatoare S
n
care admite valorile 0,1,2,...,n. Distributia sa
probabilista a fost, deja, obtinuta anterior; din ea rezulta atat media cat si dispersia acestei
variabile. Urmatoarea cale, pe care o prezentam aici, este, insa, mai simpla si chiar mai
instructiva.
Fie X
k
o variabila aleatoare care ia valoarea 1 sau 0, dupa cum cartea numarul k este sau
nu este pe locul k. Atunci, S
n
=X
n
+...+X
n
. Dar, fiecare carte poate aparea pe locul k cu
probabilitatea 1/n, astfel ca P(X
k
=1) =1/n si P(X
k
=0) =(n-1)/n. Prin urmare , M(X
k
) =1/n si,
deci, urmeaza ca M(S
n
) =1; media este o pereche per pachet. Pentru a gasi
2
(S
n
) sa calculam,
mai intai, dispersia o
k
a lui X
k

(3.33) o
k
n n
n
n
2
2
2
1 1 1
=
|
\

|
.
|
=


98
Apoi , calculam M(X
j
X
k
). Produsul X
j
X
k
este ori 0 ori 1; ultima este adevarata daca atat cartea
numarul j cat si cartea numarul k sunt pe locurile lor proprii, probabilitatea pentru acest caz fiind
1
1 n n ( )
. Deci
(3.34) M X X
n n
iar C X X
n n
n n n
j k j k
( )
( ),
( , )
( )
( )
=

1
1
1
1
1 1
1
2 2

Astfel, in final, rezulta

2
2 2
1
2
2
1
1
1 ( )
( )
S n
n
n
n
n n
n
=

+
|
\

|
.
|

= .
Dupa cum se vede, atat media cat si dispersia numarului de perechi sunt egale cu 1.
Exemplul 3.4.4. (Selectia nerepetata).
Sa presupunem ca dintr-o populatie care consta din a elemente albe si g elemente galbene
se face o selectie aleatoare nerepatata de volum r. Numarul S
k
de elemente albe din selectie este
o variabila aleatoare care urmeaza repartitia hipergeometrica; prin caclul direct se pot obtine
media si dispersia.
Amintim ca repartitia hipergeometrica se obtine pornind de la o populatie de n elemente
dintre care n
1
sunt albe si n
2
=n-n
1
negre. Se alege, din aceasta populatie, un grup de elemente la
intamplare. Se cere probabilitatea ca grupul de elemente astfel ales sa contina exact k elemente
albe. Desigur k poate sa fie orice intreg intre zero si n
1
sau r, care din ele este mai mic. Pentru a
gasi q
k
, retinem ca grupul de elemente alese contine k elemente albe si r-k elemente negre. Cele
albe pot fi alese in
n
k
1
|
\

|
.
|
moduri diferite, iar cele negre in
n n
r k

|
\

|
.
|
1
moduri. Deoarece orice
alegere de k elemente albe poate fi combinata cu orice alegere a elementelor negre, se obtine
q
n
k
n n
r k
n
r
k
=
|
\

|
.
|

|
\

|
.
|
|
\

|
.
|
1 1
.
Sistemul de probabilitati, astfel definit, se numeste repartitie hypergeometrica. Tinand
seama de faptul ca
n
r
n
r n r
|
\

|
.
|
=

!
!( )!

formula de mai sus se poate rescrie in forma
q
r
k
n r
n k
n
n
k
=
|
\

|
.
|

|
\

|
.
|
|
\

|
.
|
1
1

extrem de utila in practica].
99
Aici, preferam, insa, metoda urmatoare. Sa definim variabila aleatoare X
k
despre care
admitem ca ia valorile 1 sau 0 dupa cum elementul k din selectie este sau nu este alb (ksr).
Probabilitatea ca X
k
=1 este a/(a+g) si, deci,
(3.35) M(X
k
) =a/(a+g),
2
(X
k
) =ag/(a+g)
2
. .
Apoi , daca j=k atunci, X
j
X
k
=1 daca elementele j si k ale selectiei sunt albe, si X
j
X
k
=0 in
caz contrar. Probabilitatea lui X
j
X
k
= 1 este
a a
a g a g
( )
( )( )

+ +
1
1
si, deci,
(3.36) M(X
j
X
k
) =
a a
a g a g
( )
( )( )

+ +
1
1

Si (3.37) C(X
j
,C
k
) =

+ +
ag
a g a g ( ) ( )
2
1
.
Prin urmare,
M(S
r
) =
+
ar
a g

Si
2
2
1
1
1
( )
arg
( )
S
a g
r
a g
r
=
+


+

(
.
Intr-o selectie repetata se gaseste aceeasi medie, dar dispersia va fi cu putin mai mare,
adica
arg
( ) a g +
2
.

3.5. Inegalitatea lui Cebsev
2)

S-a accentuat mai inainte ca dispersia mica conduce la concluzia ca sunt improbabile
deviatii mari de la medie. Aceasta concluzie este accentuata mai mult de inegalitatea lui Cebsev,
care este extrem de folositaore si constituie un instrument usor de manuit.
Teorema 3.5.1. Fie X o variabila aleatoare cu media m=M(X) si dispersia o
2
. Atunci,
pentru orice t>0
(3.38) P X m t
t
( ) > s
o
2
2

Demonstratie. Dispersia este definita, asa cum am vazut in paragraful 3.3, printr-o serie
de termeni pozitivi
(3.39) M X m x mx m f x
j
j
j j
(( ) ) ( ) ( ) = +
_
2 2 2
2 .
Eliminam toti termenii pentru care ,x
j
-m,<t; aceasta nu poate mari valoarea seriei si, prin
urmare,
(3.40) o
2 2
>
_
*
( ) ( ) x m f x
j j

ceea ce dovedeste teorema.

2)
Pafnutii Lvovici Cebsev, rus, 1821-1894.
100
Inegalitatea lui Cebsev trebuie privita, mai degraba, ca un instrument teoretic decat ca o
metoda practica de estimare. Importanta acestei inegalitati se datoreste universalitatii sale, dar nu
ne putem astepta ca vreo formulare a sa, oricat de generala ar fi, sa duca la rezultate rasunatoare
in cazuri individuale.
Exemplul 3.5.1.
Pentru repartitia binomiala b(k;n,p) s-a obtinut (conform exemplului 3.3.1) m=np si
o
2
=npq. Pentru n suficient de mare se stie ca
(3.41) P S np x npq N x N x
n
( ( ) ) ( ) ( )
/
) ~ +
1 2
1 .
Inegalitatea lui Cebsev afirma doar ca membrul stang este mai mic decat 1/x
2
; deci, evident, o
estimare mai slaba decat 4.(41).

3.6. Inegalitatea lui Kolmogorov
3)

In acest paragraf prezentam o teorema care scoate in evidenta o metoda mult mai rafinata
de estimare in sensul discutat pana acum.
Teorema 3.6.1. Fie X
1
,...,X
n
variabile aleatoare inedependente cu mediile m
k
=M(X
k
) si
dispersiile o
2
k
. Se noteaza
(3.42) S
k
=X
1
+...+X
k

si
m
(k)
=M(S
k
) =m
1
+...+m
k
;
(3.43) s S
k
k
k
2 2
1
2 2
= = + + o o ( ) ... .
Pentru fiecare t>0 probabilitatea realizarii simultane a urmatoarealor n inegalitati
(3.44) S m ts k n
k
k
n
( =
( )
, , ,.., 1 2
este cel putin 1-t
-2
.
Pentru n=1 aceasta teorema se reduce la inegalitatea lui Cebsev. Pentru n>1 inegalitatea
lui Cebsev margineste, in acelasi fel, probabilitatea unei singure inegalitati ,S
n
-m
(n)
,<ts
n
, astfel
ca inegalitatea lui Kolmogorov este considerabil mai tare.
Demonstratie. Trebuie sa estimam probabilitatea x ca cel putin una dintre inegalitatile
(3.44) sa nu aiba loc. Teorema afirma ca xst
-2
. Sa definim n variabile aleatoare Y
k
dupa cum
urmeaza: Y
u
= 1 daca

S m ts
i
S m ts pentruk
n
k
k
n
u
u
u
>
( =
( )
( )
[
, ,..., 1 2 1

Y
u
=0 pentru toate celelalte puncte. Cu alte cuvinte, Y
u
este egala cu 1 in acele puncte in care cea
de-a v inegalitate (3.44) pentru prima data nu este satisfacuta. Atunci, in orice punct particular,
cel mult dintre variabilele Y
k
este 1, iar suma Y
1
+Y
2
+...+Y
n
poate admite valorile 0 sau 1; ea

3)
Andrei Ncolaevici Kolmogorov, rus, 1903-1987.
101
este 1 daca si numai daca cel putin una dintre inegalitatile (3.44) nu este satisfacuta si, prin
urmare
(3.45) x=P[ Y
1
+Y
2
+...+Y
n
=1] .
Deoarece Y
1
+Y
2
+...+Y
n
este 0 sau 1, avem _Y
k
s1. Inmultind prin (S
n
-m
(n)
)
2
si luand
mediile , se obtine
(3.46) M Y S m s
k n
n
n
k
n
( ( ) )
( )
s
=
_
2 2
1
.
Pentru evaluarea termenilor din partea stanga sa punem
_
+ =
= =
n
k
k
k
n
n k
m X m S m S U
1
) ( ) (
) ( ) ( ) (
u
u u

Atunci,
(3.47)
M Y S m M Y S m M Y U S m M Y U
k n
n
k k
k
k k k
k
k k
( ( ) ) ( ( ) ) ( ( )) ( )
( ) ( ) ( )
= + +
2 2 2
2
Insa, U
k
depinde numai de X
k+1
,...,X
n
in timp ce Y
k
si S
k
depind numai de X
1
, . . . , X
k
. Deci U
k

este independenta de
, ,
Y S m
k k
k

|
\

|
.
|
si, prin urmare ,

, , , ,
, , M Y U S m M Y S m M U
k k k
k
k k
k
k

|
\

|
.
|
|
\

|
.
| =
|
\

|
.
|
|
\

|
.
| = 0 deoarece M(U
k
)=0. Astfel, din
(3.47) rezulta
(3.48)
, , , ,
M Y S m M Y S m
k n
n
k k
k

|
\

|
.
|
|
\

|
.
| >
|
\

|
.
|
|
\

|
.
|
2 2
.
Dar Y
k
=0 numai daca
, ,
S m ts
k
k
n
> , astfel incat
, ,
Y S m t s Y
k k
k
n k

|
\

|
.
|
>
2
2 2
.
Deci combinand (3.46) si (3.48) se obtine
, , s t s M Y Y
n n n
2 2 2
1
> + + ... .
Cum Y Y
n 1
+ + ... este egala ori cu 0 ori cu 1, urmeaza ca media membrului drept al inegalitatii
este egala cu probabilitatea x definita in (3.45). Astfel, xt
2
s1 asa cum s-a afirmat.

3.7. Raport de corelatie
Fie X si Y doua variabile aleatoare oarecare cu mediile m
x
si m
y
si dispersiile pozitive,

x
2
si
y
2
. Introducem variabilele aleatoare normalizate corespunzatoare X
*
si Y
*
definite prin
(3.27).
Prin definitie, corelatia variabilelor X
*
si Y
*
poarta numele de raport de corelatie al
variabilelor aleatoare X si Y si va fi notat prin p(X,Y). Astfel, folosind relatia (3.29) se gaseste
(3.49) , ,
, ,
, ,
p

X Y C X Y
C X Y
z y
, ,
,
* *
= = .
102
Se observa ca acest raport de corelatie este independent atat de origine cat si de unitatile
de masura, adica pentru orice constante a
1
, a
2
, b
1
, b
2
, cu a
1
>0, a
2
>0, se are
, , , , p p a X b a Y b X Y
1 1 2 2
+ + = , , .
Se stie din paragraful 3.4 ca C(X,Y)=0 ori de cate ori sunt variabile aleatoare
independente. Deci, in acest caz, se are si p(X,Y) =0. Este deosebit de important sa se retina ca
reciproca nu este adevarata. De altfel, raportul de corelatie p(X,Y) poate sa tinda la zero chiar
daca Y este o functie de X.
Exemple.
(i) Fie X o variabila aleatoare care admite valorile 1, 2 fiecare cu probabilitatea . Fie Y=X
2
.
Distributia comuna este data prin egalitatile p(-1, 1) = p(1, 1) = p(2, 4) = p(-2, 4)=1/4. Se
constata ca p(X,Y) =0 chiar daca exista o dependenta functionala directa a lui Y de X.
(ii) Fie U si V variabile aleatoare independente cu aceeasi distributie si fie X=U+V, Y=U-V .
Atunci M(XY) =M(U
2
)-M(V
2
) =0 si M(Y) =0. Deci C(X,Y) =0 de unde rezulta ca p(X,Y) =0.
Spre exemplu, X si Y pot fi suma si diferenta punctelor rezultate in cazul aruncarii a doua zaruri.
Atunci X si Y sunt ori ambele impare ori ambel e pare si, prin urmare, dependente.
Urmeaza ca raportul de corela]ie in nici un caz nu poate fi o masura generala a
dependentei dintre X si Y. Insa, p(X,Y) se leaga de dependenta liniara a lui X si Y.
Teorema 3.7.1. Este totdeauna adevarata inegalitatea ,p(X,Y),s1; in plus, , , p X Y , = 1
numai daca exista constantele a si b astfel incat Y=aX+b, cu exceptia, eventual, a valorilor lui X
cu probabilitatea zero.
Demonstratie. Fie X
*
si Y
*
variabilele normalizate. Atunci,

2
(X
*
Y
*
) =
*
(X
*
) 2C(X
*
,Y
*
) +
2
(Y
*
) = 2(1 p(X,Y) .
Partea stanga a egalitatii nu poate fi negativa; deci , , p X Y , s1 . Pentru , , p X Y , =1 este
necesar ca
, ,

2
0 X Y
* *
= ceea ce inseamna ca, cu o probabilitate egala cu 1, variabila X
*
-
Y
*
admite numai o valoare. In acest caz X
*
-Y
*
=c, (c - constanta) si, prin urmare, Y=aX+c, unde
a =

y
x
. Un rationament similar se aplica in cazul p(X,Y) =-1.

3.8. Variabile aleatoare peste un camp de probabilitate complet aditiv
Problema care se pune este urmatoarea: Ce se intampla in cazul campurilor infinite, sau
mai precis pe campuri de probabilitate complet aditive? (vezi definitia 2.3.1).
Fie (O, K(O), P) un camp de probabilitate complet aditiv si
f : OR
o functie reala definita pe O. Dandu-se oeR sa consideram multimea f
-
1
(o)={xeO,f(x) =o}.P(O). Cum K(O) nu coincide cu P(O), (K(O) fiind un o-corp de parti ale
multimii P(O)), se poate intampla sa avem sau f
-1
(o)eK(O) sau
103
f
-1
(o)eK(O) si acesta este cazul general. Daca insa f
-1
(o)eK(O), putem vorbi de probabilitatea
evenimentului f
-1
(o).
La fel, daca I.R este un interval (deschis, inchis, seminchis) sau este o multime oarecare
a dreptei reale, avem sau
f
-1
(I)={xeO,f(x) eI}eK(O)
sau
f
-1
(I)eK(O)
si aceasta este cazul general.
Din cele infatisate, mai sus, se vede ca functiile reale avand drept domeniu de definitie
multimea O se impart in doua clase si anume: acelea care se bucura de proprietatea ca oricare ar
fi X.R, f
-1
(X)eK(O) si cele care nu au aceasta proprietate.
Fie X.R si oeX. Daca punem
I
o
={xeX,x<o}, I
o
={xeX,x>o}
observam ca f
-1
(X)eK(O) daca f
-1
(I
o
)eK(O), f
-1
(I
o
)eK(O) deoarece f
-1
(X)=f
-1
(I
o
)f
-1
( I
o
).
Aceste observatii ne permit sa introducem
Definitia 3.8.1. Fie (O,K(O),P) un camp de probabilitate complet aditiv. O aplicatie f :
OR se spune ca este o variabila aleatoare peste campul (O,K(O),P) daca pentru orice oeR
avem f
-1
(I
o
)eK(O), unde I
o
={xeR,x<o}.
Daca (O,K(O),P) este un camp de probabilitate finit, orice f : OR se considera
variabila aleatoare.
Teorema 3.8.1. Fie o,|eR in relatia o<|. Aplicatia f : OR este o variabila aleatoare
peste campul (O,K(O),P) daca este satisfacuta una din conditiile urmatoare
1) f
-1
({xeR,x >o})eK(O)
2) f
-1
({xeR,osx s|})eK(O)
3) f
-1
({xeR,o<x <|})eK(O)
4) f
-1
({xeR,o<x s|})eK(O)
5) f
-1
({xeR,osx <|})eK(O)
6) f
-1
({xeR,x>|})eK(O)
7) f
-1
({xeR,x>|})eK(O)
Demonstratia teoremei 3.8.1. este o consecinta directa a definitiei 3.8.1. si a proprietatilor
cmpului K(O) si o propunem drept exercitiu.
Observatia 3.8.1. f
-1
({xeR,x<o})= {eO,f()<o} , etc.
Observatia 3.8.2. Fie A.O. AeK(O) daca si numai daca indicatorul multimii A este o variabila
aleatoare .
Observatia 3.8.3. Atragem atentia ca in acceptia definitiei 3.1.1. variabilele aleatoare nu sunt
toate aplicatiile f : OR pentru care avem f
-1
(X)eK(O) cu X.R arbitrar, ci numai acele functii
reale definite pe O cu proprietatea ca avem f
-1
(X)eK(O) numai daca XeB
1
unde B
1
desemneaza
corpul borelian pe R generat de intervalele deschise , (vezi paragraful 2.3).
104
Prin urmare, se poate reformula definitia 3.1.1. in felul urmator
Definitia 3.8.2. Daca B
n
este corpul borelian generat de multimile deschise din R
n
, atunci
f : OR
n
este o variabila aleatoare n-dimensiunala daca
f
-1
(X)eK(O)
pentru orice parte boreliana XeB
n
. In particular, pentru n=1, vom spune ca f este o variabila
aleatoare.
Este imediat rezultatul urmator
Teorema 3.8.2. Daca f,g sunt variabile aleatoare atunci, pentru orice ,eR , f+g
este o variabila aleatoare (unde f+g desemneaza aplicatia f+g : OR) pentru care avem
(f+g)(e)= f(e)+g(e) pentru orice eeO. De asemenea, fg este variabila aleatoare pentru
care avem (fg)(e)=f(e)f(e).
Fie f si g doua variabile aleatoare. Are loc urmatorul rezultat
Lema 3.8.1. Daca f,g sunt doua variabile aleatoare, at unci
1). {eeO, f(e)>g(e)}eK(O) ;
2). {eeO, f(e)>g(e)}eK(O) ;
3). {eeO,f(e)=g(e)}eK(O) .
Intr-adevar, pentru primul caz avem
{e,f(e)>g(e)} = { ( ) } { ( ) } e e e e f
n
m
g
n
m
n N m Z e e
eK(O).
Celelalte doua afirmatii rezulta din faptul ca
{e,f(e)>g(e)} = C{e,g(e)>f(e)} e K(O)
Si {e,f(e)=g(e)} = {e,f(e)>g(e)}{e,f(e)sg(e)} e K(O) .
Dintre variabilele aleatoare se disting, ca deosebit de importante in teoria probabilitatilor,
variabilele aleatoare simple.
Definitia 3.8.3. Se numeste variabila aleatoare simpla o variabila aleatoare care ia numai
un numar finit de valori.
In sensul acestei definitii, inseamna ca aplicatia f : OR este o variabila aleatoare simpla
daca ia un numar finit de valori v
1
,v
2
,...,v
n
si daca
{eeO,f(e)=v
i
}eK(O) oricare ar fi i=1,2,...,n.
Convenim sa notam familia variabilelor aleatoare simple prin S. Astfel, cel mai simplu
exemplu de variabila aleatore simpla este indicatorul I
A
al evenimentului A. Avem, astfel o
descriere completa a corpului K(O) prin variabile aleatoare. De asemenea, sa observam ca, daca
feS atunci f va admite o reprezentare sub forma
v I
I
o
o
o
O
e
_
unde O
o
eK(O), v
o
sunt numere reale, iar I este o multime finita de indici. Desigur, o astfel de
reprezentare nu este unica.
Daca valorile pe care le ia variabila aleatoare feS sunt (a
o
)
oeI
si daca
O
o
={eeO,f(e)=a
o
},
105
atunci se poate nota f si in felul urmator
{, v
o
, O
o
,
oeI
} ;
iar daca I={1,2,...,n} se poate folosi simbolul
{v
1
,O
1
, v
2
,O
2
, ..., v
n
,O
n
}.
Din aceste consideratii se deduce imediat ca suma , produsul si puterea unor variabile
aleatoare simple sunt, de asemenea, variabile aleatoare simple. In plus, daca feS atunci, ,f,eS; iar
daca oeR atunci ofeS. Are loc propozitia urmatoare
Propozitia 3.8.1. Daca f este o variabila aleatoare pozitiva, atunci exista un sir crescator
(f
i
)
0si<
de variabile aleatoare simple, pozitive, convergent catre f.
Demonstratie. Oricare ar fi n=1,2,... sa luam

>
= ( (

=
n f daca n
k f
k
daca
k
f
n
n n n
n
) (
) 2 ,.., 1 (
2
1
) (
2
1
2
1
) (

.
Prin urmare, f
n
()eS si f
n
()>0 pentru orice . Daca f()<n, atunci
f f
n
n
( ) ( ) (
1
2

si, in acest caz, lim ( ) ( )
n
n
f f

= . Deoarece sirul (f
i
)
0si<
, de variabile aleatoare, este crescator,
propozitia este dovedita.
Daca se noteza f
+
=sup(f,0) si f

=inf(f,0) atunci, deoarece f=f


+
-(-f
-
), rezulta ca orice
variabila aleatoare este limita unui sir de variabile aleatoare simple.
3.9. Functia de probabilitate
Fie (O, K(O), P) un camp de probabilitate complet aditiv. Fie, de asemenea, O
1
o noua
multime de evenimente elementare si sa consideram o aplicatie f : OO
1
. Daca se noteaza prin
K
(f)
(O
1
) familia tuturor partilor A.O
1
cu proprietatea ca f
-1
(A)eK(O), atunci este clar ca
K
(f)
(O
1
) este un corp borelian.
Pentru orice AeK
(f)
(O) se poate acum defini, in mod unic, functia
(3.50) P
(f)
(A)=P(f
-1
(A)) .
Se poate arata ca functia P
(f)
(A) definita in (3.50) este o probabilitate pe corpul borelian
K
(f)
(O
1
), astfel ca (O
1
, K
(f)
(O
1
), P
(f)
) este un camp de probabilitate complet aditiv.
Intr-adevar, P
(f)
(A)>0 pentru orice Ae K
(f)
(O
1
). De asemenea
P
(f)
(O
1
)=P(f
-1
(O
1
))=1
deoarece P este o probabilitate pe corpul borelian K
(f)
prin ipoteza.
Fie, acum, (A
o
)
oeI
.K
(f)
(O
1
) o familie numerabila de evenimente incompatibile doua cate
doua, adica A
o
A
o
=C pentru o

=o

cu o

,o

eI.
Atunci,
P
(f)
A P f A P f A P f A P A
I I I I
f
o
o
o
o
o
o
o
o e

e
|
\

|
.
| =
|
\

|
.
|
|
\

|
.
|
=
|
\

|
.
| = = _ _
1 1 1
( ) ( ( )) (
( )
o
)
oeI
106
deoarece, daca o,oeI si o

=o

, atunci
f A f A f A A f

= = C = C
1 1 1 1
( ) ( ) ( ) ( )
' " ' "
o o o o
.
Deci, (O
1
, K
(f)
(O
1
), P
(f)
) este un camp de probabilitate complet aditiv.
Functia P
(f)
definita de (3.50) se numeste functia lui Kolmogorov sau functia de
probabilitate. Ea va interveni, in continuare, in definirea functiei de repartitie a unei variabile
aleatoare.

3.10. Functia de repartitie
Fie f o variabila aleatoare definita pe campul de probabilitate complet aditiv (O, K(O),
P). Pentru orice numar aeR sa punem O
a
={,f(, <a}. Este clar ca, in acest fel, O
a
=f
-1
((-,a)) si
sa notam
(3.51) F(a)=P(O
a
)=P({,f(, <a}) .
Deoarece (-,a)eB.K
(f)
(O
1
) rezulta ca
F(a)= P({,f(, <a})= P(f
-1
(-,a))=P
f
((-,a))
in virtutea relatiei (3.50).
Definitia 10.1. Pentru orice aeR si variabila aleatoare f, functia F(a) data in (3.51) se
numeste functia de repartitie a variabilei aleatoare f.
Proprietatile de baza ale functiei de repartitie sunt date in teorema urmatoare
Teorema 3.10.1. Functia de repartitie F a unei variabile aleatoare f are urmatoarele
proprietati:
1) F(+, =1 ;
2) F(-, =0 ;
3) F(a-0, =F(a) , pentru aeR ;
4) F(a)sF(b), daca asb cu a,beR.
[Aici s-au utilizat notatiile obisnuite F(+)= ) ( lim ) 0 ( ) ( lim ) ( ), ( lim x F a F si a F F a F
a x
a x a a
(

= = ].
Demonstratie.
1) Fie a
1
<a
2
<...<a
n
<.. un sir monoton crescator de numere reale cu lim
n
n
a

= +. Atunci, (-
,a
n
). (-,a
n+1
) si, pentru orice numar natural n, avem ( , ) =
e
a R
n
n N
.
In virtutea corolarului 2.3.2 se obtine
F F a P a P a P R
n
n
n
f
n
f
n
n N
f
( ) lim ( ) lim (( , ) ( , ) ( )
( ) ( ) ( )
+ = = =
|
\

|
.
| = =

e
1 .
2) Fie, acum, a
1
>a
2
>...>a
n
>... un sir monoton descrescator de numere reale cu lim
n
n
a

= .
Atunci, (-,a
n+1
). (-,a
n
) si, pentru orice numar natural n, se are
n N
n
a
e
= C ( , ) .
107
In baza corolarului 2.3.1. se obtine de data aceasta
F F a P a P a P
n
n
n
f
n
f
n N
n
f
( ) lim ( ) lim (( , ) ( , ) ( )
( ) ( ) ( )
= = =
|
\

|
.
| = C = C

e
.
3) Fie sirul monoton crescator de numere reale a
1
<a
2
<...<a
n
<... cu lim
n
n
a a

= . In acest caz
F(a)=P
(f)
((-,a)) si F(a
n
)=P
(f)
((-,a
n
)), astfel ca
F(a)-F(a
n
)= P
(f)
((-,a))- P
(f)
((-,a
n
))= P
(f)
([a
n
,a)).
Insa |a
n+1
,a).|a
n
,a) si, pentru fiecare numar natural n, avem
| , a a
n
n N
,
e
= C.
Prin urmare,
| , | , lim ( ( ) ( )) lim ( , ) , ( )
( ) ( ) ( )
n
n
n
f
n
f
n
n N
f
F a F a P a a P a a P

e
= =
|
\

|
.
| = C = 0
de unde se deduce proprietatea.
4) Fie a,beR cu asb. Atunci (-,a).(-,b). Deci
F(a)=P
(f)
((-,a))s P
(f)
((-,b))=F(b) .
Sa observam ca, pentru fiecare numar real a s-au considerat, in definitia functiei de
repartitie, numai valorile variabilei aleatoare f strict mai mici decat a. Ne propunem sa vedem ce
se intampla daca se vor lua in consideratie si valorile f()=a. Cu alte cuvinte, sa consideram
P({,f(, sa}).
In acest caz
P({,f(, sa})=P
(f)
((-,a]),
unde putem scrie intervalele de forma (-,a] astfel
(-,a]=
I
N n n
a
e
+ )
1
, ( .
Dar ( , ) ( , ) +
+
. + a
n
a
n
1
1
1

pentru orice numar natural n, astfel ca, in baza corolarului 2.3.1 obtinem
P({,f(, sa})=P
(f)
((-,a])=P
(f)
( ( , ) +
e
a
n
n N
1
)=
=
lim ( , ) lim ( ) ( )
( )
n
f
n
P a
n
F a
n
F a

+ = + = +
1 1
0
.
Iata, deci, ca pentru orice aeR se poate scrie
(3.52) F(a+0)=P({,f()sa}).
Din aceste consideratii rezulta imediat ca
P({,f()=a}) = F(a+0)) - F(a-0)
oricare ar fi aeR. De asemenea, daca a
1
,a
2
eR si a
1
<a
2
, atunci
P({,a
1
sf()sa
2
}) = F(a
2
) - F(a
1
).
108
Teorema 3.10.2. Daca o functie de repartitie F este continua in fiecare punct xeR,
atunci ea este uniform continua pe R.
Demonstratie. Deoarece F(-) s F(x) s F(+), din proprietatiile functiei de repartitie
rezulta ca
0 s F(x) s 1
pentru orice xeR. Se pot determina, atunci, numerele a,beR, cu a<b astfel incat sa avem
0 s F(x)s
c
2
, daca x<a
1-
c
2
s F(x) s 1 , daca x>b.
F este o functie continua pe |a, b] si, deci, este uniform continua. Rezulta ca se poate determina
un g>0 astfel incat
,F(x
2
)-F(x
1
), s
c
2

daca x
1
,x
2
e|a,b] si ,x
2
-x
1
,<g. Dar, atunci, urmeaza ca x
1
,x
2
eR si
,x
2
-x
1
,<o=min(g, (b-a))
implica
,F(x
2
)-F(x
1
), < c
ceea ce dovedeste teorema.





















109
CAPITOLUL 4
REPARTITII STATISTICE SI UNELE PROBLEME INRUDITE

OBIECTIVE

Capitolul poate fi considerat ca apartinand atat statisticii matematice cat si Teoriei
probabilitatilor. Evenimente de tip Binomila sau Poissonian sunt foarte des intalnite in viata de zi
cu zi.
Puntea de legatura dintre Teoria probabilitatilor si statistica matematica este data de legea
numerelor mari, un rezultat deosebit de important. O repartitie fundamentala este cea normala,
repartitie catre care converg si alte repartitii. Legat de convergenta, Teorema Limita De Moivre
La Place este esentiala.

La sfarsitul acestui capitol, studentii trebuie sa-si insuseasca:
- Probabilitatile celor trei repartitii: Binomiala, Poisson, Normala
- Caracteristicile numerice ale celor 3 legi
- Legea numerelor mari
- Interpretarea Teoremei Limita de MoivreLaplace


4.1. Repartitia binomiala
Extractiile repetate independente se numesc extractii de tip Bernoulli
1)
daca exista numai
doua rezultate posibile pentru fiecare extragere, posibilitatile lor ramanand aceleasi la toate
extragerile.
Notand cele doua probabilitati prin p si q, ne vom referi la un rezultat, cu probabilitatea p,
ca fiind o realizare R, iar la celalalt ca fiind o nerealizare sau un insucces I. In mod evident
p si q trebuie sa fie nenegative si
(4.1.) p+q=1
Campul de evenimente al fiecarei probe individuale este format din doua puncte R si I.
Campul de evenimente a n extractii Bernoulli contine 2
n
puncte sau succesiuni de n simboluri R
si I, fiecare punct reprezentand un rezultat posibil al experimentului compus. Cum probele sunt
independente, urmeaza ca probabilitatile se inmultesc. Cu alte cuvinte, probabilitatea oricarei
secvente specificate este produsul obtinut prin inlocuirea simbolurilor R si I cu p si q respectiv.
Astfel
P|(RRIIRI...IRR)] = ppqqpq...qpp
Exemplul 4.1.1.
Fie o urna cu a bile albe si n bile negre si sa presupunem ca dupa fiecare extragere se
reintroduce bila extrasa in urna, deci la fiecare extragere urna are aceeasi compozitie.

1)
Jacques Bernoulli (1654-1705) Principala lucrare Ars conjectandi publicata postum in 1713.
110
Considerand, in aceasta situatie, extractii aleatoare repetate (care sunt deci independente), avem
imaginea probelor de tip Bernoulli in care probabilitatea p a realizarii unei bile albe este p=
a/(a+n). De multe ori nu intereseaza sa se faca distinctie intre rezultate diferite si se prefera
descrierea oricarui rezultat in mod simplu, cum ar fi A sau non-A. Astfel, la aruncarea unui zar
perfect distinctia intre realizarea fetei unu, R, si nerealizarea ei, I, conduce la probe de tip
Bernoulli cu p=1/6, in timp ce distinctia intre par si impar conduce la probe de tip Bernoulli cu
p=1/2. Daca zarul nu este perfect (sa zicem neechilibrat), aruncarile seccesive inca mai formeaza
probe de tip Bernoulli, dar probabilitatile corespunzatoare p sunt diferite.
Schema Bernoulli ramane, insa un model teoretic si numai experienta poate arata daca el
este potrivit pentru descrierea diferitelor experimente. Aceasta schema se dovedeste a fi un
model ideal chiar daca nu poate fi niciodata obtinut complet. Spre exemplu, masinile spalat
fabricate in productie de masa pot varia in marime dar, la control, ele sunt clasificate drept
corespunzatoare (R) sau necorespunzatoare (I), dupa cum marimea se incadreaza sau nu in
limitele prescrise. Deci exista multe motive pentru care productia nu se poate conforma schemei
Bernoulli. Masinile sunt supuse schimbarilor si, deci, probabilitatile nu raman constante; exista o
persistenta in mecanismul masinilor si, prin urmare, sunt mai probabile secventele lungi de
derivatii de acelasi fel, in aceasta situatie, decat ar fi fost daca probele erau cu adevarat
independente. Insa, din punct de vedere al controlului de calitate este de dorit ca procesul sa fie
conform schemei lui Bernoulli si este foarte important ca, in anumite limite, se poate face ca
productia sa se comporte in acest mod. Scopul controlului continuu este, deci, de a descoperi cat
mai devreme devierile flagrante de la schema ideala si a le folosi dretp indiciu al unor dificultati
iminente.
De obicei, intereseaza doar numarul total al realizarilor produse intr-o secventa de n
extrageri Bernoulli si nu ordinea acestora. Numarul realizarilor poate fi 0,1,...,n si prima
problema care se pune este sa se determine probabilitatile corespunzatoare. Atunci, evenimentul
din n extrageri rezulta k realizari si n-k nerealizari se poate produce in tot atatea moduri dupa
cum pot fi distribuite k litere R pe n pozitii. Cu alte cuvinte, acest eveniment contine
n
k
|
\

|
.
|
puncte
si, prin definitie, fiecare punct are probabilitatea p
k
q
n-k
. Aceasta dovedeste
Teorema 4.4.4. Fie b(k;n,p) probabilitatea ca, din n probe Bernoulli cu probabilitatea p
pentru realizare si q=1-p pentru nerealizare, sa rezulte k realizari si n-k nerealizari (0sksn).
Atunci
(4.2) b(k;n,p) =
|
\

|
.
|

n
k
p q
k n k
.
In particular, probabilitatea de a nu se produce nici o realizare este q
n
, iar probabilitatea
de a se produce cel putin o realizare este 1-q
n
.
Sa privim, acum, pe p ca o constanta si sa notam, prin S
n
numarul realizarilor din n probe.
Atunci, b(k;n,p)=P(S
n
=k). In terminologia obisnuita S
n
este o variabila aleatoare, iar functia
(4.2) este repartitia acestei variabile aleatoare si ne vom referi la ea ca repartitie binomiala.
111
Atributul binomial se refera la faptul ca (4.2.) reprezinta termenul de rang k din dezvoltarea
binomiala (q+p)
n
. Acasta remarca arata, de asemenea, ca b(0;a,p)+b(1;n,p)+...+b(n;n,p)
=(q+p)
n
=1, ceea ce este impus prin insasi notiunea de probabilitate.
Exemplul 4.1.2. (Weldon)
Sa consideram un experiment constand din aruncarea a douasprezece zaruri si sa privim
ca realizari fetele 5 si 6. Daca zarurile sunt perfecte, probabilitatea de a avea o realizare este
p=1/3, iar numarul realizarilor este dat de repartitia binomiala b(k;12,1/3). Tabelul 4.1, de mai
jos, da aceste probabilitati impreuna cu frecventele medii corespunzatoare observate in 26.306
experiente reale.

k b(k;12,1/3) Frecvente
observate
b(k;12, 0,3377)
0 0,007707 0,007033 0,007123
1 0,046244 0,043678 0,043584
2 0,127171 0,124116 0,122225
3 0,211952 0,208127 0,207736
4 0,238446 0,232418 0,238324
5 0,190757 0,197445 0,194429
6 0,111275 0,116589 0,115660
7 0,047689 0,050597 0,050549
8 0,014903 0,015320 0,016109
9 0,003312 0,003991 0,003650
10 0,000497 0,000532 0,000558
11 0,000045 0,000152 0,000052
12 0,000002 0,000000 0,000002
Tabelul 4.1

Ipoteza este buna dar pentru o experienta atat de vasta nu este tocmai potrivita. Este mai
rezonabil sa se presupuna ca zarurile nu sunt perfecte. In acest caz, o realizare cu probabilitatea
p= 0,3377 ar fi mai potrivita cu observatiile.
Exemplul 4.1.3.
Daca probabilitatea unei realizari este 0,01, cate probe sunt necesare pentru ca
probabilitatea a cel putin unei realizari sa devina 1/2 sau mai mare ? In acest caz se cauta cel mai
mic intreg n pentru care 1-(0,99)
n
> 1/2, sau -nlog(0,99)>log2. Deci n>70.
Exemplul 4.1.4.
Sa presupunem ca n=10 unitati economice folosesc in mod intermitent energia electrica si
sa cautam a estima ce sarcina totala ar fi de asteptat. Sa ne imaginam (vorbind destul de general)
ca la orice moment fiecare unitate economica solicita o unitate de energie cu aceeasi
probabilitate p. Daca ele lucreaza indepentent, probabilitatea ca, la acelasi moment, k unitati
112
economice sa solocite energia electrica este b(k;n,p). Daca, in medie, o unitate economica
foloseste energia electrica 12 minute pe ora, atunci vom pune p=1/5. Deci probabilitatea ca sapte
sau mai multe unitati economice sa solicite curent in acelasi timp este b(7; 10, 0,2)+...+b(10; 10,
0,2) = =0,0008643584. Cu alte cuvinte, daca alimentarea este redusa la sase unitati de energie, o
supraincarcare are probabilitatea 0,00086..., adica aproximativ un minut in douazeci de ore.
Probabilitatea ca opt sau mai multe unitati economice sa solicite curent in acelasi timp este
numai 0,0000779264 sau aproximativ de unsprezece ori mai mica.
Sa observam ca, din (4.2.) urmeaza
(4.3.)
b k n p
b k n p
n k p
kq
n p k
kq
( , , )
( , , )
( ) ( )

=
+
= +
+
1
1
1
1

Prin urmare, termenul b(k;n,p) este mai mare decat precedentul pentru k<(n+1)p si este mai mic
pentru k>(n+1)p. Daca se intampla ca (n+1)p=m fie un intreg, atunci b(m;n,p) =b(b(n-1;n,p).
Exista, deci, un singur intreg n astfel incat
(4.4.) (n+1)p-1<ms(n+1)p
si obtinem
Teorema 4.1.2. Pe masura ce k ia valori de la 0 la n, termenii b(k;n.p) mai intai cresc
monoton, iar apoi descresc monoton, atingand valoarea maxima cand k=n cu exceptia cazului in
care b(m-1;n,p) =b(m;n,p), cand m=(n+1)p.
Convenim sa numim b(m;n,p) termen central. Deseori m este numit valoarea cea mai
probabilia a realizarilor insa trebuie inteles in sensul ca pentru valori mari ale lui n toti termenii
b(k;n,p) sunt mici. Spre exemplu, in cazul aruncarii unei monede valoarea cea mai probabila a
realizarii banului este 50, dar probabilitatea sa este mai decat 0,08; (in statistica matematica se
arata ca valoarea lui b(m;n,p) este aproximativ egala cu , , 2
1 2
tnpq
/
).
In mod evident, raportul din (4.3.) descreste monoton pe masura ce creste k. Prin urmare,
cand k>r+1
(4.5.)
b k n p
b k n p
n r p
r q
( , , )
( , , )
( )
( )
s

+ 1 1
.
Sa punem aici k=r+1,...,r+v si sa inmultim cele v inegalitati. Se obtine
(4.6.)
b r n p
b r n p
n r p
r q
( , , )
( , , )
( )
( )
+
s

+

(
v
v
1
.
Pentru r>np fractia din paranteza dreapta ramane mai mica decat unitatea si sumarea dupa v
conduce la o serie geometrica finita cu ratia
( )
( )
n r p
r q

+ 1
.
Conchidem, deci, ca pentru r>np
(4.7.) b r n p b r n p
r q
r n p
n r
( , , ) ( , , )
( )
( )
+ s
+
+ +
=

_
v
v
1
1 1
0

care ne da probabilitatea de a avea cel putin r realizari. In mod similar rezulta ca, pentru s snp
113
(4.8) b n p b s n p
n s p
n p s
s
( ; , ) ( ; , )
( )
( )

=
_ s
+
+
0
1
1

S-a dovedit, astfel
Teorema 4.1.3. Daca r>np, probabilitatea obtinerii a cel putin r realizari satisface
inegalitatea (4.7.); daca ssnp, probabilitatea obtinerii a cel mult s realizari satisface
inegalitatea (4.8.).

4.2. Legea numerelor mari
Asa cum am mai precizat in cateva randuri, notiunea noastra intuitiva de probabilitate se
bazeaza pe urmatoarea presupunere. Daca in n probe identice evenimentul A apare de v ori, si
daca n este suficient de mare, atunci v/n se apropie oricat de mult de probabilitatea p a
evenimentului A. Cum o teorie matematica formala cauta totdeauna sa prezinte cat mai exact
fenomenele reale pe care le studiaza, vom interpreta si noi, aici, extragerile identice ca
extrageri de tip Bernoulli cu p probabilitatea unei realizari. Daca S
n
este numarul de realizari
din n extrageri atunci, S
n
/n este frecventa relativa a realizarilor si ar fi apropiata de p. Se poate
da, acum, un sens precis acestui fapt. Sa consideram, spre exemplu, probabilitatea ca S
n
/n sa
depaseasca p+c, unde c>0 este fixat si arbitrar de mic. Aceasta probabilitate este aceeasi ca si
P|S
n
>n(p+c)] si egala cu membrul stang al inegalitatii (4.7) cand r este cel mai mic intreg care
depaseste n(p+c). Atunci (4.7) implica
(4.9.)
| ]
PS n p b r n p
n p q
n q
n
) + (
+ +
+
( ) ( , , )
( )
c
c
c

Pe masura ce n creste fractia din membrul al doilea al inegalitatii ramane marginita, in timp ce
b(r;n,p)0 deoarece b(r;n,p)<b(k;n,p) pentru fiecare k astfel incat (n+1)psk<r si exista
aproximativ nc astfel de termeni. Urmeaza ca, in timp de n creste, P|S
n
>n(p+c)]0. Folosind,
acum, inegalitatea (4.8.) se constata, in acelasi fel, ca P|S
n
<n(p-c)]0. Prin urmare a rezultat ca
(4.10) P
S
n
p
n
(

(
c 1
ceeace inseamna ca daca n este suficient de mare probabilitatea ca, abaterea frecventei relative
a realizarilor fata de p, sa fie in valoare absoluta mai mare decat c tinde la zero. Aceasta este o
forma de prezentare a legii numerelor mari, ce serveste ca baza pentru notiunea intuitiva de
probabilitate ca masura a frecventelor relative. Pentru aplicatii practice ea trebuie completata
printr-o estimare mai precisa a probabilitatii situata in partea stanga din (4.10); o asemenea
estimare este furnizata de aproximarea normala a repartitiei binomiale, (4.10) fiind, de fapt, o
consecinta a acesteia.
Obisnuim sa ne referim la (4.10.) ca fiind legea clasica a numerelor mari. Ea, insa,
prezinta un interes destul de limitat, astfel ca ea este inlocuita prin legea tare a numerelor mari,
mai precisa si mai folositoare, la care ne vom referi in cap 12.
Observatie. Se obisnuieste sa se citeasca in legea numerelor mari obiecte pe care ea nu
le implica in mod explicit. Daca indivizii X si Y arunca o moneda perfecta de 10.000 ori se crede,
114
din obisnuinta, ca X va avea un avans de jumatate de timp, aproximativ. Aceasta, insa, nu este
adevarat. Probabilitatea ca X sa conduca in mai putin de 20 probe este mai mare decat
probabilitatea ca numarul probelor in care el conduce sa se gaseasca intre 4990 si 5010, de
exemplu. Legea numerelor mari nu afirma ca frecventa relativa ar fi egala cu probabilitatea ci
numai ca, pentru un numar mare de probe, frecventa acelora in care se realizeaza banul, la orice
moment dat, se apropie oricat de mult de 1/2. Pentru precizare se obisnuieste sa se spuna ca
frecventa relativa tinde in probabilitatea catre p.

4.3. Repartitia Poisson
2)

Multe aplicatii conduc la probe de tip Bernoulli unde, comparativ vorbind, n este mare si
p este mic, in timp ce produsul
(4.11.) =np
este de marime moderata. In aceste cazuri, este convenabil sa se foloseasca o formula de
aproximare pentru b(k;n,p) datorata lui Poisson, pe care o vom stabili in cele ce urmeaza. Avem,
deci,
(4.12.) b(0;n,p)=(1-p)
n

sau, tinand seama de (4.11)
(4.13.) b(0;n,p)=(1-(/n))
n

Trecand, acum, la logaritmi si folosind dezvoltarea Taylor a logaritmului natural (4.14.)

...
3 2
1 ln ) , , 0 ( ln
, 1 1
...
4
1
3
1
2
1
) 1 ln(
2
3 2
4 3 2
=
|
.
|

\
|
=
( (
+ + = +
n n n
n p n b
rezulta t cu
t t t t t


astfel ca pentru un n suficient de mare
(4.15.) b(0;n,p)~e
-
,
(semnul ~ inseamna egalitate aproximativa). In plus, din (4.3.) reiese ca, pentru orice k fixat si n
suficient de mare, avem
(4.16.)
b k n p
b k n p
k p
kq k
( , , )
( , , )
( )

=

~
1
1

Pentru k=1 se obtine, de aici si din (4.15.), ca b(1;n,p)~e
-
. Analog, pentru k=2 rezulta
b(2;n,p)~


2
2
e

< iar, in general, prin inductie se gaseste


(4.17.) P(k;n,p)~


k
k
e
!


Aceasta este cunoscuta aproximatie Poisson a distributiei binomiale. Deoarece este de
dorit sa existe un simbol pentru membrul drept din (4.17.), sa punem

2)
Simon Denis Poisson (1781-1840)
115
(4.18.) P(k;)=


k
k
e
!

.
Cu aceasta notatie, P(k;) este o aproximatie pentru b(k;n, /n) cand n este suficient de mare.
Observatie. De fapt, se vede fara greutate ca, daca n si p0 astfel incat =np
r\m=ne constant atunci, b(k;n,p) tinde uniform la P(k;) pentru orice k. Am vazut ca distributia
binomiala este definita prin relatia
b(k;n,p)=
n
k
p q
k n k
|
\

|
.
|


de unde punand p=/n rezulta
b(k;n,p)=
n n n k
k n n
n n n k
n k n
k
k
n k
k
k
n k
( )...( )
!
( )...( )
!
+

|
\

|
.
|
=
+

|
\

|
.
|

1 1
1
1 1
1


Prin urmare,
lim ( , , )
!
lim
n
k
n
n k
b k n p
k n

=
|
\

|
.
|

1
adica
lim b(k;n,p) =


k
k
e
!
.
Exemplul 4.3.1.
In tabelul 4.2, de mai jos, se compara P(k;1) cu repartitia binomiala pentru n =100, p=1/100.

k b(k;100,1/100 ) p(k;1) N
k

0 0,366032 0,367879 41
1 0,369730 0,367879 34
2 0,184865 0,183940 16
3 0,060999 0,061313 8
4 0,014942 0,015328 0
5 0,002898 0,003066 1
6 0,000463 0,000511 0
7 0,000063 0,000073 0
8 0,000007 0,000009 0
9 0,000001 0,000001 0

Tabel 4.2
Tabelul arata ca aproximarea este satisfacuta pentru multe situatii. (Aici primele coloane
ilustreaza aproximarea Poisson a distributiei binomiale. Ultima coloana contine numarul
grupelor de 100 perechi de cifre aleatoare, in fiecare din ele combinatia (7,7) aparand exact de k
ori) Deci, ca ilustrare, sa luam aparitia combinatiei (7,7) in 100 perechi de cifre aleatoare, care au
distributia binomiala b(k;100,1/100). Atunci, ultima coloana a tabelului de mai sus da rezultatul
116
calculului in 100 grupe de cate 100 cifre aleatoare fiecare. Pentru a obtine frecventele relative
trebuiesc impartiti toti intregii din ultima coloana la 100. Aceste frecvente corespund, in mod
acceptabil, probabilitatilor teoretice.

Exemplul 4.3.2.
Care este probabilitatea p
k
ca, intr-o societate de 500 oameni, k dintre ei sa fie nascuti in
ziua de Anul Nou ? Daca cei 500 de oameni sunt alesi la intamplare, putem aplica schema a 500
probe Bernoulli, probabilitatea unei realizari fiind p=1/365. Atunci
p
0
=(364/365)
500
=0,2537...
Pentru aproximarea Poisson punem =500/365=1,3699.... Deci P(0;)=0,2541 care
implica o eroare numai la nivelul zecimilor de miimi. Pentru k=1,2,3 valorile corecte ale lui p
k
,
calculate din formula binomiala, sunt p
1
=0,3484..., p
2
=0,2388..., p
3
=0,1089..., p
4
=0,0372...,
p
5
=0,0101..., p
6
=0,0023...
Aproximarile Poisson corespunzatoare sunt P(1;)=0,3481..., P(2;)=0,2385...,
P(3;)=0,1089..., P(4;)=0,0373..., P(5;)=0,0102..., P(6;)=0,0023... Toate erorile sunt de
ordinul zecimilor de miimi.
Exemplul 4.3.3.
Ne referim in acest exemplu la persoanele centenare. La nastere fiecare persoana are o
sansa mica de a trai 100 ani si, intr-o comunitate numeroasa, numarul zilelor de nastere este
mare. Datorita razboiului, accidentelor, epidemiilor, etc., diferite fiinte umane nu sunt
independente stochastic, dar ca o prima aproximatie putem compara n zile de nastere cu n probe
Bernoulli, considerand ca avem o realizare daca moartea survine dupa 100 ani. Intr-o comunitate
stabila unde nici volumul comunitatii nici coeficientul de mortalitate nu sufera schimbari
considerabile, este normal sa ne asteptam ca frecventa anilor in care mor exact k centenari sa fie
aproximativ P(k; ), unde depinde de volumul comunitatii si de gradul de sanatate al acesteia.
Pana acum am folosit expresia Poisson (4.18) numai ca o aproximare convenabila a
distributiei binomiale in cazul cand n este suficient de mare si p este mic. Avem de-a face aici cu
un caz special al faptului remarcabil ca exista cateva distributii deosebit de importante care apar
intr-o varietate surprinzator de mare de probleme cu implicatii in teoria probabilitatilor, cum sunt
repartitia binomiala, repartitia normala (asupra careia nu insistam aici) si repartitia Poisson data
de (4.18) asupra careia vom mai insista inca.
Notam, mai intai, ca adunand ecuatiile (4.18) pentru k=1, 1, 2, 3, . . ., se obtine in
membrul drept de e
-
ori seria Taylor pentru e

. Deci pentru orice k fixat cantitatile P(k;) au


suma egala cu unitatea si, prin urmare, ne putem imagina un experiment ideal in care P(k; este
probabilitatea a avea k realizari. Vom arata, acum, de ce multe experiente fizice si observatii
statistice, in mod natural, conduc la o astfel de interpretare a relatiei (4.18). Adevarata natura a
repartitiei Poisson va aparea numai in legatura cu teoria proceselor stochastice la care nu ne vom
referi in cele de fata.
Sa consideram o secventa de evenimente aleatoare care apar in timp, asa cum sunt
dezintegrarea radioactiva sau apelurile care sosesc la o centrala telefonica. Sa reprezentam
117
fiecare eveniment printr-un punct pe axa timpului si sa urmarim repartitia aleatoare a punctelor.
Exista multe tipuri diferite de asemenea repartitii, studiul lor apartinand domeniului
probabilitatilor continue, aici, insa, ne vom unele conditii fizice care conduc la P(k;) ca
probabilitatea de a gasi k puncte (evenimente) intr-un interval fixat de lungime stabilita.
Asemenea supozitii fizice pe care dorim sa le exprimam matematic se refera la faptul ca
conditiile in care se desfasoara experimentul raman constante in timp si ca intervalele de timp
care nu se suprapun sunt independente stochastic in sensul ca informatia privitoare la numarul de
evenimente dintr-un interval nu dezvaluie nimic cu privire la alt interval. Intr-o teorie
caracterizata prin repartitia continua de probabilitati aceste formulari se pot da direct, dar cum
aici ne referim la o repartitie discreta de probabilitati, vom folosi un model finit aproximativ
trecand apoi la limita. Sa ne imaginam intervalul de timp unitate impartit intr-un numar mare de
intervale, fiecare avand lungimea 1/n. Un subinterval particular este, atunci, ori este vid ori
contine cel putin unul dintre punctele noastre aleatoare (sau evenimente) si convenim sa
consideram aceste doua posibilitati ca nerealizare si respectiv realizare. Probabilitatea p
n
a
realizarii trebuie sa fie aceeasi pentru toate cele n subintervale, deoarece ele au aceeasi lungime.
Atunci, independenta pe care am presupus-o relativ la intervalele care nu se suprapun implica
faptul ca avem n probe de tip Bernoulli, probabilitatea de a obtine k realizari fiind data de
b(k;n,p
n
). Se intelege ca numarul realizarilor nu este in mod necesar acelasi cu numarul punctelor
aleatoare, deoarece un subinterval poate contine diferite puncte aleatoare. Insa, este normal sa se
introduca presupunerea suplimentara ca probabilitatea a doua sau mai multor puncte aleatoare,
de-a lungul unui interval de timp foarte scurt, sa fie neglijabila la limita. [Aceasta presupunere
apare implicit in descrierea intuitiva a punctelor aleatoare izolate. Insa, este necesar sa se excluda
posibilitatea ca evenimentele sa apara in dubleti. Spre exemplu, daca evenimentele sunt
accidente de automobil atunci, probabilitatea sa apara doua evenimente intr-un interval scurt de
timp este neglijabila in comparatie cu probabilitatea unui eveniment. Pe de alta parte, un
accident este de natura sa implice doua masini si, daca evenimentele inseamna o masina lovita,
atunci ele au sansa sa apara in perechi si presupunerea facut nu se apli cat.
In acest caz, probabilitatea de a gasi k puncte aleatoare in intervalul de timp unitate este
data de limita , , lim , ,
n
n
b k n p

. Impartind fiecare subinterval in doua parti, de lungime egala, se


obtine p
n
=2p
2n
-p
2
2n
; aceasta relatte exprima faptul ca realizarea intr-un interval de lungime 1/n
inseamna ori realizarea in jumatatea stanga ori realizarea in jumatatea dreapta, ori in ambele.
Urmeaza ca p
n
< 2p
2n
, ceea ce sugereaza ca np
n
este monoton crescator. Daca np
n
atunci,
b(k;n,p
n
) ~ b(k;n,/n)P(k;) si se gaseste, astfel, (4.18.) ca probabilitatea sa existe un total de k
puncte aleatoare continute in intervalul unitate. Presupunerea np
n
, nu conduce la vreun
rezultat apreciabil, desi ae implica o infinitate de puncte aleatoare chiar in cel mai mic interval.
Daca in locul intervalului unitate se ia un interval arbitrar de lungime t si se foloseste din
nou o subdivizare in intervale de lungime 1/n, atunci avem de-a face cu probe de tip Bernoulli,
avand aceesi probabilitate p
n
a realizarii, numarul probelor fiind un intreg mai apropiat de nt
decat de n.
118
Trecerea la limita se face la fel doar ca se obtine t in loc de . Aceasta ne conduce la a
considera
, ,
, ,
P k t e
t
k
t
k
,
!

=

(4.19.)
ca probabilitatea obtinerii a exact k puncte intr-un inteval fixat de lungime t. In particular,
probabilitatea de a nu avea nici un punct intr-un interval de lungime t este
, , P t e
t
0,

=

(4.20.)
astfel ca probabilitatea de a avea unul sau mai multe puncte este, deci, 1 -e
-t
.
Parametrul este o constanta fizica ce determina densitatea punctelor pe axa t. Cu cat
este mai mare cu atat este mai mica probabilitatea (4.20) de a nu gasi nici un punct intr-un
interval de lungime t. Sa presupunem ca un experiment fizic este repetat de un numar mare N, de
ori, si ca, de fiecare data, socotim numarul evenimentelor dintr-un interval de lungime fixata t.
Fie N
k
numarul de repetari a experimentului in urma caruia s -au observat k evenimente. Atunci
N
0
+ N
1
+ N
2
+. . . =N.
Numarul total de puncte observate in cele N experimente este
N
1
+ 2N
2
+ 3N
3
+. . . =T (4.21.)
T
N
fiind valoarea medie. Daca N este mare, ne asteptam ca
N
k
~ NP(k; t) (4.22.).
[Aceasta sta la baza tuturor aplicatiilor probabilitatii si ii vom da o justificare mai precisa intr-un
cap. 12. Substituind (4.22.) in (4.21.) gasim
, , , , , , | ]
, ,
t N
t t
t Ne t P t P t P N T
t




=
(

+ + + = + + + ~

...
! 2 1
1 ... , 3 3 , 2 2 , 1
2

si deci
t ~
T
N
(4.23.)
Aceasta relatie da o semnificatie a estimarii lui din observatii si a compararii teoriei cu
experimentele.
Observatie.
S-a considerat pana acum repartitia evenimentelor aleatoare sau punctelor de-a lungul
axei t, dar acelasi rationament se aplica repartitiei punctelor in plan sau in spatiu. In locul
intervalelor de lungime t vom avea domenii de arie sau volum t, iar ipoteza fundamentala va fi
ca, probabilitatea de a gasi k puncte in orice domeniu stabilit sa depinda numai de aria sau
volumul domeniului si nu de configuratia sa. In caz contrar se va rationa in aceleasi ipoteze ca
mai inainte: 1
0
daca t este mic, probabilitatea de a gasi mai mult decat un punct intr-un domeniu
de volum t este mica in comparatie cu t; 2
0
domeniile care nu se suprapun sunt in mod reciproc
independente. Pentru a gasi probabilitatea ca un domeniu de volum t sa contina k puncte
aleatoare, impartim domeniul in n subdomenii si aproximam probabilitatea ceruta prin
probabilitatea a k realizari in n probe. Omitand posibilitatea de a gasi mai mult decat un punct in
119
acelasi subdomeniu, presupunerea 1
0
implica faptul ca eroarea tinde la zero cand n. La
limita se obtine, din nou, repartitia Poisson (4.19). De fapt, stelele in spatiul cosmic, stafidele in
cozonac, semintele de buruiana printre semintele de iarba, defectele intr-o stofa, cirezile de
animale pe camp, toate se distribuie in concordanta cu legea lui Poisson.
In continuare, vom prezenta cateva exemple relative la repartitia Poisson. Se stie probabil
ca repartitia Poisson a devenit cunoscuta ca legea numerelor mici sau a evenimentelor rare.
Acestea insa, sunt interpretari gresite care s-au dovedit daunatoare realizarii rolului fundamental
al repartitiei Poisson. Exemplele urmatoare vor arata cat de inselatoare sunt cele doua denumiri.
Exemplul 4.3.4. (Dezintegrarea radioactiva).
O substanta radioactiva emite o particule; numarul particulelor care ajung intr-o portiune
data a spatiului in timpul t este cel mai bine cunoscut exemplu de evenimente aleatoare care se
supun legii lui Poisson. Bineinteles ca substanta continua sa se descompuna si, cu timpul,
densitatea o-particulelor va scadea. Insa, in ceea ce priveste radiul trebuie sa treaca cativa ani
pentru a putea detecta o reducere a substantei, astfel ca pentru perioade relativ scurte conditiile
pot fi considerate constante si putem spune ca avem o realizare ideala a ipotezelor care conduc la
repartitia Poisson. Intr-un renumit experiment
3)
a fost observata o substanta radioactiva pe
parcursul a N=2608 intervale de timp de 7.5 secunde fiecare si s-a stabilit, pentru fiecare
perioada, numarul particulelor care au ajuns la un contor. Tabelul de mai jos prezinta rezultatele
cu privire la numarul N
k
de perioade cu k particule. Numarul total al particulelor este
T = _kN
k
= 10.094, iar media
T
N
= 3,870 . Valorile teoretice N
p
(k;3,870)

k

K
n


N
p
(k;3,870)
0 57 54,399
1 203 210,523
2 383 407,361
3 525 525,496
4 532 508,418
5 408 393,515
6 273 253,817
7 139 140,325
8 45 67,882
9 27 29,189
k>10 16 17,075
Total 2608 2608.000
Tabel 4.3


3)
Rutherford, Chadwich si Ellis - Radiations from radioactive substances, Cambridge, 1920, p.172.

120
se vede ca sunt apropiate de valorile observate N
k
. Pentru a aprecia densitatea fluxului de
particule, este necesara o estimare a marimii probabile a fluctuatiei sansei. De obicei, pentru
aprecierea densitatii fluxului se foloseste criteriul
2
(studiat in statistica matematica drept un
criteriu de baza pentru verificarea ipotezelor statistice) cu ajutorul caruia se constata o abatere
fata de tabelul 4.3, in conditii ideale, cam de 17 dintr -o 100 de cazuri comparabile.
Exemplul 4.3.5.
Ca exemplu de distributie spatiala a punctelor aleatoare vom considera datele statistice
privind bombardarea cu bombe dirijate ( bombe cu autonomie de deplasare) a zonei sudice a
Londrei in timpul celui de-al doilea razboi mondial
4)
.
Intreaga suprafata a fost impartita in N=576 arii mici de cate t=1/4 km
2
fiecare,
inregistrandu-se intr-un tabel, ca cel de mai jos, numarul N
k
al suprafetelor lovite de k bombe.
K 0 1 2 3 4 5 si mai
multe
N
k
229 211 93 35 7 1
N
p
(k;
0,9323)
226,74 211,39 98,54 30,62 7,14 1,57
Tabel 4.4
Numarul total al loviturilor de bombe este T kN
k
= =
_
537, cu media t=T/N=0,9323...
Aplicarea repartitiei Poisson se face, deci, cu succes. Este interesant de retinut ca s-a crezut ca
exista o tendinta a punctelor de ciocnire de a se ingramadi. Daca acest lucru ar fi fost adevarat,
atunci ar fi existat o frecventa mai mare a suprafetelor avand ori multe lovituri ori nici una si o
diminuare a claselor intermediare. Tabelul 4.4 indica un caracter aleator si omogenitate perfecta
a suprafetelor, el constituind o ilustrare instructiva a faptului bine cunoscut ca, pentru un ochi
neexperimentat, caracterul aleator apare ca o regularitate sau ca o tendinta de aglomerare, de
ingramadire.
Sa consideram, acum, o secventa de n probe Bernoulli. Cat de lunga trebuie sa fie pentru
a depinde de a r-a realizare ? (r este un intreg pozitiv fixat). Numarul total de realizari in n probe
poate fi, bineinteles, mai mic decat r, dar probabilitatea, ca cea de-a r-a realizare sa se produca la
proba vsn este, in mod clar, independenta de n, depinzand numai de , r si p. Deoarece, in mod
necesar, v>r este preferabil sa se scrie v=k+r.
Probabilitatea ca a r-a realizare sa se produca la proba r+k (unde k=0,1,2,. . . ) va fi
notata prin f(k;r,p). Ea este egala cu probabilitatea ca exact k nerealizari sa preceada cea de-a
r-a realizare. Acest eveniment apare daca si numai daca printre cele r+k-1 probe exista k
nerealizari, iar urmatoarea proba sau cea de-a r+k-a, duce la o realizare. Probabilitatile
corespunzatoare sunt
r k
k
p q
r k
+
|
\

|
.
|


1
1
si p, astfel incat

4)
R.D. Clarke - An application of the Poisson distribution, Journal of the Institute of Actuaries, vol. 72, (1946),
p.48
121
f(k;r,p)=
r k
k
p q
r k
+
|
\

|
.
|

1
. (4.24.)
Tinand seama de faptul ca pentru orice a>0
, ,

|
\

|
.
|
=
+
|
\

|
.
|
a
k
a k
k
k
1
1
obtinem din (4.24.)
f(k;r,p) , , =

|
\

|
.
|

r
k
p q
r k
, k=0,1,2, . . . (4.25.)
Sa presupunem, mai departe, ca extragerile de tip Bernoulli sunt continuate atat cat este
necesar pentru ca sa depinda de r realizari. Un punct caracteristic este reprezentat printr-o
secventa care contine un numar arbitrar, k, de litere N si exact r litere R, secventa terminandu-se
printr-un R; probabilitatea unui asemenea punct este, prin definitie, p
r
q
k
. Trebuie, insa, sa ne
punem intrebarea daca este posibil ca extragerile sa nu se sfarseasca niciodata, adica daca o
secventa infinita de extrageri poate produce mai putin de r realizari.
Atunci, f k r p
k
( , , )
=

_
0
este probabilitatea ca a r-a realizare sa se produca dupa un numar finit de
extrageri. In consecinta, se poate nesocoti posibilitatea de a avea o secventa infinita cu mai putin
de r realizari daca si numai daca
f k r p
k
( , , )
=

_
0
= 1. (4.26.)
Pentru a dovedi ca (4.26.) are loc este suficient sa se observe ca
|
\

|
.
|
=

_
r
k
q
k
k
( )
0
= (1-q)
k
= p
-r
(4.27.)
Inmultind, acum, (4.27.) cu p
r
rezulta tocmai (4.26.).
Dupa cum se vede, marimea definita de relatiile (4.24.) sau (4.25.) este nenegativa, iar
(4.26.) are loc pentru orice r pozitiv. Pentru r >0 arbitrar si 0<p<1, secventa f ( k; r, p )` poarta
numele de repartitie binominala negativa. Cand r este un intreg pozitiv, f ( k; r, p )` poate fi
interpretata ca reapartitia probabilista a timpului de asteptare pentru producerea celei de a r-a
realizari. Ea mai este numita deseori si repartitie Pascal. Pentru r=1 se reduce la repartitia
geometrica pq
k
`.
Exemplul 4.3.6. (Problema lui Banach, comunicata de H. Steinhaus ).
Un anume matematician poarta totdeauna o cutie cu chibrite in buzunarul din dreapta al
hainei si una in cel din stanga. Cand vrea sa aprinda un chibrit, el alege o cutie la intamplare,
alegerile succesive constituind, astfel, extrageri de tip Bernoulli cu p =
1
2
. Sa presupunem ca la
inceput, in fiecare cutie, au fost N bete de chibrit si sa consideram momentul in care
matematicianul respectiv descopera, pentru prima oara, ca o cutie este goala. In acel moment,
cealalta cutie poate contine 0, 1, 2, . . . , N chibrituri si fie u
r
probabilitatile corespunzatoare. Sa
identificam o realizare cu o alegere a cutiei din buzunarul stang. Matematicianul va descoperi
122
ca in buzunarul stang are o cutie goala intr-un moment cand cutia din buzunarul drept contine
exact r bete daca si numai daca realizarea N+1 este precedata de N-r nerealizari. Probabilitatea
acestui eveniment este f(N-r; N+1, 1/2). Cum acelasi rationament se aplica pentru cutia din
buzunarul drept, rezulta ca probabilitatea cautata este
u
r
= 2f(N-r;N+1,
1
2
2
) =
|
\

|
.
|
N r
N
2
-2N+r
(4.28.)
Valorile numerice pentru cazul N=50 sunt date in tabelul urmator
r ur Ur
0 0.079589 0.079589
2 0.079589 0.159178
3 0.078785 0.237963
4 0.077177 0.315140
5 0.074790 0.389931
6 0.067902 0.529506
7 0.063568 0.593073
8 0.058783 9.651855
9 0.053671 0.705527
10 0.048363 0.753890
11 0.042989 0.796879
12 0.037676 0.834555
13 0.032538 0.867094
14 0.027676 0.894770
15 0.023171 0.917941
16 0.019081 0.937022
17 0.015447 0.952469
18 0.012283 0.964752
19 0.009587 0.974338
20 0.007338 0.981676
21 0.005504 0.987180
22 0.004041 0.991220
23 0.002901 0.994121
24 0.002034 0.996155
25 0.001392 0.997547
26 0.000928 0.998475
27 0.000602 0.999077
28 0.000379 0.999456
29 0.000232 0.999688

123
4.4. Repartitia multinomiala
Repartitia binomiala poate fi generalizata, fara greutate , la cazul a n probe repetate in
mod independent, unde fiecare proba poate avea unul sau mai multe rezultate. Sa notam prin E
1
,
. . . , E
r
rezultatele posibile ale fiecarei probe si sa presupunem ca probabilitatea realizarii lui E
i

in fiecare proba este p
i
( i = 1, . . . , r ). Pentru r = 2 avem probe Bernoulli, in general, numerele
p
i
nu sunt supuse decat conditiei
p p
r 1
1 + + = . . . , p
i
> 0 (4.29.).
Rezultatul a n probe este o secventa de tipul E
2
E
1
E
3
. . . Probabliltatea ca in n probe E
1
sa
apara de k
1
ori, E
2
sa apara de k
2
ori, etc., este

r
k
r
k k k
r
p p p p
k k k
n
...
! !... !
!
3 2 1
3 2 1
2 1
(4.30.)
Aici k
i
sunt intregi arbitrari nenegativi care satisfac conditia
k k k n
r 1 2
+ + + = ... (4.31.).
Daca r = 2, atunci (4.30.) se reduce la repartitia binominala cu p
1
=p, p
2
=q, k
1
=k, k
2
=n-k.
Relatia (4.30.) poarta numele de repartitie multinominala deoarece membrul drept este
termenul general al dezvoltarii multinominale a polinomului , , p p
r
n
1
+ + ... . Principala sa aplicatie
se intalneste la modelele bazate pe schema bilei intoarse cand elementele se clasifica in mai
mult decat doua categorii ( de exemplu, clasificarea indivizilor dupa profesii).

Exemplul 4.4.1.
Aruncand 12 zaruri, care este posibilitatea de a obtine fiecare fata de doua ori?
Evenimentele E
1
, . . . , E
r
reprezinta cele sase fete , k
i
sunt, fiecare, egali cu 2, iar fiecare p
i
este
egal cu
1
6
. Rezulta, deci, , , , , , , 12 2 6 00034
6 12
! . ...

=
Exemplul 4.4.2. ( Selectie) .
Fie o populatie cu N elemente impartita in subclasele E
1
, . . . , E
r
de volum, respectiv, N
p1
,
. . . , N
pr
. Repartitia multinominala da probabilitatile diferitelor combinatii posibile a unei selectii
repetate de volum n luata din aceasta populatie.
Exemplul 4.4.3. (Probe Bernoulli multiple)..
Doua secvente de probe Bernoulli cu probabilitatile p
1
, q
1
pentru realizari si p
2
, q
2
pentru
nerealizari (sau insuccese), pot fi considerate ca un experiment compus cu patru rezultate
posibile, in fiecare proba, adica combinatiile (R,R), (R,I), (I,R), (I,I). Presupunerea ca cele doua
secvente initiale sunt independente, poate fi exprimata in felul urmator: probabilitatile celor
patru rezultate sunt p
1
p
2
,, p
1
q
2
., q
1
p
2
, si q
1
q
2
respectiv. Daca k
1
, k
2
, k
3
, k
4
sunt patru intregi de
suma n, probabilitatea ca in n probe (RR) sa apara de k
1
ori , (RI) de k
2
ori, etc., este

n
k k k k
p q p q
k k k k k k k k
!
! ! . ! !
1 2 3 4
1 1 2 2
1 2 3 4 1 3 2 4
+ + + +


124
4.5. Repartitia normala. Teorema limita De Moivre-Laplace.
In acest paragraf, vom introduce doua functii deosebit de importante.
Definitia 4.5.1. Functia definita prin
, ,
, ,
g x e
x
=

1
2
1
2
1
2
2
t
(4.32.)
se numeste functia densitate normala; iar integrala sa
, ,
, ,
N x e dy
x
y
=

}
1
2
1
2
1
2
2
t
(4.33.)
poarta numele de functie de repartitie normala.
Graficul functiei g(x) este o curba descrescatoare, simetrica fata de axa coordonatelor,
avand forma de clopot, asa cum se observa in figura 4.4.1

0,5 (x)
0,4


0,3
0,2 0,399

0,1

0 0,242

-3 -2 -1 0,67 0,67 1 2 3 x
50% din arie

68,3% din arie

95,6% din arie

99.7 % din arie


Fig. 4.1

Precizam ca s-au folosit unitati de masura diferite pe cele doua axe: maximum functiei g(x) este
aproximativ , , 2 0399
1
2
t

= . , astfel ca intr-un sistem cartezian obisnuit curba y=g(x) va fi mai
turtita.
125
Lema 4.5.1. Domeniul marginit de graficul functiei g(x) si axa xx are aria egala cu
unitatea, adica
g x dx ( ) =

+
}
1. (4.34.)
Demonstratie. Se observa ca
, ,
g x dx g x g y dxdy e dxdy
x y
( ) ( ) ( )

+
+

+
} } } } }

(
(
= =
2 1
2
1
2
2 2
t
.
Dar aceasta integrala dubla poate fi exprimata in coordonate polare astfel

1
2
1
0
2
1
2
0
1
2
0
1
2
0
2 2 2
t
u
t
d e r dr e r dr e
r r r
} } }



= = = ,
ceeace dovedeste lema.
Din definitia 4.5.1 si lema 4.5.1 rezulta ca N(x) creste tot timpul de la 0 la 1. Graficul ei
(figura 4.4.2.) este o curba in form de S cu
N(-x)=1-N(x) (4.35)


N(x)

1
0.9

0.8
0.7

0.6

0,5
0.4
0.3

0.2
0.1
-3 -2 -1 -0.67 0 0.67 1 2 3 x


Fig.4.2.


126
Prezentam in tabelul 4.6 de mai jos, doar ca orientare, valori ale lui N(x) pentru x pozitiv, N(-x)
obtinandu-se din (4.35.).


t

g(t)

N(t)

0.0 0.398942 0.500000
0.1 0.396952 0.539828
0.2 0.391043 0.579260
0.3 0.381388 0.617911
0.4 0.368270 0.655422
0.5 0.352065 0.691462
0.6 0.333225 0.725747
0.7 0.312254 0.758036
0.8 0.289692 0.788145
0.9 0.266085 0.815940
1.0 0.241971 0.841345
1.1 0.217852 0.864334
1.2 0.194186 0.884930
1.3 0.171369 0.903200
1.4 0.149727 0.919243
1.5 0.129518 0.933193
1.6 0.110921 0.945201
1.7 0.094049 0.955435
1.8 0.078950 0.964070
1.9 0.065616 0.971283
2.0 0.053991 0.977250
2.1 0.043984 0.982136
2.2 0.035475 0.986097
2.3 0.028327 0.989276
2.4 0.022395 0.991802
2.5 0.017528 0.993790
2.6 0.013583 0.995339
2.7 0.010421 0.996533
2.8 0.007915 0.997445
2.9 0.005953 0.998134
3.0 0.004432 0.998650
3.1 0.003267 0.999032
3.2 0.002384 0.999312
127
3.3 0.001723 0.999517
3.4 0.001232 0.999663
3.5 0.000873 0.999767
3.6 0.000612 0.999841
3.7 0.000425 0.999892
3.8 0.000292 0.999928
3.9 0.000199 0.999952
4.0 0.000134 0.999968
4.1 0.000089 0.999979
4.2 0.000059 0.999987
4.3 0.000039 0.999991
4.4 0.000025 0.999995
4.5 0.000016 0.999997
Tabelul 4.6

In multe situatii este convenabil sa se cunoasca o estimare elementara pentru 1-N(x) cand
x este suficient de mare. Are loc astfel
Lema 4.5.2. Cand x
1-N(x) ~
1
2
1
2
1
2
2
( ) t x
e
x
; (4.36.)
mai exact, pentru fiecare x>0 are loc dubla inegalitate

, ,
, ,
, ,
x
e x N
x x
e
x x
1
2
1
1
1 1
2
1
2 2
2
1
2
1 3
2
1
2
1

< <
(


t t
(4.37.)

Demonstratie. Se poate verifica, prin diferentiere, ca
, , , ,
| ]dy y e
x
e
x
y x
2
2
1
2
1
2
1
2
1
1
2
1 1
2
1
2 2
+ =
}


t t

iar integrantul din membrul drept este mai mare decat integrantul din
, ,
1
1
2
1
2
1
2
2
=

}
N x e dy
y
x
( )
t

ceeace dovedeste a doua inegalitate din (4.37.). Prima inegalitate urmeaza in acelasi fel, folosind
drept un nou integrant e
y
y

1
2
4
2
1
3
[ ] care este mai mic decat e
y
1
2
2
.
Observatie. Termenul functie de repartitie este folosit in literatura matematica pentru
functii nedescrescatoare de variabila x care tind la 0 cand x- si la 1 cand x . In statistica
128
se mai intalneste si termenul functie de repartitie cumulativa, dar adjectivul cumulativ este
abuziv.
Functia densitate este o functie nenegativa f(x) a carei integrala extinsa peste intreaga axa
a x-ilor este egala cu unitatea. Integarala de la - la x a oricarei functii densitate este functie de
repartitie.
Functia de repartitie normala este numita adesea repartitie gaussiana , dar ea a fost
folosita in teoria probabilitatilor, mai intai, de DeMoivre si Laplace. Daca se schimba originea si
unitatea de masura, atunci N(x) se transforma in N
x a
b

|
\

|
.
|
; aceasta functie se numeste functie
de repartitie normala cu media a si dispersia b
2
.
Sa notam prin S
n
numarul realizarilor in n probe Bernoulli, o realizare avand
probabilitatea p. Atunci, b(k;n,p) este probabilitatea evenimentului ca S
n
=k. In practica
intereseaza, in mod obisnuit, probabilitatea evenimentului ca numarul realizarilor sa se gaseasca
intre doua limite fixate initial o si |. Daca o si | sunt intregi si o < |, atunci acest eveniment
este definit prin egalitatea o | s s S
n
, iar probabilitatea sa este

| ] , , , , , , P S b n p b n p b n p
n
o | o o | s s = + + + + , , , , ... , , 1 (4.38.)
Aceasta suma poate sa aiba multi termeni, astfel ca o evaluare directa, in mod obisnuit,
nu este posibila. Din fericire, ori de cate ori n este mai mare, se poate folosi functia de repartitie
normala pentru a obtine aproximari simple ale probabilitatii (4.38.). Aceasta descoperire se
datoreste lui DeMoivre
5)
si Laplace
6)
. Dupa cum se va vedea, importanta sa depaseste domeniul
calculului numeric.
Scopul principal pe care-l urmarim este de a obtine o formula asimptotica pentru
termenul general
b k n p
n
k n k
p q
k n k
( , , )
!
!( )!
=


. (4.39.)
Aceasta necesitate se impune datorita dificultatilor considerabile pe care le ridica calculul
lui b(k;n,p) din formula (4.39.). O astfel de formula a fost gasita, mai intai, de DeMoivre (in
1730) pentru cazul special cand p=q=1/2. Ulterior, Laplace a generalizat acest rezultat pentru p
arbitrar diferit de 0 si 1. Se obtine, astfel, urmatoarea teorema limita.
Teorema limita DeMoivre-Laplace.
Daca probabilitatea de aparitie a unui eveniment E in n probe independente este
constanta si este egala cu p (0<p<1) atunci, probabilitatea b(k;n,p), ca in fiecare dintre probe,
evenimentul E sa apara de k ori satisface relatia
b(k;np):
1
2
1
2
2
tnpq
e
x

(4.40.)
cand n, uniform in m, cand x variaza intr-un interval finit, unde x=(k -np)(npq)
-1/2
.


5)
Abraham DeMoivre (1667-1754). The doctrine of chance (1718).
129
Demonstratie.
Mai intai, pentru calculul factorialilor din (4.40.) vom folosi formula lui Stirling
n!~(2t)
1/2
n
n+1/2
e
-n
(unde am folosit semnul ~ pentru a indica faptul ca raportul celor doi
membri tinde la 1 cand n). Apoi, din expresia lui x, tinem seama ca
2
1
2
1
) npq ( x nq k n
si
) npq ( x np k
=
+ =
(4.41.)
Din formulele (4.41.) urmeaza ca, daca x ramane marginit de doua constante arbitrare a si b
atunci, atat k cat si n-k tind la infinit cand n. Revenind la (4.39.) obtinem succesiv

) k n (
2
1
) k n (
2
1
k
2
1
k
2
1
n
2
1
n
2
1
e ) k n ( ) 2 ( )! k n (
e k ) 2 ( ! k
e n ) 2 ( ! n

+

+
t ~
t ~
t ~

de unde rezulta

k n k
n
2
1
) k n ( k
n
) k n ( k 2
n
)! k n ( ! k
! n

t
~

.
Astfel, probabilitatea b(k;n,p) devine

k n k
k n k n
2
1
) k n ( k
q p n
) k n ( k 2
n
) p , n ; k ( b

t
~ . (4.42.)
Sa consideram, acum, al doilea factor din (4.42.) pe care il vom calcula trecand la logaritmi si
tinand seama de formulele (4.41.)

(
(

|
|
.
|

\
|


(
(

|
|
.
|

\
|
+
(

+ =
=

=
= |
.
|

\
|

+ |
.
|

\
|
=
(
(

|
.
|

\
|

|
.
|

\
|
=

2
1
2
1
2
1
2
1
k n k k n k
k n k
k n k n
nq
p
x 1 ln ) npq ( x nq
np
q
x 1 ln ) npq ( x np
nq
k n
ln ) k n (
np
k
ln k
k n
nq
ln
k
np
ln
k n
nq
k
np
ln
) k n ( k
q p n
ln

Dar, in conditiile impuse, cantitatile
2
1
np
q
x
|
|
.
|

\
|
si
2
1
nq
p
x
|
|
.
|

\
|
pot fi arbitrar de mici pentru n
suficient de mare, astfel ca pentru cei doi logaritmi se poate folosi dezvoltarea in serie Taylor a
logaritmului natural

6)
Pierre Simon de Laplace (1749-1827). Thorie analytique des probabilits (1812).
130
). 1 1 ( ...,
4
1
3
1
2
1
) 1 ln(
4 3 2
< < + + = + t t t t t t
Marginandu-ne la primii doi termeni obtinem
|
.
|

\
|
+
|
|
.
|

\
|
=
(
(

|
|
.
|

\
|
+
2 / 3
2
2
1
2
1
n
1
O
np
qx
2
1
np
q
x
np
q
x 1 ln
Si .
n
1
O
nq
px
2
1
nq
p
x
nq
p
x 1 ln
2 / 3
2
2
1
2
1
|
.
|

\
|
+
|
|
.
|

\
|
=
(
(

|
|
.
|

\
|

Atunci
.
n
1
O
nq
p
px
2
1
np
q
qx
2
1
x x
2
1
n
1
O
nq
px
) npq ( x
2
1
nq
p
) npq ( x
nq
px
nq
2
1
nq
p
xnq
np
qx
) npq ( x
2
1
np
q
) npq ( x
np
qx
np
2
1
np
q
xnp
) k n ( k
q p n
ln
2 / 3
2
1
3
2
1
3 2 2
2 / 3
2
2
1
2
1
2
1
2
2
2
1
2
2
1
2
1
2
1
2
2
2
1
k n k
k n k n
|
.
|

\
|
+
|
|
.
|

\
|

|
|
.
|

\
|
+ =
= |
.
|

\
|
+
|
|
.
|

\
|
+
|
|
.
|

\
|
+
+ +
|
|
.
|

\
|
+
|
|
.
|

\
|
=


Dar, cum am mai precizat, cantitatile
2
1
np
q
|
|
.
|

\
|
si
2
1
nq
p
|
|
.
|

\
|
pot fi arbitrar de mici pentru n suficient de
mare, astfel ca, in final
.
n
1
O x
2
1
) k n ( k
q p n
ln
2 / 1
2
k n k
k n k n
|
.
|

\
|
+ =

.
Prin urmare, urmatoarea relatie se pastreaza uniform in x in orice interval finit de variatie a lui x

2
x
k n k
k n k n
2
e
) k n ( k
q p n


sau
. 1 e :
) k n ( k
q p n
2
x
k n k
k n k n
2


Mai ramane de calculat primul factor din (4.42.). Revenind, din nou, la formulele (4.41.) obtinem
=
(
(
(
(

+
=
(

t
2
1
2
1
2
1
2
1
) npq ( x nq ) npq ( x np
n
) k n ( k 2
n
(4.43)
131
2
1
2
1
2
1
2
1
nq
p
x 1
np
q
x 1
1
) npq (
1
(
(
(
(
(
(
(

(
(

|
|
.
|

\
|

(
(

|
|
.
|

\
|
+
= .
Al doilea factor din (4.43.) tinde la 1 cand n, in mod uniform, in fiecare interval finit de
variatie al lui x. Prin urmare,

2
1
2
1
) npq (
1
) k n ( k 2
n

t
,
si, in final, cand n rezulta

, ,
2
x
2
1
2
e
npq 2
1
) p , n ; k ( b

t

Sau
, ,
1 e
npq 2
1
: ) p , n ; k ( b
2
x
2
1
2

t


ceea ce dovedeste teorema.
Exemplul 4.5.1.
Sa se determine b(k;n,p) pentru n=10000, k=40, p=0.005. Din teorema DeMoivre-
Laplace avem

, ,
, ,
2
2
1
npq
np k
2
1
2
1
e
npq 2
1
) p , n ; k ( b
|
|
|
.
|

\
|

t
~ .
In cazul de fata
05 . 7 ) 75 , 49 ( ) npq (
2
1
2
1
~ =
iar
42 . 1
) npq (
np k
2
1
~

.
Prin urmare,

, ,
2
) 42 . 1 (
2
1
2
e
2 05 . 7
1
) p , n ; k ( b

t
~ .
Din tabele rezulta pentru functia
132

2
x
2
1
2
e
) 2 (
1
) x (

t
=
valoarea 0.1456, asa incat
0206 . 0
05 . 7
1456 . 0
) p , n ; k ( b ~ ~ .
Pe de alta parte, calculul probabilitatii b(k;n,p) cu formula (4.39.) da valoarea (cu patru zecimale
exacte)
b(k;n,p)~0.0197.
Dupa cum se vede aproximarea data de teorema limita DeMoivre-Laplace este, putem
spune, surprinzator de buna.
Este normal sa ne intrebam, inca, cat de buna este aproximarea probabilitatii b(k;n,p) in
cazul datorat lui DeMoivre, adica p=q=1/2. Vom raspunde la aceasta intrebare prin exemplul
urmator.
Exemplul 4.5.2.
Fie, deci, p=q=1/2 si sa luam acele valori ale lui n pentru care este posibil sa avem x
nk
=1.
Spre exemplu, pentru n=25 sau 100 sau 400 sau 1156, se obtine x
nk
=1 daca m=15, 55, 210 sau,
respectiv, 595. Conform teoremei limita DeMoivre-Laplace raportul

, ,
1 e
npq 2
1
: ) p , n ; k ( b
2
x
2
1
2
nk

t


cand n . In acelasi timp diferenta celor doua expresii tinde la 0 cand n. In tabelul de mai
jos sunt prezentate rezultatele calculului. Pentru simplificarea scrierii notam impartitorul de mai
sus prin

, ,
2
1
nk
npq
) x (
.
n b(k;n,p)
, ,
2
1
nk
npq
) x (
b(k;n,p)-
, ,
2
1
nk
npq
) x (
b(k;n,p):
, ,
2
1
nk
npq
) x (

25 0.09742 0.09676 0.00063 1.0065
100 0.04847 0.04839 0.00008 1.0030
400 0.024207 0.024194 0.000013 1.0004
1156 0.014236 0.014234 0.000002 1.0001

Tabelul 4.7.
Cu notatia din exemplul de mai sus pentru (x), se obtine pentru b(k;n,p) aproximarea de
forma urmatoare
) x ( ) npq ( ) p , n ; k ( b
k
2
1
~

(4.44.)
133
Introducand notatia o
k
=k-np, sa presupunem ca n si k in asa fel incat 0
n
k

o
si
0
n
2
3
k

o
. In mod evident, ultima conditie o implica pe prima si este similara cu conditia
0
n
x
2
1
3
k
. Avem astfel
Teorema 4.5.1. Daca n si k in asa fel incat 0
n
x
2
1
3
k
atunci, are loc (4.44.). Cu
alte cuvinte, exista doua constante A si B astfel incat

2
1
3
1 k
k
2
1
n
x B
n
A
1
) (x (npq)
p) n, b(k; +

+ <

.
In figura 4.5.3. se da o ilustrare a teoremei 4.5.1. pentru cazul n=4, p=0.2 si unde npq este doar
1.6
F
F
F
F 0,3
F
F 0,2
F
F 0,1
F
F
0 1 2 3 4 5 6
Fig. 4.3

Chiar si in acest caz extrem de nefavorabil aproximatia este surprinzator de buna. Astfel,
valorile probabilitatii b(k;10,0.2) pentru k=0,1,...,6 sunt, respectiv, 0.1074; 0.2684; 0.3020;
0.2013; 0,0880; 0.0264; 0.0055; iar aproximatiile corespunzatoare ) x ( ) npq (
k
2
1

sunt: 0.0904;
0.2307; 0.3154; 0.2307; 0.0904; 0.0189; 0.0021. [In fi gura 4.5.3., functia in scara da
probabilitatile b(k;10,1/5) a k realizari in 10 probe Bernoulli cu p=1/5. Curba continua da, pentru
fiecare intreg k, aproximatia normala corespunzatoare] .
In mod direct, teorema 4.5.1. conduce la aproximatii simple pentr u suma (4.38.). Daca
0 x ) npq ( si 0 x ) npq (
3
2
1
3
2
1

|

, (4.45.)
atunci (4.44.) ramane neschimbata pentru toti termenii din (4.38.) si, prin urmare,
134
)] x ( ... ) x ( ) x ( [ ) npq ( ] S [ P
1
2
1
n | + o o

+ + + ~ | s s o . (4.46.)
Partea dreapta este o suma Riemann care aproximeaza o integrala [deoarece
|
|
.
|

\
|

|
|
.
|

\
|
+
2
1
k
2
1
k
x N x N
reprezinta aria triunghiului cu baza
2
1
k
2
1
k
) npq (
2
1
x x ) npq (
2
1
x

+ < <
si marginit in partea superioara de tangenta la curba y=(x) in x=x
k
, iar ) x ( ) npq (
k
2
1

reprezinta
aria dreptunghiului cu aceeasi baza].
Este interesant, deci, de cercetat cat de buna este aceasta aproximare.
In virtutea teoremei valorii medii exista o valoare t
k
astfel incat
, , , , ); t ( ) npq ( x N x N
k
2
1
1 k 1 k
=

+


2
1
k k
2
1
k
) npq (
2
1
x t ) npq (
2
1
x

+ < < . (4.47.)
Atunci,

, ,
(

|
|
.
|

\
|

|
|
.
|

\
|
=
+

2
1
k
2
1
k
x t
2
1
k
2
1
x N x N e ) x ( ) npq (
2
k
2
k
.
Fie, acum, un c>0 arbitrar. Daca conditiile (4.45.) au loc atunci, pentru orice osks| si n suficient
de mare, se obtine

(

+ < + =

2
1
k
2
1
k k k k
2
k
2
k
) npq (
4
1
x ) npq ( x t x t
2
1
x t
2
1

de unde rezulta

(

|
|
.
|

\
|

|
|
.
|

\
|
< <
(

|
|
.
|

\
|

|
|
.
|

\
|
+
c

+
c
2
1
k
2
1
k
k
2
1
2
1
k
2
1
k
x N x N e ) x ( ) npq ( x N x N e (4.48.)
Sumand dupa k, se gaseste ca raportul dintre membrul drept din (4.46.) si
|
|
.
|

\
|

|
|
.
|

\
|
o + |
2
1
2
1
x N x N
tinde la 1. S-a obtinut, astfel, o noua varianta a teoremei limita DeMoivre-Laplace.
Teorema 4.5.2. (A doua varianta a teoremei limita DeMoivre-Laplace). Daca o si |
variaza astfel incat conditiile (4.45.) se realizeaza, atunci
P[o s S
n
s |] ~ N x N x
| o +
|
\

|
.
|
|
\

|
.
|
1
2
1
2
(4.49.)
unde x
k
=(k-np)(npq)
-1/2
.
135
Altfel spus, diferenta relativa dintre cei doi membrii ai expresiei (4.49.) tinde la zero
odata cu x npq
|
3
1
2
( )

si x npq
o
3
1
2
( )

.
In particular, (4.49.) se pastreaza daca o si | sunt marginiti de valori pentru care x
o
si x
|

raman intr-un interval fixat. Ne vom referi ulterior la cazul in care o si | sunt atat de mari incat
conditiile (4.45.) nu sunt indeplinite.
Se foloseste (4.49.), in aplicatii statistice, in mod obisnuit intr-un interval in care |x
o
| si
|x
|
| nu sunt mai mari de 3 sau 4. In aplicatii teoretice, adesea este necesar sa se foloseasca (4.49.)
pentru intervale (o,|) pentru care atat x
o
cat si x
|
sunt mari. In asemenea cazuri, ambii membrii
din (4.49.) sunt mici si este important sa se stie ca raportul lor este apropiat de 1, iar diferenta lor
tinde la zero.
O forma mai simpla a teoremei limita 4.5.2. se obtine daca, in loc de S
n
se introduce
numarul redus de realizari definit prin

2
1
n
n
) npq (
np S
S

=
-
. (4.50.)
Aceasta se reduce la masurarea abaterilor lui S
n
fata de np in unitati de (npq)
1/2
.
Cantitatea np se numeste media lui S
n
, iar (npq)
1/2
, abaterea patratica medie a sa. [Aceasta vor fi
introduse in capitolul 11 ].
Inegalitatea osS
n
s| inseamna, acum, x
o
s
-
n
S sx
|
, in timp ce (4.49.) exprima faptul ca,
pentru x
o
<x
|
, fixati si arbitrari,

|
|
|
.
|

\
|

|
|
|
.
|

\
|
+ ~ s s

o

| |
-
o
2
) npq (
x N
2
) npq (
x N ] x S x [ P
2
1
2
1
n
. (4.51.)
Dar (npq)
-1/2
0 cand n, astfel ca membrul drept tinde la N(x
|
)-N(x
o
). Am ajuns astfel la
urmatoarea varianta mai slaba a relatiei (4.49.).
Corolarul 4.5.1. Pentru fiecare o<| fixati
, , , , a N b N b] S P[a
n
s s
-
. (4.52.)
Relatia (4.52.) reprezinta forma clasica a teoremei limita a lui Laplace. Omiterea lui
2
) npq (
2
1

in relatia (4.51.) introduce o eroare care tinde la zero cand n, dar care are, in
schimb, o influenta considerabila cand npq are o valoare potrivita.
Principalul fapt evidentiat de (4.52.) este ca, pentru un n mare, probabilitatea din partea
stanga este in mod practic independenta de p. Aceasta ne permite sa comparam fluctuatiile in
serii diferite de probe Bernoulli simple, uzand de unitatile la care ne-am referit mai inainte.
Observatie. Din punct de vedere istoric, (4.52.) este prima teorema limita in teoria
probabilitatilor. Din punct de vedere modern, ea este numai un caz extrem de special al teoremei
limita centrala. [ Nu insistam aici asupra acestei chestiuni]. In statistica, (4.52.) este folosita ca o
136
aproximatie chiar cand npq este relativ mic, cazuri in care este necesara o estimare a erorii. De
fapt, in multe cazuri, eroarea din (4.44.) este mica in comparatie cu eroarea comisa inlocuind
suma din (4.46.) prin integrala. [Aceasta eroare poate fi evitata prin folosirea formulei Euler -
MacLaurin]. Serge Bernstein a consacrat o serie de articole cercetarii erorii in cazul general si a
discutat modul in care sa se modifice defini tia lui x
t
pentru a imbunatati convergenta in (4.49.).
De asemenea, este important de retinut ca teoremele de aproximare sunt valabile numai
daca numarul n de probe este fixat anterior, independent de rezultatul probelor. Daca la un joc de
noroc un jucator se opreste la un moment care-i este favorabil, ultimul sau castig nu poate fi
apreciat dupa aproximarea normala pentru ca, acum, durata jocului depinde de sansa. Pentru
fiecare n fixat este foarte improbabil ca S
n
sa fie mare. Insa, intr-o serie lunga de probe chiar cel
mai improbabil lucru nu poate sa nu se produca, astfel ca intr-un joc continuu este practic sigur
ca
-
n
S are o secventa maxima ca ordin de marime.
Exemplul 4.5.3.
Fie p=1/2, n=200, o=95, |=105. Aici P[95sS
n
s105] poate sa fie interpretata ca
probabilitatea ca, in 200 de aruncari ale unei monede, numarul de aparitii ale valorii are o abatere
de cel mult 5 fata de 100. Se are h=(50)
-1/2
=0.141421... si -x
o-1/2
=x
|+1/2
=(5.5)(npq)
-1/2
=0.7778...
Din tabele se obtine 56331 . 0 x N x N
2
1
2
1
=
|
|
.
|

\
|

|
|
.
|

\
|
o + |
... Valoarea adevarata (obtinuta, de
asemenea, din tabele) este 0.56325... Eroarea este neinsemnat de mica, dar aceasta numai
datorita faptului ca in intervalul in discutie integrala supraestimeaza suma din (4.46.), in timp ce
aproximarea (4.44.) subestimeaza fiecare termen.
Exemplul 4.5.4.
Fie p=1/10, n=500, o=50, |=55. Valoarea corecta este P[50sS
n
s55]=0.317573... Cum
(npq)
-1/2
=(45)
-1/2
=0.1490712... se obtine aproximarea N(5,5(npq)
-1/2
)-N(0,5(npq)
-1/2
)=0.3235...
Eroarea este de aproape 2%.
Exemplul 4.5.5.
Sa se gaseasca un numar a astfel incat, pentru un n mare, inegalitatea |
-
n
S |>a sa aiba o
probabilitate apropiata de . Pentru aceasta este necesar ca N(a)-N(-a)=1/2 sau N(a)=3/4. Din
tabelele care dau repartitia normala se obtine ca a=0.6745 si, deci, cele doua inegalitati
|S
n
-np|<0.6745(npq)
1/2
si |S
n
-np|>0.6745(npq)
1/2

sunt aproape egal probabile. In particular, probabilitatea ca, in n aruncari ale unei monede,
numarul de aparitii ale valorii sa fie situat intre limitele
2
1
n 337 . 0
2
n
este aproape . In mod
similar, se obtine aceeasi probabilitate ca in n aruncari ale unui zar, numarul de aparitii ale fetei 1
sa fie situat in intervalul
2
1
n 251 . 0
6
n
. Probabilitatea ca S
n
sa se gaseasca intre limitele
2
1
) npq ( 2 np este aproape N(2)-N(-2)=0.9545...; iar ca sa se gaseasca intre limitele
2
1
) npq ( 3 np este 0.9973...
137
In final, ne vom referi la cazul cand abaterile sunt mari. In mod frecvent este de dorit ca
numarul redus de realizari
-
n
S (conform 4.50.) sa depaseasca un numar dat x. Deci limita
superioara a intervalului este infinita, ceea ce necesita un rationament special pentru a arata ca
teorema limita inca se aplica.
Teorema 4.5.3. Daca n si t variaza ca o functie de n in asa fel incat x, iar
0 ) npq ( x
2
1
3

, atunci
P[S
n
*
> x] ~ 1-N(x) (4.53.)
Tinand seama de (4.36.) aceasta este echivalenta cu
P[S
n
*
> x] ~
1
x
x ( ) (4.54.)
Demonstratie. Sa alegem intregii o si | in (4.49.) astfel incat x sa fie intre x
o
si x
o+1
, iar
x
|
~x
o
+lnx. Atunci 0 ) npq ( x
2
1
3

|
si (4.49.) ramane, in continuare, adevarata. Prin urmare,
P[o < S
n
< |] ~ [1-N(x
o
)] - [1-N(x
|
)] .
Dar, din (4.36.) si din faptul ca x
|
~x
o
+ln x
o
, rezulta ca 1-N(x
|
) este de un ordin de
marime mai mic decat 1-N(x
o
), in timp ce 1-N(x
o
)~1-N(x
|
). Deci
P[o < S
n
< |] ~ 1-N(x) . (4.54.)
Pe de alta parte, din (4.44.) si (4.7.) se obtine
) (
1
) (
1
) , ; ( ] [
|
|
|
|
|
|
| x
pqx
x
npq
n
x
p n b
np
n
S P
n
= ~

s > .
Dar 1/(pq) fiind o constanta, iar
) x ( N 1 ) x (
x
1
| |
|
~ ,
urmeaza ca membrul drept tinde la zero mai repede decat 1-N(x), ceea ce inseamna ca ] S [ P
n
| >
este de un ordin de marime mai mic decat 1-N(x). Acest rezultat, asociat cu (4.54.), conduce la
concluzia ca ) x ( N 1 ] S [ P
n
~ o >
ceea ce dovedeste teorema.








138
CAPITOLUL 5
Elemente de teoria selectiei

OBIECTIVE

Notiunile de baza ale statisticii matematice (populatie, selectie, valori tipice(empirice) de
selectie) sunt prezentate impreuna ca exemple de natura practica. Datele statistice vor fi
caracterizate cu ajutorul reprezentarilor grafice (poligonul frecventelor, h istograma).

La sfarsitul acestui capitol, studentii trebuie sa-si insuseasca:
- Caracteristici numerice de selectie
- Functia de repartitie de selectie
- Reprezentari grafice

5.1 Selectie. Repartitie empirica.

Colectivitate (populatie) statistica o multime de elemente (indivizi) ce au in comun o
proprietate, o trasatura.
Caracteristica unei populatii statistice este proprietatea, trasatura care se studiaza din punct de
vedere statistic la populatia aflata in studiu.
Caracteristica se asimileaza cu o variabila aleatoare numita teoretica si notata X. Legile de
repartitie, valorile tipice ale caracteristicii X se numesc legi de repartitie teoretice respectiv
valorile tipice teoretice.
Selectia (esantion, sondaj) este o colectivitate partiala obtinuta prin extragerea la intamplare din
populatia statistica a unui numar n limitat de indivizi si masurarea lor din punctul de vedere al
caracteristicii studiate. Numarul n reprezinta volumul selectiei.
Selectia repetata individul extras din populatie si supus masurarii din punct de vedere al
caracteristicii studiate se reintroduce in colectivitate inainte de a se extrage urmatorul.
Selectia nerepetata cazul contrar selectiei repetate.Daca volumul n al selectiei este foarte mic
in raport cu volumul populatiei aflat in studiu nu se mai fac distinctii intre cele doua tipuri de
selectie.
Intr-o selectie realizata, valorile :
observate (masurate) pe indivizii selectiei pot fi considerate ca valori a n variabile aleatoare
independente :
avand aceiasi repartitie teoretica cu cea a caracteristicii X studiate. Variabilele :
se numesc variabile de selectie.
n 2 1
x ,..., x , x
n 2 1
X ,..., X , X
n 2 1
X ,..., X , X
139
Frecventa absoluta v
i
a valorii x
i
, obtinuta intr-o selectie realizata de volum n, reprezinta
numarul de aparitie a valorii x
i
in cadrul selectiei realizate.
Frecventa relativa f
i
a valorii x
i
, obtinuta intr-o selectie realizata de volum n, reprezinta raportul
dintre frecventa absoluta v
i
corespunzatoare valorii x
i
si volumul n al selectiei,
Frecventa absoluta respectiv relativa cumulata a valorii x
i
obtinuta intr-o selectie de volum n
reprezinta suma frecventelor absolute, respectiv relative corespunzatoare
valorilor
deci
respectiv
Descrierea si sistematizarea datelor de selectie se face prin asa zisa repartitie a selectiei numita
repartitie empirica a variabilei de selectie sau a variabilei empirice
notata cu
Se disting urmatoarele modalitati de definire a repartitiei empirice :
i)
daca volumul n al selectiei nu este prea mare si toate valorile x
i
ale variabilei de selectie sunt
distincte, fiecare avand aceiasi frecventa relativa

ii)
cu

n
f
i
i
v
=
i j
x x <
_
<
i j
x x j;
j

_
<
i j
x x j;
j
f
*
X
|
|
|
|
.
|

\
|
n
1
n
x
...
n
1
2
x
n
1
1
x
*
X
|
|
.
|

\
|
n 2 1
f f f
n
x
...
2
x
1
x
*
X
n
f
i
i
v
=
k 1, i = _
=
=
k
1
1 f
i
i
n
k
1 i
i
=
_
=
k 1, i
i
i 1 i *

] a , [a
X
=

|
|
.
|

\
|
140
iii)
in cazul in care valorile rezultate in urma unei selectii realizate,sunt situate intr-un interval [a,b]
al axei reale.
In acest caz se considera o impartire a intervalului [a,b] in r subintervale de lungime egala cu h,

iar frecventa absoluta reprezinta in acest caz numarul valorilor x
i
ale variabilelor de selectie ce
cad in
O reprezentare mai putin exacta a repartitiei empirice
in acest caz, poate fi si :

unde :
sau
Functia empirica de repartitie
se defineste pentru fiecare
ca raportul
dintre numarul

) a [a,
1
) a , [a
2 1
b) , [a
1 - k
) a , [a
3 2
h a b ... a a a a
1 k 3 2 1
= = = =

) a , [a
i 1 i
*
X
k 1, i
i
i *

c
X
=
|
|
.
|

\
|
2
1 i i
i
a a
c
+
=

k 1, i
i
i *

c
X
=
|
|
.
|

\
|
n
f
i
i
v
=
(x) F
*
n
J e x
n
(x)
n
(x)
n
141
de valori x
i
din selectie mai mici decat x si volumul n al selectiei. Functia empirica de repartitie
reprezinta suma frecventelor relative a valorilor x
i
care cad la stanga lui x, adica frecventa
relativa a evenimentului
-pentru
avem
-pentru

cu
avem
-pentru


avem
x X
*
<
n
(x)
(x) F
n
*
n
=
|
|
|
|
.
|

\
|
n
1
n
x
...
n
1
2
x
n
1
1
x
*
X

>
= s s

s
=

n
i i
i
n
x x
n i x x x
n
i
x x
F
, 1
, 2 , ,
1
, 0
1
*
|
|
.
|

\
|
n 2 1
f f f
n
x
...
2
x
1
x
*
X
n
f
i
i
v
= k 1, i =
n
k
1 i
i
=
_
=
_
=
=
k
1
1 f
i
i
k 1, i
*
X
i
i 1 - i

] a , [a
=
|
|
.
|

\
|

>
= s s
s
=

=
_
n
i i
i
j
j
i
n
x x
k i x x x f
x x
F
, 1
, 2 , ,
, 0
1
1
1
*
142

-pentru
avem

Reprezentarea grafica

1. Reprezentarea in batoane
Se masoara pe axa absciselor valorile x
i
ale variabilelor de selectie, iar in dreptul fiecarei v alori x
i

se ridica cate o perpendiculara de lungime egala cu f
i
(respectiv v
i
) corespunzatoare valorii x
i.

2. Poligonul frecventelor absolute (respectiv relative)
Pe axa absciselor se masoara valorile x
i
, iar pe axa ordonatelor valorile frecventelor absolute v
i

(respectiv relative f
i
). Unind punctele (x
i,
v
i
) (respectiv (x
i,
v
i
)) se obtine poligonul frecventelor.

3. Histograma
Se utilizeaza in cazul in care valorile de selectie obtinute sunt situate intr-un interval [a,b], cand
se impune gruparea valorilor x
i
obtinute pe subintervale (clase)
de lungimi egale.
Pe axa absciselor se considera subintervale
de lungimi egale cu h. Pe fiecare subinterval
considerat ca baza, se ridica un dreptunghi a carui latura (inaltime) este egala cu
respectiv

= >
= = s s

+
= s
=

=
_
k
i i i i i
i
i
j
j n
a b x
a a cuh k i a x a f
h
a x
f
a a x
F
, 1
, , 2 , ,
, 0
1 1
1
1
1
0
*

= >
= s s
s
=

=
_
b a x
k i a x a f
a x
F
k
i i
i
j
j n
, 1
, 2 , ,
, 0
1
1
1
*
) a , [a
i 1 - i
] a , (a
i 1 - i
] a , (a
i 1 - i
h

i
, ,
k 1, i
i
f
c *
X
=
2
a a
c
i 1 i
i
+
=

n
f
i
i
v
=
143
In acest fel, aria unui dreptunghi va fi v
i
respectiv f
i
.
Pentru o selectie de volum mare, conturul superior al histogramei, ne ofera o imagine suficient
de exacta a graficului densitatii de repartitie teoretice
a variabilei aleatoare (caracteristicii) teoretice X.

5.2 Valori tipice (empirice) de selectie.
Momentul initial (empiric) de selectie de ordin r,(corespunzator cu repartitia empirica a lui

(1)


(2)


(3)

Media (empirica) de selectie

(4)

(5)
(6)
h
f
i
(x)
*
X
_
=
=
n
1 i
r
i
*
r
X
n
1
m
_ _
= =
= =
k
1 i
r
i i
k
1 i
r
i i
*
r
X f X
n
1
m
_ _
= =
= =
k
1 i
r
i i
k
1 i
r
i i
*
r
c f c
n
1
m
_
=
= = =
n
1 i
i
*
1
*
X
n
1
X m m
_
=
= = =
n
1 i
i i
*
1
*
X f X m m
_
=
= = =
n
1 i
i i
*
1
*
c f
n
1
X m m
144
Mediana

Este valoarea caracteristicii care imparte volumul n al selectiei in doua parti egale si se noteaza
cu
Daca n=2k+1 atunci

iar daca n=2k atunci
sau x
k+1
sau
Modul sau moda

Este valoarea caracteristicii pentru care frecventa corespunzatoare este maxima si se noteaza cu
Momentul centrat (empiric) de selectie de ordinul r,

(corespunzator cu repartitia empirica a lui X
*
)

(7)
(8)

(9)

Dispersia de selectie

(10)
*
e
m
1 k
*
e
x m
+
=
k
*
e
x m =
2
x x
k 1 k
+
+
*
0
m
*
r e
_
=
=
n
1 i
r
i
r
*
) X (X
n
1

_ _
= =
= =
n
1 i
r
i i
n
1 i
r
i i
r
*
) X (X f ) X (X
n
1

_ _
= =
= =
n
1 i
r
i i
n
1 i
r
i i
r
*
) X (c f ) X (c
n
1

145

(11)
(12)


Exista si alte moduri de a defini dispersia de selectie si anume

(13)

(14)

(15)

daca media teoretica m=M(X) este cunoscuta.

(16)

pentru selectii de volum n<=50.
Raportul
se numeste corectia lui Bessel si avem

_
=
= =
n
1 i
2
i
2 *
2
) X (X
n
1
S
_
=
= =
n
1 i
2
i i
2 *
2
) X (X f S
_
=
= =
n
1 i
2
i i
2 *
2
) X (c f S
_
=
=
n
1 i
2
i
2
*
m) (X
n
1
S
_
=
=
k
1 i
2
i i
2
*
m) (X f S
_
=
=
k
1 i
2
i i
2
*
m) (c f S
_
=
=
n
1 i
2
i
2
) X (X
1 - n
1
S
1 - n
n
146
din relatiile (10) si (16).

Proprietati:
Pentru valorile empirice (1),(4),(10) avem urmatoarele propri etati:





Asimetria
Se noteaza
A*
cu si se defineste prin:


Excesul:
Se noteaza cu E
*
si are formula:

Excesul masoara gradul de turtire al poligonului frecventelor relative.

2 2
S
1 - n
n
s =
r r
m ) M(m =
n
m m
) (m D
2
r 2r *
r
2

=
m ) X M( =
n

(X) D
n
1
) X ( D
2
2 2
= =
2 2

n
1 - n
) M(S =
n
3
n
) 2 2(
-
n

) (S D
2
2 4
2
2
2 41
2
2 4 2 2

+

=
m) X ( S m) X ( ) X (X
n
1
S
2
*
n
1 i
2 2
i
2
= =
_
=
_
=
=
n
1 i
3
i
3
*
3 *
) X (X
nS

A
3 ) X (X
1
3
S

E
n
1 i
4
i
4 4
*
4 *
= =
_
=
nS
147
5.3 Aplicatii.

1. Intr-un studiu statistic al rezultatelor obtinute la examenul de matematica de studentii
anului I ai unei Facultati de Stiinte Economice, s-a ales o grupa formata din 35 de studenti.
Mentionand ca pentru cei absenti de la examen, s-a convenit nota 0, situatia notelor
obtinute la examenul de matematica este prezentata in tabelul de mai jos:

Nota(xi) 0 1 2 3 4 5 6 7 8 9 10
Nr.
Studenti(vi)
3 0 0 2 5 3 5 5 6 3 3

Sa se determine:
a) frecventa relativa a fiecarei note;
b) repartitia variabilei empirice;
c) functia empirica de repartitie si graficul sau;
d) poligonul frecventelor relative;
e) media si dispersia de selectie.

Solutie :

a)
n=35



b)

n
f
i
i
v
=
0,10 i =
35
3
n

f
0
0
= =
0
n

f
1
1
= = 0
n

f
2
2
= =
35
5
n

f
6
6
= =
35
5
n

f
4
4
= =
35
2
n

f
3
3
= =
35
3
n

f
5
5
= =
35
6
n

f
8
8
= =
35
5
n

f
7
7
= =
35
3
n

f
9
9
= =
35
3
n

f
10
10
= =
1,10 i
i
i *
f
x
X
=
|
|
.
|

\
|
|
|
.
|

\
|
35
3
35
3
35
6
35
5
35
5
35
3
35
5
35
2
0 0
35
3
10 9 8 7 6 5 4 3 2 1 0
X
*

148
c)













0 10




>
= s s
s
=

=
_
k
i i
i
j
j n
x x
k i x x x f
x x
F
, 1
, 2 , ,
, 0
1
1
1
1
*

>
s <
s <
s <
s <
s <
s <
s <
s <
s <
s <
s
=
10 , 1
10 9 , 35 / 32
9 8 , 35 / 29
8 7 , 35 / 23
7 6 , 35 / 18
6 5 , 35 / 13
5 4 , 35 / 10
4 3 , 35 / 5
3 2 , 35 / 3
2 1 , 35 / 3
1 0 , 35 / 3
0 , 0
*
x
x
x
x
x
x
x
x
x
x
x
x
F
n
i
x
*
n
F
149
0,20






0,00 11

d)



2. Din productia de becuri a unei intreprinderi, s -au extras la intamplare 200 de becuri, care au
fost testate pentru a afla numarul de ore de functionare. Datele obtinute au fost grupate pe
intervale de timp de cate 20 de ore si sunt date in tabelul urmator :

Timp de
functionare
( ti-1, ti)
1340
1360
1360
1380
1380
1400
1400
1420
1420
1440
1440
1460
1460
1480
1480
1500
1500
1520
1520
1540
Nr de
becuri ( vi)
3 17 30 35 50 24 18 15 7 1

Sa se determine:
a) Repartitia variabilei empirice ;
b) Functia empirica de repartitie;
c) Histograma si poligonul frecventelor relative.

Solutie:
a) Datele de selectie fiind grupate pe intervala de lungime 20 de ore repartitia variabilei de
selectie X
*
o vom da sub forma

03 , 6
35
211
) 3 10 3 9 6 8 5 7 5 6 3 5 5 4 2 3 (
35
1
x f x
n
1
X
10
0 i
i i
10
0 i
i i
~ = + + + + + + + = = =
_ _
= =
] ) 03 , 6 10 ( 3 ) 03 , 6 9 ( 3 ) 03 , 6 8 ( 6 ) 03 , 6 7 ( 5 ) 03 , 6 6 ( 5
) 03 , 6 5 ( 3 ) 03 , 6 4 ( 5 ) 03 , 6 3 ( 2 ) 03 , 6 0 ( 3 [
35
1
) (x
n
1
2 2 2 2 2
2 2 2 2
n
0 i
i i
2
+ + + + +
+ + + + = =
_
=
X S
150

unde



este mijlocul intervalului



b) Pentru repartitia data anterior, functia de repartitie este:



Graficul lui
1,10 i
i
i *
f
x
X
=
|
|
.
|

\
|
2
t t
c
i 1 i
i
+
=

] t , [t
i 1 i

>
= s s
s
=

=
_
10
i 1 i
1 i
1 j
j
1
*
n
c x 1,
2,10 i , c x c , f
c x 0,
F

>
s <
s <
s <
s <
s <
s <
s <
s <
s <
s
=
1530 , 1
1530 1510 , 200 / 1999
1510 1490 , 200 / 192
1490 1470 , 200 / 177
1470 1450 , 200 / 159
1450 1430 , 200 / 135
1430 1410 , 200 / 85
1410 1390 , 200 / 50
1390 1370 , 200 / 20
1370 1350 , 200 / 3
1350 , 0
F
*
n
x
x
x
x
x
x
x
x
x
x
x
) ( F
*
n
x
|
|
.
|

\
|
200
1
200
7
200
15
200
18
200
24
200
50
200
35
200
30
200
17
200
3
1530 1510 1490 1470 1450 1430 1410 1390 1370 1350
X
*
151
este o functie in scara:










O reprezentare mai exacta a lui 1350 1510
se poate obtine considerand repartitia

caz in care avem:

) ( F
*
n
x
|
|
.
|

\
|
i
i i *

a , [a
X

>
= s s +
s
=

=
_
b
a
x 1,
2,10 i , a x a ,
h
a - x
f f
x 0,
F
i 1 i
1 - i
i
1 i
1 j
j
*
n

>
s < +
s < +
s < +
s < +
s < +
s < +
s < +
s < +
s < +
s <
s
=
1540 , 1
1540 1520 ), 20 / ) 1520 (( ) 200 / 1 ( ) 200 / 199 (
1520 1500 ), 20 / ) 1500 (( ) 200 / 7 ( ) 200 / 192 (
1500 1480 ), 20 / ) 1480 (( ) 200 / 15 ( ) 200 / 177 (
1480 1460 ), 20 / ) 1460 (( ) 200 / 18 ( ) 200 / 159 (
1460 1440 ), 20 / ) 1440 (( ) 200 / 24 ( ) 200 / 135 (
1440 1420 ), 20 / ) 1420 (( ) 200 / 50 ( ) 200 / 85 (
1420 1400 ), 20 / ) 1400 (( ) 200 / 35 ( ) 200 / 50 (
1400 1380 ), 20 / ) 1380 (( ) 200 / 30 ( ) 200 / 20 (
1380 1360 ), 20 / ) 1360 (( ) 200 / 17 ( ) 200 / 3 (
1360 1340 ), 20 / ) 1340 (( ) 200 / 3 (
1340 , 0
F
*
n
x
x x
x x
x x
x x
x x
x x
x x
x x
x x
x x
x
*
n
F
i
x
152


Graficul acestei functii de repartitie se obtine din graficul frecventelor relative cumulate printr-o
translatie.

c)


0,30





0,00

1340 1520
Unind mijloacele laturilor de sus dreptunghiurilor se obtine poligonul frecventelor relative fata
de repartitia

de la punctul a).
















1,10 i
i
i *
f
c
X
=
|
|
.
|

\
|
153

CAPITOLUL 6
Elemente de teoria estimatiei

OBIECTIVE
Estimarea parametrilor teoretici ca apar in diverse tipuri de repartitii statistice se face prin
trei metode fundamentale: a momentelor, a verosimilitatii maxime, a intervalelor de incredere.
Aceste estimari vor fi facute pe baza datelor de selectie obtinute in urma studiului
caracteristicilor populatiei date.

La sfarsitul acestui capitol, studentii trebuie sa-si insuseasca:
- Tipuri de estimatii ale parametrilor
- Metode de estimare ale parametrilor

6.1 Estimatii.Tipuri de estimatii.

Consideram o populatie de volum mare si o caracteristica asociata populatiei aflatain studiu
static.Valoriile caracteristicii X sunt repartizate dupa legea unei variabile aleatoare teoreticii
necunoscute si pe care incercam sa la cunoastem prin folosirea unei variabile de
selectie(empirice ) X
*
.
In multele situatii legea de repartie teoretica se intuieste cu ajutorul reprezantariilor grafice
atasate variabile de selectie X
*
si depinde de anumiti parametrii a caror valori sunt necunoscute.
Operatia prin care se evalueaza parametrii necunoscutii ai legii de repartee teoretice se
numeste estimarea parametriilor si ea se face pe baza unei selectii de volum n efectuata din
populatie pe care este considerate variabila X cu legea specifcara care contine parametrul ce
trebuie estimat.
Statistica definita univoc de variabilele de selectie a carei valoare ptr o selectie efectuata
reprezinta o aproximatie a valorii parametrului din legea de repartitie teoretica
a populatiei generale ,se numeste estimatia punctuala a parametrului .
Tipuri de estimatii
Estimatie nedeplasata

) X ,..., X , (X T
n 2 1 n
) X ,..., X , (X T
n 2 1 n
.
) F(x,
) X ,..., X , (X T
n 2 1 n
.
154
este o estimatie nedeplasata a parametrului din repartitia teoretica daca :
1)
2)

Estimatia deplasata
1)

2)

3)
(deplasarea estimatiei).
Daca B
n
>0,atunci
.
este pozitiv deplasata fata de
Daca B
n
<0,atunci
.
este negativ deplasata fata de

Estimatia absoluta corecta
1)

2)
(nedeplasata)

3)


Estimatie corecta
1)

< = -
.
)) X ,..., X , (X M(T )T )M( (
n 2 1 n n
< -
.
) )M( (
) M( =
.
) M( B
n
=
.
< -
. .
) ( D ), )M( (
2
) M( =
.
=
.
n , )) X ,..., X , (X (T D ) ( D
n 2 1 n
2 2
< -
. .
) ( D ), )M( (
2
155
2)

3)


Estimatie consistenta
Avem
adica
converge in probabilitatea catre .

Propozitia 1: Daca statistica
este o estimatie a parametrului nedeplasata sau deplasata cu
si daca
atunci estimatia este o estimatie consistenta.

Teorema 1 (Rao-Cramer)
Daca
este o estimatie nedeplasata a parametrului din repartitia teoretica a variabilei X atunci,
unde

se numeste cantitatea de informatie pe o observatie.
+ = =
.
n 0, ) ( cu ) ( )) X ,..., X , (X M(T ) M(
n n n 2 1 n

.
n , 0 ) ( D
2
0 ) ( >
1 ) ) X ,..., X , (X T P( lim
n 2 1 n
n
= <

) X ,..., X , (X T
n 2 1 n
=
.
) X ,..., X , (X T
n 2 1 n
=
.
0 ) - ) M(( lim B lim
n
n
n
= =
.

0 ) ( D lim
2
n
=
.

) X ,..., X , (X T
n 2 1 n
=
.
) I( n
1
) (T D
n
2
u
>
(

c
c
=
(

c
c
=
2
2
2
) (x, ln
M
) (x, ln
M ) I(
u u
156
Conditiile de regularitate necesare aplicarii inegalitatii lui Rao-Cramer sunt:
1)multimea valorilor lui formeaza un interval ( a,b ) al axei reale ;
2)

3)

4)
o estimatie nedeplasata a lui avem :

5)

Egalitatea in inegalitatea Rao-Cramer are loc in cazul in care ) (x, verifica ecuatia

Estimatia eficienta sau de minima dispersie este o estimatie nedeplasata
a lui pentru care

si

Eficienta estimatiei
a lui este raportul,
b) (a, ) ( , ) (x,

e <
c
c
b) (a, ,

dF
dF

e
c
c
=
c
c
} }
.
) (
} }
=
c
c
=
c
c
. .
1 dF

dF


b) (a, ) ( , ) (x, ln

M
2
e <
(

c
c
| ] N(x) ) A( ) - (x) L ) ( A ) (x, ln
/
+ + = u
) X ,..., X , (X T
n 2 1
* *
n
=
) ( I n
1
) ( D
*
2

=
_
=
n
i?1
i
*
) L(x
n
1

) X ,..., X , (X T
n 2 1 n
=
.
157

unde
este estimatia eficienta a lui si avem

Daca
atunci estimatia
a lui se numeste asimptotic eficienta.

Proprietate
Orice estimatie eficienta este si consistenta.

Estimatia suficienta
este o estimatie suficienta a parametrului daca
1)
(
.
este estimatia corecta)

2)


Propozitia 2.
(1) Media de selectie
) (T D
I(( n
1
) ( D
) ( D
) (T e ) ( e
m
2
2
* 2
n n n

= = =
.
.
*

1 ) (T e 0
n n
s <
1 ) (T e
n n

n
) X ,..., X , (X T
n 2 1 n
=
.
) X ,..., X , (X T
n 2 1 n
=
.
+ = =
.
n 0, ) ( ), ( )) X ,..., X , (X T M( ) M(
n n n 2 1 n

+
= =
.
n 0, ) ( ,
) I( n
)) ( (1
) (T D ) ( D
n
2 /
m
n
2 2
158

obtinuta printr-o selectie de volum n dintr-o populatie cu caracteristica X este o estimatie
nedeplasata a mediei teoretice m=M(X) a caracteristicii.
(2) Dispersia de selectie
obtinuta printr-o selectie de volum n,dintr-o populatie cu caracteristica X este o estimatie
deplasata a dispersiei teoretice



(3) Dispersia de selectie
obtinuta printr-o selectie de volum n, dintr-o populatie cu caracteristica X este o estimati
nedeplasata a dispersiei teoretice

(4) Daca media teoretica m=M(X) a caracteristicii X este cunoscuta atunci dispersia de selectie
obtinuta printr-o selectie de volum n,dintr-o populatie cu caracteristica X este o estimatie
nedeplasata a dispersiei teoretice

6.2 Metode de determinare a estimatiilor.

Metoda momentelor

Consideram ca pentru caracteristica X aflata sub cercetare statistica, functia de frecventa (in
cazul discret) respectiv densitatea de repartitie (in cazul continuu) este
_
=
=
n
1 i
i
x
n
1
x
_
=
=
n
1 i
2
i
2
) x - x (
n
1
s
(X) D
2 2
=
_
=
=
n
1 i
2
i
2
) x - x (
n
1
s
n

- B ,
n

- ) s ( M
2
n
2
2 2
= =
(X) D
2 2
=
2 2
) s ( M =
_
=
=
n
1 i
2
i
2
*
m) - x (
n
1
s
2

2 2
*
) s ( M =
159
si depinde de s parametrii
ce trebuiesc estimati.
Presupunand ca exista si sunt finite momentele initiale pana la ordinul s ale variabilei teoretice
X, metoda momentelor consta in urmatoarele:
(1)Se calculeaza primele s momente de selectie:
sau
sau

(2)Se considera sistemul de s ecuatii:

(3)Daca ecuatiile sistemului sunt independente functional, atunci rezolvand sistemul in raport cu


se obtin solutiile:


ce constituie estimatii ale parametrilor


) , ... , ; X ( f
s 2 1
s 2 1
, ... ,
_
=
=
n
1 i
r
i
*
r
x
n
1
m
_ _
= =
= =
k
1 i
r
i
k
1 i
r
i i
*
r
x f x
n
1
m
_ _
= =
= = =
k
1 i
r
i i
k
1 i
r
i i
*
r
s 1, r , c f c f
n
1
m
s 1, r ), x ,..., x , (x m m ) ,..., , ( m ) M(x m
n 2 1
*
r
*
r s 2 1 r
r
r
= = = = =
s 2 1
, ... , ,
s 2 1
, ... , ,
s r , 1 ), X ,..., X , (X )) X ,..., X , (X m ),..., X ,..., X , (X (m
n 2 1
r
n 2 1
*
s n 2 1
*
1
r r = = =
. . .
u u u
160
Metoda verosimilitatii maxime

Functia de verosimilitate
unde
reprezinta densitatea de probabilitate in cazul continuu sau functia de frecventa in cazul discret,
pentru caracteristica X asociata unei populatii aflata in studiu statistic.
Functia de verosimilitate reprezinta densitatea de repartitie respectiv functia de frecventa pentru
vectorul aleator
corespunzator unei selectii de volum n.
Valoarea
a parametrului care se obtine se numeste estimatie de verosimilitate maxima a
parametrului din legea teoretica.
Valoarea lui
depinde de valorile variabilelor de selectie
deci
Maximul functiei
are loc pentru aceiasi valoare a lui care asigura maximul functiei


Deci estimatia de verosimilitate maxima se obtine ca solutie a ecuatiei:

Ecuatia de mai sus se numeste ecuatie de verosimilitate maxima.

Etape :
(1) Se construieste functia de verosimilitate:
) ; (x ) ; x ,..., x , (x P
i
n
1 i
n 2 1 [
=
=
) ; (x o
n 2 1
X , ... , X , X
*

n 2 1
X , ... , X , X
) X , ... , X , X (
n 2 1
* *
=
) ; x , ... , x , x ( P
n 2 1
) ; x , ... , x , x ( P ln
n 2 1
0

) ; x ( P ln

) ; x , ... , x , x ( P ln
n
1 i
1 n 2 1
=
c
c
=
c
c
_
=
*

161
(2)Se calculeaza:

(3) Se considera ecuatia de verosimilitate maxima

(4)Se rezolva ecuatia de la punctul (3) in raport cu .
Solutia
obtinuta este o estimatie de verosimilitate maxima.
(5)Se verifica daca
(conditia de maxim).

Teorema2.
Orice estimatie eficienta verifica ecuatia verosimilitatii maxime.
Daca densitatea de probabilitate sau functia de frecventa
depinde de s parametrii, metoda verosimilitatii consta in urmatoarele:
(1)Se construieste functia de verosimilitate:
(2)Se logaritmeaza functia de verosimilitate:
(3)Se considera sistemul de s ecuatii:

(4)Se rezolva sistemul de la punctul (3) si se obtin solutiile
care sunt estimatii asimptotic eficiente ale parametrilor
[
=
=
n
1 i
i i n 2 1
) ; (x ) ; x , ... , x , x ( P
_
=
=
n
1 i
i n 2 1
) ; (x ln ) ; x , ... , x , x ( P ln
(*) 0,

) ; (x ln

) ; x , ... , x , x ( P ln
n
1 i
i
n 2 1
=
c
c
=
c
c
_
=
) X ,..., X , (X
n 2 1
* *
=
0 ) ; X ,..., X , (X P d
*
n 2 1
2
<
) ,..., , (x,
s 1 1
[
=
=
n
1 i
s 2 1 i s 2 1 n 2 1
) ,..., , ; (x ) ,..., , ; x , ... , x , x ( P
_
=
=
n
i 1
s 2 1 i s 2 1 n 2 1
) ,..., , ; (x ln ) ,..., , ; x , ... , x , x ( P ln
_
=
s s =
c
=
c
c
n
1 i j
s 2 1 i
j
s 2 1 n 2 1
s(**) j 0,1

) ,..., , ; (x ln

) ,..., , ; x , ... , x , x ( P ln
*
s
*
2
*
1
, ... , ,
162

Teorema3.
(a) Ecuatia de verosimilitate maxima ( * ) are o solutie


care pentru valori mai mari ale lui n, este repartizata normal cu media m = si dispersia


(b) Sistemul de ecuatii (**) are o solutie
care pentru valori mari ale lui n este repartizata normal cu media
si o matrice de covarianta:

Matricea de covarianta a unui vector aleator se defineste astfel:



Metoda intervalelor de incredere
Metoda intervalelor de incredere de estimare a parametrului dintr-o repartitie teoretica a
caracteristicii X, da posibilitatea de a indica un interval despre care se poate afirma cu o
probabilitate cunoscuta ca acopera valoarea parametrului u estimat.
Sa presupunem ca efectuand o selectie
s 2 1
, ... , ,
2
2

) (x, ln
M n
1
I(( n
1

c
c

=
) X ,..., X , (X
n 2 1
* *
=
) ,..., , (
*
s
*
2
*
1
) ,..., , ( ) m ,..., m , (m
s 2 1 s 2 1
=
s j i, ,1 )

ln
M( n
1
j i
2
s s
(
(

c c
c


...
) (X D )..... X , cov( ).... , cov(X
.... .......... .......... .......... .......... .......... ..........
) X , cov( .... ) (X D ).... , cov(X
) X , cov( ).... , cov(X )....... (X D
c
n
2
2 2 n
n 2 2
2
2 1
n 1 2 1 1
2
(
(
(
(
(

=
n
X X
X X
X X
163
de volum n din populatia a carei lege de repartitie teoretica este
, exista doua functii de selectie

cu
astfel incat probabilitatea inegalitatii
sa nu depinda de u , adica


, unde o nu depinde deu .
Pentru o selectie realizata

u si u au valori bine determinate iar pentru foarte apropiat de 1


intervalul (

u , u ) acopera parametrul necunoscut u .


Cu cat intervalul (

u , u ) este mai mic si probabilitatea o este mai aproape de 1 cu atat avem o


indicatie mai precisa cu privire la valoarea constanta a lui u .
Daca

u si u sunt asfel incat pentru un o dat cu 0<o < 1 sa avem:


Se numeste interval de incredere pentru parametrul u .
Intervalul de incredere este un interval aleator ale carui limite depind de datele selectiei, in timp
ce parametrul u din repartitia teoretica
este o marime constanta dar necunoscuta.
Valoarea o = 1- o se numeste coeficient de incredere, iar marimea

} { X ,..., X , X
n 2 1
) (x,
) X ,..., X , X (
n 2 1

u
) X ,..., X , X (
n 2 1
u
u u <

u u u < <

o u
u
u
= < <

)) X ,..., X , (X ) X ,..., X , (X (
n 2 1 n 2 1
P
o u
u
u
= < <

1 )) X ,..., X , (X ) X ,..., X , (X (
n 2 1 n 2 1
P
) (x,
164
se numeste lungimea intervalului de incredere. Valoarea o = 1- se numeste prag de
semnificatie.
Un interval de incredere de lungime mica construit cu un coeficient de incredere mare,
estimeaza cu precizie valoarea necunoscuta a parametrului u .



6.3 Aplicatii.
1. Repartitia de selectie obtinuta ca rezultat a cantaririi a 800 de bile de otel este data in tabele
de mai jos:

(Xk-
1,
xk)
20
20,5
20,5
21
21
21,5
21,5
22
22
22,5
22,5
23
23
23,5
23,5
24
24
24,5
24,5
25
k 91 76 75 74 92 83 79 73 80 77

Presupunand ca variabila teoretica X ce reprezinta greutatea in grame a bilelor de otel cantarite
are o repartitie uniforma cu densitatea:


sa se estimeze prin metoda momentelor parametrii
2 1
, , pe baza rezultatelor celor 800 de
cantariri.

Solutie:

Estimatiile


u u

1 2
2 1

1
) , x; (

= 2 1 2 1
)], , [ x < e
2

m M(x)
2 1
1
+
= =
3

) M(x
2
1 2 1
2
1
2
+ +
=
. .
2 1
,
165
se obtin rezolvand sistemul:




Luand dispersia nedeplasata

avem




=
+ +
= =
+
*
2
2
2 2 1
2
1
*
1
2 1
m
3

m
2

x
0 3m x 4 x 2
3m ) - x (2 ) - x (2 - x 2
*
2
2
2
2
2
*
2
2
2 2
2
2 2 1
= +
= + + =
) m m ( 3 x m 3 x 4 - x x
*
2
*
1
*
2
2 2
1,2
2
= + =
.
_
=

=
n
1 i
2
i
2
) x (x
1 n
1
S
n
1) (n s
m m
2
2
*
1
*
2

=
n
1) 3(n
s x
1,2
2

=
.
n
1) 3(n
s x
1,2
1

=
.
166
Avem

Din datele problemei prezentate in tabel, rezulta


Iar s=1,44.

Obtinem astfel

iar legea de repartitie va fi

2. Sa se estimeze folosind metoda verosimilitatii maxime, parametrii m si ai repartitiei
normale pentru o selectie oarecare de volum n, stiind ca:


Solutie:
Functia de verosimilitate este:

Logaritmam:

n
1) 3(n
s x
1

=
.
n
1) 3(n
s x
2

+ =
.
0,2
1
(x) = 96) (19,98;24, x e
47 , 22 x =
98 , 19
1
=
.
u
96 , 24
2
=
.
u
0 , , e
2
1
) m, (x;
2
2
m) (x
2
1
> J e =

m
_
=
=

n
1 i
2
i
2
m) (x
2
1
n
2
n 2 1
e
) 2 (
1
) m, ; , x ,..., x , P(x
_
=
=
n
1 i
2
i
2
2 2
n 2 1
m) (x
2
1
) 2 ln(
2
ln
2
) m, ; , x ,..., x , P(x ln t
n n
2

167
Sistemul ecuatiilor de verosimilitate va fi:


Rezolvand sistemul in raport cu m si
obtinem:


Avem




este o estimatie corecta dar nu absolut corecta, caci
cu

_
= + =
c
c
_
= =
c
c
=
=
n
1 i
i
4 2 2
n
1 i
i
2
0 m) (x
2
1 1
2
n

P ln
0 m) (x

1
m
P ln
o o
_
= =
=
.
n
1 i
i
x x
n
1
m
_ _
= = =
= =
. .
n
1 i
n
1 i
2 2
i
2
i
2
) x (x
n
1
) (x
n
1
s m o
m m n
n
1
) (x
n
1
M( ) m M(
n
1 i
i
=
_
= =
=
.
2
n
1 i
2 2
i
n
1 i
2
i
2

n
1 n
) M(s ) ) x - (x
n
1
M( ) m - (x
n
1
M( ) M(

=
_
=
_
= =
= =
.
.
2
.
o
n

) M(
2
2
2
=
.
= n 0,
n

) (
2
n
2

168
3. Se cunosc rezultatele
a n=22 masuratori ale unui unghi oarecare in grade:3,1; 3,3; 2,9; 3,0; 3,1; 3,2; 2,8; 2,7; 3,1; 3,2;
2,9; 3,0; 2,9; 3,1; 2,8; 2,9; 3,2; 3,3; 2,9; 3,1; 3,2; 3,0.

a).Presupunand ca rezultatele masuratorilor urmeaza o lege normala, sa se determine un interval
de incredere 98%,(1-=0,98),pentru media m a populatiei.
b). Sa se determine intervalul de incredere pentru dispersia
Solutie
a).


Din tabela corespunzatoare functiei de repartitie a repartitiei Student cu n-1=21 grade de libertate
deducem conform cu

Intervalul de incredere va fi:
Deci m (2,9838 ;4,0798) cu o probabilitate de 0,98.

{ }
22 2 1
,..., , X X X
_
=
= =
22
1
0318 , 3
22
1
i
i
x x
_ _
= =
= =

=
22
1
22
1
2 2 2
03 03 , 0 ) (
21
1
) (
1
1
i i
i i
x x x x
n
s
831 , 2
21 ; 99 , 0 1 ; 2 / 1
= =

t t
n o
9838 , 2
47 , 0
174 , 0
831 , 2 0318 , 3
22
0303 , 0
831 , 2 0318 , 3
22
21 ; 99 , 0
~ ~
~ =
s
t x
0798 , 4
47 , 0
174 , 0
831 , 2 0318 , 3
22
0303 , 0
831 , 2 0318 , 3
22
21 ; 99 , 0
~ + ~
~ + = +
s
t x
2

169
b). Din tabela corespunzatoare a repartitiei
2
(anexa 4) cu n-1=21 grade de libertate si in baza
intervalului de incredere avem:



Deci



























897 , 8
2
0,99;21
2
1 - n /2; - 1
= =
o
932 , 38
2
0,01;21
2
1 - n /2;
= =
o
)
897 , 8
0303 , 0 21
;
932 , 38
0303 , 0 21
(
2

e o
) 07151 , 0 ; 01634 , 0 (
2
e o
170
ANEXA 1

REPARTITIA NORMALA


Z 0,00 0,01 0,02 0,03 0,04
0,0 0,00000 0,00399 0,00798 0,01197 0,01595
0,1 0,03983 0,04380 0,04776 0,05172 0,05567
0,2 0,07926 0,08317 0,08706 0,08095 0,09483
0,3 0,11791 0,12172 0,12552 0,12930 0,13307
0,4 0,15542 0,15910 0,16276 0,16640 0,17003
0,5 0,19146 0,19497 0,19847 0,20194 0,20540
0,6 0,22575 0,22907 0,23237 0,23565 0,23891
0,7 0,25804 0,26115 0,26424 0,26730 0,27035
0,8 0,28814 0,29103 0,29673 0,29673 0,29955
0,9 0,31594 0,31859 0,32381 0,32381 0,32639
1,0 0,34134 0,34357 0,33614 0,34849 0,35083
1,1 0,36433 0,36650 0,36864 0,37076 0,37286
1,2 0,38493 0,38686 0,38877 0,39065 0,39251
1,3 0,40320 0,40490 0,40658 0,40824 0,40988
1,4 0,41924 0,42073 0,42220 0,42364 0,42507
1,5 0,43319 0,43448 0,43574 0,43699 0,43822
1,6 0,44520 0,44630 0,44738 0,44845 0,44950
1,7 0,45543 0,45637 0,45728 0,45818 0,45907
1,8 0,46407 0,46485 0,46562 0,46638 0,46712
1,9 0,47128 0,47193 0,47257 0,47320 0,47381
2,0 0,47725 0,47784 0,47831 0,47882 0,47932
2,1 0,48214 0,48257 0,48300 0,48341 0,48382
2,2 0,48610 0,48645 0,48679 0,48713 0,48745
2,3 0,48928 0,48956 0,48983 0,49010 0,49036
2,4 0,49180 0,49202 0,49224 0,49245 0,49266
2,5 0,49379 0,49306 0,49413 0,49430 0,49446
2,6 0,49534 0,49547 0,49560 0,49573 0,49585
2,7 0,49653 0,49664 0,49674 0,49683 0,49693





171
ANEXA 2

FUNCTIA DE REPARTITIE STUDENT CU N GRADE DE LIBERTATE

F n 0,70 0,80 0,90 0,95 0,99 0,999
1 1,963 3,074 6,314 12,706 63,657 636,619
2 1,380 1,886 2,920 4,303 9,925 31,598
3 1,250 1,638 2,359 3,182 5,841 12,941
4 1,190 1,533 2,132 2,776 4,604 8,610
5 1,156 1,476 2,015 2,571 4,032 6,859
6 1,134 1,440 1,943 2,447 3,707 5,959
7 1,119 1,415 1,895 2,365 3,499 5,405
8 1,108 1,397 1,860 2,306 3,355 5,041
9 1,100 1,383 1,833 2,262 3,250 4,781
10 1,093 1,372 1,812 2,228 3,169 4,587
11 1,088 1,363 1,796 2,201 3,106 4,437
12 1,083 1,356 1,782 2,179 3,055 4,318
13 1,079 1,350 1,771 2,160 3,012 4,221
14 1,070 1,345 1,761 2,145 2,977 4,140
15 1,074 1,341 1,753 2,131 2,947 4,073
16 1,071 1,337 1,746 2,120 2,921 4,015
17 1,069 1,333 1,740 2,110 2,898 3,965
18 1,067 1,330 1,734 2,101 2,978 3,992
19 1,066 1,328 1,729 2,093 2,861 3,883
20 1,064 1,325 1,725 2,086 2,845 3,850
21 1,063 1,323 1,721 2,080 2,831 3,819
22 1,061 1,321 1,717 2,074 2,819 3,792
23 1,060 1,319 1,714 2,069 2,807 3,767
24 1,059 1,318 1,711 2,064 2,797 3,745
25 1,058 1,316 1,708 2,060 2,787 3,725
26 1,058 1,315 1,706 2,056 2,779 3,707
27 1,057 1,314 1,703 2,052 2,771 3,690
28 1,056 1,313 1,701 2,048 2,763 3,674
29 1,055 1,311 1,699 2,045 2,756 3,659
30 1,055 1,310 1,697 2,042 2,750 3,646
40 1,050 1,303 1,684 2,021 2,704 3,551
60 1,046 1,296 1,617 2,000 2,660 3,460
120 1,041 1,289 1,658 1,980 2,617 3,373
1,046 1,282 1,645 1,960 2,576 3,291
172
ANEXA 3

REPARTITIA HI-PATRAT


n/ 0,990 0,975 0,950 0,90
0
0,10
0
0,05
0
0,025 0,010 0,001
1 0,0316 0,0398 0,023
9
0,01
58
2,71 3,84 5,02 6,63 10,83
2 0,02 0,05 0,10 0,21 4,60 5,99 7,38 9,21 13,82
3 0,12 0,22 0,35 0,58 6,25 7,81 9,35 11,24 16,27
4 0,30 0,43 0,71 1,06 7,78 9,49 11,1 13,28 18,46
5 0,55 0,83 1,15 1,61 9,24 11,0
7
12,8 15,09 20,5
6 0,87 1,24 1,64 2,20 10,6
4
12,5
9
14,0 16,81 22,5
7 1,24 1,69 2,17 2,83 12,0
2
14,0
7
16,0 18,47 24,3
8 1,65 2,18 2,73 3,49 13,3
6
15,5
1
17,5 20,09 26,1
9 2,09 2,70 3,33 4,17 14,6
8
16,9
2
19,0 21,66 27,9
10 2,56 3,25 3,94 4,86 15,9
9
18,3
1
20,5 23,21 29,6
11 3,05 3,82 4,57 5,58 17,2
7
19,6
7
21,9 24,72 31,3
12 3,57 4,40 5,23 6,30 18,5
5
21,0
3
23,3 26,22 32,9
13 4,11 5,01 5,89 7,04 19,8
1
22,3
6
24,7 27,69 34,6
14 4,66 5,63 6,57 7,79 21,0
6
23,6
8
26,1 29,14 36,1
15 5,23 6,26 7,26 8,55 22,3
1
25,0
0
27,5 30,58 37,7
16 5,81 6,81 7,96 9,31 23,5
4
26,3
0
28,8 32,00 39,3
17 6,41 7,56 8,67 10,0
8
24,7
7
27,5
9
30,2 33,41 40,8
18 7,01 8,23 9,39 10,8
6
25,9
9
28,8
7
31,3 34,40 42,3
173
19 7,63 8,91 10,1 11,6
5
27,2
0
30,1
4
32,9 36,19 43,8
20 8,26 9,59 10,9 12,4
4
28,4
1
31,4
1
34,2 37,57 54,3
21 8,90 10,3 11,6 13,2
4
29,6
1
32,6
7
35,5 38,93 468
22 9,54 11,0 12,3 14,0
4
30,8
1
33,9
2
36,8 40,29 48,3
23 10,2 11,7 13,1 14,8
5
32,0
1
35,1
7
38,1 41,64 49,7
24 10,9 12,4 13,8 15,6
6
33,2
0
36,4
1
39,4 42,98 51,2
25 11,5 13,1 14,6 16,4
7
34,3
8
37,6
5
40,6 44,31 52,6
26 12,2 13,8 15,4 17,2
9
35,5
6
38,8
8
41,9 45,64 54,1
27 12,9 14,6 16,2 18,1
1
36,7
4
40,1
1
43,2 46,96 55,5
28 13,6 14,3 16,9 18,9
4
37,9
2
41,3
4
44,5 48,28 56,9
29 14,3 16,0 17,7 19,7
7
39,0
9
42,5
6
45,7 49,59 58,3
30 15,0 16,8 18,5 20,6
0
40,2
6
43,7
7
47,0 50,89 59,7
















174
Bibliografie
1. CHUNG, K.L., Elementary Probability Theory with Stochastic Processes Springer-Verlag,
Berlin, 1974.
2. CIUCU, G., TUDOR, C., Probabilitati si Procese Stochastice, Vol. I, II, Ed. Academiei
Romane, Bucuresti, 1979.
3. CUCULESCU, I., Teoria Probabilitatilor, Ed. All, 1998.
4. FELLER, W., An Introduction to Probability Theory and its Applications, Vol. I, John
Wiley&Sons, Inc., New York, London, 1960.
5. FELLER, W., An Introduction to Probability Theory and its Applications, Vol II, John
Wiley&Sons, Inc., New-York, London, 1966.
6. GIHMAN, I.I., SKOROHOD, A.V., The Theory of Stochastic Processes I, Springer-Verlag, Berlin, 1974.
7. GIHMAN , I.I., SKOROHOD, A.V., The Theory of Stochastic Processes II, Springer-Verlag, Berlin, 1975.
8. GNEDENKO, B.V., The Theory of Probability, Mir Publishers, Moscow, 1976.
9. HALMOS, P.P., Measure Theory, Springer-Verlag, Berlin, 1974.
10. HRAULT, D., lments de thorie moderne des probabilits, Dunod, Paris, 1967.
11. IOSIFESCU, M., MIHOC, GH., THEODORESCU, R., Teoria probabilittilor si statistica
matematica, Ed. Tehnica, Bucuresti, 1966.
12. KEMENY, J.G., SNELL, J.L., Finite Markov Chains, Springer-Verlag, Berlin, 1976.
13. LOVE, M., Probability Theory, Vol. I, Springer-Verlag, New York, Heidelberg Berlin, 1977.
14. LOVE, M., Probability Theory, Vol.. II, Springer-Verlag, New York Heidelberg Berlin, 1978.
15. ONICESCU, O., MIHOC, GH., IONESCU TULCEA C.T., Calculul probabilitatilor si
aplicatii, Ed. Academiei Romane, Bucuresti, 1956.
16. ONICESCU, O., Principes de logique et de philosophie mathmatique, Ed. de lAcademie de
la Roumanie, 1971.
17. ORMAN, G.V., Teoria Probabilitatilor, Ed. Universitatii Brasov, 1977.
18. ORMAN, G.V., COCAN, A., SIMIONESCU, C., Elemente de teoria probabilitatilor si
statistica matematica, Ed. Universitatii Brasov, 1982.
19. ORMAN, G.V., Capitole de Matematici Aplicate, Ed. Albastra, Cluj-Napoca, 1999.
20. PRESTON, C., Random Fields, Springer-Verlag, Berlin, 1976.
21. ROSENBLATT, M., Random Processes, Springer-Verlag, Berlin, 1974.
22. SPITZER, F., Principles of Random Walk, Springer-Verlag, 1975.
23. VASILACHE, S., Elemente de teoria multimilor si a structurilor algebrice, Ed. Academiei
R.P.R., 1956.

Potrebbero piacerti anche