AulasET5812010 2

Notas de Aula do Curso
ET581: Probabilidade 1
Leandro Chaves Rgo, Ph.D.
2010.2
Prefcio
Estas notas de aula foram feitas para compilar o contedo de vrias referncias bibliogrcas tendo em vista o contedo programtico da disciplina ET581-Probabilidade 1 do curso de graduao em Estatstica da Universidade Federal de Pernambuco. Em particular, elas no contm nenhum material original e no substituem a consulta a livros textos. Seu principal objetivo dispensar a necessidade dos alunos terem que copiar as aulas e, deste modo, poderem se concentrar em entender o contedo das mesmas.
Recife, agosto de 2010. Leandro Chaves Rgo, Ph.D.
Contedo
Prefcio 1 Reviso Bsica de Teoria dos Conjuntos
1.1 1.2 1.3 1.4 1.5 1.6 2.1 2.2 2.3 Denio de Conjuntos e Exemplos Operaes com Conjuntos . . . . . Produto Cartesiano . . . . . . . . . Conjunto das Partes . . . . . . . . Partio . . . . . . . . . . . . . . . Funo Indicadora . . . . . . . . . Introduo . . . . . . . . . . . . Mtodos de Contagem . . . . . 2.2.1 Regra da Adio . . . . 2.2.2 Regra da Multiplicao . Aplicaes em Grafos . . . . . . 2.3.1 Grafos No Direcionados 2.3.2 Grafos Direcionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
i 1
1 4 6 7 7 8
2 Tcnicas de Contagem
. . . . . . .
. . . . . . .
. . . . . . .
10
10 10 10 11 17 17 17
3 Introduo Probabilidade
3.1 3.2 3.3 3.4 3.5
Experimento Aleatrio . . . . . . . . . . . . . . . . . . Espao Amostral . . . . . . . . . . . . . . . . . . . . . Eventos e Coleo de Eventos . . . . . . . . . . . . . . 3.3.1 Induo Matemtica . . . . . . . . . . . . . . . Frequncias Relativas . . . . . . . . . . . . . . . . . . . Axiomas de Kolmogorov . . . . . . . . . . . . . . . . . 3.5.1 Exemplos de Medidas de Probabilidade . . . . . 3.5.2 Propriedades de uma Medida de Probabilidade .
19
19 19 20 23 25 26 28 29 35 44
4 Probabilidade Condicional
4.1 4.2
Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . Independncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
ii
5 Varivel Aleatria Discreta

5.1 5.2 5.3 5.4
5.5 6.1 6.2 6.3 6.4 6.5
Introduo . . . . . . . . . . . . . . . . . . . . . . . . . Funo de Distribuio Acumulada . . . . . . . . . . . Tipos de Varivel Aleatria . . . . . . . . . . . . . . . Varivel Aleatria Discreta . . . . . . . . . . . . . . . . 5.4.1 Aleatria. . . . . . . . . . . . . . . . . . . . . . 5.4.2 Bernoulli. . . . . . . . . . . . . . . . . . . . . . 5.4.3 Binomial. . . . . . . . . . . . . . . . . . . . . . 5.4.4 Hipergeomtrica. . . . . . . . . . . . . . . . . . 5.4.5 Geomtrica. . . . . . . . . . . . . . . . . . . . . 5.4.6 Binomial Negativa ou Pascal. . . . . . . . . . . 5.4.7 Zeta ou Zipf. . . . . . . . . . . . . . . . . . . . 5.4.8 Poisson. . . . . . . . . . . . . . . . . . . . . . . Poisson como um Limite de Eventos Raros de Binomial
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
48
48 50 53 53 54 54 55 56 57 58 59 59 60 63 63 66 67 68 69 71
6 Esperana e Momentos de Variveis Aleatrias Discretas

O Conceito de Esperana . . . . . . . . . . . . . . . . . . 6.1.1 Denio da Esperana . . . . . . . . . . . . . . . Funes de Variveis Aleatrias . . . . . . . . . . . . . . Esperana de Funes de Variveis Aleatrias Discretas. Propriedades da Esperana . . . . . . . . . . . . . . . . . Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.1 Momentos Centrais . . . . . . . . . . . . . . . . .
63
Referncias Bibliogrcas
73
iii
Captulo 1 Reviso Bsica de Teoria dos Conjuntos

1.1 Denio de Conjuntos e Exemplos
Denio 1.1.1: Um conjunto uma coleo de elementos distintos1 onde os elementos
no so ordenados. Esta denio intuitiva de um conjunto foi dada primeiramente por Georg Cantor (18451918), que criou a teoria dos conjuntos em 1895. Um conjunto pode ser especicado, listando seus elementos dentro de chaves. Por exemplo,
A = {0, 1, 2, 3, 5, 8, 13}, B = {0, 1, 2, . . . , 1000}.

Alternativamente, um conjunto pode ser especicado por uma regra que determina seus membros, como em:
C = {x : x inteiro e positivo} ou D = {x : x par}.

Como em um conjunto a ordem dos elementos no importa, tem-se que:
{1, 2, 3} = {2, 3, 1}.

Se um dado elemento faz parte de um conjunto, diz-se que ele pertence ao conjunto e denota-se isso com smbolo . Por exemplo, 2 D = {x : x par} ou 3 E = {x : primo }. Por outro lado, se um dado elemento no faz parte de um conjunto, diz-se que ele no pertence ao conjunto e denota-se isso com o smbolo / . Por exemplo, 3 / D = {x : x par} ou 4 / E = {x : x primo}. preciso ter cuidado ao distinguir entre um elemento como 2 e o conjunto contendo somente este elemento {2}. Enquanto, tem-se 2 F = {2, 3, 5}, {2} / F = {2, 3, 5}, pois o conjunto contendo somente o elemento 2 no pertence F .
Estatstica comum se falar de conjuntos incluindo o caso onde seus elementos no so distintos. Por exemplo, o conjunto dos tempos de acesso a um banco de dados, o conjunto das notas de uma dada disciplina, entre outros, podem ter valores iguais, porm formalmente na teoria dos conjuntos os elementos de um conjunto devem ser distintos.
1 Na
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS Exemplo 1.1.2: Seja G = {2, {3}}. Ento, 2 G e {3} G, porm 3 / G.
O tamanho de um conjunto A, ||A||, a quantidade de elementos que ele possui, a qual chamada de sua cardinalidade. A cardinalidades pode ser nita, innita enumervel, ou innita no-enumervel. Um conjunto nito quando existe uma funo bijetiva cujo domnio igual a este conjunto e a imagem o conjunto dos inteiros no-negativos menores que um nmero nito; seus elementos podem ser contados, sendo possvel exibir seu ltimo elemento. Um conjunto innito enumervel tem exatamente a mesma quantidade de elementos que os naturais, ou seja, existe uma funo bijetiva cujo domnio igual a este conjunto e a imagem igual ao conjunto dos naturais. Um conjunto enumervel se ele for nito ou innito enumervel. Um conjunto no-enumervel se ele no for enumervel. Por exemplo, os seguintes conjuntos so enumerveis:
Nn = {0, 1, 2, . . . , n 1}, Z = {x : x um inteiro}, Z + = {x : x um inteiro positivo}, Q = {x : x racional}.

Para notar que o conjunto dos nmeros racionais enumervel considere a seguinte matriz de nmeros racionais. (Lembrando que um nmero x racional se pode ser escrito sob a forma p , onde p e q so inteiros e q = 0.) q
0/1 1/1 2/1 3/1

. . . . . .
0/2 1/2 2/2 3/2

. . . . . .
0/3 1/3 2/3 3/3

. . . .. .
Esta matriz contm todos os racionais no-negativos. Utilizando o mtodo da diagonalizao, os elementos da matriz so ordenados, sem repetio, da seguinte forma:
0/1, 1/1, 1/2, 2/1, 1/3, 3/1, . . .

Denindo-se uma correspondncia f onde para cada racional no-negativo r, f (r) representa a posio em que r aparece na sequncia acima, tem-se que f uma correspondncia 1-1 entre os racionais no-negativos e os naturais. Por exemplo, temos que f (1/2) = 3, f (3) = 6. Pode-se denir g no conjunto de todos os racionais tal que tal que g (r) = 2(f (r) 1) se r > 0, e g (r) = 2f (|r|) 1 se r 0. Desse modo, g (r) um natural par se r for um racional positivo, e um natural mpar, se r for um racional no-positivo. Portanto, g (r) uma correspondncia 1-1 entre os racionais e os naturais, o que implica que os racionais formam um conjunto enumervel.
Autor: Leandro Chaves Rgo
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS Por outro lado, os conjuntos abaixo so no-enumerveis:
I R = {x : x um nmero real}, (a, b) = {x : a < x < b}, onde a < b, [a, b] = {x : a x b}, onde a < b.
Por exemplo, o matemtico Georg Cantor mostrou que o intervalo [0, 1] no enumervel com o seguinte argumento. A prova feita por contradio. Suponha (para ns de argumentao) que o intervalo [0, 1] innito enumervel. Ento, pode-se enumerar todos os nmeros deste intervalo como uma sequncia, (r1 , r2 , r3 , . . .) (os nmeros no precisam estar em ordem). No caso de nmeros com duas expanses decimais, como 0,499 . . . = 0,500 . . ., escolhe-se aquele que acaba com noves. Suponha, por exemplo, que as expanses decimais do incio da sequncia so como se segue: r1 = 0,5376547 . . . r2 = 0,1199999 . . . r3 = 0,5347824 . . . r4 = 0,9870812 . . . r5 = 0,3451243 . . . r6 = 0,2136530 . . . r7 = 0,3200985 . . . ... Iremos agora construir um nmero real no intervalo [0, 1] que diferente de todos os nmeros na sequncia anterior, o que gera uma contradio a hiptese inicial de que esta sequncia contm todos os reais no intervalo [0, 1]. Constri-se um nmero real x dentro do intervalo [0, 1] considerando o k -simo dgito depois da vrgula da expanso decimal de rk . A partir desses dgitos ns denimos os dgitos do nmero x da seguinte forma:
se o k -simo dgito de rk 5 ento o k -simo dgito de x 4. se o k -simo dgito de rk no 5 ento o k -simo dgito de x 5.
Para o exemplo anterior, isto resultar na seguinte expanso decimal para x: x = 0,4555554 . . .. O nmero x construdo desta forma um nmero real dentro do intervalo [0, 1]. Por isso, devemos ter rn = x para algum n, uma vez que presumimos que (r1 , r2 , r3 , . . .) enumera todos os nmeros reais no intervalo [0, 1]. No entanto, por causa da maneira como foi denido o nmero x, este nmero difere na n-sima posio de rn , ento x no est na sequncia (r1 , r2 , r3 , . . .). uma consequncia direta deste resultado que o conjunto I R de todos os nmeros reais no-enumervel. Se I R fosse enumervel, poderamos enumerar todos os nmeros reais em uma sequncia, e ento obter uma sequncia enumerando [0, 1] atravs da remoo de todos os nmeros reais fora deste intervalo. Mas ns acabamos de mostrar que esta ltima lista no pode existir. Existem dois conjuntos especiais que nos interessaro. Em muitos problemas nos dedicaremos a estudar um conjunto denido de objetos, e no outros. Por exemplo, em alguns
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS 4 problemas podemos nos interessar pelo conjunto dos nmeros naturais; ou em outros problemas pelo conjuntos dos nmeros reais; ou ainda por todas as peas que saem de uma linha produo durante um perodo de 24h, etc. O conjunto que contm todos os elementos que queremos considerar chamado de conjunto universo e denotado por . Por outro lado, o conjunto especial que no possui elementos chamado de conjunto vazio e denotado por . Este conjunto tem cardinalidade 0 e portanto nito. Por exemplo,
= {} = {x : x I R e x < x} ou = (a, a).

Dois conjuntos A e B podem ser relacionados atravs da relao de incluso, denotada por A B , e lida A um subconjunto de B ou B contm A, quando todo elemento de A tambm elemento de B . Diz-se que A um subconjunto prprio de B quando se tem A B , A = , e B A. Se A subconjunto de B , ento B chamado um superconjunto de A. Diz-se que A e B so iguais se e somente se A B e B A. Se A B , ento tambm pode-se dizer que B A. A relao possui as propriedades de (i) reexividade (A A); (ii) transitividade (A B, B C A C ); e anti-simetria (A B, B A A = B ). Contudo, ela no uma relao completa, ou seja, no verdade que, para todos os conjuntos A e B , ou A B , ou B A. Tambm fcil vericar que A e A para todo conjunto A. A relao de igualdade satisfaz as seguintes propriedades: (i) reexividade (A = A); (ii) simetria (A = B B = A); e (iii) transitividade (A = B, B = C A = C ).
1.2 Operaes com Conjuntos

Queremos estudar a importante idia de combinar conjuntos dados, a m de formamos um novo conjunto. Conjuntos podem ser transformados atravs das seguintes operaes Booleanas: 1. Complementao: Ac = { : / A}. Observe que de acordo com esta denio, para todo e todo conjunto A, no existe outra opo alm de A ou Ac , alm disso no pode ser verdade que A e Ac simultaneamente. 2. Unio: A B = { : A ou B } 3. Interseco: A B = { : A e B } 4. Diferena: A B = A B c = { : A e / B} Se A B = , ento A e B no tem nenhum elemento em comum, e ns dizemos que A e B so disjuntos.
Exemplo 1.2.1: Seja = {0, 1, 2, 3, 4, 5, 6, 7}, A = {0, 1, 5} e B = {1, 2, 3, 4}. Ento segue
que Ac = {2, 3, 4, 6, 7}, A B = {0, 1, 2, 3, 4, 5}, A B = {1}, A B = {0, 5}.
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS 5 Exemplo 1.2.2: Sejam A, B, C e D subconjuntos do conjunto universo tal que AB = , C D = , A C e B D. Prove que A = C e B = D. Soluo: Basta provar que C A e D B . Seja C , ento como C D = , tem-se que / D. Logo, como B D, segue que / B . Mas como A B = , tem-se que A. Portanto, C A. Para provar que D B , seja D, ento como C D = , tem-se que / C . Logo, como A C , segue que / A. Mas como A B = , tem que B . Portanto, D B . Relaes e propriedades das operaes Booleanas incluem as seguintes: 1. Idempotncia: (Ac )c = A ou seja, (Ac )c A. Agora suponha que A, ento / Ac , o que por sua vez implica que (Ac )c , ou seja, A (Ac )c . Portanto, (Ac )c = A. 2. Comutatividade (Simetria): A B = B A e A B = B A
Prova: Suponha que (Ac )c . Ento, / Ac , o que por sua vez implica que A,
Prova: Suponha que A B . Ento, A, ou B , o que por sua vez implica
que B A, ou seja, A B B A. Agora suponha que B A. Ento, B , ou A, o que por sua vez implica que A B , ou seja, B A A B . Portanto, A B = B A.
A prova para o caso da interseco anloga e deixada como Exerccio. 3. Associatividade: A (B C ) = (A B ) C ) e A (B C ) = (A B ) C )
Prova: Exerccio.
4. Distributividade: A (B C ) = (A B ) (A C ) e A (B C ) = (A B ) (A C )
Prova: Exerccio.
5. Leis de De Morgan: (A B )c = Ac B c e (A B )c = Ac B c . que / A e / B . Logo, Ac e B c , ou seja, (Ac B c ). Ento, (A B )c (Ac B c ). Agora suponha que (Ac B c ). Ento, Ac e B c , o que por sua vez implica que /Ae / B . Logo, / (A B ), ou seja, (A B )c . Ento, (Ac B c ) (A b)c . Portanto, (Ac B c ) = (A b)c . A prova da outra Lei de Morgan anloga e deixada como Exerccio. As Leis de De Morgan permitem que se possa expressar unies em termos de interseces e complementos e interseces em termos de unies e complementos. Unies e interseces podem ser estendendidas para colees arbitrrias de conjuntos. Seja I um conjunto qualquer. Este conjunto I ser utilizado para indexar, ou seja, identicar atravs de um nico smbolo os conjuntos na coleo arbitrria de interesse e desse modo
Prova: Suponha que (A B )c . Ento, / (A B ), o que por sua vez implica
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS 6 simplicar a notao utilizada. Por exemplo, se I = {1, 5, 7}, ento iI Ai = A1 A5 A7 ; ou, se I = N , ento iN Ai = A1 A2 An . De modo anlogo ao caso de dois conjuntos, dene-se:
iI Ai = { : pertence a pelo menos um dos conjuntos Ai , onde i I , }

e
iI Ai = { : pertence a todo Ai , onde i I .}

Se I for um conjunto enumravel, diz-se que iI Ai , respectivamente, iI Ai , uma unio, respectivamente interseco, enumravel de conjuntos. Por exemplo, se = 0, 1, 2, . . ., I o conjunto de inteiros positivos divisveis por 3 e N = {0, 1, 2, . . . , 1}, ento
I N = e I N = N3 .
Exemplo 1.2.3: Se Ai = [1, 2 + 1 ), i I N , ento iI N Ai = [1, 3) e iI N = [1, 2]. i
1.3 Produto Cartesiano

Uma construo diferente de um novo conjunto C dados conjuntos A e B feita atravs do produto Cartesiano de conjuntos. Por um par ordenado de elementos (a, b), onde a A e b B , descreve-se um objeto tal que (a1 , b1 ) = (a2 , b2 ) a1 = a2 e b1 = b2 . dados A e B o conjunto de todos os pares ordenados de elementos, onde o primeiro pertence A e o segundo pertence B :
Denio 1.3.1: Produto Cartesiano. O produto Cartesiano A B de dois conjuntos
A B = {(a, b) : a A, b B }.
Por exemplo, se A = {1, 2, 3} e B = {c, d}, ento:
A B = {(1, c), (1, d), (2, c), (2, d), (3, c), (3, d)}, e B A = {(c, 1), (c, 2), (c, 3), (d, 1), (d, 2), (d, 3)}.
A noo de produto cartesiano pode ser estendida da seguinte maneira: Se A1 , . . . , An forem conjuntos, ento,
A1 A2 . . . An = {(a1 , a2 , . . . , an ) : ai Ai },
ou seja, o conjunto de todas as nuplas ordenadas. Um caso especial importante surge quando consideramos o produto cartesiano de um conjunto por ele prprio, isto , A A. Exemplos disso surgem quando tratamos do plano euclideano, I RI R, onde I R o conjunto de todos os nmeros reais, e do espao euclideano tridimensional, representado por I RI RI R.
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS
1.4 Conjunto das Partes
Denio 1.4.1: Dado um conjunto qualquer A, pode-se denir um outro conjunto, conExemplo 1.4.2: Seja A = {1, 2, 3}, ento temos que
2A = {, A, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}}.
hecido como conjunto das partes de A, e denotado por 2A , cujos elementos so subconjuntos de A.
O prximo Teorema conhecido como Teorema de Cantor, prova que a cardinalidade do conjunto das partes de qualquer conjunto dado A maior que a cardinalidade de A.
Teorema 1.4.3: Se A um conjunto e 2A o conjunto das partes de A, no existe uma

funo f : A 2A que seja sobrejetiva.
Prova: Recorde que uma funo g : D I sobrejetiva se para todo y I , existe x D tal que g (x) = y . Suponha por contradio, que existe uma funo sobrejetiva f : A 2A . Dena o conjunto, B = {x A : x / f (x)}. Como f por suposio sobrejetiva e B 2A , temos que existe b A tal que f (b) = B . Temos que considerar dois casos: b B ou b B c . Se b B , ento b / f (b). Mas como B = f (b), temos que b / B , absurdo. Se c b B , ento b f (b). Mas como B = f (b), temos que b B , absurdo.
1.5 Partio
Intuitivamente, uma partio de um conjunto universo uma maneira de distribuir os elementos deste conjunto em uma coleo arbitrria de subconjuntos. Formalmente, tem-se a seguinte denio:
Denio 1.5.1: Dado um conjunto universo , uma partio = {A , I} de uma coleo de subconjuntos de (neste caso, indexados por que toma valores no conjunto de ndices I ) e satisfaz:
P1. Para todo = , A A = ; P2. I A = . Deste modo os conjuntos de uma partio so disjuntos par a par e cobrem todo o conjunto universo. Portanto, cada elemento pertence a um, e somente um, dos conjuntos A de uma partio.
Exemplo 1.5.2: Se = {1, 2, 3, 4}, ento {A1 , A2 }, onde A1 = {1, 2, 3} e A2 = {4}, uma
partio de .
Exemplo 1.5.3: A coleo de intervalos {(n, n + 1] : n Z } uma partio dos nmeros

reais I R.
CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS
1.6 Funo Indicadora
sempre conveniente representar um conjunto A por uma funo IA tendo domnio (conjunto dos argumentos da funo) e contra-domnio (conjunto dos possveis valores da funo) binrio {0, 1}.
Denio 1.6.1 : Funo Indicadora. A funo indicadora IA : {0, 1} de um

conjunto A dada por
IA ( ) =
1 se A, 0 se / A.
Note que podemos determinar A a partir de sua funo indicadora: A = { : IA ( ) = 1}. o conjunto universo . Se IA ( ) for identicamente igual a 0, ento A o conjunto vazio . Se IA ( ) for igual a 1 somente quando = 0 , ento A o conjunto {0 } que contm somente o elemento 0 . Note que existe uma correspondncia 1-1 entre conjuntos e suas funes indicadoras:
Exemplo 1.6.2: Se IA ( ) for identicamente igual a 1, ou seja, IA ( ) = 1, , ento A
A = B ( )IA ( ) = IB ( ).
O fato que conjuntos so iguais se, e somente se, suas funes indicadoras forem idnticas nos permitem explorar a aritmtica de funes indicadoras:
IAc = 1 IA , A B IA IB , IAB = min(IA , IB ) = IA IB , IAB = max(IA , IB ) = IA + IB IAB , IAB = max(IA IB , 0) = IA IB c ,

para construir argumentos rigorosos no que se refere a relao entre conjuntos. Ou seja, ns transformamos proposies sobre conjuntos em proposies sobre funes indicadoras e podemos ento utilizar nossa familiaridade com lgebra para resolver perguntas menos familiares sobre conjuntos.
Exemplo 1.6.3: Utilizando funes indicadoras, verique que A B B c Ac . Soluo: Temos que
A B IA IB 1 IA 1 IB IAc IB c B c Ac .
Exemplo 1.6.4: As seguintes questes no esto relacionadas umas com as outras.

CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS 9 a. Se IA IB for identicamente igual a zero, o que sabemos a respeito da relao entre A e B? b. Se A B c = B Ac , o que sabemos a respeito da relao entre A e B ?
2 2 c. Se IA + IB for identicamente igual a 1, o que podemos concluir sobre A e B ?
d. Se IA IB for identicamente igual a 1, , o que podemos concluir sobre A e B ? e. Se A B = B A, o que podemos concluir sobre A e B ?
Soluo: Exerccio.
Captulo 2 Tcnicas de Contagem

2.1 Introduo
Neste captulo estudaremos alguns mtodos de contagem, tambm conhecidos como mtodos de anlise combinatria. A relevncia deste estudo se deve ao fato que, como veremos adiante, em muitos casos onde o conjunto de resultados possveis de um experimento aleatrio nito a probabilidade dos eventos proporcional a sua cardinalidade. Deste modo, ser importante ter alguma familiaridade com estes mtodos. Embora conjuntos pequenos possam ser contados exaustivamente (fora-bruta), mesmo conjuntos com tamanho moderado podem ser difceis de contar sem a utilizao de tcnicas matemticas.
2.2 Mtodos de Contagem

2.2.1 Regra da Adio
Suponha que um procedimento, designado por 1, possa ser realizado de n1 maneiras. Admitase que um segundo procedimento, designado por 2, possa ser realizado de n2 maneiras. Alm disso, suponha que no seja possvel que ambos os procedimentos 1 e 2 sejam realizados em conjunto. Ento, o nmero de maneiras pelas quais poderemos realizar ou 1 ou 2 ser n1 + n2 . Esta regra tambm pode ser estendida da seguinte maneira: Se existirem k procedimentos e o i-simo procedimento puder ser realizado de ni maneiras, i = 1, 2, . . . , k , ento, o nmero de maneiras pelas quais poderemos realizar ou o procedimento 1, ou o procedimento 2, . . ., ou o procedimento k , dado por n1 + n2 + . . . + nk , supondo que dois quaisquer deles no possam ser realizados conjuntamente.
Exemplo 2.2.1: Suponha que estejamos planejando uma viagem e devamos escolher entre
o transporte por nibus ou por trem. Se existirem trs rodovias e duas ferrovias, ento existiro 3 + 2 = 5 caminhos disponveis para a viagem.
10
CAPTULO 2. TCNICAS DE CONTAGEM
2.2.2 Regra da Multiplicao
11
Suponha que um procedimento designado por 1 possa ser executado de n1 maneiras. Admitase que um segundo procedimento, designado por 2, possa ser executado de n2 maneiras. Suponha tambm que cada maneira de executar 1 possa ser seguida por qualquer maneira para executar 2. Ento o procedimento formado por 1 seguido de 2 poder ser executado de n1 n2 maneiras. Obviamente, esta regra pode ser estendida a qualquer nmero nito de procedimentos. Se existirem k procedimentos e o i-simo procedimento puder ser executado de ni maneiras, i = 1, 2, . . . , k , ento o procedimento formado por 1, seguido por 2,. . . , seguido pelo procedimento k , poder ser executado de n1 n2 nk maneiras.
Exemplo 2.2.2: Uma pea manufaturada deve passar por 3 estaes de controle. Em cada
estao, a pea inspecionada para determinada caracterstica e marcada adequadamente. Na primeira estao, trs classicaes so possveis, enquanto nas duas ltimas, quatro classicaes so possveis. Consequentemente, existem 3 4 4 = 48 maneiras pelas quais uma pea pode ser marcada.
Exemplo 2.2.3: Quantos divisores inteiros e positivos possui o nmero 360? Quantos desses
divisores so pares? Quantos so mpares? Quantos so quadrados perfeitos? Soluo: 360 = 23 32 5. Os divisores inteiros e positivos de 360 so os nmeros da forma: 2a 3b 5c , onde a {0, 1, 2, 3}, b {0, 1, 2}, e c {0, 1}. Portanto, existem 4 3 2 = 24 maneiras de escolher os expoentes a, b, c. Logo h 24 divisores. Para o divisor ser par, a no pode ser zero. Ento, existem 3 3 2 = 18 divisores pares. Por outro lado, para o divisor ser mpar, a tem que ser zero. Logo, existem 1 3 2 = 6 divisores mpares. Por m para o divisor ser quadrado perfeito, os expoentes tem que ser pares. Logo, existem 2 2 1 = 4 divisores quadrados perfeitos.
Exemplo 2.2.4: De quantos modos o nmero 720 pode ser decomposto em um produto
de dois inteiros positivos? Aqui consideramos, naturalmente, 8 90 como sendo o mesmo produto que 90 8. E o nmero 144? Soluo: 720 = 24 32 5. Os divisores inteiros e positivos de 720 so os nmeros da forma: 2a 3b 5c , onde a {0, 1, 2, 3, 4}, b {0, 1, 2}, e c {0, 1}. Portanto, existem 5 3 2 = 30 maneiras de escolher os expoentes a, b, c. Logo h 30 divisores. Observe que como 720 no um quadrado perfeito, para cada divisor x de 720 existe um outro divisor y = x de 720 tal que x y = 720. Portanto, cada produto contm dois divisores diferentes de 720. Como existem 30 divisores, existem 15 produtos diferentes. 144 = 24 32 . Seguindo o mesmo raciocnio anterior, temos 5 3 = 15 divisores de 144. Note que 144 = 122 e este constitui um produto de inteiros positivos que igual a 144. Para os demais produtos sempre temos que eles contm dois inteiros positivos diferentes que so divisores de 144. Como existem 14 divisores de 144 diferentes de 12, temos que existem 7 produtos envolvendo estes divisores. Logo, temos um total de 8 produtos diferentes.
Exemplo 2.2.5: O conjunto A possui 4 elementos e, o conjunto B , 7 elementos. Quantas

funes f : A B existem? Quantas delas so injetoras?
CAPTULO 2. TCNICAS DE CONTAGEM 12 Soluo: Note que para cada elemento de A temos 7 opes de valores diferentes. Como A contm 4 elementos, existem 7 7 7 7 = 74 funes diferentes. Recorde que uma funo injetora se f (a) = f (b) sempre que a = b. Portanto, no podemos repetir o mesmo elemento de B como imagem de dois elementos de A, logo existem 7 6 5 4 = 840 funes injetoras.
Exemplo 2.2.6: Em uma banca h 5 exemplares iguais da Veja, 6 exemplares iguais da
poca e 4 exemplares iguais da Isto . Quantas colees no-vazias de revistas dessa banca podemos formar? Soluo: Note que cada coleo de revistas vai ser composta por a revistas Veja, b revistas poca, e c revistas Isto , onde 0 a 5, 0 b 6, 0 c 4, e pelo menos 1 de a, b, ou c diferente de zero. Ento, temos 6 7 5 1 = 210 1 = 209 diferentes colees no-vazias destas revistas.
Amostragem ou Escolhas com Reposio

Dado um conjunto com n elementos distintos, o nmero n,r de maneiras de selecionar uma sequncia distinta de comprimento r escolhida desse conjunto com repetidas selees do mesmo elemento sendo permitida (amostragem com repetio) dada por nr , j que estamos repetindo o mesmo procedimento r vezes, e cada procedimento tem n maneiras de ser executado. Este resultado tambm se aplica ao nmero de resultados possveis em r jogadas de uma moeda (n = 2), ou de um dado (n = 6), ou o nmero de bytes (r = 8, n = 2) (Um byte uma sequncia ordenada de comprimento 8 de 0's e 1's).
Exemplo 2.2.7: Nmero de Sequncias Binrias ou Subconjuntos. O nmero de
sequncias binrias de comprimento r igual a 2r pois neste caso temos para cada posio i da sequncia ni = 2. O nmero de subconjuntos de um dado conjunto ||A|| = r pode ser determinado enumerando A = {a1 , a2 , a3 , . . . , ar } e descrevendo cada subconjunto B de A por uma sequncia binria (b1 , b2 , . . . , br ) , onde bi = 1 se ai B e bi = 0, caso contrrio. Como existem 2r destas sequncias, ento existem 2r subconjuntos de um conjunto de r elementos. Portanto, se ||A|| = r, o conjunto das partes de A, possui 2r elementos, o que explica a notao exponencial do conjunto das partes.
Amostragem ou Escolhas sem Reposio

Dado um conjunto com n elementos distintos, o nmero (n)r de maneiras de selecionar uma sequncia distinta de comprimento r escolhida desse conjunto com repetidas selees do mesmo elemento no sendo permitida (amostragem sem repetio) dada por
r 1
(n)r = n(n 1) (n r + 1) =
i=0
(n i)
CAPTULO 2. TCNICAS DE CONTAGEM 13 , j que no primeiro procedimento (escolha do primeiro elemento da sequncia) temos n maneiras de execut-lo, no segundo procedimento (escolha do segundo elemento da sequncia) temos n 1 maneiras de execut-lo, . . ., e no r-simo e ltimo procedimento (escolha do r-simo elemento da sequncia) temos n r + 1 maneiras de execut-lo. Este nmero de sequncias tambm chamado na literatura do nmero de arranjos quando temos n elementos distintos e queremos escolher r deles onde a ordem de escolha importante. Um caso particular de amostragem sem reposio quando queremos saber o nmero de permutaes de um conjunto de n elementos distintos. Neste caso temos que r = n, ento o nmero de permutaes dado por
n! = (n)n = n(n 1) 1,
onde n! conhecida como funo fatorial. Em termos, de funo fatorial, ns podemos escrever: n! (n)r = . (n r)! Propriedades da funo fatorial n! incluem as seguintes:
0! = 1! = 1 e n! = n(n 1)!.
Exemplo 2.2.8: Se A um conjunto de n elementos, quantas so as funes f : A A

bijetoras?
A nito e tem n elementos, garante-se deste modo que f tambm sobrejetora e, portanto, bijetora. Ento, o primeiro elemento de A tem n opes, o segundo n 1 opes, at que o ltimo elemento de A tem somente uma opo disponvel. Portanto, existem n! funes bijetoras f : A A.
Soluo: Temos que garantir que cada elemento de A tem uma imagem diferente. Como
Exemplo 2.2.9: De quantos modos possvel colocar r rapazes e m moas em la de modo
que as moas permaneam juntas? Soluo: Primeiro temos r + 1 opes de escolher o lugar das moas. Em seguida, temos r! maneiras de escolher a posio dos rapazes entre si, e m! maneiras de escolher a posio das moas entre si. Portanto, temos (r + 1)r!m! modos diferentes de escolha.
Exemplo 2.2.10: Quantas so as permutaes simples dos nmeros 1, 2, . . . , 10 nas quais
o elemento que ocupa o lugar de ordem k , da esquerda para a direita, sempre maior que k 3? Soluo: Comecemos escolhendo os nmeros da direita para esquerda. Observe que o nmero no lugar de ordem 10, tem que ser maior que 7, portanto existem 3 opes. O nmero no lugar de ordem 9, tem que ser maior que 6, existem, portanto, 3 opes visto que um dos nmeros maiores que 6 j foi utilizado na ltima posio. De maneira similar pode-se ver que existem 3 opes para os nmeros que ocupam do terceiro ao oitavo lugar. O nmero no lugar de ordem 2, tem somente 2 opes, pois oito nmeros j foram escolhidos anteriormente. Finalmente, resta apenas um nmero para o lugar de ordem 1. Portanto, existem 2 38 permutaes deste tipo.
Enumerao de Conjuntos: Coecientes Binomiais
14
O nmero de conjuntos, ou colees no ordenadas, de tamanho r escolhidas de um conjunto universo de tamanho n, onde, como apropriado para conjuntos, no permitido a duplicao de elementos (amostragem sem repetio), dado pelo coeciente binomial:
n r
(n)r n! = . r! (n r)!r!
Para vericar isto, note que o nmero de colees ordenadas de tamanho r sem repetio (n)r . Como os elementos de cada sequncia de comprimento r so distintos, o nmero de permutaes de cada sequncia r!. Porm, utilizando a regra da multiplicao, o procedimento de escolhermos uma coleo ordenada de r termos sem repetio igual a primeiro escolher uma coleo no-ordenada de r termos sem repetio e depois escolhermos uma ordem para esta coleo no ordenada, ou seja, temos que
(n)r =
n r!, r
de onde segue o resultado. O coeciente binomial tem as seguintes propriedades:
n r
n , nr
n 0
= 1,
n 1
= n,
n r
= 0 se n < r.
Note que o coeciente binomial tambm igual ao nmero de subconjuntos de tamanho r que pode ser formado de um conjunto de n elementos. Como j vimos que, o nmero total de subconjuntos de um conjunto de tamanho n 2n , temos que
n
2 =
r=0
n . r
Os nmeros n so chamados de coecientes binomiais, porque eles aparecem como r coecientes na expresso binomial (a + b)n . Se n for um inteiro positivo, (a + b)n = (a + b)(a + b) (a + b). Quando a multiplicao tiver sido executada, cada termo ser formado de k elementos de a e de (n k ) elementos de b, para k = 0, 1, 2, . . . , n. Mas quantos termos da forma ak bnk existiro? Simplesmente contaremos o nmero de maneiras possveis de escolher k dentre os n elementos a, deixando de lado a ordem (onde o i-simo elemento a corresponde ao i-simo fator do produto acima). Mas isto justamente dado por n . Da k obtm-se o que conhecido como o Teorema Binomial:
n
( a + b) =
k=0
n k nk a b . k
Exemplo 2.2.11: Dentre oito pessoas, quantas comisses de trs membros podem ser escolhidas, desde que duas comisses sejam a mesma comisso se forem constitudas pelas mesmas pessoas (no se levando em conta a ordem em que sejam escolhidas)? A resposta dada por 8 = 56 comisses possveis. 3
CAPTULO 2. TCNICAS DE CONTAGEM 15 Exemplo 2.2.12: Com oito bandeiras diferentes, quantos sinais feitos com trs bandeiras diferentes se podem obter? Este problema parece-se muito com o exemplo anterior, mas neste caso a ordem acarreta diferena e por isso temos (8)3 = 336 sinais.
Exemplo 2.2.13 : Um grupo de oito pessoas formado de cinco homens e trs mul-
heres. Quantas comisses de trs pessoas podem ser constitudas, incluindo exatamente dois homens? Aqui deveremos fazer duas coisas, escolher dois homens (dentre cinco) e escol3 her uma mulher (dentre trs). Da obtemos como nmero procurado 5 = 30 comisses. 2 1
Exemplo 2.2.14: Quantos sequncias binrias de comprimento n contm no mximo trs
nmeros 1? Neste caso, temos quatro casos possveis: todas sequencias que no contm 1, todas sequncias que contm apenas um nmero 1, todas sequncias que contm dois nmeros 1, e todas as sequncias que contm trs nmeros 1. Para 0 r n, temos que existem exatamente n sequncias binrias com r nmeros 1. Portanto, pela regra da adio r temos que existem n n n n + + + 0 1 2 3
sequncias binrias de comprimento n contendo no mximo trs nmeros 1. 1 cara? Neste caso, note que apenas uma sequncia no contm nenhuma cara (a sequncia que contm apenas coroa). Como o nmero total de sequncias de cara e coroa de comprimento n igual a 2n , temos ento 2n 1 sequncias de comprimento n contendo pelo menos uma cara.
1 7 Exemplo 2.2.16: Determine o coeciente de x3 no desenvolvimento de (x4 x ). Soluo: O termo genrico do desenvolvimento
Exemplo 2.2.15: Quantas sequncias de cara e coroa de comprimento n contm pelo menos
7 5k7 7 1 (x4 )k ( )7k = (1)7k x . k k x

Portanto, temos o termo x3 se 5k 7 = 3, o que implica que k = 2. Logo, o coeciente de x3 (1)5 7 = 21. 2
Contagem Multinomial
Considere que temos r tipos de elementos e ni cpias indistinguveis do elemento do tipo i. Por exemplo, a palavra probabilidade tem duas cpias de cada uma das letras a,b,d,i e uma cpia de cada uma das letras l,p,r,o,e. O nmero de sequncias ordenadas de comprimento n= r i=1 ni dado por:
n n1
n n1 n2
n n1 n2 1 = n3
n!
r i=1
ni !
CAPTULO 2. TCNICAS DE CONTAGEM Esta quantidade conhecida como coeciente multinomial e denotada por:
16
n , n1 n2 . . . nr
onde n = r i=1 ni . Para vericar esta contagem, note que das n posies na sequncia de comprimento n, n ns podemos escolher n1 posies para os n1 elementos indistinguveis do tipo 1 de n 1 maneiras. Das n n1 posies restantes na sequncia, podemos escolher n2 posies para n1 os n2 elementos indistinguveis do tipo 2 de n maneiras. Finalmente, aps repetir este n2 processo r 1 vezes, restam-nos nr posies na sequncia para os nr elementos do tipo r, que s podem ser escolhidas de uma nica maneira. Utilizando o mtodo da multiplicao, o nmero total de sequncias possveis produto do nmero de maneiras que podemos colocar os r tipos de elementos. O coeciente multinomial tambm calcula o nmero de parties de um conjunto n elementos em r subconjuntos com tamanhos dados n1 , n2 , . . . , nr . Aplicando-se o mesmo argumento que utilizamos para demonstrar o Teorema Binomial, pode-se provar a seguinte generalizao conhecida como Teorema Multinomial:
n ni1 n
j<r 1 ij
( x1 + x2 + . . . + xr ) =
i1 =0 i2 =0
ir1 =0
n i1 i2 . . . ir
r
k xi k ,
k=1
onde ir = n
j<r ij .
Exemplo 2.2.17: Um monitor tendo resoluo de n = 1.280 854 pixels, com r = 3 cores possveis (verde, azul, e vermelho) para cada pixel, pode mostrar i1 in imagens tendo i1 2 i3 pixels verdes, i2 pixels azuis, e i3 pixels vermelhos. O nmero total de imagens que pode ser exibida por este monitor para qualquer composio de cores de ver, azul, e vermelho pode ser obtido utilizando o Teorema Multinomial fazendo x1 = x2 = x3 = 1, dando o resultado de 3n possveis imagens. Exemplo 2.2.18: Determine o coeciente de x9 y 4 no desenvolvimento de (x3 + 2y 2 + x52 )5 . Soluo: O termo genrico do desenvolvimento
5 5 (x3 )i1 (2y 2 )i2 ( 2 )5i1 i2 = i1 i2 5 i1 i2 x 5 (2)i2 (5)5i1 i2 x3i1 10+2i1 +2i2 y 2i2 . i1 i2 5 i1 i2
(2.1)
Portanto, temos o termo x9 y 4 se 5i1 + 2i2 10 = 9 e 2i2 = 4, o que implica que i2 = 2 e = 40. i1 = 3. Logo, o coeciente de x9 y 4 (2)2 (5)0 3 5 2 0
2.3 Aplicaes em Grafos
17
Modelos matemticos de conectividade em sistemas ou redes so baseados em grafos. Estes modelos permitem que possamos estudar questes como a conectividade de todos os elementos de uma rede, a rosbutez dessa conectividade a falhas em conexes entre pares de elementos, e o comprimento de caminhos entre pares de elementos. Ns estudaremos algumas caractersticas de grafos, utilizando as tcnicas de contagem que aprendemos.
2.3.1 Grafos No Direcionados

Denio 2.3.1: Um grafo no direcionado G = (V, E ) denido por um conjunto V de
elementos chamados ns ou vrtices e um conjunto E {{u, v } : u, v V } de pares no ordenados de ns que so chamados de bordas ou arestas. Denotaremos por Gn um grafo no direcionado que contm n vrtices.
A aresta {u, v } vista como conectando os vrtices u e v , e estes ns so chamados de adjacentes. O caso especial da aresta {u, u} chamado de um lao. Note que o grafo chamado de no direcional pois se u adjacente a v , ento v adjacente a u. Neste breve estudo de grafos, ao no ser que mencionemos ao contrrio, assumiremos que no h laos.
n de grafos no direcionados com um conjunto V de n vrtices? Note que o nmero possveis de arestas nmero de maneiras que podemos escolher pares de vrtices de V . (Observe que a ordem dos vrtices no importante, pois o grafo no direcionado.). Ento temos n 2 possveis arestas em um grafo. Cada grafo, ento corresponde a um subconjunto do conjunto de todas as arestas. Como existem 2r subconjuntos de um conjunto de r elementos, temos que existem n n = 2( 2 )
grafos no direcionados com n vrtices. Quantos o nmero n,m de grafos no direcionados com um conjunto V de n vrtices e um conjunto E de m arestas? Como existem n possveis arestas, vemos que existem 2
Exemplo 2.3.2: Nmero de Grafos no Direcionados com n Vrtices Qual o nmero
n,m =
n 2
grafos no direcionados com n vrtices e m arestas.
2.3.2 Grafos Direcionados

Enquanto algumas conexes so simtricas, outras no so. Por exemplo, considere a relao social de u pai de v ou que u orientador de v . Evidentemente, essas relaes no so simtricas. Para representar tais sistemas, precisamos de grafos direcionados.
CAPTULO 2. TCNICAS DE CONTAGEM 18 Denio 2.3.3: Um grafo direcionado G = (V, E ) um conjunto V de vrtices e um conjunto E {(u, v ) : u, v V } = V V de pares ordenados de vrtices que denem arestas direcionadas que conectam u a v , mas no necessariamente o contrrio.
n vrtices? Como existem n(n 1) pares ordenados de vrtices sem repetio, ento o nmero total de possveis arestas do grafo n(n 1). Cada grafo, ento corresponde a um subconjunto do conjunto de todas as arestas. Ento, temos que existem n = 2n(n1)
Exemplo 2.3.4: Quantos grafos direcionados sem laos existem com um conjunto V de
grafos direcionados com n vrtices. Quantos o nmero de grafos direcionados com um conjunto V de n vrtices e um conjunto E de m arestas? Como existem n(n 1) possveis arestas, vemos que existem
n(n 1) m
grafos direcionados com n vrtices e m arestas.
Captulo 3 Introduo Probabilidade

3.1 Experimento Aleatrio
Um experimento qualquer processo de observao. Em muitos experimentos de interesse, existe um elemento de incerteza, ou chance, que no importa quanto ns sabemos sobre o passado de outras performances deste experimento, ns essencialmente no somos capazes de predizer seu comportamento em futuras realizaes. As razes para nossa falta de habilidade para predizer so varias: ns podemos no saber de todas as causas envolvidas; ns podemos no ter dados sucientes sobre as condies iniciais do experimento; as causas podem ser to complexas que o clculo do seu efeito combinado no possvel; ou na verdade existe alguma aleatoriedade fundamental no experimento. Tais experimentos so conhecidos como experimentos aleatrios. Salvo mencionado em contrrio, este livro restringe-se classe de experimentos aleatrios cujo conjuntos de possveis resultados seja conhecido1 . Os resultados de um experimento aleatrio so caracterizados pelos seguintes componentes: 1. o conjunto de resultados possveis ; 2. a coleo de conjuntos de resultados de interesse A; 3. um valor numrico P da verossimilhana ou probabilidade de ocorrncia de cada um dos conjuntos de resultados de interesse.
3.2 Espao Amostral

O conjunto de possveis resultados de um experimento aleatrio chamado de espao amostral. Existem quatro pontos que so desejveis da especicao de um espao amostral:
1 importante ressaltar que freqentemente so encontradas situaes prticas onde no se consegue descrever todos os possveis resultados de um experimento. Uma maneira de contornar este problema assumir que um resultado possvel do experimento a no ocorrncia de qualquer dos resultados descritos, contudo, em problemas prticos, tal suposio pode acarretar em diculdades quando se tenta elicitar ou deduzir probabilidades.
19
CAPTULO 3. INTRODUO PROBABILIDADE SS1. listar os possveis resultados do experimento; SS2. faz-lo sem duplicao; SS3. faz-lo em um nvel de detalhamento suciente para os interesses desejados;
20
SS4. especicar essa lista completamente em um sentido prtico, embora usualmente no completa no que se refere a todos os resultados logicamente ou sicamente possveis. Por exemplo, uma nica jogada de uma moeda pode ter o espao amostral tradicional = {cara, coroa}, ou podemos considerar que a moeda pode sicamente car equilibrada na borda = {cara, coroa, borda} (SS1). Uma outra possibilidade seria levar em considerao as coordenadas (x, y ) do centro da moeda quando ela para aps ser jogada no ar. Como vemos muito mais se sabe sobre o resultado de uma jogada de uma moeda que os simples resultados binrios tradicionais cara e coroa. Ns ignoramos est informao adicional (SS3) usando uma hiptese no mencionada que existe uma aposta com pagamentos que dependem apenas de qual lado da moeda cai para cima e no em outras informaes (SS4). Podemos classicar espaos amostrais em dois tipos de acordo com o nmero de elementos que eles contem. Espaos amostrais podem ser enumerveis ou no enumerveis; dependendo se for um conjunto enumervel ou no, respectivamente. Em um nvel losco, pode-se argumentar que s existem espaos amostrais enumerveis, visto que medidas no podem ser feitas com innita preciso. Enquanto na prtica isto verdadeiro, mtodos estatsticos e probabilsticos associados com espaos amostrais no enumerveis so, em geral, menos complicados que aqueles para espaos amostrais enumerveis, e proporcionam uma boa aproximao para a situao (enumervel) real.
3.3 Eventos e Coleo de Eventos

Um evento um subconjunto do espao amostral, ou seja, um conjunto de resultados possveis do experimento aleatrio. Se ao realizarmos um experimento aleatrio, o resultado pertence a um dado evento A, dizemos que A ocorreu. Estaremos interessados no estudo da ocorrncia de combinaes de eventos. Para tanto, utilizaremos as operaes Booleanas de conjuntos (complementar, unio, interseco, diferena) para expressar eventos combinados de interesse.
Denio 3.3.1: Os eventos A e B so disjuntos ou mutuamente excludentes ou mutuaExemplo 3.3.2: Sejam A, B , e C eventos em um mesmo espao amostral . Expresse os
mente exclusivos se no puderem ocorrer juntos, ou, em linguagem de conjuntos, A B = .
seguintes eventos em funo de A, B , e C e operaes Booleanas de conjuntos.
(a) Pelo menos um deles ocorre: (b) Exatamente um deles ocorre:
A B C.
(A B c C c ) (Ac B C c ) (Ac B c C ).
CAPTULO 3. INTRODUO PROBABILIDADE (c) Apenas A ocorre: (A B c C c ).
21
(d) Pelo menos dois ocorrem:

(A B C c ) (A B c C ) (Ac B C ) (A B C ).
(e) No mximo dois deles ocorrem: (f) Nenhum deles ocorre:
(A B C )c . (Ac B c C c ).
(g) Ambos A e B ocorrem, mas C no ocorre:

(A B C c ).
Embora possa-se pensar que, dado um espao amostral, necessariamente de interesse analisar todos os seus subconjuntos (e isto eventualmente verdadeiro), temos trs razes para esperar que estejamos apenas interessados em alguns subconjuntos do espao amostral. Primeiro, o espao amostral pode conter um grau de detalhamento superior ao que estamos interessados no momento. Por exemplo, ele pode representar uma nica jogada de um dado com 6 elementos, mas ns apenas estamos interessados em saber se o resultado par ou mpar. Segundo, ns vamos querer associar cada evento A com uma probabilidade numrica P (A). Como essas probabilidades esto baseadas em algum conhecimento sobre a tendncia de ocorrer do evento ou no grau de nossa crena que determinado evento ocorrer, nosso conhecimento sobre P pode no estender para todos os subconjuntos de . A terceira (e tcnica) razo para limitar a coleo de eventos de interesse que condies impostas em P pelos axiomas de Kolmogorov, que estudaremos adiante, podem no permitir que P seja denida em todos os subconjuntos de , em particular isto pode ocorrer quando for no enumervel, mas no iremos demonstrar este fato que est fora do escopo deste curso. Estaremos interessados em uma coleo especial A de subconjuntos do espao amostral (note que A um conjunto cujos elementos tambm so conjuntos!) que so eventos de interesse no que se refere ao experimento aleatrio E e os quais temos conhecimento sobre a sua verossimilhana de ocorrncia. A chamado de uma lgebra de eventos.
Denio 3.3.3:
1. no vazia;
Uma lgebra de eventos A uma coleo de subconjuntos do espao amostral que satisfaz:
2. fechada com respeito a complementos (se A A, ento Ac A); 3. fechada com respeito a unies nitas (se A, B A, ento A B A). Pelas Leis de De Morgan, vemos que A fechada com respeito a interseces nitas tambm.
CAPTULO 3. INTRODUO PROBABILIDADE
Exemplo 3.3.4:
22
1. A menor lgebra de eventos A = {, }; 2. A maior lgebra de eventos o conjunto das partes de ; 3. Um exemplo intermedirio, temos:
= {1, 2, 3}, A = {, , {1}, {2, 3}}.

4. A lgebra de eventos nitos e co-nitos. Seja = I Re
A = {A I R : A nito} {A I R : Ac nito},
ou seja, A consiste dos subconjuntos de I R que ou so nitos ou tm complementos nitos. A uma lgebra de eventos.
Lema 3.3.5: Se A uma lgebra, ento A Prova: Como A no vazio, seja A um elemento qualquer seu. Pela segunda propriedade
de lgebras, temos que Ac A, e pela terceira propriedade temos que = A Ac A.
Teorema 3.3.6: Sejam A1 e A2 lgebras de subconjuntos de e seja A = A1 A2 a coleo

de subconjuntos comuns as duas lgebras. Ento, A uma lgebra.
est em ambos A1 e A2 . Logo, Ac est em ambos A1 e A2 , e portanto na sua interseco A. Se A, B A, ento eles esto em ambos A1 e A2 . Consequentemente, A B est em ambos A1 e A2 e, portanto, em A. Como A satisfaz as trs condies da denio de lgebra de eventos, A uma lgebra de eventos. fcil ver que a prova do Teorema 3.3.6 pode ser estendida para o caso de uma interseco de um nmero arbitrrio de lgebras. O seguinte corolrio usa este fato para provar que sempre existe uma menor lgebra contendo uma famlia qualquer de eventos.
Prova: Como A1 e A2 so lgebras, ambos contm . Ento, A. Se A A, ento A
Corolrio 3.3.7: Existe uma menor (no sentido de incluso) lgebra contendo qualquer
famlia dada de subconjuntos de .
Prova: Seja C uma coleo qualquer de subconjuntos de , dena A(C ) como sendo o
conjunto que igual a intercesso de todas as lgebras de eventos que contm C , isto :
A(C ) =
AC :A
A.
uma lgebra de eventos
Pelo Teorema 3.3.6, A(C ) uma lgebra de eventos, e consequentemente a menor lgebra de eventos contendo C . A(C ) conhecida como a lgebra de eventos gerada por C .
CAPTULO 3. INTRODUO PROBABILIDADE 23 Observao 3.3.8: Uma maneira de construir uma lgebra de eventos, primeiro particionar em um nmero nito subconjuntos e depois considerar lgebra que consiste dos eventos que so unies nitas dos subconjuntos da partio.
Exemplo 3.3.9: Por exemplo, = {a, b, c, d}. Considere a partio, {{a, c}, {b, d}}, ento
considere a coleo de eventos que consiste de unies nitas dos eventos desta partio: A = {, , {a, c}, {b, d}}. fcil ver que A uma lgebra de eventos.
Dada uma coleo nita eventos C = {A1 , A2 , . . . , An }, dene-se um tomo de C como sendo qualquer evento B da seguinte forma: B = B1 B2 . . . Bn , onde Bi = Ai ou ||C|| Bi = A c tomos diferentes e que i para i = 1, 2, . . . , n. Note que existem no mximo 2 eles formam uma partio de C (verique!). Quando C for uma coleo nita de eventos, um evento pertencer a A(C ), se e somente se, for igual a uma unio nita de tomos de C . ||C|| Note que A(C ) ter no mximo 22 elementos (verique!).
Exemplo 3.3.10: Se = {a, b, c, d, e, f }, encontre a lgebra gerada por C = {{a, b, d}, {b, d, f }}.
Os tomos de C so {{a}, {f }, {c, e}, {b, d}}. Logo,
A(C ) = {, , {a}, {f }, {c, e}, {b, d}, {a, f }, {a, c, e}, {a, b, d}, {c, e, f }, {b, d, f }, {b, c, d, e}, {a, f, c, e}, {a, f, b, d}, {a, b, c, d, e}, {b, c, e, d, f }}.
3.3.1 Induo Matemtica

Abriremos um parnteses na nossa discusso sobre experimentos aleatrios para discutirmos um mtodo de prova matemtica que ser bastante utilizado ao longo do curso: a Induo Matemtica. Induo Matemtica um mtodo de prova matemtica usado para demonstrar a verdade de um nmero innito de proposies. A forma mais simples e mais comum de induo matemtica prova que um enunciado vale para todos os nmeros naturais n e consiste de dois passos:
A base: mostrar que o enunciado vale para n = 1. O passo indutivo: mostrar que, se o enunciado vale para n = k , ento o mesmo enunciado vale para n = k + 1.
Esse mtodo funciona provando que o enunciado verdadeiro para um valor inicial, e ento provando que o processo usado para ir de um valor para o prximo valido. Se ambas as coisas so provadas, ento qualquer valor pode ser obtido atravs da repetio desse processo. Para entender por que os dois passos so sucientes, til pensar no efeito domin: se voc tem uma longa la de domins em p e voc puder assegurar que:
O primeiro domin cair.

CAPTULO 3. INTRODUO PROBABILIDADE 24 Sempre que um domin cair, seu prximo vizinho tambm cair. ento voc pode concluir que todos os domins cairo.
Exemplo 3.3.11:
nmeros naturais n,
Suponha que desejemos provar o seguinte enunciado: para todos os

n
i=
i=1
n(n + 1) . 2
Esta uma frmula simples para a soma dos nmeros naturais de 1 a n. A prova de que o enunciado verdadeiro para todos os nmeros naturais n dada a seguir. Prova: Vericar se o enunciado verdadeiro para n = 1 (base). Claramente, do lado esquerdo da equao ca 1 e do lado direito 1(1 + 1)/2, resolvendo d 1 = 1. Ento o enunciado verdadeiro para n = 1. Podemos denir este enunciado como P (n) e portanto temos que P (1) verdadeiro. Agora precisamos mostrar que se o enunciado vale quando n = k , ento ele tambm vale quando n = k + 1 (passo indutivo). Isto pode ser feito da seguinte maneira: Assuma que o enunciado vlido para n = k , ou seja:
k
i=
i=1
k (k + 1) . 2
Adicionando k + 1 a ambos os lados:

k+1
i=
i=1
k (k + 1) k (k + 1) 2(k + 1) (k + 2)(k + 1) +k+1= + = . 2 2 2 2
Este ltimo o enunciado para n = k + 1. Note que ele no foi provado como verdadeiro: ns assumimos que P (k ) verdadeiro, e desta suposio conclumos que P (k +1) verdadeiro. Simbolicamente, mostramos que:
P (k ) P (k + 1)
Por induo, no entanto, podemos concluir que o enunciado P (n) vale para todos os nmeros naturais n: 1. P (1) verdadeiro, logo P(2) verdadeiro (usando o passo indutivo) 2. Como P(2) verdadeiro, ento P(3) tambm 3. Ento usando-se o passo indutivo P(N) ser verdadeiro e o P(N+1) tambm Agora podemos provar que toda lgebra fechada com respeito a um nmero nito de unies.
Teorema 3.3.12: Se A uma lgebra de eventos, ento

Ai A, i = 1, 2, . . . , n n i=1 Ai A
CAPTULO 3. INTRODUO PROBABILIDADE 25 Prova: Para n = 1, o resultado bvio. Para n = 2, o resultado segue diretamente da terceira propriedade na denio de lgebra de eventos. Vamos agora provar o passo indutivo, suponha que Ai A, i = 1, 2, . . . , k k i=1 Ai A. Vamos agora provar que o caso n = k + 1 verdadeiro. Suponha que Ai , i = 1, 2, . . . , k + 1 A, ento como +1 k k i=1 Ai = (i=1 Ai ) Ak+1 ,
k temos que utilizando o caso n = k , k i=1 Ai A. Como i=1 Ai A e Ak+1 A, temos que utilizando o caso n = 2, (k i=1 Ai ) Ak+1 A.
3.4 Frequncias Relativas

Resta-nos discutir o terceiro elemento para modelagem do raciocnio probabilstico, a associao de uma medida numrica a eventos que representam a probabilidade com que eles ocorrem. As propriedades desta associao so motivadas em grande parte pelas propriedades de freqncia relativas. Considere uma coleo de experimentos aleatrios Ei que possuem a mesma -lgebra de eventos A e tem resultados individuais no necessariamente numricos {i }. Fixando uma dada seqncia de resultados {i }, se estamos interessados na ocorrncia de um dado evento A, a freqncia relativa de A nada mas que uma mdia aritmtica da funo indicadora de A calculada em cada um dos termos da seqncia {i }, ou seja,
Denio 3.4.1:
A freqncia relativa de um evento A, determinada pelos resultados {1 , . . . , n } de n experimentos aleatrios,
1 rn (A) = n
IA (i ) =
i=1
Nn (A) . n
Propriedades chaves da frequncia relativa so: FR0. rn : A I R. FR1. rn (A) 0. FR2. rn () = 1. FR3. Se A e B so disjuntos, ento rn (A B ) = rn (A) + rn (B ). FR4. Se A1 , A2 , An , uma sequncia de eventos disjuntos dois a dois, ento rn ( i=1 Ai ) = r ( A ) . i i=1 n Ns prosseguiremos como se existisse alguma base emprica ou metafsica que garanta que rn (A) P (A), embora que o sentido de convergncia quando n cresce s ser explicado pela Lei dos Grandes Nmeros, que no ser discutida neste curso. Esta tendncia da frequncia relativa de estabilizar em um certo valor conhecida como regularidade estatstica. Deste modo, P herdar propriedades da frequncia relativa rn .
3.5 Axiomas de Kolmogorov
26
Primeiro por razes tcnicas, fora do escopo deste curso, temos que o domnio da medida formal de probabilidade uma lgebra de eventos que tambm fechada com relao a um nmero enumervel de unies.
Denio 3.5.1: Uma -lgebra A uma lgebra de eventos que tambm fechada com
relao a uma unio enumervel de eventos,
(i Z )Ai A iZ Ai A.
Pelas Leis de De Morgan, tem-se que A tambm fechada com respeito a interseces enumerveis.
Exemplo 3.5.2: A coleo de conjuntos de nmeros reais nitos e co-nitos uma lgebra
que no uma -lgebra.
Exemplo 3.5.3: A -lgebra de Borel B de subconjuntos reais , por denio, a menor lgebra contendo todos os intervalos e a -lgebra usual quando lidamos com quantidades reais ou vetoriais. Em particular, temos que unies enumerveis de intervalos (por exemplo, o conjunto dos nmeros racionais), seus complementos (por exemplo, o conjunto dos nmeros irracionais), e muito mais est em B . Os axiomas que descreveremos a seguir no descrevem um nico modelo probabilstico, eles apenas determinam uma famlia de modelos probabilsticos, com os quais poderemos utilizar mtodos matemticos para descobrir propriedades que sero verdadeiras em qualquer modelo probabilstico. A escolha de um modelo especco satisfazendo os axiomas feito pelo analista/estatstico familiar com o fenmeno aleatrio sendo modelado. Motivados pelas propriedades de frequncia relativa, impe-se os primeiros quatro axiomas de Kolmogorov: K0. Inicial. O experimento aleatrio descrito pelo espao de probabilidade (, A, P ) que consiste do espao amostral , de uma -lgebra A, e de uma funo de valores reais P :AI R. K1. No-negatividade. A A, P (A) 0. K2. Normalizao Unitria. P () = 1. K3. Aditividade Finita. Se A, B so disjuntos, ento P (A B ) = P (A) + P (B ). fcil provar (tente!) utilizando induo matemtica que K3 vlida para qualquer coleo nita de eventos disjuntos par a par, ou seja, se Ai , i = 1, 2, . . . , n, so eventos n disjuntos par a par, ento P (n i=1 Ai ) = i=1 P (Ai ). Um quinto axioma, embora no tenha signicado em espaos amostrais nitos, foi proposto por Kolmogorov para garantir um certo grau de continuidade da medida de probabilidade.
CAPTULO 3. INTRODUO PROBABILIDADE K4. Continuidade Monotnica. Se para todo i > 0, Ai+1 Ai e i Ai = , ento
i
27
lim P (Ai ) = 0.2
Um forma equivalente de K4 a seguinte: K4 . -aditividade. Se {Ai } uma coleo enumervel de eventos disjuntos dois a dois, ento
P ( i=1 Ai ) =
i=1
P (Ai ).
Teorema 3.5.4: Se P satisfaz K0K3, ento P satisfaz K4 se, e somente se, ela satisfaz
K4.
Prova: Primeiro, vamos provar que K0K4 implicam o axioma da -aditividade K4 . Seja
{Ai } qualquer sequncia enumervel de eventos disjuntos par a par, e dena para todo n Bn = i>n Ai ,
n i=1 Ai = Bn (i=1 Ai ).
Claramente, para todo i n, temos que Ai e Bn so disjuntos. Por K3, temos

n
P ( i=1 Ai )
Por denio de srie numrica,
n
= P (Bn ) +
i=1
P (Ai ).
lim
n i=1
P (Ai ) =
i=1
P (Ai ).
K4 segue se conseguirmos mostrar que limn P (Bn ) = 0. Note que Bn+1 Bn , e que n=1 Bn = . Ento por K4, temos que o limite acima zero e K4 verdadeiro. Agora, vamos provar que K0K3, K4 implicam o axioma da continuidade monotnica K4. Seja {Bn } qualquer coleo enumervel de eventos satisfazendo as hipteses do axioma K4: Bn+1 Bn e n=1 Bn = . Dena, An = Bn Bn+1 e observe que {An } uma coleo enumervel de eventos disjuntos par a par. Note que
Bn = j n Aj .
Ento, por K4 temos que
P (Bn ) = P (j n Aj ) =
j n
2 K4
P (Aj ).
uma idealizao que no aceita por alguns tratamentos subjetivistas de probabilidade.
CAPTULO 3. INTRODUO PROBABILIDADE conjunto universo espao amostral, evento certo elemento resultado do experimento A conjunto A evento A conjunto vazio evento impossvel c A ou A complemento de A no ocorreu o evento A AB A interseco B os eventos A e B ocorreram AB A unio B os eventos A ou B ocorreram n An interseco dos conjuntos An todos os eventos An ocorreram n An unio dos conjuntos An ao menos um dos eventos An ocorreu Tabela 3.1: Interpretaes interessantes Como por K4 ,
28
P (Aj ) = P ( j =1 Aj ) 1,
j =1
temos que
lim P (Bn ) = lim

n n j n
P (Aj ) = 0,
logo K4 verdadeiro.
Denio 3.5.5: Uma funo que satisfaz K0K4 chamada de uma medida de probabilidade. A terna (, A, P ) chamada de espao de probabilidade. Intuitivamente quando se modela uma problema atravs de probabilidade, basicamente, o que se faz especicar cada uma das componentes da terna acima. Eventos so os elementos de A, aos quais se pode atribuir probabilidade. Probabilidade uma funo cujo argumento um conjunto. Portanto, no somente conjuntos, como tambm as operaes sobre eles, tm uma importncia fundamental em teoria da probabilidade. Entretanto, preciso que a linguagem de conjuntos seja traduzida para a linguagem de probabilidade. A Tabela 3.1, a seguir, exibe algumas dessas tradues. A idia subjacente que um experimento aleatrio foi realizado e aconteceu algum evento.
3.5.1 Exemplos de Medidas de Probabilidade

assume que todos os resultados so igualmente provveis, um exemplo de uma medida de probabilidade. Neste caso, temos que
Exemplo 3.5.6: Se for um conjunto nito, ento temos que a probabilidade clssica que
P (A) =
||A|| ||||
denido para qualquer subconjunto A de . O fato que 0 ||A|| |||| e que
||A B || = ||A|| + ||B || ||A B ||,

CAPTULO 3. INTRODUO PROBABILIDADE permitem que veriquemos que P satisfaz os axiomas de Kolmogorov.
29
Exemplo 3.5.7: Seja = {1 , 2 , . . . , n } um conjunto nito, e seja P ({i }) = pi , onde

pi 0, i 1 e n i=1 pi = 1, e P (A) = i A P ({i }). Neste caso, tambm fcil vericar que P uma medida de probabilidade vericando os axiomas.
3.5.2 Propriedades de uma Medida de Probabilidade

Teorema 3.5.8: Se P uma medida de probabilidade, ento
1. P (Ac ) = 1 P (A). 2. P () = 0. 3. P (A) 1.
Prova: Parte 1, segue do fato que = A Ac , K2, e K3, pois

1 = P () = P (A) + P (Ac ).
Parte 2, segue da Parte 1, do fato que c = , e K2, K3, pois
P () = 1 P () = 0.
Parte 3, segue do fato que 1 = P () = P (A) + P (Ac ) P (A), j que P (Ac ) 0 por K1.
Teorema 3.5.9: Monotonicidade. Se A B , ento P (A) P (B ). Prova: Note que B = A (B A), onde A e B A so disjuntos. Ento K3 implica que
P (B ) = P (A) + P (B A). O resultado segue do fato que P (B A) 0.
Corolrio 3.5.10: P (A B ) max(P (A), P (B )) min(P (A), P (B )) P (A B ).

dada por
Teorema 3.5.11: Uma expresso exata para a probabilidade de uma unio no-disjunta
P (A B ) = P (A) + P (B ) P (A B ).
Prova: Como A B = A (B A), e A e B A so disjuntos, K3 implica que P (A B ) =

P (A) + P (B A). E como B = (A B ) (B A), A B e B A so disjuntos, K3 implica que P (B ) = P (A B ) + P (B A). Logo, P (A B ) = P (A) + P (B ) P (A B ).
CAPTULO 3. INTRODUO PROBABILIDADE 30 Teorema 3.5.12: Probabilidade de Parties. Se {Ai } uma partio enumervel de feita de conjuntos em A, ento para todo B A
P (B ) =
i
P (B Ai ).
Prova: Como {Ai } uma partio, segue que

B = B = B (i Ai ) = i (B Ai ).
O resultado segue ento por K4 .
Teorema 3.5.13: Desigualdade de Boole. Para n eventos arbitrrios {A1 , . . . , An }, a

desigualdade de Boole
n
P (n i=1 Ai )
i=1
P (Ai ).
Prova: Provaremos por induo matemtica em n. A desigualdade trivialmente verdadeira
para n = 1 e verdadeira para n = 2, pois uma consequncia imediata do Teorema 3.5.11. Assuma que a desigualdade vlida para n = k e vamos provar que ela vlida para n = k +1. +1 k Para ver isto, escrevemos k i=1 Ai = Ak+1 i=1 Ai . Pela desigualdade para n = 2,
+1 k P (k i=1 Ai ) P (Ak+1 ) + P (i=1 Ai ).
Pela hiptese do passo indutivo, para n = k ,

k
P (k i=1 Ai )
i=1
P (Ai ),
portanto, a desigualdade de Boole verdadeira.
Corolrio 3.5.14: Para n eventos arbitrrios {A1 , . . . , An },

n
P (Ai )
i=1
P (Ai ) (n 1).
c Prova: Utilizando a Lei de De Morgan e a desigualdade de Boole para os eventos {Ac 1 , . . . , An },
temos
n c P (n i=1 Ai )
= 1 P (Ai )
i=1 n
P (Ac i)
=
i=1
(1 P (Ai )).
Logo,
P (Ai )
i=1
P (Ai ) (n 1).
O prximo teorema permite que possamos calcular de maneira exata a probabilidade P (n i=1 Ai ) para n eventos arbitrrios.
31 Teorema 3.5.15: Princpio da Incluso-Excluso. Seja I um conjunto genrico de ndices que um subconjunto no-vazio qualquer de {1, 2, . . . , n}. Para eventos arbitrrios {A1 , . . . , An }, P (n (1)||I ||+1 P (iI Ai ), i=1 Ai ) =
=I {1,...,n}
onde o somatrio sobre todos os 2n 1 conjuntos de ndices excluindo apenas o conjunto vazio.
No caso particular de n = 3, o princpio de incluso-excluso arma que
P (A1 A2 A3 ) = P (A1 )+P (A2 )+P (A3 )P (A1 A2 )P (A1 A3 )P (A2 A3 )+P (A1 A2 A3 ).
Prova: A prova por induo matemtica em n. O resultado trivialmente verdadeiro

para n = 1 e j foi provado para n = 2 no Teorema3.5.11. Assuma que o resultado vale para n = k e vamos provar que ele verdadeiro para n = k + 1. Como na prova da desigualdade +1 k de Boole, k i=1 Ai = Ak+1 i=1 Ai . Usando o resultado para n = 2, temos
+1 k k P (k i=1 Ai ) = P (Ak+1 ) + P (i=1 Ai ) P (Ak+1 i=1 A1 ).
Reescrevendo o ltimo termo como P (k i=1 (Ak+1 Ai )), nos d uma expresso que contm uma unio de exatamente k conjuntos. Ento, usando a hiptese do passo indutivo para os dois ltimos termos
+1 P (k i=1 Ai ) = P (Ak+1 )+
(1)||I ||+1 P (iI Ai )

=I {1,...,k}
(1)||I ||+1 P (iI (An Ai )).
=I {1,...,k}
O resultado segue ao rearranjarmos os termos destes somatrios.
Exemplo 3.5.16: Professor Lenidas est tentando calcular a probabilidade p = P (A) do

evento A, e determinou que ela uma raiz do seguinte polinmio de grau cinco: (p 3)(p 3 1)(p + 3 1)(p + 0.3)(p 0.3) = 0. Baseado nesta fato, qual o valor de p?
Exemplo 3.5.17: Se = {a, b, c}, e a lgebra A o conjunto das partes de , e a medida

de probabilidade P parcialmente denida por
P ({a, b}) = 0.5, P ({b, c}) = 0.8, P ({a, c}) = 0.7,

ento complete a especicao de P para todos os eventos em A. quais as condies que a e b devem satisfazer para que P seja uma medida de probabilidade?
Exemplo 3.5.18: Se {Ai } for uma partio enumervel de e P (Ai ) = abi , i 1, ento
CAPTULO 3. INTRODUO PROBABILIDADE 32 Exemplo 3.5.19: Em um grupo de r pessoas qual a probabilidade de haver pelo menos duas pessoas que faam aniversrio no mesmo dia, assumindo que a distribuio de aniversrios uniforme ao longo do ano e desprezando a existncia de anos bissextos? Soluo: Para determinar esta probabilidade, vamos utilizar a probabilidade clssica. O nmero de resultados possveis para os aniversrios de r pessoas 365r . O nmero de casos possveis onde todas as pessoas fazem aniversrio em dias diferentes dado por 365 364 (365 (r 1)). Portanto, o nmero de casos possveis onde pelo menos duas pessoas fazem aniversrio no mesmo dia a diferena entre o nmero total de aniversrios possveis e o nmero de casos onde as pessoas tm aniversrios em datas diferentes, ou seja, igual a
365r 365 364 (365 (r 1)).

Logo, a probabilidade deste evento :
365 364 (365 (r 1)) . 365r
Para r = 23, temos que essa probabilidade aproximadamente igual a 0, 51. E para r = 50, essa probabilidade igual a 0, 97.
(1 < n < N ) bilhetes para uma s extrao e Slvio compra n bilhetes, um para cada uma de n extraes. Qual dos dois jogadores tm mais chances de ganhar algum prmio? n Soluo: A probabilidade de Salvador ganhar algum prmio N . O nmero total de n n extraes possveis N . O nmero de casos onde Slvio no ganha nenhum prmio (N 1)n , logo o nmero de casos onde Slvio ganha algum prmio igual a N n (N 1)n . 1)n Logo, a probabilidade de Slvio ganhar algum prmio 1 (NN . n n Vamos provar por induo que Salvador tem mais chance de ganhar, ou seja, N > 1 (N 1)n , que equivale a Nn (N 1)n n > 1 . Nn N Para n = 2, temos: (N 1)2 2 1 2 =1 + 2 >1 . 2 N N N N Suponha que para n = k , temos que k (N 1)k >1 . k N N
Multiplicando esta expresso por
N 1 , N
Exemplo 3.5.20: Em uma loteria de N nmeros h um s prmio. Salvador compra n
obtemos:
N 1 k 1 k k k+1 (N 1)k+1 > ( )(1 ) = 1 + > 1 . N k+1 N N N N N2 N

de duas determinadas dessas pessoas carem no mesmo grupo?
Exemplo 3.5.21: Doze pessoas so divididas em trs grupos de 4. Qual a probabilidade

CAPTULO 3. INTRODUO PROBABILIDADE 33 Soluo: O nmero total de divises de doze pessoas em 3 grupos de 4 igual a 12 8 4 . Vamos agora contar o nmero de casos favorveis ao nosso evento. Existem 4 4 4 3 opes de escolhermos em qual grupo as duas pessoas determinadas podem car. Das 10 pessoas restantes, temos que escolher mais duas para estarem neste grupo, o que podemos 4 fazer de 10 maneiras diferentes. E temos 8 maneiras diferentes de dividir as outras 8 2 4 4 pessoas nos dois grupos restantes. Portanto, a probabilidade de duas determinadas pessoas carem no mesmo grupo : 8 4 3 10 3 2 4 4 = . 12 8 4 11 4 4 4
Exemplo 3.5.22 :
Suponha que temos em uma sala n mes cada uma com um lho. Suponha formemos duplas aleatoriamente, onde cada dupla contm uma me e um lho, qual a probabilidade de que pelo menos uma me forme uma dupla com seu prprio lho? Soluo: Seja Ai o evento que a i-sima me forma dupla com seu lho. Queremos determinar P (n i=1 Ai ). Vamos calcular esta probabilidade utilizando a frmula da incluso excluso. Note que:
(n 1)! 1 = para todo i {1, 2, . . . , n} n! n 1 (n 2)! = para i = j P (Ai Aj ) = n! n(n 1) P (Ai ) =

e em geral, para um grupo I {1, 2, . . . , n} de mes temos que
P (iI Ai ) =
Como existem
n ||I ||
(n ||I ||)! . n!
grupos de mes com cardinalidade ||I ||, temos que

n
P (n i=1 Ai )
n
=
i=1
(1)i+1 1 i!
n (n i)! i n!
=
i=1
(1)i+1
. Note que quando n , temos que esta probabilidade tende a 1 1 e
Exemplo 3.5.23: Demonstre que se P (Ai ) = 1 para i = 1, 2, . . ., ento P ( i=1 Ai ) = 1. c Soluo: Como P (Ai ) = 1, temos que P (Ai ) = 1 P (Ai ) = 0. Logo, pela desigualdade
c c c de Boole, temos P ( i=1 Ai ) i=1 P (Ai ) = 0. Logo, P (i=1 Ai ) = 0. Portanto, como pela c c c Lei de De'Morgan, i=1 Ai = (i=1 Ai ) , temos que P (i=1 Ai ) = 1 P (i=1 Ai ) = 1.
Exemplo 3.5.24: Demonstre: se A1 , A2 , . . . e B1 , B2 , . . . so eventos aleatrios do mesmo

espao de probabilidade tais que P (An ) 1 e P (Bn ) p, ento P (An Bn ) p.
CAPTULO 3. INTRODUO PROBABILIDADE Soluo: Note que

c P (An Bn ) = 1 P ((An Bn )c ) = 1 P (Ac n Bn ) c 1 P (Ac n ) P (Bn ) = P (An ) + P (Bn ) 1.
34
(3.1)
Como P (Bn ) P (An Bn ) P (An ) + P (Bn ) 1, P (An ) + P (Bn ) 1 p e P (Bn ) p, pelo teorema do confronto (ou sanduche), temos que P (An Bn ) p.
Captulo 4 Probabilidade Condicional

4.1 Probabilidade Condicional
Existem vrias possveis interpretaes de probabilidade. Por exemplo, pode-se interpretar probabilidade de um evento A como um limite das freqncias relativas de ocorrncia do evento A em realizaes independentes de um experimento. Por outro lado, a interpretao subjetiva de probabilidade associa a probabilidade de um evento A com o grau de crena pessoal que o evento A ocorrer. Em ambos os casos, probabilidade baseada em informao e conhecimento. Reviso desta base de informao ou conhecimento pode levar a reviso do valor da probabilidade. Em particular, conhecimento que determinado evento ocorreu pode inuenciar na probabilidade dos demais eventos. Considerando-se a interpretao freqentista de probabilidade, suponha que estejamos interessados em saber qual a probabilidade de um dado evento A, visto que sabe-se que um dado evento B ocorreu. Suponha que realizasse um experimento n vezes das quais o evento A (resp., B e A B ) ocorre NA (resp., NB > 0 e NAB ) vezes. Seja rA = NA /n a freqncia relativa do evento A nestas n realizaes do experimento. A probabilidade condicional de A dado que sabe-se que B ocorreu segundo esta interpretao freqentista, sugere que ela deve ser igual ao limite das freqncias relativas condicionais do evento A dado o evento B , isto , ela deve ser o limite da razo NAB /NB quando n tende ao innito. fcil provar que esta razo igual a rAB /rB , que por sua vez segundo a interpretao freqentista de probabilidade aproximadamente igual a P (A B )/P (B ) para valores grandes de n. Considerando-se uma interpretao mais subjetiva suponha que a incerteza de um agente descrita por uma probabilidade P em (, A) e que o agente observa ou ca sabendo que o evento B ocorreu. Como o agente deve atualizar sua probabilidade P (|B ) de modo a incorporar esta nova informao? Claramente, se o agente acredita que B verdadeiro, ento parece razovel requerer que
P ( B c |B ) = 0
(4.1)
Em relao aos eventos contidos em B , razovel assumir que sua chance relativa permanea inalterada se tudo que o agente descobriu foi que o evento B ocorreu, ou seja, se
35
CAPTULO 4. PROBABILIDADE CONDICIONAL A1 , A2 B com P (A2 ) > 0, ento
36 (4.2)
P (A1 ) P (A1 |B ) = P (A2 ) P (A2 |B )

Segue que (4.1) e (4.2) determinam completamente P (|B ) se P (B ) > 0.
(4.1) e (4.2), ento
Teorema 4.1.1: Se P (B > 0) e P (|B ) uma medida de probabilidade em que satisfaz

P (A|B ) = P (A B ) . P (B )
Prova: Como P (|B ) uma medida de probabilidade e satisfaz P (B c |B ) = 0, ns temos
que P (B |B ) = 1 P (B c |B ) = 1. Considerando A1 = A e A2 = B em (4.2), temos P (A) ento P (A|B ) = P para A B . Se A no um subconjunto de B , temos que A = (B ) c (A B ) (A B ). Como (A B ) e (A B c ) so eventos disjuntos, temos P (A|B ) = P (A B |B ) + P (A B c |B ). Como A B c B c e P (B c |B ) = 0, temos que P (A B c |B ) = 0. Como A B B , usando o caso anterior
P (A|B ) = P (A B |B ) =
P (A B ) . P (B )
Deste modo as interpretaes freqentista e subjetivista de probabilidade justicam a seguinte denio.
Denio 4.1.2: Seja (, A, P ) um espao de probabilidade. Se A, B A e P (B ) > 0 a

probabilidade condicional de A dado B denida por
P (A|B ) =
P (A B ) P (B )
Vamos provar que para um evento xo B que satisfaz P (B ) > 0, P (|B ) satisfaz os axiomas K1-K4 acima e realmente uma medida de probabilidade. Para provar K 1, note que para todo A A, como P (A B ) 0, ns temos
P (A B ) 0. P (B ) Para provar K 2, note que B = B , ento P ( B ) P (B ) P (|B ) = = = 1. P (B ) P (B ) P (A|B ) =

Finalmente, para provar K4 (que implica K3), note que se A1 , A2 , . . . so mutuamente exclusivos A1 B, A2 B, . . . tambm o so, ento
P (i Ai |B ) = =
P ((i Ai ) B ) P (i (Ai B )) = P (B ) P (B ) i P (Ai B ) = P (Ai |B ). P (B ) i
A probabilidade condicional tambm satisfaz as seguintes propriedades:
CAPTULO 4. PROBABILIDADE CONDICIONAL 1. P (B |B ) = 1; 2. P (A|B ) = P (A B |B ); 3. se A B , ento P (A|B ) = 1; 4. P (A B |C ) = P (A|B C )P (B |C ). Fazendo C = na propriedade 4 acima, temos que:
37
P (A B ) = P (A|B )P (B ).
Utilizando induo matemtica, pode-se facilmente provar que
P (A1 A2 . . . An ) = P (A1 )P (A2 |A1 ) . . . P (An |A1 . . . An1 ).

Um mtodo de se obter uma probabilidade (incondicional) de uma probabilidade condicional utilizando o Teorema da Probabilidade Total. Antes de enunciar este teorema precisamos recordar o que uma partio do espao amostral. Uma seqncia de eventos A1 , A2 , A3 , . . . uma partio do espao amostral se estes eventos so mutuamente exclusivos e contm todos os elementos de (i Ai = ).
todo A A
Teorema 4.1.3:
Seja a seqncia de eventos B1 , B2 , . . . uma partio de , ento para
P (A) =
i:P (Bi )=0
P (A|Bi )P (Bi )
Prova:
Como B1 , B2 , . . . uma partio de , temos que
A = A = A (i Bi ) = i (A Bi ).
Como os eventos Bi 's so mutuamente exclusivos, os eventos (A Bi )'s tambm so mutuamente exclusivos. Ento axioma K 3 implica que
P (A) = P (i (A Bi )) =
i
P (A Bi ) P (A|Bi )P (Bi ).
=
i:P (Bi )=0
P (A Bi ) =
i:P (Bi )=0
Se ns interpretarmos a partio B1 , B2 , . . . como possveis causas e o evento A corresponda a um efeito particular associado a uma causa, P (A|Bi ) especica a relao estocstica entre a causa Bi e o efeito A. Por exemplo, seja {D, Dc } uma partio do espao amostral, onde o evento D signica que um dado indivduo possui uma certa doena. Seja A o evento que determinado teste para
CAPTULO 4. PROBABILIDADE CONDICIONAL 38 c o diagnstico da doena deu positivo. Ento, P (A|D ) descreve a probabilidade do exame d positivo mesmo que o paciente esteja saudvel, a chamada probabilidade de falso positivo. P (Ac |D) a probabilidade do exame d negativo mesmo que o paciente esteja doente, a chamada probabilidade de falso negativo. Estas probabilidades determinam a qualidade do teste, quanto menores as probabilidades de falso negativo e falso positivo melhor a qualidade do teste. Caso as probabilidades P (D), P (A|D), P (A|Dc ) sejam conhecidas pode-se usando o Teorema da Probabilidade Total obter a probabilidade incondicional de determinado exame dar positivo P (A). Porm geralmente, o que se busca saber que dado que o resultado de um exame deu positivo qual a probabilidade de que o indivduo esteja doente. Pode-se obter esta probabilidade utilizando a famosa frmula de Bayes:
P (D|A) =
P (A D) P (A|D)P (D) = . c P (A D) + P (A D ) P (A|D)P (D) + P (A|Dc )P (Dc )
Mais geralmente, quando temos uma partio B1 , B2 , . . ., temos que a frmula de Bayes dada por:
P (Bi |A) = =
P (A Bi ) = j P (A Bj )
P (A Bi ) j :P (Bj )=0 P (A Bj )
P (A|Bi )P (Bi ) . j :P (Bj )=0 P (A|Bj )P (Bj )
fcil de provar esta frmula usando o Teorema da Probabilidade Total. As probabilidades P (Bi ) so usualmente chamadas de probabilidades a priori e as probabilidades condicionais P (Bi |A) so chamadas de probabilidades a posteriori. O seguinte exemplo ilustra uma aplicao da frmula de Bayes. contendo dk ( m) pixels defeituosos. No primeiro estgio do experimento uma linha escolhida ao acaso e ns no sabemos qual foi a escolha. Ns ento examinamos um pixel selecionada ao acaso nesta linha e descobrimos que o pixel defectivo (chamamos este evento de D). Qual a probabilidade de que este pixel defeituoso esteja na linha k ? Seja R = k o evento que este pixel pertencia a k -sima linha da imagem. A frmula de Bayes nos permite determinar que dado que
Exemplo 4.1.4: Considere uma imagem formada por n m pixels com a k -sima linha
P (R = k ) =
ns temos que
1 n
P (D|R = k ) =
1 dk nm n 1 di i=1 n m
dk , m
P (R = k |D) =
dk n i=1
di
Ento, mesmo que a linha tenha inicialmente sido escolhida ao acaso, dado o evento que encontramos ao acaso um pixel defectivo nesta linha, agora mais provvel que seja uma linha contendo um nmero grande de pixels defectivos dk .
CAPTULO 4. PROBABILIDADE CONDICIONAL 39 Exemplo 4.1.5: Um canal de comunicao binrio envia um dentre dois tipos de sinais, denotados por 0 e 1. Devido ao rudo, um 0 transmitido alguma vezes recebido como um 1 e um 1 transmitido alguma vezes recebido como um 0. Para um dado canal, assuma uma probabilidade de 0.94 que um 0 transmitido seja corretamente recebido como um 0 e uma probabilidade de 0.91 que um 1 transmitido seja corretamente recebido como um 1. Adicionalmente, assuma uma probabilidade de 0.45 de se transmitir um 0. Se um sinal enviado, determine,
(a) A probabilidade de que um 1 seja recebido. (b) A probabilidade de que um 0 seja recebido. (c) A probabilidade de que um 1 foi transmitido, dado que um 1 foi recebido. (d) A probabilidade de que um 0 foi transmitido, dado que um zero foi recebido. (e) A probabilidade de um erro.
Sejam os eventos
T0 = {um 0 transmitido}, T1 = {um 1 transmitido}, R0 = {um 0 recebido}, R0 = {um 1 recebido}.
Logo,
P (R0 | T0 ) = 0.94 P (R1 | T0 ) = 0.06, P (R1 | T1 ) = 0.91 P (R0 | T1 ) = 0.09, P (T0 ) = 0.45, P (T1 ) = 0.55.
(a)
logo,
R1 = (R1 T1 ) (R1 T0 ),
P (R1 ) = P (R1 | T1 )P (T1 ) + P (R1 | T0 )P (T0 ) = 0.91 0.55 + 0.06 0.45 = 0.5275.
(b)
logo,
R0 = (R0 T0 ) (R0 T1 ),
P (R0 ) = P (R0 | T0 )P (T0 ) + P (R0 | T1 )P (T1 ) = 0.94 0.45 + 0.09 0.55 = 0.4725,
ou,
P (R0 ) = 1 P (R1 ) = 1 0.5275 = 0.4725.

CAPTULO 4. PROBABILIDADE CONDICIONAL
(c)
40
P (T1 | R1 ) =
P (T1 R1 ) P (R1 ) P (R1 | T1 )P (T1 ) = P (R1 ) 0.91 0.55 = 0.9488. = 0.5275
(d)
P (T0 | R0 ) = P (T0 R0 ) P (R0 ) P (R0 | T0 )P (T0 ) = P (R0 ) 0.94 0.45 = = 0.8952. 0.4725
(e)
Logo,
E = {acontece um erro}. E = (T1 R0 ) (T0 R1 ), P (E ) = P (R0 | T1 )P (T1 ) + P (R1 | T0 )P (T0 ) = 0.09 0.55 + 0.06 0.45 = 0.0765.
mente e sem reposio, duas bolas dessa urna. Determine a probabilidade da primeira bola ser branca sabendo que a segunda bola branca. Soluo: Sejam B1 e B2 os eventos a primeira bola branca e a segunda bola branca, respectivamente. Queremos calcular P (B1 |B2 ). Utilizando a frmula de Bayes, temos
Exemplo 4.1.6: Uma urna contm 4 bolas brancas e 6 bolas pretas. Sacam-se, sucessiva-
P ( B 1 |B 2 ) =
P (B2 |B1 )P (B1 ) . c c P (B2 |B1 )P (B1 ) + P (B2 |B1 )P (B1 )

4 10 c e P (B1 )= 2 15 2 5 6 . 10
3 4 c )= 9 Mas P (B2 |B1 ) = 9 , P (B2 |B1 , P (B1 ) =
Logo,
P (B1 |B2 ) =
3 9
3 9 4 10
4 10 +4 9
6 10
1 = . 3
Embora probabilidade condicional seja bastante til, ela sofre de alguns problemas, em particular quando se quer tratar de eventos de probabilidade zero. Tradicionalmente, se P (B ) = 0, ento P (A|B ) no denida. Isto leva a um nmero de diculdades loscas em relao a eventos com probabilidade zero. So eles realmente impossveis? Caso contrrio, quo improvvel um evento precisa ser antes de ele ser atribudo probabilidade zero? Deve um evento em algum caso ser atribudo probabilidade zero? Se existem eventos com
CAPTULO 4. PROBABILIDADE CONDICIONAL 41 probabilidade zero que no so realmente impossveis, ento o que signica condicionar em eventos de probabilidade zero? Por exemplo, considere o espao de probabilidade ([0, 1], B , ) onde B a -lgebra de Borel restrita a eventos contidos em [0, 1] e uma medida de probabilidade na qual todo intervalo em [0, 1] possui probabilidade igual ao seu comprimento. Seja B = {1/4, 3/4} e A = {1/4}. Como P (B ) = 0, P (A|B ) no denida. Porm parece razovel assumir que neste caso P (A|B ) = 1/2 j que intuitivamente implica que todos os estados so equiprovveis, mas a denio formal de probabilidade condicional no nos permite obter esta concluso. Alguns dos problemas mencionados no pargrafo anterior podem ser tratados considerandose probabilidades condicionais (e no probabilidade incondicionais) como a noo fundamental, porm a discusso destes modelos est fora do escopo deste curso.
Exemplo 4.1.7: Se P (C |D) = 0, 4 e P (D|C ) = 0, 5, que evento mais provvel C ou D? Soluo: Exemplo 4.1.8: Se P (E ) = 0, 4 e P (F ) = 0, 7, o que pode-se concluir sobre P (E |F )? Soluo: Por denio, temos que:
P (E |F ) = P (E F ) . P (F )
Porm, sabemos que max(P (E ) + P (F ) 1, 0) P (E F ) min(P (E ), P (F )). Logo, 0, 1 P (E F ) 0, 4, portanto
0, 1 0, 4 P (E |F ) . 0, 7 0, 7
Exemplo 4.1.9: (Paradoxo de Monty Hall) Monty Hall foi um popular apresentador de programa de jogos em TV cujo jogo comeava mostrando ao participante 3 portas fechadas d1 , d2 , d3 , e atrs de apenas uma delas havia um prmio valioso. O participante selecionava uma porta, por exemplo, d1 , mas antes que a porta fosse aberta, Monty Hall, que sabia em que porta estava o prmio, por exemplo, d2 , abria a porta restante d3 , que no continha o prmio. O participante tinha ento permisso para car com sua porta original, d1 , ou escolher a outra porta fechada. A pergunta se melhor car com a porta original ou trocar de porta. Vamos agora utilizar a frmula de Bayes para analisar este problema. Seja G uma porta escolhida aleatoriamente para conter o prmio; Y a porta que o participante escolhe primeiro; e M a porta que Monty Hall abre. O participante no tem nenhum conhecimento a priori sobre a localizao do prmio, ou seja ele considera todas as portas equiprovveis, e isto pode ser modelado por: 1 P (G = di |Y = dj ) = ; 3 todas as portas tem a mesma probabilidade de conter o prmio no importa qual porta o participante escolhe. Se o participante escolher uma porta que no contm o prmio, Monty Hall necessariamente ter de abrir a porta que no contm o prmio, isto pode ser modelado por: P (M = di1 |Y = di2 , G = di3 ) = 1,
CAPTULO 4. PROBABILIDADE CONDICIONAL 42 onde i1 , i2 , i3 {1, 2, 3} e so distintos. Se o participante escolher corretamente, por exemplo, Y = G = di2 , ento assumimos que Monty Hall escolhe aleatoriamente entre as outras duas outras portas: 1 P (M = di1 |Y = G = di2 ) = , para di1 = di2 .1 2 Para determinar se o participante deve trocar de porta, devemos calcular
P (G = d1 , Y = d2 , M = d3 ) P (Y = d2 , M = d3 ) P (M = d3 |G = d1 , Y = d2 )P (G = d1 |Y = d2 )P (Y = d2 ) = P (M = d3 |Y = d2 )P (Y = d2 ) P (M = d3 |G = d1 , Y = d2 )P (G = d1 |Y = d2 ) = P (M = d3 |Y = d2 ) 1/3 = P (M = d3 |Y = d2 ) P (G = d1 |Y = d2 , M = d3 ) =
Para determinar o valor de P (M = d3 |Y = d2 ) utilizamos o Teorema da Probabilidade Total e a denio de probabilidade condicional:
P (Y = d2 , M = d3 ) P (Y = d2 ) P (Y = d2 , M = d3 , G = d1 ) + P (Y = d2 , M = d3 , G = d2 ) + P (Y = d2 , M = d3 , G = d3 ) = P (Y = d2 ) P (M = d3 |Y = d2 , G = d1 )P (G = d1 |Y = d2 )P (Y = d2 ) = P (Y = d2 ) P (M = d3 |Y = d2 , G = d2 )P (G = d2 |Y = d2 )P (Y = d2 ) + P (Y = d2 ) P (M = d3 |Y = d2 , G = d3 )P (G = d3 |Y = d2 )P (Y = d2 ) + P (Y = d2 ) = P (M = d3 |Y = d2 , G = d1 )P (G = d1 |Y = d2 ) +P (M = d3 |Y = d2 , G = d2 )P (G = d2 |Y = d2 ) +P (M = d3 |Y = d2 , G = d3 )P (G = d3 |Y = d2 ) 1 1 1 1 =1 + +0= . 3 2 3 2 P (M = d3 |Y = d2 ) =
, e o participante deve trocar de porta de sua escolha Logo, P (G = d1 |Y = d2 , M = d3 ) = 2 3 original d2 para d1 !
Exemplo 4.1.10: Seja D o evento que um indivduo selecionado ao acaso de uma popu-
lao tem uma doena particular, Dc seu complemento. A probabilidade que um indivduo selecionado ao acaso nesta populao tenha determinada dena pd . Existe um teste para diagnstico desta doena que sempre acusa presena da doena quando o indivduo tem a
1A
soluo depende como resolvemos este caso.
CAPTULO 4. PROBABILIDADE CONDICIONAL 43 doena. Contudo, quando o indivduo no tem a doena, o teste reporta falsamente que o indivduo tem a doena com probabilidade pt . Seja T P o evento que o teste reporta positivamente que o indivduo tem a doena. Formalmente, temos:
P (D) = pd , P (T P |D) = 1, P (T P |Dc ) = pt .

Um indivduo deve estar interessado em saber a probabilidade P (D|T P ) que ele tenha a doena dado que o teste deu positivo. Se, por exemplo, a doena for rara e pd = 0, 001, e o teste reportar falsamente com probabilidade pequena pt = 0, 05, veremos que apesar desta pequena probabilidade do teste da um resultado errado, a probabilidade do indivduo ter a doena pequena. Pela frmula de Bayes
P (D|T P ) =
P (T P |D)P (D) pd = = 0, 02. P (T P |D)P (D) + P (T P |Dc )P (Dc ) pd + pt (1 pd )
Exemplo 4.1.11: Sabemos que os eventos {B1 , B2 , B3 } so disjuntos par a par e que sua
unio igual ao espao amostral. Estes eventos tem as seguintes probabilidades P (B1 ) = 0, 2 e P (B2 ) = 0, 3. Existe um outro evento A que sabemos que P (A|B1 ) = 0, 3; P (A|B2 ) = 0, 4; e P (A|B3 ) = 0, 1. Calcule: (a) P (A) (b) P (B2 |A) nmero de 1's em um byte. Considere os seguintes eventos:
Exemplo 4.1.12: Suponha que todos os bytes tenham a mesma probabilidade. Seja W o
A = {O primeiro e o segundo bit so iguais a 1, e} B = {W um nmero mpar.}
Calcule: (a) P (A) (b) P (B ) (c) P (B |A) (d) P (A|B )
Soluo:
P (A) = P (B ) = ||B || = ||||
26 1 ||A|| = 8 = . |||| 2 4
8 1
8 3
+ 28
8 5
8 7
1 = . 2
P (B |A) =
P (A B , P (A)
CAPTULO 4. PROBABILIDADE CONDICIONAL (6)+(6)+(6) B || onde P (A B ) = ||A = 1 238 5 = 1 . Portanto, 8
44
P (B |A) = P (A|B ) =
1 8 1 4
1 = . 2
1 8 1 2
P (A B ) = B
1 = . 4
Exemplo 4.1.13: Soluo:
Se jogarmos dois dados um aps o outro e observamos o evento que a soma dos dois dados igual a 9, ento qual a probabilidade do primeiro dado ter dado resultado 4?
P (A|B ) =
P (A B ) = P (B )
1 36 4 36
1 = . 4
Em um teste de mltipla escolha, a probabilidade do aluno saber a resposta da questo p. Havendo m escolhas, se ele sabe a resposta ele responde corretamente 1 com probabilidade 1; se no sabe ele responde corretamente com probabilidade m . (a) Qual a probabilidade que a pergunta foi respondida corretamente? (b) Qual a probabilidade que o aluno sabia a resposta dado que a pergunta foi respondida corretamente?
Exemplo 4.1.14:
Soluo: Para a parte (a), usamos o Teorema da Probabilidade Total:

P (A) = P (A|B )P (B ) + P (A|B c )P (B c ) = 1 p +
Para a parte (b), usamos a frmula de Bayes
1 (1 p). m
P (B |A) =
P (A|B )P (B ) 1p = 1 c c P (A|B )P (B ) + P (A|B )P (B ) 1p+ m (1 p)
4.2 Independncia
O que exatamente signica que dois eventos so independentes? Intuitivamente, isto signica que eles no tm nada haver um com o outro, eles so totalmente no relacionados; a ocorrncia de um no tem nenhuma inuncia sobre o outro. Por exemplo, suponha que duas diferentes moedas so lanadas. A maioria das pessoas viria os resultados desses lanamentos como independentes. Portanto, a intuio por trs da frase o evento A independente do evento B que nosso conhecimento sobre a tendncia para A ocorrer dado que sabemos que B ocorreu no alterada quando camos sabendo que B ocorreu. Ento, usando probabilidades condicionais podemos formalizar esta intuio da seguinte forma, A independente de B se P (A|B ) = P (A). Mas usando a denio de probabilidade condicional, chega-se a seguinte concluso A independente de B se P (A B ) = P (A)P (B ). Como esta ltima expresso denida inclusive para o caso de P (B ) = 0, ela a expresso adotada como a denio de independncia entre eventos.
CAPTULO 4. PROBABILIDADE CONDICIONAL 45 Denio 4.2.1: O evento A independente do evento B se P (A B ) = P (A)P (B ). Note que esta denio de independncia implica que independncia um conceito simtrico em teoria da probabilidade, isto , A independente de B se e somente se B independente de A. Note que esta denio tambm implica que eventos A e B so independentes se P (A) = 0 ou P (B ) = 0, o que pode gerar algumas concluses no intuitivas se de fato P (A) = 0 ou P (B ) = 0. Por exemplo, se P (A) = 0, ento A independente dele mesmo, porm A certamente no no relacionado consigo mesmo. Similarmente, fcil provar que se P (A) = 1, A independente dele mesmo. O seguinte teorema prova que estes so os nicos casos em que um evento independente dele mesmo.
Teorema 4.2.2: A independente dele mesmo se e somente se P (A) = 0 ou P (A) = 1. Prova:

P (A A) = P (A) = P (A)P (A) P (A) = 0 ou P (A) = 1.
Intuitivamente, se A independente de B o fato que B no ocorreu, ou seja que B c ocorreu, no deve alterar a probabilidade de A. Portanto, de se esperar que se A e B so independentes, ento A e B c tambm so. O seguinte teorema prova que esta intuio verdadeira.
tambm o so.
Teorema 4.2.3: Se A e B so eventos independentes, A e B c (resp., Ac e B , Ac e B c )
Prova: Note que

A = A = A (B B c ) = (A B ) (A B c ).
Ento, como A B e A B c so mutuamente exclusivos, axioma K3 implica que
P (A) = P (A B ) + P (A B c ).
Como A e B so independentes, ns temos
P (A) = P (A)P (B ) + P (A B c ).
Rearrajando os termos e utilizando o fato que P (B c ) = 1 P (B ), temos P (A B c ) = P (A)P (B c ), como queramos demonstrar. O conceito de independncia tambm se aplica a uma coleo arbitrria de eventos {Ai }iI , onde I um conjunto de ndices. Neste caso, tm-se duas denies.
Denio 4.2.4: Uma coleo de eventos {Ai }iI independente par a par se para todo
i = j I , Ai e Aj so eventos independentes.
CAPTULO 4. PROBABILIDADE CONDICIONAL 46 Denio 4.2.5: Uma seqncia nita de eventos A1 , A2 , . . . , An , n 1, mutuamente independente se para todo I {1, . . . , n},
P (iI Ai ) =
iI
P (Ai )
E uma coleo de eventos {Ai }iI mutuamente independente se para todo J I nito, {Ai }iJ mutuamente independente. Considere os seguintes exemplos que ilustram o conceito de independncia.
Exemplo 4.2.6:
Se = {1, 2, 3, 4} e P ({w}) = 1/4, ento A = {1, 2}, B = {1, 3}, e C = {2, 3} so eventos independentes par a par. Pode-se vericar isto pelo fato que
P (A B ) = P ({1}) =
1 11 = = P (A)P (B ). 4 22
Similarmente, pode-se provar o mesmo resultado para os outros pares. Contudo, a probabilidade 1 P (A B C ) = P () = 0 = P (A)P (B )P (C ) = . 8 Ento, A, B , e C no so mutuamente independentes.
Exemplo 4.2.7: Certo experimento consiste em lanar um dado equilibrado duas vezes,
independentemente. Dado que os dois nmeros sejam diferentes, qual a probabilidade condicional de (a) pelo menos um dos nmeros ser 6, (b) a soma dos nmeros ser 8?
Soluo: Para parte (a), note que existem 30 resultados possveis para os lanamentos do dado de modo que o mesmo nmero no se repita, dos quais 10 o nmero 6 ocorre. Portanto, esta probabilidade igual a 1/3. Para parte (b), note que existem 4 resultados possveis que somam 8 dado que os nmeros so diferentes, logo esta probabilidade igual a 4/30.
ou A2 ocorrerem, mas o evento A3 no ocorrer. Se A1 , A2 , A3 so mutumente independetes e P (A1 ) = 0, 4, P (A2 ) = 0, 35, e P (A3 ) = 0, 1, ento calcule P (F ).
Exemplo 4.2.8: O evento F de um determinado sistema falhar ocorre se os eventos A1 Soluo:
Assuma que A1 , . . . , An so eventos mutuamente independentes e que P (Ai ) = pi . Ns calculamos as probabilidades dos seguintes eventos:
Exemplo 4.2.9:
O evento A o evento que todos estes eventos ocorrem, ento

n n
P (A) =
P (n i=1 Ai )
=
i=1
P (Ai ) =
i=1
pi
CAPTULO 4. PROBABILIDADE CONDICIONAL O evento B o evento que nenhum desses eventos ocorre, ento
n n
47
P (B ) =
c P (n i=1 Ai )
=
i=1
P (Ac i)
=
i=1
(1 pi )
O evento C o evento que pelo menos um desses eventos ocorre, ento C = B c

n
P (C ) = P (B ) = 1 P (B ) = 1
i=1
(1 pi )
Captulo 5 Varivel Aleatria Discreta

5.1 Introduo
Suponha que uma moeda lanada cinco vezes. Qual o nmero de caras? Esta quantidade o que tradicionalmente tem sido chamada de varivel aleatria. Intuitivamente, uma varivel porque seus valores variam, dependendo da sequncia de lanamentos da moeda realizada; o adjetivo aleatria usado para enfatizar que o seu valor de certo modo incerto. Formalmente, contudo, uma varivel aleatria no nem aleatria nem uma varivel.
Denio 5.1.1: Seja (, A, P ) um espao de probabilidade. Uma funo X : R

chamada de varivel aleatria se para todo nmero real , {w : X (w) } A.
Exemplo 5.1.2: Considere trs lanamentos de uma moeda honesta. O espao amostral
para este experimento aleatrio consiste de todas as possveis sequncias de tamanho 3 de caras e coroas, isto :
= {(cara, cara, cara), (cara, cara, coroa), (cara, coroa, cara), (cara, coroa, coroa), (coroa, cara, cara), (coroa, cara, coroa), (coroa, coroa, cara), (coroa, coroa, coroa)}.
Seja A o conjunto de todos os subconjuntos de . Neste caso qualquer funo real de uma varivel aleatria. Por exemplo, seja X a diferena entre o nmero de caras e o nmero de coroas obtidos nos trs lanamentos. Ento, X pode assumir quatro valores, 3, 1, -1, ou -3. Nosso objetivo estudar a probabilidade de X assumir cada um desses possveis valores. Como a moeda honesta cada um dos possveis resultados em tem a mesma probabilidade 1/8. Ento, por exemplo, como poderemos obter a probabilidade de X ser negativo? Recorde que a -lgebra de Borel, B , a menor -lgebra de eventos reais que contem todos os intervalos. Pode-se provar que se X uma varivel aleatria em (, A, P ), ento para todo evento B B , chamado evento Boreliano, temos que X 1 (B ) = { : X ( ) B } A. 48
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 49 Deste modo, dada uma varivel aleatria X em (, A, P ), pode-se denir uma probabilidade induzida PX no espao mensurvel (R, B ) da seguinte maneira: para todo A B , denimos PX (A) = P (X 1 (A)). Como X uma varivel aleatria, tem-se que X 1 (A) A, ento PX est bem denida. Resta provar que PX satisfaz os axiomas K1, K2, e K4 de probabilidade: K1. PX (A) = P (X 1 (A)) 0. K2. PX (R) = P (X 1 (R)) = P () = 1. K4 . Suponha que A1 , A2 , . . . so eventos Borelianos disjuntos. Ento,
PX (i Ai ) = P (X 1 (i Ai )) = P (i X 1 (Ai )) =
i
P (X 1 (Ai )) =
i
PX (Ai ).
Exemplo 5.1.3 :
No exemplo anterior, temos que se o evento de interesse A so todos os reais negativos, ento X 1 (A) so todos os resultados do experimento que nos do valores negativos para X , ou seja, so os resultados que contm menos caras que coroas: (cara, coroa, coroa), (coroa, cara, coroa), (coroa, coroa, cara) e (coroa, coroa, coroa). Portanto, PX (A) = 4 1/8 = 1/2. Vale a pena salientar que em muitos problemas, j teremos a informao sobre a distribuio induzida PX denida em (R, B ). Nestes casos, estaremos esquecendo a natureza funcional de X e nos preocupando apenas com os valores assumidos por X . Estes casos podem ser pensados como se o experimento aleatrio fosse descrito por (R, B , PX ) e X (w) = w, w R, ou seja, os resultados dos experimento aleatrio j so numricos e descrevem a caracterstica de interesse que queremos analisar. importante enfatizar que usual se referir a variveis aleatrias por letras maisculas X, Y, Z, . . . e aos valores que tais variveis podem assumir por letras minsculas x, y, z, . . .. Muitas vezes escreve-se P (X A) para representar P ({w : X (w) A}). Por exemplo, P (X 5) = P ({w : X (w) 5}).
Exemplo 5.1.4: Considere que lanamos 3 vezes uma moeda que tem probabilidade de cair cara igual 2/3 . Seja X o nmero de coroas obtido. Determine:
(a) P (X < 3). (b) P (1 < X < 3). (c) P (X > 1|X < 3).
CAPTULO 5. VARIVEL ALEATRIA DISCRETA
5.2 Funo de Distribuio Acumulada
50
Para uma varivel aleatria X , uma maneira simples e bsica de descrever a probabilidade induzida PX utilizando sua funo de distribuio acumulada.
Denio 5.2.1: A funo de distribuio acumulada de uma varivel aleatria X , representada por FX , denida por
FX (x) = PX ((, x]), x R.

A funo de distribuio acumulada FX satisfaz as seguintes propriedades: F1. Se x y , ento FX (x) FX (y ).
x y (, x] (, y ] PX ((, x]) PX ((, y ]) FX (x) FX (y ).

F2. Se xn x, ento FX (xn ) FX (x). Se xn x, ento os eventos (, xn ] so decrescentes e n (, xn ] = (, x]. Logo, pela continuidade da medida de probabilidade, tem-se que PX ((, xn ]) P ((, x]), ou seja, FX (xn ) FX (x). F3. Se xn , ento FX (xn ) 0, e se xn , ento FX (xn ) 1. Se xn , ento os eventos (, xn ] so decrescentes e n (, xn ] = . Logo, pela continuidade da medida de probabilidade, tem-se que PX ((, xn ]) P (), ou seja, FX (xn ) 0. Similarmente, se xn , ento os eventos (, xn ] so crescentes e n (, xn ] = I R. Logo, pela continuidade da medida de probabilidade, tem-se que PX ((, xn ]) P (), ou seja, FX (xn ) 1.
de probabilidade acumulada.
Teorema 5.2.2: Uma funo real G satisfaz F1F3 se e somente se G uma distribuio
Prova: A prova de que se G for uma distribuio de probabilidade acumulada, ento G satisfaz F1-F3 foi dada acima. A prova de que toda funo real que satisfaz F1-F3 uma funo de probabilidade acumulada complexa envolvendo o Teorema da Extenso de Carathodory, e est fora do escopo deste curso.
Condio F2 signica que toda funo distribuio de probabilidade acumulada FX continua direita. Ainda mais, como FX no-decrescente e possui valores entre 0 e 1, pode-se provar que ela tem um nmero enumervel de descontinuidades do tipo salto. Pela continuidade direita , o salto no ponto x igual a
FX (x) FX (x ) = FX (x) lim F (x

n
= PX ((, x]) lim PX ((, x

n
1 = lim PX ((x , x]). n n
1 ]) n
1 ) n
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 51 1 1 Como a seqncia de eventos (x n , x] decrescente e n (x n , x] = {x}. Temos que {x} Boreliano e
PX (x) = FX (x) FX (x ).1
(5.1)
Ou seja, a probabilidade da varivel aleatria X assumir o valor x igual ao salto da funo de distribuio acumulada FX no ponto x.
Exemplo 5.2.3: Determine quais das seguintes funes so funes de distribuio acumuladas, especicando a propriedade que no for satisfeita caso a funo no seja uma distribuio acumulada. (a)
ex 1+ex
(b) I[0,inf ty) (x) + [1 I[0,inf ty) (x)](1 + ex )/2 (c) e|x| (d) I[0,inf ty) (x) (e) I(0,inf ty) (x)
Exemplo 5.2.4: Considere a seguinte funo G(x).

a 2b ax G(x) = a + b(x 1) 1
se se se se
x < 0, 0 x < 1, 1 x < 2, x 2.
(a) Determine as restries que as constantes a e b devem satisfazer para que a funo G(x) seja funo de distribuio acumulada de alguma varivel aleatria X . (b) Determine o valor de P (1/2 X 3/2) em funo de a e b.
Exemplo 5.2.5: Seja K o nmero de ons emitidos por uma fonte em um tempo T . Se
FK (1) FK (1/2) = 0, 1, qual o valor de P (K = 1)?
Exemplo 5.2.6:
Uma seqncia de 10 bytes independentes foi recebida. sbido que a probabilidade igual a 0,3 que o primeiro smbolo de um byte sea igual a 0. Seja K o nmero de bytes recebidos tendo 0 como primeiro smbolo. (a) Calcule P (K = 2) (b) Calcule FK (1)
) = limxa FX (x) o limite de FX (x) quando x tende a a por valores menores que a, ou seja, o limite a esquerda FX (x) quando x tende a a.
X (a
1F
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 52 Exemplo 5.2.7: Este exemplo mostra como usar a funo de distribuio acumulada para calcular probabilidades. Lembrando que FX (x) = P (X x) = PX ((, x]).
(a) (, b] = (, a] (a, b], a b
PX ((, b]) = PX ((, a]) + PX ((a, b]) PX ((a, b]) = PX ((, b]) PX ((, a]) = FX (b) FX (a)
P (a < X b) = FX (b) FX (a).
(5.2)
(b) (a, b) {b} = (a, b]
PX ((a, b)) + PX ({b}) = PX ((a, b]) PX ((a, b)) = PX ((a, b]) PX (b) = FX (b) FX (a) P (X = b)
P (a < X < b) = FX (b ) FX (a).

O resultado em 5.3 foi obtido usando 5.1 e 5.2.
(5.3)
(c) (a, b] {a} = [a, b]
PX ((a, b]) + PX (a) = PX ([a, b]) PX ([a, b]) = PX ((a, b]) + P (X = a) = FX (b) FX (a) + P (X = a)
P (a X b) = FX (b) FX (a ).
O resultado em 5.4 foi obtido usando 5.1 e 5.2.
(5.4)
(d) [a, b) = (a, b) {a}
PX ([a, b)) = PX ((a, b)) + PX (a) = FX (b) FX (a) P (X = b) + P (X = a)
P (a X < b) = FX (b ) FX (a ).
5.5 foi obtida a partir de 5.1 e 5.2.
(5.5)
(e) (, b] = (, b) {b}
PX ((, b]) = PX ((, b)) + P (X = b) PX ((, b)) = PX ((, b]) P (X = b)
P ( < X < b) = FX (b ).
5.6 foi obtida a partir de 5.1 e 5.2.
(5.6)
5.3 Tipos de Varivel Aleatria
53
Denio 5.3.1: Existem trs tipos de variveis aleatrias:

Discreta. Uma varivel aleatria X discreta se assume um nmero enumervel de valores, ou seja, se existe um conjunto enumervel {x1 , x2 , . . .} R tal que X (w) {x1 , x2 , . . .}, w . A funo p(xi ) denida por p(xi ) = PX ({xi }), i = 1, 2, . . . e p(x) = 0 para x / {x1 , x2 , . . .}, chamada de funo probabilidade de X . Contnua. Uma varivel aleatria X contnua se existe uma funo fX (x) 0 tal que
x
FX (x) =
fX (t)dt, x R.
Neste caso, a funo fX chamada de funo densidade de probabilidade de X .
Singular. Uma varivel aleatria X singular se FX uma funo contnua cujos pontos de crescimento formam um conjunto de comprimento (medida de Lebesgue) nulo.
Pode-se provar que toda funo de distribuio de probabilidade acumulada FX pode ser decomposta na soma de no mximo trs funes de distribuio de probabilidade acumuladas, sendo uma discreta, uma contnua e outra singular. Neste curso, ns estudaremos apenas as variveis aleatrios discretas.
5.4 Varivel Aleatria Discreta

Vamos considerar agora o caso das variveis aleatrias discretas. Ns vimos na seo anterior que se uma varivel aleatria discreta, ento ns podemos denir uma funo de probabilidade p de modo que p(xi ) = PX ({xi }), i = 1, 2, . . ., onde X {x1 , x2 , . . .} e p(x) = 0 para x / {x1 , x2 , . . .}. Note que toda funo de probabilidade uma funo dos reais R e assume valores entre 0 e 1, sendo positiva para um nmero enumervel de pontos e satisfaz a seguinte propriedade i p(xi ) = 1. Por outro lado, dada uma funo p : R [0, 1], onde p positiva para um nmero enumervel de pontos {x1 , x2 , . . .} e satisfaz i p(xi ) = 1, uma funo P denida nos eventos Borelianos de modo que P (A) = xi A p(xi ), A B uma medida de probabilidade em (R, B ) ( fcil vericar que P satisfaz os axiomas de Kolmogorov e portanto uma medida de probabilidade). Logo, a distribuio de uma varivel aleatria discreta X pode ser determinada tanto pela funo de distribuio acumulada FX ou pela sua funo de probabilidade p. Em particular, temos que a funo de distribuio acumulada de uma varivel aleatria discreta X , FX (x) = P (X x) = i:xi x p(xi ), sempre uma funo degrau com saltos nos pontos de xi de altura p(xi ). 5, e 7 com probabilidades 1/2, 1/3, e 1/6, ento sua funo de distribuio acumulada :
Exemplo 5.4.1: Assuma que X uma varivel aleatria discreta que assume os valores 2,
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 0 se x < 2, 1/2 se 2 x < 5, FX (x) = 5/6 se 5 x < 7, 1 se x 7. por
54
Exemplo 5.4.2: A funo de distribuio acumulada de uma varivel aleatria X dada

0 1/4 3/8 F (x) = 1/2 3/4 1
se se se se se se
x < 0, 0 x < 1, 1 x < 3, 3 x < 6, 6 x < 10, x 10,
(a) Determine a funo probabilidade de massa de X . (b) Determine P (1 X < 6|X < 9).
Vamos agora explorar alguns exemplos importantes de variveis aleatrias discretas.
5.4.1 Aleatria.
Dizemos que X tem uma distribuio aleatria com parmetro n, onde n um nmero 1 inteiro, se X (w) {x1 , x2 , . . . , xn } e p(xi ) = n , para i {1, . . . , n}. A funo de probabilidade aleatria pode ser utilizada para modelar mecanismos de jogos (por exemplo, dados e moedas balanceados, cartas bem embaralhadas). Utilizando a propriedade de aditividade da probabilidade, fcil ver que para qualquer evento A || {x1 , x2 , . . . , xn }, temos que P (X A) = ||A . n
5.4.2 Bernoulli.
Dizemos que X tem uma distribuio Bernoulli com parmetro p, onde 0 p 1, se X (w) {x0 , x1 } e p(x1 ) = p = 1 p(x0 ). A funo de probabilidade Bernoulli pode ser utilizada para modelar a probabilidade de sucesso em uma nica realizao de um experimento. Em geral, qualquer varivel aleatria dicotmica, ou seja que assume somente dois valores, pode ser modelada por uma distribuio Bernoulli. Denomina-se de ensaio de Bernoulli, qualquer experimento que tem uma resposta dicotmica. Um exemplo clssico de um ensaio Bernoulli o lanamento de uma moeda no necessariamente balanceada.
5.4.3 Binomial.
55
Dizemos que X tem uma distribuio Binomial com parmetros n e p, onde n um nmero inteiro e 0 p 1, se X (w) {0, 1, . . . , n} e p(k ) = n pk (1 p)1k , para k {0, 1, . . . , n}. k Note que utilizando o Teorema Binomial, temos que
n n
p(k ) =
k=0 k=0
n k p (1 p)nk = (p + 1 p)n = 1. k
Logo, esta uma legtima funo probabilidade de massa. Uma distribuio binomial pode ser obtida quando se considera n repeties independentes de ensaios Bernoulli, e estamos interessados no total de vezes que nesses ensaios obtivemos valor x1 para a varivel. A funo de probabilidade binomial pode ser utilizada para modelar a quantidade de erros em um texto de n smbolos quando os erros entre smbolos so assumidos independentes e a probabilidade de erro em um smbolo do texto igual a p. Tambm pode ser utilizada para modelar o nmero de caras em n lanamentos de uma moeda que possui probabilidade p de cair cara em cada lanamento. Se p = 1/2, temos um modelo para o nmero de 1's em uma seqncia binria de comprimento n escolhida aleatoriamente ou o nmero de caras em n lanamentos de uma moeda justa. A Figura 5.4.3 nos mostra a funo probabilidade de massa da Binomial(8; 0,2).
Podemos examinar a funo probabilidade de massa binomial analiticamente para encontrarmos seu valor mais provvel. Note que a razo entre as probabilidades de dois valores consecutivos da binomial
p(k ) = p(k 1)
n! pk (1 p)nk (k)!(nk)! n! pk1 (1 p)nk+1 (k1)!(nk+1)!
nk+1 p k 1p
estritamente decrescente em k . Portanto, se
np p(1) = < 1, p(0) 1p

ento as probabilidades so sempre decrescentes em k , e o valor mais provvel 0. No outro extremo, se p p(n) = > 1, p(n 1) n(1 p)
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 56 ento as probabilidades so estritamente crescentes em k , e o valor mais provvel n. Se p 1 k+1 p < 1 < n, ento a funo comea crescendo em k , enquanto nk > 1, e depois n p 1p
k) k+1 p decresce em k . Portanto, se p(pk( = nk = 1 para algum valor de k , temos que k e 1) 1p k 1 so os valores mais provveis. Caso contrrio, o valor mais provvel ser o maior valor k) k+1 p = nk > 1, isto , o valor mais provvel ser o maior valor de k de k para o qual p(pk( 1) 1p tal que k < (n + 1)p. No exemplo da Figura 5.4.3, observe que o valor mais provvel para k = 1, pois (n + 1)p = 1,8.
Exemplo 5.4.3: Uma moeda com probabilidade 0,4 de cair cara jogada 5 vezes, qual a
probabilidade de se obter exatamente 2 coroas? Soluo: Seja X o nmero de caras obtidos. Como jogamos a moeda 5 vezes, o evento obter exatamente 2 coroas igual ao evento obter exatamente 3 caras. Portanto, P (X = 3) = 5 (0, 4)3 (0, 6)2 . 3
Exemplo 5.4.4: A taxa de sucesso de um bit em uma transmisso digital 90%. Se 20 bits forem transmitidos, qual a probabilidade de que exatamente 15 deles tenha sido transmitidos com sucesso? Qual a probabilidade de que no mximo 18 deles tenham sido transmitidos com sucesso? Exemplo 5.4.5 :
Suponha que para uma dada moeda viciada a probabilidade de que ocorram 3 caras seja igual a probabilidade que ocorram 4 caras se esta moeda for jogada 8 vezes de forma independente. Determine a probabilidade de ocorrerem 3 caras em 8 lanamentos independentes desta moeda.
5.4.4 Hipergeomtrica.
A distribuio hipergeomtrica descreve o nmero de sucessos em uma seqncia de n amostras de uma populao nita sem reposio. Por exemplo, considere que tem-se uma carga com N objetos dos quais D tm defeito. A distribuio hipergeomtrica descreve a probabilidade de que em uma amostra de n objetos distintos escolhidos da carga aleatoriamente exatamente k objetos sejam defeituosos. Em geral, se uma varivel aleatria X segue uma distribuio hipergeomtrica com parmetros N, D, e n, ento a probabilidade de termos exatamente k sucessos dada por
p(k ) =
D k
N D nk N n
Esta probabilidade positiva se: N D n k , ou seja k max(0, D + n N ), e k min(n, D). Esta frmula pode ser entendida assim: existem N possveis amostras sem reposio. n D D Existem k maneiras de escolher k objetos defeituosos e existem N maneiras de preencher n k o resto da amostra com objetos sem defeito. Quando a populao grande quando comparada ao tamanho da amostra (ou seja, N for muito maior que n) a distribuio hipergeomtrica aproximada razoavelmente bem por uma distribuio binomial com parmetros n (tamanho da amostra) e p = D/N (probabilidade de sucesso em um nico ensaio).
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 57 Exemplo 5.4.6: Suponha que uma urna contm 20 bolas brancas e 10 bolas pretas. Se 4 bolas so retiradas da urna. Determine: (a) A probabilidade de pelo menos uma bola ser branca, se as bolas so retiradas com reposio. (b) A probabilidade de pelo menos uma bola ser branca, se as bolas so retiradas sem reposio. lote com 12 peas no total. Escolhendo ao acaso 4 dessas peas, determine a probabilidade de encontrar: (a) Pelo menos 2 defeituosas. (b) No mximo 1 defeituosa. (c) No mnimo 1 boa.
Exemplo 5.4.7: Por engano 3 peas defeituosas foram misturadas com boas formando um
5.4.5 Geomtrica.
Dizemos que X tem uma distribuio Geomtrica com parmetro , onde 0 < 1, se X (w) {0, 1, . . .} e p(k ) = (1 ) k , para k {0, 1, . . .}. Utilizando o resultado de uma soma innita de uma Progresso Geomtrica, temos que

p(k ) =
k=0 k=0
(1 ) = (1 )
k=0
k = 1.
Logo, esta uma legtima funo probabilidade de massa. A funo de probabilidade Geomtrica pode ser utilizada para modelar o tempo de espera medido em unidades de tempo inteira at a chegada do prximo consumidor em uma la, at a prxima emisso de um fton, ou at a primeira ocorrncia de cara numa seqncia de lanamentos de uma moeda. Suponha que joga-se uma moeda com probabilidade de cara igual a 0 < p < 1 independentemente at que uma coroa ocorra. Seja X o tempo de espera at que coroa aparea nesta seqncia, de modo que se o primeiro lanamento for coroa temos que X = 0. Qual a probabilidade do evento X = k para k {0, 1, 2, . . .}? Note que para que X = k necessrio que os primeiros k lanamentos sejam caras e o (k + 1)-simo lanamento seja coroa, logo pela independncia dos lanamentos, temos que P (X = k ) = pk (1 p). Ou seja X uma varivel geomtrica com parmetro p.
Exemplo 5.4.8 :
Exemplo 5.4.9: Suponha que X tenha uma distribuio geomtrica com parmetro . Mostre que para quaisquer dois inteiros positivos s e t,
P (X > s + t|X > s) = P (X > t).
CAPTULO 5. VARIVEL ALEATRIA DISCRETA Soluo: Note que
58
P (X > s + t|X > s) =

Mas
P (X > s + t, X > s) P (X > s + t) = . P (X > s) P (X > s)
P (X > s + t) =
s
(1 ) k1 = s+t .
k=s+t+1
Similarmente, temos que P (X > s) = . Portanto,
P (X > s + t|X > s) = t = P (X > t).

Esta propriedade da distribuio geomtrica conhecida como falta de memria.
5.4.6 Binomial Negativa ou Pascal.

Esta distribuio uma generalizao bvia da distribuio geomtrica. Suponha que ao invs de estarmos interessados no tempo de espera at a primeira ocorrncia de um evento, estejamos interessados em calcular o tempo de espera at a r-sima ocorrncia de um evento. Seja Y o tempo de espera necessrio a m de que um evento A possa ocorrer exatamente r vezes. Temos que Y = k se, e somente se, A ocorrer na (k + 1)-sima repetio e A tiver ocorrido r 1 vezes nas k repeties anteriores. Assumindo independncia entre os k experimentos, esta probabilidade igual p r pr1 (1 p)kr+1 . Portanto, 1
P (Y = k ) =
k pr (1 p)kr+1 , onde k r 1. r1
Note que se r = 1, temos que Y tem uma distribuio geomtrica com parmetro = 1 p. No caso geral, dizemos que Y tem uma distribuio Binomial Negativa ou Pascal.
Relao entre as Distribuies Binomial e Binomial Negativa.

Suponhamos que X tenha distribuio binomial com parmetros n e p, ou seja, X igual ao nmero de sucessos em n ensaios repetidos de Bernoulli com probabilidade de sucesso p. Suponhamos que Y tenha uma distribuio Binomial Negativa com parmetros r e p, ou seja, Y + 1 o nmero de ensaios de Bernoulli necessrios para se obter r sucessos com probabilidade de sucesso p. Ento, temos que {X r} = Y + 1 n, ou seja, o nmero de sucessos em n ensaios maior ou igual a r se, e somente se, o tempo de espera para o r-simo sucesso for menor ou igual a n 1. Portanto,
P (X r) = P (Y n 1).
Observe que estas duas distribuies tratam de ensaios de Bernoulli repetidos. A distribuio binomial surge quando lidamos com um nmero xo de ensaios e estamos interessados no nmero de sucessos que venham a ocorrer. A distribuio binomial negativa encontrada quando xamos o nmero de sucessos e ento registramos o tempo de espera necessrio.
5.4.7 Zeta ou Zipf.
59
Dizemos que X tem uma distribuio Zeta ou Zipf com parmetro , onde > 1, se X (w) {1, 2, . . .} e k p(k ) = , k = 1, 2, . . . , ()
conhecida como a funo Zeta de Riemann. onde () = k=1 k A funo de probabilidade Zeta ou Zipf um exemplo de uma distribuio de cauda pesada cuja importncia cresceu bastante desde meados dos anos 1990. As aplicaes desta funo de probabilidade incluem: nmero de consumidores afetados por um blackout, tamanhos de arquivos solicitados em transferncia via Web e atraso de pacotes na internet.
Exemplo 5.4.10: Os tamanhos de arquivos armazenados em um grande sistema de arquivos Unix segue uma distribuio Zeta com parmetro quando estes tamanhos so medidos em unidades de kilobytes.
(a) Se os tamanhos dos arquivos de 1KB so 10.000 vezes mais provveis que tamanhos de arquivos de 1MB, ento qual o valor do parmetro ? (b) Quanto mais provvel so tamanhos de arquivos de 1MB em comparao com tamanhos de arquivos de 1GB?
5.4.8 Poisson.
Dizemos que X tem uma distribuio Poisson com parmetro , onde 0, se X (w) k {0, 1, . . .} e p(k ) = e , para k {0, 1, . . .}. k! Usando o resultado da expanso em srie de Taylor da funo exponencial, temos que para todo x real, xk x e = . k!
k=0
Utilizando este fato, temos que

p(k ) =
k=0 k=0
e k k = e = e e = 1. k! k ! k=0
Logo, esta uma legtima funo probabilidade de massa. A funo de probabilidade Poisson utilizada para modelar a contagem do nmero de ocorrncias de eventos aleatrios em um certo tempo T : nmero de ftons emitidos por uma fonte de luz de intensidade I ftons/seg em T segundos ( = IT ), nmero de clientes chegando em uma la no tempo T ( = CT ), nmero de ocorrncias de eventos raros no tempo T ( = CT ). ento qual a probabilidade de pelo menos 2 ftons serem emitidos no tempo T ?
Exemplo 5.4.11: Se a probabilidade de 0 ftons serem emitidos no tempo T igual a 0,1,
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 60 Podemos analisar o valor mais provvel de uma distribuio de Poisson, atravs da razo de dois valores sucessivos da funo probabilidade de massa:
pk+1 = . pk k+1
Note que esta razo estritamente decrescente em k . Logo, {pk } sempre decrescente se < 1, decresce aps p0 = p1 se = 1, e cresce inicialmente se > 1 e eventualmente decresce qualquer que seja o valor de . Formalmente, um valor mais provvel de uma distribuio de Poisson denido como k se pk +1 pk e pk 1 pk . (Note que podem existir valores adjacentes que possuam o mesmo valor.) Mas esta condio equivalente a,
k k + 1, ou 1 k .
Note que se tomarmos k como sendo o maior inteiro menor ou igual a esta restrio satisfeita, e portanto este um valor mais provvel desta distribuio. A Figura 5.4.8 nos mostra a funo probabilidade de massa da Poisson para 3 valores de parmetros 1, 4, e 10.
Exemplo 5.4.12: Suponha que o nmero de clientes que chegam em um banco segue uma distribuio de Poisson. Se a probabilidade de chegarem 3 clientes for o triplo da de chegarem 4 clientes em um dado perodo de 10 minutos. Determine qual o nmero mais provvel de clientes que chegam em um perodo de 1 hora neste banco.
5.5 Poisson como um Limite de Eventos Raros de Binomial

Suponhamos que chamadas telefnicas cheguem em uma grande central, e que em um perodo particular de trs horas (180 minutos), um total de 270 chamadas tenham sido recebidas, ou seja, 1,5 chamadas por minuto. Suponhamos que queiramos calcular a probabilidade de serem recebidas k chamadas durante os prximos trs minutos. Ao considerar o fenmeno da chegada de chamadas, poderemos chegar concluso de que, a qualquer instante, uma chamada telefnica to provvel de ocorrer como em qualquer
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 61 outro instante. Como em qualquer intervalo de tempo, temos um nmero innito de pontos, vamos fazer uma srie de aproximaes para este clculo. Para comear, pode-se dividir o intervalo de 3 minutos em nove intervalos de 20 segundos cada um. Poderemos ento tratar cada um desses nove intervalos como um ensaio de Bernoulli, durante o qual observaremos uma chamada (sucesso) ou nenhuma chamada = 0, 5. Desse modo, podere(falha), com probabilidade de sucesso igual a p = 1, 5 20 60 9 mos ser tentados a armar que a probabilidade de 2 chamadas igual a 9 (0, 5)9 = 128 . 2 Porm, este clculo ignora a possibilidade de que mais de uma chamada possa ocorrer em um nico intervalo. Ento, queremos aumentar o nmero n de subintervalos de tempo de modo que cada subintervalo corresponde a 180 segundos e ento a probabilidade de ocorrnn 180 cia de uma chamada em um subintervalo igual a p = 1, 5 60 . Desta maneira temos que n np = 4, 5 permanece constante ao crescermos o nmero de subintervalos. Utilizando novamente o modelo binomial, temos que a probabilidade de ocorrerem k chamadas dada por: n 4,5 k ,5 nk ( n ) (1 4n ) . Queremos saber ento o que acontece com esta probabilidade quando k n . A resposta como veremos a seguir que esta distribuio tende a distribuio de Poisson e este resultado conhecido como limite de eventos raros. Consideremos a expresso geral da probabilidade binomial,
p(k ) =
n k n! n(n 1) (n k + 1) k p (1 p)nk = pk (1 p)nk = p (1 p)nk . k k !(n k )! k!
Como queremos estudar o caso em que np constante, faamos np = , ou seja, p = /n e 1 p = n . Ento, n
n(n 1) (n k + 1) k n nk ( ) ( ) k! n n k 1 k1 = [(1)(1 ) (1 )][1 ]nk k! n n n p(k ) =

j Fazendo n , temos que os termos da forma (1 n ), para 1 j k 1, tendem para 1 e como existe um nmero xo k 1 deles, o seu produto tambm tende a 1. O mesmo ocorre com (1 )k . Finalmente, por denio do nmero e, temos que (1 )n e n n quando n . Portanto, k lim p(k ) = e , n k! ou seja obtemos a expresso de Poisson. Ento, provamos o seguinte teorema:
Teorema 5.5.1: Se limn npn = > 0, ento

n
lim
k n k pn (1 pn )nk = e . k k!
Este resultado importante tanto para motivar a forma da distribuio de Poisson, como tambm fornece um mtodo para aproximar o clculo de uma probabilidade que pode ser
CAPTULO 5. VARIVEL ALEATRIA DISCRETA 62 feito a partir da distribuio binomial pela distribuio Poisson, ou seja, em geral, se np = e n for um nmero grande, ento vlida a seguinte aproximao:
p(k ) =
e k n k p (1 p)nk . k k!
Exemplo 5.5.2: Ao formar nmeros binrios com n dgitos, a probabilidade de que um
dgito incorreto possa aparecer 0,002. Se os erros forem independentes, qual a probabilidade de encontrar k dgitos incorretos em um nmero binrio de 25 dgitos? Se um computador forma 106 desses nmeros de 25 dgitos por segundo, qual a probabilidade de que pelo menos um nmero incorreto seja formado durante qualquer perodo de 1 segundo? Soluo: A probabilidade de que k dgitos sejam incorretos em um nmero binrios de 25 dgitos igual a 25 (0,002)k (0,998)25k . Em particular, a probabilidade de que pelo k menos um dgito seja incorreto igual a 1 (0,998)25 0,049. Se tivssemos usado a aproximao pela Poisson ento teramos uma Poisson com parmetro 25 0,002 = 0,05, logo a probabilidade de pelos menos um dgito incorreto neste nmero de 25 dgitos seria 1 e0,05 0,049. A probabilidade de que pelo menos um nmero incorreto seja formado durante o perodo 6 de 1 segundo igual a 1 (0,049)10 1 e49000 1.
Captulo 6 Esperana e Momentos de Variveis Aleatrias Discretas

6.1 O Conceito de Esperana
O conceito de Esperana ou Valor Esperado de uma varivel aleatria X , ou a mdia to antigo quanto o prprio conceito de probabilidade. Na verdade, at possvel denir probabilidade em termos de esperana, mas esta no uma maneira comum de se apresentar a teoria. Existem quatro tipos de interpretaes da Esperana: 1. Parmetro m de uma medida de probabilidade, funo de distribuio, ou funo probabilidade de massa, tambm conhecido como mdia. 2. Um operador linear em um conjunto de variveis aleatrias que retorna um valor tpico da varivel aleatria interpretado como uma medida de localizao da varivel aleatria. 3. mdia do resultado de repetidos experimentos independentes no longo prazo. 4. preo justo de um jogo com pagamentos descritos por X .
6.1.1 Denio da Esperana

Vamos motivar a denio de esperana considerando o clculo do resultado mdio de 1000 lanamentos de um dado. Uma maneira de calcular este resultado mdio seria somar todos os resultados e dividir por 1000. Uma maneira alternativa seria calcular a frao p(k ) de todos os lanamentos que tiveram resultado igual a k e calcular o resultado mdio atravs da soma ponderada:
1p(1) + 2p(2) + 3p(3) + 4p(4) + 5p(5) + 6p(6).

Quando o nmero de lanamentos se torna grande as fraes de ocorrncia dos resultados tendem a probabilidade de cada resultado. Portanto, em geral denimos a esperana de uma varivel discreta como uma soma ponderada onde as probabilidades so os pesos de ponderao. 63
CAPTULO 6. ESPERANA E MOMENTOS DE VARIVEIS ALEATRIAS DISCRETAS
64
Denio 6.1.1: Se X uma varivel aleatria discreta assumindo valores {x1 , x2 , x3 , . . .}

com probabilidade {p1 , p2 , p3 , . . .}, respectivamente, ento sua esperana dada pela frmula
EX =
i:xi <0
xi pi +
i:xi 0
xi p i ,
desde que pelo menos um dos somatrios seja nito. Em caso os dois somatrios no sejam nitos, a esperana no existe.
Exemplo 6.1.2: Considere uma varivel aleatria X tal que: P (X = 1) = 0.25, P (X =

0) = 0.5 e P (X = 2) = 0.25. Ento, EX = 1(0.25) + 0(0.5) + 2(0.25) = 0.25. 1/2. Ento,
Exemplo 6.1.3: Considere uma varivel aleatria X tal que: P (X = a) = P (X = a) =

EX = a(0.5) + a(0.5) = 0.
Note ento que muitas variveis aleatrias diferentes podem ter o mesmo valor esperado ou esperana. ( s variar o valor de a no exemplo anterior.)
Exemplo 6.1.4:
tribuio de probabilidade aleatria com parmetro n, temos que sua esperana dada por:
n n
Aleatria. Se X {1, 2, . . . , n} for uma varivel aleatria com diskp(k ) =

k=1 k
EX =
1 1 k = n n
k=
k
1 n(n + 1) n+1 = . n 2 2
Onde utilizamos a frmula da soma dos primeiros n termos de uma progresso aritmtica.
Exemplo 6.1.5: Bernoulli. Se X {0, 1} for uma varivel aleatria com distribuio de
probabilidade Bernoulli com parmetro p, temos que sua esperana dada por:
EX = 0(1 p) + 1(p) = p.
Exemplo 6.1.6: Binomial. Se X for uma varivel aleatria com distribuio de probabilidade Binomial com parmetros n e p, temos que sua esperana dada por:
n k EX = k p (1 p)nk = k k=0
n
k
k=1
n! pk (1 p)nk k !(n k )!
n
n
k=1
n 1 k1 (n 1)! pk (1 p)nk = np p (1 p)nk = np. k 1 (k 1)!(n k )! k=1
Onde utilizamos o Teorema Binomial na ltima igualdade.
65
Exemplo 6.1.7 :
probabilidade Geomtrica com parmetro , temos que sua esperana dada por:
k
Geomtrica. Se X for uma varivel aleatria com distribuio de
EX =
k=0
k (1 ) =
k=1
k (1 ) =
k=1 j =1
(1 ) k
= (1 )
j =1 k=j
k =
j =1
j =
Onde utilizamos a frmula da soma innita de uma progresso geomtrica com razo .
Exemplo 6.1.8: Binomial Negativa. Se X for uma varivel aleatria com distribuio
de probabilidade Binomial Negativa com parmetros r e p, temos que sua esperana dada por:
EX =
k =r 1
k k (k + 1) pr (1 p)kr+1 ) 1 pr (1 p)kr+1 = ( r 1 r1 k=r1
=(
(k + 1)k ! pr (1 p)kr+1 ) 1 ( r 1)!( k r + 1)! k=r1
(k + 1)! r = ( pr+1 (1 p)k+1r ) 1 p k=r1 r!(k + 1 r)!

Substituindo j = k + 1 e s = r + 1 no somatrio, temos
r (j )! r EX = ( ps (1 p)j s+1 ) 1 = 1 p j =s1 (s 1)!(j s + 1)! p

Onde utilizamos o fato que o somatrio igual soma da funo probabilidade de massa de uma varivel aleatria Binomial Negativa para todos os valores que tem probabilidade positiva, e portanto, igual a 1.
Exemplo 6.1.9: Poisson. Se X for uma varivel aleatria com distribuio de probabilidade Poisson com parmetros , temos que sua esperana dada por:
e k = EX = k k ! k=0
e k e k1 k = = . k ! ( k 1)! k=1 k=1
66
Exemplo 6.1.10: Zeta. Se X for uma varivel aleatria com distribuio de probabilidade
Zeta com parmetro > 2, temos que sua esperana dada por:
EX =
k=1
k 1 = () ()
k (1) =
k=1
( 1) , ()
onde () =
k=1
k .
Exemplo 6.1.11: Hipergeomtrica. Se X for uma varivel aleatria com distribuio de probabilidade Hipergeomtrica com parmetro N, D, n, temos que sua esperana dada por:
n
EX = nD = N
k=0 n
D k
N D n k N n
=
k=1
D!(N D)!(N n)!n! k !(D k )!(n k )!(N D n + k )!N !

n D1 N D k1 nk N 1 n 1
k=1
(D 1)!(N D)!(N n)!(n 1)! nD = (k 1)!(D k )!(n k )!(N D n + k )!(N 1)! N
k=1
Substituindo no somatrio D = D 1, k = k 1, n = n 1 e N = N 1, temos
nD EX = N k =0
D k
N D n k N n
nD . N
Onde utilizamos o fato que o somatrio igual soma da funo probabilidade de massa de uma varivel aleatria Hipergeomtrica para todos os valores que tem probabilidade positiva, e portanto, igual a 1.
6.2 Funes de Variveis Aleatrias

Muitas vezes sabemos a distribuio de probabilidade que descreve o comportamento de uma varivel aleatria X denida no espao mensurvel (, A), mas estamos interessados na descrio de uma funo Y = H (X ). Por exemplo, X pode ser uma mensagem enviada em um canal de telecomunicaes e Y ser a mensagem recebida. Nosso problema determinar P (Y A), onde A um evento Boreliano, dado PX . Para determinarmos esta probabilidade, estaremos interessados na imagem inversas a funo H , ou seja, a probabilidade do evento {Y A} ser por denio igual a probabilidade do evento {X H 1 (A)}, onde H 1 (A) = {x I R : H (x) A}. Para que esta probabilidade esteja bem denida, precisamos restringir H tal que H 1 (A) seja um evento boreliano para todo A boreliano, caso contrrio no poderemos determinar P ({X H 1 (A)}). Note que Y tambm pode ser
67
vista como uma funo do espao amostral , Y ( ) = H (X ( )) para todo . Visto dessa maneira Y uma varivel aleatria denida em (, A), pois para todo boreliano A Y 1 (A) = X 1 (H 1 (A)) e como por suposio H 1 (A) boreliano e X uma varivel aleatria, temos que X 1 (H 1 (A)) A e portanto satisfaz a denio de uma varivel aleatria. Trataremos esse problema apenas no caso de variveis aleatrias discretas. Neste caso para qualquer funo H , temos que Y = H (X ) uma varivel aleatria discreta. Suponha que X assuma os valores x1 , x2 , . . . e seja H uma funo real tal que Y = H (X ) assuma os valores y1 , y2 , . . .. Vamos agrupar os valores que X assume de acordo os valores de suas imagens quando se aplica a funo H , ou seja, denotemos por xi1 , xi2 , xi3 , . . . os valores de X tal que H (xij ) = yi para todo j . Ento, temos que

P (Y = yi ) = P (X {xi1 , xi2 , xi3 , . . .}) =

j =1
P (X = xij ) =
j =1
pX (xij ),
ou seja, para calcular a probabilidade do evento {Y = yi }, acha-se o evento equivalente em termos de X , isto , todos os valores xij de X tal que H (xij ) = yi e somam-se as probabilidades de X assumir cada um desses valores.
Exemplo 6.2.1:
Admita-se que X tenha os valores possveis 1, 2, 3, . . . e suponha que P (X = n) = (1/2)n . Seja Y = 1 se X for par e Y = 1 se X for mpar. Ento, temos que

P (Y = 1) =
n=1
(1/2)
2n
=
n=1
(1/4)n =
1/4 = 1/3. 1 1/4
Conseqentemente,
P (Y = 1) = 1 P (Y = 1) = 2/3.
6.3 Esperana de Funes de Variveis Aleatrias Discretas.

Como vimos anteriormente, se X for uma varivel aleatria discreta e se Y = H (X ), ento Y tambm ser uma varivel aleatria discreta. Conseqentemente, pode-se calcular EY . Existem duas maneiras de calcular EY que so equivalentes.
Denio 6.3.1: Seja X uma varivel aleatria discreta e seja Y = H (X ). Se Y assumir

os seguintes valores y1 , y2 , . . . e se p(yi ) = P (Y = yi ), denimos:
EY =
i=1
yi p(yi ).
68
Conforme vimos na seo anterior podemos determinar as probabilidades p(yi ) dado que sabemos a distribuio de X . No entanto, podemos encontrar EY sem preliminarmente encontrarmos a distribuio de probabilidade de Y , partindo-se apenas do conhecimento da distribuio de probabilidade de X , conforme mostra o seguinte teorema.
Teorema 6.3.2: Seja X uma varivel aleatria discreta assumindo os valores x1 , x2 , . . . e

seja Y = H (X ). Se p(xi ) = P (X = xi ), temos
EY = E (H (X )) =
i=1
H (xi )p(xi ).
Prova: Vamos re-ordenar o somatrio
H (xi )p(xi ), agrupando os termos onde xi tem a mesma imagem de acordo com a funo H , ou seja, sejam xi1 , xi2 , . . ., todos os valores xi tal que H (xij ) = yi para j 1, onde y1 , y2 , . . . so os possveis valores de Y . Desse modo podemos reescrever

i=1
H (xi )p(xi ) =
i=1 i=1 j =1
H (xij )p(xij ) =
i=1
yi
j =1
p(xij ) =
i=1
yi p(yi ) = EY.
Y = X 2 , vamos calcular EY . Utilizando o Teorema 6.3.2, temos
Exemplo 6.3.3: Suponha que X uma varivel aleatria Poisson com parmetro . Seja
2 k 2 k k
EY = = e
k e
k=0 2 k=2
k!
k2
=
k=1
k e
k!
=
k=1
k (k 1)e
k!
+
k=1
ke
k k!
+ = 2 + . (k 2)!
6.4 Propriedades da Esperana

As seguintes propriedades so aplicaes imediatas da denio de esperana: 1. P (X = c) = 1 EX = c. 2. P (X 0) = 1 EX 0. 3. E (aX ) = aEX , onde a um nmero real qualquer. Esta propriedade segue facilmente da expresso da esperana de uma funo de varivel aleatria.
69
4. E (X + Y ) = EX + EY . A prova desta propriedade envolve variveis aleatrias bidimensionais, que est fora do escopo deste curso. 5. P (X Y ) = 1 EX EY . Propriedade 5 segue das propriedades 2, 3, e 4, pois
P (X Y ) = P (X Y 0),
o que, pela propriedade 2, implica que E (X Y ) 0. Pela propriedade 4, temos que E (X Y ) = EX + E (Y ). Finalmente, pela propriedade 3, temos que E (X Y ) = EX EY , ou seja podemos concluir que EX EY 0. 6. Se X tem uma distribuio simtrica em torno de a, ou seja, P (X a x) = P (X a x), e se a esperana de X tiver bem denida, ento EX = a. Para provar esta expresso, primeiro note que se X simtrica em relao a a ento Y = X a simtrica em relao a zero. Se provarmos que EY = 0, ento segue da linearidade da esperana que EX = a. No caso discreto, como Y simtrica em torno de 0, temos que p(xi ) = p(xi ) para todo xi , portanto segue que EY = i xi p(xi ) = 0. Pode-se denir outras medidas de posio de uma varivel aleatria, tais como: mediana e moda. A mediana de uma v.a. X qualquer nmero m tal que P (X m) 0,5 e P (X m) 0,5. Por exemplo, se X assume os valores 1, 0, 1 com probabilidades 1/4, 1/4, 1/2, respectivamente, ento qualquer nmero no intervalo fechado de 0 a 1. A moda de uma varivel aleatria discreta o seu valor mais provvel, no necessariamente nico. Em distribuies unimodais simtricas, isto , distribuies tal que existe um nmero m tal que P (X m x) = P (X m x) para todo x I R, a esperana (se bem denida), mediana, e moda coincidem e so iguais a m.
6.5 Momentos
Momentos do informaes parciais sobre a medida de probabilidade P , a funo de distribuio acumulada, ou a funo probabilidade de massa de uma varivel aleatria discreta X . Momentos de X so esperanas de potncias de X .
Denio 6.5.1:
Para qualquer inteiro no-negativo n, o n-simo momento da varivel aleatria X EX , se esta esperana existe.
n
Na seo anterior, vimos que o segundo momento de uma varivel aleatria Poisson com parmetro dado por: 2 + . Vamos agora calcular o segundo momento de uma varivel
CAPTULO 6. ESPERANA E MOMENTOS DE VARIVEIS ALEATRIAS DISCRETAS aleatria X Binomial com parmetros n e p:
n
70
EX =
k=0 n
n k p (1 p)nk = k
k2
k=1 n
n! pk (1 p)nk = k !(n k )!
n! n! pk (1 p)nk + pk (1 p)nk k k (k 1) k !(n k )! k !(n k )! k=1 k=1

n
n(n 1)p2
k=2
(n 2)! pk2 (1 p)nk + np (k 2)!(n k )!

m
= n(n 1)p
2 j =0
(m)! pj (1 p)mj + np = n(n 1)p2 + np. (j )!(m j )!
Teorema 6.5.2: Se j < k , ento

|EX k | < |EX j | <
Prova: Vamos provar apenas para o caso em que X uma varivel aleatria discreta. Por
hiptese, temos que existem constantes nitas c1 e c2 tais que:
c1 >
i:xi 0
xk i p(xi ), e c2 > |
i:xi <0
xk i p(xi )|.
Ento, para j < k
c1 >
i:xi 0
xk i p(xi )
i:xi 1
xk i p(xi )
i:xi 1
xj i p(xi ) xj i p(xi ) p(xi )

i:0xi 1 i:xi 0
i:xi 0
xj i p(xi )
i:0xi 1
xj i p(xi )
i:xi 0
xj i p(xi ) 1
Portanto,
0
i:xi 0
xj i p(xi ) < c1 + 1 < . xj i p(xi ) nito.
Um clculo similar prova que
i:xi <0
Portanto, temos que momentos de ordem superiores nitos implicam momentos de ordem inferiores nitos.
71
6.5.1 Momentos Centrais

Denio 6.5.3: Se X uma varivel aleatria seu n-simo momento central : E (X
EX )n , se esta esperana existir.
Note que o primeiro momento central zero, pois E (X EX ) = EX EEX = EX EX = 0. O segundo momento central conhecido como varincia e denota-se por V arX . A varincia pode ser tambm calculada por:
V arX = E (X EX )2 = E (X 2 2XEX + (EX )2 ) = EX 2 2E (XEX ) + E ((EX )2 ) = EX 2 2(EX )2 + (EX )2 = EX 2 (EX )2 . (6.1)

Do Teorema Binomial e da linearidade da esperana, temos
n
E (X EX ) =
k=0
n (EX )nk EX k k
n
EX = E (X EX + EX ) =
k=0
n (EX )nk E (X EX )k . k
Como um corolrio, temos que o n-simo momento central existe se, e somente se, o n-simo momento existe.
Exemplo 6.5.4: Considere uma varivel aleatria X tal que

P (X = m a) = P (X = m + a) = 1 1 EX k = [(m a)k + (m + a)k ]. 2 2
1 EX = m, EX 2 = [2m2 + 2a2 ] = m2 + a2 , V arX = a2 . 2 Este exemplo, mostra que podemos encontrar uma varivel aleatria bem simples possuindo qualquer esperana e varincia predeterminadas.
Exemplo 6.5.5 :
(Aleatria ou Uniforme Discreta.) Se X tem uma distribuio uniforme discreta assumindo os valores {x1 , x2 , . . . , xn } com mesma probabilidade, ento:
V arX =
1 n
x2 i
i=1
1 ( xi )2 . n2 i=1
Exemplo 6.5.6: (Binomial.) J demonstramos que se X tem uma distribuio binomial, ento EX = np e E (X 2 ) = n(n 1)p2 + np. Portanto, V arX = n(n 1)p2 + np n2 p2 = np(1 p).
O desvio-padro de uma varivel aleatria X denido como a raiz quadrada da varincia, (X ) = V arX .
72
Propriedades da Varincia
As seguintes propriedades da varincia so conseqncias imediatas de sua denio. 1. V arX 0. 2. Se X = c, V ar(X ) = 0.
Prova: Temos que EX = c, logo V ar(X ) = E (X c)2 = E (0) = 0.

3. V ar(X + a) = V arX , onde a uma constante real.
Prova:
V ar(X + a) = E (X + a)2 (E (X + a))2 = EX 2 + 2aEX + a2 (EX )2 2aEX a2 = EX 2 (EX )2 = V arX.
4. V ar(aX ) = a2 V arX
Prova:
V ar(aX ) = E (aX )2 (E (aX ))2 = a2 EX 2 a2 (EX )2 = a2 V arX.
A tabela a seguir contm a esperana e a varincia das distribuies de probabilidade discretas mais comuns. Distribuio Bernoulli(p) Binomial(n, p) Geomtrica(p) Poisson() Hipergeomtrica(N, D, n) Esperana p np
(1p) p
Varincia p(1-p) np(1 p)

(1p) p2
nD N
nD (N D)(N n) N N (N 1)
Referncias Bibliogrcas
1. Meyer, P. (1983), "Probabilidade - Aplicaes Estatstica", 2a. edio, Livros Tcnicos e Cientcos Editora, Rio de Janeiro. 2. Davenport Jr., W. (1987), "Probability and Random Processes - an introduction for applied scientists and engineers", McGraw-Hill Book Company Inc. 3. Fine, T. (2006), Probability and Probabilistic Reasoning for Electrical Engineering, Prentice Hall. 4. Lima, E. L. et al. (2004), "A matemtica do Ensino Mdio", Volume I, Sociedade Brasileira de Matemtica. 5. Lima, E. L. et al. (2004), "A matemtica do Ensino Mdio", Volume II, Sociedade Brasileira de Matemtica.
73

AulasET5812010 2

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

AulasET5812010 2

Caricato da

Copyright:

Formati disponibili

Notas de Aula do Curso

Recife, agosto de 2010. Leandro Chaves Rgo, Ph.D.

Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . Independncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 Varivel Aleatria Discreta

5.5 6.1 6.2 6.3 6.4 6.5

6 Esperana e Momentos de Variveis Aleatrias Discretas

Captulo 1 Reviso Bsica de Teoria dos Conjuntos

A = {0, 1, 2, 3, 5, 8, 13}, B = {0, 1, 2, . . . , 1000}.

C = {x : x inteiro e positivo} ou D = {x : x par}.

{1, 2, 3} = {2, 3, 1}.

Nn = {0, 1, 2, . . . , n 1}, Z = {x : x um inteiro}, Z + = {x : x um inteiro positivo}, Q = {x : x racional}.

0/1 1/1 2/1 3/1

0/2 1/2 2/2 3/2

0/3 1/3 2/3 3/3

0/1, 1/1, 1/2, 2/1, 1/3, 3/1, . . .

Autor: Leandro Chaves Rgo

Autor: Leandro Chaves Rgo

= {} = {x : x I R e x < x} ou = (a, a).

1.2 Operaes com Conjuntos

Autor: Leandro Chaves Rgo

Prova: Suponha que A B . Ento, A, ou B , o que por sua vez implica

A prova para o caso da interseco anloga e deixada como Exerccio. 3. Associatividade: A (B C ) = (A B ) C ) e A (B C ) = (A B ) C )

Prova: Suponha que (A B )c . Ento, / (A B ), o que por sua vez implica

Autor: Leandro Chaves Rgo

iI Ai = { : pertence a pelo menos um dos conjuntos Ai , onde i I , }

iI Ai = { : pertence a todo Ai , onde i I .}

Exemplo 1.2.3: Se Ai = [1, 2 + 1 ), i I N , ento iI N Ai = [1, 3) e iI N = [1, 2]. i

1.3 Produto Cartesiano

Denio 1.3.1: Produto Cartesiano. O produto Cartesiano A B de dois conjuntos

Por exemplo, se A = {1, 2, 3} e B = {c, d}, ento:

Autor: Leandro Chaves Rgo

CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS

1.4 Conjunto das Partes

Teorema 1.4.3: Se A um conjunto e 2A o conjunto das partes de A, no existe uma

Exemplo 1.5.3: A coleo de intervalos {(n, n + 1] : n Z } uma partio dos nmeros

Autor: Leandro Chaves Rgo

CAPTULO 1. REVISO BSICA DE TEORIA DOS CONJUNTOS

1.6 Funo Indicadora

Denio 1.6.1 : Funo Indicadora. A funo indicadora IA : {0, 1} de um

Exemplo 1.6.2: Se IA ( ) for identicamente igual a 1, ou seja, IA ( ) = 1, , ento A

IAc = 1 IA , A B IA IB , IAB = min(IA , IB ) = IA IB , IAB = max(IA , IB ) = IA + IB IAB , IAB = max(IA IB , 0) = IA IB c ,

Exemplo 1.6.4: As seguintes questes no esto relacionadas umas com as outras.

Autor: Leandro Chaves Rgo

Captulo 2 Tcnicas de Contagem

2.2 Mtodos de Contagem

CAPTULO 2. TCNICAS DE CONTAGEM

2.2.2 Regra da Multiplicao

Exemplo 2.2.5: O conjunto A possui 4 elementos e, o conjunto B , 7 elementos. Quantas

Autor: Leandro Chaves Rgo

Exemplo 2.2.6: Em uma banca h 5 exemplares iguais da Veja, 6 exemplares iguais da

Amostragem ou Escolhas com Reposio

Exemplo 2.2.7: Nmero de Sequncias Binrias ou Subconjuntos. O nmero de

Amostragem ou Escolhas sem Reposio

Autor: Leandro Chaves Rgo

Exemplo 2.2.8: Se A um conjunto de n elementos, quantas so as funes f : A A

Exemplo 2.2.10: Quantas so as permutaes simples dos nmeros 1, 2, . . . , 10 nas quais

Autor: Leandro Chaves Rgo

CAPTULO 2. TCNICAS DE CONTAGEM

Enumerao de Conjuntos: Coecientes Binomiais

de onde segue o resultado. O coeciente binomial tem as seguintes propriedades:

Exemplo 2.2.14: Quantos sequncias binrias de comprimento n contm no mximo trs

7 5k7 7 1 (x4 )k ( )7k = (1)7k x . k k x

Autor: Leandro Chaves Rgo

Denio 1.3.1: Produto Cartesiano. O produto Cartesiano A B de dois conjuntos

Denio 1.6.1 : Funo Indicadora. A funo indicadora IA : {0, 1} de um

Exemplo 2.2.6: Em uma banca h 5 exemplares iguais da Veja, 6 exemplares iguais da

Enumerao de Conjuntos: Coecientes Binomiais

de onde segue o resultado. O coeciente binomial tem as seguintes propriedades:

denido para qualquer subconjunto A de . O fato que 0 ||A|| |||| e que

Exemplo 3.5.7: Seja = {1 , 2 , . . . , n } um conjunto nito, e seja P ({i }) = pi , onde