Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Contedo Programtico
Distribuies de frequncia Representao grfica Medidas estatsticas Noes de probabilidade Variveis aleatrias Principais distribuies discretas e contnuas Estimao de parmetros Teste de hipteses
Bibliografia bsica:
Caroline C. Vieira. Notas de aula
Mario F. Triola. Introduo Estatstica 10 Ed. M. N. Magalhes; Antonio C. P. de Lima. Noes de Probabilidade e Estatstica 2002.
1. Introduo
Definio de Estatstica: um conjunto de tcnicas que nos permite, de forma sistemtica, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos e experimentos.
Estatstica Descritiva: utilizada na etapa inicial da anlise para que possamos nos familiarizar com os dados, e tirarmos concluses informais e diretas a respeito de caractersticas de interesse com base nos dados observados.
Inferncia Estatstica: Tcnicas que permitem extrapolar para a populao, concluses tiradas de subconjuntos ou amostras desta populao.
Conceitos:
Populao: um conjunto de dados / pessoas / objetos / etc. que possuem pelo menos uma caracterstica em comum de interesse do pesquisador. Exemplos:
1. a populao brasileira. 2. a totalidade dos carros produzidos no Brasil. 3. uma jazida de minrio de ferro de determinada mina. 4. o sangue no corpo de uma pessoa.
Amostra: um subconjunto desta populao obtida de acordo com certas regras (tcnicas de amostragem). 1. 2. 3. 4. a populao do Paran. carros produzidos pela Fiat. um testemunho ou poro retirada da mina. uma ampola de sangue colhida para um exame.
Estatstica Descritiva
Amostragem
Populao
Amostra
Inferncia Estatstica
Dados: Conjuntos de valores, numricos ou no. Todo dado se refere determinada caracterstica (varivel). Tipos de Variveis: Qualitativas: quando os possveis valores que assume representam atributos ou qualidades.
Podem ser: Nominais: o conjunto dos possveis valores no possui uma ordenao natural. Ex: Sexo, Raa, Religio, etc.
Ordinais: possvel ordenar o conjunto dos possveis valores. Ex: Classe Social, Escolaridade do chefe da famlia, etc.
Quantitativas: quando os possveis valores que assume so de natureza numrica. Podem ser: Discretas: em geral so fruto de uma contagem. O conjunto de possveis valores enumervel. Ex: Nmero de filhos na famlia, nmero de pessoas chegando em uma fila, nmero de caras obtidas em 5 lanamentos de uma moeda etc. Contnuas: assumem valores em intervalos dos nmeros reais. Ex: peso, altura, idade, etc.
2. Estatstica descritiva
Apresentao dos dados: organizar os dados de maneira prtica e racional para o melhor entendimento do fenmeno que se est estudando. Pode ser por meio de tabelas e grficos.
Apesar de conter muita informao, a tabela de dados brutos no prtica para respondermos rapidamente a questes de interesse. Assim, a partir da tabela de dados brutos normalmente construmos uma nova tabela denominada tabela de frequncia.
A tabela de frequncia mais simples aquela que lista os valores observados para determinada varivel, e o nmero de ocorrncias (ou frequncia absoluta) de cada um destes valores. Exemplos:
Sexo F M total fi 37 13 50 Turma A B total fi 25 25 50
Outras Freqncias: Freqncia acumulada (fa): fa = freq. absoluta da classe + freq. absoluta das classes anteriores
Freqncia relativa acumulada (fra): fra = freq. relativa da classe + freq. relativa das classes anteriores
Exemplo:
Idade 17 18 19 20 21 fi 9 22 7 4 3 fa 9 31 38 42 45 fr (%) fra (%) 18 44 14 8 6 18 62 76 84 90
22 23 24 25
Total
0 2 1 2
50
45 47 48 50
0 4 2 4
100
90 94 96 100
No caso da varivel discreta assumir muitos valores e no caso das variveis contnuas, os dados sero classificados em grupos, possuindo diversos valores numa classe.
Exemplo:
Peso 44 |- 52 PMi 48 fi 11 fa 11 fr 0,22 fra 0,22
52 |- 60
60 |- 68 68 |- 76 76 |- 84 84 |- 92 92 |- 100 Total
56
64 72 80 88 96
19
7 7 1 4 1 50
30 37
44 45 49 50
0,38 0,14
0,14 0,02 0,08 0,02 1
0,60 0,74
0,88 0,90 0,98 1,00
Definies:
Limite inferior da classe (LI): o valor mnimo que a varivel alcana.
Limite superior da classe (LS): o valor mximo que a varivel alcana. Amplitude da classe (h): a diferena entre o LS e o LI de uma mesma classe.
Amplitude total (R): a diferena entre o maior e o menor valor observado. Ponto mdio da classe (PM): obtido somando-se o LI e o LS de uma mesma classe, e dividindo-se o resultado por 2.
3. Calcular a amplitude das classes (h), de forma que as classes tenham a mesma amplitude. Para isso, toma-se: =
OBS: h deve ser tomado com nmero de casa decimais igual ou menor que os dados; e seu valor deve, sempre, ser arredondado para cima.
3,5
5,0
4,0
5,0
4,0
5,0
4,0
5,0
4,5
5,5
4,5
5,5
4,5
6,0
5,0
6,0
6,0
6,5
6,5
7,0
7,0
7,0
8,0
8,5
Notas
0,0 |- 1,5 1,5 |- 3,0 3,0 |- 4,5 4,5 |- 6,0 6,0 |- 7,5 7,5 |- 9,0
fi
3 4 5 10 8 2
fa
3 7 12 22 30 32
fr (%)
9 13 16 31 25 6
fra (%)
9 22 38 69 94 100
Total
32
100
20 Frq. Absoluta
15
10
0 17 18 19 20 21 Idade 22 23 24 25
Diagrama circular, disco ou pizza: Tipo de grfico muito utilizado para representao de variveis qualitativas. Consiste num crculo dividido em setores, cujos tamanhos so proporcionais s freq. absolutas ou porcentagens correspondentes. til quando o nmero de classes pequeno.
Histograma: Este um grfico que parte de uma tabela de freqncia de dados agrupados.
Este grfico consiste de retngulos contguos cuja base igual amplitude da classe correspondente e rea igual freqncia relativa de cada classe.
A altura de cada retngulo chamada de densidade da classe. A densidade da classe i o valor dado por:
. =
Obs: o histograma pode ainda ser representado por retngulos contguos cuja base igual amplitude da classe correspondente e altura igual freqncia absoluta (ou relativa) de cada classe.
0,22
0,14
0,14
0,02
0,02
48
56
64
72
80
88
96
Polgono de Frequncia: Este grfico obtido unindo-se os pontos mdios de cada classe por segmentos de reta. Este grfico fornece uma melhor idia da forma de distribuio dos dados.
OBS: Devem-se acrescentar classes com freqncia zero em ambos os extremos da distribuio para ligar o grfico ao eixo horizontal.
0,025
0,02 0,015 0,01 0,005 0 48 56 64 72 80 88 96 Peso - Ponto Mdio
Ogiva: Representao grfica das freqncias acumuladas de uma tabela de freqncias de dados agrupados.
uma linha poligonal que parte do eixo horizontal no limite inferior da 1 classe e para cada limite superior indica a freqncia acumulada de sua classe.
60 49 50
50 44
Freq. acumulada 40 30 30 37
45
20 11
10 0
0 44 52 60 68 Pesos 76 84 92 100
2.4. Medidas
Medidas so resumos ou sumrios da informao trazida pela populao (ou amostra) em um nico nmero. Existem diferentes classes de medidas, sendo as mais conhecidas as medidas de posio e disperso.
Definies: Parmetro: Resumo de uma caracterstica obtido a partir de todos os elementos de uma populao. Ex: mdia populacional (), desvio-padro populacional (). Estatstica: Resumo da caracterstica de interesse levando-se em conta apenas os elementos da amostra. Ex: mdia amostral ( ), desvio-padro amostral (s).
2.4.1.
Medidas de posio
Tendem a representar os elementos comuns da populao (ou amostra). Ex: mdia, moda, mediana, quartis, etc.
Mdia amostral ( ): um valor que representa o centro de massa ou ponto de equilbrio da distribuio (histograma). calculado por:
X1 + X2 + + Xn X= = n
Pn
i=1
Xi
Para melhor compreenso do conceito de mdia como centro de massa, imagine uma amostra com os seguintes valores {8, 9, 5, 5, 4, 3, 6, 4}. Faamos um Diagrama de pontos, que um grfico til para visualizao de pequenas amostras.
Para tanto simplesmente plotamos um ponto para cada valor da amostra sobre um segmento de R que contenha todos os valores. Se houver repeties plotamos um ponto sobre o outro.
Note que a mdia pode ser pensada como um centro de massa porque se cada ponto tivesse a mesma massa, digamos 1kg, o tringulo representando a mdia equilibraria exatamente estes pesos.
Mdia = 5,5
fi
f1 f2 ...
...
Xk Total
...
fk n
fazemos:
1 1 + 2 2 + + = =
=1
=1
3
5 Total
2
1 10
0,2
0,1 1
Dados agrupados em classe: Para calcularmos a mdia nestes casos devemos inicialmente calcular o ponto mdio de cada classe, denotando-o por PMi.
=
=1
Vamos calcular a nota mdia dos 32 alunos de nosso exemplo a partir da tabela de distribuio de frequncias, incluindo o ponto mdio de cada classe.
fi 3 4 5 10
6,0 |- 7,5
7,5 |- 9,0 Total
6,75
8,25
8
2 32
54
16,5 153
0,25
0,06 1
1,6875
0,495 4,77
Assim, pela freq. absoluta: = 153 32 = 4,78 J pela freq. relativa: = 4,77
Em certas situaes, os valores de um conjunto de dados tm graus de importncia diferentes, o que nos leva a calcular uma mdia ponderada.
Em tais casos, calculamos a mdia ponderada atribuindo pesos (w) diferentes aos diversos valores. Assim, Pn w1 x1 + w2 x2 + + wn xn wi xi i =1 X= = Pn w1 + w2 + + wn i=1 wi
17+18+26 X= = 6; 75 4
Mdia Global: Sejam X1; X2; : : : ; Xk as mdias aritmticas de k conjuntos de n1; n2; : : : ; nk elementos, respectivamente. A mdia aritmtica da srie formada pelo conjunto dos n1 + n2 + + nk elementos dada por:
n1 X 1 + + nk X k i=1 ni X i X= = Pk n1 + + nk i=1 ni Pk
Observaes: A mdia uma medida afetada por valores extremos. Se calcularmos o valor mdio de uma varivel para toda a populao, teremos a mdia populacional, normalmente designada pela letra grega (mi). Onde: =1 =
Mediana: o valor que divide o conjunto de dados ao meio, de tal forma que 50% dos valores observados so menores ou iguais mediana e 50% so maiores ou iguais a ela. Notao: md ou Md.
Procedimento para calcular a mediana: 1. Ordenar os dados. 2. Localizar a posio central. Para isto calcula-se:
+ 1 2
3. Se o nmero de observaes (n) for mpar, a mediana ser a observao central; e se n for par, a mediana ser o ponto mdio entre as duas observaes centrais.
Os dois candidatos a md so o 2 e o 3. Ento, tomamos o ponto mdio entre eles como a mediana:
2+3 = = 2,5 2
Neste caso, = 3.
Moda: A moda de um conjunto de dados o valor que ocorre com maior freqncia. Notao: mo ou Mo.
Exemplo: { 1; 1; 3; 3; 5; 3; 3; 2}. = 3.
Se houver mais de duas modas diz-se que o conjunto multimodal. Por outro lado se nenhum valor se repete o conjunto no tem moda.
Dados agrupados em classe (Mtodo Czuber) Uma das formas de se calcular a moda para dados agrupados utilizando o Mtodo de Czuber. Esse mtodo consiste nos seguintes passos: 1. Localize a classe de maior freqncia (classe MODAL) e os limites superior (L) e inferior (l) desta classe.
O mtodo de Czuber determina a moda por interpolao usando a hiptese que leva seu nome:
A moda divide o intervalo da classe modal em distncias proporcionais s diferenas entre a freqncia da classe modal com a freqncia das classes adjacentes".
A partir da, utilizando os conceitos de semelhana dos tringulos e observando o histograma abaixo vemos que:
1 = fmo fant 2 = fmo fpos X = mo l
X 1 = hX 2
(onde h = L l)
Dessa Forma,
fmo fant mo = l + (L l) 2fmo (fant + fpos)
fi
11 19 7
68 |- 76 76 |- 84
84 |- 92 92 |- 100 Total
7 1
4 1 50
mo = 55; 2
Medidas de tendncia central Propriedades: 1. Se somarmos uma constante c a todos os valores de um conjunto de dados, a moda, mdia e mediana ficam tambm acrescidas dessa constante.
2. Se multiplicarmos uma constante c a todos os valores de um conjunto de dados, a moda, mdia e mediana ficam tambm multiplicadas dessa constante.
Percentil (P):
O percentil de ordem de um conjunto de dados um valor P% tal que % dos valores so inferiores ou iguais a ele e (100 - )% dos valores so maiores ou iguais a ele.
% fraa%
Exemplo: Para acharmos a mediana e o 1 quartil das notas dos alunos de nosso exemplo fazemos:
Mediana (P50): 1. Classe 4,5|- 6,0.
2. 50 = 0,31. 3. = 0,38.
5,1
3,3.
2.4.2.
Medidas de variabilidade
Medem o espalhamento ou disperso dos dados. Complementam importantes informaes escondidas pelas medidas de posio.
Amplitude total (R): A amplitude total de um conjunto de dados definida como a diferena entre o maior e o menor valor observado.
Ex: - Aluno 1: = 11. - Aluno 2: = 43.
Varincia amostral ( ): A varincia uma medida de disperso que leva em conta todas as observaes feitas. Ela mede a disperso dos dados em torno da mdia amostral .
Temos
)2 1
Ex: - Aluno 1: 2 = 55 60
2
+ 57 60 2 + + 66 60 1
25 + 9 + 0 + 4 + 36 74 = = = 18.5 4 4
2
- Aluno 2: 2 = 38 60
2
+ 49 60 2 + + 81 60 1
Observao: Se calcularmos a varincia de uma populao de tamanho N, teremos a varincia populacional, normalmente designada pela letra grega (sigma). Onde:
2 =
=1
Inconvenientes da varincia: 1. As unidades de medida da varincia amostral so o quadrado da unidade original da varivel (m2 para altura, kg2 para peso, etc).
Para evitar-se este desconforto estabeleceu-se o desvio padro amostral definido por:
=1(
2 =
)2 1
2. No permite comparar a variabilidade de dados medidos em diferentes unidades de medida ou medidos na mesma unidade mas com mdias diferentes.
Aqui a soluo foi a criao de uma medida chamada coeficiente de variao que no sofre influncia nem da mdia nem da unidade de medida. O coeficiente de variao definido como:
2 =1
Dados agrupados em classes: Para calcular a varincia nestes casos, considere o ponto mdio de cada classe, denotado por PMi e faa
2 = ou 1 = 1
2 =1 =1(
)2 1
2 =1
Exemplo:
Freq. cardaca 60 |- 65 65 |- 70 70 |- 75 75 |- 80 80 |- 85 85 |- 90 90 |- 95 95 |- 100 Total PMi 62,5 67,5 72,5 77,5 82,5 87,5 92,5 97,5 fi 11 35 68 20 12 10 1 3 160 PMi*fi 687,5 2362,5 4930 1550 990 875 92,5 292,5 11780 PMi2*fi 42968,75 159468,75 357425 120125 81675 76562,5 8556,25 28518,75 875300
Assim,
= 11780 160 = 73,6 1 11780 2 = 875300 159 160 = 50,3 = 7,1
2
= 50,3
Varincia Propriedades: 1. Se somarmos uma constante c a todos os valores de um conjunto de dados, a varincia no sofre alterao.
2. Se multiplicarmos uma constante c a todos os valores de um conjunto de dados, a varincia fica multiplicada pela constante ao quadrado (c2).
2.5.
Assimetria
Definio: Uma distribuio simtrica quando a metade esquerda da mesma a imagem-espelho da metade direita. Uma distribuio de dados assimtrica quando um dos lados da mesma apresenta-se mais prolongado que o outro.
Distribuio simtrica:
moda = mediana = me dia
X = mo = md
= Mo = Md
Tipos de assimetria Assimetria direita ou positiva: a distribuio apresenta uma cauda mais acentuada direita.
Assimetria esquerda ou negativa: a distribuio apresenta uma cauda mais acentuada esquerda.
3.
Probabilidade
Conceitos iniciais
3.1.
Fenmeno Aleatrio: um acontecimento cujo resultado no pode ser previamente previsto com certeza. Um experimento aleatrio pode fornecer diferente resultados, mesmo que seja repetido sempre da mesma maneira. Exemplos:
1. O resultado do seu time no prximo jogo do Campeonato Brasileiro; 2. A altura de um aluno sorteado ao acaso nesta sala; 3. A taxa de inflao do ms de dezembro de 2011; 4. O resultado do lanamento de um dado.
Espao amostral ( ou S): o conjunto de todos os resultados possveis de um fenmeno ou experimento aleatrio. Pode ser finito ou infinito, de acordo com a quantidade de possveis resultados.
Evento (A; B; C; ... ;Z): qualquer subconjunto do espao amostral (). Exemplos:
1. Seu time no perde A = {empate, vitria}; 2. A altura do aluno est entre 1,40 e 1,60 B = (1,40; 1,60); 3. A taxa de inflao de dezembro de 2011 menor ou igual a 10% C = (- 1 ; 0,10]; 4. Ocorre uma face par D = {2; 4; 6}.
Evento elementar: um resultado ou evento que no pode mais ser decomposto em componentes mais simples. Eventos especiais:
Evento impossvel ( ): o evento que nunca ocorre. Evento certo (): o evento que sempre ocorre.
EX: Experimento: lanamento de um dado. Evento A ocorre face par. Evento B ocorre face inferior a 4.
= {1, 2, 3, 4, 6}
= {2}
Para defini-se:
# () = = # () Neste caso dizemos que os resultados so equiprovveis.
4 1 = = 0,08 52 13
2. lanar duas moedas e observar a configurao obtida. c = cara; k = coroa. = {cc; ck; kc; kk}
Qual a probabilidade de se obter zero caras? E uma cara?
A zero caras A = {kk} = 1 4. B uma cara B = {ck; kc} = 2 4.
Aproximao relativa.
da
probabilidade
pela
freqncia
Realize (ou observe) um experimento aleatrio um grande nmero de vezes. Registre quantas vezes o evento A ( A ) ocorre efetivamente.
Lei dos Grandes Nmeros: Ao se repetir um experimento um grande nmero de vezes, a probabilidade pela freqncia relativa de um evento tende para a probabilidade terica.
A lei dos Grandes Nmeros afirma que a aproximao pela freqncia relativa tende a melhorar quando o nmero de observaes aumenta.
Formalmente, tem-se que: Considere n repeties independentes de um experimento aleatrio . Seja A um evento qualquer. Defina:
# = #
Exemplos:
Quando o nmero de lanamentos muito grande, fri se estabiliza. Da, toma-se fri como a probabilidade de ocorrncia da face i.
2. Suponha que temos uma linha de produo em grande escala. Retiramos n itens desta linha de produo, e a cada retirada contamos o nmero de itens defeituosos (A = item defeituoso)
Podemos ento afirmar que a probabilidade frequencial de um item defeituoso nesta linha de produo 0,05.
1. 2. 3.
4. Regra da adio: = + ( )
5. = 1 (). Como A e so complementares temos = e = . Ento, pela regra da adio, = = + e pela regra 1, + = 1, logo = 1 .
6. Se B, ento () (). Podemos escrever B como = ( ). Os eventos A e so disjuntos, ento pela regra da adio podemos escrever = + ( ). Como, pela regra 3, ( ) 0 logo () ().
Homens (H)
70 15 10
Mulheres (M)
40 15 20
Total
110 30 30
Computao (C)
Total
20
115
10
85
30
200
- = + = 200 + 200 = 200 = 0,7 - = + ( ) 30 85 15 100 = + = = 0,5 200 200 200 200 - = 1 = 1 200 = 200 = 0,85
30 170
110
30
140
A probabilidade condicional de A dado B revela a incerteza que se tem sobre o evento A supondo conhecida a verdade sobre o evento B. Podemos interpret-la como a chance relativa de A restrita ao fato de que B ocorreu.
Exemplos: 1. Uma urna contm 2 bolas brancas (B) e 3 bolas vermelhas (V). Suponha que so sorteadas duas bolas ao acaso, sem reposio.
2. As informaes abaixo se referem aos candidatos que prestaram vestibular na UFES em 2010:
Homem (H) Aprovado (A) Reprovado (R) Total 8 4 12 Mulher (M) 14 6 20 Total 22 10 32
Solues:
a. = 14 32 0,44
( ) ( ) 14 32 20 32 14 20
b.
= 0,70
c.
( ) ( )
14 32 22 32
14 22
0,64
Propriedades:
1. 2. 3. 4. 5. 6. |B = 1 |B = 0 0 (|) 1, para qualquer evento A. | = | + | ( |) | = | + | = | = 1 (|)
A definio de probabilidade condicional pode ser reescrita para fornecer uma expresso geral para a probabilidade da interseo de dois eventos:
= = ()
Exemplo: Acredita-se que na populao do ES 20% de seus habitantes sofrem algum tipo de alergia, sendo classificados como alrgicos para fins de sade pblica. Sendo alrgico, a probabilidade de ter reao a certo antibitico de 0,5. Para os no alrgicos esta probabilidade de apenas 0,05.
Escolhendo-se uma pessoa ao acaso da populao do ES, qual a probabilidade de que ela: a. Seja do grupo dos alrgicos e tenha alergia ao ingerir o antibitico? b. Seja do grupo dos no alrgicos e no tenha alergia ao ingerir o antibitico?
A regra da multiplicao til para determinarmos a probabilidade de um evento que depende de outros eventos.
Exemplo: Em uma fbrica de parafusos, as mquinas A e B produzem 2/3 e 1/3 da produo total, respectivamente. Da produo de cada mquina 2% e 0,8%, respectivamente, so parafusos defeituosos. Escolhendo-se aleatoriamente um parafuso, qual a probabilidade que ele seja defeituoso? Claramente a resposta depende de qual mquina produziu aquele parafuso.
Para generalizarmos o conceito da probabilidade total, definimos: Definio: Dizemos que os eventos {A1; A2; ... ; An} formam uma partio do espao amostral se:
1. = 2.
=1
Teorema
da
Seja {A1; A2; ... ; An} uma partio do espao amostral e seja B um evento qualquer, ento,
= 1 + 2 + +
() = 1 1 + 2 2 + +
=1
() =
3.7. Independncia
Definio: Dois eventos A e B so independentes se a ocorrncia de um no afeta a probabilidade de ocorrncia do outro. Assim, tem-se que:
1. = () 2. = ()
Uma empresa produz peas em duas mquinas (1 e 2). Estas mquinas podem apresentar desajustes com probabilidade 0,05 e 0,1, respectivamente. Suponha que as mquinas trabalhem de forma independente.
No incio do dia um teste realizado e caso a mquina esteja fora do ajuste a mesma pra de operar e vai para manuteno. Para que se cumpra o nvel mnimo de produo diria necessrio que pelo menos uma mquina esteja funcionando. Qual a probabilidade de que a empresa cumpra a produo do dia?
E agora, usando o segundo e quarto termos da igualdade vem um resultado til que nos permite escrever a probabilidade de A dado B em termos da probabilidade de B dado A:
() =
Partindo desta expresso, e escrevendo o denominador usando a regra da probabilidade total, obtemos o Teorema de Bayes: Teorema de Bayes: Se {A1; A2; ... ; An} for uma partio de e B um evento qualquer, ento:
( ) = 1 1 + +
Exemplos: 1. Suponha que um fabricante de sorvetes recebe 20% de todo o leite que consome da fazenda F1, 30% da fazenda F2 e o restante da F3. A vigilncia sanitria inspecionou as fazendas de surpresa e observou que 20% do leite produzido na fazenda F1 estava adulterado por adio de gua, o mesmo ocorrendo com 5% e 2% respectivamente nas fazendas F2 e F3.
Na indstria de sorvete os gales de leite so armazenados sem identificao das fazendas produtoras. Um galo sorteado ao acaso na indstria. Calcule: a. A probabilidade de que o galo esteja adulterado. b. A probabilidade do galo estando adulterado ter vindo da fazenda F1.
a.
= 1 2 3 = 1 + 2 + 3
2. Das pacientes da clnica de Ginecologia com idade acima de 40 anos, 60% so ou foram casadas e 40% so solteiras. Sendo solteira, a probabilidade de ter tido um distrbio hormonal no ltimo ano de 10%, enquanto para as demais esta probabilidade aumenta para 30%.
Pergunta-se: a. Qual a probabilidade de uma paciente escolhida ao acaso ter tido um distrbio hormonal no ltimo ano? b. Se a paciente escolhida tiver tido um distrbio, qual a probabilidade dela ser solteira? c. Escolhemos duas pacientes ao acaso e com reposio, qual a probabilidade de pelo menos uma ter o distrbio?
a.
b. =
( )
0,10,4 0,22
0,188
c. Seja Hi o evento de que a i-sima paciente tenha tido distrbio hormonal. Da:
4.
Variveis Aleatrias
Sabe-se que um espao amostral ( ou S) o conjunto de todos os resultados possveis de um fenmeno ou experimento aleatrio.
Em muitos casos no estamos interessados na descrio detalhada de todos os resultados, e mais interessante resumirmos o resultado atravs de nmeros.
Definio: Uma varivel aleatria (v.a.) uma funo que confere um nmero real a cada resultado no espao amostral de um experimento aleatrio. Uma varivel aleatria denotada por uma letra maiscula (por ex. X) e os valores que ela pode assumir como xi.
Exemplos: 1. E lanar duas moedas. O espao amostral desta experincia = {cc; ck; kc; kk} onde c = cara e k = coroa. Uma varivel aleatria pode ser nmero de caras, X = {0; 1; 2}.
(1; 1) = (6; 1)
(1; 6) (6; 6)
Classificao: Varivel aleatria discreta: assume valores num conjunto finito ou infinito enumervel. EX: n de filhos, n de peas defeituosas em um lote, bits transmitidos que foram recebidos com erros.
Varivel aleatria contnua: seu conjunto de valores qualquer intervalo dos nmeros reais, o que seria um conjunto infinito no enumervel. EX: peso, altura, corrente eltrica, presso, temperatura, tempo.
2. No processo de fabricao de semicondutores o fabricante deve se preocupar com o nmero de partculas contaminantes. Se definirmos a varivel aleatria Y = nmero de partculas contaminantes em uma pastilha, os valores possveis de Y = {0; 1; 2; ...}.
Modelo Probabilstico: Um modelo probabilstico consiste em atribuir a cada valor da v.a. X a sua probabilidade de ocorrncia.
A funo que atribui a cada valor xi de X a sua probabilidade chamada de funo de probabilidade.
Assim se X uma varivel aleatria assumindo os valores x1, x2, ... , xn a funo de probabilidade associada a X :
= = = = 1, 2,
A distribuio de probabilidades de uma varivel aleatria X uma descrio das probabilidades associadas com os possveis valores de X. Esta descrio pode ser realizada em forma de tabelas ou grficos.
No exemplo da varivel aleatria nmero de caras num lanamento de duas moedas (supondo que as moedas sejam honestas e os lanamentos independentes) temos a seguinte distribuio de probabilidades:
2.
= 1
Exemplo: Com os dados do ltimo censo a assistente social do centro de sade constatou que na regio 20% das famlias no tm filhos, 30% possuem 1 filho, 35% possuem 2 filhos e as demais se dividem igualmente entre 3, 4 ou 5 filhos. Suponha que uma famlia seja escolhida aleatoriamente e defina a v.a. N como o nmero de filhos desta famlia. Construa a funo de probabilidade para N.
Soluo: Se N o nmero de filhos na famlia temos que os valores possveis de N so: {0; 1; 2; 3; 4; 5}. Supondo que todas as famlias tm chances iguais de serem sorteadas:
n de filhos pi 0 1 2 3 4 5
( )2 =
2 2
Exemplo: Um canal digital transmite dados com certa probabilidade de erro. Seja X o nmero de bits recebidos com erro nos quatro prximos bits transmitidos. Os valores possveis de X so {0; 1; 2; 3; 4}. Suponha que tenhamos as seguintes probabilidades:
0 = 0,6561; 1 = 0,2916; 2 = 0,0486;
3 = 0,0036; 4 = 0,0001.
Soluo:
Clculo da mdia
= = 0 0 + 1 1 + 2 2 + 3 3 + 4(4)
= 0 0,6561 + 1 0,2916 + 2 0,0486 + 3 0,0036 + 4 0,0001
= 0,4
Estudaremos nesta seo a distribuio de probabilidade de algumas variveis aleatrias, que por possurem caractersticas especiais comuns so agrupadas em famlias.
4.2.1.
Distribuio Bernoulli
Muitos experimentos so tais que os resultados apresentam ou no uma determinada caracterstica. Por exemplo: Uma moeda lanada: o resultado cara ou no; Uma pea escolhida ao acaso de um lote contendo 500 peas: essa pea defeituosa ou no;
Definio: Seja X uma varivel aleatria que assume os valores 1 (sucesso) e 0 (fracasso). Diz-se que X tem distribuio Bernoulli com parmetro p, onde p a probabilidade de sucesso.
Notao: X ~ Bernoulli(p)
A funo de probabilidade de X :
= = (1 )1 , = 0 1
Assim temos:
=
1 =0
= = 0 = 0 + 1 = 1
= = 1 =
1 =0
2 =
= 02 = 0 + 12 = 1 2 = = 1 2 = 2 = (1 )
4.2.2.
Distribuio Binomial
Se realizarmos n experimentos de Bernoulli de forma independente e se cada experimento tem probabilidade de sucesso igual a p (fixo), ento a varivel aleatria que conta o nmero de sucessos nestes n experimentos tem distribuio binomial.
Por exemplo: Uma moeda lanada trs vezes; qual a probabilidade de se obter duas caras?
Dez peas so extradas, ao acaso, com reposio, de um lote de 500 peas; qual a probabilidade de que pelo menos duas sejam defeituosas; sabendo-se que 10% das peas do lote so defeituosas?
= (1 )
k n-k
Mas quantos vetores de tamanho n com k sucessos e (n k) fracassos podem ser formados? Para responder a essa pergunta, basta calcularmos o nmero de permutaes possveis de n elementos com k e (n k) repeties.
Definio: Uma distribuio de probabilidade Binomial resulta de um experimento que satisfaz os seguintes requisitos: 1. O experimento tem um nmero fixo de tentativas;
2. As tentativas devem ser independentes; 3. Cada tentativa deve ter todos os resultados classificados em duas categorias; 4. A probabilidade de um sucesso em cada tentativa, denotada por p, permanece constante.
A varivel aleatria X, correspondente ao nmero total de sucessos nas n tentativas do experimento, tem distribuio Binomial com parmetros n e p e funo de probabilidade:
= = (1 ) , = 0, 1, 2, , .
Notao X~Binomial(n; p)
Exemplos: 1. Um professor de Psicologia planeja dar um teste surpresa que consiste em 4 questes de mltipla escolha, cada uma com 5 alternativas possveis (a, b, c, d, e), uma das quais correta. Suponhamos que um aluno despreparado faa adivinhaes aleatrias. Qual a probabilidade de que este aluno acerte exatamente trs questes?
Soluo: Primeiramente, note que esse procedimento satisfaz os 4 requisitos para uma distribuio binomial.
A varivel aleatria X, nmero de respostas corretas dentre as 4 questes, pode assumir os valores {0, 1, 2, 3, 4}.
2. Uma linha de produo em grande escala produz 6% de itens defeituosos. 30 itens da produo semanal so observados. Calcular a probabilidade de se observar pelo menos 2 itens defeituosos?
Soluo: Seja X = nmero de itens defeituosos dentre os 30 observados. X = {0, 1, 2, ..., 30}. X ~ Binomial(30; 0,06)
2 = 1 < 2 Onde, < 2 = = 0 + = 1
30 < 2 = 0
0,06
0,94
30
30 + 1
0,06
0,94
29
2 = 1 0,455469 0,545
A figura a seguir mostra exemplo de distribuies binomiais. Para n fixo (no exemplo n = 20) medida que p aumenta de 0 a 0,5 a distribuio se torna mais simtrica. O mesmo acontece se p diminui de 1 a 0,5.
Exemplo: No exemplo anterior da linha de produo, tem-se que o nmero esperado de itens defeituosos dentre os 30 observados :
= 30 0,06 = 1,8
4.2.3.
Distribuio de Poisson
til para descrever as probabilidades do nmero de ocorrncias num campo ou intervalo contnuo (em geral tempo ou espao).
Por exemplo, a v.a. de interesse pode ser: N de peas defeituosas substitudas num veculo durante o primeiro ano de vida; N de erros tipogrficos por pgina, em um material impresso; N de acidentes por ms, em determinada rodovia; Nmero de clientes que chegam ao caixa de um supermercado por hora;
A utilizao da distribuio de Poisson baseia-se nas seguintes hipteses: 1. A probabilidade de ocorrncia a mesma para dois intervalos quaisquer de igual comprimento. 2. A probabilidade de duas ou mais ocorrncias simultneas aproximadamente zero.
Onde, P(X = x) - probabilidade de x ocorrncias em um intervalo. e - base dos logaritmos naturais ( e = 2; 71828). - taxa de ocorrncias no intervalo considerado.
OBS: o nmero de ocorrncias no tem limite mximo. Ela uma v.a. discreta que pode assumir uma sequncia infinita de valores (X = 0, 1, 2, ...). Mdia e varincia de uma distribuio de Poisson
= =
Exemplos: 1. Suponha que estejamos interessados no nmero de carros que chegam a um caixa automtico drivethru de um banco durante um perodo de 15 minutos nas manhs de fins de semana. Considere que a anlise dos dados histricos mostre que o nmero mdio de carros que chegam no perodo considerado igual a 10.
a) Exatamente 5 carros chegarem em 15 min.? X = n de carros que chegam em um perodo de 15 min qualquer.
e10 105 P (X = 5) = = 0; 0378 5!
b) Um carro chegar em um perodo de 3 mim.? Y = n de carros que chegam em um perodo de 3 min qualquer.
Portanto,
e2 21 P (Y = 1) = = 0; 2707 1!
2. Suponha que os defeitos em fios para tear possam ser aproximados por um modelo de Poisson com mdia de 0,2 defeitos por metro. Inspecionando-se pedaos de fio de 6 metros de comprimento, determine a probabilidade de se encontrar menos de 2 defeitos.
= 6 0; 2 = 1; 2
P (X 1) = P (X = 0) + P (X = 1) e1;2 1; 20 e1;2 1; 2 = + 0! 1! = 0; 301 + 0; 3612 = 0; 6622
Ex: tempo de vida de uma lmpada, nvel de colesterol no soro sanguneo, tempo de espera de um cliente para ser atendido num banco, durao de uma chamada telefnica, etc.
Distribuies de probabilidade contnuas: Dado que uma v.a. contnua X assume um conjunto infinito no enumervel de valores, torna-se impraticvel a idia de atribuir uma probabilidade a cada possvel valor de X, como era feito no caso de uma v.a. discreta.
Agora, o procedimento para a obteno de probabilidades levar em conta intervalos de valores e usar o histograma.
Lembre-se que na construo de um histograma, a altura correspondente a cada retngulo equivale densidade da classe, onde = / . Dessa forma, a rea de cada retngulo igual a freq. relativa da classe. Assim, dado que a soma das freq. relativas igual a 1, a rea total do histograma e do polgono de freqncias tambm 1.
di
Considere o intervalo (x1,x2). Temos que a probabilidade de um ponto qualquer cair entre x1 e x2 ser aproximadamente igual a rea do retngulo hachurado.
Se diminuirmos a amplitude dos intervalos, (aumentando, assim, o nmero de intervalos) tornando a mesma infinitamente pequena, o polgono de freqncias passar a ser uma curva.
di
1. 2.
x f (x) dx
Z 2 = V (X ) =
x2 f (x) dx 2
1
Exemplo: Arquelogos estudaram certa regio e estabeleceram um modelo terico para a varivel C, comprimento de fsseis na regio (em cm). Suponha que C uma varivel aleatria contnua com a seguinte funo densidade de probabilidade:
8 < f (c ) = :
1 40
c
10
Soluo:
Clculo da mdia
20
=
0
1 1 + 1 = 40 10 400 3
3 20 0
1 + 40 2
2 20 0
35 = 3
( ) =
0
20
1 + 1 40 10
2 4 20 0
1 ( ) = 400 4
2 2
1 + 40 3
3 20 0
500 = 3
500 35 = 3 3
2
= 30,56 2
30,56 = 5,53
Propriedades da mdia:
1. = 2. = () 3. + = + 4. + = + ()
Propriedades da varincia:
1. = 0 2. = 2 () 3. + = 2 () 4. = ()
4.4.1.
Distribuio Uniforme
Definio: Uma v.a. contnua tem uma distribuio uniforme se todos os valores que assume so igualmente provveis.
Uma v.a. X tem distribuio Uniforme Contnua no intervalo [a, b], a < b, se sua funo densidade de probabilidade dada por:
1 , = ( ) 0,
Notao: X ~ Uniforme[a, b]
Exemplo: Uma professora planeja a aula to cuidadosamente, que a durao de suas aulas distribuda uniformemente entre 50 e 52 minutos. Isto , qualquer tempo entre 50 e 52 minutos possvel, e todos esses valores possveis so igualmente provveis.
Se selecionarmos aleatoriamente uma aula e designarmos X a v.a. representativa do tempo de aula, ento, X tem uma distribuio definida pela funo densidade
1 , = 2 0, 50 52
2 12
Exemplo: No exemplo anterior relacionado durao de aula de uma determinada professora, designou-se X a v.a. representativa do tempo de aula (em min.), onde X seguia uma distribuio Uniforme[50, 52]. Dessa forma, o tempo esperado de aula :
52 + 50 = = 51 2
4.4.2.
Distribuio Exponencial
Notao: X ~ Exp().
Para calcular probabilidades com a exponencial, precisamos resolver a integral correspondente ao intervalo de interesse. Assim,
Esta distribuio tem sido amplamente utilizada nas reas de fsica, engenharia, computao e biologia.
Variveis como a vida til de equipamentos, tempos de falha, tempos de sobrevivncia de espcies e intervalos entre solicitaes de recursos so algumas das quantidades que tm sido modeladas pela exponencial.
Soluo: Representemos pela v.a. T, o tempo de vida da lmpada, e assim T ~ Exp(1 8000). A probabilidade desejada ser:
50 1 1 8000 8000
< 50 =
0
< 50 =
50 1 8000 0 50 8000
1 8000 0
1 8000 50
< 50 = 1
0,006
Dessa forma, a proporo de trocas por defeito de fabricao ser de aproximadamente 0,6%.
Notao: X ~ N(, 2 ).
Propriedades da Normal:
1. simtrica em relao a . 2. 0 quando . 3. O valor mximo de ocorre quando = .
A distribuio Normal completamente especificada pela mdia e pela varincia 2 (parmetros da distribuio). A figura a seguir mostra exemplo de distribuies Normais.
z1
livro:
Procedimento para achar escores z a partir de reas conhecidas. 1. Desenhe uma curva em forma de sino e identifique a regio sob a curva que corresponde probabilidade dada. Se esta regio no for uma regio acumulada esquerda, trabalhe com regies conhecidas que sejam acumuladas esquerda.
Usando a rea acumulada esquerda, localize a probabilidade mais prxima no corpo da tabela da distribuio Normal e identifique o escore z correspondente.
livro:
Qual a distribuio de X - ?
Exemplo: Doentes sofrendo de certa molstia so submetidos a um tratamento intensivo cujo tempo de cura foi modelado por uma densidade Normal, de mdia 15 e desvio padro 2 (em dias).
Seja X a v.a. que denota o tempo de cura, temos que X ~ N(15, 4).
Calcule a probabilidade do tempo de cura: a. Ser superior a 17 dias? b. Ser inferior a 20 dias? c. Estar entre 14 e 17 dias?
Soluo:
a. > 17 = >
17 15 2
= > 1
= 1 1 = 1 0,8413 = 0,1587
20 15 2
b. < 20 = <
c. 14 < < 17 =
14 15 2
< <
17 15 2
= 0,5 < < 1 = < 1 ( < 0,5) 14 < < 17 = 0,8413 0,3085 = 0,5328
Uma questo interessante seria saber o tempo mximo necessrio para a recuperao de 25% dos pacientes, ou seja,
< = 0,25 15 = = 0,25 2
Se tirarmos uma amostra aleatria de tamanho n e calcularmos sua mdia, teremos um valor para .
Exemplo: Selecionamos todas as possveis amostras de tamanho 2, com reposio, da populao {1, 3, 5, 5, 7}. Existem 5x5 = 25 possibilidades:
1e1 3e1 5e1 5e1 7e1 1e3 3e3 5e3 5e3 7e3 1e5 3e5 5e5 5e5 7e5 1e5 3e5 5e5 5e5 7e5 1e7 3e7 5e7 5e7 7e7
( = ) 1
1 25 2
2 25 5
3 25 6
4 25 6
5 25 4
6 25 1
7 25
= =
2 = =
= 4,2
2 2 = 2,08
1 , ,
selecionadas da populao. (As amostras so selecionadas de modo que todas as possveis amostras de tamanho n tm a mesma chance de serem escolhidas).
Concluso:
A distribuio das mdias amostrais () ir se aproximar de uma distribuio normal medida que n aumentar. Ou seja,
2 ~N , .
distribuda, eis uma diretriz em comum: para amostras de tamanho n maior que 30, a distribuio de pode ser razoavelmente bem aproximada pela distribuio normal. A aproximao se torna melhor medida que o tamanho amostral n aumenta.
OBS: Populaes com distribuies muito assimtricas, requerem tamanhos de amostra muito maiores que 30.
2. Se a populao for normalmente distribuda, ento ser normalmente distribuda para qualquer tamanho amostral n.
Exemplo: Em uma certa cidade, a durao de conversas telefnicas em minutos, originrias de telefones pblicos, segue um modelo Exponencial com parmetro 1/3. Observando-se uma amostra aleatria de 50 dessas chamadas, qual ser a probabilidade delas, em mdia, no ultrapassarem 4 minutos?
Tendo em vista o alto valor de probabilidade encontrado, podemos dizer que praticamente certo que a media amostral estar abaixo de 4 min.
= .
Logo, a proporo amostral nada mais do que a mdia de v.a.s convenientemente definidas. Assumindo que a proporo de indivduos com a dada caracterstica na populao p e que os indivduos so selecionados aleatoriamente, temos que 1 , , formam uma seqncia de v.a.s independentes com distribuio de Bernoulli.
Assim, = e = (1 ). Logo,
=1
=1
(1 ) =
(0, 1).
Exemplo: Suponha que a proporo de peas fora de especificao em um lote de 40%. Tomada uma amostra de tamanho 30, a probabilidade de esta amostra fornecer uma proporo de peas defeituosas menor que 0,50 pode ser calculada de forma exata pela Binomial e aproximada pelo modelo Normal.
Soluo: Seja X a v.a. representando o nmero de peas defeituosas na amostra. Claramente, X ~ Binomial(30; 0,40). Logo, se representa a proporo amostral de peas defeituosas, temos que
< 0,50 = 30 < 0,50 = ( < 15) =
14 =0
Assim,
< 0,50 < 0,50 0,40 0,40 0,60 30
Temos, ento, mesmo para uma amostra no muito grande, uma proximidade razovel entre as duas respostas.