Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Avenida das Torres, 500 – Fone: (45) 321-3900 Fax: (045) 321-3913
CEP: 85802-640 – Cascavel – Paraná
Email: fag@fag.edu.br
PROBABILIDADE
E ESTATÍSTICA
Cascavel - 2009
ENGENHARIA - FAG Probabilidade e Estatística
PARTE I
Introdução á Estatística
A estatística é um processo que permite a análise e a interpretação de dados
provenientes de uma ou mais amostras, com o objetivo de inferir características de
populações. Sendo aplicável a qualquer ramo do conhecimento onde se manipulam
dados experimentais.
3. Pesquisa Estatística
Pesquisa é um conjunto de atividades orientadas para a busca de um
determinado conhecimento. Para merecer qualificativo de científica a pesquisa deve ser
feita de modo sistematizada, utilizando para isto métodos próprios e técnicas específica.
A pesquisa científica se distingue de outras modalidades quaisquer de pesquisa pelo
método, pela técnica, por estar voltada para a realidade empírica e pela forma de
comunicar o conhecimento.
Determinar Tratamento
população amostra
os Objetivos: dos dados
Para que?
inferência
3.3.1 - População
É o conjunto de interesse final para a pesquisa. Em geral é o conjunto do qual a
amostra é retirada.
3.3.2 - Amostra
Chamaremos de amostra qualquer subconjunto da população de interesse, quer
os dados tenham sido coletados de um estudo observacional, quer sejam provenientes de
um experimento realizado sob certas condições de controle.
3.3.4 - Inferência
Conjunto de métodos que permitem inferir o comportamento de uma população
a partir do conhecimento da amostra
4 Terminologia Estatística
4.2 - Dados
É o valor ou resposta que toma a variável em cada unidade experimental.
É o resultado de uma observação.
É a matéria prima da estatística.
4.3 - Variável
É uma característica observável, susceptível de adotar distintos valores ou ser
expresso em várias categorias.
Variáveis:
• Idades;
• Sexo;
• Série;
• Horas de estudo;
• Horas de treino; etc...
4.4 Informação
É o resultado dos dados processados (ou organizados) de acordo com certos
objetivos.
4.5 - Estatística
É qualquer função dos dados empíricos* que é usada com fins descritivos ou
analíticos.
É uma medida resumo dos dados.
*Dados Empíricos: baseado apenas na experiência, e não no estudo.
4.6 - Parâmetros
São as características mais importantes da população.
Comumente são desconhecidas.
Qualitativas Quantitativa
s
Nominais Ordinais Discretas Contínua
5.1.1 - Nominal
Não existe nenhuma ordenação ou hierarquia nos possíveis resultados. Ex: sexo,
estado civil, região de procedência.
5.1.2 - Ordinal
Existe uma certa ordem ou hierarquia nos possíveis resultados. Ex: Nível de
escolaridade, nível de satisfação.
5.2.1 - Discretas
Cujos resultados se referem a dados que podem assumir valores inteiros (IN).
Ex: idade, número de pessoas, número de filhos por família, etc.
5.2.2 - Contínuas
São dados que podem assumir qualquer valor de um conjunto de números reais
(IR). Ex: peso, altura, consumo mensal de energia, etc.
PARTE II
Análise Exploratória Dos Dados ou
Estatística Descritiva
1. Introdução
Exemplo:
Tabela 01: Casos registrados de intoxicação humana segundo a causa
determinante. Brasil, 1993
Causa Freqüência
Acidente 29.601
Abuso 2.604
Suicídio 7.965
Profissional 3.735
Outras 1.959
Ignorada 1.103
Fonte: Mensário Estatístico 259/260
Observação: Não há linhas laterais, ponto final em cada linha e linhas horizontais no
corpo da tabela separando as linhas.
a) Se o número de elementos (n) for menor que 25 então o número de classes (k) é
igual a 5; se n for maior que 25, então o número de classes é aproximadamente a
raiz quadrada positiva de n. Ou seja:
Para n ≤ 25, k = 5
Para n > 25, K = n
• Gráfico de Ordenadas
Para a sua construção é traçada uma reta horizontal (ou vertical) que servirá de base;
a partir de pontos com a mesma distância nesta reta, constroem-se traços
perpendiculares, cujo comprimento seja proporcional a frequência.
• Gráfico em Barras
O gráfico em barras é a representação em que sobre o eixo vertical constroem-se
retângulos para as diferentes categorias da nossa variável, com largura apropriada e
altura proporcional as respectivas freqüências de cada categoria. As barras não são
justapostas ou ligadas, pois na maioria das vezes as categorias das variáveis qualitativas
não apresentam relação de continuidade.
• Gráfico em Colunas
A construção do gráfico em colunas é semelhante ao em barras, com uma única
diferença, os retângulos serão sustentados no eixo horizontal.
• Pictograma
O gráfico pictograma é semelhante ao gráfico em colunas, com a diferença que no
lugar de retângulos serão figuras que representaram as distribuições de freqüência.
• Dot Plot
É o gráfico onde, no eixo horizontal marca-se com espaçamentos iguais cada
categorias da variável e verticalmente a estas, desenha-se pontos, sendo que, a
quantidade de pontos em cada categoria é igual ao valor da freqüência absoluta desta.
Este gráfico não é usual e é recomendado apenas, quando as freqüências são pequenas.
• Histograma
Este é um gráfico usado para apresentar dados organizados em intervalos, utilizado
principalmente para representar a distribuição de variáveis contínuas.
fi hi
di = ou di =
h h
• Polígono de freqüências
É a representação gráfica de uma distribuição de freqüências por meio de um
polígono.
Para a sua construção, trace o sistema de eixo cartesianos; marque os pontos
médios de cada classe no eixo horizontal (ponto médio de um intervalo é a soma dos
extremos do intervalo dividido por dois); no eixo vertical coloque as freqüências; faça
pontos na intersecção do ponto médio de cada intervalo com sua respectiva freqüência;
una todos estes pontos por segmentos de reta.
• Ogiva
É o gráfico que representa a distribuição da freqüência absoluta acumulada. Sua
construção é semelhante ao do polígono de freqüências, com a diferença que
consideraremos a freqüência absoluta acumulada.
EXERCÍCIOS
a) Após observar atentamente cada variável, e com intuito de resumi-las, como é que
você identificaria (qualitativa ordinal ou nominal e quantitativa discreta ou contínua)
cada uma das 11 variáveis listadas?
b) Compare e indique as diferenças existentes entre as distribuições das variáveis
Direito, Política e Estatísticas.
c) Construa o histograma para as notas da variável Redação. Interprete os resultados.
d) Construa a distribuição, de freqüência da variável Metodologia e faça um gráfico
(poderá ser de setor, barras, colunas – de sua preferência) para indicar essa
distribuição. Interprete os resultados.
e) Construir a distribuição de freqüência conjunta para as variáveis Sexo e Idade.
Interprete os resultados.
PARTE III
Medidas de Posição
1. Introdução
Através de tabelas e gráficos construídos anteriormente, vimos como resumir e
apresentar um conjunto de dados. Contudo, podemos resumir ainda mais este conjunto,
apresentando um ou alguns valores que “representam” todo o conjunto. Esses valores
são chamados de medidas de posição.
∑x
i =1
i
x=
n
Onde n é o total de elementos no conjunto de dados.
A média aritmética é um valor que pode substituir todos os valores da variável, isto
é, é o valor que a variável teria se em vez de “variável” ela fosse “constante”.
Md ( x) = x n +1
2
x n + x n + 2
2 2
Md ( x) =
2
Neste exemplo: X1 = 6/2 = 3 (3O termo) e X2 = (6+2)/2 = 4 (4O termo), logo a mediana
é:
7+8
Md = = 7,5
2
Observe que este é um valor teórico, pois não figura entre os dados originais.
Moda = Mo = 7
Mín. Q1 Md Q3 Máx.
Onde:
- O 1O Quartil (Q1) significa que 25% dos dados são inferiores a Q1, ou que 75% dos
dados são superiores a Q1.
- O 3O Quartil (Q3) significa que 75% dos dados são inferiores a Q3, ou que 25% dos
dados são superiores a Q3.
Q1 = X n +1 + 0.75 X n +1 − X n +1
+1
4 4 4
Q3 = X ( n +1) + 0.25 X ( n +1) − X ( n +1)
3. 3. 4 +1 3.
4 4
Exemplo:
Dados os números:
3 4 2 1 7 5 4 2 1 7 8 5 2 1 4 3 5 5 6 7 9 8 8 8
PARTE IV
Exemplo:
Seja os quatro conjuntos abaixo, as notas de quatro turmas:
Turma A: 4 4 5 6 6
Turma B: 5 5 5 5 5
Turma C: 2 3 6 6 8
Turma D: 0 0 5 10 10
1.1 – Amplitude: é a diferença entre o maior e o menor dado observado. Como utiliza
apenas dois valores, contém pouca informação sobre a dispersão. È utilizada em
amostra muito pequenas.
R= Xmaior - Xmenor
n
2
∑ xi
1 n 2 i =1
S =
2
∑ xi − n (para dados amostrais)
n − 1 i =1
OBSERVAÇÃO:
O desvio Padrão representa a maneira mais comum de se medir a variação
de um conjunto de observações. Para duas amostras, a que apresentar um desvio
padrão maior acusará uma maior dispersão.
Quanto menor o desvio padrão, mais os valores da variável se aproximam
de sua média.
Quanto maior a variância e desvio padrão, maiores são os indícios de
heterogeneidade entre os elementos do conjunto.
X = Md = Mo
distribuição simétrica
Q1 + Q3 − 2 Md
2o Caso: AS =
Q3 − Q1
1.6 - Curtose
Denomina-se curtose o grau de achatamento da distribuição
Uma distribuição nem chata, nem delgada, chama-se : mesocúrtica
EXERCÍCIOS
a) Qual é a amplitude total desta amostra? É viável construir uma distribuição por
intervalos de classe?
b) Em quantas classes poderemos agrupar esse conjunto de dados?
c) Qual será o tamanho dos intervalos de classe?
d) Construa a tabela de distribuição de freqüência por classes. Inicie a primeira
classe com 30.
e) Construa os histogramas de freqüências absolutas e relativas.
f) Quantos alunos obtiveram notas maiores ou iguais a 70?
g) Analisando a tabela e os gráficos, redija um breve relatório sobre as notas desta
turma de estudantes.
h) Calcule a média amostral e interprete.
i) Calcule e interprete a moda.
j) Calcule e interprete a mediana.
k) Determine os quartis. Represente os resultado usando o BOX-PLOT.
l) Determine a Variância, Desvio Padrão e Coeficiente de Variação. Interprete.
m) A Distribuição é Simétrica? Justifique calculando o grau de assimetria e
interprete o BOX-PLOT.
n) Faça um comentário final utilizando todos as informações obtidas nos itens
acima e faça suas considerações finais.
11 14 16 21 12 13 15 12
c) Multiplique cada observação original por 4 e repita o item a). compare as resposta
obtidas com as do item a) e comente.
d) Se nos dados originais você soma ou subtrai qualquer número o que acontece com
as respostas dos dados originais (item a)?
e) Se você multiplica ou divide qualquer número (exceto o zero) o que acontece com
as respostas dos dados originais (item a)?
f) Que conclusão podemos obter de a), d) e e)?
A 10 9 10 9 11 8 9 7 8 9
B 5 10 7 15 16 12 4 8 10 13
C 10 11 9 10 9 11 12 8 10 10
Xi fi
31,5 1
32,5 5
33,5 11
34,5 8
35,5 3
36,5 2
Determine a média, mediana, variância, desvio padrão e coeficiente de variação.
Podemos afirmar que as embalagens plásticas tem formato homogêneo?
Há razões para afirmar que a distribuição das espessuras seja simétrica?
Tabela 01: Valores da Dureza, medida no centro das Peças do Tipo Especial, Após os
tratamentos de resfriamento.
Resfriamento em
Observação Água Óleo A Óleo B
1 36,7 36,0 35,3
2 38,9 36,4 35,0
3 38,7 35,3 34,3
4 38,8 36,8 35,7
5 37,6 36,9 35,2
6 37,2 37,5 34,2
7 38,8 35,3 36,5
8 38,0 36,0 35,6
9 37,2 35,7 35,5
10 37,8 36,1 35,5
11 38,0 37,0 35,4
12 38,8
Determine:
a) A média, Mediana, Desvio Padrão, Coeficiente de Variação, Quartis, Valor
Mínimo e Valor Máximo de cada tratamento. Interprete os resultados.
b) Construa os gráficos Dot-plot e Box-plot para cada tratamento. Interprete os
resultados.
c) Que tratamento tem nível de dureza com menos variabilidade com respeito a sua
média e mais homogêneo?
d) Qual dos três tratamentos de resfriamento cumpre as especificações do cliente?
PARTE V
Probabilidade
1 . Introdução
U = {1, 2, 3, 4, 5, 6}.
Exemplos de eventos no espaço amostral U:
A: sair número maior do que 4: A = {5, 6}
B: sair um número primo e par: B = {2}
C: sair um número ímpar: C = {1, 3, 5}
Consideremos uma urna que contenha 49 bolas azuis e 1 bola branca. Para uma
retirada, teremos duas possibilidades: bola azul ou bola branca. Percebemos, entretanto
que será muito mais freqüente obtermos numa retirada, uma bola azul, resultando daí,
podermos afirmar que o evento "sair bola azul" tem maior probabilidade de ocorrer, do
que o evento "sair bola branca".
2. Conceito de Probabilidade
n( A)
P( A) =
n(U )
onde: n (A) = número de elementos de A e n (U) = número de elementos do espaço de
prova U.
a) sair o número 3:
Temos U = {1, 2, 3, 4, 5, 6} [n(U) = 6] e A = {3} [n(A) = 1]. Portanto, a probabilidade
procurada será igual a
1
P( A) =
6
3 1
P( A) = =
6 2
2 1
P( A) = =
6 3
d) sair um número menor do que 3: agora, o evento A = {1, 2} com dois elementos.
Portanto:
2 1
P( A) = =
6 3
e) sair um quadrado perfeito: agora o evento A = {1,4} com dois elementos. Portanto:
2 1
P( A) = =
6 3
a) Sair a soma 8
Observe que neste caso, o espaço amostral U é constituído pelos pares ordenados (i,
j), onde i = número no dado 1 e j = número no dado 2.
É evidente que teremos 36 pares ordenados possíveis do tipo (i, j) onde
i = 1, 2, 3, 4, 5, ou 6, o mesmo ocorrendo com j.
As somas iguais a 8, ocorrerão nos casos: (2,6), (3,5), (4,4), (5,3) e (6,2).
5
P( A) =
36
b) Sair a soma 12
Neste caso, a única possibilidade é o par (6,6).Portanto, a probabilidade procurada
será igual a:
1
P( A) =
36
2.3 – Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirando-
se uma bola com reposição, calcule as probabilidades seguintes:
3. Propriedades
P(A) + P(A') = 1
Nota: esta propriedade simples, é muito importante pois facilita a solução de muitos
problemas aparentemente complicados. Em muitos casos, é mais fácil calcular a
probabilidade do evento complementar e, pela propriedade acima, fica fácil determinar
a probabilidade do evento.
Exemplo:
Em uma certa comunidade existem dois jornais J e P. Sabe-se que 5000 pessoas são
assinantes do jornal J, 4000 são assinantes de P, 1200 são assinantes de ambos e 800
não lêem jornal. Qual a probabilidade de que uma pessoa escolhida ao acaso seja
assinante de ambos os jornais?
SOLUÇÃO:
Precisamos calcular o número de pessoas do conjunto universo, ou seja, nosso espaço
amostral.
Teremos:
n(U) = n(J U P) + N.º de pessoas que não lêem jornais.
n(U) = n(J) + n(P) – n(J ∩ P) + 800
n(U) = 5000 + 4000 – 1200 + 800
n(U) = 8600
Portanto, a probabilidade procurada será igual a:
P = 1200/8600 = 12/86 = 6/43.
Logo, P = 6/43 = 0,1395 = 13,95%.
4. Probabilidade condicional
Teremos então:
P(A/B) = n(A∩B)/n(B)
onde A∩B = interseção dos conjuntos A e B.
Vejamos:
Ora, a expressão acima, pode ser escrita sem nenhum prejuízo da elegância, nem do
rigor, como:
P(A/B) = [n(A∩B)/n(U)] . [n(U)/n(B)]
P(A/B) = p(A∩B) . 1/P(B)
Vem, então: P(A / B) = p (A∩B) /p (B), de onde concluímos finalmente:
P(A ∩ B) = P(A/B).P(B)
então p(A/B) = p(A) e, neste caso, os eventos são ditos independentes, e a fórmula
acima fica:
Exemplo:
Uma urna possui cinco bolas vermelhas e duas bolas brancas.Calcule as probabilidades
de:
a) em duas retiradas, sem reposição da primeira bola retirada, sair uma bola vermelha
(V) e depois uma bola branca (B).
Solução:
P(V ∩ B) = P(V) . P(B/V)
P(V) = 5/7 (5 bolas vermelhas de um total de 7).
Supondo que saiu bola vermelha na primeira retirada, ficaram 6 bolas na urna. Logo:
P(B/V) = 2/6 = 1/3
Da lei das probabilidades compostas, vem finalmente que:
P(V ∩ B) = 5/7 . 1/3 = 5/21 = 0,2380 = 23,8%
b) em duas retiradas, com reposição da primeira bola retirada, sair uma bola vermelha
e depois uma bola branca.
Solução:
Com a reposição da primeira bola retirada, os eventos ficam independentes. Neste caso,
a probabilidade buscada poderá ser calculada como:
P(V ∩ B) = P (V) . (B) = 5/7 . 2/7 = 10/49 = 0,2041 = 20,41%
5. Teorema Bayes
Definição: Sejam E1, E2, E3, . . . , Ek eventos mutuamente exclusivos, tais que: P(E1) +
P(E2) + P(E3) + . . . + P(Ek) = 1. Seja A um evento qualquer, que se sabe ocorrerá em
conjunto com, ou em conseqüência de, um dos eventos Ei. Então a probabilidade de
ocorrência de um evento Ei dada a ocorrência de A, é dada por:
P( Ei ∩ A) P( Ei ) ⋅ P( A / Ei )
P( Ei / A) = =
P( A) P( E1 ) ⋅ P( A / E1 ) + P( E 2 ) ⋅ P( A / E 2 ) + .... + P( E k ) ⋅ P( A / E k )
EXERCÍCIOS
1. Determine a probabilidade de cada evento:
a) Um número par aparecer no lançamento de um dado não viciado;
b) Um rei aparecer, ao extrair-se uma carta de um baralho;
c) Pelo menos uma cara aparecer no lançamento de três moedas;
d) Pelo menos uma cara aparecer no lançamento de n moedas;
e) Duas copas aparecerem, ao retirarem-se duas cartas de um baralho;
f) Uma carta de copas e uma de ouros aparecerem ao extraírem-se duas
cartas de um baralho.
R: a) 1/2 b) 1/13 c) 7/8 d) (2n – 1)/2n e) 1/17
f) 13/204
9. Numa urna, são misturadas 10 bolas numerada de 1 a 10. Duas bolas são
retiradas (a, b) sem reposição. Qual é a probabilidade de a + b =10?
R: 4/45
11. Um lote é formado por 10 peças boas, quatro com defeitos e duas com defeitos
graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que:
a) Ela não tenha defeitos graves;
b) Ela não tenha defeitos;
c) Ela seja boa, ou tenha defeitos graves;
R: a) 7/8 b) 5/8 c) ¾
12. Considere o mesmo lote anterior. Retiram-se duas peças ao acaso. Qual a
probabilidade de que;
a) Ambas sejam perfeitas?
b) Pelo menos uma seja perfeita?
c) Nenhuma tenha defeito grave?
d) Nenhuma seja perfeita?
R: 3/8 b) 7/8 c) 91/120 d) 1/8
14. Uma urna contém cinco bolas brancas e seis pretas. Três bolas são retiradas.
Calcular a probabilidade de:
a) Serem todas pretas;
b) Ser exatamente uma branca;
c) Ser ao menos uma preta.
R: a)4/33 b) 5/11 c) 31/33
15. Em uma classe, existem cinco alunos do 4º ano, quatro do 2º ano e três do 3º
ano. Qual é a probabilidade de serem sorteados dois alunos de 2º ano, três do 4º
e dois do 3º?
R: 5/22
16. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20
terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a
probabilidade de:
a) A ganhar todas as três;
b) Duas partidas terminarem empatadas;
c) A e B ganharem alternadamente.
R: a) 1/8 b) 5/72 c) 5/36
18. Numa bolsa temos cinco moedas de R$ 1,00 e quatro de R$ 0,50. Qual a
probabilidade de, ao retirarmos duas moedas, obtermos R$ 1,50?
R: 5/9
3
19. A probabilidade de uma mulher estar viva daqui 30 anos é de e de seu
4
3
marido, . Calcular a probabilidade de:
5
a) Apenas o homem estar vivo;
b) Somente a mulher estar viva;
c) Ambos estarem vivos.
R: a) 3/20 b) 3/10 c) 9/20
20. Uma caixa A contém oito peças, das quais três são defeituosas, e uma caixa B
contém cinco peças, das quais duas são defeituosas. Uma peça é retirada
aleatoriamente de cada caixa.
a) Qual a probabilidade p de que ambas as peças não sejam defeituosas?
b) Qual é a probabilidade p de que uma peça seja defeituosa e a outra não?
c) Se uma peça é defeituosa e a outra não, qual é a probabilidade p de que a
peça defeituosa venha da caixa A?
R: a) 3/8 b) 19/40 c) 9/19
21. Temos duas caixas: na primeira há três bolas brancas e sete pretas; e na segunda,
uma bola branca e cinco pretas. De uma caixa escolhida ao acaso, seleciona-se
uma bola e verifica-se que é preta. Qual é a probabilidade de que a caixa onde
for extraída a bola seja a primeira? E a segunda?
R: 21/46 25/46
3
22. A probabilidade de um indivíduo de classe A comprar uma carro é de , de B é
4
1 1
e de C é . A probabilidade de o indivíduo de classe A comprar um carro
5 20
1 3 3
da marca D é ; de B comprar da marca D é e de C é . Em certa loja
10 5 10
comprou-se um carro da marca D. qual é a probabilidade de que o indivíduo da
classe B o tenha comprado?
R: 4/7
23. Em certo colégio, 5% dos homens e 2% das mulheres tem mais do que 1,80m de
altura. Por outro lado, 60% dos estudantes são homens. Se um estudante é
escolhido ao acaso e tem mais de 1,80m de altura qual é a probabilidade de que
o estudante seja mulher?
R: 4/19
25. A industria Alpha Ltda., fabricante de esferas metálicas, possui três máquinas,
M1, M2 e M3, responsáveis por 25%, 40% e 35%, respectivamente, de sua
produção diária. Por sua vez, as respectivas taxas de unidades defeituosas são de
1%, 2% e 3%. Tendo um item sido retirado, ao acaso, da produção diária de
600.000 unidades, e se verificando que apresenta defeito, pede-se a
probabilidade de ser proveniente de Mi (i = 1, 2, 3).
R: M1 = 11,9% M2 = 38,10% M3 = 50%
26. A circulação da estrada que liga a cidade Alpha à cidade Betha é cortada por três
sinais luminosos, não sincronizados, cuja distancia entre si é de 2,5km. Os sinais
têm ciclo de um minuto, com duração para o sinal verde de 30, 30 e 40
segundos, respectivamente. Se um carro percorre a estrada, à velocidade de
60km/h, observando a todos os sinais, qual a probabilidade de não ser parado
por nenhum deles?
R: 1/6
28. Uma caixa tem 3 moedas: uma não viciada, outra com 2 caras e uma terceira
1
viciada, de modo que a probabilidade de ocorrer cara nesta moeda é de . Uma
5
moeda é selecionada ao acaso da caixa. Saiu cara. Qual a probabilidade de que a
3ª moeda tenha sido selecionada?
R: 2/17
29. Um certo programa pode ser usado com uma entre duas sub-rotinas A e B,
dependendo do problema. A experiência tem mostrado que a sub-rotina A é
usada 40% das vezes e B é usada 60% das vezes. Se A é usada, existe 75%
de chance que o programa chegue a um resultado dentro do limite de tempo. Se
B é usada, a chance é de 50%. Se o programa foi realizado dentro do limite de
tempo, qual a probabilidade de que a sub-rotina A tenha sido escolhida?
R: 50%
30. A probabilidade de que um atleta A ultrapasse 17,30m num único salto triplo
é de 0,7. O atleta dá 4 altos. Qual a probabilidade de que pelo menos num dos
saltos ultrapasse 17,30m?
R: 99,19%
PARTE VI
Exemplo:
• Lançam-se três moedas. Seja X: número de ocorrência de face cara. Determinar a
distribuição de probabilidade de X.
Exemplos:
• X: O número de Caras obtidas em um lançamento de duas moedas não viciadas.
• X: O número de Clientes que vão ao banco no horário das 10:00h as 12:00h.
• X: Chamadas telefônicas por unidade de tempo.
• X: Número de partículas emitidas por uma fonte de material radioativo por unidade
de tempo.
Exemplos:
• X: Altura acima do solo que um dardo atinge o painel.
• X: O intervalo de tempo de vida de uma lâmpada.
• X: Tempo de vida útil de uma bateria de automóvel.
• X: Tempo de vida de uma pessoa.
2. Função Probabilidade
F( x ) = ∑ p( xi )
xi ≤ x
Exemplo:
• Lançam-se três moedas. Seja X: número de ocorrência de face cara. Determinar a
Distribuição de Probabilidade Acumulada de X, para:
a) F(1)
b) F(1,5)
c) F(2,5)
d) F(3)
e) F(5)
f) F(-0,5)
• Em uma caixa, têm-se cinco peças boas e quatro defeituosas. São retiradas
aleatoriamente três peças, sem reposição. Determinar a tabela de distribuição de
probabilidades, seu gráfico e as seguintes funções acumuladas abaixo, para a variável
aleatória X: número de peças boas dentre as três peças retiradas:
a) F(-0,7)
b) F(0,5)
c) F(1)
d) F(1,8)
e) F(2,1)
f) F(3)
g) F(8)
Var( x ) = σ 2 ( x ) = { E( x 2 ) − [ E( x )2 ]}
onde:
k
E( x 2 ) = ∑ [( xi 2 ). p( xi ) ]
i =1
e
k
E( x ) = ∑ [( xi ). p( xi ) ]
i =1
Notação:
Var( x ), V ( x ), σ 2 , σ x2 , σ 2
DP( x ) = Var( x )
ou
σ ( x ) = σ 2( x )
∑ P ( X = xi ) = ∑
i =1 i =1
∑j =1
p ( xi , y j ) = 1
∑ P(Y = y ) = ∑ ∑
j =1
i
j =1 i =1
p( xi , y i ) = 1
7. Distribuições Condicionais
Definição:
P( X = xi ;Y = y j )
P( X = xi / Y = y j ) = , j = fixo e i = 1, 2 ,..., m
P( Y = y j )
p( y = y j ) ≠ 0
Definição:
P( X = xi ;Y = y j )
P( Y = y j / X = xi ) = , i = fixo e j = 1, 2,..., n
P( X = xi )
p( X = xi ) ≠ 0
Definição:
m m p ( xi ; y j )
P( X / Y = y j ) = ∑ xi .p(x i /y i ) = ∑ x i j = fixo e i = 1, 2,..., n
i =1 i =1 p( y j )
Definição:
n n p( xi ; y j )
P(Y / X = xi ) = ∑ yi .p(y i /x i ) = ∑ y j i = fixo e j = 1, 2,..., m
j =1 j=1 p ( xi )
9.1 E ( X ± Y ) = E ( X ) ± E (Y )
ρ ≤ 1 ⇒ −1 ≤ ρ ≤ +1
EXERCÍCIOS
1. Uma urna tem 4 bolas brancas e 3 pretas. Retiram-se 3 bolas sem reposição. Seja
X: número de bolas brancas, determinar a distribuição de probabilidade de X.
6. Sabe-se que uma moeda mostra a face cara quatro vezes mais do que a face
coroa, quando lançada (MOEDA VICIADA). Esta moeda é lançada quatro
vezes. Seja X: o número de caras que aparece, determine:
a) E(X) R: E(X)=3,20
b) Desvio Padrão de (X) R: VAR(X)= 0,64
c) P(X≥2) R: 0,9728
d) P(1 ≤X <3) R: 0,1792
PARTE VII
Hipóteses:
• São realizadas n provas do mesmo tipo (Idênticas);
• Cada prova admite dois resultados possíveis: Sucesso ou Fracasso;
• Os resultados das provas são independentes;
Fórmula: P(X = x) = p x .q n − x .C n , x
Onde:
n = número de provas ou repetições;
x=número de Sucessos;
n-x = número de Fracassos;
p = probabilidade de sucesso em cada prova;
q = 1-p é a probabilidade de Fracasso em cada prova;
C n , x = número de combinações de n elementos tomados x a x
DISTRIBUIÇÃO GEOMÉTRICA
Seja X número de tentativas necessárias ao aparecimento do primeiro sucesso.
Assim a variável x tem distribuição geométrica:
Fórmula: P(X = x) = q x −1 . p
Onde:
x= número de tentativas necessárias ao aparecimento do primeiro sucesso;
p = probabilidade de sucesso;
q = é a probabilidade de Fracasso;
q
Variância Var(x) = σ2 (x) =
p2
DISTRIBUIÇÃO DE PASCAL
Suponha que um experimento aleatório repetido independentemente até que um
evento A ocorra pela r-ésima vez.
Seja X: número de repetições necessárias para que A ocorra pela r-ésima vez.
Assim a variável x tem distribuição de Pascal:
Fórmula: P(X = x) = p r .q x − r .C x −1
r −1
Onde:
x = número de repetições;
r = número de sucessos;
p = probabilidade de sucesso;
q = é a probabilidade de Fracasso;
DISTRIBUIÇÃO HIPERGEOMÉTRICA
Consideremos uma população com N elementos das quais r têm uma
determinada característica. Retiramos dessa população, sem reposição, uma amostra de
tamanho n.
Seja X: número de sucessos na amostra
Assim a variável x tem distribuição Hipergeométrica:
Combinações sucessos
Fórmula: P(X = x) = n− x , 0 ≤ x ≤ n e x≤r
C N ,n
Combinações da Amostra
Onde:
x = número de sucessos da amostra;
r = característica da população;
N = tamanho da população;
n = tamanho da amostra;
DISTRIBUIÇÃO DE POISSON
Consideremos a probabilidade de ocorrência de sucessos em um determinado
intervalo.
Hipóteses:
H1: A probabilidade de uma ocorrência em um intervalo ∆t ( ∆ S, ou...) é constante e
proporcional ao tamanho do intervalo. Isto é:
P( X = 1,∆t ) = λ∆t
EXERCÍCIOS
4. Uma urna tem 20 bolas pretas e 30 brancas. Retira-se 25 bolas com reposição.
Qual a probabilidade de que:
a) 2 sejam pretas? R: 0,038%
b) Pelo menos 3 sejam pretas? R: 99,96%
5. Numa estrada há 2 acidentes para cada 100 km. Qual a probabilidade de que em;
a) 250Km ocorram pelo menos 3 acidentes? R: 87,53%
b) 300Km ocorram 5 acidentes? R: 16,06%
10. A experiência mostra que de cada 400 lâmpadas, 2 queimam ao serem ligadas.
Qual a probabilidade de que numa instalação de:
a) 600 lâmpadas no mínimo se queimem? R: 57,68%
b) 900 lâmpadas, exatamente se queimem? R: 4,63%
11. O número de mortes por afogamento em fins de semana, numa cidade praiana é
de 2 para cada 50.000 habitantes. Qual a probabilidade de que em:
12. Numa urna há 40 bolas brancas e 60 bolas pretas. Retiram-se 20 bolas. Qual a
probabilidade de que ocorram no mínimo 2 bolas brancas, considerando as
extrações:
b) sem reposição; R: 99,98%
c) com reposição. R: 99,94%
14. A média de chamadas telefônicas numa hora é três. Qual a probabilidade de:
a) Receber exatamente três chamada numa hora? R: 22,41%
b) Receber quatro ou mais chamadas em 90 minutos? R: 65,8%
15. Certo posto de Bombeiros recebe em média três chamadas por dia. Calcular a
probabilidade de:
a) receber quatro chamadas num dia; R: 16,8%
b) receber três ou mais chamadas num dia. R: 57,67%
16. Uma loja atende em média dois cliente por hora. Calcule a probabilidade de em
uma hora:
a) atender exatamente dois cliente; R: 27%
b) atender três clientes. R: 18%
1
19. A probabilidade de um atirador acertar uma alvo é de . Se ele atirar seis vezes,
3
qual a probabilidade de:
10. acertar exatamente dois tiros? R: 32,92%
11. não acertar nenhum tiro? R: 8,78%
PARTE VIII
Parâmetros:
ESPERANÇA MATEMÁTICA: Pode ser entendida como um “centro de distribuição
∞
de probabilidade”. E ( X ) = µ ( x) = ∫ x ⋅ f ( x)dx
−∞
VARIÂNCIA MATEMÁTICA:
VAR( X ) = E ( X 2 ) − [ E ( X )] 2
onde:
∞
E( X 2 ) = ∫x ⋅ f ( x)dx
2
−∞
1. DISTRIBUIÇÃO UNIFORME
O valor de k é:
b
∫ kdx = 1
a
Logo:
1
se a ≤ x ≤ b
f ( x) = b - a
0 se x < a ou x > b
Parâmetros:
ESPERANÇA MATEMÁTICA: A Esperança de X é o ponto médio do intervalo
b+a
[a, b]: E( X ) =
2
(b − a) 2
VARIÂNCIA MATEMÁTICA: A variância de X é dada por: VAR( X ) =
12
2. DISTRIBUIÇÃO NORMAL
O nome normal deve-se ao fato de que muitas distribuições de freqüências de
erros de observações e mensurações podem ser descritas por uma distribuição dessa
natureza.
A distribuição de probabilidade normal tem importância na inferência estatística
por três razões:
· As medidas produzidas em diversos processos aleatórios seguem esta distribuição;
· Probabilidades normais podem ser usadas freqüentemente como aproximações de
outras distribuições de probabilidade, como a Binomial e de Poisson;
· As distribuições estatísticas da amostra, como a média e a proporção, seguem
freqüentemente a distribuição normal, independentemente da distribuição da população.
Embora a curva normal esteja definida de menos infinito (-∞) à mais infinito
(+∞), pode-se observar que quase a totalidade dos casos cai entre -3 e +3 desvios
padrão, ou seja, 97,74% dos casos. Este fato é ilustrado na figura abaixo.
3. DISTRIBUIÇÃO EXPONENCIAL
A distribuição exponencial é freqüentemente usada em estudos de confiabilidade
como sendo o modelo para o tempo até a falha de um equipamento – muito utilizado
para componentes eletrônicos.
O tempo de vida até a falha de um semicondutor pode ser modelado por uma
variável aleatória exponencial com média de 40.000h, por exemplo.
A variável X, que é igual à distância entre contagens sucessivas de um processo
de Poisson, com média λ > 0, tem uma distribuição exponencial com parâmetro λ.
λ e − λx se x ≥ 0
f ( x) =
0 se x < 0
A função de distribuição de X, f.d.p., é:
1 − e − λx se x > 0
F ( x) = se
0 se x ≤ 0
O gráfico da f.d.p. de X é:
P(T>t0) = e − λt0
P(T≤t0)=1 – e − λt0
Parâmetros:
ESPERANÇA MATEMÁTICA: A Esperança de X é o ponto médio do intervalo
1
[a, b]: E( X ) =
λ
EXERCÍCIOS
1. A dureza de uma peça de aço pode ser pensada como uma variável aleatória com
distribuição uniforme no intervalo de [50, 70] da escala de Rockwel segundo a
f.d.p. dada:
1
se 50 ≤ h ≤ 70
F(h) = 20
0 se h < 50 ou h > 70
Calcular a probabilidade de que uma peça tenha dureza entre 55 e 60.
R: ¼
2. Uma variável aleatória contínua X, com distribuição exponencial [0, +∞), tem
f.d.p. dada por:
k −x
e se x ≥ 0
f ( x) = 2
0 se x < 0
a) calcular o valor de k.
R: K=2
k (2 x − x 2 ) se 0 ≤ x ≤ 1
f ( x) =
0 se x < 0 ou x > 1
a) determinar K.
b) calcular a E(x) e Var(x).
c) calcular P(0 ≤ x ≤ ½)
R: a) K=3/2 b) 5/8 e 19/320 c) 5/16
0 4 x
R: a) ¼ b) 2,58 c) 4/3 d) 8/9
5. Uma fábrica de TV determinou que a vida média dos tubos de sua fabricação é
de 800 horas de uso contínuo e segue distribuição exponencial. Qual a
probabilidade de que a fabrica tenha de substituir um tubo gratuitamente, se
oferecer uma garantia de 300 horas de uso?
R: 0,3127
K + 44 − 2 kx
e se x ≥ 0
7. Sendo f(x) = 6 calcular
0 se x < 0
a) K;
b) P {8µ − 3σ < x < 10 µ + 6σ )
R: a) K=4 b) 0,00674
2e −2 x se x ≥ 0
8. A f.d.p. f ( x) = representa a distribuição do índice de acidez (X)
0 se x < 0
de um determinado produto alimentício. O produto é consumível se este for
menor que 2. O setor de fiscalizaáo do I.A.L. aprendeu 30 unidades do mesmo.
Qual a probabilidade de que pelo menos 10% da amostra esteja imprópria para
consumo?
R: 0,02172
10. Foi feito um estudo sobre a altura de uma faculdade, observando-se que ela se
distribuía normalmente com média de 1,72m e desvio Padrão de 5cm. Qual a
porcentagem dos alunos com altura:
a) entre 1,67m e 1,77m?
b) entre 1,62m e 1,82m?
c) entre 1,57m e 1,87m?
d) acima de 1,90m?
R: a) 68,27% b) 95,45% c) 99,73% d) 0,02%
R: a) 0,626 b) 97,59%
13. Numa fábrica foram instaladas 1000 lâmpadas novas. Sabe-se que a duração
média das lâmpadas é de 800 horas e desvio padrão de 100 horas, com
distribuição normal. Determinar a quantidade de lâmpadas que durarão:
a) Menos de 500 horas.
b) Mais de 700 horas.
c) Entre 516 e 814 horas.
R: a) 1,4 b) 841,3 c) 120,8
15. Uma fábrica de pneumáticos fez um teste para medir o desgaste de sues pneus e
verificou que ele obedecia a uma distribuição normal de média 48.000 km e
desvio Padrão de 2.000km. Calcule a probabilidade de um pneu escolhido ao
acaso:
a) Durar mais de 46.000km;
b) Durar menos de 52.000km
c) Durar entre 45.000 e 50.000km.
16. Suponha que o diâmetro médio de vida dos parafusos produzidos por uma
fábrica seja de 0,25 polegadas, e o desvio padrão de 0,02 polegadas. Um
parafuso é considerado defeituoso se seu diâmetro é maior que 0,28 polegadas
ou menor que 0,20 polegadas.
a) Encontre a porcentagem de parafusos defeituosos.
b) Qual deve ser a medida mínima para que tenhamos no máximo 12% de
parafusos defeituosos?
R: a) 7,3% b) 0,2266 polegadas
c) Exatamente um mês?
d) Mais de três semanas?
R: a) 0,2212 b) 0,0323 c) 0 d) 0,4724
PARTE IX
7.1 - INTRODUÇÃO
O objetivo da Estatística é o de conhecer populações por meio das informações
amostrais. Como as populações são caracterizadas por medidas numéricas descritivas,
denominadas parâmetros, a estatística diz respeito á realização de inferências sobre
esses parâmetros populacionais desconhecidos. Parâmetros populacionais típicos são a
média ( X ou µ ), o desvio padrão ( S ou σ ) e a proporção (p)de determinado
evento populacional.
Os nmétodos para realizar inferências a respeito dos parâmetros pertencem a
duas categorias:
• Estimação : determinação de estimativas dos parâmetros populacionais;
• Teses de hipóteses: tomada de decisão relativa ao valor de um parâmetro
populacional.
EXEMPLO:
Uma amostra aleatória de 200 alunos de uma universidade de 20.000 estudantes
revelou nota média amostral de 5,2. logo: x = 5,2 é uma estimativa pontual da
verdadeira média dos 20.000 alunos.
EXEMPLOS:
• O intervalo [1,60m; 1,64m] contém a altura média dos moradores do município X,
com um nível de confiança de 95%;
Geometricamente
ϕ = n-1
α α
2 2
α
1-α
− tα 0 tα
2 2
−
Equação
S S
IC (µ, (1-α)%) = x − t α . ≤ µ ≤ x + t α .
n −1, n n −1, n
2 2
Onde:
t = distribuição t de Student
(n – 1) = grau de liberdade
S = desvio padrão
x = média
n = tamanho da amostra
α = probabilidade de erro na estimação do intervalo.
f( X 2i )
α ϕ = n-1
2
α
α
1-α
2
X2inferior X2superior X2
Equação
2
S ( n −1) S 2( n −1)
IC (σ, (1-α)%) = ≤σ ≤
X 2 sup X 2 inf
Onde:
6. Sabe-se que a variação das dimensões fornecidas por uma máquina independem
dos ajustes do valores médios. Duas amostras de dimensões das peças
produzidas forneceram:
Amostra 01: 12,2 12,4 12,1 12 12,7 12,4
Amostra 02: 14,0 13,7 13,9 14,1 13,9
Estabeleça um intervalo de 90% e 95% de confiança para a média e para o desvio
padrão com que a máquina opera. Interprete os resultados.
PARTE X
2 - MODELOS DE REGRESSÃO
d) quanto a finalidade
Modelos de decisão – são aqueles orientados para o processo de tomada de
decisões.
Modelos de previsão – que visam á previsão de valores de uma variável.
Tais classificações não são exclusivas. Portanto, um modelo pode ser, por exemplo
linear, uni-equacional, dinâmico e de decisão ao mesmo tempo.
Yi
Ŷ = a + bX
(Y − Yˆ )
X Xi
Figura 1: Desvio entre uma observação e a reta de Mínimos Quadrados.
Os pontos acima da reta dão erros positivos, os situados abaixo dão erros
n
negativos. Como a soma dos erros é zero, isto é; ∑ (Yi − Yˆi ) = 0 , o método utiliza a soma
i =1
n
dos quadrados dos erros, daí o nome Mínimos Quadrados. Assim, ∑ (Y − Yˆ )
i =1
i ii
2
deverá
ser minimizada.
Como Yˆi = a + bX i , vamos minimizar:
n
∑ [(Y − (a + bX )]
i =1
i i
2
I − ∑
i =1
Yi = na + b ∑
i =1
Xi
n n n
II − X Y = a X + b X 2
∑i =1
i i ∑i =1
i ∑
i =1
i
Sxy
b= e a = y − bx
Sxx
onde:
n n
∑ Xï = x
i =1
e ∑Y
i =1
ï =y
S xy = ∑ xy −
∑ x∑ y S xx = ∑ x − 2
(∑ x ) 2
n n
x=
∑x y=
∑y
n n
Exemplo
Para estimar uma possível relação linear entre o preço de venda (Y) e o valor
estimador ou “valor contábil”(X) de resistência em determinado bairro foi selecionada
uma amostra de cinco residências que foram vendidas no ultimo ano. Os valores estão
em unidade de R$ 100.000.
Residências Valor estimado (x) Preço de venda (y)
1 2 2
2 3 5
3 4 7
4 5 10
5 6 11
Determine a reta de ajuste e seu coeficiente de correlação.
Observemos então que, para amostras grandes, R 2 = R2, mas para pequenas
amostras, que é o caso em que R2 é uma medida deficiente R 2 é pequeno, valendo
sempre a relação R 2≤ R2 .
Em particular, para n = 2 , R 2 é indeterminado e quando R2 = 100, caso em que
o ajuste é perfeito, R 2 também é igual a 100, a menos que n = 2.
O estimador da variância do modelo s2 é dado por é dado por
EXERCÍCIOS
BIBLIOGRAFIA