Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Fernando Guerra
Estatística Aplicada à
Educação Matemática
Florianópolis, 2007
Universidade Federal de Santa Catarina
Consórcio ReDiSul
Comissão Editorial
Antônio Carlos Gardel Leitão
Albertina Zatelli
Elisa Zunko Toma
Igor Mozolevski
Luiz Augusto Saeger
Roberto Corrêa da Silva
Ruy Coimbra Charão
Coordenação Pedagógica das Licenciaturas à Distância UFSC/CED/CFM
Coordenação: Roseli Zen Cerny
Núcleo de Formação
Coordenação: Nilza Godoy Gomes
Ficha Catalográfica
T164e
Taneja, Inder Jet
Estatística Aplicada à Educação Matemática / Inder Jet Taneja, Fernando
Guerra. – Florianópolis : UFSC/EAD/CED/CFM, 2007.
234 p.
ISBN 9788599379158
1. Estastística. 2. Educação. I. Guerra, Fernando. II Título.
CDU 519.2
4 Medidas de Dispersão e
Utilização das Planilhas ........................................................ 99
4.1 Introdução ..................................................................................101
4.2 Amplitude ................................................................................. 103
4.3 Desvio Médio............................................................................ 105
4.3.1 Desvio Médio Absoluto – Dados Isolados .................... 106
4.3.2 Dados Isolados Ponderados e
Agrupados em Classe ...............................................................107
4.4 Desvio Padrão ...........................................................................111
4.5 Variância ....................................................................................112
4.6 Coeficiente de Variação ............................................................113
4.7 A Estatística no Excel ............................................................... 120
4.7.1 Conhecendo o Excel ......................................................... 120
Os autores
1 Noções Básicas da Estatística
1 Noções Básicas da Estatística
13
Pelo Decreto de 6 de julho de 1934, foi criado o Instituto Nacional de
Estatística, órgão que veio centralizar todas as atividades estatísticas do
país e responsável pela publicação do Anuário Estatístico do Brasil.
14
todos que se destinam a possibilitar a tomada de decisões acerta-
das face às incertezas.
1.2 Conceitos
Existe mais de uma centena de conceitos ou definições propostos
por autores, objetivando estabelecer com clareza a filosofia, os
limites e o campo de atuação da Estatística. Alguns são:
15
Uma população pode ser finita ou infinita (em princípio, não se
pode, na realidade, enumerar todas as observações, como por
exemplo, os astros existentes no Universo).
1.4 Amostra
É um conjunto de observações (aleatórias, sem preferência) e
representativas tomadas de uma População. Uma amostra deve
ser probabilística, isto é, cada elemento da população deve ter a
mesma oportunidade ser escolhido. É, portanto, um subconjunto
finito de uma população. Eis alguns exemplos:
16
• a execução da pesquisa;
• o levantamento de dados necessários;
• a análise dos dados;
• os resultados alcançados;
• a conclusão.
1) Pesquisa de Levantamento
Neste tipo de pesquisa, levantamos diversas características
dos elementos da população, utilizando questionários ou
entrevistas. A observação é feita naturalmente sem a inter-
ferência do pesquisador.
2) Pesquisa Experimental
Este tipo de pesquisa é usado para resolver problemas bem
específicos, geralmente formulados sob a forma de hipóte-
ses de causa e efeito. Por exemplo, a metodologia que certo
aluno utiliza para estudar uma disciplina do seu curso e sua
reprovação nesta mesma disciplina é influenciada por isto.
17
A coleta pode ser direta e indireta.
18
1.9 Análise Exploratória de Dados
Com os dados adequadamente resumidos e apresentados em ta-
belas e gráficos, podemos observar certos aspectos relevantes e
começar a delinear hipóteses a respeito da estrutura do fenômeno
objeto de estudo. Isto se chama Análise Exploratória de Dados (técni-
cas para extrair informações de conjuntos de dados).
19
• Dados de Experimento – Têm a finalidade de observar as
relações de causa e efeito que existem entre fenômenos pro-
venientes de uma situação onde existe realmente controle
sobre os fatores que influenciam os dados. É o que chama-
mos também de dados primários, por exemplo: o interes-
se de um aluno em participar em programas de capacita-
ção; o nível de satisfação do aluno em relação a seu curso.
20
ii) Variáveis Ordinárias são variáveis onde existe um or-
denamento ou uma hierarquia. Por exemplo: hierarquia
numa empresa: presidente, diretor, gerente etc.; resposta a
um questionário de pesquisa onde existe uma escala: bom,
regular e ruim; as posições das 10 melhores instituições de
ensino superior: primeira, segunda etc.
Escolari-
Nome Idade Cargo Sexo Peso
dade
João Paulo 36 Supervisor Escolar M 68 kg 1o Grau
Ana Cristina 29 Secretária F 71 kg 2o Grau
Alex Pereira 39 Chefe de expediente M 65 kg 1o Grau
Paulo José 26 Analista de Sistema M 74 kg 3o Grau
Quadro 1.1
21
• Idade: variável quantitativa contínua;
• Cargo: variável qualitativa ordinal;
• Sexo: variável qualitativa ordinal;
• Peso: variável quantitativa continua;
• Escolaridade: variável qualitativa ordinal.
• Primeira
• Segunda
Nota: _________.
22
suração proposta leva aos objetivos da pesquisa.
23
2) Fazer uma revisão bibliográfica para verificar como men-
surar adequadamente algumas características.
No nosso exemplo, queremos avaliar o grau de satisfação do
aluno com o seu curso. Devemos procurar referências biblio-
gráficas que nos orientem sobre como medir a satisfação.
24
3) Sexo: F se feminino, M se masculino;
• Questionário
1) Id:________
2) Turma: ( ) A ( )B
5) Altura: _________ m
6) Peso: __________ kg
25
8) Gosta de praticar atividades físicas? ( ) Sim ( ) Não
1) Id: 1_
2) Turma: ( x ) A ( )B
5) Altura: 1,72_ m
6) Peso: 74,6_ kg
26
1 2 3 4 5 6 7 8 9 10 11 12
Id. Turma Sexo Idade Altura Peso Filhos Gosta N° vez Est civil Pratica Qual
1 A Mas 30,5 1,72 74,6 0 Sim 2 Cas Sim Nat
2 A Fem 35,7 1,62 62,8 0 Não 2 Solt Sim Nat
3 B Mas 23,4 1,68 80,2 1 Sim 1 Divor Sim Fut
4 B Mas 27,2 1,69 64,8 0 Sim 5 Solt Sim Bas
5 A Fem 32,1 1,63 36,9 0 Não Nen Solt Não Nen
6 B Fem 23,6 1,62 65,3 0 Sim 2 Solt Sim Vol
7 A Fem 30,6 1,72 62,7 2 Sim 3 Cas sim Fut
8 B Fem 22,7 1,83 71,7 1 Sim 2 Cas Sim Nat
9 A Mas 25,5 1,83 109,2 1 Sim Nen Solt Não Nen
10 B Fem 21,8 1,52 58,2 1 Sim Nen Dolt Não Nen
Quadro 1.2
27
dem ser os próprios elementos da população; a forma de seleção dos
elementos da população feita sob a forma de sorteio (são as amostras
aleatórias) e o tamanho da amostra. Por exemplo, numa população
de alunos matriculados na UFSC, residentes em Florianópolis,
podemos planejar a seleção dos alunos com domicílios residen-
ciais na ilha ou no continente. Chegando ao domicílio (unidade
de amostragem), podemos chegar aos estudantes domiciliados na
ilha (elemento da população).
28
• n = tamanho (número de elementos) da amostra;
• n0 = uma primeira aproximação para o tamanho da amostra;
• E0 = erro amostral tolerável.
29
Portanto, o tamanho mínimo de uma amostra aleatória simples,
tal que o erro amostral não seja superior a 5% é de 240 alunos.
Exercícios Propostos
1) Numa pesquisa para estudar se o povo brasileiro confia no
atual presidente da república, diante dos fatos de denúncias de
corrupção e as CPIs, qual o tamanho de uma amostra aleatória
simples de pessoas (maiores de 18 anos) que garanta um erro
amostral não superior a 3%?
30
2) A UFSC com, digamos, 3.500 servidores técnicos administrati-
vos, numa política de recursos humanos, deseja estimar a porcen-
tagem de servidores favoráveis a certo tipo de capacitação para o
seu tipo de trabalho. Qual deve ser o tamanho de uma amostra ale-
atória simples que garanta um erro amostral não superior a 2%?
Respostas:
31
4) Considerando a população dos alunos do quarto semestre (4ª
fase) do Curso de Licenciatura (noturno) em Matemática da UFSC,
semestre 2005/1, completar as definições das seguintes variáveis e
verificar quais são qualitativas e quais são quantitativas.
a) Turma;
b) Sexo;
c) Idade;
d) Altura;
e) Peso;
f) Filhos;
g) Est. Civ..
Resposta:
Resumo
Neste capítulo, você teve a oportunidade de estudar e compre-
ender os conceitos de Estatística, população e amostra, campo de
aplicação e também o conceito de Estatística Descritiva.
32
Resta mencionar que a compreensão, sempre referida, é impor-
tante para que você possa acompanhar o curso. Se você teve al-
guma dúvida, releia todo o capítulo, já que tudo que veremos a
seguir depende dos conceitos abordados neste capítulo. Consulte
o tutor do pólo sempre que achar necessário.
Bibliografia Comentada
33
2 Organização de Dados, Gráficos
e Distribuição de Freqüência
35
2 Organização de Dados, Gráficos
e Distribuição de Freqüência
2.1 Variáveis
Sempre que desejamos simbolizar os elementos de uma popula-
ção, utilizamos as variáveis, representadas por letras (a, b, x, y, ...) ,
que podem assumir o valor de cada elemento desta população.
37
• o número de peças defeituosas produzidas por uma fábrica
poderá ser 0, 1, 2, ... e não 1,6 ou 3,17 . Assim, este número
é representado por uma variável discreta;
• o peso de uma pessoa poderá ser 74,8 kg ou 74,796 kg , con-
forme a precisão da balança utilizada. Este peso é, então,
representado por uma variável contínua.
a) totais ou parciais;
b) simples ou cruzadas.
a) tabelas ou quadros;
b) gráficos.
38
momento deixará de ter o valor devido, se a conclusão não es-
tiver coerente.
39
Uma tabela compõe-se de:
40
Reajuste de salários dos professores de ensino fundamental e ensino mé-
dio da Escola Prof. Fortunato Siqueira, do município XX, estado de Santa
Catarina, no período de 1996 a 2005
Anos Reajuste Salarial (%)
1996 12,2
1997 11,4
1998 13,0
1999 10,4
2000 2,8
2001 5,9
2002 6,7
2003 10,9
2004 9,3
2005 8,7
Tabela 2.1
Fonte: Dados Hipotéticos
2.3 Gráficos
Os gráficos assumem papel fundamental em qualquer campo da
ciência. Seja na Física, na Química, na Biologia, na Medicina, na
Engenharia, na Estatística e em outras.
41
2.3.1 Tipos de Gráficos
Existem vários tipos de gráficos que são classificados a seguir:
i) gráfico de linha;
a) barras simples;
b) barras horizontais;
c) barras superpostas;
d) barras complementares;
v) gráfico polar;
• Gráfico de linha
42
2002 3.222
2003 3.222
2004 3.222
2005 3.222
Tabela 2.2
Fonte: Dados Hipotéticos
2.500
2.400
2.300
2.200
2.100
2.000
1.900
1.800
1.700
1.600
1.500
1.400
1.300
1.200
1.100
1.000 Anos
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Gráfico 2.1
Fonte: Dados Hipotéticos
• Gráfico de barras
43
Número Grau de instrução
1 1o grau
2 1o grau
3 1o grau
4 2o grau
5 1o grau
6 1o grau
7 1o grau
8 1o grau
9 2o grau
10 2o grau
11 2o grau
12 1o grau
13 2o grau
14 1o grau
15 2o grau
16 2o grau
17 2o grau
18 1o grau
19 superior
20 2o grau
21 2o grau
22 2o grau
23 1o grau
24 superior
25 2o grau
26 2o grau
27 1o grau
28 2o grau
29 2o grau
30 2o grau
31 superior
32 2o grau
44
33 superior
34 superior
35 2o grau
36 superior
Quadro 2.1
Superior
Segundo
Grau
Primeiro
Grau
0 3 6 9 12 15 18 21
Número de funcionários
Gráfico 2.2
• Gráfico de setores
Exemplo 2.4.
Tabela 2.3
Fonte: Secretaria de Finanças do Município XX
45
Receita do Município XX de 2001 a 2003
2003 2001
33% 34%
2002
33%
Gráfico 2.3
• Diagrama de pontos
Gráfico 2.4
46
Exercícios Propostos
1) Consideremos os dados relativos ao aproveitamento dos
alunos na disciplina de Estatística, turma 404 no Curso de Ma-
temática-EaD-UFSC, período 2005.1 apresentados abaixo.
Tabela 2.4
Respostas:
Excelente
Boa
Média
Razoável
Fraca
0 10 20 30 40 50 60
Porcentagem
Gráfico 2.5
b) Gráfico em setores.
Clasificação dos alunos de Estatística Turma 404
Excelente Fraca
10% 5%
Razoável
10%
Boa
25%
Média
50%
Gráfico 2.6
47
2.4 Distribuição de Freqüências
Entre as séries estatísticas, merece referência especial a distribui-
ção de freqüência. Uma distribuição de freqüência é uma tabela,
na qual os possíveis valores de uma variável se encontram agru-
pados em classes, registrando-se o número de valores observados
em cada classe. Os dados organizados em uma distribuição de
freqüência são chamados dados agrupados. Praticamente se resu-
me na maneira de ordenar os dados estatísticos em linha ou co-
lunas, tornando possível sua leitura, tanto no sentido horizontal
quanto vertical. Isto quer dizer que, dada uma grande quantidade
de dados, geralmente não organizados, costumamos distribuí-los
em classes ou categorias, denominando o número de indivíduos
pertencentes a cada uma delas. A este número damos o nome de
freqüência da classe.
• Tabela de Freqüência
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Tabela 2.5
48
Assim, conhecidos os valores de uma variável, é difícil formar-
mos uma idéia exata do comportamento do grupo como um todo
a partir dos dados não ordenados.
Tabela 2.6
49
Chamando de freqüência de uma classe o número de valores
da variável pertencentes à classe, os dados acima podem ser dis-
postos na tabela abaixo, denominada distribuição de freqüência
com intervalos de classe.
154 A 158 9
158 A 162 11
162 A 166 8
166 A 170 5
170 A 174 3
Total 40
Tabela 2.7
Fonte: Dados Hipotéticos
• Classe
i = 1 + 3,3 × log n
onde:
50
i = número de classes;
n = número total de dados.
• Limites de classe
• Amplitude amostral
AT = xmax − xmin .
51
A amplitude total da distribuição jamais coin-
cide com a amplitude amostral.
h2 4
x2 = l2 + ⇒ x2 = 154 + = 156 ⇒ x2 = 156 cm, ou ainda
2 2
154 + 158
x2 = = 156 .
2
52
Logo, a freqüência relativa da terceira classe no nosso exemplo é:
f3 11
fr3 = ⇒ fr3 = = 0, 275 ⇒ fr3 = 0, 275 .
∑f i 40
• Freqüência acumulada ( Fk )
F3 = f1 + f 2 + f3 ⇒ F3 = 4 + 9 + 11 = 24 ,
24
Fr3 = = 0,600 .
40
∑f = 40
Tabela 2.8
53
O conhecimento dos vários tipos de freqüência nos ajuda a respon-
der muitas questões com relativa facilidade, como as seguintes:
Quadro 2.2
Determinar:
3) o número de classes;
4) amplitude de classe;
54
limite inferior da primeira classe igual a 3);
6) a tabela de freqüência.
Resposta:
Quadro 2.3
AT 29, 6
4) Amplitude da classe (h) h = = = 4,93 ≈ 5 .
i 6
5) e 6)
Tabela 2.9
55
Exemplo 2.7. Suponhamos que uma empresa deseje analisar a
distribuição dos salários pagos por hora a seus funcionários. O
estatístico da empresa dispõe dos seguintes dados:
Classe Freqüências
8,3 A 9,8 6
9,8 A 11,3 6
11,3 A 12,8 9
12,8 A 14,3 7
14,3 A 15,8 2
Total 30
Tabela 2.10
56
Pode-se observar que quando os dados não estavam agrupados
no quadro 2.4, não se tinha nenhuma informação sobre a dis-
tribuição de salários. Agora, observada a tabela 2.10, já pode-
mos estabelecer algumas considerações valiosas. Podemos, por
exemplo, concluir que a classe de salários predominante na em-
presa é a terceira: 11,3 12,8.
7
6
5
4
3
2
1
0
150 154 158 162 166 170 174
Estatura dos alunos Escola Estadual Esperança (em cm)
Gráfico 2.7
57
Exemplo 2.9. Histograma de freqüência de uma amostra de 36
funcionários da Escola Estadual Primavera, conforme quadro 2.1,
segundo o grau de instrução.
Histograma de freqüência
20
50,0%
18
Freqüência Observada 16
14
50,0%
12
10
8
16,7%
6
4
2
0
1° grau 2° grau superior
Escolaridade dos Funcionários
Gráfico 2.8
• Polígono de freqüências
Gráfico 2.9
58
Classe Freqüência Ponto Médio
Tabela 2.11
9
8
7
6
Freqüências
5
4
3
2
1
0
8,3 9,8 11,3 12,8 14,3 15,8 Classe
Gráfico 2.10
Classe
8,3 9,8 11,3 12,8 14,3 15,8
Gráfico 2. 11
59
Exemplo 2.12.
00 A 05 42 2,5
05 A 10 65 7,5
10 A 15 23 12,5
15 A 20 28 17,5
20 A 25 10 22,5
25 A 30 24 27,5
30 A 35 08 32,5
Total 200 -
Tabela 2.12
70
60
50
Freqüências
40
30
20
10
0 5 10 15 20 25 30 35 Classe
Gráfico 2.12
70
60
50
Freqüências
40
30
20
10
Classe
0 5 10 15 20 25 30 35
Gráfico 2.13
60
Exercícios Propostos
1) Dadas as distribuições de freqüência a seguir, determinar
para cada uma:
a) O histograma de freqüência.
b) O polígono de freqüência.
40 A 44 2
44 A 48 5
48 A 52 9
52 A 56 6
56 A 60 4
∑ = 26
Tabela 2.13
Resposta.
f
10
8
6
4
2
0 40 44 48 52 56 60 Kg
Gráfico 2.14
61
b)
Resposta.
f
11
9
7
5
3
1
0 150 162 174 186 cm
Gráfico 2.15
c)
500 A 700 8
700 A 900 20
900 A 1100 7
1100 A 1300 5
1300 A 1500 2
1500 A 1700 1
1700 A 1900 1
∑ = 44
Tabela 2.15
62
Resposta.
f
20
16
12
8
Gráfico 2. 16
Idade Freqüência
10 3
11 11
12 8
13 3
Quadro 2.5
68 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
Quadro 2.6
63
Determinar:
b) As freqüências acumuladas.
c) As freqüências relativas.
4 (12%)
3 (16%)
0 (10%)
5 (10%)
2 (32%)
1 (20%)
Gráfico 2.17
64
Com os dados disponíveis, pode-se concluir que a média desses
salários é, aproximadamente:
a) R$ 420,00
b) R$ 536,00
c) R$ 562,00
d) R$ 640,00
e) R$ 708,00
Resposta: e).
Resumo
Você viu neste capítulo como identificar os elementos de uma dis-
tribuição de freqüência e os tipos de freqüência.
Bibliografia Comentada
65
3 Medidas de Tendência Central
3 Medidas de Tendência Central
3.1 Introdução
Pelo apresentado nos capítulos anteriores, vemos que à Estatística
cabe a análise de fenômenos mensuráveis. Temos, assim, dian-
te de nós, informações numéricas, obtidas nas fases iniciais do
trabalho estatístico (planejamento, coleta, crítica, apuração e ex-
posição), que deverão ser analisadas agora na fase do trabalho
estatístico que chamamos de interpretação.
69
principais medidas de tendência central são as seguintes:
a) Médias
ii) geométrica;
iii) harmônica;
iv) quadrática.
b) Mediana.
c) Moda.
x + x + ... + xn ∑x i
,
x= 1 2 = i =1
n n
ou simplesmente
∑x
x=
n .
Exemplo 3.1.
∑x i
2 + 5 + 7 + 6 20
x= i =1
= = =5.
4 4 4
70
Exemplo 3.2. Sabendo-se que um funcionário da Escola Estadual
“Esperança” trabalha, durante uma semana, em horas, 10, 14, 13, 15,
16, 18 e 12 horas, temos que a média de trabalho da semana foi de
10 + 14 + 13 + 15 + 16 + 18 + 12
x= = 14 horas .
7
∑ fi xi ∑f i xi
= i =1
n
= i =1 ,
∑f
n
i
i =1
n
onde n = ∑ fi , é a freqüência total.
i =1
71
65 8
75 16
80 3
100 2
Total 50
Quadro 3.1
3 × 20 + 6 × 35 + 2 × 40 + 10 × 60 + 8 × 65 + 16 × 75 + 3 × 80 + 2 × 100
x=
50
60 + 210 + 80 + 600 + 520 + 1200 + 240 + 200
=
50
3150
= = 60,3
50
xi fi
2 8
3 2
5 4
8 6
6 5
9 3
Total 28
Quadro 3.2
8 × 2 + 2 × 3 + 4 × 5 + 6 × 8 + 5 × 6 + 3× 9
x=
28
16 + 6 + 20 + 48 + 30 + 27
=
28
147 .
=
28
72
sica recebendo mensalmente R$ 4.500,00 cada um; um diretor de
recursos humanos com salário mensal de R$ 7.000,00; e três ou-
tros profissionais recebendo mensalmente R$ 5.500,00 cada um.
Tabela 3.1
73
Aplicando a fórmula da média dada acima, temos
600 × 8 + 800 × 20 + 1000 × 7 + 1200 × 5 + 1400 × 2 + 1600 × 1 + 1800 × 1
x=
44
= 909,09 .
Tabela 3.2
74
n
∑f i pmi
x= i =1
n ,
∑
i =1
fi
Tabela 3.3
7
∑ f .p i mi
x= i =1
7
∑f
i =1
i
2515
= = 12,575 .
200
• Processo das freqüências relativas
Por definição, n
⎛ ⎞
∑f ⋅p i mi n ⎜ f ⎟ n
x= i =1
= ∑ ⎜ n i ⎟ pmi = ∑ fri ⋅ pmi ,
i =1 ⎜ ⎟
n
∑f ⎜ ∑ fi ⎟
i =1
i
i =1 ⎝ i =1 ⎠
fi
onde fri = n
, i = 1, 2,..., n são freqüências relativas.
∑f i =1
i
75
Exemplo 3.9. Calcule a média aritmética da seguinte tabela de
freqüência, usando processo de freqüências relativas.
Tabela 3.4
∑ f .p i mi
x= i =1
n
∑f
i =1
i
∑ f (d )
n
i i + pm
= i =1
n
∑f
i =1
i
n n
∑ f i d i + ∑ f i . pm
= i =1
n
i =1
∑f
i =1
i
76
n n
∑ fi di ∑f i . pm
= i =1
n
+ i =1
n
∑i =1
fi ∑f i =1
i
n n
∑f d i i ∑f i
= i =1
n
+ pm i =1
n , pois pm é constante.
∑f
i =1
i ∑f i =1
i
Isto é, n
∑f d i i
x = pm + i =1
n
.
∑f i =1
i
Exemplo 3.10.
∑f d i i
x = pm + i =1
n
∑f i =1
i
77
⎛ −985 ⎞
= 17,5 + ⎜ ⎟
⎝ 200 ⎠
= 17,5 + (−4,925) = 17,5 − 4,925
= 12,575 .
G = x1 × x2 × ... × xn =
n n
∏x
i =1
i
.
Exemplo 3.11.
G = 3 18 × 36 × 72 = 3 46.656 = 36 .
G = 3 1 × 9 × 81 = 3 729 = 9 .
78
Portanto,
⎛1 n
⎞
G = ant. log ⎜
⎝n
∑ log x ⎟⎠ ,
i =1
i
Exemplo 3.12.
1 1⎡ 1 1 1 ⎤ 1 ⎡ 4 + 2 + 1⎤ 7
= ⎢ + + ⎥= ⎢ ⎥ = .
H 3 ⎣18 36 72 ⎦ 3 ⎣ 72 ⎦ 216
Portanto,
216
H= = 30,86 .
7
79
iii) A média harmônica entre 1 e 4 será:
1 1 ⎡ 1 1 ⎤ 1 ⎡1 + 4 ⎤ 1 5 5 .
= + = = =
H 2 ⎢⎣ 4 1 ⎥⎦ 2 ⎢⎣ 4 ⎥⎦ 2 4 8
Portanto,
8
H= = 1,6 .
5
3.3.3 Média Quadrática
A média quadrática Q de uma série de n valores, x1 , x2 ,..., xn , é,
por definição, a raiz quadrada da média aritmética dos quadra-
dos desses valores, ou seja:
n
x12 + x2 2 + ... + xn 2 ∑x i
2
Q= = i =1
,
n n
ou simplesmente
∑ x2
Q= .
n
Exemplo 3.13.
12 + 42 1 + 16 17
Q= = = = 8,5 = 2,9 .
2 2 2
ii) A média quadrática dos números 3, 5 e 6 será:
32 + 52 + 62 9 + 25 + 36 70
Q= = = = 23,33 = 4,8 .
3 3 3
iii) A média quadrática dos números 1, 2 e 3 será:
12 + 22 + 32 1+ 4 + 9 14
Q= = = = 4,66 = 2,16 .
3 3 3
xmín ≤ G ≤ H ≤ x ≤ Q ≤ xmáx ,
80
xmín = mín {x1 , x2 ,..., xn } e xmáx = máx {x1 , x2 ,..., xn }.
n +1
P= .
2
81
Exemplo 3.14. Cálculo da mediana da série 9, 15, 3, 7, 6, 16, 4, 19 e 1.
Portanto,
Me = 7 .
10 + 12 22
Me = = = 11 .
2 2
82
Resolução: A disposição ordenada torna-se:
42 34 32 27 39 29 45 30
27 29 30 32 34 39 42 45
32 + 34
Mediana = = 33 .
2
Exemplo 3.18. Suponha que o seguinte conjunto de dados repre-
sente os salários (em reais) de uma amostra de sete funcionários
da Escola Estadual “Nova Esperança”:
83
Exemplo 3.19. Cálculo da mediana dos seguintes dados:
x f fa
2 2 2
4 5 7
5 8 15
7 6 21
8 4 25
Total 25 -
Quadro 3.3
Neste caso,
25 + 1
P= = 13 .
2
x f fa
3 5 5
5 4 9
6 6 15
7 8 23
9 3 26
Total 26 -
Quadro 3.4
26 26
P' = = 13 e P '' = + 1 = 14 .
2 2
A mediana será o valor médio dos valores das 13ª e 14ª posições.
Isto é,
6+6
Me = =6.
2
84
• Valores agrupados em classe
Tabela 3.6
n 40
Resolução. Temos = = 20 , a classe da Mediana é a terceira.
2 2
LiM= 158 ; n = 40; fa = 13 ; h = 4 ; f = 11.
85
Logo,
⎛ 40 ⎞
⎜ − 13 ⎟ × 4
Me = 158 + ⎝ 2 ⎠
11
(20 − 13) × 4
= 158 +
11
= 158 + 2,545 = 160,545
20 A 30 12 22
30 A 40 34 56
40 A 50 48 104
50 60 90 194
60 A 70 54 248
70 A 80 52 300
80 A 90 15 315
90 A 100 5 320
Total 320
Tabela 3.7
86
560
= 50 + = 50 + 6, 2 = 56, 2 .
90
A mediana igual à nota 56,2 revela que tal resultado coloca
tantos alunos com notas inferiores a 56,2 quanto com notas
superiores a 56,2.
Gráfico da mediana:
fa
320
315
300
248
194
160
104
56
22
10
3
0 10 20 30 40 50 60 70 80 90 100 Classe
Me = 56,2
Gráfico 3.1
87
Resolução. Neste caso, temos
n
= 100 , f a = 42 , Li = 5 , f = 65 e h = 5 .
2
= 5 + 4, 45 = 9, 45 .
Gráfico da mediana:
fa
200
192
168
158
130
107
100
42
0
5 10 15 20 25 30 35 Classe
Gráfico 3. 2
Observações. A mediana
iv)
88
3.5 Moda
A moda é o valor que ocorre com maior freqüência em um dado con-
junto de números. Isto é, moda ou norma (M o ) de uma série de n
valores, x1 , x2 ,..., xn , é o valor que se repete o maior número de vezes.
42 34 32 27 39 29 34 30 26
34 32 27 29 45
42 37 32 27 39 29 37 42 26
89
Série amodal
Gráfico 3.3
Série modal
Gráfico 3. 4
3, 4, 4, 8, 4, 5, 4, 3, 4, 9, 4, 3 e 6.
• Série bimodal
90
Gráfico 3. 5
o o o
Gráfico 3. 6
Exemplo 3.30.
x f
3 5
5 8
7 4
8 8
10 7
12 8
15 3
20 1
Total 44
Quadro 3. 5
91
3.5.2 Cálculo da Moda para Dados Agrupados em Classes
Notas em prova
(classe)
Alunos (f )
0A2 9
2A4 19
4A6 26
6A8 32
8 A 10 14
Total 100
Tabela 3. 9
92
Exemplo 3.32. Calcular a moda dos quarenta alunos da Escola
Estadual “Esperança”.
i Estaturas(cm) Freqüências
1 150 A 154 4
2 154 A 158 9
3 158 A 162 11
4 162 A 166 8
5 166 A 170 5
6 170 A 174 3
Total 40
Tabela 3. 10
I = 158; h = 4; Δ1 = 11 – 9 = 2; Δ 2 = 11 – 8 = 3.
L
2
M 0 = 158 + ×4
2+3
2
= 158 + × 4 = 158 + 1,6 = 159,60
5
Exercícios Propostos
1) Calcular a média aritmética da seguinte distribuição de fre-
qüência:
Classe Freqüência
0A4 2
4A8 6
93
8 A 12 8
12 A 16 3
16 A 20 1
Tabela 3.11
50 A 100 3
100 A 150 4
150 A 200 10
200 A 250 2
250 A 300 1
Tabela 3. 12
Nessas condições:
Respostas:
a)
50 A 100 3 3
100 A 150 4 7
94
150 A 200 10 17
200 A 250 2 19
250 A 300 1 20
Tabela 3. 13
b) 160;
c) 165.
145 A 151 10
151 A 157 9
157 A 163 8
163 A 169 6
169 A 175 3
175 A 187 3
181 1
∑ = 40
Tabela 3. 14
determinar:
a) a média;
b) moda;
c) mediana.
95
Resposta. 82,08.
Número de
Salários(em R$)
funcionários
800 A 900 4
900 A 1.000 10
1.000 A 1.100 18
1.100 A 1.200 5
1.200 A 1.300 3
Tabela 3. 15
Nessas condições:
xi Freqüência - Fi
2 5
3 10
4 15
96
5 12
6 5
7 3
Quadro 3. 6
Respostas. a) 72,2; b) 3.
Tabela 3. 16
97
O salário médio desses empregados nesse mês foi de:
a) R$ 2.637,00
b) R$ 2.420,00
c) R$ 2.520,00
d) R$ 2.400,00
e) R$ 2.500,00
Resposta. d)
Resumo
Neste capítulo explicamos várias medidas de tendência central,
que também são conhecidas com medidas de posição. As princi-
pais medidas são: média, mediana e moda. Também explicamos
outras médias, tais como: médias harmônicas, geométricas e qua-
dráticas.
98
4 Medidas de Dispersão e Utilização
das Planilhas
4 Medidas de Dispersão e
Utilização das Planilhas
4.1 Introdução
• Grupo A : 7, 7, 7, 7 e 7
• Grupo B : 5, 6, 7, 8 e 9
• Grupo C : 4, 5, 7, 9 e 10
• Grupo D : 0, 5, 10, 10 e 10
101
Dia 2ª 3ª 4ª 5ª 6ª
Turno Feira Feira Feira Feira Feira Total Média
I 150 150 150 150 150 750 150
II 70 130 150 180 220 750 150
III 15 67 117 251 300 750 150
Tabela 4.1
i) desvio médio;
iii) variância;
102
Antes de apresentar as medidas de dispersão, apresentaremos, a
seguir, o conceito de amplitude.
4.2 Amplitude
Amplitude ou intervalo total (I t ) de uma série de n termos,
x1 , x2 , ..., xn , é definida como a diferença entre os valores extre-
mos da série, ou seja:
I t = xmáx − xmín ,
onde:
I t = amplitude ou intervalo total;
xmáx = valor máximo da série, isto é, máx {x1 , x2 , ..., xn };
xmín = valor mínimo da série, isto é, mín {x1 , x2 , ..., xn }.
42 34 32 27 39 29 45 30
27 29 30 32 34 39 42 45
103
Um deles segue o mesmo raciocínio anterior, sendo que a am-
plitude é obtida pela diferença entre o limite superior da última
classe e o limite inferior da primeira classe, assim,
I t = xmáx − xmín .
4A6 8 5
6A8 3 7
8 A 10 1 9
Total 20 -
Tabela 4.2
Resolução.
• Primeiro processo:
I t = 10 − 0 = 10
• Segundo processo:
It = 9 − 1 = 8
104
4.3 Desvio Médio
d1 = x1 − x = 10 − 14 = −4;
d 2 = x2 − x = 14 − 14 = 0;
d3 = x3 − x = 13 − 14 = −1;
d 4 = x4 − x = 15 − 14 = 1;
d5 = x5 − x = 16 − 14 = 2;
d 6 = x6 − x = 18 − 14 = 4;
d 7 = x7 − x = 12 − 14 = −2.
∑d
i =1
i = 0.
105
4.3.1 Desvio Médio Absoluto – Dados Isolados
∑ di ∑ x −x i
,
dm = i =1
= i =1
n n
ou simplesmente
∑d
dm = ,
n
onde,
d m = desvio médio;
d = desvio, afastamento, resíduo ou discrepância dos termos da
série, calculados em relação à média aritmética (d = x − x )
sem considerar sinal, ou seja, desvio absoluto;
n = número de termos da série.
∑ xi 2 + 5 + 8 + 15 + 20
x= = = 10 .
n 5
∑ xi − x
dm =
n
2 − 10 + 5 − 10 + 8 − 10 + 15 − 10 + 20 − 10
=
5
8 + 5 + 2 + 5 + 10 30
= = = 6.
5 5
106
Exemplo 4.5. Com os dados do exemplo apresentado em 4.3, tem-
se o Desvio Médio Absoluto (DMA)
∑ x −x i
−4 + 0 + −1 + 1 + 2 + 4 + −2 14
DMA = i =1
= = = 2.
7 7 7
∑d×f
dm = ,
∑f
onde
d = x − M e ou pm − M e ,
M e = mediana;
e demais variáveis como acima.
a) usando a média:
x f x. f d = x−x d. f
5 4 20 3,2 12,8
6 5 30 2,2 11,0
107
8 12 96 0,2 2,4
10 4 40 1,8 7,2
12 5 60 3,8 19,0
TOTAL 30 246 - 52,4
Tabela 4.3
Resolução:
∑ f i xi 246
x= = = 8, 2 .
∑ fi 30
e
∑ di . fi 52, 4
dm = = = 1,75 .
∑ fi 30
b) usando a mediana:
x f f .x d = x − Me f .d
5 4 20 3 12
6 5 30 2 10
8 12 96 0 0
10 4 40 2 8
12 5 60 4 20
Total 30 246 - 50
Tabela 4.4
Resolução:
n 30 30
P' = = = 15ª e P '' = + 1 = 16ª ,
2 2 2
8+8
Me = =8,
2
e
∑ di . fi 50
dm = = = 1,67 .
∑ fi 30
108
Exemplo 4.7. Considerando o tempo de serviço (em anos) dos 200
servidores públicos da Escola Estadual “Sena Figueiredo”, da ci-
dade XX, do Estado de Santa Catarina até janeiro de 2006, calcu-
lar o desvio médio dos dados a seguir:
a) usando a média:
Tempo de
f Pm d = pm − x d. f
serviço (anos)
Tabela 4.5
Resolução.
∑ f i xi
x= = 12,575 .
∑ fi
e
∑ di . fi 1.509,5
dm = = = 7,547 .
∑ fi 200
109
b) usando a mediana: d = pm − M e
Tempo de
f Pm d = pm − M e d. f
serviço (anos)
Tabela 4.6
Resolução.
M e = 9, 45
∑ di . fi 1.462,3
dm = = = 7,311 .
∑ fi 200
Observação 4.2.
110
4.4 Desvio Padrão
O termo desvio padrão
foi introduzido na
estatística por Karl É definido como a raiz quadrada da média aritmética dos quadra-
Pearson. Ele foi o fundador
dos dos desvios em relação à média. É a mais importante medi-
do Departamento de
Estatística Aplicada da de variabilidade, ou seja, o desvio padrão de uma série de n
(Department of Applied termos, x1 , x2 , ..., xn , é a média quadrática dos desvios calculados
Statistics) na University
College London em 1911.
em relação à média aritmética da série, e é dada por
∑(x i − x )2
s= i
,
n
ou
2
⎛ ⎞
⎜ ∑ xi ⎟
∑i xi 2 − ⎝ i n ⎠
s= ,
n
ou
N
∑d i
2
s= i =1
,
n
ou, simplesmente,
∑d2
s= ,
n
onde
s = desvio padrão;
d = desvio em relação à média (d = x − x );
n = número de termos da série.
∑d2 ⎛ ∑d ⎞
2
s= −⎜ ⎟ .
n ⎝ n ⎠
Onde
d = x − x0 (desvio em relação a um valor arbitrário).
111
Para facilitar ainda mais os cálculos, podemos usar x0 = 0 , o que re-
sulta em d = x − 0 = x . Então, a fórmula anterior transforma-se em:
∑ x2 ⎛ ∑ x ⎞
2
s= −⎜ ⎟ .
n ⎝ n ⎠
Exemplo 4.8. Cálculo do desvio padrão dos seguintes valores: 2,
5, 5, 6 e 7.
Resolução.
4 + 25 + 25 + 36 + 49 ⎛ 2 + 5 + 5 + 6 + 7 ⎞
2
s= −⎜ ⎟
5 ⎝ 5 ⎠
⎛ 139 ⎞
= ⎜ − 25 ⎟ = 27,8 − 25 = 2,8 = 1,67 .
⎝ 5 ⎠
Resolução.
42 + 62 + 7 2 + 92 + 92 ⎛ 4 + 6 + 7 + 9 + 9 ⎞
2
s= −⎜ ⎟
5 ⎝ 5 ⎠
⎛ 263 ⎞
= ⎜ − 49 ⎟ = 52,6 − 49 = 3,6 = 1,89 .
⎝ 5 ⎠
4.5 Variância
A variância de uma amostra de valores (dados não agrupados),
x1 , x2 ,..., xn , é definida como sendo a média dos quadrados dos A variância de uma
variável aleatória é uma
desvios das medidas em relação à sua média x , evitando, com medida da sua dispersão
n
estatística, indicando
isso, que ∑d
i =1
i = 0 . A variância da amostra é dada por quão longe em geral os
N seus valores se encontram
∑ (x i − x )2 do valor esperado. Fonte:
s2 = i =1
, http://pt.wikipedia.org/
n wiki/Variancia
ou pela fórmula alternativa
2
⎛ ⎞
⎜ ∑ xi ⎟
∑ xi 2 − ⎝ i ⎠ .
n
s2 = i
n
112
Variância de uma série é o quadrado do desvio padrão desta sé-
rie. É representado por s 2 e suas fórmulas de cálculo são as mes-
mas vistas anteriormente para o desvio padrão:
∑d2
s2 = .
n
Alternativamente, se os dados estão apresentados em uma tabela
de distribuição de freqüências, para obter a variância, aplica-se a
seguinte fórmula:
(∑ xi fi ) 2
∑ xi × fi − n
2
s2 = ,
n
onde
xi são os valores dados;
f i são as freqüências, e
n = ∑ fi número total de observações.
113
Exemplo 4.10. Sejam as distribuições de pesos e estaturas com as
seguintes características:
Resolução.
S1 7,5
i) CV1 = 100 × = 100 × = 12,99 , isto é, CV1 ≅ 13,0 %
x1 57, 7
S2 7,1
ii) CV2 = 100 × = 100 × = 41,17 , isto é, CV2 ≅ 41, 2 %
x2 170, 0
16 + 0 + 1 + 1 + 4 + 16 + 4 42
= = =6.
7 7
Vamos mostrar o cálculo da variância pela fórmula alternativa:
xi xi2
10 100
14 196
13 169
15 225
16 256
18 324
12 144
∑xi
i = 98 ∑x i
2
= 1414
i
Tabela 4.7
114
(98) 2
1414 −
s2 = 7 = 1414 − 1372 = 42 = 6 .
7 7 7
Agora, vamos ao cálculo do desvio padrão:
s = 6 = 2,4495 .
2, 4495
CV = × 100 % = 17,5% .
14
Cálculo da variância:
1
s2 = ⎡⎣(1 − 1,7) 2 + (0 − 1,7) 2 + (3 − 1,7) 2 + (4 − 1,7) 2 + (2 − 1,7) 2
10
+ (1 − 1,7) 2 + (0 − 1,7) 2 + (3 − 1,7) 2 + (1 − 1,7) 2 + (2 − 1,7) 2 ⎤⎦
115
Exemplo 4.13. Considere as informações, obtidas na secretaria,
relativas ao número de faltas ao trabalho, durante o mês de Maio/
X1, dos quarenta funcionários da Escola Estadual “ESPERANÇA”.
Calcular a variância e o desvio padrão.
Quadro 4.1
x f x × f x2 x2 × f
0 15 0 0 0
1 10 10 1 10
2 5 10 4 20
3 5 15 9 45
4 1 4 16 16
5 1 5 25 25
6 0 0 36 0
7 3 21 49 147
∑= 40 ∑ = 65 ∑ = 263
Tabela 4.8
• Cálculo da variância:
(65) 2
263 −
s2 = 40 = 263 − 105, 63 = 3,9344 .
40 40
116
• Cálculo do desvio padrão:
s = 3,9344 = 1,9835 .
Exercícios Propostos
1) Calcular a variância e o desvio padrão da seguinte distribui-
ção de freqüência:
Classe Freqüência
0A4 2
4A8 6
8 A 12 8
12 A 16 3
16 A 20 1
Tabela 4.9
50 A 100 3
100 A 150 4
150 A 200 10
200 A 250 2
250 A 300 1
Tabela 4.10
117
Nessas condições:
Resposta: Física.
Resposta: 5,41.
Resposta: 51,7.
118
Pontos No de alunos
35 A 45 1
45 A 55 3
55 A 65 8
65 A 75 3
75 A 85 3
85 A 95 2
Tabela 4.11
Nessas condições:
xi Freqüência – fi
2 5
3 10
4 15
5 12
6 5
7 3
Quadro 4.2
119
8) Determinada editora pesquisou o número de páginas das re-
vistas mais vendidas em uma cidade.
Revistas A B C D E F
Número de páginas 62 90 88 92 110 86
Quadro 4.3
Calcular:
b) O desvio médio.
c) A variância.
d) O desvio padrão.
120
conhecermos cada um deles.
Barra de menus
Barra de ferramentas
Barra de fórmulas
Endereço de
Célula ativa
Célula ativa Barra de rolagem
vertical e horizontal
Identificador
de linha
Identificador
Botões de rolamento
de coluna
de planilhas
Guia de planilhas
Figura 4.1
121
Uma das primeiras coisas que devemos aprender sobre uma pla-
nilha é como nos movimentarmos. Realmente é uma área de tra-
balho muito grande que o Excel nos oferece. Quando ingressa-
mos no Excel, ele nos fornece uma pasta de trabalho que tem 3
folhas (ou guias), cada uma das quais tem 256 colunas e 16.384
linhas. Em outras palavras, cada guia tem mais de 4 milhões de
células individuais. Como deslocarmos nesta grande área?
1) Com o teclado
2) Com o mouse
Figura 4.2
122
amente com todas as células previamente selecionadas, por
exemplo, para mudar o tipo de letra que elas apresentam, ou
para apagar seu conteúdo, etc.
Figura 4.3
123
É importante também saber identificar em que célula está escrito o
dado. Para isto, é suficiente que você selecione uma célula e verifique,
na barra de fórmulas, se o dado está sendo visualizado também ali.
• 1o Exponenciação ( ^ )
• 2o Multiplicação ( * ) e Divisão ( / )
• 3o Adição ( + ) e Subtração ( - )
2*3+10 = 16
2*(3+10) = 26.
=media(A1:A5),
124
O Excel possui mais de 700 funções predefinidas, separadas em
11 categorias. Você também poderá escrever uma função com o
assistente de função, o qual pode ser acessado clicando no botão
da barra de ferramentas padrão. Quando você ativa o Assistente de
Função, aparecerá a Caixa de Diálogo, mostrada na seguinte figura:
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Tabela 4.12
125
Resolução. Comece por digitar na célula A1 o título ESTATURAS
DE ALUNOS. Da célula A2 à célula J5, digite cada um dos valores
apresentados na tabela 4.12, conforme o exemplo abaixo.
Figura 4.5
126
= MÍNIMO(A2:J5), que fornece o resultado igual a 150.
• Introduza a função:
cujo resultado é 4.
127
Para determinar o número de alunos que têm estatura igual ou
superior a 154 cm e menor do que 158 cm:
• Introduza a função:
• Introduza a função:
cujo resultado é 3.
128
célula F16 e introduza a função = F15 + D16, cujo resultado é 13.
Para calcular a freqüência acumulada da terceira classe, deslo-
que o cursor para a célula F17 e introduza a função
Quadro 4.5
Resolução: Exercício
129
Resumo
Neste capítulo, explicamos as medidas de dispersão, de cálculo
de amplitude total, o desvio médio absoluto, a variância, o desvio
padrão, o coeficiente de variação, etc.
Bibliografias Comentadas
130
5 Cálculo de Probabilidade
5 Cálculo de Probabilidade
A palavra probabilidade
origina-se do Latim
probare (provar ou testar). O nosso objetivo neste capítulo é encontrar explicação no
Informalmente, provável é
fato de que a maioria dos fenômenos de que se trata a Esta-
uma das muitas palavras
utilizadas para eventos tística é de natureza aleatória ou probabilística. Conseqüen-
incertos ou conhecidos. Tal temente, o conhecimento dos aspectos mais fundamentais
como acontece com a teoria
da mecânica, que atribui
do cálculo de probabilidades é uma ferramenta essencial
definições precisas a para o estudo da Inferência Estatística ou Estatística Infe-
termos de uso diário, como rencial, que será abordada no próximo capítulo.
trabalho e força, também
a teoria das probabilidades
tenta quantificar a noção
de provável. Fonte: http://
pt.wikipedia.org/wiki/Pro 5.1 Introdução
babilidade#Probabilidade_
na_matem.C3.A1tica O cálculo das probabilidades pertence ao campo da Matemática
que trata situações sujeitas às leis do acaso.
133
Na teoria da probabilidade, definimos um modelo matemático
para tal fenômeno pela associação s de “probabilidades” (ou os
valores limites das freqüências relativas) aos “eventos” relaciona-
dos com um experimento. A validade do nosso modelo matemá-
tico, para um dado experimento, depende de as probabilidades
associadas estarem bem próximas da freqüência relativa.
Ω 1: {1,2,3,4,5,6}
Ω 2: {0,1,2,3,4}.
134
Ω 4: {t / t ≥ 0}.
• Evento (E)
• Axiomas de Probabilidade
135
Axioma 1: Para todo evento A , 0 ≤ P( A) ≤ 1 .
Axioma 2: P(Ω) = 1 .
2a condição: p1 + p2 + ... + pn = 1 .
136
e
P( A ∩ B)
P( B / A) = ⇒ P( A ∩ B) = P( B) × P( A / B) .
P( A)
137
P( A ∪ B ∪ C ) = P( A) + P( B ) + P(C )
− P( A ∩ B ) − P( A ∩ C )
− P( B ∩ C ) + P( A ∩ B ∩ C ) .
Exemplo 5.1.
138
X = 1 - corresponde ao evento (Ca,Co), (Co,Ca) com probabilidade
1/2;
Definição 5.8. Seja X uma variável aleatória discreta. A cada possível resulta-
do de xi associaremos um número p( xi ) = P( X = xi ), i = 1, 2,..., denominado
probabilidade de xi tal que p( xi ) ≥ 0 e ∑ p( xi ) = 1, ou p ( x) = P( X = x) .
i ≥1
139
A função p, assim definida, é denominada função de probabilidade da variável
aleatória X. A coleção de pares (xi , p ( xi ) ), i = 1, 2,... é denominada distribui-
ção de probabilidade de X.
1) Tabela:
x 0 1 2
P( X = x) 1/4 1/2 1/4
Tabela 5.1
2) Gráfico:
P(X= x)
1/2
1/4
x
0 1 2
Gráfico 5.1
⎛2⎞
⎜ x⎟
3) Fórmula: P( X = x ) = ⎝ ⎠ , para x = 0,1,2.
4
Exemplo 5.3. Seja o lançamento de um par de dados. O espaço amos-
tral é constituído de 36 pares ordenados de números entre 1 e 6, isto é,
Ω = {(1,1),(1,2),...,(6,6)}, e X associa a cada ponto (a,b) de Ω o maior des-
ses números, isto é, X(a,b) = máx (a,b). Então, X é uma variável aleatória
com o conjunto imagem {1,2,3,4,5,6}. Determinar p( xi ) = P( X = xi ),
i = 1, 2,...,6 , ou seja, a distribuição ou função de probabilidade de X.
140
Resolução: Calculando a distribuição p de X , vem:
Para x1 = 1 temos
1
p ( x1 ) = p (1) = P( X = 1) = P({(1,1)}) = .
36
Para x2 = 2 temos
3
p ( x2 ) = p (2) = P( X = 2) = P({(2,1), (2, 2), (1, 2)}) = .
36
Para x3 = 3 temos
p( x3 ) = p(3) = P( X = 3)
= P({(3,1),(3, 2),(3,3),(2,3),(1,3)})
5
= .
36
Para x4 = 4 temos
p( x4 ) = p(4) = P( X = 4)
= P({(4,1),(4, 2),(4,3),(4, 4),(3, 4),(2, 4),(1, 4)}) .
7
= .
36
Da mesma forma, temos
9
p ( x5 ) = p (5) = P( X = 5) =
36
e
11
p ( x6 ) = p (6) = P( X = 6) = .
36
Esta informação é colocada na forma de uma tabela, como segue:
xi 1 2 3 4 5 6
1 3 5 7 9 11
p ( xi )
36 36 36 36 36 36
Tabela 5.2
141
E ( X ) = μ X = μ = ∑ xi × p ( xi )
i ,
xi 1 2 3 4 5 6
1 3 5 7 9 11
p ( xi )
36 36 36 36 36 36
Tabela5.3
e,
E ( X ) = ∑ xi × p( xi )
i
1 3 5
= 1× + 2 × + 3×
36 36 36
7 9 11
+4 × + 5 × + 6 ×
36 36 36
161
= = 4, 47 .
36
Portanto, o valor esperado ou esperança matemática é 4,47.
142
Exemplo 5.6. O almoxarifado da Escola Estadual “Vida Nova” es-
tabeleceu um registro de requisição para certo tipo de material
escolar, conforme quadro abaixo. Determine o número esperado
de requisições por dia.
Número de requisições/dia 0 1 2 3 4 5 6 7 8 9
Probabilidade de ocorrência 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01
Quadro 5.1
N° de chamadas 0 1 2 3 4 5
Quadro 5.2
onde
X = variável aleatória discreta de interesse;
X i = i-ésimo resultado de X;
P( X i ) = probabilidade de ocorrência do i-ésimo resultado de X.
μ = média aritmética
143
Sendo assim, o desvio padrão ( σ ) de uma variável aleatória dis-
creta é dado por:
n
σ= ∑(X
i =1
i − μ) 2 × P( X i ) ,
ou seja,
σ = + Var ( X )
Face do resultado 1 2 3 4 5 6
Probabilidade 1/6 1/6 1/6 1/6 1/6 1/6
Tabela 5.4
Resolução:
μ X = μ = ∑ xi × p ( xi )
i
= 1 × 1/ 6 + 2 × 1/ 6 + 3 × 1/ 6
+ 4 × 1/ 6 + 5 × 1/ 6 + 6 × 1/ 6
= 21/ 6 = 3,5 .
σ = (1 − 3,5) × 1/ 6 + (2 − 3,5) 2 × 1/ 6 + (3 − 3,5) 2 × 1/ 6
2 2
+ (4 − 3,5) 2 × 1/ 6 + (5 − 3,5) 2 × 1/ 6 +
+ (6 − 3,5) 2 × 1 / 6 = 2,9166
e
σ = 2,9166 = 1, 71 .
144
mero de ocorrências por amostra ou o número de ocorrências por
unidade num intervalo de tempo ou de área.
⎧0 fracasso
X =⎨
⎩1 sucesso
com
P( X = 0) = 1 − p e P( X = 1) = p .
Jakob Bernoulli (1654, 1705) Diremos que a variável aleatória assim definida tem distribuição
de Bernoulli e sua função de probabilidade é dada por
P( X = x) = p x × q1− x .
• Cálculo da média
Temos que
X P( X i ) ( X i − μ) 2 ( X i − μ) 2 × P( X i )
0 1− p (0 − p ) 2 = p 2 (0 − p ) 2 × (1 − p )
1 p (1 − p ) 2 (1 − p ) 2 × p + (1 − p ) 2 × p
Quadro5.3
Logo,
μ = ∑ xi × P( xi ) = 0 × (1 − p ) + 1× p = p
i
145
• Cálculo da variância e desvio padrão
n
Var ( X ) = σ 2 = ∑ ( X i − μ) 2 × P( X i )
i =1
= (0 − p ) 2 × (1 − p ) + (1 − p ) 2 × p
= p 2 × (1 − p ) + (1 − p ) 2 × p
= p × (1 − p ) × [ p + (1 − p )]
= p × (1 − p ) = p × q , onde q= 1-p
Portanto,
2
μ = E( X ) = p = ,
5
2 3 6
Var ( X ) = p × q = × = ,
5 5 25
6
σ= = 0, 4899 ,
25
e
x 1− x
⎛ 2⎞ ⎛3⎞
P( X = x) = ⎜ ⎟ × ⎜ ⎟ .
⎝5⎠ ⎝5⎠
146
tribuição binomial possui quatro propriedades essenciais.
• Em jogos de azar
• Na educação
• Nas finanças
147
sentar elevação no seu preço de fechamento numa base diária
nas próximas 10 sessões (consecutivas) de negociação, se as
mudanças no preço de mercado de ações forem aleatórias?
⎛n⎞ n!
⎜ ⎟= .
⎝ k ⎠ ( n − k )! k !
148
independentes. Cada questão tem 5 alternativas. Apenas uma al-
ternativa é correta. Se um aluno resolve a avaliação a esmo (no
popular chute), qual a probabilidade de tirar nota 5?
P( X = 25) = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 0,000002
⎝ 25 ⎠ ⎝ 5 ⎠ ⎝ 5 ⎠
Exemplo 5.11. Num determinado processo de fabricação, 5% das
peças são consideradas defeituosas. As peças são colocadas em
caixas com 5 unidades cada uma.
⎛ 5⎞
a) P( X = 4) = ⎜ ⎟ (0,05) 4 (0,95)1
⎝4⎠
= 5 × (0,05) 4 × (0,95)1 = 0,00003 .
P( X ≥ 2) = 1 − [ P( X = 0) + P( X = 1)] ;
⎛ 5⎞
P( X = 0) = ⎜ ⎟ (0,05)0 (0,95)5 = 0,7738;
⎝ 0⎠
⎛ 5⎞
P( X = 1) = ⎜ ⎟ (0,05)1 (0,95) 4 = 0,2036.
⎝1⎠
149
Logo,
P( X ≥ 2) = 1 − [0,7738 + 0,2036] = 0,0226 .
Exemplo 5.14. Num rebanho bovino, 30% dos animais estão ata-
cados de febre aftosa. Retirando-se ao acaso uma amostra de 10
animais, qual a probabilidade de se encontrar 6 animais doentes?
150
Resolução: Seja X a variável aleatória associada ao número de
animais com febre aftosa, logo X : 0,1, 2,...,10 .
n = 10 ; p = 0,3; q = 0,7 e k = 6.
⎛ 10 ⎞
P( X = 6) = ⎜ ⎟ × (0,3)6 × (0,7) 4
⎝6⎠
= 210 × 0,00073 × 0, 2401 = 0,037 = 3,7% .
Portanto,
P( X ≥ 2) = 99,19%.
151
Consideremos uma variável aleatória que pode tomar todos os
valores de um dado intervalo. Pertencem a este tipo as mensura-
ções de altura, temperatura, precipitação pluviométrica, tempo de
espera numa fila, etc. Tais mensurações na prática são registradas
com aproximação de inteiro, décimo ou centésimo. Conforme o
caso, a natureza da variável aleatória é essencialmente contínua.
152
• μ (média): este parâmetro especifica a posição central da
distribuição de probabilidades.
f (x)
m
Gráfico 5.2
Escrevemos:
153
No cálculo da probabilidade de uma variável aleatória normal-
mente distribuída, surgem dois problemas:
X−μ
Z= ,
σ
onde
100 − 100
Z= =0.
10
154
Para X = 130, tem-se:
130 − 100
Z= = 3,
10
e assim por diante.
X−μ
Z= ,
σ
tem uma distribuição N(0,1), isto é, tem distribuição normal com média
1 − 12 z 2
f ( z) = e , com −∞ ≤ z ≤ +∞ .
2π
Logo, Z tem distribuição normal de média zero e va-
riância 1. O aspecto gráfico de uma distribuição nor-
mal reduzida ou padronizada é o da figura a seguir.
155
sas, isto é, aproxima-se indefinidamente do eixo das abscis-
sas sem, contudo, alcançá-lo.
0 z
(Média)
Figura 5.2
156
e da coluna 0,05. O valor 0,3944 é a porcentagem da área sob a
curva normal entre a média 0 e z = 1, 25 . Veja a figura abaixo:
1,2,5
00 01 02 03 04 05 06 ...
...
1,0
1,1
1,2 0,3944
...
Figura 5.3
Quadro 5.4
A tabela normal reduzida pode também ser usada para deter-
minar a área sob a curva além de um dado valor de z . O detalhe
aqui é que a área de uma das metades é 50%, logo a área além
de z é 50% menos o valor tabelado. Por exemplo, a área além
de z = +1 será 0,5 − 0,3413 = 0,1587 , pois a área entre a média e
z = +1 é 0,3413.
157
Área desejada = 50% - área tabelada
Área
na
tabela
0 z
50%
Figura 5.4
Quadro 5.5
a) P(100 ≤ X ≤ 106) ;
b) P(89 ≤ X ≤ 107) ;
c) P(112 ≤ X ≤ 116)
158
X − 100
Resolução. Como μ = 100 e σ = 5 logo Z = .
5
Assim, para responder a letra a), temos
P(100 ≤ X ≤ 106)
100 − 100 X − 100 106 − 100
= P( ≤ ≤ )
5 5 5
= P(0 ≤ Z ≤ 1, 2) = 0,384930 = 38, 4930% .
= P( −2, 2 ≤ Z ≤ 0) + P(0 ≤ Z ≤ 1, 4)
159
Observação. Considerar o peso da carga com distribuição normal.
Assim, 120
E ( X ) = μ = ∑ 65 = 120 × 65 = 7.800
i =1
e
Var ( X ) = σ 2
120 120
= ∑ VAR( X i ) = ∑16 = 120 × 16 = 1.920,
i =1 i =1
ou
σ = 1920 = 43,82 .
Logo,
N (7800,1920) ,
μ = 7800 ,
σ = 43,82
e
X − 7.800
Z= .
43,82
160
P( X > 7722)
X − 7800 7722 − 7800
= P( > )
43,82 43,82
= P( Z ≥ −1, 78) = P(−1, 78 ≤ Z ≤ 0) + 0,5
= 0,5 + 0, 462462 = 0,962462 = 96, 2462% .
2 − 2 X − 2 2, 05 − 2
P(2 < X < 2, 05) = P( < < )
0, 04 0, 04 0, 04
= P(0 < Z < 1, 25) = 0,3944 = 39,44%.
Resolução.
161
Temos
X − 850 750 − 850
P( X < 750) = P( < )
45 45
= P( Z < −2, 222)
162
P ara melhorar a aproximação, é necessário
um pequeno ajuste (correção de continui-
dade), que consiste em subtrair e/ou somar 0,5
aos valores da variável aleatória discreta.
7,5 − μ X − μ 10,5 − μ
= P( ≤ ≤ ),
σ σ σ
onde
μ = n × p = 10 × 0, 5 = 5
e
σ = 10 × 0,5 × 0,5 = 1,58113 .
Assim,
7,5 − 5 10,5 − 5
P( ≤Z≤ )
1,58113 1,58113
= P(1,5811 ≤ Z ≤ 3, 4785)
= 0, 49975 − 0, 44295 = 0,0568 = 5,68% .
Portanto, a P(8 ≤ Y ≤ 10) é de 5,68%.
163
a) Em que porcentagem de caixas teremos pelo menos 50% de
frangos grandes? (50% é igual a 30 frangos).
1 5
Aqui, n = 180 ; p = ; q= .
6 6
164
Assim,
1
μ = 180 × = 30 ⇒ μ = 30
6
e
1 5
σ = 180 × × = 25 = 5 ⇒ σ = 5 .
6 6
Na letra a), calculando P(29 ≤ Y ≤ 32) , temos
165
1 9
σ = 10000 × × = 900 = 30
10 10
⇒ σ = 30 .
Logo,
= P( Z ≤ 0) − P( −1,67 ≤ Z ≤ 0)
Exercícios Propostos
1) Lançam-se dois dados conjuntamente. Determinar a probabi-
lidade da soma ser igual ou maior do que 10.
1
Resposta: .
6
a) Três homens?
166
b) Se um cliente vai comprar duas geladeiras, qual a probabili-
1 1
Resposta: a) ; b) .
3 11
Resposta: R$ 1.000,00
Resposta: 17 dias.
b) terminar em 3,
c) ser primo;
167
7) Se P( A) = 12 ; P( B) = 13 e P( A ∩ B) = 14 , calcular:
− − − −
a) P( A ∪ B) ; b) P( A∪ B) e c) P( A∩ B) .
Partido AA Partido BB
Homens 21 39
Mulheres 14 26
Calcular:
a) a probabilidade de um escolhido ser homem;
a) entre 60 e 70 kg;
Resposta. 20/243.
168
P ara saber mais sobre distribuição normal e
a normal como aproximação da binominal,
consulte SOARES, J.F; FARIAS, A.A. E CESAR,
C.C. Introdução à Estatística, LTC, Rio de Janei-
ro, 1991.
Resumo
Neste capítulo, você teve a oportunidade de estudar e compreen-
der os conceitos de experimento, espaço amostral, evento, axiomas
da probabilidade, probabilidades finitas dos espaços amostrais
finitos, cálculo de probabilidade condicional e ainda percebeu a
independência estatística com eventos mutuamente exclusivos.
Apêndice
Área na Cauda Direita sob a Distribuição Normal Padronizada
169
Média z
Ilustrando: 43,57% da área sob uma curva normal estão entre a orde-
nada máxima e um ponto 1,52 desvios padrões adiante.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549
0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
170
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4986 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Tabela 5.5
171
6 Amostragem
6 Amostragem
6.1 Introdução
A seguir, apresentamos alguns conceitos básicos de amostragem.
Explicamos também sua utilização conforme a cada situação.
175
• Amostra – é uma parte (subconjunto) necessariamente fini-
ta da população, retirada segundo uma regra conveniente.
Quanto maior a amostra, mais precisos e mais cofiáveis são
os resultados.
• Censo – ao medir ou observar todos os elementos de uma
população realizamos um censo. Um censo é um processo
de obter informação
• Censo x Amostragem – há várias situações de aplicação sobre a totalidade dos
de censo ou amostragem. Abaixo, descrevemos algumas membros de uma dada
população (não tem de
situações de quando utilizamos censo e quando utiliza-
ser, necessariamente,
mos amostragem: uma população humana).
Os chineses e romanos
i) Censo – é utilizado quando: elaboraram os primeiros
censos conhecidos; a
a) a população é bastante pequena; finalidade deste trabalho
na época era militar e
b) o tamanho da amostra for grande em relação à popu- fiscal; em Roma, era o
lação; censor que mantinha o
moral público e levava
ao governo central as
c) for necessária a precisão completa;
informações sobre o estado
geral da população. Fonte:
d) já se dispõe da informação completa.
http://pt.wikipedia.org/
wiki/Censo
ii) Amostragem – é utilizada quando:
a) a população é infinita;
176
lística se todos os elementos da população tiverem probabili-
dade conhecida, e diferente de zero, de pertencer à amostra.
Isto implica num sorteio com regras bem determinadas, cuja
realização só será possível se a população for finita e total-
mente acessível.
Sem reposição: C Nn ;
Com reposição: N n .
830
• tamanho dos grupos = 55,3... , isto é 56;
15
177
• pela TNA, procuramos o 1o elemento entre 01 e 56;
178
2o estágio: sortear quarteirões dos municípios;
3o estágio: sortear residências dos quarteirões sorteados.
179
f) Unidade de amostra – definir a unidade amostra – indivi-
duo, casa, família etc.
180
Podemos observar que X é também uma variável aleatória. Qual-
quer outra característica da amostra também será uma função do
vetor aleatório ( X 1 , X 2 ,...,X n ) .
1 n
X= ∑ Xi
n i =1
→ média de amostra
1 n
(
∑ Xi − X )
2
s2 = → variância da amostra
n − 1 i =1
X mín = mín {X 1 , X 2 ,..., X n } → menor valor da amostra
Var ( X ) = σ 2 e E ( X ) = μ .
Quadro 6.1
181
Como já vimos antes amostra é uma parte (subconjunto)necessar
iamente finita da população, retirada segundo uma regra conve-
niente. Veja o gráfico a seguir:
Inferência Estatística
A A A
U U
X , S2,n,p^ m,s,N,p
Funções Distribuições
População Amostras das F. Amostrais
Amostrais
Gráfico 6.1
182
6.3.1 Distribuição Amostral da Média: Com e Sem Reposição
Se extrairmos um objeto de uma urna, poderemos repô-lo ou não
na urna antes da extração seguinte. No primeiro caso, determina
do objeto pode aparecer mais de uma vez, enquanto, no segundo
caso, o objeto só pode aparecer uma vez, No primeiro caso, temos
a amostragem com reposição, no segundo, amostragem sem reposição.
{(2, 2 ), (2, 4 ), (2,6 ), (4, 2 ), (4, 4 ), (4,6 ), (6, 2 ), (6, 4 ), (6,6 )}.
Conjunto das médias das amostras:
{2, 3, 4, 3, 4, 5, 4, 5, 6}.
183
Este conjunto é uma população.
4
σX = = 1,1547
3
Pelo exemplo observamos que
4 8 8 1 .
σX = = = ×
3 3× 2 3 2
σ
iii) σ X = , isto é, o desvio padrão das médias dessas amostras é
n
igual ao desvio padrão da população dividida pela raiz quadra-
da do tamanho da amostra.
X 1 + X 2 + ... + X n
X= .
n
Então, temos
μX = E X = μ( ) (1)
184
( ) (
σ 2 X = var X = E X − μ2 = ) σ2
n
. (2)
σ2 ⎛ N − n ⎞
σ2X = ⎜ ⎟, (3)
n ⎝ N −1 ⎠
ao passo que μ X é dado ainda por (1), ou seja, μ X = μ . Note que
(3) se reduz a (2) quando N → ∞ .
a) a média da população;
185
b) o desvio padrão da população;
Resolução:
a) A média da população é
1+ 3 + 6 + 7 + 8
μ= =5.
5
(1 − 5) + (3 − 5) + (6 − 5) + (7 − 5) + (8 − 5)
2 2 2 2 2
σ2 =
5
16 + 4 + 1 + 4 + 9 34
= = = 6,8 .
5 5
c) Média da distribuição amostral de médias:
1 2 3,5 4 4,5
2 3 4,5 5 5,5
186
3,5 4,5 6 6,5 7
4 5 6,5 7 7,5
σ2X =
25
85
= = 3, 4 .
25
Isto mostra que, para população finita envolvendo amostragem
σ2
com reposição ou populações infinitas, σ 2 X = , pois o mem-
n
6,8
bro direto é = 3, 4 , o que está de acordo com o valor obtido
2
acima.
5! 5.4
e) Há C5,2 = = = 10 amostras de tamanho dois, sem re-
2! 3! 1.2
posição, que podem ser extraídas da população. Isto significa
que podemos extrair um número e em seguida outro número
diferente do 1°, a saber,
187
Aqui a escolha (1,3) , por exemplo, é considerada idêntica à es-
colha (3,1) . As médias amostrais correspondentes são
σ2X =
1
10
{
(2 − 5) + (3,5 − 5) + (4 − 5) + (4,5 − 5) + (4,5 − 5) ,
2 2 2 2 2
σ2 ⎛ N − n ⎞
σ2X = ⎜ ⎟ (N = 5 e n = 2)
n ⎝ N −1 ⎠
⇒ σ X = 1,5968 ,
188
• Fator de Correção Finita (FCF)
N −n
n > 5% ⇒ FCF = ,
N −1
σx = μ .
e
σ N −n
σx = ⋅ .
n N −1
Observação 6.4. Quanto à normalidade da distribuição da população:
X −μ X −μ
z= ou z = ,
σx σ/ n
onde:
X – elemento da distribuição X;
μ – média da população;
σ – desvio padrão da população;
n – tamanho da amostra.
189
a) amostragem com reposição;
Resolução:
maiores que 70. Então, neste caso não obtemos uma distribuição
amostral verdadeira, mas uma distribuição amostral experimental.
Como o número de amostras é muito grande, deve haver aproxi-
mação satisfatória entre as duas distribuições amostrais. Logo,
a média e o desvio padrão esperados devem estar próximos dos
valores correspondentes de distribuição teórica. Então, temos
μ X = μ = 175 cm,
σ 9 9
σX = = = = 1,5 .
n 36 6
O que é quase igual a 1,5, portanto, para fins práticos, podemos con-
siderar como o mesmo valor obtido por amostragem com reposição.
Assim, podemos concluir que a distribuição experimental das
médias tem distribuição aproximadamente normal com média
175 cm e desvio padrão 1,5 cm.
X − μX X − 175
z= = ;
σX 1,5
=
(172 − 175) = −2,0 ;
1,5
190
179 em unidades padronizadas é
=
(179 − 175) = 2,67 .
1,5
Proporção da amostra com médias 172 e 179
-2 2,67
Figura 6.1
=
(173 − 175) = −1,34 .
1,5
Porções de amostras com média inferior a 173 cm
-1,34
Figura 6.2
191
Então o número esperado de amostras é
70 × (0,0910 ) = 6,307 ,
ou seja, aproximadamente 6.
σ N −n 5 600 − 50
σX = =
n N −1 50 600 − 1
= 0,707 × 0,958 = 0,68 .
68 em unidades padronizadas é
68 − 70
= = −2,98 ;
0,67
69 em unidades padronizadas é
69 − 70
= = −1, 49 .
0,67
Probabilidade desejada
192
-2,98 -1,49
Figura 6.3
Em unidades padronizadas, 75 é
=
(72 − 70 ) = 2,98 .
0,67
Probabilidade desejada
Resolução.
193
2) P(49 ≤ X ≤ 51) = ?
49 − 50 51 − 50
z1 = = −1,5 , z2 = = 1,5 .
4 / 36 4 / 36
Logo,
P(49 ≤ X ≤ 51) = P( −1,5 ≤ z ≤ 1,5)
= 0, 4332 + 0, 43320
= 0,8664 = 86,64% .
2) P( X > 3, 4) = ?
1 169 − 25 3, 4 − 3
σx = ⋅ = 0,185 , z1 = = 2,16 .
25 169 − 1 0,185
Logo,
P( X > 3, 4) = P( z > 2,16)
= 0,5 − 0, 4846 = 0,0154 = 1,54% .
194
Resolução. Temos seguintes dados:
2) P(770 ≤ X ≤ 830) = ?
pq
μp = p e σp = .
n
• Amostragem sem Reposição de População Finita
pq N −n
μ p = p e caso n > 5% σ p = × .
n N −1
195
• Fator de Correção de Continuidade (FCC) - Considerando
que a proporção é uma variável discreta e que a população
é distribuída binomialmente ( p e q ), o que não impede de
n > 30 ser aceita como aproximadamente normal. É neces-
1
sário, então, que se acrescente ou se subtraia , confor-
2× n
me a situação exigir. A transformação para o uso da Curva
Normal Padronizada será efetuada pela fórmula:
p′ − p ± FCC
z= ,
σ
onde
p′ é a proporção da amostra;
p é a proporção da população;
σ é o desvio padrão da população;
1
FCC = → Fator de Correção de Continuidade.
2× n
Exemplo 6.8. Determine a probabilidade de que em 80 jogadas de
uma moeda apareçam:
b) 3 ou mais caras.
5
Resolução: Consideremos 80 jogadas como uma amostra das
infinitas jogadas possíveis da moeda. Em tal população, a pro-
1
babilidade de “cara” é p = , e a probabilidade de coroa é
2
1
9 = 1− p = .
2
a)Queremos a probabilidade de o número de caras em 80 joga-
das estar entre 36 (45% de 80) e 44 (55% de 80). Temos
1
μ = número de caras = np = 80 × = 40 ,
2
1 1
σ = n p q = 80 × × = 20 = 4, 47 ,
2 2
1 1 1
FCC = = = = 0, 00625
2n 2 × 80 160
e
196
1 1
×
pq 2 2 = 0, 0559 .
σp = =
n 80
Em unidades padronizadas, 45% com FCC é
0, 45 − 0,00625 − 0,50
= = −1,00 ;
0,0559
e 55% em unidades padronizadas com FCC é
a probabilidade desejada é
Portanto,
Logo,
a probabilidade procurada é
= (área sob a curva normal à direita de z = 1,90 )
= (área à direita de z = 0 ) – (área entre z = 0 e z = 1,90)
= 0,5 – 0,4712 = 0,0288 = 2,88%.
Portanto,
P( p ≥ 0,6) = 2,88% .
197
um grande lote contém 10% de copos quebrados ou lascados,
qual a probabilidade de o varejista obter uma de 100 copos
com 17% ou mais defeituosos?
1) p = 0,10 , n = 100 ;
2) P( p > 0,17) = ? ;
μ p = p = 0,1 , q = 1 − p = 0,9 ,
1
FCC = = 0, 005 ,
2 × 100
0,1 × 0,9
σp = = 0,03
100
2) P( p > 0,17) = ?
198
μ p = p = 0,1 , q = 1 − p = 0,9 ,
1
FCC = = 0, 00222 ,
2 × 225
n 225
= > 5% → FCC ,
N 625
Exercícios Propostos
1)Um fabricante de baterias alega que seu artigo de primeira ca-
tegoria tem uma vida esperada (média) de 50 meses. Sabe-se que
o desvio padrão correspondente é de 4 meses.
199
cesso tem distribuição normal com desvio padrão de 1 mm. Se
o processo funciona conforme o esperado (i.e, média de 3mm de
desvio padrão de 1mm), qual seria a probabilidade de extrair uma
amostra de 25 de um lote de 169 cerejas e encontrar uma média
amostral superior a 3,4mm?
Resposta: 1,54.
a) A média da população.
Respostas: a) μ = 6 ; b) σ = 3, 29 ; c) μ = 6 ; d) σ = 2,32 .
Respostas: a) μ = 6 ; b) σ = 3, 29 ; c) μ = 6 ; d) σ = 2,01 .
a) com reposição.
b) sem reposição.
b) abaixo de 169,65cm?
200
Respostas: a) 54 ; b) 2.
Resumo
Neste capítulo, apresentamos o conceito de amostragem. Estuda-
mos a amostragem casual simples, e analisamos o conceito de dis-
tribuições amostrais das médias com e sem reposição. Também
explicamos distribuição amostral das proporções. Todos esses
assuntos foram abordados com exemplos numéricos e, ao final
propusemos uma lista de exercícios.
201
7 Estimação
7 Estimação
7.1 Introdução
Estimação é o processo que consiste em utilizar dados amostrais
para estimar os valores de parâmetros populacionais desconhe-
cidos. Essencialmente, qualquer característica de uma população
pode ser estimada a partir de uma amostra aleatória. Por exemplo:
Lojas – devem prever a procura dos diversos artigos, tais como:
avaliação de estoques, estimação de custos de projetos, avaliação
de novas fontes de energia, predições sobre realizações de empre-
endimentos, estimativas de tempo médio etc.
205
Veja quadro abaixo, que dá exemplos de estimativas pontuais e
intervalares:
Parâmetro
Pontual Intervalar
populacional
1. O brasileiro conso-
1. O consumo médio de carne
me em média 15kg de
no país está entre 12 e 18
carne/ano.
Média kg/ano.
2. Um Palio de 8 ci-
2. Um Palio de 8 cilindros faz
lindros faz 10 km/l de
entre 8 e 12 km/l de gasolina.
gasolina.
Quadro 7.1
206
um intervalo de confiança para o parâmetro θ para cada uma
dentre 100 amostras aleatórias da população, somente 5, em mé-
dia, destes intervalos de confiança não conterão θ . Por exemplo,
95% de confiança ⇒ risco de 5%.
Analogamente,
i.e., α = 2% ⇒ z = 2,33 .
Intervalo de confiança: X ± z σ X
Figura 7.1
207
amostrais, a forma se parecerá com uma curva normal.
X ∼ N ( μ, σ 2 / n)
Nível de
99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50%
Confiança
zc 3,00 2,58 2,33 2,05 2,00 1,96 1,643 1,28 1,00 0,6745
Quadro 7.2
σ
X ± zc , (1)
n
e no caso de amostragem sem reposição de uma população finita
de tamanho N , são dadas por
σ N −n
X ± zc . (2)
n N −1
208
Em geral, não se conhece o desvio padrão σ da população, de
modo que se passam a obter os limites de confiança acima. Va-
mos analisar a seguir dois casos:
Estimativa Intervalar de μ : x ± z σ x .
Quadro 7.3
209
Exemplo 7.1. Suponha que as alturas de 100 estudantes do sexo
masculino da UFSC constituam uma amostra aleatória das altu-
ras dos 2000 estudantes de sexo masculino. A amostra é dada (em
cm) na seguinte tabela.
(X − X ) ( )
2 2
Intervalo Média Freqüência f ⋅x f ⋅x⋅ X − X
Quadro 7.4
Determine:
b) a variância,
Resolução.
a) Média
∑ f x ∑ f x 16952
X= = = = 169,52 cm .
∑f n 100
b) Variância
( )
2
∑f x X −X 2248,96
s= = = 22, 49 = 4,7423 cm.
n 100
σ
c) Os limites de confiança na base de 95% são X ± 1,96 .
n
Usando X = 169,52 e s = 4,7423 como estimativa de σ , os li-
mites de confiança são
4,7423
169,52 ± 1,96 = 169,52 ± 0,92
100
⇒ 168,59 a 170, 44 .
210
Assim, o intervalo de confiança de 95% para média μ da popu-
lação de 168,59 a 170,44 cm é de 95% ou 0,95, ou seja,
σ
d)Os limites de confiança na base de 99% são X ± 2,58 .
n
Para o nosso caso,
σ 4, 7423
X ± 2,58 = 169,52 ± 2,58
n 100
= 169,52 ± 1, 22
⇒ 168,06 e 170,74 .
em lugar de .
N −n 2000 − 100
= = 0,9749 ,
N −1 2000 − 1
o que é bem próximo de 1. Logo, podemos omiti-lo. Se levarmos
em conta os limites de confiança, serão:
c) 169,52 ± 0,90
d) 169,52 ± 1,22
211
uma semana acusa média de 2,15 cm e desvio padrão de 0,17 cm.
Determine o intervalo de confiança de:
a) 95%
b) 99%
c) 98%
d) 90%
e) 99,73%
Resolução:
= 2,15 ± 0,028
212
-zc zc
Figura 7.2
= 2,15 ± 0,018
213
Exemplo 7.3. De um total de 250 notas em matemática, uma amos-
tra aleatória de 50 notas acusa média 7,0 e desvio padrão de 0,10.
Resolução:
σ N −n
X ± 1,96 σ X = X ± 1,96
n N −1
0,1 250 − 50
= 7,0 ± 1,96
50 250 − 1
0,1
= 7,0 ± 1,96 0,896
7,14
= 7,0 ± 1,96 ⋅ 0,0125
= 7,0 ± 0,025
214
7.4.2 Erro de Estimação e Tamanho da Amostra
O erro num intervalo de estimação diz respeito ao desvio (diferença)
entre a média amostral e a verdadeira média da população. Como o
intervalo de confiança tem centro na média amostral, o erro máxi-
mo provável é igual à metade da amplitude do intervalo.
σ σ
x ± z⋅ ⇒ e = z⋅ .
n n
Se quisermos saber qual é o tamanho da amostra, então calcula-
mos a seguir: 2
σ ⎛ σ ⎞ e
e = z⋅ ⇒ e = ⎜z⋅ ⎟ , onde = erro tolerável.
n ⎝ n⎠
Exemplo 7.4. Qual o tamanho da amostra necessária para se esti-
mar a média da população infinita cujo desvio padrão é igual a 4,
com 98% de confiança e precisão de 0,5?
Resolução.
σ
a) Os limites de confiança de 95% são X ± 1,96 , com o
n
σ
erro da estimativa sendo 1,96 . Tomando σ = S = 0, 06 se-
n
gundos, vemos que este erro será igual a 0,02 segundos se
(1,96 )(0,06 ) = 0,02, isto é,
n 1,96 × 0,06
n= = 5,88
0,02
⇒ n = 34,57 .
215
σ
b) Os limites de confiança de 99% são X ± 2,58 . Então,
n
(2,58)(0,06 ) = 0,02 , isto é,
n
2,58 × 0,06
n= = 7,74
0,02
⇒ n = 59,90 .
NORMAL
Figura 7.3
216
Para grandes amostras ( n > 30 ), é razoável usar valores z para
aproximar valores t, muito embora a distribuição t seja sempre
teoricamente correta quando não se conhece o desvio padrão da
população independentemente do tamanho da amostra.
(∑ x )
2
∑x 2
−
n .
s=
n −1
s - desvio padrão amostral
n − 1 - graus de liberdade.
95%
47,59% 47,59%
O z = 1,96
Figura 7.4
t
95%
2,5% 2,5%
Figura 7.5
217
Observações 7.2.
1) Se n > 30 ⇒ t ≈ z
Tabela 7.5
s
Estimação por intervalo de μ : x ± t × .
n
Agora veremos o que você compreendeu! Complete a tabela do
exemplo seguinte, com base no que foi apresentado.
P (19,487 ≤ μ ≤ 20,513)
90% 1,71 1,5
20 − 1,71 × 20 ± 0,513
25
= 0,90
95%
99%
Tabela 7.6
218
7.5.2 Amostragem de Pequenas Populações: Fator de
Correção Finita
Quando a população é finita e a amostra constitui mais de 5% da
população, devemos aplicar o fator de Correção Finita (FCF), dado
N −n
por . Veja na tabela como utilizar este FCF.
n −1
Desvio padrão Intervalo de Cofiança Erro
σx N −n σx N −n
σ x conhecido x ± z⋅ ⋅ z⋅ ⋅
n N −1 n N −1
s N −n s N −n
σ x desconhecido x ±t⋅ ⋅ t⋅ ⋅
n N −1 n N −1
Tabela 7.7
b) x = 20 , sx = 2,5 , n = 20 , N = 240 .
Resolução.
n 120
a) Como = = 10% , devemos utilizar o fator de correção
N 1200
finita. A fórmula para o intervalo de confiança é
n 20
b)Como = = 0,0833 = 8,33% , σ x é desconhecido e
N 240
n ≤ 30 , devemos utilizar a distribuição de t , e a fórmula para
o intervalo de confiança é
s N −n 2,5 240 − 20
x ±t⋅ ⋅ = 20 ± 2,131
n N −1 20 240 − 1
= 20 ± (2,131)(0,559)(0,959)
= 20 ± 1,142 .
219
• Fórmula Modificada para Determinação do Tamanho da
Amostra
z 2 σ 2x N
σ x conhecido: n= 2 2 .
z σ x + e 2 ( N − 1)
t 2s2 N
σ x desconhecido: n= .
t 2 s 2 + e 2 ( N − 1)
Observação 7.1. A não utilização destas fórmulas pode resultar
numa amostra que exceda o tamanho da população.
a) v = 9 ?
b) v = 20 ?
c) v = 30 ?
d) v = 60 ?
Figura 7.6
220
Exemplo 7.10. Uma amostra de 10 medidas do diâmetro de uma esfera
acusa média X = 11,0 cm e desvio padrão S = 0,15 cm. Determine os
limites de confiança (a) de 95% e (b) de 99% para o diâmetro efetivo.
Resolução:
a) Os limites de confiança de 95% são dados por
( )
X ± t0,975 S | n − 1 .
Exemplo 7.11.
Resolução.
a) Utilizando a teoria das grandes amostras, os limites de con-
fiança de 95% são
σ 0,15
X ± 1,96 = 11, 0 ± 1,96
n 10
= 11,0 ± 0,093 ,
221
onde tomamos o desvio padrão amostral de 0,15 como estimati-
va de σ . Analogamente, os limites de confiança de 99% são
0,15
11,0 ± 2,58 = 11,0 ± 0,122
10
⇒ 10,878 e 11,122 .
pq p (1 − p )
P ± zc = P ± zc ,
n n
no caso de amostragem de uma população infinita, ou amostra-
gem com reposição de uma população finita. Analogamente, os
limites de confiança são
pq N −n
P ± zc
n N −1
se a amostragem é sem reposição, de uma população finita de
tamanho N . Nota-se que tais resultados se obtêm de (1) e (2 )
substituindo X por P e σ por pq .
Em resumo, temos:
• Proporção ⇒ percentagem
222
x
• p= , onde
n
x – no de elementos da proporção;
n – tamanho da amostra.
• Estimação pontual de p : x ;
n
⎛ x ⎞ ⎡ ⎛ x ⎞⎤
⎜ ⎟ ⎢1 − ⎜ ⎟ ⎥
• Estimação intervalar de p : x ± z ⋅ ⎝ n ⎠ ⎣ ⎝ n ⎠ ⎦ ;
n n
n
• População Finita: > 5% ⇒ F.C.F.;
N
⎛ x ⎞ ⎡ ⎛ x ⎞⎤
⎜ n ⎟ ⎢1 − ⎜ n ⎟ ⎥
⎝ ⎠ ⎣ ⎝ ⎠⎦
• Erro de Estimação: e = z ⋅ ;
n
⎛ x ⎞ ⎡ ⎛ x ⎞⎤
⎜ n ⎟ ⎢1 − ⎜ n ⎟ ⎥
⎝ ⎠ ⎣ ⎝ ⎠⎦
• Tamanho da Amostra: n = z 2 ⋅ .
e2
x
Resolução. Dados: IC = 95% ⇒ z = 1,96 , e = 0,08 , p = = 0,5 .
n
Cálculos:
⎧ 0,5(1,0 − 0,5) ⎫
n = (1,96) 2 ⎨ 2 ⎬ = 150,0625 ⇒ n = 151 .
⎩ (0,08) ⎭
Exemplo 7.13. Uma amostra aleatória de 100 eleitores de certo dis-
trito eleitoral dá 55% como favoráveis a determinado candidato.
Determine os limites de confianças para a proporção global de
eleitores favoráveis ao candidato
a) na base de 95%;
b) na base de 99%;
c) na base de 99,73%.
223
Resolução:
p (1 − p )
P ± 1,96 σ p = P ± 1,96
n
= 0,55 ± 1,96
(0,55)(0, 45)
100
= 0,55 ± 0,10
⇒ 0, 45 a 0,65 ,
0,55 ± 2,58
(0,55)(0, 45) = 0,55 ± 0,15
100
⇒ 0, 40 a 0,70 .
a) de 95%
b) de 99,73%
Resolução:
24
a) Para 95%, zc = 1,96 . Levando os valores P = = 0,6 e
40
n = 40 na fórmula
P (− p )
p = P ± zc
n
= 0,6 ± 1,96
(0,6 )(0, 4 )
40
= 0,6 ± 0,15 ,
224
Exercícios Propostos
1)Considerando-se que uma amostra de 100 elementos extraída
de uma população aproximadamente normal, cujo desvio padrão
é igual a 2,0, forneceu uma média = 35,6 , construir um intervalo
de 95% de confiança para a média população.
225
a) = 0,10,
b) = 0,06.
Resposta: 69.
226
10)Determinar um intervalo de 95% de confiança para estas
duas situações:
Resposta:0,18; 0,32.
227
Resumo
Este capítulo está dedicado para assuntos relacionados com esti-
mação. Explicamos o que é intervalo de confiança e abordamos
esse assunto para média de uma população. Também explicamos
como calcular o erro da estimação e o tamanho da amostra. No
caso de desvio padrão populacional desconhecido, explicamos
como utilizar a destituição t de studant.
228
Referências
229
SPIEGEL, M.R. Probabilidade e Estatística. São Paulo: McGraw
Hill,1997
Sites na Internet
http://www.estatisticaaplicada.oi.com.br/aulas.html
http://www.dmat.ubi.pt/~jgama/Ficheiros/Apontamentos.pdf
http://www.vademecum.com.br/iatros/estdiscritiva.htm
http://alea-estp.ine.pt/ingles/html/glossar/html/glossar.html#h
(Glossário)
http://www.socio-estatistica.com.br/Edestatistica/glossario.htm
http://www.ibge.gov.br/
http://www.ibope.com.br
http://www.dme.im.ufrj.br/divulgacao.ppt#22