.Estat - Básica (Ehlers) 2006 Ufpr-1pag

INTRODUCAO A ESTATISTICA
RICARDO S. EHLERS
Prefacio
O objetivo principal deste texto e oferecer um material didatico basico em por-

tugues para um curso de Introducao a Estatstica a nvel de graduacao. Sao
Departamento de Estatstica
apresentados os mais importantes conceitos e metodos de analise estatstica de
Universidade Federal do Parana dados. O texto se originou de notas de aulas de disciplinas de introducao a Es-
tatstica ministradas para diferentes cursos na Universidade Federal do Parana.
O manuscrito foi preparado usando o LATEX e todas as ilustracoes e tabelas
estatsticas foram produzidas no pacote estatstico R (R Development Core Team
2006), gratuito e de codigo aberto, que pode ser obtido em
http://www.r-project.org/
Este texto certamente nao esta livre de erros, e comentarios e sugestoes dos
leitores sao bem vindos. Citar este texto como:
Ehlers, R.S. (2005) Introducao a Estatstica. Departamento de Estatstica,

UFPR. Disponvel em http://www.est.ufpr.br/ ehlers/notas/. Acesso em: 21
nov. 2005.
Ricardo S. Ehlers
Curitiba, novembro de 2005.
Primeira publicacao 2002

Segunda edicao publicada em 2005
Terceira edicao publicada em 2006
c RICARDO SANDES EHLERS 2002-2006

i
INTRODUCAO A ESTATISTICA
RICARDO S. EHLERS
Prefacio
O objetivo principal deste texto e oferecer um material didatico basico em por-

tugues para um curso de Introducao a Estatstica a nvel de graduacao. Sao
Departamento de Estatstica
apresentados os mais importantes conceitos e metodos de analise estatstica de
Universidade Federal do Parana dados. O texto se originou de notas de aulas de disciplinas de introducao a Es-
tatstica ministradas para diferentes cursos na Universidade Federal do Parana.
O manuscrito foi preparado usando o LATEX e todas as ilustracoes e tabelas
estatsticas foram produzidas no pacote estatstico R (R Development Core Team
2006), gratuito e de codigo aberto, que pode ser obtido em
http://www.r-project.org/
Este texto certamente nao esta livre de erros, e comentarios e sugestoes dos
leitores sao bem vindos. Citar este texto como:
Ehlers, R.S. (2005) Introducao a Estatstica. Departamento de Estatstica,

UFPR. Disponvel em http://www.est.ufpr.br/ ehlers/notas/. Acesso em: 21
nov. 2005.
Ricardo S. Ehlers
Curitiba, novembro de 2005.
Primeira publicacao 2002

Segunda edicao publicada em 2005
Terceira edicao publicada em 2006
c RICARDO SANDES EHLERS 2002-2006

i
SUMARIO iii
2.6.9 Variaveis Aleatorias Contnuas . . . . . . . . . . . . . . . . 43

2.6.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.7 Ajuste de Modelos Teoricos . . . . . . . . . . . . . . . . . . . . . 45
2.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Sumario 3 Estimacao
3.1 Inferencia Estatstica . . . . . . . . . . . . . . . . . . . . . . . . .
56
56
3.2 Princpios de estimacao . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Obtendo uma amostra . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . 59
1 Estatstica Descritiva 1
3.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
3.6 Intervalos de Confianca . . . . . . . . . . . . . . . . . . . . . . . . 63
1.2 Tipos de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.1 Intervalos de confianca para a media . . . . . . . . . . . . 63
1.3 Variaveis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.2 Intervalos de confianca para uma proporcao . . . . . . . . 66
1.4 Variaveis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 4
3.6.3 Comparacao de intervalos de confianca . . . . . . . . . . . 67
1.5 Resumos numericos . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.6.4 Intervalo de Confianca para Variancia . . . . . . . . . . . . 68
1.5.1 Media, variancia e desvio padrao . . . . . . . . . . . . . . 9
3.7 Comentario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.2 A mediana e a amplitude inter-quartis . . . . . . . . . . . 11
3.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.3 A moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Dados multiplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Testes de Hipoteses 72
1.6.1 Diagramas de dispersao . . . . . . . . . . . . . . . . . . . 15 4.1 Introducao e notacao . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.6.2 Dados Pareados . . . . . . . . . . . . . . . . . . . . . . . . 17 4.1.1 Decisoes e poder . . . . . . . . . . . . . . . . . . . . . . . 74
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.3 Probabilidade de significancia (P -valor) . . . . . . . . . . . . . . . 76
2 Probabilidades 24 4.4 Procedimento geral de teste . . . . . . . . . . . . . . . . . . . . . 77
2.1 Experimento aleatorio . . . . . . . . . . . . . . . . . . . . . . . . 24 4.5 Teste para a media . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.2 Definicao de probabilidade . . . . . . . . . . . . . . . . . . . . . . 25 4.6 Teste para a proporcao . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3 Probabilidade Condicional e Independencia . . . . . . . . . . . . . 26 4.7 Testes para a variancia da distribuicao normal . . . . . . . . . . . 79
2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.9 Dimensionamento de amostras . . . . . . . . . . . . . . . . . . . . 82
2.6 Algumas distribuicoes de probabilidade . . . . . . . . . . . . . . . 33 4.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.6.1 A distribuicao Uniforme Discreta . . . . . . . . . . . . . . 34 4.11 Testes de Aderencia (Testes 2 ) . . . . . . . . . . . . . . . . . . . 85
2.6.2 A distribuicao Binomial . . . . . . . . . . . . . . . . . . . 34 4.12 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.6.3 A distribuicao de Poisson . . . . . . . . . . . . . . . . . . 36 4.13 Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.6.4 Distribuicao Geometrica . . . . . . . . . . . . . . . . . . . 38
2.6.5 Variaveis Aleatorias Discretas . . . . . . . . . . . . . . . . 38 5 Comparando Grupos 89
2.6.6 A Distribuicao Uniforme Contnua . . . . . . . . . . . . . 40 5.1 Diferenca entre medias de dois grupos . . . . . . . . . . . . . . . . 89
2.6.7 A Distribuicao Normal . . . . . . . . . . . . . . . . . . . . 40 5.1.1 Desvios padrao iguais . . . . . . . . . . . . . . . . . . . . . 90
2.6.8 Distribuicao Exponencial . . . . . . . . . . . . . . . . . . . 43 5.1.2 Desvios padrao diferentes . . . . . . . . . . . . . . . . . . 91
ii
SUMARIO iii
2.6.9 Variaveis Aleatorias Contnuas . . . . . . . . . . . . . . . . 43

2.6.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.7 Ajuste de Modelos Teoricos . . . . . . . . . . . . . . . . . . . . . 45
2.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Sumario 3 Estimacao
3.1 Inferencia Estatstica . . . . . . . . . . . . . . . . . . . . . . . . .
56
56
3.2 Princpios de estimacao . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Obtendo uma amostra . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . 59
1 Estatstica Descritiva 1
3.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
3.6 Intervalos de Confianca . . . . . . . . . . . . . . . . . . . . . . . . 63
1.2 Tipos de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.1 Intervalos de confianca para a media . . . . . . . . . . . . 63
1.3 Variaveis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.2 Intervalos de confianca para uma proporcao . . . . . . . . 66
1.4 Variaveis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 4
3.6.3 Comparacao de intervalos de confianca . . . . . . . . . . . 67
1.5 Resumos numericos . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.6.4 Intervalo de Confianca para Variancia . . . . . . . . . . . . 68
1.5.1 Media, variancia e desvio padrao . . . . . . . . . . . . . . 9
3.7 Comentario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.2 A mediana e a amplitude inter-quartis . . . . . . . . . . . 11
3.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.3 A moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Dados multiplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Testes de Hipoteses 72
1.6.1 Diagramas de dispersao . . . . . . . . . . . . . . . . . . . 15 4.1 Introducao e notacao . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.6.2 Dados Pareados . . . . . . . . . . . . . . . . . . . . . . . . 17 4.1.1 Decisoes e poder . . . . . . . . . . . . . . . . . . . . . . . 74
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.3 Probabilidade de significancia (P -valor) . . . . . . . . . . . . . . . 76
2 Probabilidades 24 4.4 Procedimento geral de teste . . . . . . . . . . . . . . . . . . . . . 77
2.1 Experimento aleatorio . . . . . . . . . . . . . . . . . . . . . . . . 24 4.5 Teste para a media . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.2 Definicao de probabilidade . . . . . . . . . . . . . . . . . . . . . . 25 4.6 Teste para a proporcao . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3 Probabilidade Condicional e Independencia . . . . . . . . . . . . . 26 4.7 Testes para a variancia da distribuicao normal . . . . . . . . . . . 79
2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.9 Dimensionamento de amostras . . . . . . . . . . . . . . . . . . . . 82
2.6 Algumas distribuicoes de probabilidade . . . . . . . . . . . . . . . 33 4.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.6.1 A distribuicao Uniforme Discreta . . . . . . . . . . . . . . 34 4.11 Testes de Aderencia (Testes 2 ) . . . . . . . . . . . . . . . . . . . 85
2.6.2 A distribuicao Binomial . . . . . . . . . . . . . . . . . . . 34 4.12 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.6.3 A distribuicao de Poisson . . . . . . . . . . . . . . . . . . 36 4.13 Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.6.4 Distribuicao Geometrica . . . . . . . . . . . . . . . . . . . 38
2.6.5 Variaveis Aleatorias Discretas . . . . . . . . . . . . . . . . 38 5 Comparando Grupos 89
2.6.6 A Distribuicao Uniforme Contnua . . . . . . . . . . . . . 40 5.1 Diferenca entre medias de dois grupos . . . . . . . . . . . . . . . . 89
2.6.7 A Distribuicao Normal . . . . . . . . . . . . . . . . . . . . 40 5.1.1 Desvios padrao iguais . . . . . . . . . . . . . . . . . . . . . 90
2.6.8 Distribuicao Exponencial . . . . . . . . . . . . . . . . . . . 43 5.1.2 Desvios padrao diferentes . . . . . . . . . . . . . . . . . . 91
ii
iv SUMARIO
5.2 Comparacao de variancias . . . . . . . . . . . . . . . . . . . . . . 92

5.3 Amostras pareadas . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4 Comparando proporcoes . . . . . . . . . . . . . . . . . . . . . . . 94
5.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6 Correlacao e Regressao 99
6.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Captulo 1
6.2 Interpretacao do coeficiente de correlacao . . . . . . . . . . . . . . 101
6.3 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4 Regressao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.4.1 Modelo de regressao linear simples . . . . . . . . . . . . . 111
Estatstica Descritiva
6.4.2 Estimando os parametros do modelo . . . . . . . . . . . . 112
6.4.3 Construindo intervalos e testando hipoteses . . . . . . . . 114
6.4.4 Transformacoes de dados . . . . . . . . . . . . . . . . . . . 115
6.4.5 Representacao Matricial . . . . . . . . . . . . . . . . . . . 116 1.1 Introducao
6.4.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.5 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . 118
A Estatstica esta presente em todas as areas da ciencia que envolvam a coleta e
6.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
analise de dados e sua consequente transformacao em informacao, para postular,
References 126 refutar ou validar hipoteses cientficas sobre um fenomeno observavel. Sendo
assim, a Estatstica pode ser pensada como a ciencia de aprendizagem a partir
A Tabelas Estatsticas 127 de dados.
B Solucoes de Exerccios Selecionados 136 Em linhas gerais, o papel da Estatstica consiste em desenvolver metodos
de analise de dados que auxiliam o processo de tomada de decisao nos mais
variados problemas onde existe incerteza. Em funcao disto, fica evidente que os
metodos estatsticos podem ser empregados em praticamente todas as areas do
conhecimento, sempre que estiver envolvida a coleta ou analise de dados. Em
ciencia, sao realizados estudos experimentais ou observacionais que dao origem a
um conjunto de dados numericos. O proposito da investigacao e responder uma
questao cientfica, mas o padrao de variacao nos dados faz com que a resposta
nao seja obvia.
Em geral, a disciplina de Estatstica refere-se a metodos para coleta e descricao
de dados, e para quantificacao da evidencia nos dados pro ou contra uma questao
cientfica. A presenca de uma variacao nao previsvel (aleatoria) nos dados faz
disso uma tarefa pouco trivial. Neste captulo serao apresentadas tecnicas para
organizacao e descricao dos dados. No Captulo 2 serao estudados conceitos asso-
ciados a teoria das probabilidades, necessarios para desenvolver os metodos dos
captulos seguintes. A partir do Captulo 3 serao estudados metodos estatsticos
que auxiliam na tomada de decisoes com base nos dados.
1
iv SUMARIO
5.2 Comparacao de variancias . . . . . . . . . . . . . . . . . . . . . . 92

5.3 Amostras pareadas . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4 Comparando proporcoes . . . . . . . . . . . . . . . . . . . . . . . 94
5.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6 Correlacao e Regressao 99
6.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Captulo 1
6.2 Interpretacao do coeficiente de correlacao . . . . . . . . . . . . . . 101
6.3 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4 Regressao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.4.1 Modelo de regressao linear simples . . . . . . . . . . . . . 111
Estatstica Descritiva
6.4.2 Estimando os parametros do modelo . . . . . . . . . . . . 112
6.4.3 Construindo intervalos e testando hipoteses . . . . . . . . 114
6.4.4 Transformacoes de dados . . . . . . . . . . . . . . . . . . . 115
6.4.5 Representacao Matricial . . . . . . . . . . . . . . . . . . . 116 1.1 Introducao
6.4.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.5 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . 118
A Estatstica esta presente em todas as areas da ciencia que envolvam a coleta e
6.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
analise de dados e sua consequente transformacao em informacao, para postular,
References 126 refutar ou validar hipoteses cientficas sobre um fenomeno observavel. Sendo
assim, a Estatstica pode ser pensada como a ciencia de aprendizagem a partir
A Tabelas Estatsticas 127 de dados.
B Solucoes de Exerccios Selecionados 136 Em linhas gerais, o papel da Estatstica consiste em desenvolver metodos
de analise de dados que auxiliam o processo de tomada de decisao nos mais
variados problemas onde existe incerteza. Em funcao disto, fica evidente que os
metodos estatsticos podem ser empregados em praticamente todas as areas do
conhecimento, sempre que estiver envolvida a coleta ou analise de dados. Em
ciencia, sao realizados estudos experimentais ou observacionais que dao origem a
um conjunto de dados numericos. O proposito da investigacao e responder uma
questao cientfica, mas o padrao de variacao nos dados faz com que a resposta
nao seja obvia.
Em geral, a disciplina de Estatstica refere-se a metodos para coleta e descricao
de dados, e para quantificacao da evidencia nos dados pro ou contra uma questao
cientfica. A presenca de uma variacao nao previsvel (aleatoria) nos dados faz
disso uma tarefa pouco trivial. Neste captulo serao apresentadas tecnicas para
organizacao e descricao dos dados. No Captulo 2 serao estudados conceitos asso-
ciados a teoria das probabilidades, necessarios para desenvolver os metodos dos
captulos seguintes. A partir do Captulo 3 serao estudados metodos estatsticos
que auxiliam na tomada de decisoes com base nos dados.
1
2 CAPITULO 1. ESTATISTICA DESCRITIVA 1.3. VARIAVEIS QUALITATIVAS 3
1.2 Tipos de Variaveis Tabela 1.1: Frequencias observadas para os dados de itens defeituosos.
Ao inves de tentar interpretar listas de numeros e mais informativo produzir Estado ni ni /n pi Porcentagem
um resumo numerico e usar metodos graficos para descrever as caractersticas Defeituoso 6 6/25 0,24 24,0%
principais dos dados. O metodo mais apropriado dependera da natureza dos Perfeito 12 12/25 0,48 48,0%
dados, e podemos distinguir dois tipos principais apresentados abaixo. Recuperavel 5 5/25 0,20 20,0%
Outros 2 2/25 0,08 8,0%
Variaveis qualitativas ou categoricas que podem ser: Totais n = 25 pi = 1
nominais, por exemplo sexo (masculino, feminino), classificacao de

defeitos em uma maquina. de itens produzidos e classificados segundo seu estado (defeituoso, perfeito, recu-
ordinais, com categorias ordenadas, por exemplo salinidade (baixa, peravel, outros). Note que foi definida tambem a categoria outros. Em geral, se
media, alta). muitos dados forem classificados em poucas categorias, entao e conveniente unir
as categorias com somente uma ou duas observacoes em outra categoria chamada
Variaveis quantitativas que podem ser: outros. Tabelas simples como esta sao na maioria das vezes suficientes para
descrever dados qualitativos especialmente quando existem apenas duas ou tres
discretos, i.e. contagens ou numero inteiros, por exemplo numero de categorias.
ataques de asma no ano passado. Dados qualitativos sao usualmente bem ilustrados num simples grafico de bar-
contnuos, i.e. medidas numa escala contnua, tais como volume, area ras onde a altura da barra e igual a frequencia. O grafico na Figura 1.1 apresenta
ou peso. as frequencias observadas na Tabela 1.1. Note que a ordem das categorias poderia
As distincoes podem ser menos rgidas na pratica. Por exemplo, em geral

Figura 1.1: Grafico de barras das frequencias observadas na Tabela 1.1
trataramos a idade como uma variavel contnua, mas se a idade for registrada
pelo ano mais proximo, podemos trata-la como discreta, e se agruparmos os dados
12
em criancas, adultos jovens, adultos e idosos, entao temos faixa etaria
10
como uma variavel ordenada categorica. No entanto, em geral e recomendado
manter os dados em sua forma original e criar categorias somente para propositos
8
de apresentacao.
frequencias
6
1.3 Variaveis qualitativas
4
Para resumir dados qualitativos numericamente, utiliza-se contagens, proporcoes,
2
porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala
apropriada. Por exemplo, se encontrarmos que 7 de uma amostra de 5000 pes-
0
soas sao portadoras de uma doenca rara poderamos expressar isto como uma defeituoso perfeito recuperavel outros
proporcao observada (0,0014) ou percentual (0,14%), mas melhor seria 1,4 casos
por mil.
Frequentemente o primeiro passo da descricao de dados e criar uma tabela de ser alterada no eixo horizontal ja que nao existe ordenacao natural. Alem disso
frequencias. Por exemplo, na Tabela 1.1 abaixo temos as frequencias observadas a distancia horizontal entre as barras nao tem nenhuma interpretacao.
2 CAPITULO 1. ESTATISTICA DESCRITIVA 1.3. VARIAVEIS QUALITATIVAS 3
1.2 Tipos de Variaveis Tabela 1.1: Frequencias observadas para os dados de itens defeituosos.
Ao inves de tentar interpretar listas de numeros e mais informativo produzir Estado ni ni /n pi Porcentagem
um resumo numerico e usar metodos graficos para descrever as caractersticas Defeituoso 6 6/25 0,24 24,0%
principais dos dados. O metodo mais apropriado dependera da natureza dos Perfeito 12 12/25 0,48 48,0%
dados, e podemos distinguir dois tipos principais apresentados abaixo. Recuperavel 5 5/25 0,20 20,0%
Outros 2 2/25 0,08 8,0%
Variaveis qualitativas ou categoricas que podem ser: Totais n = 25 pi = 1
nominais, por exemplo sexo (masculino, feminino), classificacao de

defeitos em uma maquina. de itens produzidos e classificados segundo seu estado (defeituoso, perfeito, recu-
ordinais, com categorias ordenadas, por exemplo salinidade (baixa, peravel, outros). Note que foi definida tambem a categoria outros. Em geral, se
media, alta). muitos dados forem classificados em poucas categorias, entao e conveniente unir
as categorias com somente uma ou duas observacoes em outra categoria chamada
Variaveis quantitativas que podem ser: outros. Tabelas simples como esta sao na maioria das vezes suficientes para
descrever dados qualitativos especialmente quando existem apenas duas ou tres
discretos, i.e. contagens ou numero inteiros, por exemplo numero de categorias.
ataques de asma no ano passado. Dados qualitativos sao usualmente bem ilustrados num simples grafico de bar-
contnuos, i.e. medidas numa escala contnua, tais como volume, area ras onde a altura da barra e igual a frequencia. O grafico na Figura 1.1 apresenta
ou peso. as frequencias observadas na Tabela 1.1. Note que a ordem das categorias poderia
As distincoes podem ser menos rgidas na pratica. Por exemplo, em geral

Figura 1.1: Grafico de barras das frequencias observadas na Tabela 1.1
trataramos a idade como uma variavel contnua, mas se a idade for registrada
pelo ano mais proximo, podemos trata-la como discreta, e se agruparmos os dados
12
em criancas, adultos jovens, adultos e idosos, entao temos faixa etaria
10
como uma variavel ordenada categorica. No entanto, em geral e recomendado
manter os dados em sua forma original e criar categorias somente para propositos
8
de apresentacao.
frequencias
6
1.3 Variaveis qualitativas
4
Para resumir dados qualitativos numericamente, utiliza-se contagens, proporcoes,
2
porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala
apropriada. Por exemplo, se encontrarmos que 7 de uma amostra de 5000 pes-
0
soas sao portadoras de uma doenca rara poderamos expressar isto como uma defeituoso perfeito recuperavel outros
proporcao observada (0,0014) ou percentual (0,14%), mas melhor seria 1,4 casos
por mil.
Frequentemente o primeiro passo da descricao de dados e criar uma tabela de ser alterada no eixo horizontal ja que nao existe ordenacao natural. Alem disso
frequencias. Por exemplo, na Tabela 1.1 abaixo temos as frequencias observadas a distancia horizontal entre as barras nao tem nenhuma interpretacao.
4 CAPITULO 1. ESTATISTICA DESCRITIVA 1.4. VARIAVEIS QUANTITATIVAS 5
Graficos de setores tambem costumam ser utilizados para apresentacao de Tabela 1.2. Note que foram incluidas as frequencias acumuladas Ni e Fi , assim
dados categoricos. Os setores do grafico sao desenhados de tal forma que eles
tenham area proporcional a frequencia. A Figura 1.2 abaixo ilustra as frequencias Tabela 1.2: Frequencias observadas do numero de itens defeituosos em 35 lotes.
observadas na Tabela 1.1.
defeituosos 0 1 2 3 4 5 6 8
Figura 1.2: Grafico de setores com as frequencias observadas na Tabela 1.1 ni 1 3 5 4 9 5 6 2
pi 0,03 0,09 0,14 0,11 0,26 0,14 0,17 0,06
Ni 1 4 9 13 22 27 33 35
Fi 0,03 0,11 0,26 0,37 0,63 0,77 0,94 1,00
por exemplo podemos dizer que aproximadamente 77% dos lotes inspecionados
defeituoso tem 5 itens defeituosos ou menos. Neste caso, frequencias absolutas e frequencias
acumuladas podem ser representadas graficamente como na Figura 1.3 abaixo.
perfeito
1.0
outros
8
0.8
6
recuperavel
Freq. acumuladas
0.6
frequncias
4
0.4
2
0.2
0.0
0
0 2 4 6 8 0 1 2 3 4 5 6 8
defeituosos defeituosos
No entanto, graficos de setores constituem uma forma muito ruim de apre- (a) (b)
sentar informacao ja que em geral temos dificuldade em comparar areas. Um
Figura 1.3: Grafico de frequencias do numero de itens defeituosos em 35 lotes. (a)
grafico de barras ou de pontos e prefervel para representar este tipo de dados.
Frequencias acumuladas. (b) Frequencias absolutas.
Duas otimas referencias para este assunto sao Cleveland (1993, 1994) e Good and
Hardin (2003).
A construcao de tabelas de frequencias para variaveis quantitativas contnuas
requer certo cuidado uma vez que nao existirao observacoes repetidas. A solucao
1.4 Variaveis quantitativas
entao e agrupar os dados em classes e obter as frequencias observadas em cada
Analogamente, para resumir dados quantitativos discretos, podemos utilizar uma classe. E importante notar que ao resumir dados referentes a uma variavel
tabela de frequencias como no exemplo a seguir. contnua sempre se perde alguma informacao ja que nao temos ideia de como
se distribuem as observacoes dentro de cada classe.
Exemplo 1.1 : Foram inspecionados 35 lotes de componentes eletronicos e ob- O metodo mais comum de representacao grafica de dados contnuos e atraves
tidos os numeros de itens defeituosos em cada lote. Os dados estao resumidos na de um histograma. Neste caso, a frequencia de cada classe e representada por
Graficos de setores tambem costumam ser utilizados para apresentacao de Tabela 1.2. Note que foram incluidas as frequencias acumuladas Ni e Fi , assim
dados categoricos. Os setores do grafico sao desenhados de tal forma que eles
tenham area proporcional a frequencia. A Figura 1.2 abaixo ilustra as frequencias Tabela 1.2: Frequencias observadas do numero de itens defeituosos em 35 lotes.
observadas na Tabela 1.1.
defeituosos 0 1 2 3 4 5 6 8
Figura 1.2: Grafico de setores com as frequencias observadas na Tabela 1.1 ni 1 3 5 4 9 5 6 2
pi 0,03 0,09 0,14 0,11 0,26 0,14 0,17 0,06
Ni 1 4 9 13 22 27 33 35
Fi 0,03 0,11 0,26 0,37 0,63 0,77 0,94 1,00
por exemplo podemos dizer que aproximadamente 77% dos lotes inspecionados
defeituoso tem 5 itens defeituosos ou menos. Neste caso, frequencias absolutas e frequencias
acumuladas podem ser representadas graficamente como na Figura 1.3 abaixo.
perfeito
1.0
outros
8
0.8
6
recuperavel
Freq. acumuladas
0.6
frequncias
4
0.4
2
0.2
0.0
0
0 2 4 6 8 0 1 2 3 4 5 6 8
defeituosos defeituosos
No entanto, graficos de setores constituem uma forma muito ruim de apre- (a) (b)
sentar informacao ja que em geral temos dificuldade em comparar areas. Um
Figura 1.3: Grafico de frequencias do numero de itens defeituosos em 35 lotes. (a)
grafico de barras ou de pontos e prefervel para representar este tipo de dados.
Frequencias acumuladas. (b) Frequencias absolutas.
Duas otimas referencias para este assunto sao Cleveland (1993, 1994) e Good and
Hardin (2003).
A construcao de tabelas de frequencias para variaveis quantitativas contnuas
requer certo cuidado uma vez que nao existirao observacoes repetidas. A solucao
1.4 Variaveis quantitativas
entao e agrupar os dados em classes e obter as frequencias observadas em cada
Analogamente, para resumir dados quantitativos discretos, podemos utilizar uma classe. E importante notar que ao resumir dados referentes a uma variavel
tabela de frequencias como no exemplo a seguir. contnua sempre se perde alguma informacao ja que nao temos ideia de como
se distribuem as observacoes dentro de cada classe.
Exemplo 1.1 : Foram inspecionados 35 lotes de componentes eletronicos e ob- O metodo mais comum de representacao grafica de dados contnuos e atraves
tidos os numeros de itens defeituosos em cada lote. Os dados estao resumidos na de um histograma. Neste caso, a frequencia de cada classe e representada por
um retangulo cuja base e igual a amplitude da classe e a altura e proporcional a Algumas vezes e conveniente agregar classes de frequencia nos extremos da
frequencia. distribuicao de forma que os intervalos passam a ter larguras diferentes. Neste
caso deve-se ter certo cuidado ao interpretar o histograma. A ideia e que a area
Exemplo 1.2 : Em um rio foram encontrados mortos 150 peixes vtimas de de cada retangulo deve ser preservada, assim por exemplo se a amplitude de um
contaminacao e seus comprimentos foram medidos em milmetros. As medidas intervalo for duplicada ele deve ter altura igual a metada de sua frequencia.
observadas foram agrupadas em classes e as frequencias de cada classe aparecem Neste texto nao discutiremos em detalhes a especificacao do numero e da am-
na Tabela 1.3. O histograma construdo com base nestes dados e apresentado na plitude das classes ja que os pacotes estatsticos utilizam algoritmos para escolha
Figura 1.4. otima destes valores. A ideia e que um numero muito grande de classes nao re-
sume satisfatoriamente os dados e com um numero muito pequeno perde-se muita
Tabela 1.3: Frequencias dos comprimentos de peixes encontrados mortos em um rio. informacao.
Outro metodo grafico que vale a pena ser utilizado quando o numero de ob-
Comprimento (mm) ni pi Ni Fi servacoes nao for muito grande e o grafico de ramo-e-folhas que sera ilustrado
100 110 7 0,05 7 0,05 nos exemplos a seguir. Cada observacao e separada em um ramo (geralmente a
110 120 16 0,11 23 0,15 parte inteira) e uma folha (geralmente a parte decimal). O grafico tera a forma
120 130 19 0,13 42 0,28
de um histograma porem retendo a informacao dos valores observados. A tecnica
130 140 31 0,21 73 0,49
e ilustrada nos exemplo 1.3 abaixo.
140 150 41 0,27 114 0,76
150 160 23 0,15 137 0,91
160 170 10 0,07 147 0,98 Exemplo 1.3 : Um estudo geoqumico foi realizado utilizando-se amostras de
170 180 3 0,02 150 1,00 sedimentos provenientes de riachos e obteve-se as concentracoes de Cromo (em
ppm) abaixo. Podemos facilmente escrever os dados no grafico de ramo-e-folhas
como na Figura 1.5.
10,6 14,1 13,7 15,2 15,4 12,5 12,9 14,3

Figura 1.4: Histograma das frequencias de comprimentos de peixes mortos dadas na 13,0 12,6 12,0 14,0 10,0 18,2 11,5 9,4
Tabela 1.3 16,5 13,7 14,7 16,6 11,4 18,4 17,4 11,1
15,8 17,0 13,6 16,6 11,8 15,8 13,5
40
Note que os ramos sao numeros inteiros e as folhas sao os valores depois
da vrgula decimal. E importante escrever as folhas em colunas igualmente
30
espacadas, caso contrario a figura ficara distorcida. Alem de ser um resumo

frequencias
visual dos dados o grafico de ramo-e-folhas fornece mais informacao do que o

20
histograma ja que os dados podem ser lidos no grafico.
Exemplo 1.4 : Os valores abaixo correspondem ao tempo (em minutos) que os

10
alunos matriculados em uma disciplina do curso de Estatstica utilizaram para

resolucao da prova no segundo semestre de 2002.
0
100 120 140 160 180

comprimentos 23 31 42 45 51 52 57 61 61 64
68 69 73 75 75 82 89 94 118 120
um retangulo cuja base e igual a amplitude da classe e a altura e proporcional a Algumas vezes e conveniente agregar classes de frequencia nos extremos da
frequencia. distribuicao de forma que os intervalos passam a ter larguras diferentes. Neste
caso deve-se ter certo cuidado ao interpretar o histograma. A ideia e que a area
Exemplo 1.2 : Em um rio foram encontrados mortos 150 peixes vtimas de de cada retangulo deve ser preservada, assim por exemplo se a amplitude de um
contaminacao e seus comprimentos foram medidos em milmetros. As medidas intervalo for duplicada ele deve ter altura igual a metada de sua frequencia.
observadas foram agrupadas em classes e as frequencias de cada classe aparecem Neste texto nao discutiremos em detalhes a especificacao do numero e da am-
na Tabela 1.3. O histograma construdo com base nestes dados e apresentado na plitude das classes ja que os pacotes estatsticos utilizam algoritmos para escolha
Figura 1.4. otima destes valores. A ideia e que um numero muito grande de classes nao re-
sume satisfatoriamente os dados e com um numero muito pequeno perde-se muita
Tabela 1.3: Frequencias dos comprimentos de peixes encontrados mortos em um rio. informacao.
Outro metodo grafico que vale a pena ser utilizado quando o numero de ob-
Comprimento (mm) ni pi Ni Fi servacoes nao for muito grande e o grafico de ramo-e-folhas que sera ilustrado
100 110 7 0,05 7 0,05 nos exemplos a seguir. Cada observacao e separada em um ramo (geralmente a
110 120 16 0,11 23 0,15 parte inteira) e uma folha (geralmente a parte decimal). O grafico tera a forma
120 130 19 0,13 42 0,28
de um histograma porem retendo a informacao dos valores observados. A tecnica
130 140 31 0,21 73 0,49
e ilustrada nos exemplo 1.3 abaixo.
140 150 41 0,27 114 0,76
150 160 23 0,15 137 0,91
160 170 10 0,07 147 0,98 Exemplo 1.3 : Um estudo geoqumico foi realizado utilizando-se amostras de
170 180 3 0,02 150 1,00 sedimentos provenientes de riachos e obteve-se as concentracoes de Cromo (em
ppm) abaixo. Podemos facilmente escrever os dados no grafico de ramo-e-folhas
como na Figura 1.5.
10,6 14,1 13,7 15,2 15,4 12,5 12,9 14,3

Figura 1.4: Histograma das frequencias de comprimentos de peixes mortos dadas na 13,0 12,6 12,0 14,0 10,0 18,2 11,5 9,4
Tabela 1.3 16,5 13,7 14,7 16,6 11,4 18,4 17,4 11,1
15,8 17,0 13,6 16,6 11,8 15,8 13,5
40
Note que os ramos sao numeros inteiros e as folhas sao os valores depois
da vrgula decimal. E importante escrever as folhas em colunas igualmente
30
espacadas, caso contrario a figura ficara distorcida. Alem de ser um resumo

frequencias
visual dos dados o grafico de ramo-e-folhas fornece mais informacao do que o

20
histograma ja que os dados podem ser lidos no grafico.
Exemplo 1.4 : Os valores abaixo correspondem ao tempo (em minutos) que os

10
alunos matriculados em uma disciplina do curso de Estatstica utilizaram para

resolucao da prova no segundo semestre de 2002.
0
100 120 140 160 180

comprimentos 23 31 42 45 51 52 57 61 61 64
68 69 73 75 75 82 89 94 118 120
8 CAPITULO 1. ESTATISTICA DESCRITIVA 1.5. RESUMOS NUMERICOS 9
Figura 1.5: Grafico de ramo-e-folhas dos dados geoqumicos do Exemplo 1.3.

1.5.1 Media, variancia e desvio padrao
Para resumir dados quantitativos aproximadamente simetricos, e usual calcular
9|4 a media aritmetica como uma medida de locacao. Se x1 , x2 , . . . , xn sao os valores
10|0 6
dos dados, entao podemos escrever a media como
11|1 4 5 8
12|0 5 6 9 Pn
x1 + x2 + + xn xi
13|0 5 6 7 7 x= = i=1 .
n n
14|0 1 3 7
15|2 4 8 8 A variancia e definida como o desvio quadratico medio em torno da media e
16|5 6 6 e calculada a partir de uma amostra de dados como
17|0 4 Pn
18|2 4 (xi x)2
s2 = i=1 .
n1
A representacao no grafico de ramo-e-folhas e feita de forma que os ramos Note que, sendo definida a partir de uma soma de quadrados a variancia sempre
contenham dezenas de minutos e as folhas contenham unidades de minutos. assume valores positivos. Alem disso, a divisao por n1 retira o efeito do tamanho
do conjunto de dados, assim as dispersoes de dois conjuntos ficam comparaveis
2|3 2|F mesmo que um deles tenha muito mais observacoes do que o outro. Nao e difcil
3|1 3|F mostrar que a expressao da variancia pode ser reescrita como
4|2 5 4|M F Pn 2
5|1 2 7 5|F F M x nx2
s2 = i=1 i
6|1 1 4 8 9 6|F F F F M n1
7|3 5 5 7|M M M
que e uma versao mais facil de ser calculada quando nao se dispoe de recursos
8|2 9 8|M F
computacionais. Mas cuidado porque os erros de arrendondamento podem gerar
9|4 9|F
um valor negativo se a variancia for muito pequena.
10| 10|
A raiz quadrada positiva da variancia, chamada de desvio padrao, e uma
11|8 11|M
medida
de dispersao que esta na mesma escala dos dados. A notacao usual e
12|0 12|M
s = s2 .
Pode-se notar que os valores estao simetricamente dispersos em torno de um valor Algumas propriedades destas mediadas sao,
central e nao ha a indicacao de valores atpicos ou discrepantes (outliers). No P
1. a soma de desvios em torno da media e sempre igual a zero, ni=1 (xi x) =
diagrama da direita a informacao sobre o sexo dos alunos foi adicionada e ha
0.
indicacao de que os homens (M) gastaram um tempo maior do que as mulheres
P
(F). 2. a soma de desvios quadraticos em torno de um valor a, ni=1 (xi a)2 , e
mnima se somente se a = x.
1.5 Resumos numericos 3. somando-se uma constante k aos dados a media sera somada da mesma
constante enquanto a variancia fica inalterada.
Para resumir numericamente dados de uma variavel quantitativa o objetivo e
escolher medidas apropriadas de locacao e de dispersao. Existem tres escolhas 4. multiplicando-se os dados por uma constante k a media sera multiplicada
mais frequentemente utilizadas para medidas de locacao que estao ligadas a certas pela mesma constante enquanto a variancia sera multiplicada pelo quadrado
medidas de dispersao como sera visto adiante. da constante.
Figura 1.5: Grafico de ramo-e-folhas dos dados geoqumicos do Exemplo 1.3.

1.5.1 Media, variancia e desvio padrao
Para resumir dados quantitativos aproximadamente simetricos, e usual calcular
9|4 a media aritmetica como uma medida de locacao. Se x1 , x2 , . . . , xn sao os valores
10|0 6
dos dados, entao podemos escrever a media como
11|1 4 5 8
12|0 5 6 9 Pn
x1 + x2 + + xn xi
13|0 5 6 7 7 x= = i=1 .
n n
14|0 1 3 7
15|2 4 8 8 A variancia e definida como o desvio quadratico medio em torno da media e
16|5 6 6 e calculada a partir de uma amostra de dados como
17|0 4 Pn
18|2 4 (xi x)2
s2 = i=1 .
n1
A representacao no grafico de ramo-e-folhas e feita de forma que os ramos Note que, sendo definida a partir de uma soma de quadrados a variancia sempre
contenham dezenas de minutos e as folhas contenham unidades de minutos. assume valores positivos. Alem disso, a divisao por n1 retira o efeito do tamanho
do conjunto de dados, assim as dispersoes de dois conjuntos ficam comparaveis
2|3 2|F mesmo que um deles tenha muito mais observacoes do que o outro. Nao e difcil
3|1 3|F mostrar que a expressao da variancia pode ser reescrita como
4|2 5 4|M F Pn 2
5|1 2 7 5|F F M x nx2
s2 = i=1 i
6|1 1 4 8 9 6|F F F F M n1
7|3 5 5 7|M M M
que e uma versao mais facil de ser calculada quando nao se dispoe de recursos
8|2 9 8|M F
computacionais. Mas cuidado porque os erros de arrendondamento podem gerar
9|4 9|F
um valor negativo se a variancia for muito pequena.
10| 10|
A raiz quadrada positiva da variancia, chamada de desvio padrao, e uma
11|8 11|M
medida
de dispersao que esta na mesma escala dos dados. A notacao usual e
12|0 12|M
s = s2 .
Pode-se notar que os valores estao simetricamente dispersos em torno de um valor Algumas propriedades destas mediadas sao,
central e nao ha a indicacao de valores atpicos ou discrepantes (outliers). No P
1. a soma de desvios em torno da media e sempre igual a zero, ni=1 (xi x) =
diagrama da direita a informacao sobre o sexo dos alunos foi adicionada e ha
0.
indicacao de que os homens (M) gastaram um tempo maior do que as mulheres
P
(F). 2. a soma de desvios quadraticos em torno de um valor a, ni=1 (xi a)2 , e
mnima se somente se a = x.
1.5 Resumos numericos 3. somando-se uma constante k aos dados a media sera somada da mesma
constante enquanto a variancia fica inalterada.
Para resumir numericamente dados de uma variavel quantitativa o objetivo e
escolher medidas apropriadas de locacao e de dispersao. Existem tres escolhas 4. multiplicando-se os dados por uma constante k a media sera multiplicada
mais frequentemente utilizadas para medidas de locacao que estao ligadas a certas pela mesma constante enquanto a variancia sera multiplicada pelo quadrado
medidas de dispersao como sera visto adiante. da constante.
5. a media aritmetica sempre pertence ao intervalo de variacao dos dados, i.e. coeficiente de variacao definido como s/|x|. Assim a escala das observacoes esta
min(xi ) x max(xi ) sendo levada em conta.
Das propriedades 3 e 4 e facil verificar que se yi = a + bxi , i = 1, . . . , n entao Exemplo 1.7 : Suponha por exemplo que 2 conjuntos de dados apresentam
a media aritmetica e a variancia de y sao desvios-padroes s1 = 3 e s2 = 4 com medias x1 = 30 e x2 = 80. Embora
em termos absolutos a dispersao seja maior no segundo conjunto as dispersoes
y = a + bx e s2y = b2 s2 .
relativas sao 10% e 5% respectivamente.
Exemplo 1.5 : Sete homens foram pesados, e os resultados em Kg foram: Exemplo 1.8 : Sejam agora as variaveis X e Y cujos valores observados sao 0,0,
0,05 e 0,10 e 1000, 110 e 1200 respectivamente. E facil verificar que
57,0; 62,9; 63,5; 64,1; 66,1; 67,1; 73,6.
x = 0, 05 s2x = 0, 052 sx = 0, 05
Utilizando uma calculadora nao e difcil verificar que a media e 64,9 kg, a variancia y = 1100 s2y = 1002 sx = 100
e 25,16 kg2 e o desvio padrao e 5,02 kg.
e a variabilidade de X e bem menor em termos absolutos. Porem, em termos
Exemplo 1.6 : Foram inspecionados 30 aparelhos fabricados por uma industria relativos,
e obteve-se a distribuicao de frequencias do numero de defeitos por aparelho dada 100
CV (X) = 100% e CV (Y ) = 6%.
na Tabela 1.4. 1100
Tabela 1.4: Frequencias dos numeros de defeitos por aparelho inspecionado. 1.5.2 A mediana e a amplitude inter-quartis
Numero de defeitos 0 1 2 3 4 Aqui vamos apresentar medidas de locacao e dispersao baseadas em dados orde-
ni 12 8 7 1 2 nados (ou estatsticas de ordem) que sao particularmente uteis para distribuicoes
assimetricas e sao pouco sensveis a observacoes muito discrepantes.
A mediana e definida como o valor que divide os dados ordenados em duas
Neste caso o numero medio de defeitos por aparelho sera partes de mesmo tamanho. Quando ha um numero mpar de observacoes a me-
diana e o valor central (de ordem (n + 1)/2) enquanto que para um numero par
12 0 + 8 1 + 7 2 + 1 3 + 2 4 33
x= = = 1, 1 de observacoes a mediada e calculada como a media dos dois valores centrais (de
30 30
ordem n/2 e n/2 + 1). Por exemplo, as medianas dos conjuntos ordenados
e sua variancia sera
5, 7, 9, 13, 17, 19, 20 e 3, 7, 8, 10, 12, 15
12 02 + 8 12 + 7 22 + 1 32 + 2 42 30 1, 12 40, 7
s2 = = 1, 4.
29 29 sao 13 e (8+10)/2=9 respectivamente.
A definicao pode ser estendida para valores que dividem a distribuicao em 4
Vale notar que estas medidas sao extremamente sensveis a observacoes dis- partes de mesmo tamanho (quartis) ou 100 partes de mesmo tamanho (percentis).
crepantes. No Exemplo 1.6, se um unico aparelho apresentasse 15 defeitos ao Os quartis inferior e superior, usualmente denotados por Q1 e Q3 , sao definidos
inves de 4 a media passaria a ser aproximadamente 1,5 e a variancia passaria a como os valores abaixo dos quais estao 1/4 e 3/4, respectivamente, dos dados.
ser aproximadamente 7,6. Estes valores sao frequentemente usados para resumir os dados juntamente com o
Uma medida de dispersao relativa particularmente util quando se deseja com- mnimo, o maximo e a mediana. Para um numero par de observacoes, os quartis
parar dispersoes em dois conjuntos de dados com medias bem diferentes e o tambem serao uma media de valores.
5. a media aritmetica sempre pertence ao intervalo de variacao dos dados, i.e. coeficiente de variacao definido como s/|x|. Assim a escala das observacoes esta
min(xi ) x max(xi ) sendo levada em conta.
Das propriedades 3 e 4 e facil verificar que se yi = a + bxi , i = 1, . . . , n entao Exemplo 1.7 : Suponha por exemplo que 2 conjuntos de dados apresentam
a media aritmetica e a variancia de y sao desvios-padroes s1 = 3 e s2 = 4 com medias x1 = 30 e x2 = 80. Embora
em termos absolutos a dispersao seja maior no segundo conjunto as dispersoes
y = a + bx e s2y = b2 s2 .
relativas sao 10% e 5% respectivamente.
Exemplo 1.5 : Sete homens foram pesados, e os resultados em Kg foram: Exemplo 1.8 : Sejam agora as variaveis X e Y cujos valores observados sao 0,0,
0,05 e 0,10 e 1000, 110 e 1200 respectivamente. E facil verificar que
57,0; 62,9; 63,5; 64,1; 66,1; 67,1; 73,6.
x = 0, 05 s2x = 0, 052 sx = 0, 05
Utilizando uma calculadora nao e difcil verificar que a media e 64,9 kg, a variancia y = 1100 s2y = 1002 sx = 100
e 25,16 kg2 e o desvio padrao e 5,02 kg.
e a variabilidade de X e bem menor em termos absolutos. Porem, em termos
Exemplo 1.6 : Foram inspecionados 30 aparelhos fabricados por uma industria relativos,
e obteve-se a distribuicao de frequencias do numero de defeitos por aparelho dada 100
CV (X) = 100% e CV (Y ) = 6%.
na Tabela 1.4. 1100
Tabela 1.4: Frequencias dos numeros de defeitos por aparelho inspecionado. 1.5.2 A mediana e a amplitude inter-quartis
Numero de defeitos 0 1 2 3 4 Aqui vamos apresentar medidas de locacao e dispersao baseadas em dados orde-
ni 12 8 7 1 2 nados (ou estatsticas de ordem) que sao particularmente uteis para distribuicoes
assimetricas e sao pouco sensveis a observacoes muito discrepantes.
A mediana e definida como o valor que divide os dados ordenados em duas
Neste caso o numero medio de defeitos por aparelho sera partes de mesmo tamanho. Quando ha um numero mpar de observacoes a me-
diana e o valor central (de ordem (n + 1)/2) enquanto que para um numero par
12 0 + 8 1 + 7 2 + 1 3 + 2 4 33
x= = = 1, 1 de observacoes a mediada e calculada como a media dos dois valores centrais (de
30 30
ordem n/2 e n/2 + 1). Por exemplo, as medianas dos conjuntos ordenados
e sua variancia sera
5, 7, 9, 13, 17, 19, 20 e 3, 7, 8, 10, 12, 15
12 02 + 8 12 + 7 22 + 1 32 + 2 42 30 1, 12 40, 7
s2 = = 1, 4.
29 29 sao 13 e (8+10)/2=9 respectivamente.
A definicao pode ser estendida para valores que dividem a distribuicao em 4
Vale notar que estas medidas sao extremamente sensveis a observacoes dis- partes de mesmo tamanho (quartis) ou 100 partes de mesmo tamanho (percentis).
crepantes. No Exemplo 1.6, se um unico aparelho apresentasse 15 defeitos ao Os quartis inferior e superior, usualmente denotados por Q1 e Q3 , sao definidos
inves de 4 a media passaria a ser aproximadamente 1,5 e a variancia passaria a como os valores abaixo dos quais estao 1/4 e 3/4, respectivamente, dos dados.
ser aproximadamente 7,6. Estes valores sao frequentemente usados para resumir os dados juntamente com o
Uma medida de dispersao relativa particularmente util quando se deseja com- mnimo, o maximo e a mediana. Para um numero par de observacoes, os quartis
parar dispersoes em dois conjuntos de dados com medias bem diferentes e o tambem serao uma media de valores.
Podemos agora definir uma medida de dispersao aproprida, a amplitude inter- Para efeito de construcao do Box-plot, uma observacao x sera considerada um
quartis, que e a diferenca entre o quartil superior e o inferior, Q3 Q1 . Note outlier se,
tambem que 50% dos dados estarao entre os quartis inferior e superior.
x < Q1 1, 5(Q3 Q1 ) ou x > Q3 + 1, 5(Q3 Q1 ).
Exemplo 1.9 : O numero de criancas em 19 famlias foi contado e obteve-se os
seguintes valores (ja ordenados),
Exemplo 1.10 : Um box-plot para os dados do Exemplo 1.4 e mostrado na
0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10. Figura 1.7. Os dados originais foram adicionados ao eixo vertical e pode-se notar
que o valor 120 minutos foi considerado um outlier segundo o criterio acima.
Assim, o numero mediano de criancas e o valor de ordem (19+1)/2=10, i.e. 3
criancas. Analogamente, os quartis inferior e superior sao os valores de ordem 5
e 15 respectivamente, i.e. 2 e 6 criancas. Portanto a amplitude inter-quartis e de Figura 1.7: Box-plot dos dados do Exemplo 1.4.
4 criancas.
120
Vale notar tambem que no Exemplo 1.6 se um unico aparelho apresentasse 15
100
defeitos ao inves de 4 a mediana e os quartis ficariam inalterados.
Um importante metodo grafico para apresentar caractersticas de um con-
tempos em minutos
junto de dados chama-se Box-and-Whisker plot ou simplesmente Box-plot
80
e e baseado nas medidas vistas acima, i.e. o mnimo, o maximo, os quartis e a
mediana. Um box-plot para os dados do Exemplo 1.3 e mostrado na Figura 1.6.
60
A altura do retangulo representa a distancia inter-quartis e as linhas se estendem
40
Figura 1.6: Box-plot dos dados geoqumicos do Exemplo 1.3.
20
18
A presenca de outliers em um conjunto de dados pode ser perfeitamente nor-

16
concentraes de Cr
mal, embora eles possam viesar calculos baseados em somas. Eles tambem podem
ser devido a erros (que podem ser corrigidos), ou ainda revelar que a distribuicao
14
dos dados tem caudas pesadas (e.g. dados intra-diarios do mercado financeiro).
Vale notar que este tipo de grafico e particularmente util para comparar ca-
12
ractersticas de diferentes conjuntos de dados (como sera visto na Secao 1.6.5).

10
1.5.3 A moda
Algumas vezes, especialmente para dados de contagem, um unico valor domina
a amostra. Neste caso, a medida de locacao apropriada e a moda, definida como
o valor que ocorre com maior frequencia. A proporcao da amostra que assume
ate as observacoes extremas, exceto aquelas consideradas discrepantes (outliers). este valor modal pode ser utilizada no lugar de uma medida formal de dispersao.
Podemos agora definir uma medida de dispersao aproprida, a amplitude inter- Para efeito de construcao do Box-plot, uma observacao x sera considerada um
quartis, que e a diferenca entre o quartil superior e o inferior, Q3 Q1 . Note outlier se,
tambem que 50% dos dados estarao entre os quartis inferior e superior.
x < Q1 1, 5(Q3 Q1 ) ou x > Q3 + 1, 5(Q3 Q1 ).
Exemplo 1.9 : O numero de criancas em 19 famlias foi contado e obteve-se os
seguintes valores (ja ordenados),
Exemplo 1.10 : Um box-plot para os dados do Exemplo 1.4 e mostrado na
0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10. Figura 1.7. Os dados originais foram adicionados ao eixo vertical e pode-se notar
que o valor 120 minutos foi considerado um outlier segundo o criterio acima.
Assim, o numero mediano de criancas e o valor de ordem (19+1)/2=10, i.e. 3
criancas. Analogamente, os quartis inferior e superior sao os valores de ordem 5
e 15 respectivamente, i.e. 2 e 6 criancas. Portanto a amplitude inter-quartis e de Figura 1.7: Box-plot dos dados do Exemplo 1.4.
4 criancas.
120
Vale notar tambem que no Exemplo 1.6 se um unico aparelho apresentasse 15
100
defeitos ao inves de 4 a mediana e os quartis ficariam inalterados.
Um importante metodo grafico para apresentar caractersticas de um con-
tempos em minutos
junto de dados chama-se Box-and-Whisker plot ou simplesmente Box-plot
80
e e baseado nas medidas vistas acima, i.e. o mnimo, o maximo, os quartis e a
mediana. Um box-plot para os dados do Exemplo 1.3 e mostrado na Figura 1.6.
60
A altura do retangulo representa a distancia inter-quartis e as linhas se estendem
40
Figura 1.6: Box-plot dos dados geoqumicos do Exemplo 1.3.
20
18
A presenca de outliers em um conjunto de dados pode ser perfeitamente nor-

16
concentraes de Cr
mal, embora eles possam viesar calculos baseados em somas. Eles tambem podem
ser devido a erros (que podem ser corrigidos), ou ainda revelar que a distribuicao
14
dos dados tem caudas pesadas (e.g. dados intra-diarios do mercado financeiro).
Vale notar que este tipo de grafico e particularmente util para comparar ca-
12
ractersticas de diferentes conjuntos de dados (como sera visto na Secao 1.6.5).

10
1.5.3 A moda
Algumas vezes, especialmente para dados de contagem, um unico valor domina
a amostra. Neste caso, a medida de locacao apropriada e a moda, definida como
o valor que ocorre com maior frequencia. A proporcao da amostra que assume
ate as observacoes extremas, exceto aquelas consideradas discrepantes (outliers). este valor modal pode ser utilizada no lugar de uma medida formal de dispersao.
14 CAPITULO 1. ESTATISTICA DESCRITIVA 1.6. DADOS MULTIPLOS 15
Na pratica pode haver situacoes aonde se pode distinguir claramente dois ou

mais picos na frequencia dos valores observados. Neste caso dizemos que os Figura 1.8: Box-plots dos dados de renda mediana em Curitiba no ano de 2000 agru-
pados de acordo com o numero de homicidios.
dados apresentam multimodalidade e devemos reportar todas os valores modais.
Dados deste tipo sao particularmente difceis de resumir e analisar.
Exemplo 1.11 : O conjunto de dados discretos 3, 5, 7, 7, 7, 8, 10, 10, 10, 15, 20
20
apresenta duas modas 7 e 10 sendo assim chamado de bimodal.
15
1.6 Dados multiplos
Os resultados de um estudo tipicamente envolverao mais do que um unico con-
10
junto de dados. Neste caso, representacoes graficas sao uteis para comparar
grupos de dados ou para verificar se exitem relacoes entre eles. Existem mui-
tas possibilidades, mas a mais adequada dependera das peculiaridades de cada
5
conjunto de dados.
Podemos criar combinacoes dos metodos ja discutidos. Por exemplo, se me-
dirmos as alturas e pesos de um conjunto de pessoas, podemos produzir box-plots Num. homic. > 4 Num. homic. <= 4
de alturas lado a lado para homens e mulheres, ou graficos ramo-e-folhas lado a

lado (com as alturas dos homens a esquerda do ramo, e as alturas das mulheres a
direita), ou um histograma acima do outro com a mesma escala no eixo horizontal
de forma que eles possam ser facilmente comparados. Para um numero diferente C (0,5, 1 e 2 mg) em 2 formas de ingestao (Acido ascorbico e suco de laranja).
de grupos, uma serie de box-plots verticais funciona bem como um simples resumo Na Figura 1.9 sao apresentados os box-plots das medidas separados por dosagem
dos dados. e forma de ingestao.
Exemplo 1.12 : Na Figura 1.8 sao apresentados os box-plots da renda familiar

mediana (em salarios mnimos) nos 75 bairros de Curitiba no ano de 2000, agru- 1.6.1 Diagramas de dispersao
pados por numero de homicdios (menor ou igual a 4 ou maior do que 41 ). Os
Para avaliar se existe uma relacao entre duas variaveis contnuas podemos pro-
valores originais dos dados aparecem nos eixos verticais. Que informacoes podem
duzir um grafico de pontos, em geral chamado de diagrama de dispersao. Neste
ser tiradas deste grafico?
caso faz pouco sentido unir os pontos, exceto quando o eixo horizontal representa
perodos de tempo. Smbolos diferentes podem ser usados para diferentes grupos
Para combinacoes de dados categoricos, uma serie de graficos de setores ou
adicionando assim uma nova dimensao ao grafico.
de barras podem ser produzidos. No caso de dois ou tres grupos de uma mesma
variavel categorica pode ser mais interessante colocar toda a informacao em um
Exemplo 1.14 : O grafico na Figura 1.10 mostra as taxas de mortalidade por
mesmo grafico de barras.
homicidio (por 100 mil habitantes) em Sao Paulo (capital mais regiao metropoli-
tana e interior do estado) entre janeiro de 1979 e agosto de 1995. Os histogramas
Exemplo 1.13 : Em um estudo foram medidos os comprimentos de um dos
das duas variaveis aparecem nas margens e uma reta de regressao foi estimada.
dentes em cada um de 10 porquinhos da India submetidos a 3 doses de Vitamina
Que informacoes podem ser tiradas deste grafico?
1
O valor 4 foi fixado somente para fins de ilustracao Para mais do que duas variaveis, deve-se produzir diagramas de dispersao
Na pratica pode haver situacoes aonde se pode distinguir claramente dois ou

mais picos na frequencia dos valores observados. Neste caso dizemos que os Figura 1.8: Box-plots dos dados de renda mediana em Curitiba no ano de 2000 agru-
pados de acordo com o numero de homicidios.
dados apresentam multimodalidade e devemos reportar todas os valores modais.
Dados deste tipo sao particularmente difceis de resumir e analisar.
Exemplo 1.11 : O conjunto de dados discretos 3, 5, 7, 7, 7, 8, 10, 10, 10, 15, 20
20
apresenta duas modas 7 e 10 sendo assim chamado de bimodal.
15
1.6 Dados multiplos
Os resultados de um estudo tipicamente envolverao mais do que um unico con-
10
junto de dados. Neste caso, representacoes graficas sao uteis para comparar
grupos de dados ou para verificar se exitem relacoes entre eles. Existem mui-
tas possibilidades, mas a mais adequada dependera das peculiaridades de cada
5
conjunto de dados.
Podemos criar combinacoes dos metodos ja discutidos. Por exemplo, se me-
dirmos as alturas e pesos de um conjunto de pessoas, podemos produzir box-plots Num. homic. > 4 Num. homic. <= 4
de alturas lado a lado para homens e mulheres, ou graficos ramo-e-folhas lado a

lado (com as alturas dos homens a esquerda do ramo, e as alturas das mulheres a
direita), ou um histograma acima do outro com a mesma escala no eixo horizontal
de forma que eles possam ser facilmente comparados. Para um numero diferente C (0,5, 1 e 2 mg) em 2 formas de ingestao (Acido ascorbico e suco de laranja).
de grupos, uma serie de box-plots verticais funciona bem como um simples resumo Na Figura 1.9 sao apresentados os box-plots das medidas separados por dosagem
dos dados. e forma de ingestao.
Exemplo 1.12 : Na Figura 1.8 sao apresentados os box-plots da renda familiar

mediana (em salarios mnimos) nos 75 bairros de Curitiba no ano de 2000, agru- 1.6.1 Diagramas de dispersao
pados por numero de homicdios (menor ou igual a 4 ou maior do que 41 ). Os
Para avaliar se existe uma relacao entre duas variaveis contnuas podemos pro-
valores originais dos dados aparecem nos eixos verticais. Que informacoes podem
duzir um grafico de pontos, em geral chamado de diagrama de dispersao. Neste
ser tiradas deste grafico?
caso faz pouco sentido unir os pontos, exceto quando o eixo horizontal representa
perodos de tempo. Smbolos diferentes podem ser usados para diferentes grupos
Para combinacoes de dados categoricos, uma serie de graficos de setores ou
adicionando assim uma nova dimensao ao grafico.
de barras podem ser produzidos. No caso de dois ou tres grupos de uma mesma
variavel categorica pode ser mais interessante colocar toda a informacao em um
Exemplo 1.14 : O grafico na Figura 1.10 mostra as taxas de mortalidade por
mesmo grafico de barras.
homicidio (por 100 mil habitantes) em Sao Paulo (capital mais regiao metropoli-
tana e interior do estado) entre janeiro de 1979 e agosto de 1995. Os histogramas
Exemplo 1.13 : Em um estudo foram medidos os comprimentos de um dos
das duas variaveis aparecem nas margens e uma reta de regressao foi estimada.
dentes em cada um de 10 porquinhos da India submetidos a 3 doses de Vitamina
Que informacoes podem ser tiradas deste grafico?
1
O valor 4 foi fixado somente para fins de ilustracao Para mais do que duas variaveis, deve-se produzir diagramas de dispersao
Figura 1.9: Box-plots dos dados de comprimento de dente separados por dosagem e Figura 1.10: Diagrama de dispersao das taxas de mortalidade por homicidio em Sao
forma de ingestao. Paulo.
35
30
1
25
Comprimento do dente
3.0
20
2.5
15
Interior
2.0
10
3 2
1.5
Acido Ascorbico
suco de laranja
5
1.0
0
2 4 6 8 10 12 14 16
0.5 0.5 1 1 2 2 Metropolitana
Dose de Vitamina C em mg
para todos os pares possveis produzindo assim uma matriz de graficos de pontos
(Ver Captulo 6).
1.6.2 Dados Pareados
O exemplo abaixo ilustra um tipo de representacao grafica que pode ser util para
visualizar dados pareados.
Grafico temporal
Exemplo 1.15 : Uma alteracao foi introduzida na linha de montagem de um
Um caso especial de um grafico de pontos e um grafico temporal onde a variavel aparelho com o objetivo de reduzir o tempo gasto pelos operarios para execucao
tempo esta no eixo horizontal. Ou seja, as medidas dos dados sao feitas ao de certas tarefas. Uma amostra de 10 operarios foi observada antes e depois da
longo do tempo. Nestes casos e usual unir pontos sucessivos por segmentos de alteracao e a Tabela 1.5 abaixo mostra os tempos de execucao medidos. Uma
reta, e e em geral uma boa pratica deixar o eixo horizontal mais longo do que o representacao grafica destes dados e dada na Figura 1.12. E muito mais facil ver
vertical. do grafico do que da tabela que os operarios tenderam a reduzir seus tempos de
Como exemplo deste tipo de dados, na Figura 1.11 sao apresentados os graficos execucao, e que aqueles que nao reduziram ja tendiam a ter os menores tempos
temporais com medidas diarias de quatro indicadores de qualidade do ar em Nova e provavelmente nao necessitavam da alteracao.
Iorque entre maio e setembro de 1973. Uma referencia para analise deste tipo de
dados e Morettin e Toloi (2004).
Figura 1.9: Box-plots dos dados de comprimento de dente separados por dosagem e Figura 1.10: Diagrama de dispersao das taxas de mortalidade por homicidio em Sao
forma de ingestao. Paulo.
35
30
1
25
Comprimento do dente
3.0
20
2.5
15
Interior
2.0
10
3 2
1.5
Acido Ascorbico
suco de laranja
5
1.0
0
2 4 6 8 10 12 14 16
0.5 0.5 1 1 2 2 Metropolitana
Dose de Vitamina C em mg
para todos os pares possveis produzindo assim uma matriz de graficos de pontos
(Ver Captulo 6).
1.6.2 Dados Pareados
O exemplo abaixo ilustra um tipo de representacao grafica que pode ser util para
visualizar dados pareados.
Grafico temporal
Exemplo 1.15 : Uma alteracao foi introduzida na linha de montagem de um
Um caso especial de um grafico de pontos e um grafico temporal onde a variavel aparelho com o objetivo de reduzir o tempo gasto pelos operarios para execucao
tempo esta no eixo horizontal. Ou seja, as medidas dos dados sao feitas ao de certas tarefas. Uma amostra de 10 operarios foi observada antes e depois da
longo do tempo. Nestes casos e usual unir pontos sucessivos por segmentos de alteracao e a Tabela 1.5 abaixo mostra os tempos de execucao medidos. Uma
reta, e e em geral uma boa pratica deixar o eixo horizontal mais longo do que o representacao grafica destes dados e dada na Figura 1.12. E muito mais facil ver
vertical. do grafico do que da tabela que os operarios tenderam a reduzir seus tempos de
Como exemplo deste tipo de dados, na Figura 1.11 sao apresentados os graficos execucao, e que aqueles que nao reduziram ja tendiam a ter os menores tempos
temporais com medidas diarias de quatro indicadores de qualidade do ar em Nova e provavelmente nao necessitavam da alteracao.
Iorque entre maio e setembro de 1973. Uma referencia para analise deste tipo de
dados e Morettin e Toloi (2004).
Tabela 1.5: Tempos de execucao de tarefas por operario.
Operario Tempo antes Tempo depois

1 10,3 12,2
2 11,4 12,1
3 10,9 13,1
300
150
4 12,0 11,9
250
5 10,0 12,0
6 11,9 12,9
Radiao solar
100
200
Ozonio
7 12,2 11,4
150
8 12,3 12,1
9 11,7 13,5
100
50
50 10 12,0 12,3
0
0 50 100 150 0 50 100 150

dias dias
(a) (b)
20
90
Figura 1.12: Grafico dos tempos de execucao de tarefas por operarios observados antes
15
e depois de uma alteracao.

Temperatura
80
Vento
14
10
70
13
5
60
tempo de execuo
0 50 100 150 0 50 100 150
12
dias dias
(c) (d)
Figura 1.11: Graficos com as series temporais de quatro indicadores de qualidade do
11
ar em Nova Iorque, EUA.
10
Tabela 1.5: Tempos de execucao de tarefas por operario.
Operario Tempo antes Tempo depois

1 10,3 12,2
2 11,4 12,1
3 10,9 13,1
300
150
4 12,0 11,9
250
5 10,0 12,0
6 11,9 12,9
Radiao solar
100
200
Ozonio
7 12,2 11,4
150
8 12,3 12,1
9 11,7 13,5
100
50
50 10 12,0 12,3
0
0 50 100 150 0 50 100 150

dias dias
(a) (b)
20
90
Figura 1.12: Grafico dos tempos de execucao de tarefas por operarios observados antes
15
e depois de uma alteracao.

Temperatura
80
Vento
14
10
70
13
5
60
tempo de execuo
0 50 100 150 0 50 100 150
12
dias dias
(c) (d)
Figura 1.11: Graficos com as series temporais de quatro indicadores de qualidade do
11
ar em Nova Iorque, EUA.
10
20 CAPITULO 1. ESTATISTICA DESCRITIVA 1.7. PROBLEMAS 21
1.7 Problemas 0 1 11 0 0 0 2 12 0 0
12 1 0 0 0 0 12 0 11 0
1. Para um conjunto de n valores observados x1 , . . . , xn mostre que:
P
(a) a variancia tambem pode ser escrita como ( ni=1 x2i nx2 )/(n 1);
7. Faca um grafico ramo-e-folhas para apresentacao dos dados de altura (em
(b) somando-se uma constante k aos dados a variancia nao se altera e a
metros) de 20 mulheres sendo estudadas para uma certa condicao medica.
media fica somada de k;
(c) multiplicando-se os dados por uma constante k a media fica multipli-
cada por k e a variancia fica multiplicada por k 2 .
1,52 1,60 1,57 1,52 1,60
(d) Calcule a media e a variancia da transformacao yi = axi + b para duas 1,75 1,73 1,63 1,55 1,63
constantes a e b quaisquer. 1,65 1,55 1,65 1,60 1,68
2.50 1,52 1,65 1,60 1,65
2. No Exemplo 1.6 verifique que se um unico aparelho apresentasse 15 defeitos
ao inves de 4 a mediana e os quartis ficariam inalterados.
3. O salario medio dos funcionarios de uma empresa era de R$500,00 com 8. Os dados a seguir fornecem a concentracao de um determinado poluente
variancia 100 reais2 e o salario mediano era de R$450,00. Se todos os (em ppm) em 8 pontos de um afluente medidos antes e uma hora depois de
salarios forem duplicados o que ocorre com a media, variancia, mediana e um acidente ambiental:
coeficiente de variacao?
4. Descreva em palavras quais informacoes podem ser tiradas das Figuras 1.8,
1.9 e 1.10. Antes Depois
4,67 5,44
5. Forneca dois exemplos de variaveis qualitativas e dois de variaveis quanti- 4,97 6,11
tativas (diferentes da apostila). 5,11 6,49
6. Descreva de forma concisa os seguintes dados usando suas palavras e algu- 5,17 6,61
mas estatsticas descritivas, apontando caractersticas principais observa- 5,33 6,67
das. 6,22 6,67
6,50 6,78
(a) As notas (de um total de 100 e ordenadas por tamanho) de 20 estu- 7,00 7,89
dantes de estatstica no primeiro exame do semestre:
30 35 37 40 40 49 51 54 54 55
57 58 60 60 62 62 65 67 74 89 Faca um grafico destes dados, e use o grafico para ajudar a avaliar se o
(b) O numero de faltas de 20 trabalhadores num ano (ordenados por ta- acidente provocou um aumento significativo nos nveis do poluente no aflu-
manho): ente.
0 0 0 0 0 0 0 1 1 1
2 2 3 3 4 5 5 5 8 45 9. A tabela abaixo fornece o numero de granulos de arenito por cm3 em 20
(c) O numero de exemplares de um jornal mensal em particular lidos por amostras tomadas de uma certa localidade (A) e 20 amostras tomadas de
20 pessoas num ano: uma outra localidade (B).
1.7 Problemas 0 1 11 0 0 0 2 12 0 0
12 1 0 0 0 0 12 0 11 0
1. Para um conjunto de n valores observados x1 , . . . , xn mostre que:
P
(a) a variancia tambem pode ser escrita como ( ni=1 x2i nx2 )/(n 1);
7. Faca um grafico ramo-e-folhas para apresentacao dos dados de altura (em
(b) somando-se uma constante k aos dados a variancia nao se altera e a
metros) de 20 mulheres sendo estudadas para uma certa condicao medica.
media fica somada de k;
(c) multiplicando-se os dados por uma constante k a media fica multipli-
cada por k e a variancia fica multiplicada por k 2 .
1,52 1,60 1,57 1,52 1,60
(d) Calcule a media e a variancia da transformacao yi = axi + b para duas 1,75 1,73 1,63 1,55 1,63
constantes a e b quaisquer. 1,65 1,55 1,65 1,60 1,68
2.50 1,52 1,65 1,60 1,65
2. No Exemplo 1.6 verifique que se um unico aparelho apresentasse 15 defeitos
ao inves de 4 a mediana e os quartis ficariam inalterados.
3. O salario medio dos funcionarios de uma empresa era de R$500,00 com 8. Os dados a seguir fornecem a concentracao de um determinado poluente
variancia 100 reais2 e o salario mediano era de R$450,00. Se todos os (em ppm) em 8 pontos de um afluente medidos antes e uma hora depois de
salarios forem duplicados o que ocorre com a media, variancia, mediana e um acidente ambiental:
coeficiente de variacao?
4. Descreva em palavras quais informacoes podem ser tiradas das Figuras 1.8,
1.9 e 1.10. Antes Depois
4,67 5,44
5. Forneca dois exemplos de variaveis qualitativas e dois de variaveis quanti- 4,97 6,11
tativas (diferentes da apostila). 5,11 6,49
6. Descreva de forma concisa os seguintes dados usando suas palavras e algu- 5,17 6,61
mas estatsticas descritivas, apontando caractersticas principais observa- 5,33 6,67
das. 6,22 6,67
6,50 6,78
(a) As notas (de um total de 100 e ordenadas por tamanho) de 20 estu- 7,00 7,89
dantes de estatstica no primeiro exame do semestre:
30 35 37 40 40 49 51 54 54 55
57 58 60 60 62 62 65 67 74 89 Faca um grafico destes dados, e use o grafico para ajudar a avaliar se o
(b) O numero de faltas de 20 trabalhadores num ano (ordenados por ta- acidente provocou um aumento significativo nos nveis do poluente no aflu-
manho): ente.
0 0 0 0 0 0 0 1 1 1
2 2 3 3 4 5 5 5 8 45 9. A tabela abaixo fornece o numero de granulos de arenito por cm3 em 20
(c) O numero de exemplares de um jornal mensal em particular lidos por amostras tomadas de uma certa localidade (A) e 20 amostras tomadas de
20 pessoas num ano: uma outra localidade (B).
A B (a) Faca um grafico desses dados para investigar a relacao entre o conteudo
171 397 116 375 de acucar e sal nos cereais matinais.
431 795 375 440 (b) Comente brevemente qualquer padrao observado nos dados.
288 257 151 192
1283 902 752 503
554 1621 979 1252
295 1004 208 688
568 1378 426 771
958 435 675 377
2415 1104 410 700
1212 396 736 315
(a) Calcule as medias e desvios-padrao nas duas localidades.

(b) Faca histogramas dos dois conjuntos de dados, e compare-os.
(c) Obtenha o mnimo, maximo, mediana, e os quartis de cada grupo?
(d) Usando sua resposta ao item (c), construa boxplots para os dois con-
juntos de dados e compare-os.
(e) Voce acha que existe uma diferenca real entre os numeros de granulos
de arenito nas duas localidades, ou as diferencas observadas poderiam
ter simplesmente ocorrido como uma consequencia dos grupos consis-
tirem de somente 20 observacoes cada?
(f) Descreva as principais caractersticas dos dados em uma ou duas sen-
tencas.
10. O percentual de acucar e sal em 9 cereais matinais mais populares foram

medidos, com os seguintes resultados:
Cereal acucar sal

1 19 8
2 36 5
3 3 10
4 8 4
5 26 6
6 16 6
7 8 9
8 10 3
9 54 3
A B (a) Faca um grafico desses dados para investigar a relacao entre o conteudo
171 397 116 375 de acucar e sal nos cereais matinais.
431 795 375 440 (b) Comente brevemente qualquer padrao observado nos dados.
288 257 151 192
1283 902 752 503
554 1621 979 1252
295 1004 208 688
568 1378 426 771
958 435 675 377
2415 1104 410 700
1212 396 736 315
(a) Calcule as medias e desvios-padrao nas duas localidades.

(b) Faca histogramas dos dois conjuntos de dados, e compare-os.
(c) Obtenha o mnimo, maximo, mediana, e os quartis de cada grupo?
(d) Usando sua resposta ao item (c), construa boxplots para os dois con-
juntos de dados e compare-os.
(e) Voce acha que existe uma diferenca real entre os numeros de granulos
de arenito nas duas localidades, ou as diferencas observadas poderiam
ter simplesmente ocorrido como uma consequencia dos grupos consis-
tirem de somente 20 observacoes cada?
(f) Descreva as principais caractersticas dos dados em uma ou duas sen-
tencas.
10. O percentual de acucar e sal em 9 cereais matinais mais populares foram

medidos, com os seguintes resultados:
Cereal acucar sal

1 19 8
2 36 5
3 3 10
4 8 4
5 26 6
6 16 6
7 8 9
8 10 3
9 54 3
2.2. DEFINICAO DE PROBABILIDADE 25
Algumas operacoes com eventos serao muito uteis e sao definidas a seguir.
Para dois eventos A e B quaisquer:
1. A uniao entre eles (AB) ocorre se somente se pelo menos um deles ocorre.
Em outras palavras, se ocorre apenas o evento A, ou ocorre apenas o evento
Captulo 2 B, ou ambos ocorrem simultaneamente. Podemos dizer ainda que A ou B
ocorrem.
2. A intersecao entre eles (A B) ocorre se somente se ambos ocorrem simul-

Probabilidades taneamente, isto e, A e B ocorrem. Em particular, se A B = dizemos
que A e B sao mutuamente exclusivos.
3. Se A nao ocorre dizemos que ocorre o seu complementar, A.

Um conceito fundamental
Os metodos estatsticos para analise de dados estao associados ao conceito
Vale notar que as operacoes de intersecao e uniao sao comutativas, i.e.
de incerteza. Uma forma de quantificar o grau de incerteza (ou aleatoriedade) e
atraves do conceito de probabilidade. Neste captulo serao apresentadas definicoes A B = B A e A B = B A.
e propriedades em termos de teoria dos conjuntos.
Algumas propriedades das operacoes de uniao, intersecao e complementacao
tambem serao bastante uteis na resolucao de problemas. A seguir listamos aquelas
2.1 Experimento aleatorio mais importantes,
Qualquer experimento cujo resultado nao pode ser previsto com certeza absoluta
e chamado de experimento aleatorio. O espaco amostral e conjunto de todos os 1. A S = A, A S = S, A = e A = A.
possveis resultados de um experimento aleatorio, que aqui sera denotado por S.
2. A A = , A A = S, A A = A e A A = A.
Qualquer subconjunto A de S (i.e. A S) e chamado de evento.
Alguns exemplos de experimentos aleatorios com os respectivos espacos amos- 3. A B = A B e A B = A B.
trais e um evento associado sao os seguintes,
4. A = (A B) (A B).
1. Lancamento de uma moeda e observacao da face superior. S =
{cara, coroa}, A = {cara}.
2. Lancamento de um dado e observacao da face superior. S = {1, 2, 3, 4, 5, 6}, 2.2 Definicao de probabilidade
A = {2, 4, 6}
Seja um espaco amostral S associado a um dado experimento aleatorio. A cada
3. Contagem do numero de pecas defeituosas em um lote com 100 pecas. possvel evento A de S podemos associar um numero real, representado por P (A)
S = {0, 1, 2, . . . , 100}, A = {0, 1, . . . , 10} e denominado probabilidade do evento A, satisfazendo as seguintes propriedades,
4. Medicao do tempo de vida de um equipamento eletronico em horas. S = 1. 0 P (A) 1,

(0, ), A = (0, 100].
2. P (S) = 1,
Note que o ultimo espaco amostral e uma construcao teorica ja que na pratica
havera sempre um limite superior para o intervalo. 3. P (A1 A2 ) = P (A1 ) + P (A2 ) se A1 e A2 sao mutuamente exclusivos.
24
2.2. DEFINICAO DE PROBABILIDADE 25
Algumas operacoes com eventos serao muito uteis e sao definidas a seguir.
Para dois eventos A e B quaisquer:
1. A uniao entre eles (AB) ocorre se somente se pelo menos um deles ocorre.
Em outras palavras, se ocorre apenas o evento A, ou ocorre apenas o evento
Captulo 2 B, ou ambos ocorrem simultaneamente. Podemos dizer ainda que A ou B
ocorrem.
2. A intersecao entre eles (A B) ocorre se somente se ambos ocorrem simul-

Probabilidades taneamente, isto e, A e B ocorrem. Em particular, se A B = dizemos
que A e B sao mutuamente exclusivos.
3. Se A nao ocorre dizemos que ocorre o seu complementar, A.

Um conceito fundamental
Os metodos estatsticos para analise de dados estao associados ao conceito
Vale notar que as operacoes de intersecao e uniao sao comutativas, i.e.
de incerteza. Uma forma de quantificar o grau de incerteza (ou aleatoriedade) e
atraves do conceito de probabilidade. Neste captulo serao apresentadas definicoes A B = B A e A B = B A.
e propriedades em termos de teoria dos conjuntos.
Algumas propriedades das operacoes de uniao, intersecao e complementacao
tambem serao bastante uteis na resolucao de problemas. A seguir listamos aquelas
2.1 Experimento aleatorio mais importantes,
Qualquer experimento cujo resultado nao pode ser previsto com certeza absoluta
e chamado de experimento aleatorio. O espaco amostral e conjunto de todos os 1. A S = A, A S = S, A = e A = A.
possveis resultados de um experimento aleatorio, que aqui sera denotado por S.
2. A A = , A A = S, A A = A e A A = A.
Qualquer subconjunto A de S (i.e. A S) e chamado de evento.
Alguns exemplos de experimentos aleatorios com os respectivos espacos amos- 3. A B = A B e A B = A B.
trais e um evento associado sao os seguintes,
4. A = (A B) (A B).
1. Lancamento de uma moeda e observacao da face superior. S =
{cara, coroa}, A = {cara}.
2. Lancamento de um dado e observacao da face superior. S = {1, 2, 3, 4, 5, 6}, 2.2 Definicao de probabilidade
A = {2, 4, 6}
Seja um espaco amostral S associado a um dado experimento aleatorio. A cada
3. Contagem do numero de pecas defeituosas em um lote com 100 pecas. possvel evento A de S podemos associar um numero real, representado por P (A)
S = {0, 1, 2, . . . , 100}, A = {0, 1, . . . , 10} e denominado probabilidade do evento A, satisfazendo as seguintes propriedades,
4. Medicao do tempo de vida de um equipamento eletronico em horas. S = 1. 0 P (A) 1,

(0, ), A = (0, 100].
2. P (S) = 1,
Note que o ultimo espaco amostral e uma construcao teorica ja que na pratica
havera sempre um limite superior para o intervalo. 3. P (A1 A2 ) = P (A1 ) + P (A2 ) se A1 e A2 sao mutuamente exclusivos.
24
26 CAPITULO 2. PROBABILIDADES 2.3. PROBABILIDADE CONDICIONAL E INDEPENDENCIA 27
Esta ultima propriedade pode ser generalizada para um numero finito ou infinito A partir desta definicao obtemos a chamada regra do produto de probabilida-
de eventos mutuamente exclusivos, A1 , A2 , . . . , An , ou seja des,
P (A B) = P (A|B)P (B).
P (A1 A2 An ) = P (A1 ) + P (A2 ) + + P (An ),
Esta e chamada probabilidade conjunta dos eventos A e B e tambem pode ser
se Ai Aj = , para todo i 6= j. escrita como P (A, B). P (A) e P (B) sao chamadas probabilidades marginais dos
A partir destes axiomas outras propriedades bastante uteis podem ser obtidas, eventos A e B.
por exemplo
1. P (A) = 1 P (A) onde A e o evento complementar de A. Exemplo 2.1 : Duas bolas sao retiradas ao acaso de uma urna contendo 2 bolas
brancas (B) e 3 vermelhas (V ), sem reposicao. Neste caso os possveis resultados
2. P (A A) = 1 e P () = 0. do experimento sao {BB, BV, V B, V V } e suas probabilidades sao,
3. Se A B entao P (A) P (B). 2 1 2

P (B B) = P (B)P (B|B) = =
5 4 20
4. P (A B) = P (A) + P (B) P (A B). 2 3 6
P (B V ) = P (B)P (V |B) = =
5 4 20
3 2 6
Uma definicao mais simples de probabilidade e a chamada definicao classica. P (V B) = P (V )P (B|V ) = =
5 4 20
Neste caso a regra pratica para obter P (A) consiste em simplesmente contar o 3 2 6
numero de resultados favoraveis ao evento A e dividir pelo numero de resultados P (V V ) = P (V )P (V |V ) = = .
5 4 20
possveis do experimento. Assim,
numero de resultados favoraveis a A

P (A) = . No exemplo acima imagine agora que as retiradas sao feitas com reposicao.
numero de resultados possveis Neste caso a informacao sobre a cor da bola na primeira retirada nao altera em
No entanto esta definicao so faz sentido quando o espaco amostral e finito, de nada chances de obtermos uma bola branca na segunda retirada. Em outras pa-
modo que possamos fazer as contagens requeridas, e tambem se todos os possveis lavras, P (B|V ) = P (B|B) = P (B) e dizemos que as retiradas sao independentes.
resultados tem a mesma chance de ocorrer.
Em geral dizemos que dois eventos A e B sao independentes se e somente se
2.3 Probabilidade Condicional e Independencia P (A|B) = P (A) e P (B|A) = P (B)
Para dois eventos A e B, sendo que P (B) > 0, definimos a probabilidade condi- e isto tambem equivalente a dizer que
cional de A dado que B ocorreu como
P (A B) = P (A)P (B).
P (A B)
P (A|B) = .
P (B)
O conceito de independencia pode ser estendido a um numero qualquer de
Vale notar que todas as propriedades vistas anteriormente continuam validas
eventos, i.e.
para probabilidades condicionais. Por exemplo,
P (A1 Ak ) = P (A1 ) . . . P (Ak )
P (A | B) = 1 P (A | B). se somente se os eventos A1 , . . . , Ak forem independentes.
26 CAPITULO 2. PROBABILIDADES 2.3. PROBABILIDADE CONDICIONAL E INDEPENDENCIA 27
Esta ultima propriedade pode ser generalizada para um numero finito ou infinito A partir desta definicao obtemos a chamada regra do produto de probabilida-
de eventos mutuamente exclusivos, A1 , A2 , . . . , An , ou seja des,
P (A B) = P (A|B)P (B).
P (A1 A2 An ) = P (A1 ) + P (A2 ) + + P (An ),
Esta e chamada probabilidade conjunta dos eventos A e B e tambem pode ser
se Ai Aj = , para todo i 6= j. escrita como P (A, B). P (A) e P (B) sao chamadas probabilidades marginais dos
A partir destes axiomas outras propriedades bastante uteis podem ser obtidas, eventos A e B.
por exemplo
1. P (A) = 1 P (A) onde A e o evento complementar de A. Exemplo 2.1 : Duas bolas sao retiradas ao acaso de uma urna contendo 2 bolas
brancas (B) e 3 vermelhas (V ), sem reposicao. Neste caso os possveis resultados
2. P (A A) = 1 e P () = 0. do experimento sao {BB, BV, V B, V V } e suas probabilidades sao,
3. Se A B entao P (A) P (B). 2 1 2

P (B B) = P (B)P (B|B) = =
5 4 20
4. P (A B) = P (A) + P (B) P (A B). 2 3 6
P (B V ) = P (B)P (V |B) = =
5 4 20
3 2 6
Uma definicao mais simples de probabilidade e a chamada definicao classica. P (V B) = P (V )P (B|V ) = =
5 4 20
Neste caso a regra pratica para obter P (A) consiste em simplesmente contar o 3 2 6
numero de resultados favoraveis ao evento A e dividir pelo numero de resultados P (V V ) = P (V )P (V |V ) = = .
5 4 20
possveis do experimento. Assim,
numero de resultados favoraveis a A

P (A) = . No exemplo acima imagine agora que as retiradas sao feitas com reposicao.
numero de resultados possveis Neste caso a informacao sobre a cor da bola na primeira retirada nao altera em
No entanto esta definicao so faz sentido quando o espaco amostral e finito, de nada chances de obtermos uma bola branca na segunda retirada. Em outras pa-
modo que possamos fazer as contagens requeridas, e tambem se todos os possveis lavras, P (B|V ) = P (B|B) = P (B) e dizemos que as retiradas sao independentes.
resultados tem a mesma chance de ocorrer.
Em geral dizemos que dois eventos A e B sao independentes se e somente se
2.3 Probabilidade Condicional e Independencia P (A|B) = P (A) e P (B|A) = P (B)
Para dois eventos A e B, sendo que P (B) > 0, definimos a probabilidade condi- e isto tambem equivalente a dizer que
cional de A dado que B ocorreu como
P (A B) = P (A)P (B).
P (A B)
P (A|B) = .
P (B)
O conceito de independencia pode ser estendido a um numero qualquer de
Vale notar que todas as propriedades vistas anteriormente continuam validas
eventos, i.e.
para probabilidades condicionais. Por exemplo,
P (A1 Ak ) = P (A1 ) . . . P (Ak )
P (A | B) = 1 P (A | B). se somente se os eventos A1 , . . . , Ak forem independentes.
28 CAPITULO 2. PROBABILIDADES 2.4. TEOREMA DE BAYES 29
2.4 Teorema de Bayes Veremos uma aplicacao no exemplo a seguir.
Suponha agora que os eventos A1 , A2 , . . . , Ak sao dois a dois mutuamente ex- Exemplo 2.2 : Um medico, ao examinar uma pessoa, desconfia que ela possa
clusivos e a uniao deles e o proprio espaco amostral. Em outras palavras, um ter uma certa doenca. Baseado na sua experiencia, ele assume que a probabilidade
destes eventos necessariamente ira ocorrer porem dois deles nao podem ocorrer do paciente ter a doenca e 0,7. Para aumentar sua quantidade de informacao
simultaneamente, sobre a doenca o medico aplica um teste que tem probabilidades 0,4 e 0,95 de dar
resultado positivo em pessoas sadias e pessoas doentes respectivamente. Sabendo
A1 A2 Ak = S e Ai Aj = , i 6= j. que o teste deu positivo como fica a probabilidade da pessoa ter a doenca?
Aqui o evento de interesse e A= o paciente tem a doenca e definimos o
Entao, qualquer outro evento B pode ser escrito como
evento B= teste deu resultado positivo. Assim,
B = (B A1 ) (B A2 ) (B Ak )
P (B|A) = 0, 40 e P (B|A) = 0, 95.
sendo que estes k eventos do lado direito tambem sao mutuamente exclusivos
E bem intuitivo que a probabilidade de doenca deve ter aumentado apos este
(verifique!). Alem disso, P (B Aj ) = P (B|Aj )P (Aj ), j = 1, . . . k e portanto
resultado e a questao aqui e quantificar este aumento. Usando o teorema de
podemos escrever que
Bayes segue que
P (B) = P (B A1 ) + P (B A2 ) + + P (B Ak ) P (B|A)P (A) (0, 95)(0, 7)
= P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + + P (B|Ak )P (Ak ) P (A|B) = = = 0, 847.
P (B|A)P (A) + P (B|A)P (A) (0, 95)(0, 7) + (0, 40)(0, 30)
Xk
= P (B|Aj )P (Aj ).
j=1 Exemplo 2.3 : No Exemplo 2.1 suponha que foram retiradas 2 bolas brancas
mas nao sabemos se as retiradas foram com ou sem reposicao. Definindo o evento
O fato e que em muitas aplicacoes conhecemos as probabilidades do lado
A=retiradas com reposicao gostariamos de calcular a probabilidade de A a luz
direito desta igualdade e estaremos interessados em calcular a probabilidade de
do resultado do experimento (B B). Suponha que antes do sorteio nao temos
um dos eventos Ai ocorrer dado que B ocorreu, isto e
informacao sobre o tipo de experimento (com ou sem reposicao) e atribuimos a
P (Ai B) P (B|Ai)P (Ai ) probabilidade a priori P (A) = 0, 5. Usando o Teorema de Bayes obtemos que
P (Ai|B) = = Pk .
P (B) j=1 P (B|Aj )P (Aj ) P (BB|A)P (A)
P (A|BB) =
Chamamos esta ultima igualdade de teorema de Bayes ou regra de Bayes, que nos P (BB|A)P (A) + P (BB|A)P (A)
mostra como atualizar a nossa crenca no evento Ai apos receber novas informacoes 0, 16 0, 5
= = 0, 615.
(i.e. que B ocorreu). 0, 16 0, 5 + 0, 1 0, 5
Assim, e mais provavel agora (a posteriori) que o experimento tenha sido com
P (Ai ) e a probabilidade a priori do evento Ai , porque antecede a informacao
reposicao.
sobre o evento B.
P (Ai |B) e a probabilidade a posteriori do evento Ai porque e calculada Em muitas situacoes podemos estar interessados em comparar probabilidades
apos termos informacao sobre B. a posteriori atraves da razao
P (Ai |B)
,
Para um valor especfico de B, P (B|Ai) e chamada funcao de verossimi- P (Aj |B)
lhanca de Ai . ou seja, quanto o evento Ai e mais provavel do que o evento Aj apos observar o
28 CAPITULO 2. PROBABILIDADES 2.4. TEOREMA DE BAYES 29
2.4 Teorema de Bayes Veremos uma aplicacao no exemplo a seguir.
Suponha agora que os eventos A1 , A2 , . . . , Ak sao dois a dois mutuamente ex- Exemplo 2.2 : Um medico, ao examinar uma pessoa, desconfia que ela possa
clusivos e a uniao deles e o proprio espaco amostral. Em outras palavras, um ter uma certa doenca. Baseado na sua experiencia, ele assume que a probabilidade
destes eventos necessariamente ira ocorrer porem dois deles nao podem ocorrer do paciente ter a doenca e 0,7. Para aumentar sua quantidade de informacao
simultaneamente, sobre a doenca o medico aplica um teste que tem probabilidades 0,4 e 0,95 de dar
resultado positivo em pessoas sadias e pessoas doentes respectivamente. Sabendo
A1 A2 Ak = S e Ai Aj = , i 6= j. que o teste deu positivo como fica a probabilidade da pessoa ter a doenca?
Aqui o evento de interesse e A= o paciente tem a doenca e definimos o
Entao, qualquer outro evento B pode ser escrito como
evento B= teste deu resultado positivo. Assim,
B = (B A1 ) (B A2 ) (B Ak )
P (B|A) = 0, 40 e P (B|A) = 0, 95.
sendo que estes k eventos do lado direito tambem sao mutuamente exclusivos
E bem intuitivo que a probabilidade de doenca deve ter aumentado apos este
(verifique!). Alem disso, P (B Aj ) = P (B|Aj )P (Aj ), j = 1, . . . k e portanto
resultado e a questao aqui e quantificar este aumento. Usando o teorema de
podemos escrever que
Bayes segue que
P (B) = P (B A1 ) + P (B A2 ) + + P (B Ak ) P (B|A)P (A) (0, 95)(0, 7)
= P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + + P (B|Ak )P (Ak ) P (A|B) = = = 0, 847.
P (B|A)P (A) + P (B|A)P (A) (0, 95)(0, 7) + (0, 40)(0, 30)
Xk
= P (B|Aj )P (Aj ).
j=1 Exemplo 2.3 : No Exemplo 2.1 suponha que foram retiradas 2 bolas brancas
mas nao sabemos se as retiradas foram com ou sem reposicao. Definindo o evento
O fato e que em muitas aplicacoes conhecemos as probabilidades do lado
A=retiradas com reposicao gostariamos de calcular a probabilidade de A a luz
direito desta igualdade e estaremos interessados em calcular a probabilidade de
do resultado do experimento (B B). Suponha que antes do sorteio nao temos
um dos eventos Ai ocorrer dado que B ocorreu, isto e
informacao sobre o tipo de experimento (com ou sem reposicao) e atribuimos a
P (Ai B) P (B|Ai)P (Ai ) probabilidade a priori P (A) = 0, 5. Usando o Teorema de Bayes obtemos que
P (Ai|B) = = Pk .
P (B) j=1 P (B|Aj )P (Aj ) P (BB|A)P (A)
P (A|BB) =
Chamamos esta ultima igualdade de teorema de Bayes ou regra de Bayes, que nos P (BB|A)P (A) + P (BB|A)P (A)
mostra como atualizar a nossa crenca no evento Ai apos receber novas informacoes 0, 16 0, 5
= = 0, 615.
(i.e. que B ocorreu). 0, 16 0, 5 + 0, 1 0, 5
Assim, e mais provavel agora (a posteriori) que o experimento tenha sido com
P (Ai ) e a probabilidade a priori do evento Ai , porque antecede a informacao
reposicao.
sobre o evento B.
P (Ai |B) e a probabilidade a posteriori do evento Ai porque e calculada Em muitas situacoes podemos estar interessados em comparar probabilidades
apos termos informacao sobre B. a posteriori atraves da razao
P (Ai |B)
,
Para um valor especfico de B, P (B|Ai) e chamada funcao de verossimi- P (Aj |B)
lhanca de Ai . ou seja, quanto o evento Ai e mais provavel do que o evento Aj apos observar o
30 CAPITULO 2. PROBABILIDADES 2.5. PROBLEMAS 31
evento B? Aplicando o teorema de Bayes ao numerador e denominador e notando Area

que P (B) se cancela obtemos que Sexo Biologicas Exatas Sociais
masculino 50 58 54
P (Ai |B) P (B|Ai ) P (Ai ) feminino 43 34 90
= .
P (Aj |B) P (B|Aj ) P (Aj )
| {z } | {z } | {z }
razao de chances fator de Bayes razao de chances
(a) a probabilidade de que seja do sexo feminino e das ciencias sociais.
a posteriori a priori
(b) a probabilidade de que seja do sexo masculino e nao seja das ciencias
No Exemplo 2.2, ter a doenca era 2,33 vezes mais provavel do que nao ter a biologicas.
doenca antes de realizar o teste. Apos realizar o teste e obter resultado positivo,
(c) a probabilidade de que seja do sexo masculino dado que e da area de
o fator de Bayes indicou que ter a doenca era 2,375 vezes mais plausvel do que
exatas.
nao ter. Combinando estas duas informacoes conclui-se que ter a doenca ficou
5,54 vezes mais provavel a posteriori. 5. Considere o lancamento de dois dados e os seguintes eventos A: soma dos
No exemplo 2.3 temos que numeros obtidos igual a 6 e B: numero obtido no primeiro dado maior ou
igual a 3.
P (A|BB) 0, 615
= = 1, 597
P (A|BB) 1 0, 615 (a) Enumere os elementos de A e B.
ou seja, e 1,597 mais provavel que o experimento tenha sido com reposicao. (b) Obtenha A B, A B e B.
(c) Calcule as probabilidades dos eventos no item anterior.
2.5 Problemas 6. Dois dados sao lancados e observa-se S, a soma dos valores obtidos nas
faces.
1. Sejam os eventos S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}, A = {1, 2, 3, 4, 5}, B =
{2, 3, 5, 6} e {3, 4, 5, 6}. Obtenha A, A B, A C, A B, e A B. (a) Calcule a probabilidade da soma ser menor do que 8 sabendo que e
2. Sejam os eventos A1 , . . . , Ak tais que A1 Ak = S e Ai Aj = , um numero mpar.
i 6= j. Para um evento B qualquer verifique que B Ai sao mutuamente (b) Os dados sao lancados ate que se obtenha soma 7 ou 8. Calcule a
exclusivos. probabilidade do evento A = {S = 7} sabendo que o experimento
terminou.
3. Duas moedas sao lancadas. Escreva o espaco amostral para este experi-
mento e liste os seguintes eventos, 7. Dois eventos independentes A e B ocorrem com probabilidades p e q, res-
pectivamente. Qual a probabilidade de que
(a) pelo menos duas caras
(b) exatamente duas caras (a) nenhum destes eventos ocorra?
(c) o complementar do item anterior (b) pelo menos um destes eventos ocorra?
Agora calcule as probabilidades dos eventos acima. 8. Dois eventos independentes A e B sao tais que P (A) = 0, 4, P (B) = p e
P (A B) = 0, 7. Para que valores de p os eventos serao:
4. Suponha que 300 estudantes de uma universidade foram classificados o sexo
e sua area de estudo. Obteve-se a distribuicao de frequencias abaixo. (a) mutuamente exclusivos,
Se um estudante for selecionado ao acaso calcule, (b) independentes.
evento B? Aplicando o teorema de Bayes ao numerador e denominador e notando Area

que P (B) se cancela obtemos que Sexo Biologicas Exatas Sociais
masculino 50 58 54
P (Ai |B) P (B|Ai ) P (Ai ) feminino 43 34 90
= .
P (Aj |B) P (B|Aj ) P (Aj )
| {z } | {z } | {z }
razao de chances fator de Bayes razao de chances
(a) a probabilidade de que seja do sexo feminino e das ciencias sociais.
a posteriori a priori
(b) a probabilidade de que seja do sexo masculino e nao seja das ciencias
No Exemplo 2.2, ter a doenca era 2,33 vezes mais provavel do que nao ter a biologicas.
doenca antes de realizar o teste. Apos realizar o teste e obter resultado positivo,
(c) a probabilidade de que seja do sexo masculino dado que e da area de
o fator de Bayes indicou que ter a doenca era 2,375 vezes mais plausvel do que
exatas.
nao ter. Combinando estas duas informacoes conclui-se que ter a doenca ficou
5,54 vezes mais provavel a posteriori. 5. Considere o lancamento de dois dados e os seguintes eventos A: soma dos
No exemplo 2.3 temos que numeros obtidos igual a 6 e B: numero obtido no primeiro dado maior ou
igual a 3.
P (A|BB) 0, 615
= = 1, 597
P (A|BB) 1 0, 615 (a) Enumere os elementos de A e B.
ou seja, e 1,597 mais provavel que o experimento tenha sido com reposicao. (b) Obtenha A B, A B e B.
(c) Calcule as probabilidades dos eventos no item anterior.
2.5 Problemas 6. Dois dados sao lancados e observa-se S, a soma dos valores obtidos nas
faces.
1. Sejam os eventos S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}, A = {1, 2, 3, 4, 5}, B =
{2, 3, 5, 6} e {3, 4, 5, 6}. Obtenha A, A B, A C, A B, e A B. (a) Calcule a probabilidade da soma ser menor do que 8 sabendo que e
2. Sejam os eventos A1 , . . . , Ak tais que A1 Ak = S e Ai Aj = , um numero mpar.
i 6= j. Para um evento B qualquer verifique que B Ai sao mutuamente (b) Os dados sao lancados ate que se obtenha soma 7 ou 8. Calcule a
exclusivos. probabilidade do evento A = {S = 7} sabendo que o experimento
terminou.
3. Duas moedas sao lancadas. Escreva o espaco amostral para este experi-
mento e liste os seguintes eventos, 7. Dois eventos independentes A e B ocorrem com probabilidades p e q, res-
pectivamente. Qual a probabilidade de que
(a) pelo menos duas caras
(b) exatamente duas caras (a) nenhum destes eventos ocorra?
(c) o complementar do item anterior (b) pelo menos um destes eventos ocorra?
Agora calcule as probabilidades dos eventos acima. 8. Dois eventos independentes A e B sao tais que P (A) = 0, 4, P (B) = p e
P (A B) = 0, 7. Para que valores de p os eventos serao:
4. Suponha que 300 estudantes de uma universidade foram classificados o sexo
e sua area de estudo. Obteve-se a distribuicao de frequencias abaixo. (a) mutuamente exclusivos,
Se um estudante for selecionado ao acaso calcule, (b) independentes.
32 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 33
9. Duas maquinas operam de forma independente em uma linha de producao. 15. Um componente eletronico esta sendo testado e sabe-se que ele pode ter
Em um perodo de 8 horas as probabilidades de que cada uma delas apre- sido produzido por maquinas do tipo I, II ou III com probabilidades 0,35,
sente defeito sao 1/3 e 1/4. Qual a probabilidade de que pelo menos uma 0,25 e 0,40 respectivamente. Sabe-se tambem que as probabilidades deste
das maquinas apresente defeito neste perodo? componente ser defeituoso sao 0,01, 0,02 e 0,03 respectivamente para cada
tipo de maquina. Calcule a probabilidade deste componente eletronico
10. Um dado e viciado de tal forma que a probabilidade de sair uma face e
proporcional ao seu valor, i.e. P (face x) x. Calcular: (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Qual a probabilidade deste componente eletronico nao ter sido fabri-
(a) A probabilidade de sair 5, sabendo-se que a face que saiu e mpar.
cada por uma maquina do tipo I?
(b) A probabilidade de sair um numero par, sabendo-se que saiu um
(c) Qual a probabilidade dele ser defeituoso?
numero maior que 3.
(d) Qual a probabilidade dele ter sido fabricado por uma maquina do tipo
11. Expresse as seguintes afirmacoes em termos de operacoes entre eventos. II sabendo-se que e defeituoso?
(a) A ocorre mas B nao ocorre. 16. Uma empresa de credito precisa saber como a inadimplencia esta distribuda
(b) Exatamente um dos eventos A e B ocorre. entre seus clentes. Sabe-se que um cliente pode pertencer a uma de 4 clas-
ses distintas com probabilidades 0,50, 0,20, 0,20 e 0,10 respectivamente.
(c) Nenhum dos dois eventos ocorre. Para cada uma destas classes as probabilidade de um cliente estar inadim-
(d) No maximo um deles ocorre. plente sao 0,30, 0,10, 0,05 e 0,05 respectivamente. Um cliente e sorteado
aleatoriamente.
12. Se A e B sao eventos independentes mostre que tambem sao independentes
A e B, A e B, A e B. (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Calcule a probabilidade de pertencer as classes A ou B.
13. Se A, B e C sao eventos independentes verifique se
(c) Calcule a probabilidade de estar inadimplente e pertencer a classe A.
(a) A e B C sao independentes,
(d) Qual a probabilidade dele estar inadimplente ?
(b) A B e A C sao independentes. (e) Sabendo que ele esta inadimplente, qual a probabilidade dele pertencer
14. Um medico, ao examinar uma pessoa, desconfia que ela possa ter uma a classe B?
certa doenca e assume que a probabilidade do paciente ter a doenca e 0,7. 17. Sejam duas moedas, uma honesta e a outra com 2 caras. Uma destas
Para aumentar sua quantidade de informacao o medico aplica um teste, que moedas foi sorteada e lancada.
da resultado positivo em 40% das pessoas sadias e em 95% das pessoas com
esta doenca. (a) Se o resultado foi cara, qual a probabilidade de ter sido usada a moeda
honesta?
(a) Qual a probabilidade do teste dar resultado positivo?
(b) A moeda selecionada foi lancada novamente e o resultado foi cara.
(b) Sabendo-se que o teste deu resultado positivo qual a probabilidade Qual a probabilidade de ser a moeda honesta?
desta pessoa estar doente?
(c) Foi aplicado um segundo teste que da resultado positivo com pro-
2.6 Algumas distribuicoes de probabilidade
babilidades 0,04 e 0,98 em pessoas sadias e doentes respectivamente.
Calcule a probabilidade deste teste dar positivo e a probabilidade de Nesta secao estudaremos alguns modelos teoricos que se adequam a uma serie
doenca sabendo que ele deu negativo. de problemas praticos. Veremos que estes modelos envolvem parametros cujo
9. Duas maquinas operam de forma independente em uma linha de producao. 15. Um componente eletronico esta sendo testado e sabe-se que ele pode ter
Em um perodo de 8 horas as probabilidades de que cada uma delas apre- sido produzido por maquinas do tipo I, II ou III com probabilidades 0,35,
sente defeito sao 1/3 e 1/4. Qual a probabilidade de que pelo menos uma 0,25 e 0,40 respectivamente. Sabe-se tambem que as probabilidades deste
das maquinas apresente defeito neste perodo? componente ser defeituoso sao 0,01, 0,02 e 0,03 respectivamente para cada
tipo de maquina. Calcule a probabilidade deste componente eletronico
10. Um dado e viciado de tal forma que a probabilidade de sair uma face e
proporcional ao seu valor, i.e. P (face x) x. Calcular: (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Qual a probabilidade deste componente eletronico nao ter sido fabri-
(a) A probabilidade de sair 5, sabendo-se que a face que saiu e mpar.
cada por uma maquina do tipo I?
(b) A probabilidade de sair um numero par, sabendo-se que saiu um
(c) Qual a probabilidade dele ser defeituoso?
numero maior que 3.
(d) Qual a probabilidade dele ter sido fabricado por uma maquina do tipo
11. Expresse as seguintes afirmacoes em termos de operacoes entre eventos. II sabendo-se que e defeituoso?
(a) A ocorre mas B nao ocorre. 16. Uma empresa de credito precisa saber como a inadimplencia esta distribuda
(b) Exatamente um dos eventos A e B ocorre. entre seus clentes. Sabe-se que um cliente pode pertencer a uma de 4 clas-
ses distintas com probabilidades 0,50, 0,20, 0,20 e 0,10 respectivamente.
(c) Nenhum dos dois eventos ocorre. Para cada uma destas classes as probabilidade de um cliente estar inadim-
(d) No maximo um deles ocorre. plente sao 0,30, 0,10, 0,05 e 0,05 respectivamente. Um cliente e sorteado
aleatoriamente.
12. Se A e B sao eventos independentes mostre que tambem sao independentes
A e B, A e B, A e B. (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Calcule a probabilidade de pertencer as classes A ou B.
13. Se A, B e C sao eventos independentes verifique se
(c) Calcule a probabilidade de estar inadimplente e pertencer a classe A.
(a) A e B C sao independentes,
(d) Qual a probabilidade dele estar inadimplente ?
(b) A B e A C sao independentes. (e) Sabendo que ele esta inadimplente, qual a probabilidade dele pertencer
14. Um medico, ao examinar uma pessoa, desconfia que ela possa ter uma a classe B?
certa doenca e assume que a probabilidade do paciente ter a doenca e 0,7. 17. Sejam duas moedas, uma honesta e a outra com 2 caras. Uma destas
Para aumentar sua quantidade de informacao o medico aplica um teste, que moedas foi sorteada e lancada.
da resultado positivo em 40% das pessoas sadias e em 95% das pessoas com
esta doenca. (a) Se o resultado foi cara, qual a probabilidade de ter sido usada a moeda
honesta?
(a) Qual a probabilidade do teste dar resultado positivo?
(b) A moeda selecionada foi lancada novamente e o resultado foi cara.
(b) Sabendo-se que o teste deu resultado positivo qual a probabilidade Qual a probabilidade de ser a moeda honesta?
desta pessoa estar doente?
(c) Foi aplicado um segundo teste que da resultado positivo com pro-
2.6 Algumas distribuicoes de probabilidade
babilidades 0,04 e 0,98 em pessoas sadias e doentes respectivamente.
Calcule a probabilidade deste teste dar positivo e a probabilidade de Nesta secao estudaremos alguns modelos teoricos que se adequam a uma serie
doenca sabendo que ele deu negativo. de problemas praticos. Veremos que estes modelos envolvem parametros cujo
conhecimento e necessario para calcular probabilidades. Vale notar que na maio- Dizemos que X tem distribuicao de Bernoulli com parametro p ou equivalente-
ria dos problemas reais estes parametros serao desconhecidos e sera preciso fazer mente X Bernoulli(p), 0 < p < 1.
algum tipo de inferencia sobre eles, e este assunto sera abordado no proximo
captulo. Por enquanto vamos assumir que estes parametros sao conhecidos e nos Suponha agora que n experimentos (ou ensaios) independentes, sao executa-
concentrar nas principais caractersticas dos modelos apresentados. dos, onde n e um numero fixo, e que cada experimento resulta num sucesso com
probabilidade p ou numa falha com probabilidade 1 p. Ou seja, o experimento
consiste na observacao das v.a. X1 , . . . , Xn onde Xi Bernoulli(p), i = 1, . . . , n.
2.6.1 A distribuicao Uniforme Discreta
Frequentemente estaremos interessados no numero total de sucessos obtidos,
Suponha um experimento com um numero finito de possveis resultados e cada um independente da ordem em que eles ocorrem. Por exemplo, uma moeda e lancada
deles com a mesma probabilidade de ocorrer. Definindo uma variavel aleatoria 10 vezes e o numero total de caras e contado (aqui cara e um sucesso).
(v.a) X cujos possveis valores {x1 , . . . , xk } estao associados aos resultados deste Pn
experimento, entao O numero total de sucessos, Y = i=1 Xi , cujos possveis valores sao
1 0, 1, . . . , n e uma variavel aleatoria com distribuicao binomial com parametros
P (X = xi ) = , i = 1, . . . , k.
k n e p, ou Y Binomial(n, p). As probabilidades de cada um destes possveis
P valores sao dadas por
O valor medio (ou valor esperado) e E(X) = (1/k) ki=1 xi e sua variancia e

k k n k
1X 1X 2 P (Y = k) = p (1 p)nk , k = 0, 1, . . . , n (2.1)
V ar(X) = [xi E(X)]2 = [ x kE(X)2 ] k
k i=1 k i=1 i
sendo
n n!
=
2.6.2 A distribuicao Binomial k k!(n k)!
Q
e m! = m i=1 i e o fatorial de m (define-se 0! = 1). Alem disso, o numero medio (ou
Em muitos experimentos os possveis resultados apresentam ou nao uma deter-
esperado) de sucessos e E(Y ) = np e a variancia e V ar(Y ) = np(1p). Na Figura
minada caracterstica. Esta caracterstica sera muitas vezes determinada pelo
2.1 estao representadas graficamente distribuicoes Binomiais com probabilidades
pesquisador dependendo dos objetivos do experimento. Por exemplo, se uma
de sucesso p=0,2, 0,5, 0,7 e 0,9. Note como a distribuicao e simetrica em torno
pessoa for escolhida ao acaso dentre 1000 podemos estar interessados apenas se
da media quando p = 1/2 e e assimetrica para os outros valores de p.
ela e do sexo masculino ou nao. Neste tipo de experimento estaremos interessados
na ocorrencia de um sucesso ou falha e esta terminologia sera utilizada daqui em
diante. E usual denotar a probabilidade de sucesso por p, isto e P (sucesso) = p Exemplo 2.4 : Em uma linha de montagem estima-se que a proporcao de itens
e portanto P (fracasso) = 1 p. defeituosos e aproximadamente 0,1. Se esta proporcao e (aproximadamente) cons-
Podemos definir uma variavel aleatoria (v.a) X como a variavel indicadora de tante ao longo do processo e 20 itens sao selecionados de forma independente
sucesso em um experimento binario, i.e. entao o numero medio ou esperado de defeituosos e 2 com variancia 1,8 itens2 .
Definindo a v.a. Y : numero de itens defeituosos podemos calcular por exemplo
1, se ocorre sucesso
X= a probabilidade de no maximo 2 itens defeituosos como
0, se ocorre fracasso
P (Y 2) = P (Y = 0) + P (Y = 1) + P (Y = 2)
e a probabilidade de X assumir cada um dos seus possveis valores e
20 20 20
= 0, 10 0, 920 + 0, 11 0, 919 + 0, 12 0, 918
px (1 p)1x se x = 0, 1 0 1 2
P (X = x) = = 0, 1216 + 0, 2702 + 0, 2852 = 0, 677.
0 caso contrario.
conhecimento e necessario para calcular probabilidades. Vale notar que na maio- Dizemos que X tem distribuicao de Bernoulli com parametro p ou equivalente-
ria dos problemas reais estes parametros serao desconhecidos e sera preciso fazer mente X Bernoulli(p), 0 < p < 1.
algum tipo de inferencia sobre eles, e este assunto sera abordado no proximo
captulo. Por enquanto vamos assumir que estes parametros sao conhecidos e nos Suponha agora que n experimentos (ou ensaios) independentes, sao executa-
concentrar nas principais caractersticas dos modelos apresentados. dos, onde n e um numero fixo, e que cada experimento resulta num sucesso com
probabilidade p ou numa falha com probabilidade 1 p. Ou seja, o experimento
consiste na observacao das v.a. X1 , . . . , Xn onde Xi Bernoulli(p), i = 1, . . . , n.
2.6.1 A distribuicao Uniforme Discreta
Frequentemente estaremos interessados no numero total de sucessos obtidos,
Suponha um experimento com um numero finito de possveis resultados e cada um independente da ordem em que eles ocorrem. Por exemplo, uma moeda e lancada
deles com a mesma probabilidade de ocorrer. Definindo uma variavel aleatoria 10 vezes e o numero total de caras e contado (aqui cara e um sucesso).
(v.a) X cujos possveis valores {x1 , . . . , xk } estao associados aos resultados deste Pn
experimento, entao O numero total de sucessos, Y = i=1 Xi , cujos possveis valores sao
1 0, 1, . . . , n e uma variavel aleatoria com distribuicao binomial com parametros
P (X = xi ) = , i = 1, . . . , k.
k n e p, ou Y Binomial(n, p). As probabilidades de cada um destes possveis
P valores sao dadas por
O valor medio (ou valor esperado) e E(X) = (1/k) ki=1 xi e sua variancia e

k k n k
1X 1X 2 P (Y = k) = p (1 p)nk , k = 0, 1, . . . , n (2.1)
V ar(X) = [xi E(X)]2 = [ x kE(X)2 ] k
k i=1 k i=1 i
sendo
n n!
=
2.6.2 A distribuicao Binomial k k!(n k)!
Q
e m! = m i=1 i e o fatorial de m (define-se 0! = 1). Alem disso, o numero medio (ou
Em muitos experimentos os possveis resultados apresentam ou nao uma deter-
esperado) de sucessos e E(Y ) = np e a variancia e V ar(Y ) = np(1p). Na Figura
minada caracterstica. Esta caracterstica sera muitas vezes determinada pelo
2.1 estao representadas graficamente distribuicoes Binomiais com probabilidades
pesquisador dependendo dos objetivos do experimento. Por exemplo, se uma
de sucesso p=0,2, 0,5, 0,7 e 0,9. Note como a distribuicao e simetrica em torno
pessoa for escolhida ao acaso dentre 1000 podemos estar interessados apenas se
da media quando p = 1/2 e e assimetrica para os outros valores de p.
ela e do sexo masculino ou nao. Neste tipo de experimento estaremos interessados
na ocorrencia de um sucesso ou falha e esta terminologia sera utilizada daqui em
diante. E usual denotar a probabilidade de sucesso por p, isto e P (sucesso) = p Exemplo 2.4 : Em uma linha de montagem estima-se que a proporcao de itens
e portanto P (fracasso) = 1 p. defeituosos e aproximadamente 0,1. Se esta proporcao e (aproximadamente) cons-
Podemos definir uma variavel aleatoria (v.a) X como a variavel indicadora de tante ao longo do processo e 20 itens sao selecionados de forma independente
sucesso em um experimento binario, i.e. entao o numero medio ou esperado de defeituosos e 2 com variancia 1,8 itens2 .
Definindo a v.a. Y : numero de itens defeituosos podemos calcular por exemplo
1, se ocorre sucesso
X= a probabilidade de no maximo 2 itens defeituosos como
0, se ocorre fracasso
P (Y 2) = P (Y = 0) + P (Y = 1) + P (Y = 2)
e a probabilidade de X assumir cada um dos seus possveis valores e
20 20 20
= 0, 10 0, 920 + 0, 11 0, 919 + 0, 12 0, 918
px (1 p)1x se x = 0, 1 0 1 2
P (X = x) = = 0, 1216 + 0, 2702 + 0, 2852 = 0, 677.
0 caso contrario.
2.6.3 A distribuicao de Poisson tempo. Portanto, para 10 intervalos a probabilidade sera 0, 676710 = 0, 0201.
Um outro modelo bastante utilizado em aplicacoes praticas e a distribuicao de

Poisson. Ela e frequentemente usada para modelar dados de contagem, i.e. o A distribuicao de Poisson tambem pode ser vista como uma aproximacao para
numero de ocorrencias de um certo fenomeno, durante um intervalo fixo de tempo a distribuicao binomial quando n e grande e p e pequeno. Assim, intuitivamente
ou regiao fixa do espaco. Alguns exemplos sao: o numero de chamadas recebidas podemos dizer que a distribuicao de Poisson pode ser usada no estudo de eventos
por uma central telefonica durante uma hora, o numero de defeitos por unidade raros, i.e. com pequena probabilidade de ocorrencia, quando o experimento e
de comprimento de uma fita magnetica, o numero de nmetoides encontrados por repetido um numero grande de vezes. Neste caso o numero medio de ocorrencias
unidade de superfcie de solo, o numero diario de novos casos de cancer de mama, e = np. Na pratica esta aproximacao e geralmente utilizada quando n 50 e
etc. np < 5.
Neste caso, o numero de ocorrencias X por intervalo fixo (de tempo ou espaco)
tem distribuicao de Poisson e a probabilidade de exatamente k ocorrencias e dada
por Exemplo 2.6 : Sabe-se que a proporcao de pessoas com uma certa doenca em
k e uma populacao e 0,01. Em uma amostra aleatoria de 200 pessoas qual a proba-
P (X = k) = , > 0, k = 0, 1, . . . . (2.2)
k! bilidade de que pelo menos 4 delas tenham esta doenca?
sendo e a base do logaritmo natural (e = 2, 71828 . . . ).
A constante (que e sempre positiva) pode ser interpretada como o numero Podemos assumir que a distribuicao exata do numero X de pessoas com a
esperado (ou numero medio) de ocorrencias por unidade de tempo ou espaco. doenca dentre estas 200 e binomial com parametros n = 200 e p = 0, 01. Como
Assim, a media de uma variavel aleatoria com distribuicao de Poisson e igual a n > 50 e np = 2 < 5 podemos aproxima-la pela distribuicao de Poisson com
e pode-se mostrar que a variancia e igual a sua media, parametro = np = 2. Neste caso a probabilidade pedida e

X
E(X) = V ar(X) = . P (X 4) = P (X = k) = 1 P (X < 4)
k=4
Na Figura 2.2 estao representadas graficamente distribuicoes de Poisson com = 1 [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
media =1, 2, 5 e 15. 0 2
2e 21 e2 22 e2 23 e2
= 1 + + +
0! 1! 2! 3!
Exemplo 2.5 : O numero de partculas radioativas emitidas em cada intervalo = 1 (0, 1353 + 0, 2707 + 0, 2707 + 0, 1804) = 0, 1428.
de 5 segundos tem distribuicao de Poisson e sabe-se que em media 2 partculas
sao emitidas por intervalo. Se forem observados 10 intervalos de tempo qual a Note que P (X 4) e uma soma infinita e foi mais facil calcular a probabilidade
probabilidade de que em cada um deles menos de 3 partculas sejam emitidas? do complementar.
Neste caso, podemos definir a v.a. X como o numero de partculas emitidas
por intervalo sendo que o numero medio de emissoes e =2. Portanto X tem Finalmente, uma propriedade importante e que se temos n v.a. X1 , . . . , Xn
distribuicao de Poisson com parametro igual a 2 e queremos calcular P (X < 3). independentes e cada uma delas com distribuicao Poisson() entao
Mas,
X = X1 + + Xn P oisson(n)
20 e2 21 e2 22 e2
P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = + +
0! 1! 2! e
= 0, 1351 + 0, 2707 + 0, 2707 = 0, 6767. X1 + + X n
X=
n
Esta e a probabilidade de emissao de menos de 3 partculas em um intervalo de tem media igual a e vriancia igual a /n.
2.6.3 A distribuicao de Poisson tempo. Portanto, para 10 intervalos a probabilidade sera 0, 676710 = 0, 0201.
Um outro modelo bastante utilizado em aplicacoes praticas e a distribuicao de

Poisson. Ela e frequentemente usada para modelar dados de contagem, i.e. o A distribuicao de Poisson tambem pode ser vista como uma aproximacao para
numero de ocorrencias de um certo fenomeno, durante um intervalo fixo de tempo a distribuicao binomial quando n e grande e p e pequeno. Assim, intuitivamente
ou regiao fixa do espaco. Alguns exemplos sao: o numero de chamadas recebidas podemos dizer que a distribuicao de Poisson pode ser usada no estudo de eventos
por uma central telefonica durante uma hora, o numero de defeitos por unidade raros, i.e. com pequena probabilidade de ocorrencia, quando o experimento e
de comprimento de uma fita magnetica, o numero de nmetoides encontrados por repetido um numero grande de vezes. Neste caso o numero medio de ocorrencias
unidade de superfcie de solo, o numero diario de novos casos de cancer de mama, e = np. Na pratica esta aproximacao e geralmente utilizada quando n 50 e
etc. np < 5.
Neste caso, o numero de ocorrencias X por intervalo fixo (de tempo ou espaco)
tem distribuicao de Poisson e a probabilidade de exatamente k ocorrencias e dada
por Exemplo 2.6 : Sabe-se que a proporcao de pessoas com uma certa doenca em
k e uma populacao e 0,01. Em uma amostra aleatoria de 200 pessoas qual a proba-
P (X = k) = , > 0, k = 0, 1, . . . . (2.2)
k! bilidade de que pelo menos 4 delas tenham esta doenca?
sendo e a base do logaritmo natural (e = 2, 71828 . . . ).
A constante (que e sempre positiva) pode ser interpretada como o numero Podemos assumir que a distribuicao exata do numero X de pessoas com a
esperado (ou numero medio) de ocorrencias por unidade de tempo ou espaco. doenca dentre estas 200 e binomial com parametros n = 200 e p = 0, 01. Como
Assim, a media de uma variavel aleatoria com distribuicao de Poisson e igual a n > 50 e np = 2 < 5 podemos aproxima-la pela distribuicao de Poisson com
e pode-se mostrar que a variancia e igual a sua media, parametro = np = 2. Neste caso a probabilidade pedida e

X
E(X) = V ar(X) = . P (X 4) = P (X = k) = 1 P (X < 4)
k=4
Na Figura 2.2 estao representadas graficamente distribuicoes de Poisson com = 1 [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
media =1, 2, 5 e 15. 0 2
2e 21 e2 22 e2 23 e2
= 1 + + +
0! 1! 2! 3!
Exemplo 2.5 : O numero de partculas radioativas emitidas em cada intervalo = 1 (0, 1353 + 0, 2707 + 0, 2707 + 0, 1804) = 0, 1428.
de 5 segundos tem distribuicao de Poisson e sabe-se que em media 2 partculas
sao emitidas por intervalo. Se forem observados 10 intervalos de tempo qual a Note que P (X 4) e uma soma infinita e foi mais facil calcular a probabilidade
probabilidade de que em cada um deles menos de 3 partculas sejam emitidas? do complementar.
Neste caso, podemos definir a v.a. X como o numero de partculas emitidas
por intervalo sendo que o numero medio de emissoes e =2. Portanto X tem Finalmente, uma propriedade importante e que se temos n v.a. X1 , . . . , Xn
distribuicao de Poisson com parametro igual a 2 e queremos calcular P (X < 3). independentes e cada uma delas com distribuicao Poisson() entao
Mas,
X = X1 + + Xn P oisson(n)
20 e2 21 e2 22 e2
P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = + +
0! 1! 2! e
= 0, 1351 + 0, 2707 + 0, 2707 = 0, 6767. X1 + + X n
X=
n
Esta e a probabilidade de emissao de menos de 3 partculas em um intervalo de tem media igual a e vriancia igual a /n.
2.6.4 Distribuicao Geometrica para um conjunto A qualquer. Para distribuicoes discretas de probabilidade
tambem e sempre possvel mostrar que
A distribuicao geometrica tambem esta relacionada a experimentos dicotomicos X
P (X = k) = 1.
realizados de forma independente e com a mesma probabilidade de sucesso. O
k
evento de interesse neste caso e o numero de experimentos X necessarios para a
ocorrencia do primeiro sucesso. Por exemplo o numero de inspecoes necessarias As definicoes de valor esperado (ou valor medio) e variancia tambem podem
ate encontrar-se um item defeituoso em um lote. ser generalizados para qualquer v.a. discreta X. Usaremos a seguinte notacao,
A probabilidade de que exatamente k experimentos sejam necessarios ate a X
E(X) = X = kP (X = k)
ocorrencia do primeiro sucesso e dada por
k
X
2
P (X = k) = (1 p) k1
p, k = 1, 2, . . . . V ar(X) = X = P (X = k) (k X )2
k
Tambem pode-se mostrar que o numero medio de repeticoes do experimento para valor medio e variancia respectivamente. O equivalente teorico ao conceito
ate ocorrer o primeiro sucesso e E(X) = (1 p)/p e a variancia e V ar(X) = de frequencias acumuladas vistas no Captulo 1 e a funcao de distribuicao acu-
(1 p)/p2 = E(X)/p. Ou seja, quanto menor a probabilidade de sucesso menor mulada ou simplesmente funcao de distribuicao definida como,
sera o numero esperado de repeticoes para que ele ocorra. X
F (x) = P (X x) = P (X = k), x R
kx
Exemplo 2.7 : Um motorista ve uma vaga de estacionamento em uma rua. Ha
cinco carros na frente dele, e cada um deles tem probabilidade 0,2 de tomar a vaga.
Qual a probabilidade de a vaga ser tomada pelo carro que esta imediatamente a Exemplo 2.8 : Em um experimento 5 pecas foram inspecionadas e a v.a. X
frente dele? representa o numero de pecas defeituosas com a seguinte distribuicao de proba-
Neste caso, podemos definir a v.a. X como o numero de carros que pas- bilidades
sam pela vaga ate que ela seja tomada (este e o evento definido como sucesso).
Assume-se tambem que cada motorista toma a vaga ou nao de forma indepen- x 0 1 2 3 4 5
dente. Ou seja queremos calcular P (X = x) 0,35 0,45 0,1 0,05 0,04 0,01
P (X = 5) = (0, 8)4 0, 2 = 0, 082. Neste caso podemos calcular o numero medio de defeituosos e a variancia
como
E(X) = 0 0, 35 + 1 0, 45 + 2 0, 1 + 3 0, 05 + 4 0, 04 + 5 0, 01 1 peca
2.6.5 Variaveis Aleatorias Discretas

V ar(X) = (0 1)2 0, 35 + (1 1)2 0, 45 + (2 1)2 0, 1 + (3 1)2 0, 05
Os modelos vistos ate agora sao chamados distribuicoes de probabilidade dis- + (4 1)2 0, 04 + (5 1)2 0, 01 0, 9 pecas2
cretas ja que a v.a. associada assume valores em um conjunto finito ou infinito
enumeravel. Neste caso, probabilidades sao calculadas como somas, i.e.
Exemplo 2.9 : Um empresario vai abrir uma nova filial de sua empresa. Com
X base na experiencia sobre outras filiais e outras empresas do ramo o lucro foi
P (X A) = P (X = k),
kA
representado como uma v.a. discreta com a distribuicao abaixo.
2.6.4 Distribuicao Geometrica para um conjunto A qualquer. Para distribuicoes discretas de probabilidade
tambem e sempre possvel mostrar que
A distribuicao geometrica tambem esta relacionada a experimentos dicotomicos X
P (X = k) = 1.
realizados de forma independente e com a mesma probabilidade de sucesso. O
k
evento de interesse neste caso e o numero de experimentos X necessarios para a
ocorrencia do primeiro sucesso. Por exemplo o numero de inspecoes necessarias As definicoes de valor esperado (ou valor medio) e variancia tambem podem
ate encontrar-se um item defeituoso em um lote. ser generalizados para qualquer v.a. discreta X. Usaremos a seguinte notacao,
A probabilidade de que exatamente k experimentos sejam necessarios ate a X
E(X) = X = kP (X = k)
ocorrencia do primeiro sucesso e dada por
k
X
2
P (X = k) = (1 p) k1
p, k = 1, 2, . . . . V ar(X) = X = P (X = k) (k X )2
k
Tambem pode-se mostrar que o numero medio de repeticoes do experimento para valor medio e variancia respectivamente. O equivalente teorico ao conceito
ate ocorrer o primeiro sucesso e E(X) = (1 p)/p e a variancia e V ar(X) = de frequencias acumuladas vistas no Captulo 1 e a funcao de distribuicao acu-
(1 p)/p2 = E(X)/p. Ou seja, quanto menor a probabilidade de sucesso menor mulada ou simplesmente funcao de distribuicao definida como,
sera o numero esperado de repeticoes para que ele ocorra. X
F (x) = P (X x) = P (X = k), x R
kx
Exemplo 2.7 : Um motorista ve uma vaga de estacionamento em uma rua. Ha
cinco carros na frente dele, e cada um deles tem probabilidade 0,2 de tomar a vaga.
Qual a probabilidade de a vaga ser tomada pelo carro que esta imediatamente a Exemplo 2.8 : Em um experimento 5 pecas foram inspecionadas e a v.a. X
frente dele? representa o numero de pecas defeituosas com a seguinte distribuicao de proba-
Neste caso, podemos definir a v.a. X como o numero de carros que pas- bilidades
sam pela vaga ate que ela seja tomada (este e o evento definido como sucesso).
Assume-se tambem que cada motorista toma a vaga ou nao de forma indepen- x 0 1 2 3 4 5
dente. Ou seja queremos calcular P (X = x) 0,35 0,45 0,1 0,05 0,04 0,01
P (X = 5) = (0, 8)4 0, 2 = 0, 082. Neste caso podemos calcular o numero medio de defeituosos e a variancia
como
E(X) = 0 0, 35 + 1 0, 45 + 2 0, 1 + 3 0, 05 + 4 0, 04 + 5 0, 01 1 peca
2.6.5 Variaveis Aleatorias Discretas

V ar(X) = (0 1)2 0, 35 + (1 1)2 0, 45 + (2 1)2 0, 1 + (3 1)2 0, 05
Os modelos vistos ate agora sao chamados distribuicoes de probabilidade dis- + (4 1)2 0, 04 + (5 1)2 0, 01 0, 9 pecas2
cretas ja que a v.a. associada assume valores em um conjunto finito ou infinito
enumeravel. Neste caso, probabilidades sao calculadas como somas, i.e.
Exemplo 2.9 : Um empresario vai abrir uma nova filial de sua empresa. Com
X base na experiencia sobre outras filiais e outras empresas do ramo o lucro foi
P (X A) = P (X = k),
kA
representado como uma v.a. discreta com a distribuicao abaixo.
lucro -100 0 50 100 200 Esta distribuicao e apropriada para modelar variaveis aleatorias contnuas,
P (lucro = k) 0,05 0,05 0,30 0,50 0,10 que assumem valores em algum subconjunto dos numeros reais. Neste caso, so
faz sentido falar na probabilidade da variavel pertencer a um certo intervalo [a, b]
E(Lucro) = 1000, 05 + 00, 05 + 500, 30 + 1000, 50 + 2000, 10 = 80. que e dada pela area sob a curva e dentro deste intervalo.
A seguir estudaremos distribuicoes de probabilidade chamadas contnuas A equacao da curva normal e especificada usando dois parametros: a media
quando a v.a. associada assume valores no conjunto dos numeros reais. , e o desvio padrao , ou equivalentemente a variancia 2 . Denotamos N(, 2 )
a curva normal com media e variancia 2 . A media refere-se ao centro da
distribuicao e o desvio padrao ao grau de espalhamento de curva. A distribuicao
2.6.6 A Distribuicao Uniforme Contnua normal e simetrica em torno da media o que implica que a media, a mediana e a
moda sao todas coincidentes. Para referencia, a equacao da curva e dada por
A forma mais simples de modelar um fenomeno aleatorio cujos valores ocorrem
no intervalo (a, b) da reta dos reais e atraves de uma v.a. X cuja probabilidade 1

(x )2

de pertencer a qualquer subintervalo de (a, b) seja proporcional ao comprimento f (x) = exp , R, 2 > 0. (2.3)
2 2 2 2
do subintervalo. Matematicamente, se (c, d) (a, b) entao
O importante e que se entenda como a curva e afetada pelos valores numericos
P (c X d) d c. de e . A forma da curva e mostrada na Figura 2.4 para alguns valores da media
e desvio padrao.
Isto significa que funcao de densidade de probabilidade de X deve ser escrita A area sob a curva normal (na verdade abaixo de qualquer funcao de densidade
como de probabilidade) e 1. Entao, para quaisquer dois valores especficos podemos
1
, axb determinar a proporcao de area sob a curva entre esses dois valores. Em particular
f (x) = ba
0, caso contrario para a distribuicao normal, a proporcao de valores localizados dentro de um, dois,
ou tres desvios padrao em torno da media sao:
Deste modo, P (c X d) = (d c)/(b a). Pode-se mostrar tambem que
Intervalo Proporcao
E(X) = (a + b)/2 e V ar(X) = (b a) /12. 2 1 68,3%
2 95,5%
3 99,7%
Exemplo 2.10 : Seja X uma v.a. com distribuicao uniforme no intervalo (-1,4). Um exemplo de como utilizar este resultado e o seguinte.
Entao a funcao de densidade de probabilidade de X e
Exemplo 2.11 : Suponha que os comprimentos de um particular tipo de peixe
1/5, 1 x 4 podem ser descritos por uma distribuicao normal, com media 140mm e desvio
f (x) =
0, caso contrario padrao 15mm. Neste caso, a proporcao dos peixes que tem comprimentos entre
110mm e 170mm, por exemplo, e a proporcao da area sob a curva normal entre
e tambem P (0 X 2) = 2/5.
110 e 170. Entao neste exemplo, cerca de 95% dos peixes tem comprimentos entre
110mm e 170mm. Em termos probabilsticos, se a variavel aleatoria X representa
2.6.7 A Distribuicao Normal o comprimento dos peixes e se um peixe for selecionado ao acaso entao
A distribuicao normal e a mais familiar das distribuicoes de probabilidade e P ( 2 < X < + 2) = P (110 < X < 170) = 0, 95.
tambem uma das mais importantes em Estatstica. Esta distribuicao e carac-
terizada por uma funcao de densidade de probabilidade cujo grafico tem uma
forma de sino como na Figura 2.3. Em geral as probabilidades sao obtidas calculando-se a integral definida da
lucro -100 0 50 100 200 Esta distribuicao e apropriada para modelar variaveis aleatorias contnuas,
P (lucro = k) 0,05 0,05 0,30 0,50 0,10 que assumem valores em algum subconjunto dos numeros reais. Neste caso, so
faz sentido falar na probabilidade da variavel pertencer a um certo intervalo [a, b]
E(Lucro) = 1000, 05 + 00, 05 + 500, 30 + 1000, 50 + 2000, 10 = 80. que e dada pela area sob a curva e dentro deste intervalo.
A seguir estudaremos distribuicoes de probabilidade chamadas contnuas A equacao da curva normal e especificada usando dois parametros: a media
quando a v.a. associada assume valores no conjunto dos numeros reais. , e o desvio padrao , ou equivalentemente a variancia 2 . Denotamos N(, 2 )
a curva normal com media e variancia 2 . A media refere-se ao centro da
distribuicao e o desvio padrao ao grau de espalhamento de curva. A distribuicao
2.6.6 A Distribuicao Uniforme Contnua normal e simetrica em torno da media o que implica que a media, a mediana e a
moda sao todas coincidentes. Para referencia, a equacao da curva e dada por
A forma mais simples de modelar um fenomeno aleatorio cujos valores ocorrem
no intervalo (a, b) da reta dos reais e atraves de uma v.a. X cuja probabilidade 1

(x )2

de pertencer a qualquer subintervalo de (a, b) seja proporcional ao comprimento f (x) = exp , R, 2 > 0. (2.3)
2 2 2 2
do subintervalo. Matematicamente, se (c, d) (a, b) entao
O importante e que se entenda como a curva e afetada pelos valores numericos
P (c X d) d c. de e . A forma da curva e mostrada na Figura 2.4 para alguns valores da media
e desvio padrao.
Isto significa que funcao de densidade de probabilidade de X deve ser escrita A area sob a curva normal (na verdade abaixo de qualquer funcao de densidade
como de probabilidade) e 1. Entao, para quaisquer dois valores especficos podemos
1
, axb determinar a proporcao de area sob a curva entre esses dois valores. Em particular
f (x) = ba
0, caso contrario para a distribuicao normal, a proporcao de valores localizados dentro de um, dois,
ou tres desvios padrao em torno da media sao:
Deste modo, P (c X d) = (d c)/(b a). Pode-se mostrar tambem que
Intervalo Proporcao
E(X) = (a + b)/2 e V ar(X) = (b a) /12. 2 1 68,3%
2 95,5%
3 99,7%
Exemplo 2.10 : Seja X uma v.a. com distribuicao uniforme no intervalo (-1,4). Um exemplo de como utilizar este resultado e o seguinte.
Entao a funcao de densidade de probabilidade de X e
Exemplo 2.11 : Suponha que os comprimentos de um particular tipo de peixe
1/5, 1 x 4 podem ser descritos por uma distribuicao normal, com media 140mm e desvio
f (x) =
0, caso contrario padrao 15mm. Neste caso, a proporcao dos peixes que tem comprimentos entre
110mm e 170mm, por exemplo, e a proporcao da area sob a curva normal entre
e tambem P (0 X 2) = 2/5.
110 e 170. Entao neste exemplo, cerca de 95% dos peixes tem comprimentos entre
110mm e 170mm. Em termos probabilsticos, se a variavel aleatoria X representa
2.6.7 A Distribuicao Normal o comprimento dos peixes e se um peixe for selecionado ao acaso entao
A distribuicao normal e a mais familiar das distribuicoes de probabilidade e P ( 2 < X < + 2) = P (110 < X < 170) = 0, 95.
tambem uma das mais importantes em Estatstica. Esta distribuicao e carac-
terizada por uma funcao de densidade de probabilidade cujo grafico tem uma
forma de sino como na Figura 2.3. Em geral as probabilidades sao obtidas calculando-se a integral definida da
funcao f (x) em (2.3), i.e. 2. P (X > + h) = P (X < h).

Z b
P (a < X < b) = f (x)dx. 2.6.8 Distribuicao Exponencial
a
Neste caso, P (X = x) = 0 e portanto segue que Frequentemente usada para modelar o tempo entre eventos que ocorrem a uma
taxa media constante. Se X e uma v.a. com distribuicao exponencial sua funcao
P (a < X < b) = P (a X < b) = P (a < X b) = P (a X b). de densidade de probabilidade tem a forma
Na pratica desejamos calcular probabilidades para diferentes valores de e f (x) = ex , x > 0, > 0, (2.5)
. Para isso, a variavel X cuja distribuicao e N(, 2 ) e transformada numa
sendo o parametro da distribuicao. Usamos a notacao X Exponencial().
forma padronizada Z com distribuicao N(0, 1) (distribuicao normal padrao) pois
Pode-se mostrar que o valor medio de X e 1/ e sua variancia e 1/2 . Probabi-
tal distribuicao e tabelada. A quantidade Z e dada por
lidades sao facilmente calculadas como
X Z b
Z= (2.4)
P (a < X < b) = ex dx = ea eb
a
Exemplo 2.12 : A concentracao de um poluente em agua liberada por uma Na Figura 2.5 estao representadas graficamente as funcoes de densidade (2.5)
fabrica tem distribuicao normal com media 8 ppm e desvio padrao 1,5 ppm. com =1, 2, e 0,5.
Qual a probabilidade, de que num dado dia, a concentracao do poluente exceda
o limite regulatorio de 10 ppm? Exemplo 2.13 : Em uma empresa os acidentes de trabalho ocorrem a uma taxa
media de 0,1 por dia. Seja T o tempo (em dias) ate a ocorrencia do primeiro
A solucao deste problema resume-se em determinar qual proporcao da dis-
acidente, entao T tem distribuicao exponencial com parametro = 0, 1. Assim,
tribuicao esta acima de 10 ppm. Assim, definindo a v.a. X como sendo a con-
o tempo medio ate ocorrer o primeiro acidente e igual a 10 dias (E(T )=10). A
centracao do poluente na agua segue que X N(9; 1, 52), e devemos calcular
probabilidade de nao haver acidentes em uma semana de trabalho (de 5 dias) e
P (X > 10). Usando a estatstica Z temos que
dada por Z

10 8 P (T > 5) = 0, 1e0,1t dt = e0,15 0, 607.
P (X > 10) = P Z > = P (Z > 1, 33) = 1 P (Z 1, 33)
1, 5 5
= 0, 5 P (0 < Z < 1, 33)

O modelo exponencial tem inumeras aplicacoes praticas, por exemplo em
Consultando a tabela da distribuicao normal padronizada obtemos que teoria das filas (tempo entre chegadas de clientes em um sistema), confiabilidade
P (0 < Z < 1, 33) = 0, 4082 e assim P (X > 10) = 0, 0918. Portanto, espera- (tempo ate a falha de um equipamento), etc.
se que a agua liberada pela fabrica exceda os limites regulatorios cerca de 9% do
tempo.
2.6.9 Variaveis Aleatorias Contnuas
Vale notar que a propriedade de simetria da curva normal em torno da media
e bastante util no calculo de probabilidades. Por exemplo, se X tem distribuicao Estes ultimos modelos sao chamados distribuicoes de probabilidade contnuas
N(, 2 ) entao, para quaisquer valores de , 2 e h > 0, ja que a v.a. associada assume valores em um conjunto infinito. Neste caso,
probabilidades sao calculadas como integrais, i.e.
1. P (X > ) = P (X < ) = 0, 50 uma vez que a area total abaixo da curva e Z
igual a 1. P (X A) = f (x)dx,
A
funcao f (x) em (2.3), i.e. 2. P (X > + h) = P (X < h).

Z b
P (a < X < b) = f (x)dx. 2.6.8 Distribuicao Exponencial
a
Neste caso, P (X = x) = 0 e portanto segue que Frequentemente usada para modelar o tempo entre eventos que ocorrem a uma
taxa media constante. Se X e uma v.a. com distribuicao exponencial sua funcao
P (a < X < b) = P (a X < b) = P (a < X b) = P (a X b). de densidade de probabilidade tem a forma
Na pratica desejamos calcular probabilidades para diferentes valores de e f (x) = ex , x > 0, > 0, (2.5)
. Para isso, a variavel X cuja distribuicao e N(, 2 ) e transformada numa
sendo o parametro da distribuicao. Usamos a notacao X Exponencial().
forma padronizada Z com distribuicao N(0, 1) (distribuicao normal padrao) pois
Pode-se mostrar que o valor medio de X e 1/ e sua variancia e 1/2 . Probabi-
tal distribuicao e tabelada. A quantidade Z e dada por
lidades sao facilmente calculadas como
X Z b
Z= (2.4)
P (a < X < b) = ex dx = ea eb
a
Exemplo 2.12 : A concentracao de um poluente em agua liberada por uma Na Figura 2.5 estao representadas graficamente as funcoes de densidade (2.5)
fabrica tem distribuicao normal com media 8 ppm e desvio padrao 1,5 ppm. com =1, 2, e 0,5.
Qual a probabilidade, de que num dado dia, a concentracao do poluente exceda
o limite regulatorio de 10 ppm? Exemplo 2.13 : Em uma empresa os acidentes de trabalho ocorrem a uma taxa
media de 0,1 por dia. Seja T o tempo (em dias) ate a ocorrencia do primeiro
A solucao deste problema resume-se em determinar qual proporcao da dis-
acidente, entao T tem distribuicao exponencial com parametro = 0, 1. Assim,
tribuicao esta acima de 10 ppm. Assim, definindo a v.a. X como sendo a con-
o tempo medio ate ocorrer o primeiro acidente e igual a 10 dias (E(T )=10). A
centracao do poluente na agua segue que X N(9; 1, 52), e devemos calcular
probabilidade de nao haver acidentes em uma semana de trabalho (de 5 dias) e
P (X > 10). Usando a estatstica Z temos que
dada por Z

10 8 P (T > 5) = 0, 1e0,1t dt = e0,15 0, 607.
P (X > 10) = P Z > = P (Z > 1, 33) = 1 P (Z 1, 33)
1, 5 5
= 0, 5 P (0 < Z < 1, 33)

O modelo exponencial tem inumeras aplicacoes praticas, por exemplo em
Consultando a tabela da distribuicao normal padronizada obtemos que teoria das filas (tempo entre chegadas de clientes em um sistema), confiabilidade
P (0 < Z < 1, 33) = 0, 4082 e assim P (X > 10) = 0, 0918. Portanto, espera- (tempo ate a falha de um equipamento), etc.
se que a agua liberada pela fabrica exceda os limites regulatorios cerca de 9% do
tempo.
2.6.9 Variaveis Aleatorias Contnuas
Vale notar que a propriedade de simetria da curva normal em torno da media
e bastante util no calculo de probabilidades. Por exemplo, se X tem distribuicao Estes ultimos modelos sao chamados distribuicoes de probabilidade contnuas
N(, 2 ) entao, para quaisquer valores de , 2 e h > 0, ja que a v.a. associada assume valores em um conjunto infinito. Neste caso,
probabilidades sao calculadas como integrais, i.e.
1. P (X > ) = P (X < ) = 0, 50 uma vez que a area total abaixo da curva e Z
igual a 1. P (X A) = f (x)dx,
A
44 CAPITULO 2. PROBABILIDADES 2.7. AJUSTE DE MODELOS TEORICOS 45
para um conjunto A R qualquer. Tambem e sempre possvel mostrar que (a) Calcule P (X < 1, 8)
Z (b) Calcule P (X > 1, 5)
f (x)dx = 1.
(c) Calcule P (X < 2)
As definicoes de valor esperado (ou valor medio) e variancia tambem podem (d) Calcule P (1 < X < 1)
ser generalizados para qualquer v.a. contnua X, (e) Calcule a media e mediana de X
Z
E(X) = X = xf (x)dx
Z

2.7 Ajuste de Modelos Teoricos
2
V ar(X) = X = f (x) (x X )2 .
Um problema de grande importancia pratica e o ajuste de distribuicoes teoricas
as distribuicoes dos dados observados. Em outras palavras, queremos saber se
Neste caso a funcao de distribuicao acumulada e definida como
a distribuicao das frequencias observadas nos dados segue o padrao de algum
Z x
modelo teorico (normal, binomial, etc.). Nos exemplos a seguir veremos como
F (x) = P (X x) = f (t)dt, x R
fazer este ajuste.
2.6.10 Problemas Exemplo 2.14 : Em uma amostra de 100 lotes com 5 itens cada um, verificou-se
que o numero de itens defeituosos tem a seguinte distribuicao de frequencias,
1. Mostre que as funcoes abaixo sao funcoes de densidade de probabilidade e
determine o valor da constante k.
Tabela 2.1: Frequencias observadas para os dados de itens defeituosos.
(a) f (x) = kx2 para 0 < x < 4.
no de defeituosos 0 1 2 3 4 5 total
(b) f (x) = k(1 + 2x) para 0 < x < 2.
no de lotes 75 21 3 1 0 0 100
(c) f (x) = k exp(x) para x > 0.
2. Considerando a funcao de densidade no item (b) do problema 1.

Podemos ajustar uma distribuicao binomial a estes dados com n = 5 e p a
(a) Calcule P (X > 1, 5). probabilidade de um item ser defeituoso. Neste caso a media teorica e np = 5p
e o numero medio de itens defeituosos observados e x = 0, 3. Igualando as duas
(b) Calcule P (0, 7 < X < 1, 2).
medias obtemos que 5p = 0, 3, e portanto p = 0, 06. Assim, se X representa o
(c) Calcule o valor esperado de X. numero de itens defeituosos em cada lote, a distribuicao binomial ajustada sera,
(d) Calcule a variancia de X.
5
(e) Calcule a mediana de X. P (X = k) = (0, 06)k (0, 94)5k , k = 0, 1, 2, 3, 4, 5.
k
(f) Calcule os quartis da distribuicao de X.
Agora podemos calcular as frequencias teoricas (ou ajustadas) e comparar
3. A funcao de distribuicao acumulada de uma certa variavel aleatoria e com aquelas observadas, como na Tabela 2.2 a seguir.
Com base nesta tabela podemos afirmar que o modelo binomial parece ser
0, x < 2 adequado ja que as frequencias observadas ficaram muitos proximas das ajusta-
F (x) = 0, 25x + 0, 5, 2 x < 2 das. Em outras palavras, aquilo que foi observado parece estar de acordo com o

x x2 modelo teorico.
para um conjunto A R qualquer. Tambem e sempre possvel mostrar que (a) Calcule P (X < 1, 8)
Z (b) Calcule P (X > 1, 5)
f (x)dx = 1.
(c) Calcule P (X < 2)
As definicoes de valor esperado (ou valor medio) e variancia tambem podem (d) Calcule P (1 < X < 1)
ser generalizados para qualquer v.a. contnua X, (e) Calcule a media e mediana de X
Z
E(X) = X = xf (x)dx
Z

2.7 Ajuste de Modelos Teoricos
2
V ar(X) = X = f (x) (x X )2 .
Um problema de grande importancia pratica e o ajuste de distribuicoes teoricas
as distribuicoes dos dados observados. Em outras palavras, queremos saber se
Neste caso a funcao de distribuicao acumulada e definida como
a distribuicao das frequencias observadas nos dados segue o padrao de algum
Z x
modelo teorico (normal, binomial, etc.). Nos exemplos a seguir veremos como
F (x) = P (X x) = f (t)dt, x R
fazer este ajuste.
2.6.10 Problemas Exemplo 2.14 : Em uma amostra de 100 lotes com 5 itens cada um, verificou-se
que o numero de itens defeituosos tem a seguinte distribuicao de frequencias,
1. Mostre que as funcoes abaixo sao funcoes de densidade de probabilidade e
determine o valor da constante k.
Tabela 2.1: Frequencias observadas para os dados de itens defeituosos.
(a) f (x) = kx2 para 0 < x < 4.
no de defeituosos 0 1 2 3 4 5 total
(b) f (x) = k(1 + 2x) para 0 < x < 2.
no de lotes 75 21 3 1 0 0 100
(c) f (x) = k exp(x) para x > 0.
2. Considerando a funcao de densidade no item (b) do problema 1.

Podemos ajustar uma distribuicao binomial a estes dados com n = 5 e p a
(a) Calcule P (X > 1, 5). probabilidade de um item ser defeituoso. Neste caso a media teorica e np = 5p
e o numero medio de itens defeituosos observados e x = 0, 3. Igualando as duas
(b) Calcule P (0, 7 < X < 1, 2).
medias obtemos que 5p = 0, 3, e portanto p = 0, 06. Assim, se X representa o
(c) Calcule o valor esperado de X. numero de itens defeituosos em cada lote, a distribuicao binomial ajustada sera,
(d) Calcule a variancia de X.
5
(e) Calcule a mediana de X. P (X = k) = (0, 06)k (0, 94)5k , k = 0, 1, 2, 3, 4, 5.
k
(f) Calcule os quartis da distribuicao de X.
Agora podemos calcular as frequencias teoricas (ou ajustadas) e comparar
3. A funcao de distribuicao acumulada de uma certa variavel aleatoria e com aquelas observadas, como na Tabela 2.2 a seguir.
Com base nesta tabela podemos afirmar que o modelo binomial parece ser
0, x < 2 adequado ja que as frequencias observadas ficaram muitos proximas das ajusta-
F (x) = 0, 25x + 0, 5, 2 x < 2 das. Em outras palavras, aquilo que foi observado parece estar de acordo com o

x x2 modelo teorico.
Tabela 2.2: Frequencias ajustadas e observadas para os dados de itens defeituosos. Tabela 2.4: Frequencias ajustadas e observadas para os dados de defeitos por
item.
frequencias
no de defeituosos (k) P (X = k) ajustada observada frequencias
0 0,7339 73 75 no de defeitos (k) P (X = k) ajustada observada
1 0,2342 23 21 0 0,28 85 80
2 0,0299 3 3 1 0,36 107 122
3 0,0019 0 1 2 0,23 68 53
4 0,0001 0 0 3 0,09 28 31
5 0,0000 0 0 4 0,03 9 14
Tabela 2.3: Frequencias observadas de defeitos em 300 itens.

Tabela 2.5: Frequencias observadas para os dados de vazao agrupados em classes.
o
n de defeitos 0 1 2 3 4 total
no de itens 80 122 53 31 14 300 classes de vazao frequencia observada
10-14 55
14-18 126
18-22 325
Exemplo 2.15 : Em uma amostra de 300 itens, o numero de defeitos observados 22-26 315
em cada um deles tem a distribuicao de frequencias dada na Tabela 2.3 abaixo. 26-30 130
Podemos pensar em ajustar uma distribuicao de Poisson com parametro () 30-34 49
dado pelo numero medio de defeitos observados por item. Neste caso a media
amostral e x = 1, 26, e portanto se X representa o numero de defeitos por item
entao a distribuicao ajustada sera,
x = 21, 9 e s = 4, 71 e portanto se X representa as medicoes de vazao entao X
(1, 26)k e1,26 tem distribuicao N(21, 9; 4, 712) (esta e a distribuicao ajustada). Calculado as
P (X = k) = , k = 0, 1, . . .
k! probabilidades de obter uma medicao em cada uma das classes podemos construir
a Tabela 2.6 com as frequencias ajustadas.
A partir deste modelo podemos calcular as frequencias ajustadas, e obtemos
a Tabela 2.4 a seguir. A probabilidade da primeira classe foi obtida calculando-se
Podemos dizer que o modelo ainda parece adequado embora as frequencias
10 21, 9 14 21, 9
observadas nao estejam mais tao proximas das ajustadas (como no exemplo an- P (10 < X < 14) = P <Z<
4, 71 4, 71
terior). Nos proximos captulos veremos como testar esta adequacao mais for-
= P (2, 53 < Z < 1, 68) = P (1, 68 < Z < 2, 53)
malmente.
= P (Z < 2, 53) P (Z < 1, 68) = 0, 9945 0, 9535 = 0, 041
Exemplo 2.16 : Em um determinada secao de um rio foram efetuadas 1000
medicoes de sua vazao (em m3 /s), e obteve-se a distribuicao apresentada na e este calculo foi repetido para as outras classes.
Tabela 2.5 abaixo. Novamente parece razoavel afirmar que o modelo e adequado para estes da-
Podemos ajustar uma distribuicao normal com parametros (media e variancia) dos uma vez que as frequencias observadas ficaram relativamente proximas das
dados pela media amostral e variancia amostral respectivamente. Neste caso, ajustadas.
Tabela 2.2: Frequencias ajustadas e observadas para os dados de itens defeituosos. Tabela 2.4: Frequencias ajustadas e observadas para os dados de defeitos por
item.
frequencias
no de defeituosos (k) P (X = k) ajustada observada frequencias
0 0,7339 73 75 no de defeitos (k) P (X = k) ajustada observada
1 0,2342 23 21 0 0,28 85 80
2 0,0299 3 3 1 0,36 107 122
3 0,0019 0 1 2 0,23 68 53
4 0,0001 0 0 3 0,09 28 31
5 0,0000 0 0 4 0,03 9 14
Tabela 2.3: Frequencias observadas de defeitos em 300 itens.

Tabela 2.5: Frequencias observadas para os dados de vazao agrupados em classes.
o
n de defeitos 0 1 2 3 4 total
no de itens 80 122 53 31 14 300 classes de vazao frequencia observada
10-14 55
14-18 126
18-22 325
Exemplo 2.15 : Em uma amostra de 300 itens, o numero de defeitos observados 22-26 315
em cada um deles tem a distribuicao de frequencias dada na Tabela 2.3 abaixo. 26-30 130
Podemos pensar em ajustar uma distribuicao de Poisson com parametro () 30-34 49
dado pelo numero medio de defeitos observados por item. Neste caso a media
amostral e x = 1, 26, e portanto se X representa o numero de defeitos por item
entao a distribuicao ajustada sera,
x = 21, 9 e s = 4, 71 e portanto se X representa as medicoes de vazao entao X
(1, 26)k e1,26 tem distribuicao N(21, 9; 4, 712) (esta e a distribuicao ajustada). Calculado as
P (X = k) = , k = 0, 1, . . .
k! probabilidades de obter uma medicao em cada uma das classes podemos construir
a Tabela 2.6 com as frequencias ajustadas.
A partir deste modelo podemos calcular as frequencias ajustadas, e obtemos
a Tabela 2.4 a seguir. A probabilidade da primeira classe foi obtida calculando-se
Podemos dizer que o modelo ainda parece adequado embora as frequencias
10 21, 9 14 21, 9
observadas nao estejam mais tao proximas das ajustadas (como no exemplo an- P (10 < X < 14) = P <Z<
4, 71 4, 71
terior). Nos proximos captulos veremos como testar esta adequacao mais for-
= P (2, 53 < Z < 1, 68) = P (1, 68 < Z < 2, 53)
malmente.
= P (Z < 2, 53) P (Z < 1, 68) = 0, 9945 0, 9535 = 0, 041
Exemplo 2.16 : Em um determinada secao de um rio foram efetuadas 1000
medicoes de sua vazao (em m3 /s), e obteve-se a distribuicao apresentada na e este calculo foi repetido para as outras classes.
Tabela 2.5 abaixo. Novamente parece razoavel afirmar que o modelo e adequado para estes da-
Podemos ajustar uma distribuicao normal com parametros (media e variancia) dos uma vez que as frequencias observadas ficaram relativamente proximas das
dados pela media amostral e variancia amostral respectivamente. Neste caso, ajustadas.
6. O numero medio de colonias de bacterias por 10 ml de agua retirada de um

Tabela 2.6: Frequencias ajustadas e observadas para os dados de vazao agrupados
em classes. lago e igual a 3.
frequencias (a) Qual a probabilidade de se achar pelo menos duas colonias em 10 ml

classes de vazao Probabilidades das classes ajustada observada de agua deste lago?
10-14 0,041 41 55 (b) Qual a probabilidade de nao se achar nenhuma colonia em 10 ml de
14-18 0,157 157 126 agua deste lago?
18-22 0,305 305 325
22-26 0,300 300 315 7. Um curso de especializacao garante que 9 em cada 10 alunos seus tem au-
26-30 0,150 150 130 mento de produtividade. Uma empresa decide enviar uma turma de 15
30-34 0,038 38 49 funcionarios para fazer o curso e verificar quantos aumentaram a produti-
vidade.
2.8 Problemas (a) Indique um modelo apropriado para este experimento e diga quais as
hipoteses necessarias para que ele seja valido.
1. Suponha que a variavel aleatoria X possa assumir os seguintes valores -3,- (b) Assumindo que este modelo e valido, qual a probabilidade de que no
2,-1,0,1,2,3 com a mesma probabilidade. Determine distribuicao de proba- maximo 2 funcionarios nao aumentem sua produtividade ?
bilidades de Y = X 2 X.
(c) O que ocorre com o item anterior se a empresa enviar 100 funcionarios
2. Considere um modelo uniforme discreto para a v.a. X no conjunto ? (De uma solucao aproximada).
{1, 2, . . . , 10}. Calcule P (3 X < 7) e P (X 9|X 6). 8. A tabela abaixo representa uma distribuicao de frequencias para o numero
3. A probabilidade de um atirador acertar no alvo num unico tiro e 1/4. Se o de defeitos observados em certo tipo de componente eletronico.
atirador atira 20 vezes no alvo qual a probabilidade de acertar
no defeitos 1 2 3 4 5 6 7
(a) exatamente 5 vezes; frequencia 3 9 8 5 3 1 1
(b) pelo menos 3 vezes; (a) Voce diria que a distribuicao normal e adequada para modelar estes
(c) nenhuma vez; dados? (Justifique).
(d) no maximo 2 vezes. (b) Assumindo que o modelo de Poisson e apropriado calcule a proba-
bilidade de um componente escolhido ao acaso apresentar mais de 2
4. Um professor aplica um teste do tipo certo-errado com 20 questoes. Calcule defeitos.
a probabilidade de um aluno acertar mais de 80% das questoes supondo que
(c) Calcule a probabilidade de exatamente 2 dentre 5 componentes esco-
ele esta respondendo ao acaso.
lhidos ao acaso apresentarem no maximo 2 defeitos por componente.
5. O numero de partculas alfa emitidas por segundo em sedimentos radioati-
9. Uma pessoa a procura de emprego visita varias empresas ate conseguir ser
vos pode ser descrito por uma distribuicao Poisson com media 6.
admitida. A probabilidade de admissao e constante e igual a 0,3. Calcule o
(a) Qual a probabilidade de nao haver nenhuma partcula emitida num numero de empresas que devem ser visitadas para que a probabilidade de
dado segundo? conseguir uma vaga seja maior do que 0,70.
(b) Qual a probabilidade de pelo menos quatro partculas serem emitidas 10. Para a distribuicao Normal calcule a proporcao de valores localizados dentro
num segundo? de 1, 2 e 3 desvios padrao em torno da media utilizando a tabela apropriada.
6. O numero medio de colonias de bacterias por 10 ml de agua retirada de um

Tabela 2.6: Frequencias ajustadas e observadas para os dados de vazao agrupados
em classes. lago e igual a 3.
frequencias (a) Qual a probabilidade de se achar pelo menos duas colonias em 10 ml

classes de vazao Probabilidades das classes ajustada observada de agua deste lago?
10-14 0,041 41 55 (b) Qual a probabilidade de nao se achar nenhuma colonia em 10 ml de
14-18 0,157 157 126 agua deste lago?
18-22 0,305 305 325
22-26 0,300 300 315 7. Um curso de especializacao garante que 9 em cada 10 alunos seus tem au-
26-30 0,150 150 130 mento de produtividade. Uma empresa decide enviar uma turma de 15
30-34 0,038 38 49 funcionarios para fazer o curso e verificar quantos aumentaram a produti-
vidade.
2.8 Problemas (a) Indique um modelo apropriado para este experimento e diga quais as
hipoteses necessarias para que ele seja valido.
1. Suponha que a variavel aleatoria X possa assumir os seguintes valores -3,- (b) Assumindo que este modelo e valido, qual a probabilidade de que no
2,-1,0,1,2,3 com a mesma probabilidade. Determine distribuicao de proba- maximo 2 funcionarios nao aumentem sua produtividade ?
bilidades de Y = X 2 X.
(c) O que ocorre com o item anterior se a empresa enviar 100 funcionarios
2. Considere um modelo uniforme discreto para a v.a. X no conjunto ? (De uma solucao aproximada).
{1, 2, . . . , 10}. Calcule P (3 X < 7) e P (X 9|X 6). 8. A tabela abaixo representa uma distribuicao de frequencias para o numero
3. A probabilidade de um atirador acertar no alvo num unico tiro e 1/4. Se o de defeitos observados em certo tipo de componente eletronico.
atirador atira 20 vezes no alvo qual a probabilidade de acertar
no defeitos 1 2 3 4 5 6 7
(a) exatamente 5 vezes; frequencia 3 9 8 5 3 1 1
(b) pelo menos 3 vezes; (a) Voce diria que a distribuicao normal e adequada para modelar estes
(c) nenhuma vez; dados? (Justifique).
(d) no maximo 2 vezes. (b) Assumindo que o modelo de Poisson e apropriado calcule a proba-
bilidade de um componente escolhido ao acaso apresentar mais de 2
4. Um professor aplica um teste do tipo certo-errado com 20 questoes. Calcule defeitos.
a probabilidade de um aluno acertar mais de 80% das questoes supondo que
(c) Calcule a probabilidade de exatamente 2 dentre 5 componentes esco-
ele esta respondendo ao acaso.
lhidos ao acaso apresentarem no maximo 2 defeitos por componente.
5. O numero de partculas alfa emitidas por segundo em sedimentos radioati-
9. Uma pessoa a procura de emprego visita varias empresas ate conseguir ser
vos pode ser descrito por uma distribuicao Poisson com media 6.
admitida. A probabilidade de admissao e constante e igual a 0,3. Calcule o
(a) Qual a probabilidade de nao haver nenhuma partcula emitida num numero de empresas que devem ser visitadas para que a probabilidade de
dado segundo? conseguir uma vaga seja maior do que 0,70.
(b) Qual a probabilidade de pelo menos quatro partculas serem emitidas 10. Para a distribuicao Normal calcule a proporcao de valores localizados dentro
num segundo? de 1, 2 e 3 desvios padrao em torno da media utilizando a tabela apropriada.
11. A concentracao de cadmio em cinzas de um certo lixo radioativo tem dis- entre 5cm e 10cm. Sabe-se que o comprimento das pecas e uma variavel
tribuicao normal com media igual a 1 ppm e desvio padrao 0,72 ppm. Qual aleatoria com distribuicao normal de media 7,5 cm e variancia 20,0 cm2 .
a probabilidade de que uma amostra aleatoria das cinzas tenha uma con-
(a) Qual a proporcao esperada de lotes aceitos durante a inspecao.
centracao de cadmio entre 0,5 e 1,75 ppm?
(b) Quantas pecas devem ser retiradas aleatoriamente para que 82% dos
12. A idade dos assinantes de um jornal e uma variavel aleatoria com densidade lotes sejam aceitos.
normal com media 36 anos e desvio padrao 6 anos.
17. Em uma cidade, a duracao das conversas telefonicas em minutos, originarias
(a) Qual a probabilidade que um assinante escolhido aleatoriamente tenha de telefones publicos, segue o modelo exponencial com parametro 1/3.
entre 24 e 30 anos?
(a) Calcule a probabilidade de uma conversa telefonica durar mais do que
(b) Qual a faixa etaria dos 10% assinantes mais velhos?
o tempo medio da cidade.
13. O numero mensal de itens vendidos por uma empresa tem distribuicao (b) Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
aproximadamente normal com media 500 e desvio padrao 50. Se a em- a probabilidade do tempo medio amostral nao ultrapassar 4 minutos?
presa decide fabricar 600 unidades deste produto num certo mes, qual a
probabilidade de esgotar sua producao? 18. O tempo de duracao (em horas) de um componente eletronico tem dis-
tribuicao exponencial. Sabendo que o tempo de duracao medio e 1 hora
14. As alturas (em metros) de 1000 alunos de uma universidade tem distribuicao calcule,
aproximadamente normal com media 1,70 e desvio padrao 0,05.
(a) a probabilidade de que a duracao seja menor do que 10 h.
(a) Qual o numero esperado de alunos com alturas superiores a 1,68 metros (b) a probabilidade de que a duracao esteja entre 5 e 15 horas.
?
(c) o valor de t tal que a probabilidade da duracao ser maior do que t seja
(b) Que intervalos simetricos em torno da media conterao, aproximada- 0,01.
mente, 68% e 95% das alturas dos alunos?
15. Uma maquina produz pecas que cuja resistencia a pressao tem distribuicao
normal com desvio padrao igual a 10.
(a) Qual deve ser a resistencia media m para que 40% das pecas tenham
resistencia maior do que 20?
(b) Usando este valor de m calcule a probabilidade de que uma peca sele-
cionada ao acaso tenha resistencia superior a 15,5.
(c) Uma peca e defeituosa se sua resistencia se desvia mais de h unidades
da media. Calcule o intervalo m h tal que 12,6% das pecas sejam
defeituosas.
(d) Nas condicoes do item anterior qual deve ser o novo desvio padrao tal
que porcentagem de pecas defeituosas seja 1%.
16. Suponha que a aceitacao de um lote de 1000 pecas ocorre apenas se o

comprimento medio de 10 pecas retiradas aleatoriamente do lote estiver
11. A concentracao de cadmio em cinzas de um certo lixo radioativo tem dis- entre 5cm e 10cm. Sabe-se que o comprimento das pecas e uma variavel
tribuicao normal com media igual a 1 ppm e desvio padrao 0,72 ppm. Qual aleatoria com distribuicao normal de media 7,5 cm e variancia 20,0 cm2 .
a probabilidade de que uma amostra aleatoria das cinzas tenha uma con-
(a) Qual a proporcao esperada de lotes aceitos durante a inspecao.
centracao de cadmio entre 0,5 e 1,75 ppm?
(b) Quantas pecas devem ser retiradas aleatoriamente para que 82% dos
12. A idade dos assinantes de um jornal e uma variavel aleatoria com densidade lotes sejam aceitos.
normal com media 36 anos e desvio padrao 6 anos.
17. Em uma cidade, a duracao das conversas telefonicas em minutos, originarias
(a) Qual a probabilidade que um assinante escolhido aleatoriamente tenha de telefones publicos, segue o modelo exponencial com parametro 1/3.
entre 24 e 30 anos?
(a) Calcule a probabilidade de uma conversa telefonica durar mais do que
(b) Qual a faixa etaria dos 10% assinantes mais velhos?
o tempo medio da cidade.
13. O numero mensal de itens vendidos por uma empresa tem distribuicao (b) Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
aproximadamente normal com media 500 e desvio padrao 50. Se a em- a probabilidade do tempo medio amostral nao ultrapassar 4 minutos?
presa decide fabricar 600 unidades deste produto num certo mes, qual a
probabilidade de esgotar sua producao? 18. O tempo de duracao (em horas) de um componente eletronico tem dis-
tribuicao exponencial. Sabendo que o tempo de duracao medio e 1 hora
14. As alturas (em metros) de 1000 alunos de uma universidade tem distribuicao calcule,
aproximadamente normal com media 1,70 e desvio padrao 0,05.
(a) a probabilidade de que a duracao seja menor do que 10 h.
(a) Qual o numero esperado de alunos com alturas superiores a 1,68 metros (b) a probabilidade de que a duracao esteja entre 5 e 15 horas.
?
(c) o valor de t tal que a probabilidade da duracao ser maior do que t seja
(b) Que intervalos simetricos em torno da media conterao, aproximada- 0,01.
mente, 68% e 95% das alturas dos alunos?
15. Uma maquina produz pecas que cuja resistencia a pressao tem distribuicao
normal com desvio padrao igual a 10.
(a) Qual deve ser a resistencia media m para que 40% das pecas tenham
resistencia maior do que 20?
(b) Usando este valor de m calcule a probabilidade de que uma peca sele-
cionada ao acaso tenha resistencia superior a 15,5.
(c) Uma peca e defeituosa se sua resistencia se desvia mais de h unidades
da media. Calcule o intervalo m h tal que 12,6% das pecas sejam
defeituosas.
(d) Nas condicoes do item anterior qual deve ser o novo desvio padrao tal
que porcentagem de pecas defeituosas seja 1%.
16. Suponha que a aceitacao de um lote de 1000 pecas ocorre apenas se o

comprimento medio de 10 pecas retiradas aleatoriamente do lote estiver
Figura 2.1: Graficos das probabilidades (2.1) para p=0,2, 0,5, 0,7 e 0,9. Figura 2.2: Graficos das probabilidades (2.2) para = 1, 2, 5, 15.
p = 0.2 p = 0.5 =1 =2
0.20
0.25
0.15
0.3
0.20
0.15
0.10
0.15
0.2
0.10
0.10
0.05
0.1
0.05
0.05
0.00
0.00
0.00
0.0
0 5 10 15 20 0 5 10 15 20 0 2 4 6 8 10 0 2 4 6 8 10
p = 0.7 p = 0.9 =5 = 15
0.10
0.25
0.15
0.15
0.08
0.20
0.06
0.10
0.15
0.10
0.04
0.10
0.05
0.05
0.02
0.05
0.00
0.00
0.00
0.00
0 5 10 15 20 0 5 10 15 20 0 5 10 15 0 5 10 15 20 25 30
Figura 2.1: Graficos das probabilidades (2.1) para p=0,2, 0,5, 0,7 e 0,9. Figura 2.2: Graficos das probabilidades (2.2) para = 1, 2, 5, 15.
p = 0.2 p = 0.5 =1 =2
0.20
0.25
0.15
0.3
0.20
0.15
0.10
0.15
0.2
0.10
0.10
0.05
0.1
0.05
0.05
0.00
0.00
0.00
0.0
0 5 10 15 20 0 5 10 15 20 0 2 4 6 8 10 0 2 4 6 8 10
p = 0.7 p = 0.9 =5 = 15
0.10
0.25
0.15
0.15
0.08
0.20
0.06
0.10
0.15
0.10
0.04
0.10
0.05
0.05
0.02
0.05
0.00
0.00
0.00
0.00
0 5 10 15 20 0 5 10 15 20 0 5 10 15 0 5 10 15 20 25 30
Figura 2.3: Exemplo de uma curva normal.
0.4
0.3
0.2
f(x)
Figura 2.5: Graficos das funcoes de densidades (2.5) para =1,2, e 0,5.
0.1
1.0
0.0
0.8
-4 -2 0 2 4
x
0.6
=1
= 0.5
f (x )
=2
0.4
Figura 2.4: Graficos da curva normal para alguns valores de e .
0.2
0.8
N(6,.25)
0.0
0.6
0 2 4 6 8
x
N(0,1) N(3,1)
0.4
f(x)
0.2
N(6,4)
0.0
0 5 10
x
Figura 2.3: Exemplo de uma curva normal.
0.4
0.3
0.2
f(x)
Figura 2.5: Graficos das funcoes de densidades (2.5) para =1,2, e 0,5.
0.1
1.0
0.0
0.8
-4 -2 0 2 4
x
0.6
=1
= 0.5
f (x )
=2
0.4
Figura 2.4: Graficos da curva normal para alguns valores de e .
0.2
0.8
N(6,.25)
0.0
0.6
0 2 4 6 8
x
N(0,1) N(3,1)
0.4
f(x)
0.2
N(6,4)
0.0
0 5 10
x
3.2. PRINCIPIOS DE ESTIMACAO 57
algumas vezes logicamente impossvel, por exemplo, em ensaios destrutivos.

Caractersticas de uma populacao que diferem de um indivduo para outro e
as quais temos interesse em estudar sao chamadas variaveis. Alguns exemplos
sao comprimento, massa, idade, temperatura, numero de ocorrencias, etc. Cada
unidade ou membro da populacao que e escolhido como parte de uma amostra
Captulo 3 fornece uma medida de uma ou mais variaveis, chamadas observacoes.
3.2 Princpios de estimacao

Estimacao
Suponha que estamos interessados em um parametro populacional (desconhecido)
. O conjunto aonde assume valores e denominado espaco parametrico.
3.1 Inferencia Estatstica Exemplo 3.1 : Se X P oisson(), entao = { : > 0}.
Inferencia estatstica e o processo pelo qual podemos tirar conclusoes acerca de Exemplo 3.2 : Se X N(, 1), entao = { : < < }.
um conjunto maior (a populacao) usando informacao de um conjunto menor (a
amostra). Em estatstica, o termo populacao nao se refere necessariamente a Exemplo 3.3 : Se X N(, 2 ), entao = {(, 2 ) : < < , 2 > 0}.
pessoas, plantas, animais, etc. Ele poderia tambem se referir por exemplo a
fosseis, rochas e sedimentos num determinado local, itens produzidos em uma Podemos estimar o parametro usando a informacao de nossa amostra. Cha-
linha de montagem, etc. mamos este unico numero que representa o valor mais plausvel do parametro
A populacao se refere a todos os casos ou situacoes sobre as quais o pesqui- (baseado nos dados amostrais) de uma estimativa pontual de . Alguns exem-
sador quer fazer inferencias e assim a caraterizacao da populacao depende do plos sao a media amostral, o desvio padrao amostral, a mediana amostral, os
problema em estudo. Diferentes pesquisadores podem querer fazer inferencias quais estimam a verdadeira media, desvio padrao e mediana da populacao (que
acerca da concentracao de poluentes num determinado lencol freatico; predizer a sao desconhecidos). Os verdadeiros (e desconhecidos) valores populacionais sao
quantidade de petroleo num poco a ser perfurado, estimar o tempo de vida util chamados parametros.
de um componente eletronico e assim por diante. Definicao 3.1 Uma estatstica e uma funcao qualquer dos elementos que
Note que o investigador nao esta interessado em todos os aspectos da po- compoem a amostra e que nao depende do parametro desconhecido.
pulacao. O pesquisador pode nao estar interessado em estudar a concentracao
de todos os tipos de poluentes, somente alguns poluentes mais importantes para Estatsticas sao usualmente representadas por letras latinas, (por exemplo,
seu estudo. x para a media amostral, s para o desvio padrao amostral), enquanto que
Uma amostra e um subconjunto qualquer da populacao usado para obter parametros sao usualmente representados por letras gregas (por exemplo, para
informacao acerca do todo. Algumas razoes para se tomar uma amostra ao inves a media populacional, para o desvio padrao populacional).
de usar a populacao toda sao as seguintes, E claro que a medida que a amostra aumenta, mais informacao nos teremos
acerca da populacao de interesse, e portanto mais precisas serao as estimativas
custo alto para obter informacao da populacao toda, dos parametros de interesse.
tempo muito longo para obter informacao da populacao toda, Definicao 3.2 Qualquer estatstica que assume valores em e denominada um
estimador para .
algumas vezes impossvel, por exemplo, estudo de poluicao atmosferica
56
3.2. PRINCIPIOS DE ESTIMACAO 57
algumas vezes logicamente impossvel, por exemplo, em ensaios destrutivos.

Caractersticas de uma populacao que diferem de um indivduo para outro e
as quais temos interesse em estudar sao chamadas variaveis. Alguns exemplos
sao comprimento, massa, idade, temperatura, numero de ocorrencias, etc. Cada
unidade ou membro da populacao que e escolhido como parte de uma amostra
Captulo 3 fornece uma medida de uma ou mais variaveis, chamadas observacoes.
3.2 Princpios de estimacao

Estimacao
Suponha que estamos interessados em um parametro populacional (desconhecido)
. O conjunto aonde assume valores e denominado espaco parametrico.
3.1 Inferencia Estatstica Exemplo 3.1 : Se X P oisson(), entao = { : > 0}.
Inferencia estatstica e o processo pelo qual podemos tirar conclusoes acerca de Exemplo 3.2 : Se X N(, 1), entao = { : < < }.
um conjunto maior (a populacao) usando informacao de um conjunto menor (a
amostra). Em estatstica, o termo populacao nao se refere necessariamente a Exemplo 3.3 : Se X N(, 2 ), entao = {(, 2 ) : < < , 2 > 0}.
pessoas, plantas, animais, etc. Ele poderia tambem se referir por exemplo a
fosseis, rochas e sedimentos num determinado local, itens produzidos em uma Podemos estimar o parametro usando a informacao de nossa amostra. Cha-
linha de montagem, etc. mamos este unico numero que representa o valor mais plausvel do parametro
A populacao se refere a todos os casos ou situacoes sobre as quais o pesqui- (baseado nos dados amostrais) de uma estimativa pontual de . Alguns exem-
sador quer fazer inferencias e assim a caraterizacao da populacao depende do plos sao a media amostral, o desvio padrao amostral, a mediana amostral, os
problema em estudo. Diferentes pesquisadores podem querer fazer inferencias quais estimam a verdadeira media, desvio padrao e mediana da populacao (que
acerca da concentracao de poluentes num determinado lencol freatico; predizer a sao desconhecidos). Os verdadeiros (e desconhecidos) valores populacionais sao
quantidade de petroleo num poco a ser perfurado, estimar o tempo de vida util chamados parametros.
de um componente eletronico e assim por diante. Definicao 3.1 Uma estatstica e uma funcao qualquer dos elementos que
Note que o investigador nao esta interessado em todos os aspectos da po- compoem a amostra e que nao depende do parametro desconhecido.
pulacao. O pesquisador pode nao estar interessado em estudar a concentracao
de todos os tipos de poluentes, somente alguns poluentes mais importantes para Estatsticas sao usualmente representadas por letras latinas, (por exemplo,
seu estudo. x para a media amostral, s para o desvio padrao amostral), enquanto que
Uma amostra e um subconjunto qualquer da populacao usado para obter parametros sao usualmente representados por letras gregas (por exemplo, para
informacao acerca do todo. Algumas razoes para se tomar uma amostra ao inves a media populacional, para o desvio padrao populacional).
de usar a populacao toda sao as seguintes, E claro que a medida que a amostra aumenta, mais informacao nos teremos
acerca da populacao de interesse, e portanto mais precisas serao as estimativas
custo alto para obter informacao da populacao toda, dos parametros de interesse.
tempo muito longo para obter informacao da populacao toda, Definicao 3.2 Qualquer estatstica que assume valores em e denominada um
estimador para .
algumas vezes impossvel, por exemplo, estudo de poluicao atmosferica
56
58 CAPITULO 3. ESTIMACAO 3.4. TEOREMA CENTRAL DO LIMITE 59
Das definicoes acima segue entao que qualquer estimador e uma estatstica pratica nao existe forma de garantir isto sem ter informacao da populacao in-
mas nem toda estatstica define um estimador. teira para comparar com a amostra. Porem em tais circunstancias nao haveria
necessidade de amostragem.
Exemplo 3.4 : Seja uma v.a. X que representa o resultado de um experimento Ao inves disso, podemos assegurar que nao existem vcios sistematicos em
do tipo sucesso-falha, tal que X = 1 se ocorre sucesso e X = 0 se ocorre falha. O nossa amostra atraves de uma selecao aleatoria dos membros da populacao. Uma
parametro desconhecido aqui e a probabilidade de sucesso p. Se o experimento amostra aleatoria independente e uma amostra selecionada de tal forma que
for repetido digamos 10 vezes de forma independente entao a v.a. Y : numero
total de sucessos e uma estatstica porem nao e um estimador de p ja que pode 1. todos os membros da populacao tem a mesma chance de serem selecionados;
assumir valores 0, 1, . . . , 10.
2. cada combinacao possvel de um dado numero de membros tem a mesma
chance de ser selecionada.
Os exemplos mais conhecidos de estatsticas sao a media (aritmetica) amostral
n
Em princpio, a melhor forma de obter uma amostra aleatoria de tamanho
X
Xi n e ter uma lista de todos os membros da populacao, dar a todos um numero
i=1 digamos de 1 a N, e entao escolher aleatoriamente n numeros de 1 a N para definir
X=
n a amostra. E claro que na pratica isto nao sera possvel quando a populacao for
muito grande ou mesmo infinita. Para o leitor interessado neste topico um texto
a variancia amostral n
X 2 em portugues sobre o assunto e Bolfarine and Bussab (2005).
Xi X A partir de agora vamos assumir que dispomos de uma amostra segundo a
i=1
S2 = definicao a seguir.
n1
eo desvio padrao amostral, diretamente obtido a partir da variancia amostral S = Definicao 3.3 Se X representa uma caracterstica de interesse da populacao,
S 2 . Estas estatsticas sao tambem estimadores pontuais da media, variancia e uma amostra aleatoria de tamanho n e o conjunto de n variaveis aleatorias in-
desvio-padrao. dependentes X1 , . . . , Xn cada uma com a mesma distribuicao de X.
Exemplo 3.5 : No Exemplo 3.4 um possvel estimador para a probabilidade de

sucesso p e
n
3.4 Teorema Central do Limite
X
Xi
Y Uma razao para a distribuicao normal apresentada no Captulo 2 ser considerada
p = i=1 = tao importante e porque, qualquer que seja a distribuicao da variavel de interesse,
n n
a distribuicao das medias amostrais tendera a uma distribuicao normal a medida
ou seja, a proporcao amostral de sucessos. Se Y = k for observado entao a
que o tamanho de amostra cresce. Ou seja podemos ter uma caracterstica popu-
estimativa de p sera p = k/n, por exemplo se foram obtidos 3 sucessos nas 10
lacional com uma distribuicao muito diferente da normal, podendo ate mesmo ser
replicacoes do experimento entao p = 0, 3. A diferenca fundamental aqui e que o
discreta, mas se tomarmos varias amostras grandes desta distribuicao, e entao
estimador Y /n e uma variavel aleatoria cujos possveis valores sao 0, 1/10, . . . , 1
fizermos um histograma das medias amostrais, a forma se parecera como uma
enquanto a estimativa k/n e um numero.
curva normal.
3.3 Obtendo uma amostra Exemplo 3.6 : O diagrama na Figura 3.1 apresenta os resultados de um
experimento no qual 2000 observacoes foram simuladas de duas distribuicoes
Obtemos uma amostra para fazer inferencias de uma populacao. Nossas in- bem diferentes, uniforme discreta em {0, 1, . . . , 10} e exponencial com media 2.
ferencias sao validas somente se a amostra e representativa da populacao. Na Os histogramas destes valores estao na primeira linha. Foram entao geradas
58 CAPITULO 3. ESTIMACAO 3.4. TEOREMA CENTRAL DO LIMITE 59
Das definicoes acima segue entao que qualquer estimador e uma estatstica pratica nao existe forma de garantir isto sem ter informacao da populacao in-
mas nem toda estatstica define um estimador. teira para comparar com a amostra. Porem em tais circunstancias nao haveria
necessidade de amostragem.
Exemplo 3.4 : Seja uma v.a. X que representa o resultado de um experimento Ao inves disso, podemos assegurar que nao existem vcios sistematicos em
do tipo sucesso-falha, tal que X = 1 se ocorre sucesso e X = 0 se ocorre falha. O nossa amostra atraves de uma selecao aleatoria dos membros da populacao. Uma
parametro desconhecido aqui e a probabilidade de sucesso p. Se o experimento amostra aleatoria independente e uma amostra selecionada de tal forma que
for repetido digamos 10 vezes de forma independente entao a v.a. Y : numero
total de sucessos e uma estatstica porem nao e um estimador de p ja que pode 1. todos os membros da populacao tem a mesma chance de serem selecionados;
assumir valores 0, 1, . . . , 10.
2. cada combinacao possvel de um dado numero de membros tem a mesma
chance de ser selecionada.
Os exemplos mais conhecidos de estatsticas sao a media (aritmetica) amostral
n
Em princpio, a melhor forma de obter uma amostra aleatoria de tamanho
X
Xi n e ter uma lista de todos os membros da populacao, dar a todos um numero
i=1 digamos de 1 a N, e entao escolher aleatoriamente n numeros de 1 a N para definir
X=
n a amostra. E claro que na pratica isto nao sera possvel quando a populacao for
muito grande ou mesmo infinita. Para o leitor interessado neste topico um texto
a variancia amostral n
X 2 em portugues sobre o assunto e Bolfarine and Bussab (2005).
Xi X A partir de agora vamos assumir que dispomos de uma amostra segundo a
i=1
S2 = definicao a seguir.
n1
eo desvio padrao amostral, diretamente obtido a partir da variancia amostral S = Definicao 3.3 Se X representa uma caracterstica de interesse da populacao,
S 2 . Estas estatsticas sao tambem estimadores pontuais da media, variancia e uma amostra aleatoria de tamanho n e o conjunto de n variaveis aleatorias in-
desvio-padrao. dependentes X1 , . . . , Xn cada uma com a mesma distribuicao de X.
Exemplo 3.5 : No Exemplo 3.4 um possvel estimador para a probabilidade de

sucesso p e
n
3.4 Teorema Central do Limite
X
Xi
Y Uma razao para a distribuicao normal apresentada no Captulo 2 ser considerada
p = i=1 = tao importante e porque, qualquer que seja a distribuicao da variavel de interesse,
n n
a distribuicao das medias amostrais tendera a uma distribuicao normal a medida
ou seja, a proporcao amostral de sucessos. Se Y = k for observado entao a
que o tamanho de amostra cresce. Ou seja podemos ter uma caracterstica popu-
estimativa de p sera p = k/n, por exemplo se foram obtidos 3 sucessos nas 10
lacional com uma distribuicao muito diferente da normal, podendo ate mesmo ser
replicacoes do experimento entao p = 0, 3. A diferenca fundamental aqui e que o
discreta, mas se tomarmos varias amostras grandes desta distribuicao, e entao
estimador Y /n e uma variavel aleatoria cujos possveis valores sao 0, 1/10, . . . , 1
fizermos um histograma das medias amostrais, a forma se parecera como uma
enquanto a estimativa k/n e um numero.
curva normal.
3.3 Obtendo uma amostra Exemplo 3.6 : O diagrama na Figura 3.1 apresenta os resultados de um
experimento no qual 2000 observacoes foram simuladas de duas distribuicoes
Obtemos uma amostra para fazer inferencias de uma populacao. Nossas in- bem diferentes, uniforme discreta em {0, 1, . . . , 10} e exponencial com media 2.
ferencias sao validas somente se a amostra e representativa da populacao. Na Os histogramas destes valores estao na primeira linha. Foram entao geradas
60 CAPITULO 3. ESTIMACAO 3.5. PROBLEMAS 61
2000 amostras de tamanhos 2, 5 e 15 de cada distribuicao e calculadas as medias

amostrais. A segunda, terceira e quarta linhas mostram os histogramas das Figura 3.1: Histogramas dos valores simulados de 2 distribuicoes (1a linha) e das
medias amostrais resultantes. medias amostrais de tamanhos 2, 5 e 15 .
Note como a forma da distribuicao muda a medida que se muda de uma
200 400
200 400
linha para a proxima, e como as duas distribuicoes em cada linha tornam-se mais
similares nas suas formas a medida que o tamanho das amostras aumenta. Ainda
mais, cada distribuicao parece mais e mais com uma distribuicao normal. Nao e
necessario uma amostra de tamanho muito grande para ver uma forma normal.
0
As medias populacionais para as duas distribuicoes sao 5 e 2 respectivamente.
0 2 4 6 8 10 0 5 10 15
Note como, quanto maior o tamanho de amostra mais perto as medias amostrais x y
tendem a estar da media populacional.
A justificativa teorica para o que observamos neste exemplo e baseada no
chamado Teorema Central do Limite (TCL). Para amostras grandes X1 , . . . , Xn ,
300
150
se E(Xi ) = e V ar(Xi ) = 2 para i = 1, . . . , n temos o seguinte resultado
150
A distribuicao da media amostral X e aproximadamente

0 50
Normal com media e desvio padrao / n.
0
Usaremos a notacao 0 2 4 6 8 10 0 2 4 6 8 10
x y
X N(, 2 /n).
A aproximacao para a normal melhora a medida que o tamanho amostral
400
cresce. Este resultado nos permite conduzir alguns procedimentos de inferencia
250
sem qualquer conhecimento da distribuicao da populacao.
Uma observacao importante e que se a variavel original X ja tem distribuicao
200
0 100
normal entao X N(, 2 /n) qualquer que seja o valor de n. Este importante
resultado decorre da seguinte propriedade, se X1 , . . . , Xn sao v.a. independentes
0
tais que Xi N(i , i2 ) entao 2 4 6 8 0 1 2 3 4 5 6
! x y
Xn Xn n
X
Y = Xi N i , i2 .
i=1 i=1 i=1
200
250
3.5 Problemas
100
0 100
1. Explique as diferencas entre estatsticas, estimadores e estimativas.
0
2. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 3 4 5 6 7 8 1 2 3 4
distribuicao Bernoulli, isto e P [Xi = 1] = p e P [Xi = 1] = 1 p. Ache a x y
P
distribuicao aproximada (para n grande) de Y = ni=1 Xi .
2000 amostras de tamanhos 2, 5 e 15 de cada distribuicao e calculadas as medias

amostrais. A segunda, terceira e quarta linhas mostram os histogramas das Figura 3.1: Histogramas dos valores simulados de 2 distribuicoes (1a linha) e das
medias amostrais resultantes. medias amostrais de tamanhos 2, 5 e 15 .
Note como a forma da distribuicao muda a medida que se muda de uma
200 400
200 400
linha para a proxima, e como as duas distribuicoes em cada linha tornam-se mais
similares nas suas formas a medida que o tamanho das amostras aumenta. Ainda
mais, cada distribuicao parece mais e mais com uma distribuicao normal. Nao e
necessario uma amostra de tamanho muito grande para ver uma forma normal.
0
As medias populacionais para as duas distribuicoes sao 5 e 2 respectivamente.
0 2 4 6 8 10 0 5 10 15
Note como, quanto maior o tamanho de amostra mais perto as medias amostrais x y
tendem a estar da media populacional.
A justificativa teorica para o que observamos neste exemplo e baseada no
chamado Teorema Central do Limite (TCL). Para amostras grandes X1 , . . . , Xn ,
300
150
se E(Xi ) = e V ar(Xi ) = 2 para i = 1, . . . , n temos o seguinte resultado
150
A distribuicao da media amostral X e aproximadamente

0 50
Normal com media e desvio padrao / n.
0
Usaremos a notacao 0 2 4 6 8 10 0 2 4 6 8 10
x y
X N(, 2 /n).
A aproximacao para a normal melhora a medida que o tamanho amostral
400
cresce. Este resultado nos permite conduzir alguns procedimentos de inferencia
250
sem qualquer conhecimento da distribuicao da populacao.
Uma observacao importante e que se a variavel original X ja tem distribuicao
200
0 100
normal entao X N(, 2 /n) qualquer que seja o valor de n. Este importante
resultado decorre da seguinte propriedade, se X1 , . . . , Xn sao v.a. independentes
0
tais que Xi N(i , i2 ) entao 2 4 6 8 0 1 2 3 4 5 6
! x y
Xn Xn n
X
Y = Xi N i , i2 .
i=1 i=1 i=1
200
250
3.5 Problemas
100
0 100
1. Explique as diferencas entre estatsticas, estimadores e estimativas.
0
2. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 3 4 5 6 7 8 1 2 3 4
distribuicao Bernoulli, isto e P [Xi = 1] = p e P [Xi = 1] = 1 p. Ache a x y
P
distribuicao aproximada (para n grande) de Y = ni=1 Xi .
62 CAPITULO 3. ESTIMACAO 3.6. INTERVALOS DE CONFIANCA 63
3. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 11. Em uma certa cidade, a duracao das conversas telefonicas em minutos,
distribuicao exponencial todas com o mesmo parametro . Ache a distri- originarias de telefones publicos segue o modelo exponencial com parametro
P
buicao aproximada (para n grande) de Y = ni=1 Xi . 1/3. Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
a probabilidade delas, em media, nao ultrapassarem 4 minutos?
4. Uma variavel aleatoria X pode assumir os valores 1, 3 ou 6 com probabili-
dades 0,45; 0,25 e 0,3. Em uma amostra de 30 observacoes desta variavel
calcule a probabilidade da media amostral ser maior do que 3.5.
3.6 Intervalos de Confianca
5. Dada uma populacao normal X com media 605 e desvio-padrao 16, se
uma amostra aleatoria de tamanho 64 for selecionada calcule P (X > 602), Quando estimamos um parametro atraves de um unico valor numerico (es-
P (X > 610), P (602 < X < 610) e P (|X| > 610). timacao pontual) toda a informacao presente nos dados e resumida atraves deste
numero. E importante encontrar tambem um intervalo de valores plausveis para
6. Se uma populacao normal X tem media 100 e variancia 2,25 e uma amostra o parametro.
aleatoria de tamanho 16 for selecionada calcule P (X > 105), P (X < 96), e A ideia e construir um intervalo em torno da estimativa pontual de modo que
P (|X| > 103). ele tenha uma probabilidade conhecida de conter o verdadeiro valor do parametro.
Assim, se
7. O tempo medio de vida de um componente eletronico e igual a 10 (milhares P (T1 < < T2 ) = 1
de horas) e a variancia tambem e igual a 10. Uma amostra aleatoria de
entao t1 < < t2 e denominado intervalo de confianca (I.C.) para com nvel
50 componentes foi selecionada e o tempo ate a falha de cada um deles foi
de confianca 1 . A escolha do nvel de confianca depende da precisao com
registrado. Calcule a probabilidade de que o tempo medio amostral esteja
que queremos estimar o parametro, sendo que 0,90, 0,95 e 0,99 sao os valores
entre 9 e 12.
mais comuns na pratica. Vale notar no entanto que o aumento da confianca no
8. Suponha que um lote contendo 1000 itens possui uma proporcao p de itens intervalo implica necessariamente no aumento de sua amplitude.
defeituosos. Definindo-se a v.a. X = 1 se um item e defeituoso e X = 0 Tecnicamente, dizemos que 100(1 )% de todos os intervalos de confianca
caso contrario entao X tem media igual a p e variancia p(1 p). Calcule que construirmos conterao o verdadeiro valor do parametro (dado que todas as
a probabilidade de uma amostra de 40 itens deste lote apresentar mais do suposicoes envolvidas estejam corretas). Por exemplo se 1 = 0, 95 entao,
que 25% de defeituosos sabendo-se que p = 0, 20. em media, somente 5 a cada 100 intervalos nao conterao . Podemos obter
intervalos de confianca para medias, diferencas de medias, proporcoes, diferencas
9. Uma peca e montada conectando-se tres partes componentes de modo que em proporcoes, etc.
o comprimento da peca e a soma dos comprimentos das partes. Cada uma
de tres maquinas produz, de forma independente, uma das partes segundo
uma distribuicao normal. Sabe-se que as maquinas foram ajustadas para 3.6.1 Intervalos de confianca para a media
produzir partes com comprimentos medios iguais a 2,3; 2,1 e 2,5 cm e
desvios-padroes 1,0. Calcule a probabilidade de uma peca ter comprimento Na Secao 3.4 vimos que para uma amostra suficientemente grande a distribuicao
maior do que 7 cm. das medias amostrais em torno da media populacional e normal com desvio

padrao / n,

10. As alturas de mulheres e homens (em polegadas) em certa populacao tem n(X )
U= N(0, 1).
distribuicoes N(65,12) e N(68,22) respectivamente. Uma mulher e um ho-

mem foram selecionados ao acaso e de forma independente. Qual a proba- Chamamos / n o erro padrao da media amostral, uma vez que quanto menor
bilidade da mulher ser mais alta? seu valor mais proximas estarao as medias amostrais da media populacional
3. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 11. Em uma certa cidade, a duracao das conversas telefonicas em minutos,
distribuicao exponencial todas com o mesmo parametro . Ache a distri- originarias de telefones publicos segue o modelo exponencial com parametro
P
buicao aproximada (para n grande) de Y = ni=1 Xi . 1/3. Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
a probabilidade delas, em media, nao ultrapassarem 4 minutos?
4. Uma variavel aleatoria X pode assumir os valores 1, 3 ou 6 com probabili-
dades 0,45; 0,25 e 0,3. Em uma amostra de 30 observacoes desta variavel
calcule a probabilidade da media amostral ser maior do que 3.5.
3.6 Intervalos de Confianca
5. Dada uma populacao normal X com media 605 e desvio-padrao 16, se
uma amostra aleatoria de tamanho 64 for selecionada calcule P (X > 602), Quando estimamos um parametro atraves de um unico valor numerico (es-
P (X > 610), P (602 < X < 610) e P (|X| > 610). timacao pontual) toda a informacao presente nos dados e resumida atraves deste
numero. E importante encontrar tambem um intervalo de valores plausveis para
6. Se uma populacao normal X tem media 100 e variancia 2,25 e uma amostra o parametro.
aleatoria de tamanho 16 for selecionada calcule P (X > 105), P (X < 96), e A ideia e construir um intervalo em torno da estimativa pontual de modo que
P (|X| > 103). ele tenha uma probabilidade conhecida de conter o verdadeiro valor do parametro.
Assim, se
7. O tempo medio de vida de um componente eletronico e igual a 10 (milhares P (T1 < < T2 ) = 1
de horas) e a variancia tambem e igual a 10. Uma amostra aleatoria de
entao t1 < < t2 e denominado intervalo de confianca (I.C.) para com nvel
50 componentes foi selecionada e o tempo ate a falha de cada um deles foi
de confianca 1 . A escolha do nvel de confianca depende da precisao com
registrado. Calcule a probabilidade de que o tempo medio amostral esteja
que queremos estimar o parametro, sendo que 0,90, 0,95 e 0,99 sao os valores
entre 9 e 12.
mais comuns na pratica. Vale notar no entanto que o aumento da confianca no
8. Suponha que um lote contendo 1000 itens possui uma proporcao p de itens intervalo implica necessariamente no aumento de sua amplitude.
defeituosos. Definindo-se a v.a. X = 1 se um item e defeituoso e X = 0 Tecnicamente, dizemos que 100(1 )% de todos os intervalos de confianca
caso contrario entao X tem media igual a p e variancia p(1 p). Calcule que construirmos conterao o verdadeiro valor do parametro (dado que todas as
a probabilidade de uma amostra de 40 itens deste lote apresentar mais do suposicoes envolvidas estejam corretas). Por exemplo se 1 = 0, 95 entao,
que 25% de defeituosos sabendo-se que p = 0, 20. em media, somente 5 a cada 100 intervalos nao conterao . Podemos obter
intervalos de confianca para medias, diferencas de medias, proporcoes, diferencas
9. Uma peca e montada conectando-se tres partes componentes de modo que em proporcoes, etc.
o comprimento da peca e a soma dos comprimentos das partes. Cada uma
de tres maquinas produz, de forma independente, uma das partes segundo
uma distribuicao normal. Sabe-se que as maquinas foram ajustadas para 3.6.1 Intervalos de confianca para a media
produzir partes com comprimentos medios iguais a 2,3; 2,1 e 2,5 cm e
desvios-padroes 1,0. Calcule a probabilidade de uma peca ter comprimento Na Secao 3.4 vimos que para uma amostra suficientemente grande a distribuicao
maior do que 7 cm. das medias amostrais em torno da media populacional e normal com desvio

padrao / n,

10. As alturas de mulheres e homens (em polegadas) em certa populacao tem n(X )
U= N(0, 1).
distribuicoes N(65,12) e N(68,22) respectivamente. Uma mulher e um ho-

mem foram selecionados ao acaso e de forma independente. Qual a proba- Chamamos / n o erro padrao da media amostral, uma vez que quanto menor
bilidade da mulher ser mais alta? seu valor mais proximas estarao as medias amostrais da media populacional
(i.e. menor sera o erro). Portanto, A Tabela ?? apresenta os valores de t tais que
media populacional = P (|X| > t) = P (X < t) + P (X > t) = p,

desvio padrao populacional =
sendo que X tem distribuicao t de Student com r graus de liberdade. Para
erro padrao da media amostral = / n
p = 0, 05 tomamos o valor correspondente a linha r = n 1 graus de liberdade.
Entao por exemplo se n = 10 um intervalo de confianca de 95% para e
Isto significa que 68,3% de todas as medias amostrais estarao dentro de 1 erro
padrao em torno da media populacional pois
s s

x 2, 262 , x + 2, 262 .
n n
P ( / n < X < + / n) 0, 683.
Note ainda que a medida que n cresce, o valor de t torna-se mais proximo de 1,96.
Similarmente, da tabela da distribuicao normal padronizada obtemos que Isto ocorre porque a distribuicao t de Student tende para a distribuicao normal
a medida que n cresce.
P (1, 96 < U < 1, 96) = 2P (0 < U < 1, 96) = 2 0, 475 = 0, 95
No caso geral, quando o desvio padrao populacional for desconhecido o inter-
ou seja, 95% de todas as medias amostrais estarao dentro de 1, 96 erros padroes valo de confianca de 100(1 )% para a media e
em torno de . Sendo assim, intervalos da forma
s s
x t/2 , x + t/2 .
n n
x 1, 96 , x + 1, 96
n n
Note que quanto menor n, maiores os valores de t obtidos na tabela e maior sera
conterao a verdadeira media populacional em 95% das vezes. a amplitude do intervalo.
No caso geral, um intervalo de confianca de 100(1 )% para a media e
dado por Exemplo 3.7 : Foram medidos os diametros de 9 arvores de uma certa especie

x z/2 , x + z/2 em um floresta e obteve-se os seguintes valores amostrais: 19,4 21,4 22,3 22,1 20,1
n n
23,8 24,6 19,9 21,5. Queremos encontrar um intervalo de confianca de 95% para
sendo o valor de z/2 obtido na tabela da normal padronizada de modo que o verdadeiro diametro medio de todas as arvores desta especie nesta floresta.
P (z/2 < Z < z/2 ) = 1 .
Podemos assumir que a variavel aleatoria X = diametro de cada arvore tem
distribuicao N(, 2 ) onde ambos e 2 sao desconhecidos. Usando a tabela da
Variancia Desconhecida distribuicao t com p = 0, 05 e 8 graus de liberdade obtemos que t/2 = 2, 3. A
media e o desvio padrao amostrais podem ser calculados e obtemos x = 21, 7 e
Um problema com a construcao de tais intervalos e que nao conhecemos o ver-
dadeiro desvio padrao populacional . Portanto, vamos substituir pelo desvio s = 1, 75. Assim o I.C. de 95% fica
padrao amostral s mas ao inves de usar o valor 1,96, usaremos um valor ligeira-
1, 75 1, 75

mente maior para refletir nossa reducao na confianca. Aqui usaremos a estatstica 21, 7 2, 3 ; 21, 7 + 2, 3 = (20, 4; 23, 0)
3 3
X
Portanto estamos 95% confiantes de que o diametro medio da populacao da
S/ n
qual a amostra foi retirada esta entre 20,4 e 23,0. Outra interpretacao e que se
que tem distribuicao t de Student (ou simplesmente t) com n 1 graus de liber- todas as possveis amostras de 9 diametros fossem obtidas e os I.C. construidos,
dade. 95% deles conteriam .
(i.e. menor sera o erro). Portanto, A Tabela ?? apresenta os valores de t tais que
media populacional = P (|X| > t) = P (X < t) + P (X > t) = p,

desvio padrao populacional =
sendo que X tem distribuicao t de Student com r graus de liberdade. Para
erro padrao da media amostral = / n
p = 0, 05 tomamos o valor correspondente a linha r = n 1 graus de liberdade.
Entao por exemplo se n = 10 um intervalo de confianca de 95% para e
Isto significa que 68,3% de todas as medias amostrais estarao dentro de 1 erro
padrao em torno da media populacional pois
s s

x 2, 262 , x + 2, 262 .
n n
P ( / n < X < + / n) 0, 683.
Note ainda que a medida que n cresce, o valor de t torna-se mais proximo de 1,96.
Similarmente, da tabela da distribuicao normal padronizada obtemos que Isto ocorre porque a distribuicao t de Student tende para a distribuicao normal
a medida que n cresce.
P (1, 96 < U < 1, 96) = 2P (0 < U < 1, 96) = 2 0, 475 = 0, 95
No caso geral, quando o desvio padrao populacional for desconhecido o inter-
ou seja, 95% de todas as medias amostrais estarao dentro de 1, 96 erros padroes valo de confianca de 100(1 )% para a media e
em torno de . Sendo assim, intervalos da forma
s s
x t/2 , x + t/2 .
n n
x 1, 96 , x + 1, 96
n n
Note que quanto menor n, maiores os valores de t obtidos na tabela e maior sera
conterao a verdadeira media populacional em 95% das vezes. a amplitude do intervalo.
No caso geral, um intervalo de confianca de 100(1 )% para a media e
dado por Exemplo 3.7 : Foram medidos os diametros de 9 arvores de uma certa especie

x z/2 , x + z/2 em um floresta e obteve-se os seguintes valores amostrais: 19,4 21,4 22,3 22,1 20,1
n n
23,8 24,6 19,9 21,5. Queremos encontrar um intervalo de confianca de 95% para
sendo o valor de z/2 obtido na tabela da normal padronizada de modo que o verdadeiro diametro medio de todas as arvores desta especie nesta floresta.
P (z/2 < Z < z/2 ) = 1 .
Podemos assumir que a variavel aleatoria X = diametro de cada arvore tem
distribuicao N(, 2 ) onde ambos e 2 sao desconhecidos. Usando a tabela da
Variancia Desconhecida distribuicao t com p = 0, 05 e 8 graus de liberdade obtemos que t/2 = 2, 3. A
media e o desvio padrao amostrais podem ser calculados e obtemos x = 21, 7 e
Um problema com a construcao de tais intervalos e que nao conhecemos o ver-
dadeiro desvio padrao populacional . Portanto, vamos substituir pelo desvio s = 1, 75. Assim o I.C. de 95% fica
padrao amostral s mas ao inves de usar o valor 1,96, usaremos um valor ligeira-
1, 75 1, 75

mente maior para refletir nossa reducao na confianca. Aqui usaremos a estatstica 21, 7 2, 3 ; 21, 7 + 2, 3 = (20, 4; 23, 0)
3 3
X
Portanto estamos 95% confiantes de que o diametro medio da populacao da
S/ n
qual a amostra foi retirada esta entre 20,4 e 23,0. Outra interpretacao e que se
que tem distribuicao t de Student (ou simplesmente t) com n 1 graus de liber- todas as possveis amostras de 9 diametros fossem obtidas e os I.C. construidos,
dade. 95% deles conteriam .

3.6.2 Intervalos de confianca para uma proporcao 1/ 4n. Neste caso, um intervalo de confianca conservativo e dado por
r r !
1 1
Pesquisadores frequentemente expressam a frequencia de ocorrencia de um item p z/2 , p + z/2 .
4n 4n
numa amostra como uma proporcao do total. Por exemplo, uma amostra de larvas
de mosquito coletadas de um lago com agua limpa parada contem 80 larvas das No entanto, se o verdadeiro valor de p estiver afastado do seu valor maximo e es-
quais 60 sao de uma certa especie. A proporcao daquela especie na amostra e tiver proximo de 0 ou de 1 entao este intervalo tem amplitude desnecessariamente
60/80 = 0, 75. Considerando esta amostra uma amostra aleatoria, esta proporcao grande porque substituimos p(1 p) pelo seu valor maximo.
e uma estimativa da proporcao total populacional. Outras amostras forneceriam
estimativas ligeiramente diferentes daquela proporcao. Exemplo 3.8 : No caso das larvas de mosquito descrito acima temos que n = 80
e p = 0, 75. Portanto um intervalo de confianca de 95% para proporcao de larvas
Seja n o tamanho da amostra e seja x o numero observado do evento de inte-
e !
resse. Entao estimamos a proporcao populacional p com a proporcao observada r r
0, 75(0, 25) 0, 75(0, 25)
p = x/n. 0, 75 1, 96 , 0, 75 + 1, 96
80 80
Da mesma forma que um conjunto de medias amostrais sao distribudas nas e entao podemos afirmar, com 95% de confianca, que a verdadeira proporcao esta
proximidades da media populacional, as proporcoes amostrais p sao distribudas entre 0,655 e 0,845.
ao redor da verdadeira proporcao populacional p. Devido ao Teorema Central do
Limite, para n grande e p nao muito proximo de 0 ou 1, a distribuicao de p sera
aproximadamente normal com media p e um desvio padrao dado por
r 3.6.3 Comparacao de intervalos de confianca
p(1 p)
.
n
Suponha que tenhamos dois ou mais grupos separados, por exemplo, machos e
Este e o erro padrao da proporcao amostral e podemos usar isto na construcao femeas. Algumas vezes pode-se construir um intervalo de confianca de 95% para a
de um intervalo de confianca para a verdadeira proporcao p. media para cada um dos grupos, e entao controi-se um grafico com esses intervalos
contra um eixo comum para verificar se existe uma intersecao (i.e. se existem
No entanto este erro padrao depende do valor desconhecido de p e aqui duas alguns valores em comum). Se os intervalos nao se sobrepoem, entao temos (pelo
abordagens sao possveis. Um enfoque consiste em substituir p pela sua estimativa menos) 95% de confianca de que as verdadeiras medias nao sao iguais. Embora
pontual, i.e. a proporcao amostral de sucessos p. Neste caso, um intervalo de estes graficos sejam uteis para visualizacao, utilizaremos um abordagem mais
confianca de aproximadamente 95% para p e dado por formal no captulo 5 para construir um intervalo de confianca para a diferenca
r r ! entre duas medias ou duas proporcoes.
p(1 p) p(1 p)
p 1, 96 , p + 1, 96 .
n n
Exemplo 3.9 : Considere os dados de um estudo investigando a existencia de um
Aqui usaremos como regra geral que este intervalo de confianca e valido se tiver- equilbrio entre a proporcao de peixes machos e femeas de uma certa especie em
mos ambos np e n(1 p) maiores ou iguais a 5. Em alguns livros o divisor n 1 dois lagos distintos. A proporcao observada de machos capturados no primeiro
e utlizado mas nao se preocupe quanto a isso pois o intervalo resultante nao sera lago foi 74,4% dentre 43 capturados e no segundo foi 60% dentre 50. Pode-
notavelmente diferente. mos agora construir intervalos de confianca para as proporcoes verdadeiras nas
populacoes dos dois lagos. Neste caso temos que
pde p(1 p) e
Alternativamente, podemos usar o fato de que o valor maximo
atingido para p = 1/2, logo p(1 p) 1/4, ou equivalentemente p(1 p)/n np = 32, 25 e n(1 p) = 10.75

3.6.2 Intervalos de confianca para uma proporcao 1/ 4n. Neste caso, um intervalo de confianca conservativo e dado por
r r !
1 1
Pesquisadores frequentemente expressam a frequencia de ocorrencia de um item p z/2 , p + z/2 .
4n 4n
numa amostra como uma proporcao do total. Por exemplo, uma amostra de larvas
de mosquito coletadas de um lago com agua limpa parada contem 80 larvas das No entanto, se o verdadeiro valor de p estiver afastado do seu valor maximo e es-
quais 60 sao de uma certa especie. A proporcao daquela especie na amostra e tiver proximo de 0 ou de 1 entao este intervalo tem amplitude desnecessariamente
60/80 = 0, 75. Considerando esta amostra uma amostra aleatoria, esta proporcao grande porque substituimos p(1 p) pelo seu valor maximo.
e uma estimativa da proporcao total populacional. Outras amostras forneceriam
estimativas ligeiramente diferentes daquela proporcao. Exemplo 3.8 : No caso das larvas de mosquito descrito acima temos que n = 80
e p = 0, 75. Portanto um intervalo de confianca de 95% para proporcao de larvas
Seja n o tamanho da amostra e seja x o numero observado do evento de inte-
e !
resse. Entao estimamos a proporcao populacional p com a proporcao observada r r
0, 75(0, 25) 0, 75(0, 25)
p = x/n. 0, 75 1, 96 , 0, 75 + 1, 96
80 80
Da mesma forma que um conjunto de medias amostrais sao distribudas nas e entao podemos afirmar, com 95% de confianca, que a verdadeira proporcao esta
proximidades da media populacional, as proporcoes amostrais p sao distribudas entre 0,655 e 0,845.
ao redor da verdadeira proporcao populacional p. Devido ao Teorema Central do
Limite, para n grande e p nao muito proximo de 0 ou 1, a distribuicao de p sera
aproximadamente normal com media p e um desvio padrao dado por
r 3.6.3 Comparacao de intervalos de confianca
p(1 p)
.
n
Suponha que tenhamos dois ou mais grupos separados, por exemplo, machos e
Este e o erro padrao da proporcao amostral e podemos usar isto na construcao femeas. Algumas vezes pode-se construir um intervalo de confianca de 95% para a
de um intervalo de confianca para a verdadeira proporcao p. media para cada um dos grupos, e entao controi-se um grafico com esses intervalos
contra um eixo comum para verificar se existe uma intersecao (i.e. se existem
No entanto este erro padrao depende do valor desconhecido de p e aqui duas alguns valores em comum). Se os intervalos nao se sobrepoem, entao temos (pelo
abordagens sao possveis. Um enfoque consiste em substituir p pela sua estimativa menos) 95% de confianca de que as verdadeiras medias nao sao iguais. Embora
pontual, i.e. a proporcao amostral de sucessos p. Neste caso, um intervalo de estes graficos sejam uteis para visualizacao, utilizaremos um abordagem mais
confianca de aproximadamente 95% para p e dado por formal no captulo 5 para construir um intervalo de confianca para a diferenca
r r ! entre duas medias ou duas proporcoes.
p(1 p) p(1 p)
p 1, 96 , p + 1, 96 .
n n
Exemplo 3.9 : Considere os dados de um estudo investigando a existencia de um
Aqui usaremos como regra geral que este intervalo de confianca e valido se tiver- equilbrio entre a proporcao de peixes machos e femeas de uma certa especie em
mos ambos np e n(1 p) maiores ou iguais a 5. Em alguns livros o divisor n 1 dois lagos distintos. A proporcao observada de machos capturados no primeiro
e utlizado mas nao se preocupe quanto a isso pois o intervalo resultante nao sera lago foi 74,4% dentre 43 capturados e no segundo foi 60% dentre 50. Pode-
notavelmente diferente. mos agora construir intervalos de confianca para as proporcoes verdadeiras nas
populacoes dos dois lagos. Neste caso temos que
pde p(1 p) e
Alternativamente, podemos usar o fato de que o valor maximo
atingido para p = 1/2, logo p(1 p) 1/4, ou equivalentemente p(1 p)/n np = 32, 25 e n(1 p) = 10.75
68 CAPITULO 3. ESTIMACAO 3.7. COMENTARIO 69
no primeiro lago e disso, este intervalo nao e simetrico em torno da estimativa pontual e por isso
np = 30 e n(1 p) = 20 temos que obter 2 valores da distribuicao qui-quadrado cujos valores absolutos
sao diferentes, um a ser utilizado no limite inferior e outro a ser utilizado no
no segundo lago. Portanto, os intervalos de confianca aproximados de 95% para
limite superior do intervalo.
a verdadeira proporcao de machos ficam
p p
[0, 75 1, 96 0, 75(0, 25)/43; 0, 75 + 1, 96 0, 75(0, 25)/43] = [0, 621; 0, 879]
p p
3.7 Comentario
[0, 60 1, 96 0, 60(0, 40)/50; 0, 60 + 1, 96 0, 60(0, 40)/50] = [0, 464; 0, 736].
A forma como intervalos de confianca sao construidos pode dar margem a inter-
A conclusao e que temos 95% de confianca de que a proporcao de machos e a pretacoes erroneas, o que alias acontece com bastante frequencia. Um parametro
mesma nos dois lagos. e sempre desconhecido mas fixo e portanto nao e passvel de descricao proba-
bilstica, ou seja nao se trata de um intervalo de probabilidade para (embora
intuitivamente e o que gostariamos que fosse). Na verdade os limites do intervalo
3.6.4 Intervalo de Confianca para Variancia
e que sao variaveis aleatorias e apos a amostra ser observada dizemos por exemplo
Em muitas situacoes existe interesse tambem em estimar a variabilidade do pro- que

cesso. Para obter estimativas intervalares da variancia populacional 2 sao apli- x z/2 x + z/2
n n
cados os mesmos princpios utilizados para estimar a media. Aqui usamos a
seguinte quantidade com confianca 100(1 )%. Nao e possvel inferir se o parametro esta mais
(n 1)S 2 proximo de um ou outro limite, embora novamente seja isto que intuitivamente
2 gostariamos de fazer.
que tem uma distribuicao chamada qui-quadrado (2 ) com n 1 graus de liber- Mas nem tudo esta perdido. A Estatstica Bayesiana admite que um
dade e o intervalo de confianca utiliza valores desta distribuicao. A Tabela ?? parametro pode ser tratado como variavel aleatoria e portanto obtem interva-
fornece valores x desta distribuicao tais que a probabilidade a direita de x e igual los de probabilidade para eles. Este assunto nao sera abordado neste texto e
a p (primeira linha da tabela) segundo o numero de graus de liberdade (primeira algumas referencias sao Migon and Gamerman (1999) ou DeGroot (1989).
coluna da tabela). Por exemplo, se uma v.a. Y tem distribuicao 2 com 10 graus
de liberdade entao P (Y > 18, 307) = 0, 05.
Para construir um IC de 100(1 )% para 2 devemos entao obter os valores 3.8 Problemas
2/2,n1 e 2/2,n1 desta distribuicao tais que
1. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma media
de 72,9 batidas por minuto (bpm) e um desvio padrao de 11,0 bpm foram
(n 1)S 2
P 2/2,n1 2
/2,n1 = 1 . obtidos. Construa um intervalo de confianca de 95% para a pulsacao media
2
em repouso de pessoas sadias com base nesses dados.
Apos observar a amostra teremos o valor numerico s2 de S 2 e segue que
2. Tendo sido medido o eixo maior de 9 graos de quartzo de um corpo arenoso
(n 1)s2 (n 1)s2 em uma lamina de arenito, obteve-se um comprimento amostral medio de
2 < 2 < 2
/2,n1 /2,n1 1,5mm e um desvio padrao de 0,3mm. Deseja-se construir um intervalo de
confianca para o comprimento medio dos graos de quartzo do corpo arenoso.
com 100(1 )% de confianca (ou seja este e o IC).
Note que o intervalo nao depende da media amostral x mas somente do grau 3. Os QIs de 181 meninos com idades entre 6-7 anos de Curitiba foram medi-
de dispersao dos dados, medido atraves do desvio padrao amostral s2 . Alem dos. O QI medio foi 108,08, e o desvio padrao foi 14,38.
68 CAPITULO 3. ESTIMACAO 3.7. COMENTARIO 69
no primeiro lago e disso, este intervalo nao e simetrico em torno da estimativa pontual e por isso
np = 30 e n(1 p) = 20 temos que obter 2 valores da distribuicao qui-quadrado cujos valores absolutos
sao diferentes, um a ser utilizado no limite inferior e outro a ser utilizado no
no segundo lago. Portanto, os intervalos de confianca aproximados de 95% para
limite superior do intervalo.
a verdadeira proporcao de machos ficam
p p
[0, 75 1, 96 0, 75(0, 25)/43; 0, 75 + 1, 96 0, 75(0, 25)/43] = [0, 621; 0, 879]
p p
3.7 Comentario
[0, 60 1, 96 0, 60(0, 40)/50; 0, 60 + 1, 96 0, 60(0, 40)/50] = [0, 464; 0, 736].
A forma como intervalos de confianca sao construidos pode dar margem a inter-
A conclusao e que temos 95% de confianca de que a proporcao de machos e a pretacoes erroneas, o que alias acontece com bastante frequencia. Um parametro
mesma nos dois lagos. e sempre desconhecido mas fixo e portanto nao e passvel de descricao proba-
bilstica, ou seja nao se trata de um intervalo de probabilidade para (embora
intuitivamente e o que gostariamos que fosse). Na verdade os limites do intervalo
3.6.4 Intervalo de Confianca para Variancia
e que sao variaveis aleatorias e apos a amostra ser observada dizemos por exemplo
Em muitas situacoes existe interesse tambem em estimar a variabilidade do pro- que

cesso. Para obter estimativas intervalares da variancia populacional 2 sao apli- x z/2 x + z/2
n n
cados os mesmos princpios utilizados para estimar a media. Aqui usamos a
seguinte quantidade com confianca 100(1 )%. Nao e possvel inferir se o parametro esta mais
(n 1)S 2 proximo de um ou outro limite, embora novamente seja isto que intuitivamente
2 gostariamos de fazer.
que tem uma distribuicao chamada qui-quadrado (2 ) com n 1 graus de liber- Mas nem tudo esta perdido. A Estatstica Bayesiana admite que um
dade e o intervalo de confianca utiliza valores desta distribuicao. A Tabela ?? parametro pode ser tratado como variavel aleatoria e portanto obtem interva-
fornece valores x desta distribuicao tais que a probabilidade a direita de x e igual los de probabilidade para eles. Este assunto nao sera abordado neste texto e
a p (primeira linha da tabela) segundo o numero de graus de liberdade (primeira algumas referencias sao Migon and Gamerman (1999) ou DeGroot (1989).
coluna da tabela). Por exemplo, se uma v.a. Y tem distribuicao 2 com 10 graus
de liberdade entao P (Y > 18, 307) = 0, 05.
Para construir um IC de 100(1 )% para 2 devemos entao obter os valores 3.8 Problemas
2/2,n1 e 2/2,n1 desta distribuicao tais que
1. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma media
de 72,9 batidas por minuto (bpm) e um desvio padrao de 11,0 bpm foram
(n 1)S 2
P 2/2,n1 2
/2,n1 = 1 . obtidos. Construa um intervalo de confianca de 95% para a pulsacao media
2
em repouso de pessoas sadias com base nesses dados.
Apos observar a amostra teremos o valor numerico s2 de S 2 e segue que
2. Tendo sido medido o eixo maior de 9 graos de quartzo de um corpo arenoso
(n 1)s2 (n 1)s2 em uma lamina de arenito, obteve-se um comprimento amostral medio de
2 < 2 < 2
/2,n1 /2,n1 1,5mm e um desvio padrao de 0,3mm. Deseja-se construir um intervalo de
confianca para o comprimento medio dos graos de quartzo do corpo arenoso.
com 100(1 )% de confianca (ou seja este e o IC).
Note que o intervalo nao depende da media amostral x mas somente do grau 3. Os QIs de 181 meninos com idades entre 6-7 anos de Curitiba foram medi-
de dispersao dos dados, medido atraves do desvio padrao amostral s2 . Alem dos. O QI medio foi 108,08, e o desvio padrao foi 14,38.
(a) Calcule um intervalo de confianca de 95% para o QI medio popula- 6. Para decidir se uma moeda e balanceada (honesta) ela e lancada 40 vezes
cional dos meninos entre 6-7 anos de idade em Curitiba usando estes e cara aparece 13 vezes. Construa um intervalo de 95% de confianca para
dados. a verdadeira proporcao de caras p. O que voce conclui?
(b) Interprete o intervalo de confianca com palavras. 7. Numa pesquisa eleitoral, 57 dentre 150 entrevistados afirmaram que vota-
(c) Foi necessario assumir que os QIs tem distribuicao normal neste caso? riam no candidato X. Com uma confianca de 90%, o que voce pode dizer
Por que? acerca da proporcao real de votos aquele candidato tera?
4. A tabela abaixo apresenta QIs medios e seus desvios padroes calculados de 8. Dentre 100 peixes capturados num certo lago, 18 nao estavam apropria-
amostras de criancas por classe de atividade profissional dos pais. dos para consumo devido aos nveis de poluicao do ambiente. Construa
um intervalo de confianca de 99% para a verdadeira proporcao de peixes
contaminados.
Ocupacao Media desvio padrao n I.C.
Profissional 112,27 13,16 30 (107,36; 117,18) 9. Os dados abaixo sao uma amostra aleatoria da distribuicao Bernoulli(p),
Gerencial 112,65 11,01 78 i.e. sao valores observados da v.a. X = 1 se ocorre sucesso e X = 0 caso
Nao-Manual 108,86 13,94 28 contrario e P (sucesso)=p. Construa os IC 90% e 99%.
Manual 0001101111011011110111111
com pratica) 104,38 14,41 152
Manual
(pouca pratica) 96,97 10,13 37
Manual
(sem pratica) 98,85 14,02 20
(a) Complete a ultima coluna, a qual contem intervalos de confianca de

95% para o QI medio. Ilustre os I.C. graficamente.
(b) Comente os padroes gerais que voce ve.
5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
minutos. Foi introduzida uma modificacao para reduzir este tempo e apos
alguns meses foi selecionada uma amostra de 16 operarios medindo-se o
tempo de execucao de cada um. Obteve-se um tempo medio amostral de
90 minutos e um desvio padrao amostral de 16 minutos.
(a) Estime o novo tempo medio de execucao por um intervalo com 95%
de confianca.
(b) Interprete o I.C. obtido no item anterior. Voce diria que a modificacao
surtiu efeito? (Justifique).
(c) Estime a nova variancia populacional por um intervalo com 95% de
confianca.
(a) Calcule um intervalo de confianca de 95% para o QI medio popula- 6. Para decidir se uma moeda e balanceada (honesta) ela e lancada 40 vezes
cional dos meninos entre 6-7 anos de idade em Curitiba usando estes e cara aparece 13 vezes. Construa um intervalo de 95% de confianca para
dados. a verdadeira proporcao de caras p. O que voce conclui?
(b) Interprete o intervalo de confianca com palavras. 7. Numa pesquisa eleitoral, 57 dentre 150 entrevistados afirmaram que vota-
(c) Foi necessario assumir que os QIs tem distribuicao normal neste caso? riam no candidato X. Com uma confianca de 90%, o que voce pode dizer
Por que? acerca da proporcao real de votos aquele candidato tera?
4. A tabela abaixo apresenta QIs medios e seus desvios padroes calculados de 8. Dentre 100 peixes capturados num certo lago, 18 nao estavam apropria-
amostras de criancas por classe de atividade profissional dos pais. dos para consumo devido aos nveis de poluicao do ambiente. Construa
um intervalo de confianca de 99% para a verdadeira proporcao de peixes
contaminados.
Ocupacao Media desvio padrao n I.C.
Profissional 112,27 13,16 30 (107,36; 117,18) 9. Os dados abaixo sao uma amostra aleatoria da distribuicao Bernoulli(p),
Gerencial 112,65 11,01 78 i.e. sao valores observados da v.a. X = 1 se ocorre sucesso e X = 0 caso
Nao-Manual 108,86 13,94 28 contrario e P (sucesso)=p. Construa os IC 90% e 99%.
Manual 0001101111011011110111111
com pratica) 104,38 14,41 152
Manual
(pouca pratica) 96,97 10,13 37
Manual
(sem pratica) 98,85 14,02 20
(a) Complete a ultima coluna, a qual contem intervalos de confianca de

95% para o QI medio. Ilustre os I.C. graficamente.
(b) Comente os padroes gerais que voce ve.
5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
minutos. Foi introduzida uma modificacao para reduzir este tempo e apos
alguns meses foi selecionada uma amostra de 16 operarios medindo-se o
tempo de execucao de cada um. Obteve-se um tempo medio amostral de
90 minutos e um desvio padrao amostral de 16 minutos.
(a) Estime o novo tempo medio de execucao por um intervalo com 95%
de confianca.
(b) Interprete o I.C. obtido no item anterior. Voce diria que a modificacao
surtiu efeito? (Justifique).
(c) Estime a nova variancia populacional por um intervalo com 95% de
confianca.
4.1. INTRODUCAO E NOTACAO 73
com p constante, portanto X=numero de acertos tem distribuicao binomial

com parametros n = 10 e p desconhecido. Suponha que adotamos a seguinte
regra de decisao: o aluno nao esta advinhando se acertar 8 ou mais questoes.
Isto equivale a rejeitar H0 se X 8 (regiao de rejeicao ou regiao crtica) e aceitar
H0 se X < 8 (regiao de aceitacao).
Captulo 4 No entanto, e possvel que um aluno acerte 8 ou mais questoes e esteja advi-
nhando, isto e podemos rejeitar H0 quando ela e verdadeira. A probabilidade de
que isto ocorra e
Testes de Hipoteses P (X 8 | p = 1/2) =

10
0, 510 +

10
0, 510 +

10
0, 510 =
7
0, 054.
8 9 10 128
Esta probabilidade e chamada nvel de significancia e sera denotada por . Note

que o valor de depende da regra de decisao, por exemplo se a regiao crtica
4.1 Introducao e notacao for X 7 entao 0, 171. No proximo exemplo veremos como usar o nvel de
significancia para construir uma regra de decisao.
Em geral, intervalos de confianca sao a forma mais informativa de apresentar os
achados principais de um estudo. Contudo, algumas vezes existe um particu- Exemplo 4.2 : Um fornecedor garante que 90% de sua producao nao apresenta
lar interesse em verificar determinadas afirmacoes ou conjecturas. Por exemplo, defeito. Para testar esta afirmacao selecionamos ao acaso 10 itens de um lote e
podemos estar interessados em determinar se uma moeda e honesta, se certas contamos o numero de defeituosos. Decidimos nao comprar o lote se o numero
quantidades sao independentes, ou se populacoes distintas sao similares do ponto observado de nao defeituosos for muito pequeno (mas quao pequeno?).
de vista probabilstico. Cada uma destas afirmacoes constitui uma hipotese que Definindo X=numero de nao defeituosos na amostra de 10 itens temos entao
pode ser associada a um modelo, i.e. pode ser parametrizada. uma distribuicao binomial com parametros n = 10 e p desconhecido, e queremos
Chamamos de hipotese estatstica qualquer afirmacao que se faca sobre um testar H0 : p = 0, 90. Aqui p e a proporcao de itens nao defeituosos no lote e
parametro populacional desconhecido. A ideia basica e que a partir de uma portanto a hipotese alternativa deve ser H1 : p < 0, 90. Suponha que decidimos
amostra da populacao iremos estabelecer uma regra de decisao segundo a qual manter < 0, 025 e a partir deste valor vamos estabelecer a nossa regra de
rejeitaremos ou aceitaremos a hipotese proposta. Esta regra de decisao e cha- decisao, ou seja vamos obter o valor de k tal que P (X k|p = 0, 9) < 0, 025.
mada de teste. Normalmente existe uma hipotese que e mais importante para o Para isto vamos calcular para diferentes regioes crticas, assim
pesquisador que sera denotada por H0 e chamada hipotese nula. Qualquer outra
hipotese diferente de H0 sera chamada de hipotese alternativa e denotada por P (X 5 | p = 0, 90) = 0, 001
H1 . Veremos mais adiante que intervalos de confianca e testes de hipoteses estao P (X 6 | p = 0, 90) = 0, 012
intimamente relacionados.
P (X 7 | p = 0, 90) = 0, 069.
Exemplo 4.1 : (Teste unilateral) Um professor aplica um teste do tipo certo- Portanto, para que o nvel de significancia maximo seja 0,025 devemos usar a
errado com 10 questoes. Queremos testar a hipotese de que o aluno esta advi- regiao crtica X 6. Isto e, vamos rejeitar o lote se o numero de itens defeituosos
nhando. na amostra for maior do que 6.
Denotando por p a probabilidade do aluno acertar cada questao a hipotese
estatstica de interesse pode ser formulada como H0 : p = 1/2. Neste caso, a Nestes dois exemplos os testes sao chamados de unilaterais porque somente
hipotese alternativa mais adequada e H1 : p > 1/2 indicando que o aluno tem valores de um lado do espaco amostral foram utilizados para construir a regiao
algum conhecimento sobre o assunto. Temos entao 10 repeticoes do experimento crtica. As regioes crticas sao mostradas nos graficos da Figura 4.1. Podemos ter
72
4.1. INTRODUCAO E NOTACAO 73
com p constante, portanto X=numero de acertos tem distribuicao binomial

com parametros n = 10 e p desconhecido. Suponha que adotamos a seguinte
regra de decisao: o aluno nao esta advinhando se acertar 8 ou mais questoes.
Isto equivale a rejeitar H0 se X 8 (regiao de rejeicao ou regiao crtica) e aceitar
H0 se X < 8 (regiao de aceitacao).
Captulo 4 No entanto, e possvel que um aluno acerte 8 ou mais questoes e esteja advi-
nhando, isto e podemos rejeitar H0 quando ela e verdadeira. A probabilidade de
que isto ocorra e
Testes de Hipoteses P (X 8 | p = 1/2) =

10
0, 510 +

10
0, 510 +

10
0, 510 =
7
0, 054.
8 9 10 128
Esta probabilidade e chamada nvel de significancia e sera denotada por . Note

que o valor de depende da regra de decisao, por exemplo se a regiao crtica
4.1 Introducao e notacao for X 7 entao 0, 171. No proximo exemplo veremos como usar o nvel de
significancia para construir uma regra de decisao.
Em geral, intervalos de confianca sao a forma mais informativa de apresentar os
achados principais de um estudo. Contudo, algumas vezes existe um particu- Exemplo 4.2 : Um fornecedor garante que 90% de sua producao nao apresenta
lar interesse em verificar determinadas afirmacoes ou conjecturas. Por exemplo, defeito. Para testar esta afirmacao selecionamos ao acaso 10 itens de um lote e
podemos estar interessados em determinar se uma moeda e honesta, se certas contamos o numero de defeituosos. Decidimos nao comprar o lote se o numero
quantidades sao independentes, ou se populacoes distintas sao similares do ponto observado de nao defeituosos for muito pequeno (mas quao pequeno?).
de vista probabilstico. Cada uma destas afirmacoes constitui uma hipotese que Definindo X=numero de nao defeituosos na amostra de 10 itens temos entao
pode ser associada a um modelo, i.e. pode ser parametrizada. uma distribuicao binomial com parametros n = 10 e p desconhecido, e queremos
Chamamos de hipotese estatstica qualquer afirmacao que se faca sobre um testar H0 : p = 0, 90. Aqui p e a proporcao de itens nao defeituosos no lote e
parametro populacional desconhecido. A ideia basica e que a partir de uma portanto a hipotese alternativa deve ser H1 : p < 0, 90. Suponha que decidimos
amostra da populacao iremos estabelecer uma regra de decisao segundo a qual manter < 0, 025 e a partir deste valor vamos estabelecer a nossa regra de
rejeitaremos ou aceitaremos a hipotese proposta. Esta regra de decisao e cha- decisao, ou seja vamos obter o valor de k tal que P (X k|p = 0, 9) < 0, 025.
mada de teste. Normalmente existe uma hipotese que e mais importante para o Para isto vamos calcular para diferentes regioes crticas, assim
pesquisador que sera denotada por H0 e chamada hipotese nula. Qualquer outra
hipotese diferente de H0 sera chamada de hipotese alternativa e denotada por P (X 5 | p = 0, 90) = 0, 001
H1 . Veremos mais adiante que intervalos de confianca e testes de hipoteses estao P (X 6 | p = 0, 90) = 0, 012
intimamente relacionados.
P (X 7 | p = 0, 90) = 0, 069.
Exemplo 4.1 : (Teste unilateral) Um professor aplica um teste do tipo certo- Portanto, para que o nvel de significancia maximo seja 0,025 devemos usar a
errado com 10 questoes. Queremos testar a hipotese de que o aluno esta advi- regiao crtica X 6. Isto e, vamos rejeitar o lote se o numero de itens defeituosos
nhando. na amostra for maior do que 6.
Denotando por p a probabilidade do aluno acertar cada questao a hipotese
estatstica de interesse pode ser formulada como H0 : p = 1/2. Neste caso, a Nestes dois exemplos os testes sao chamados de unilaterais porque somente
hipotese alternativa mais adequada e H1 : p > 1/2 indicando que o aluno tem valores de um lado do espaco amostral foram utilizados para construir a regiao
algum conhecimento sobre o assunto. Temos entao 10 repeticoes do experimento crtica. As regioes crticas sao mostradas nos graficos da Figura 4.1. Podemos ter
72
74 CAPITULO 4. TESTES DE HIPOTESES 4.2. PROBLEMAS 75
tambem testes bilaterais aonde os dois extremos do espaco amostral sao usados
Tabela 4.1: Tipos de decisao e erros associados ao testar hipoteses.
como regiao crtica. A variavel aleatoria X e chamada estatstica de teste, sua
distribuicao deve ser conhecida e ela deve depender do parametro que esta sendo Decisao
testado. Verdade Aceitar H0 Rejeitar H0
H0 verdadeira Decisao correta Erro Tipo I
(probabilidade 1 ) (probabilidade )
H0 falsa Erro Tipo II Decisao correta
0.25
0.4
(probabilidade ) (probabilidade 1 )
0.20
0.3
4.2 Problemas
0.15
Probabilidades
Probabilidades
0.2
1. Em um estudo antropologico deve-se decidir se os habitantes de uma ilha
0.10
sao descendentes da civilizacao A ou B. Com base em uma amostra de 100

0.1 moradores adultos a regra de decisao utilizada consiste em afirmar que os
0.05
habitantes descendem de B se a altura media amostral for maior do que 176

0.00
0.0
0 2 4 6 8 10 0 2 4 6 8 10
cm. Caso contrario afirma-se que sao descendentes de A. Denotando por
(a) (b)
e os verdadeiros valores da altura media e desvio-padrao das alturas dos
habitantes defina as hipoteses,
Figura 4.1: Probabilidades binomiais com n = 10 e (a) p = 1/2 e (b) p = 0, 90.
Regioes crticas dos Exemplos 4.1 e 4.2 em negrito. H0 : = 175, = 10 (habitantes descendem de A)
H1 : = 177, = 10 (habitantes descendem de B).
(a) Defina os erros tipo I e tipo II.

(b) Calcule as probabilidades destes erros.
(c) Qual deve ser a regra de decisao fixando a probabilidade de erro tipo
4.1.1 Decisoes e poder I em 0,05? Qual a probabilidade de erro tipo II neste caso?
2. Nas situacoes abaixo, escolha a sua hipotese H0 de modo que o erro tipo I
Ao tomar uma decisao a favor ou contra uma hipotese existem dois tipos de erros seja mais importante do que o erro tipo II. Descreva quais os dois erros em
que podemos cometer. Podemos rejeitar a hipotese nula quando de fato ela e cada caso.
verdadeira (erro tipo I) ou podemos falhar em rejeitar H0 quando de fato ela
e falsa (erro tipo II). Frequentemente denotamos as probabilidades destes dois (a) Um operador de radar precisa detectar aeronaves inimigas. Quando
tipos de erro como e respectivamente. O poder de um teste e a probabilidade surge alguma coisa estranha na tela ele deve decidir entre as hipoteses:
de rejeitar a hipotese nula quando esta e de fato falsa, isto e 1 . 1. esta comecando um ataque inimigo, 2. e apenas uma leve inter-
ferencia.
Existe um balanco entre esses dois tipos de erros, no sentido de que ao tentar-
se minimizar , aumenta-se . Isto e, nao e possvel minimizar estas duas proba- (b) Um indivduo esta sendo julgado por um crime e o juri deve decidir
bilidades simultaneamente e na pratica e costume fixar um valor (pequeno) para entre as hipoteses: 1. o acusado e inocente, 2. o acusado e culpado.
. Na Tabela 4.1 estao descritas as decisoes que podemos tomar e os tipos de (c) Um pesquisador acredita que descobriu uma vacina contra resfriado.
erro associados. De acordo com resultados de testes em laboratorio ele lancara ou nao
tambem testes bilaterais aonde os dois extremos do espaco amostral sao usados
Tabela 4.1: Tipos de decisao e erros associados ao testar hipoteses.
como regiao crtica. A variavel aleatoria X e chamada estatstica de teste, sua
distribuicao deve ser conhecida e ela deve depender do parametro que esta sendo Decisao
testado. Verdade Aceitar H0 Rejeitar H0
H0 verdadeira Decisao correta Erro Tipo I
(probabilidade 1 ) (probabilidade )
H0 falsa Erro Tipo II Decisao correta
0.25
0.4
(probabilidade ) (probabilidade 1 )
0.20
0.3
4.2 Problemas
0.15
Probabilidades
Probabilidades
0.2
1. Em um estudo antropologico deve-se decidir se os habitantes de uma ilha
0.10
sao descendentes da civilizacao A ou B. Com base em uma amostra de 100

0.1 moradores adultos a regra de decisao utilizada consiste em afirmar que os
0.05
habitantes descendem de B se a altura media amostral for maior do que 176

0.00
0.0
0 2 4 6 8 10 0 2 4 6 8 10
cm. Caso contrario afirma-se que sao descendentes de A. Denotando por
(a) (b)
e os verdadeiros valores da altura media e desvio-padrao das alturas dos
habitantes defina as hipoteses,
Figura 4.1: Probabilidades binomiais com n = 10 e (a) p = 1/2 e (b) p = 0, 90.
Regioes crticas dos Exemplos 4.1 e 4.2 em negrito. H0 : = 175, = 10 (habitantes descendem de A)
H1 : = 177, = 10 (habitantes descendem de B).
(a) Defina os erros tipo I e tipo II.

(b) Calcule as probabilidades destes erros.
(c) Qual deve ser a regra de decisao fixando a probabilidade de erro tipo
4.1.1 Decisoes e poder I em 0,05? Qual a probabilidade de erro tipo II neste caso?
2. Nas situacoes abaixo, escolha a sua hipotese H0 de modo que o erro tipo I
Ao tomar uma decisao a favor ou contra uma hipotese existem dois tipos de erros seja mais importante do que o erro tipo II. Descreva quais os dois erros em
que podemos cometer. Podemos rejeitar a hipotese nula quando de fato ela e cada caso.
verdadeira (erro tipo I) ou podemos falhar em rejeitar H0 quando de fato ela
e falsa (erro tipo II). Frequentemente denotamos as probabilidades destes dois (a) Um operador de radar precisa detectar aeronaves inimigas. Quando
tipos de erro como e respectivamente. O poder de um teste e a probabilidade surge alguma coisa estranha na tela ele deve decidir entre as hipoteses:
de rejeitar a hipotese nula quando esta e de fato falsa, isto e 1 . 1. esta comecando um ataque inimigo, 2. e apenas uma leve inter-
ferencia.
Existe um balanco entre esses dois tipos de erros, no sentido de que ao tentar-
se minimizar , aumenta-se . Isto e, nao e possvel minimizar estas duas proba- (b) Um indivduo esta sendo julgado por um crime e o juri deve decidir
bilidades simultaneamente e na pratica e costume fixar um valor (pequeno) para entre as hipoteses: 1. o acusado e inocente, 2. o acusado e culpado.
. Na Tabela 4.1 estao descritas as decisoes que podemos tomar e os tipos de (c) Um pesquisador acredita que descobriu uma vacina contra resfriado.
erro associados. De acordo com resultados de testes em laboratorio ele lancara ou nao
76 CAPITULO 4. TESTES DE HIPOTESES 4.4. PROCEDIMENTO GERAL DE TESTE 77
a nova vacina no mercado. As hipoteses a serem testadas sao: 1. a Como ja vimos, o p-valor e a probabilidade de observar resultados tao extre-
vacina e eficaz, 2. a vacina nao e eficaz. mos quanto os obtidos se a hipotese nula for verdadeira. A ideia e que se o p-valor
for grande ele fornece evidencia de que H0 e verdadeira, enquanto que um p-valor
3. Ao lancar uma moeda 3 vezes a hipotese de que ela e honesta sera rejeitada pequeno indica que existe evidencia nos dados contra H0 (ja que ocorreu um re-
se aparecerem 3 caras. sultado pouco provavel). As seguintes interpretacoes de p-valores (P ) podem ser
uteis,
(a) Qual a probabilidade de erro tipo I?
P 0, 10 Nao existe evidencia contra H0
(b) Qual a probabilidade de erro tipo II quando P (cara) = 2/3 ?
P < 0, 10 Fraca evidencia contra H0
P < 0, 05 Evidencia significativa . . .
P < 0, 01 Evidencia altamente significativa . . .
4.3 Probabilidade de significancia (P -valor) P < 0, 001 Evidencia extremamente significativa . . .
Vimos que a escolha do nvel de significancia do teste e completamente ar-
bitraria. Alem disso, quando a distribuicao da estatstica de teste e discreta, 4.4 Procedimento geral de teste
como nos Exemplos 4.1 e 4.2 (binomial), o nvel escolhido pode nem mesmo ser
atingido. Por outro lado, a decisao de aceitar ou rejeitar H0 claramente depende 1. Estabeleca a hipotese nula, H0 e a hipotese alternativa H1 .
desta escolha. Na maioria das aplicacoes praticas o valor escolhido e 0,05 ou 0,01
mas nao ha nada que justifique formalmente o uso destes valores em particular. 2. Decida qual o teste a ser usado, checando se este e valido para o seu pro-
Um enfoque alternativo consiste em calcular o menor nvel de significancia blema.
para o qual H0 e rejeitada, para o valor observado da estatstica de teste. Esta
3. Apos observar a amostra calcule a estatstica de teste, T .
quantidade e chamada nvel crtico ou P-valor. A ideia e que, apos calcular o p-
valor o pesquisador pode escolher o seu proprio nvel de significancia como sendo 4. Encontre a probabilidade de observar um valor tao extremo ou maior do
a probabilidade maxima toleravel para um erro tipo I. que T se a hipotese nula e verdadeira (p-valor). Voce precisara se refe-
rir aos valores crticos nas tabelas estatsticas as quais fornecem p-valores
Exemplo 4.3 : No Exemplo 4.1 suponha que o numero observado de questoes correspondendo aos valores das estatstica de teste.
certas foi X = 9. Entao o p-valor sera
5. Avalie a forca da evidencia contra H0 (quanto menor o p-valor, maior a
10 10
P (X 9 | p = 1/2) = 0, 510 + 0, 510 = 0, 0107 evidencia contra H0 ). Decida se esta evidencia e suficiente para rejeitar (ou
9 10
nao rejeitar) a hipotese nula.
e rejeitaremos H0 para todo nvel de significancia maior do que este valor. Por
6. Estabeleca as conclusoes e interpretacao dos seus resultados.
exemplo, rejeitaremos H0 para = 0, 025 ou = 0, 05 e aceitaremos H0 para
= 0, 01.
E importante notar que existe uma diferenca entre significancia estatstica e
Exemplo 4.4 : No Exemplo 4.2 suponha que o numero observado de nao defei- significancia pratica. Um efeito pode ser estatisticamente significante mas nao ter
tuosos foi X = 4. Neste caso o p-valor e dado por qualquer importancia pratica e vice-versa. Por exemplo, um estudo muito grande
pode estimar a diferenca entre a media de peso de plantas como sendo 0,0001
P (X 4 | p = 0, 90) = 0, 000146 gramas e concluir que a diferenca e estatsticamente significativa. Contudo,
na pratica, esta diferenca e despresvel e provavelmente de pouca importancia
ou seja, rejeitaremos H0 para praticamente todos os nveis de significancia usuais. pratica.
76 CAPITULO 4. TESTES DE HIPOTESES 4.4. PROCEDIMENTO GERAL DE TESTE 77
a nova vacina no mercado. As hipoteses a serem testadas sao: 1. a Como ja vimos, o p-valor e a probabilidade de observar resultados tao extre-
vacina e eficaz, 2. a vacina nao e eficaz. mos quanto os obtidos se a hipotese nula for verdadeira. A ideia e que se o p-valor
for grande ele fornece evidencia de que H0 e verdadeira, enquanto que um p-valor
3. Ao lancar uma moeda 3 vezes a hipotese de que ela e honesta sera rejeitada pequeno indica que existe evidencia nos dados contra H0 (ja que ocorreu um re-
se aparecerem 3 caras. sultado pouco provavel). As seguintes interpretacoes de p-valores (P ) podem ser
uteis,
(a) Qual a probabilidade de erro tipo I?
P 0, 10 Nao existe evidencia contra H0
(b) Qual a probabilidade de erro tipo II quando P (cara) = 2/3 ?
P < 0, 10 Fraca evidencia contra H0
P < 0, 05 Evidencia significativa . . .
P < 0, 01 Evidencia altamente significativa . . .
4.3 Probabilidade de significancia (P -valor) P < 0, 001 Evidencia extremamente significativa . . .
Vimos que a escolha do nvel de significancia do teste e completamente ar-
bitraria. Alem disso, quando a distribuicao da estatstica de teste e discreta, 4.4 Procedimento geral de teste
como nos Exemplos 4.1 e 4.2 (binomial), o nvel escolhido pode nem mesmo ser
atingido. Por outro lado, a decisao de aceitar ou rejeitar H0 claramente depende 1. Estabeleca a hipotese nula, H0 e a hipotese alternativa H1 .
desta escolha. Na maioria das aplicacoes praticas o valor escolhido e 0,05 ou 0,01
mas nao ha nada que justifique formalmente o uso destes valores em particular. 2. Decida qual o teste a ser usado, checando se este e valido para o seu pro-
Um enfoque alternativo consiste em calcular o menor nvel de significancia blema.
para o qual H0 e rejeitada, para o valor observado da estatstica de teste. Esta
3. Apos observar a amostra calcule a estatstica de teste, T .
quantidade e chamada nvel crtico ou P-valor. A ideia e que, apos calcular o p-
valor o pesquisador pode escolher o seu proprio nvel de significancia como sendo 4. Encontre a probabilidade de observar um valor tao extremo ou maior do
a probabilidade maxima toleravel para um erro tipo I. que T se a hipotese nula e verdadeira (p-valor). Voce precisara se refe-
rir aos valores crticos nas tabelas estatsticas as quais fornecem p-valores
Exemplo 4.3 : No Exemplo 4.1 suponha que o numero observado de questoes correspondendo aos valores das estatstica de teste.
certas foi X = 9. Entao o p-valor sera
5. Avalie a forca da evidencia contra H0 (quanto menor o p-valor, maior a
10 10
P (X 9 | p = 1/2) = 0, 510 + 0, 510 = 0, 0107 evidencia contra H0 ). Decida se esta evidencia e suficiente para rejeitar (ou
9 10
nao rejeitar) a hipotese nula.
e rejeitaremos H0 para todo nvel de significancia maior do que este valor. Por
6. Estabeleca as conclusoes e interpretacao dos seus resultados.
exemplo, rejeitaremos H0 para = 0, 025 ou = 0, 05 e aceitaremos H0 para
= 0, 01.
E importante notar que existe uma diferenca entre significancia estatstica e
Exemplo 4.4 : No Exemplo 4.2 suponha que o numero observado de nao defei- significancia pratica. Um efeito pode ser estatisticamente significante mas nao ter
tuosos foi X = 4. Neste caso o p-valor e dado por qualquer importancia pratica e vice-versa. Por exemplo, um estudo muito grande
pode estimar a diferenca entre a media de peso de plantas como sendo 0,0001
P (X 4 | p = 0, 90) = 0, 000146 gramas e concluir que a diferenca e estatsticamente significativa. Contudo,
na pratica, esta diferenca e despresvel e provavelmente de pouca importancia
ou seja, rejeitaremos H0 para praticamente todos os nveis de significancia usuais. pratica.
78 CAPITULO 4. TESTES DE HIPOTESES 4.6. TESTE PARA A PROPORCAO 79
4.5 Teste para a media 4.6 Teste para a proporcao

Agora suponha que tenhamos um valor hipotetico p0 para uma proporcao popu-
O teste desenvolvido aqui e conhecido como teste t e talvez um dos mais utilizados
lacional p. Podemos realizar um teste de
em Estatstica aplicada. O nome vem do fato que para uma amostra aleatoria
X1 , . . . , Xn de uma populacao com media , H 0 : p = p0
X H1 : p 6= p0
T = tn1
S/ n
de maneira similar ao teste t acima. A dualidade com intervalos de confianca
e esta e a estatstica utilizada para testar as hipoteses segue exatamente da mesma forma.
Suponha que tenhamos uma amostra aleatoria de tamanho n de uma po-
H0 : = 0 pulacao de interesse onde a verdadeira proporcao de membros numa categoria
H1 : 6= 0 . em particular e p. Se o numero observado na categoria de interesse e x, entao os
passos principais do teste sao:
Neste caso, os passos principais do teste t sao os seguintes,
1. calcule a proporcao amostral p = x/n;
p
2. calcule o erro padrao, EP = p(1 p)/n;
1. calcule a media amostral x e o desvio padrao amostral s;
3. calcule a estatstica de teste avaliada em H0 , t = (p p0 )/EP ;
2. calcule a estatstica de teste avaliada sob H0 , 4. encontre o p-valor usando o valor absoluto da estatstica de teste da tabela
da distribuicao normal.
x 0
t= ;
s/ n Assim como em intervalos de confianca uma regra geral para que este teste
seja valido e quando temos ambos np e n(1 p) maiores ou iguais a 5.
3. encontre o p-valor na tabela da distribuicao t, com n 1 graus de liberdade
usando os valores absolutos da estatstica de teste, i.e.
4.7 Testes para a variancia da distribuicao nor-
P (|T | > t) = P (T < t) + P (T > t); mal
Se o objetivo e testar se a variancia da distribuicao normal e igual a um deter-
4. estabeleca conclusoes e interprete os resultados. minado valor 02 , entao as hipoteses podem ser formuladas como
H0 : 2 = 02
Se a variancia populacional for conhecida a estatstica de teste avaliada sob
H0 e H1 : 2 6= 02 .
x 0
z= A regra de decisao sobre estas hipotese e baseada na estatstica
/ n
e o p-valor sera agora obtido na tabela da distribuicao normal padronizada como (n 1)S 2
P (|Z| > z). T =
02
78 CAPITULO 4. TESTES DE HIPOTESES 4.6. TESTE PARA A PROPORCAO 79
4.5 Teste para a media 4.6 Teste para a proporcao

Agora suponha que tenhamos um valor hipotetico p0 para uma proporcao popu-
O teste desenvolvido aqui e conhecido como teste t e talvez um dos mais utilizados
lacional p. Podemos realizar um teste de
em Estatstica aplicada. O nome vem do fato que para uma amostra aleatoria
X1 , . . . , Xn de uma populacao com media , H 0 : p = p0
X H1 : p 6= p0
T = tn1
S/ n
de maneira similar ao teste t acima. A dualidade com intervalos de confianca
e esta e a estatstica utilizada para testar as hipoteses segue exatamente da mesma forma.
Suponha que tenhamos uma amostra aleatoria de tamanho n de uma po-
H0 : = 0 pulacao de interesse onde a verdadeira proporcao de membros numa categoria
H1 : 6= 0 . em particular e p. Se o numero observado na categoria de interesse e x, entao os
passos principais do teste sao:
Neste caso, os passos principais do teste t sao os seguintes,
1. calcule a proporcao amostral p = x/n;
p
2. calcule o erro padrao, EP = p(1 p)/n;
1. calcule a media amostral x e o desvio padrao amostral s;
3. calcule a estatstica de teste avaliada em H0 , t = (p p0 )/EP ;
2. calcule a estatstica de teste avaliada sob H0 , 4. encontre o p-valor usando o valor absoluto da estatstica de teste da tabela
da distribuicao normal.
x 0
t= ;
s/ n Assim como em intervalos de confianca uma regra geral para que este teste
seja valido e quando temos ambos np e n(1 p) maiores ou iguais a 5.
3. encontre o p-valor na tabela da distribuicao t, com n 1 graus de liberdade
usando os valores absolutos da estatstica de teste, i.e.
4.7 Testes para a variancia da distribuicao nor-
P (|T | > t) = P (T < t) + P (T > t); mal
Se o objetivo e testar se a variancia da distribuicao normal e igual a um deter-
4. estabeleca conclusoes e interprete os resultados. minado valor 02 , entao as hipoteses podem ser formuladas como
H0 : 2 = 02
Se a variancia populacional for conhecida a estatstica de teste avaliada sob
H0 e H1 : 2 6= 02 .
x 0
z= A regra de decisao sobre estas hipotese e baseada na estatstica
/ n
e o p-valor sera agora obtido na tabela da distribuicao normal padronizada como (n 1)S 2
P (|Z| > z). T =
02
onde S 2 e a variancia amostral calculada em uma amostra aleatoria com n ob- 5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
servacoes. Ja vimos que T tem distribuicao qui-quadrado com n 1 graus de minutos com desvio padrao 15 minutos. Foi introduzida uma modificacao
liberdade e portanto a regiao de rejeicao ao nvel de significancia e dada pelos para reduzir este tempo e apos alguns meses foi selecionada uma amostra
valores de T tais que de 16 operarios medindo-se o tempo de execucao de cada um. Obteve-se
um tempo medio amostral de 90 minutos e um desvio padrao amostral de
T > 21 ,n1 ou T < 2 n1 . 16 minutos.
2 2
Em termos de p-valor o procedimento consiste em avaliar a estatstica de teste (a) Verifique se existem evidencias, ao nvel de significancia de 5%, de que
t e calcular P (T > t). a modificacao surtiu efeito?
(b) Verifique se ha evidencias, ao nvel de significancia de 5%, de que a
modificacao alterou a variancia populacional.
4.8 Problemas (c) Estime o novo desvio padrao populacional por um intervalo com 98%
1. Suponha que a variavel X: custo de manutencao de uma maquina pode ser de confianca.
considerada como tendo distribuicao normal com media e desvio-padrao (d) O I.C. obtido no item anterior esta de acordo com sua conclusao no
20. Sabe-se tambem que os possveis valores do custo medio sao 200 ou item (b)? (Justifique).
210. Com base em uma amostra de 25 maquinas,
6. Uma fabrica de automoveis anuncia que seus carros consomem, em media,
(a) defina as hipoteses a serem testadas, 11 litros por 100 km, com desvio padrao de 0,8 litros. Uma revista resolve
testar essa afirmacao e analisa 35 automoveis dessa marca, obtendo 11,3
(b) defina uma regra de decisao e encontre as probabilidades de erros tipo litros por 100 km como consumo medio (considerar distribucao normal). O
I e tipo II. que a revista pode concluir sobre o anuncio da fabrica, no nvel de 10%?
2. Uma maquina automatica de encher pacotes de cafe enche-os segundo uma 7. Num levantamento feito com operarios da industria mecanica concluiu-se
distribuicao normal, com media e variancia 400g2 . A maquina foi regulada que o salario medio e 3,64 sm (salarios mnimos) com desvio padrao 0,85
para = 500 g. A cada meia hora colher-se uma amostra de 16 pacotes e sm. Supeita-se que os salarios de subclasse de torneiros mecanicos sao
verifica-se se a producao esta sob controle, isto e se = 500 g ou nao. Se diferentes dos salarios do conjunto todo, tanto na media como na variancia.
uma dessas amostras apresentasse uma media x = 492 g, voce pararia ou Que conclusoes voce obteria se uma amostra de 25 torneiros apresentasse
nao a producao para verificar se a maquina esta ajustada? salario medio igual a 4,22 sm e desvio padrao igual a 1,25 sm?
3. Uma companhia de cigarros anuncia que o ndice medio de nicotina dos ci- 8. A tensao media de ruptura dos cabos produzidos em uma industria e 500
garros que fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratorio Kgf com desvio padrao de 25 Kgf. Uma nova tecnica de producao para
realiza 6 analises desse ndice, obtendo 27, 24, 21, 25, 26, 22. Sabe-se que o aumentar esta tensao media foi introduzida e coletou-se uma amostra de
ndice de nicotina se distribui normalmente, com variancia igual a 4, 86mg2 . 25 cabos medindo-se a tensao em cada um. Obteve-se uma tensao media
Pode-se aceitar, ao nvel de 10%, a afirmacao do fabricante. amostral de 515 Kgf e desvio padrao amostral de 30 Kgf.
(a) Verifique se ha evidencias de que a nova tecnica surtiu efeito.

4. Uma estacao de televisao afirma que 60% dos televisores estavam ligados
no seu programa especial de ultima segunda-feira. Uma rede competidora (b) Verifique se ha evidencias de que a modificacao aumentou a variancia
deseja contestar essa afirmacao, e decide usar uma amostra de 200 famlias populacional.
obtendo 104 respostas afirmativas. Qual a conclusao ao nvel de 5% de (c) Verifique se estes dados sao suficientes para estimar a tensao media
significancia? com precisao de 5 Kgf e 95% de confianca.
onde S 2 e a variancia amostral calculada em uma amostra aleatoria com n ob- 5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
servacoes. Ja vimos que T tem distribuicao qui-quadrado com n 1 graus de minutos com desvio padrao 15 minutos. Foi introduzida uma modificacao
liberdade e portanto a regiao de rejeicao ao nvel de significancia e dada pelos para reduzir este tempo e apos alguns meses foi selecionada uma amostra
valores de T tais que de 16 operarios medindo-se o tempo de execucao de cada um. Obteve-se
um tempo medio amostral de 90 minutos e um desvio padrao amostral de
T > 21 ,n1 ou T < 2 n1 . 16 minutos.
2 2
Em termos de p-valor o procedimento consiste em avaliar a estatstica de teste (a) Verifique se existem evidencias, ao nvel de significancia de 5%, de que
t e calcular P (T > t). a modificacao surtiu efeito?
(b) Verifique se ha evidencias, ao nvel de significancia de 5%, de que a
modificacao alterou a variancia populacional.
4.8 Problemas (c) Estime o novo desvio padrao populacional por um intervalo com 98%
1. Suponha que a variavel X: custo de manutencao de uma maquina pode ser de confianca.
considerada como tendo distribuicao normal com media e desvio-padrao (d) O I.C. obtido no item anterior esta de acordo com sua conclusao no
20. Sabe-se tambem que os possveis valores do custo medio sao 200 ou item (b)? (Justifique).
210. Com base em uma amostra de 25 maquinas,
6. Uma fabrica de automoveis anuncia que seus carros consomem, em media,
(a) defina as hipoteses a serem testadas, 11 litros por 100 km, com desvio padrao de 0,8 litros. Uma revista resolve
testar essa afirmacao e analisa 35 automoveis dessa marca, obtendo 11,3
(b) defina uma regra de decisao e encontre as probabilidades de erros tipo litros por 100 km como consumo medio (considerar distribucao normal). O
I e tipo II. que a revista pode concluir sobre o anuncio da fabrica, no nvel de 10%?
2. Uma maquina automatica de encher pacotes de cafe enche-os segundo uma 7. Num levantamento feito com operarios da industria mecanica concluiu-se
distribuicao normal, com media e variancia 400g2 . A maquina foi regulada que o salario medio e 3,64 sm (salarios mnimos) com desvio padrao 0,85
para = 500 g. A cada meia hora colher-se uma amostra de 16 pacotes e sm. Supeita-se que os salarios de subclasse de torneiros mecanicos sao
verifica-se se a producao esta sob controle, isto e se = 500 g ou nao. Se diferentes dos salarios do conjunto todo, tanto na media como na variancia.
uma dessas amostras apresentasse uma media x = 492 g, voce pararia ou Que conclusoes voce obteria se uma amostra de 25 torneiros apresentasse
nao a producao para verificar se a maquina esta ajustada? salario medio igual a 4,22 sm e desvio padrao igual a 1,25 sm?
3. Uma companhia de cigarros anuncia que o ndice medio de nicotina dos ci- 8. A tensao media de ruptura dos cabos produzidos em uma industria e 500
garros que fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratorio Kgf com desvio padrao de 25 Kgf. Uma nova tecnica de producao para
realiza 6 analises desse ndice, obtendo 27, 24, 21, 25, 26, 22. Sabe-se que o aumentar esta tensao media foi introduzida e coletou-se uma amostra de
ndice de nicotina se distribui normalmente, com variancia igual a 4, 86mg2 . 25 cabos medindo-se a tensao em cada um. Obteve-se uma tensao media
Pode-se aceitar, ao nvel de 10%, a afirmacao do fabricante. amostral de 515 Kgf e desvio padrao amostral de 30 Kgf.
(a) Verifique se ha evidencias de que a nova tecnica surtiu efeito.

4. Uma estacao de televisao afirma que 60% dos televisores estavam ligados
no seu programa especial de ultima segunda-feira. Uma rede competidora (b) Verifique se ha evidencias de que a modificacao aumentou a variancia
deseja contestar essa afirmacao, e decide usar uma amostra de 200 famlias populacional.
obtendo 104 respostas afirmativas. Qual a conclusao ao nvel de 5% de (c) Verifique se estes dados sao suficientes para estimar a tensao media
significancia? com precisao de 5 Kgf e 95% de confianca.
4.9 Dimensionamento de amostras estimativa de 2 . O tamanho da amostra para estimar com digamos 95% de
confianca e calculado usando a seguinte expressao
Em geral, quanto maior o tamanho da amostra, maior o poder do teste (1-). 2
E desejavel decidir sobre um tamanho de amostra conveniente antes de conduzir t(n0 1;0,05) s
n= .
um estudo de forma que o resultados do teste de hipotese tera poder suficiente d
para responder a questao cientfica de interesse. Se n n0 , a amostra-piloto ja tera sido suficiente para a estimacao. Caso
Vimos no Captulo 3 e nas secoes anteriores deste captulo como construir contrario, deveremos retirar ainda da populacao os elementos necessarios a com-
intervalos e testes de hipoteses para os principais parametros populacionais. Em plementacao do tamanho mnimo de amostra.
todos os casos, supusemos dado o nvel de confianca desses intervalos e testes. Procedemos de forma analoga se desejamos estimar uma proporcao populaci-
Evidentemente, o nvel de confianca deve ser fixado de acordo com a probabi- onal com determinada confianca e dada precisao. No caso de populacao suposta
lidade de acerto que se deseja ter na estimacao por intervalo e testes. Sendo infinita, da expressao r
conveniente, o nvel de confianca pode ser aumentado ate tao proximo de 100% p(1 p)
quanto se queira, mas isso resultara em intervalos de amplitude cada vez maiores d=z ,
n
(e testes com poderes cada vez menores), o que significa perda de precisao na podemos obter
estimacao. E claro que seria desejavel termos intervalos com alto nvel de con- z 2
n= p(1 p).
fianca e pequena probabilidade de erro e grande precisao. Isso porem requer uma d
amostra suficientemente grande, pois, para n fixo, confianca e precisao variam O obstaculo a determinacao do tamanho de amostra por meio da expressao
em sentidos opostos. acima esta em desconhecermos p. Essa dificuldade pode ser resolvida atraves
Veremos a seguir como determinar o tamanho das amostras necessarias nos de uma amostra-piloto, analogamente ao caso descrito para a estimacao de , ou
casos de estimacao da media ou de uma proporcao populacional. Vimos na Secao analisando-se o comportamento do fator p(1 p) para 0 p 1. Segue que
3.6 que o intervalo de confianca de 95% para a media da populacao quando p(1 p) e a expressao de uma parabola cujo ponto de maximo e p = 1/2.
e conhecido tem semi-amplitude d dada pela expressao Se substituirmos, p(1 p) por seu valor maximo, 1/4, seguramente o tamanho
de amostra obtido sera suficiente para a estimacao de qualquer que seja p. Isso

d = z , equivale a considerar
n z 2 1 z 2
n= = .
onde z = 1, 96. O problema entao resolvido foi, fixados o nvel de confianca d 4 2d
(1 = 0, 95) e n, determinar d. Mas, e evidente dessa expressao que podemos Evidentemente, usando-se essa expressao corre-se o risco de se superdimensionar
resolver outro problema. Fixados, d e o nvel de confianca, determinar n, que e a amostra. Isso ocorrera se p for na realidade proximo de 0 ou 1. Se o custo
o problema da determinacao do tamanho de amostra necessario para se realizar envolvido for elevado e proporcional ao tamanho de amostra, e mais prudente a
a estimacao por intervalo com a confianca e a precisao (d) desejadas. Vemos tomada de uma amostra-piloto.
imediatamente que z 2
n=
d
. 4.10 Problemas
Essa sera a expressao usada se for conhecido.
1. Qual o tamanho de amostra necessario para se estimar a media de uma
Como o desvio-padrao populacional e desconhecido, deveramos subtitu-lo populacao infinita cujo desvio-padrao e igual a 4, com 98% de confianca e
por sua estimativa s e usar t de Student na expressao acima. Porem a amostra precisao de 0,5?
ainda nao foi retirada e portanto nao dispomos em geral do valor de s. Se nao
conhecemos nem ao menos um limite superior para , a unica solucao sera colher 2. Qual o tamanho de amostra suficiente para estimarmos a proporcao da area
uma amostra-piloto de n0 elementos, X1 , . . . , Xn0 e com base nela obter uma com solo contaminado que precisa de tratamento, com precisao de 0,02 e
4.9 Dimensionamento de amostras estimativa de 2 . O tamanho da amostra para estimar com digamos 95% de
confianca e calculado usando a seguinte expressao
Em geral, quanto maior o tamanho da amostra, maior o poder do teste (1-). 2
E desejavel decidir sobre um tamanho de amostra conveniente antes de conduzir t(n0 1;0,05) s
n= .
um estudo de forma que o resultados do teste de hipotese tera poder suficiente d
para responder a questao cientfica de interesse. Se n n0 , a amostra-piloto ja tera sido suficiente para a estimacao. Caso
Vimos no Captulo 3 e nas secoes anteriores deste captulo como construir contrario, deveremos retirar ainda da populacao os elementos necessarios a com-
intervalos e testes de hipoteses para os principais parametros populacionais. Em plementacao do tamanho mnimo de amostra.
todos os casos, supusemos dado o nvel de confianca desses intervalos e testes. Procedemos de forma analoga se desejamos estimar uma proporcao populaci-
Evidentemente, o nvel de confianca deve ser fixado de acordo com a probabi- onal com determinada confianca e dada precisao. No caso de populacao suposta
lidade de acerto que se deseja ter na estimacao por intervalo e testes. Sendo infinita, da expressao r
conveniente, o nvel de confianca pode ser aumentado ate tao proximo de 100% p(1 p)
quanto se queira, mas isso resultara em intervalos de amplitude cada vez maiores d=z ,
n
(e testes com poderes cada vez menores), o que significa perda de precisao na podemos obter
estimacao. E claro que seria desejavel termos intervalos com alto nvel de con- z 2
n= p(1 p).
fianca e pequena probabilidade de erro e grande precisao. Isso porem requer uma d
amostra suficientemente grande, pois, para n fixo, confianca e precisao variam O obstaculo a determinacao do tamanho de amostra por meio da expressao
em sentidos opostos. acima esta em desconhecermos p. Essa dificuldade pode ser resolvida atraves
Veremos a seguir como determinar o tamanho das amostras necessarias nos de uma amostra-piloto, analogamente ao caso descrito para a estimacao de , ou
casos de estimacao da media ou de uma proporcao populacional. Vimos na Secao analisando-se o comportamento do fator p(1 p) para 0 p 1. Segue que
3.6 que o intervalo de confianca de 95% para a media da populacao quando p(1 p) e a expressao de uma parabola cujo ponto de maximo e p = 1/2.
e conhecido tem semi-amplitude d dada pela expressao Se substituirmos, p(1 p) por seu valor maximo, 1/4, seguramente o tamanho
de amostra obtido sera suficiente para a estimacao de qualquer que seja p. Isso

d = z , equivale a considerar
n z 2 1 z 2
n= = .
onde z = 1, 96. O problema entao resolvido foi, fixados o nvel de confianca d 4 2d
(1 = 0, 95) e n, determinar d. Mas, e evidente dessa expressao que podemos Evidentemente, usando-se essa expressao corre-se o risco de se superdimensionar
resolver outro problema. Fixados, d e o nvel de confianca, determinar n, que e a amostra. Isso ocorrera se p for na realidade proximo de 0 ou 1. Se o custo
o problema da determinacao do tamanho de amostra necessario para se realizar envolvido for elevado e proporcional ao tamanho de amostra, e mais prudente a
a estimacao por intervalo com a confianca e a precisao (d) desejadas. Vemos tomada de uma amostra-piloto.
imediatamente que z 2
n=
d
. 4.10 Problemas
Essa sera a expressao usada se for conhecido.
1. Qual o tamanho de amostra necessario para se estimar a media de uma
Como o desvio-padrao populacional e desconhecido, deveramos subtitu-lo populacao infinita cujo desvio-padrao e igual a 4, com 98% de confianca e
por sua estimativa s e usar t de Student na expressao acima. Porem a amostra precisao de 0,5?
ainda nao foi retirada e portanto nao dispomos em geral do valor de s. Se nao
conhecemos nem ao menos um limite superior para , a unica solucao sera colher 2. Qual o tamanho de amostra suficiente para estimarmos a proporcao da area
uma amostra-piloto de n0 elementos, X1 , . . . , Xn0 e com base nela obter uma com solo contaminado que precisa de tratamento, com precisao de 0,02 e
84 CAPITULO 4. TESTES DE HIPOTESES 4.11. TESTES DE ADERENCIA (TESTES 2 ) 85
95% de confianca, sabendo que essa proporcao seguramente nao e superior 7. Refaca o exerccio anterior, sabendo que temos boas razoes para acreditar
a 0,2? que a proporcao que estamos tentando estimar e no mnimo 0,65.
3. A fim de testar a ocorrencia de estratificacao gradacional num certo arenito,

Os testes apresentados nas Secoes 4.5, 4.6 e 4.7 sao todos bilaterais ja que
amostras foram coletadas na base e no topo de 7 estratos desse arenito.
os dois extremos do espaco amostral foram usados como regiao crtica. Nestas
Verifique se as diferencas entre o tamanho medio das partculas da base e
situacoes pode ser que os testes mais apropriados seja unilaterais o que implicara
do topo sao significativas ou nao.
em usar somente uma das caudas da distribuicao na especificacao do nvel de
significancia ou calculo do p-valor.
Estratos base topo d=t-b
1 2,81 3,13 0,32
2 3,95 4,13 0,18
3 3,75 3,88 0,13
4.11 Testes de Aderencia (Testes 2)
4 2,68 2,91 0,23
Vimos na Secao 2.7 como ajustar modelos teoricos a um conjunto de dados e
5 3,25 3,65 0,36
a qualidade do ajuste foi verificada comparando-se as frequencias teoricas (ou
6 3,90 4,20 0,30
esperadas) com as frequencias observadas.
7 3,30 3,12 -0,18
Mais formalmente, a aderencia dos dados a um certo modelo teorico pode ser
testada atraves da seguinte estatstica
4. Foram feitas 20 medidas do tempo total gasto para a precipitacao de um
sal, em segundos, num dado experimento, obtendo-se os valores k
X (oi ei )2
T =
i=1
ei
13 15 12 14 17 15 16 15 14 16
17 14 16 15 15 13 14 15 16 15 sendo oi e ei as frequencias observadas e esperadas respectivamente e k o numero
de classes ou valores considerados. Pode-se mostrar que T tem distribuicao qui-
Verifique se estes dados sao suficientes para estimar o tempo medio gasto quadrado com k 1 m graus de liberdade sendo m o numero de parametros
estimados no modelo teorico. Uma condicao de validade desta distribuicao e que
na precipitacao com precisao de meio segundo e 95% de confianca? Caso
ei 5, i = 1, . . . , k.
negativo, qual o tamanho da amostra adicional necessaria?
As hipoteses a serem testadas sao
5. Deseja-se estimar a resistencia media de certo tipo de peca com precisao
de 2kg e 95% de confianca. Desconhecendo-se a variabilidade dessa re- H0 : Os dados se ajustam bem ao modelo
sistencia, roperam-se cinco pecas, obtendo-se para elas os seguintes valores H1 : O ajuste nao e bom.
de sua resitencia (em kg): 50,58,52,49,55. Com base no resultado obtido,
determinou-se que deveriam ser rompidas mais quinze pecas, a fim de se Note que se o ajuste nao for bom as frequencias observadas e esperadas tenderao a
conseguir o resultado desejado. Qual sua opiniao a respeito dessa conclusao? ser muito diferentes e portanto valores grandes da estatstica T indicam evidencia
contra H0 . Ou seja, este teste e do tipo unilateral.
6. Suponha que estejamos interessados em estimar a proporcao de todos os
motoristas que excedem o limite maximo de velocidade num trecho da ro- Exemplo 4.5 : No Exemplo 2.16 as frequencias ajustadas e observadas para os
dovia entre Curitiba-Sao Paulo. Quao grande deve ser a amostra para que dados de vazao agrupados em classes sao dadas na Tabela 2.6. Estamos interessa-
estejamos pelo menos 99% confiantes de que o erro de nossa estimativa, a dos em testar a hipotese de que o modelo normal com media 21,9 e desvio-padrao
proporcao amostral, seja no maximo 0,04? 4,71 se ajusta bem aos dados. Neste caso o valor da estatstica de teste e dado
84 CAPITULO 4. TESTES DE HIPOTESES 4.11. TESTES DE ADERENCIA (TESTES 2 ) 85
95% de confianca, sabendo que essa proporcao seguramente nao e superior 7. Refaca o exerccio anterior, sabendo que temos boas razoes para acreditar
a 0,2? que a proporcao que estamos tentando estimar e no mnimo 0,65.
3. A fim de testar a ocorrencia de estratificacao gradacional num certo arenito,

Os testes apresentados nas Secoes 4.5, 4.6 e 4.7 sao todos bilaterais ja que
amostras foram coletadas na base e no topo de 7 estratos desse arenito.
os dois extremos do espaco amostral foram usados como regiao crtica. Nestas
Verifique se as diferencas entre o tamanho medio das partculas da base e
situacoes pode ser que os testes mais apropriados seja unilaterais o que implicara
do topo sao significativas ou nao.
em usar somente uma das caudas da distribuicao na especificacao do nvel de
significancia ou calculo do p-valor.
Estratos base topo d=t-b
1 2,81 3,13 0,32
2 3,95 4,13 0,18
3 3,75 3,88 0,13
4.11 Testes de Aderencia (Testes 2)
4 2,68 2,91 0,23
Vimos na Secao 2.7 como ajustar modelos teoricos a um conjunto de dados e
5 3,25 3,65 0,36
a qualidade do ajuste foi verificada comparando-se as frequencias teoricas (ou
6 3,90 4,20 0,30
esperadas) com as frequencias observadas.
7 3,30 3,12 -0,18
Mais formalmente, a aderencia dos dados a um certo modelo teorico pode ser
testada atraves da seguinte estatstica
4. Foram feitas 20 medidas do tempo total gasto para a precipitacao de um
sal, em segundos, num dado experimento, obtendo-se os valores k
X (oi ei )2
T =
i=1
ei
13 15 12 14 17 15 16 15 14 16
17 14 16 15 15 13 14 15 16 15 sendo oi e ei as frequencias observadas e esperadas respectivamente e k o numero
de classes ou valores considerados. Pode-se mostrar que T tem distribuicao qui-
Verifique se estes dados sao suficientes para estimar o tempo medio gasto quadrado com k 1 m graus de liberdade sendo m o numero de parametros
estimados no modelo teorico. Uma condicao de validade desta distribuicao e que
na precipitacao com precisao de meio segundo e 95% de confianca? Caso
ei 5, i = 1, . . . , k.
negativo, qual o tamanho da amostra adicional necessaria?
As hipoteses a serem testadas sao
5. Deseja-se estimar a resistencia media de certo tipo de peca com precisao
de 2kg e 95% de confianca. Desconhecendo-se a variabilidade dessa re- H0 : Os dados se ajustam bem ao modelo
sistencia, roperam-se cinco pecas, obtendo-se para elas os seguintes valores H1 : O ajuste nao e bom.
de sua resitencia (em kg): 50,58,52,49,55. Com base no resultado obtido,
determinou-se que deveriam ser rompidas mais quinze pecas, a fim de se Note que se o ajuste nao for bom as frequencias observadas e esperadas tenderao a
conseguir o resultado desejado. Qual sua opiniao a respeito dessa conclusao? ser muito diferentes e portanto valores grandes da estatstica T indicam evidencia
contra H0 . Ou seja, este teste e do tipo unilateral.
6. Suponha que estejamos interessados em estimar a proporcao de todos os
motoristas que excedem o limite maximo de velocidade num trecho da ro- Exemplo 4.5 : No Exemplo 2.16 as frequencias ajustadas e observadas para os
dovia entre Curitiba-Sao Paulo. Quao grande deve ser a amostra para que dados de vazao agrupados em classes sao dadas na Tabela 2.6. Estamos interessa-
estejamos pelo menos 99% confiantes de que o erro de nossa estimativa, a dos em testar a hipotese de que o modelo normal com media 21,9 e desvio-padrao
proporcao amostral, seja no maximo 0,04? 4,71 se ajusta bem aos dados. Neste caso o valor da estatstica de teste e dado
por e podemos construir a tabela abaixo.
(41 55)2 (157 126)2 (305 325)2

T = + + + Tabela 4.3: Frequencias esperadas sob a hipotese de independencia.
41 157 305
2 2 2
(300 315) (150 130) (38 49)
+ + = 18, 81386. Classe social
300 150 38
Colegio Alta Media Baixa
O numero de classes e k = 6 e o numero de parametros estimados e m = 2 A 31,82 36,36 31,82
(a media e a variancia da distribuicao normal) e portanto T tem distribuicao B 38,18 43,64 38,18
qui-quadrado com k 1 m = 3 graus de liberdade. Nenhuma das classes
apresenta frequencia esperada menor do que 5 portanto esta distribuicao e valida.
Fixando o nvel de significancia = 0, 05 obtemos na tabela da distribuicao 2 Podemos agora avaliar a estatstica de teste
com 3 graus de liberdade que P (T > 7, 815) = 0, 05 e como 18, 81386 > 7, 815
(20 31, 82)2 (40 36, 36)2 (40 31, 82)2
ha evidencias para rejeitar H0 ao nvel de 5%. Da mesma tabela obtemos que T = + + +
P (T > 16, 266) = 0, 001 e portanto o P -valor e menor do que 0,001. Ou seja, ha 31, 82 36, 36 31, 82
2 2 2
evidencia extremamente forte contra H0 . (50 38, 18) (40 43, 64) (30 38, 18)
+ + = 12, 57.
38, 18 43, 64 38, 18
Exemplo 4.6 : O teste 2 tambem pode ser aplicado no estudo da relacao entre
Ao nvel de significancia 0,05 obtemos da tabela 2 com (p 1)(k 1) = 2
duas variaveis categoricas com p e k possveis categorias. Neste caso queremos
graus de liberdade que P (T > 5, 99) = 0, 05 e como 12, 57 > 5, 99 a hipotese
testar se as variaveis sao independentes (hipotese nula). A estatstica de teste
de independencia e rejeitada. Para calcular o P -valor, note que a tabela qui-
e a mesma porem com numero de graus de liberdade igual a (p 1)(k 1)
quadrado com 2 graus de liberdade nos fornece,
Considere por exemplo a Tabela 4.3 na qual estao apresentados os numero de
alunos matriculados nos colegios A e B, em relacao a sua classe social. Se as P (T > 12, 429) = 0, 002
Tabela 4.2: e portanto podemos concluir que P -valor < 0,002. Ou seja, existe forte evidencia
contra a hipotese de independencia entre as variaveis Colegio e Classe social.
Classe social
Colegio Alta Media Baixa Total
A 20 40 40 100
B 50 40 30 120 4.12 Problemas
Total 70 80 70 220
1. Nos Exemplos 2.14 e 2.15 teste a adequacao dos modelos propostos (Bino-
mial e Poisson respectivamente).
variaveis Colegio e Classe social forem independentes espera-se que as frequencias
de alunos das 3 classes sejam as mesmas nos 2 colegios, i.e. 70/220, 80/220 e 2. Em seus experimentos com ervilhas, Mendel ao cruzar plantas de semen-
70/220. As frequencias esperadas sob a hipotese de independencia sao entao tes amarelas lisas com plantas de sementes verdes enrugadas observou a
dadas por seguinte descendencia na 2a geracao: 315 plantas com sementes amarelas
lisas, 108 com sementes amarelas enrugadas, 101 com sementes verdes li-
70 80 70
Colegio A: 100 = 31, 82 100 = 36, 36 100 = 31, 82 sas e 32 com sementes verdes enrugadas. De acordo com os postulados de
220 220 220
Mendel a segregacao esperada nesta geracao deveria seguir a proporcao de
70 80 70 9:3:3:1. Verifique se a teoria de Mendel explica a segregacao observada.
Colegio B: 120 = 38, 18 120 = 43, 64 120 = 38, 18
220 220 220
por e podemos construir a tabela abaixo.
(41 55)2 (157 126)2 (305 325)2

T = + + + Tabela 4.3: Frequencias esperadas sob a hipotese de independencia.
41 157 305
2 2 2
(300 315) (150 130) (38 49)
+ + = 18, 81386. Classe social
300 150 38
Colegio Alta Media Baixa
O numero de classes e k = 6 e o numero de parametros estimados e m = 2 A 31,82 36,36 31,82
(a media e a variancia da distribuicao normal) e portanto T tem distribuicao B 38,18 43,64 38,18
qui-quadrado com k 1 m = 3 graus de liberdade. Nenhuma das classes
apresenta frequencia esperada menor do que 5 portanto esta distribuicao e valida.
Fixando o nvel de significancia = 0, 05 obtemos na tabela da distribuicao 2 Podemos agora avaliar a estatstica de teste
com 3 graus de liberdade que P (T > 7, 815) = 0, 05 e como 18, 81386 > 7, 815
(20 31, 82)2 (40 36, 36)2 (40 31, 82)2
ha evidencias para rejeitar H0 ao nvel de 5%. Da mesma tabela obtemos que T = + + +
P (T > 16, 266) = 0, 001 e portanto o P -valor e menor do que 0,001. Ou seja, ha 31, 82 36, 36 31, 82
2 2 2
evidencia extremamente forte contra H0 . (50 38, 18) (40 43, 64) (30 38, 18)
+ + = 12, 57.
38, 18 43, 64 38, 18
Exemplo 4.6 : O teste 2 tambem pode ser aplicado no estudo da relacao entre
Ao nvel de significancia 0,05 obtemos da tabela 2 com (p 1)(k 1) = 2
duas variaveis categoricas com p e k possveis categorias. Neste caso queremos
graus de liberdade que P (T > 5, 99) = 0, 05 e como 12, 57 > 5, 99 a hipotese
testar se as variaveis sao independentes (hipotese nula). A estatstica de teste
de independencia e rejeitada. Para calcular o P -valor, note que a tabela qui-
e a mesma porem com numero de graus de liberdade igual a (p 1)(k 1)
quadrado com 2 graus de liberdade nos fornece,
Considere por exemplo a Tabela 4.3 na qual estao apresentados os numero de
alunos matriculados nos colegios A e B, em relacao a sua classe social. Se as P (T > 12, 429) = 0, 002
Tabela 4.2: e portanto podemos concluir que P -valor < 0,002. Ou seja, existe forte evidencia
contra a hipotese de independencia entre as variaveis Colegio e Classe social.
Classe social
Colegio Alta Media Baixa Total
A 20 40 40 100
B 50 40 30 120 4.12 Problemas
Total 70 80 70 220
1. Nos Exemplos 2.14 e 2.15 teste a adequacao dos modelos propostos (Bino-
mial e Poisson respectivamente).
variaveis Colegio e Classe social forem independentes espera-se que as frequencias
de alunos das 3 classes sejam as mesmas nos 2 colegios, i.e. 70/220, 80/220 e 2. Em seus experimentos com ervilhas, Mendel ao cruzar plantas de semen-
70/220. As frequencias esperadas sob a hipotese de independencia sao entao tes amarelas lisas com plantas de sementes verdes enrugadas observou a
dadas por seguinte descendencia na 2a geracao: 315 plantas com sementes amarelas
lisas, 108 com sementes amarelas enrugadas, 101 com sementes verdes li-
70 80 70
Colegio A: 100 = 31, 82 100 = 36, 36 100 = 31, 82 sas e 32 com sementes verdes enrugadas. De acordo com os postulados de
220 220 220
Mendel a segregacao esperada nesta geracao deveria seguir a proporcao de
70 80 70 9:3:3:1. Verifique se a teoria de Mendel explica a segregacao observada.
Colegio B: 120 = 38, 18 120 = 43, 64 120 = 38, 18
220 220 220
88 CAPITULO 4. TESTES DE HIPOTESES
3. Em uma amostra de 1800 valores no intervalo (0,1) obteve-se 391 valores

entre 0 e 0,2, 490 valores entre 0,2 e 0,5, 580 entre 0,5 e 0,8; e 339 maiores do
que 0,8. Teste a hipotese de que a amostra foi tomada de uma distribuicao
uniforme no intervalo (0,1) (neste caso a probabilidade de um valor cair no
intervalo (a, b) e b a).
Captulo 5
4.13 Comentarios
Da forma como a metodologia classica de testes de hipoteses foi desenvolvida Comparando Grupos
podemos ter a impressao de que estamos calculando probabilidades a respeito de
uma hipotese. De fato, algumas vezes e incorretamente afirmado que rejeitar H0
ao nvel indica que a probabilidade de H0 ser verdadeira e menor do que .
Esta interpretacao nao e valida e o p-valor calculado em um teste nao fornece 5.1 Diferenca entre medias de dois grupos
nenhuma indicacao sobre qualquer probabilidade a respeito de H0 .
Para que esta interpretacao fosse valida teriamos que usar a abordagem Baye- Na Secao 3.6.1, vimos como construir um intervalo de confianca para a media
siana. Basicamente, teramos que atribuir uma probabilidade a priori, i.e. antes populacional , de uma amostra aleatoria de tamanho n. Consideremos agora
de observar os dados, para a hipotese H0 . Apos a observacao dos dados amos- a comparacao das medias 1 e 2 de duas populacoes (e.g. machos e femeas,
trais esta probabilidade seria atualizada, segundo regras da inferencia Bayesiana, fornecedores A e B, etc) atraves da estimacao das diferencas de medias (1 2 )
e teramos uma probabilidade a posteriori para a hipotese H0 . Este assunto nao e calculando um intervalo de confianca para esta diferenca das medias.
sera tratado nestas notas, para maiores detalhes ver por exemplo Migon and Quando temos amostras independentes de cada uma de duas populacoes, po-
Gamerman (1999) ou DeGroot (1989). demos resumi-las pelas suas medias, desvios padrao e tamanhos amostrais. Vamos
denotar estas medidas por x1 , s1 , n1 para a amostra 1 e x2 , s2 , n2 para a amostra
2. As correspondentes medias e desvios padrao populacionais serao denotados por
1 , 2 , 1 e 2 respectivamente. Ou seja temos agora duas amostras aleatorias
independentes
X11 , . . . , X1n1 N(1 , 12 )
X21 , . . . , X2n2 N(2 , 22 ).
Uma estimativa natural da diferenca entre medias na populacao, 1 2 , e
dada pela diferenca nas medias amostrais x1 x2 . Agora o que precisamos e de
um erro padrao para esta estimativa para que possamos construir intervalos de
confianca e realizar testes de hipotese do tipo
H0 : 1 2 = 0
H1 : 1 2 6= 0.
Das propriedades vistas no Captulo 3 segue que
X 1 N(1 , 12 /n1 ) e X 2 N(2 , 12 /n2 )
89
88 CAPITULO 4. TESTES DE HIPOTESES
3. Em uma amostra de 1800 valores no intervalo (0,1) obteve-se 391 valores

entre 0 e 0,2, 490 valores entre 0,2 e 0,5, 580 entre 0,5 e 0,8; e 339 maiores do
que 0,8. Teste a hipotese de que a amostra foi tomada de uma distribuicao
uniforme no intervalo (0,1) (neste caso a probabilidade de um valor cair no
intervalo (a, b) e b a).
Captulo 5
4.13 Comentarios
Da forma como a metodologia classica de testes de hipoteses foi desenvolvida Comparando Grupos
podemos ter a impressao de que estamos calculando probabilidades a respeito de
uma hipotese. De fato, algumas vezes e incorretamente afirmado que rejeitar H0
ao nvel indica que a probabilidade de H0 ser verdadeira e menor do que .
Esta interpretacao nao e valida e o p-valor calculado em um teste nao fornece 5.1 Diferenca entre medias de dois grupos
nenhuma indicacao sobre qualquer probabilidade a respeito de H0 .
Para que esta interpretacao fosse valida teriamos que usar a abordagem Baye- Na Secao 3.6.1, vimos como construir um intervalo de confianca para a media
siana. Basicamente, teramos que atribuir uma probabilidade a priori, i.e. antes populacional , de uma amostra aleatoria de tamanho n. Consideremos agora
de observar os dados, para a hipotese H0 . Apos a observacao dos dados amos- a comparacao das medias 1 e 2 de duas populacoes (e.g. machos e femeas,
trais esta probabilidade seria atualizada, segundo regras da inferencia Bayesiana, fornecedores A e B, etc) atraves da estimacao das diferencas de medias (1 2 )
e teramos uma probabilidade a posteriori para a hipotese H0 . Este assunto nao e calculando um intervalo de confianca para esta diferenca das medias.
sera tratado nestas notas, para maiores detalhes ver por exemplo Migon and Quando temos amostras independentes de cada uma de duas populacoes, po-
Gamerman (1999) ou DeGroot (1989). demos resumi-las pelas suas medias, desvios padrao e tamanhos amostrais. Vamos
denotar estas medidas por x1 , s1 , n1 para a amostra 1 e x2 , s2 , n2 para a amostra
2. As correspondentes medias e desvios padrao populacionais serao denotados por
1 , 2 , 1 e 2 respectivamente. Ou seja temos agora duas amostras aleatorias
independentes
X11 , . . . , X1n1 N(1 , 12 )
X21 , . . . , X2n2 N(2 , 22 ).
Uma estimativa natural da diferenca entre medias na populacao, 1 2 , e
dada pela diferenca nas medias amostrais x1 x2 . Agora o que precisamos e de
um erro padrao para esta estimativa para que possamos construir intervalos de
confianca e realizar testes de hipotese do tipo
H0 : 1 2 = 0
H1 : 1 2 6= 0.
Das propriedades vistas no Captulo 3 segue que
X 1 N(1 , 12 /n1 ) e X 2 N(2 , 12 /n2 )
89
90 CAPITULO 5. COMPARANDO GRUPOS 5.1. DIFERENCA ENTRE MEDIAS DE DOIS GRUPOS 91
e como as sao independentes segue tambem que Analogamente, para testar por exemplo as hipoteses

2 2 H0 : 1 = 2 H1 : 1 6= 2
X 1 X 2 N 1 2 , 1 + 2 .
n1 n2
pode-se especificar um nvel de significancia e obter o valor de t/2 como acima.
Aqui no entanto precisamos levar em conta duas possveis situacoes ja que os
Como o teste e bilateral a regra de decisao consiste em rejeitar H0 se
desvios padrao podem ser iguais (1 = 2 ) ou nao (1 6= 2 ).
(x1 x2 ) (x1 x2 )
r < t/2 ou r > t/2 .
1 1 1 1
sp + sp +
n1 n2 n1 n2
5.1.1 Desvios padrao iguais
Primeiramente, assumimos que os desvios padrao populacionais sao os mesmos Exemplo 5.1 : Com o objetivo de comparar as alturas medias em centmetros
em cada grupo, i.e. 1 = 2 = . Podemos combinar os dois desvios padroes dos estudantes dos sexos masculino (X1 ) e feminino (X2 ) em uma universidade
amostrais para formar uma estimativa combinada do desvio padrao atribuindo foram selecionadas duas amostras de tamanhos n1 = 20 e n2 = 17. As medidas
mais peso as amostras maiores. Este desvio padrao combinado denotado por sp amostrais obtidas foram x1 = 178, 85, s1 = 7, 734, x2 = 164, 09, e s2 = 9, 750. A
e a raiz quadrada da variancia combinada dada por estimativa pontual para a diferenca entre as medias e entao dada por 178, 85
164, 09 = 14, 76. A variancia amostral combinada fica
(n1 1)s21 + (n2 1)s22
s2p = .
n1 + n2 2 s2p = (19 7, 7342 + 16 9, 7502 )/35 = 75, 92801

Note que min{s21 , s22 } s2p max{s21 , s22 } sempre ja que a soma dos pesos e igual e entao sp =p 75, 92801 = 8, 71. Finalmente o erro padrao pode ser calculado
a 1. Se isto nao ocorrer seus calculos estao errados. Agora podemos calcular o como 8, 71 1/20 + 1/17 = 2, 87. Fixando o nvel de confianca em 0,95 obtemos
erro padrao das diferencas nas medias como na tabela t com 35 graus de liberdade que P (|T | > 2, 03) = 0, 05 e entao um I.C.
r de 95% para 1 2 e dado por
1 1
EP (X 1 X 2 ) = Sp + .
n1 n2 [14, 76 2, 03 2, 87; 14, 76 + 2, 03 2, 87] = [8, 93; 20, 59].
Pode-se mostrar que
Note que este resultado tambem implica em rejeitar a hipotese de igualdade
(X 1 X 2 ) (1 2 ) entre as medias populacionais ao nvel de significancia 0,05.
T = r tn1 +n2 2
1 1
Sp +
n1 n2
e esta e a estatstica utilizada para construir intervalos de confianca e testar 5.1.2 Desvios padrao diferentes
hipoteses sobre a diferenca de medias.
A violacao da suposicao de igualdade leva a problemas teoricos e praticos uma vez
Assim para construir um IC de 100(1 )% para a diferenca obtem-se o
que nao e trivial encontrar uma estatstica de teste com distribuicao conhecida.
valor t/2 na tabela da distribuicao t com n1 + n2 2 graus de liberdade tal que
Assim, o pesquisador deve levar isto em conta caso haja diferenca substancial
P (t/2 < T < t/2 ) = 1 . Apos observar as amostras o intervalo fica
entre 12 e 22
r r
1 1 1 1 A literatura estatstica apresenta varios metodos para resolver este problema
x1 x2 t/2 sp + ; x1 x2 + t/2 sp + . mas nenhum deles e completamente satisfatorio. Um procedimento possvel (e
n1 n2 n1 n2
90 CAPITULO 5. COMPARANDO GRUPOS 5.1. DIFERENCA ENTRE MEDIAS DE DOIS GRUPOS 91
e como as sao independentes segue tambem que Analogamente, para testar por exemplo as hipoteses

2 2 H0 : 1 = 2 H1 : 1 6= 2
X 1 X 2 N 1 2 , 1 + 2 .
n1 n2
pode-se especificar um nvel de significancia e obter o valor de t/2 como acima.
Aqui no entanto precisamos levar em conta duas possveis situacoes ja que os
Como o teste e bilateral a regra de decisao consiste em rejeitar H0 se
desvios padrao podem ser iguais (1 = 2 ) ou nao (1 6= 2 ).
(x1 x2 ) (x1 x2 )
r < t/2 ou r > t/2 .
1 1 1 1
sp + sp +
n1 n2 n1 n2
5.1.1 Desvios padrao iguais
Primeiramente, assumimos que os desvios padrao populacionais sao os mesmos Exemplo 5.1 : Com o objetivo de comparar as alturas medias em centmetros
em cada grupo, i.e. 1 = 2 = . Podemos combinar os dois desvios padroes dos estudantes dos sexos masculino (X1 ) e feminino (X2 ) em uma universidade
amostrais para formar uma estimativa combinada do desvio padrao atribuindo foram selecionadas duas amostras de tamanhos n1 = 20 e n2 = 17. As medidas
mais peso as amostras maiores. Este desvio padrao combinado denotado por sp amostrais obtidas foram x1 = 178, 85, s1 = 7, 734, x2 = 164, 09, e s2 = 9, 750. A
e a raiz quadrada da variancia combinada dada por estimativa pontual para a diferenca entre as medias e entao dada por 178, 85
164, 09 = 14, 76. A variancia amostral combinada fica
(n1 1)s21 + (n2 1)s22
s2p = .
n1 + n2 2 s2p = (19 7, 7342 + 16 9, 7502 )/35 = 75, 92801

Note que min{s21 , s22 } s2p max{s21 , s22 } sempre ja que a soma dos pesos e igual e entao sp =p 75, 92801 = 8, 71. Finalmente o erro padrao pode ser calculado
a 1. Se isto nao ocorrer seus calculos estao errados. Agora podemos calcular o como 8, 71 1/20 + 1/17 = 2, 87. Fixando o nvel de confianca em 0,95 obtemos
erro padrao das diferencas nas medias como na tabela t com 35 graus de liberdade que P (|T | > 2, 03) = 0, 05 e entao um I.C.
r de 95% para 1 2 e dado por
1 1
EP (X 1 X 2 ) = Sp + .
n1 n2 [14, 76 2, 03 2, 87; 14, 76 + 2, 03 2, 87] = [8, 93; 20, 59].
Pode-se mostrar que
Note que este resultado tambem implica em rejeitar a hipotese de igualdade
(X 1 X 2 ) (1 2 ) entre as medias populacionais ao nvel de significancia 0,05.
T = r tn1 +n2 2
1 1
Sp +
n1 n2
e esta e a estatstica utilizada para construir intervalos de confianca e testar 5.1.2 Desvios padrao diferentes
hipoteses sobre a diferenca de medias.
A violacao da suposicao de igualdade leva a problemas teoricos e praticos uma vez
Assim para construir um IC de 100(1 )% para a diferenca obtem-se o
que nao e trivial encontrar uma estatstica de teste com distribuicao conhecida.
valor t/2 na tabela da distribuicao t com n1 + n2 2 graus de liberdade tal que
Assim, o pesquisador deve levar isto em conta caso haja diferenca substancial
P (t/2 < T < t/2 ) = 1 . Apos observar as amostras o intervalo fica
entre 12 e 22
r r
1 1 1 1 A literatura estatstica apresenta varios metodos para resolver este problema
x1 x2 t/2 sp + ; x1 x2 + t/2 sp + . mas nenhum deles e completamente satisfatorio. Um procedimento possvel (e
n1 n2 n1 n2
92 CAPITULO 5. COMPARANDO GRUPOS 5.3. AMOSTRAS PAREADAS 93
aproximado) que sera considerado aqui consiste em utilizar a estatstica liberdade do denominador.
Uma propriedade bastante util para calcular probabilidades com a distribuicao
(X 1 X 2 ) (1 2 ) F vem do fato de que se X F (m, n) entao X 1 F (n, m). Devido a esta
T = r 2
S1 S2 propriedade e usual que os livros fornecam tabelas somente com os percentis
+ 2
n1 n2 superiores da distribuicao F para varias combinacoes de valores dos graus de
liberdade.
com distribuicao t de Student e numero de graus de liberdade dado por
(w1 + w2 )2 Exemplo 5.2 : Suponha por exemplo que X F (4, 6) e queremos obter o valor
= x tal que P (X < x) = 0, 05. Neste caso devemos obter primeiro o valor y tal que
w12 w22
+ P (X 1 > y) = 0, 05 onde X 1 F (6, 4) que e dado na Tabela ?? por y = 6, 16.
n1 1 n2 1
Podemos agora calcular x = 1/y = 1/6, 16 0, 16.
onde
s21 s22
w1 = e w2 = .
n1 n2 5.3 Amostras pareadas
Novamente pode-se construir intervalos de confianca e testar hipoteses sobre
a diferenca entre as medias populacionais usando esta estatstica. Nas secoes anteriores fizemos a suposicao de que as amostras eram independentes,
mas esta nem sempre e uma suposicao razoavel. Em estudos chamados pareados,
temos duas amostras mas cada observacao na primeira amostra e pareada com
5.2 Comparacao de variancias uma observacao da segunda amostra. Tal situacao ocorre por exemplo em um
estudo de medidas feitas antes e depois no mesmo indivduo (ou mesma maquina,
Outra situacao de interesse e a comparacao das duas variancias populacionais. ou processo de producao, etc). Como esperado, as duas observacoes do mesmo
Neste caso, faz mais sentido utilizar a razao de variancias ao inves da diferenca indivduo sao mais provaveis de serem similares, e portanto nao podem ser con-
ja que elas medem a escala de uma distribuicao e sao sempre positivas. Ou seja sideradas estatisticamente independentes.
estamos interessados em estimar a quantidade 12 /22 construindo intervalos de Analogamente ao caso anterior, as observacoes pareadas sao representadas
confianca em torno da estimativa pontual s21 /s22 . As hipoteses a serem testadas pelas variaveis aleatorias
neste caso podem ser
X11 , . . . , X1n : medida 1
H0 : 12 = 22
H1 : 12 6= 22 . X21 , . . . , X2n : medida 2
e entao escrevemos as diferencas nas medidas de cada par como Di = X2i X1i ,
Para fazer inferencia sobre esta razao de variancias a estatstica utilizada e
i = 1, . . . , n. Temos agora uma amostra de diferencas e assumindo que
S12 22
F (n1 1, n2 1). 2
D1 , . . . , Dn N(D , D )
S22 12
A distribuicao associada e chamada distribuicao F de Fisher (ou simplesmente podemos usar os metodos que ja estamos familiares. Podemos calcular um inter-
F ) com n1 1 e n2 1 graus de liberdade. Os valores dos percentis estao ta- valo de confianca para a diferenca media e testar se a diferenca media e igual a
belados no Apendice ?? para varias probabilidades e estes podem ser utilizados um particular valor (usualmente zero) ou nao. Nos referimos a tal teste como um
na construcao de intervalos de confianca e testes de hipoteses para a razao de teste t pareado. Note que neste caso estamos interessados na diferenca media en-
variancias. A primeira linha das tabelas apresenta os chamados graus de liber- quanto que para duas amostras independentes, estamos interessados na diferenca
dade do numerador enquanto a primeira coluna apresenta os chamados graus de das medias. Ainda que numericamente estas quantidades possam ser as mesmas,
92 CAPITULO 5. COMPARANDO GRUPOS 5.3. AMOSTRAS PAREADAS 93
aproximado) que sera considerado aqui consiste em utilizar a estatstica liberdade do denominador.
Uma propriedade bastante util para calcular probabilidades com a distribuicao
(X 1 X 2 ) (1 2 ) F vem do fato de que se X F (m, n) entao X 1 F (n, m). Devido a esta
T = r 2
S1 S2 propriedade e usual que os livros fornecam tabelas somente com os percentis
+ 2
n1 n2 superiores da distribuicao F para varias combinacoes de valores dos graus de
liberdade.
com distribuicao t de Student e numero de graus de liberdade dado por
(w1 + w2 )2 Exemplo 5.2 : Suponha por exemplo que X F (4, 6) e queremos obter o valor
= x tal que P (X < x) = 0, 05. Neste caso devemos obter primeiro o valor y tal que
w12 w22
+ P (X 1 > y) = 0, 05 onde X 1 F (6, 4) que e dado na Tabela ?? por y = 6, 16.
n1 1 n2 1
Podemos agora calcular x = 1/y = 1/6, 16 0, 16.
onde
s21 s22
w1 = e w2 = .
n1 n2 5.3 Amostras pareadas
Novamente pode-se construir intervalos de confianca e testar hipoteses sobre
a diferenca entre as medias populacionais usando esta estatstica. Nas secoes anteriores fizemos a suposicao de que as amostras eram independentes,
mas esta nem sempre e uma suposicao razoavel. Em estudos chamados pareados,
temos duas amostras mas cada observacao na primeira amostra e pareada com
5.2 Comparacao de variancias uma observacao da segunda amostra. Tal situacao ocorre por exemplo em um
estudo de medidas feitas antes e depois no mesmo indivduo (ou mesma maquina,
Outra situacao de interesse e a comparacao das duas variancias populacionais. ou processo de producao, etc). Como esperado, as duas observacoes do mesmo
Neste caso, faz mais sentido utilizar a razao de variancias ao inves da diferenca indivduo sao mais provaveis de serem similares, e portanto nao podem ser con-
ja que elas medem a escala de uma distribuicao e sao sempre positivas. Ou seja sideradas estatisticamente independentes.
estamos interessados em estimar a quantidade 12 /22 construindo intervalos de Analogamente ao caso anterior, as observacoes pareadas sao representadas
confianca em torno da estimativa pontual s21 /s22 . As hipoteses a serem testadas pelas variaveis aleatorias
neste caso podem ser
X11 , . . . , X1n : medida 1
H0 : 12 = 22
H1 : 12 6= 22 . X21 , . . . , X2n : medida 2
e entao escrevemos as diferencas nas medidas de cada par como Di = X2i X1i ,
Para fazer inferencia sobre esta razao de variancias a estatstica utilizada e
i = 1, . . . , n. Temos agora uma amostra de diferencas e assumindo que
S12 22
F (n1 1, n2 1). 2
D1 , . . . , Dn N(D , D )
S22 12
A distribuicao associada e chamada distribuicao F de Fisher (ou simplesmente podemos usar os metodos que ja estamos familiares. Podemos calcular um inter-
F ) com n1 1 e n2 1 graus de liberdade. Os valores dos percentis estao ta- valo de confianca para a diferenca media e testar se a diferenca media e igual a
belados no Apendice ?? para varias probabilidades e estes podem ser utilizados um particular valor (usualmente zero) ou nao. Nos referimos a tal teste como um
na construcao de intervalos de confianca e testes de hipoteses para a razao de teste t pareado. Note que neste caso estamos interessados na diferenca media en-
variancias. A primeira linha das tabelas apresenta os chamados graus de liber- quanto que para duas amostras independentes, estamos interessados na diferenca
dade do numerador enquanto a primeira coluna apresenta os chamados graus de das medias. Ainda que numericamente estas quantidades possam ser as mesmas,
94 CAPITULO 5. COMPARANDO GRUPOS 5.5. PROBLEMAS 95
conceitualmente elas sao diferentes. e do teorema central do limite e propriedades da distribuicao normal segue que
Exemplo 5.3 : A mudanca nos nveis de um contaminante numa certa area do p2 p1 N(p2 p1 , 2 )
incio ao final de seis meses de observacao foram (em /l):
sendo s
1, 5 0, 6 0, 3 0, 2 2, 0 1, 2 p1 (1 p1 ) p2 (1 p2 )
2 = + .
n1 n2
Aqui nao estamos interessados nos nveis de contaminacao mas sim em sua va- O erro padrao da diferenca amostral de proporcoes e estimado por
riacao. A media e o desvio padrao amostrais sao d = 0, 9 e s = 0, 81 respectiva-
s
mente. Entao o erro padrao e 0, 81/ 6 = 0, 33. Podemos agora realizar um teste p1 (1 p1 ) p2 (1 p2 )
t pareado para testar a hipotese nula de que a perda na concentracao media e 0. EP (p2 p1 ) = + .
n1 n2
Para isso calculamos
d 0 0, 9 e com isto podemos construir um intervalo de confianca da forma usual, ou seja
t=
EP(d) = 0, 33 = 2, 73.
Note que este valor e negativo (porque a mudanca media observada foi a reducao (p2 p1 ) z/2 EP (p2 p1 ).
na concentracao do poluente, um valor positivo seria um aumento na concentracao
do poluente). Observamos o valor absoluto da estatstica de teste (2,73) na tabela Podemos tambem testar as hipoteses
da distribuicao t, usando a linha com n 1 = 5 graus de liberdade. A quinta
H 0 : p2 p1 = 0
linha da tabela mostra que 0, 04 < p valor < 0, 05 (porque o valor 2,73 esta
entre os valores tabelados 2,571 e 4,032). Entao, rejeitamos a hipotese nula ao H1 : p2 p1 6= 0.
nvel de 5%. Em outras palavras, existe evidencia ao nvel de 5% de que a area
usando a estatstica
em estudo sofreu uma reducao em media nos nveis do contaminante durante o (p2 p1 ) 0
perodo de seis meses. T =
EP
e comparando este valor com a tabela da normal padronizada.
5.4 Comparando proporcoes 5.5 Problemas

1. Uma industria compra componentes eletronicos dos fornecedores A e B,
Em muitos estudos, investiga-se a existencia de igualdade nas proporcoes de ele-
mas o fornecedor A garante que o tempo medio de vida (em horas) do seu
mentos com uma caracteristica de interesse em duas populacoes diferentes.
produto supera o da marca B em 300 horas. Para testar esta afirmacao
Sejam p1 e p2 as verdadeiras proporcoes populacionais nos grupos 1 e 2. Es-
foram selecionadas duas amostras de 5 e 4 componentes, das marcas A e
tamos interessados na diferenca em proporcoes, p2 p1 . Estimativas pontuais
B respectivamente. As medias amostrais foram 1492 e 1182 e as variancias
de p1 e p2 sao dadas pelas respectivas proporcoes amostrais p1 e p2 e entao uma amostrais foram 770 e 3892.
estimativa pontual da diferenca em proporcoes e p2 p1 .
Formalmente temos duas amostras aleatorias independentes com distribuicao (a) Compare as variancias dos tempos de vida atraves de um intervalo de
de Bernoulli, i.e. confianca de 98%.
X11 , . . . , X1n1 Bernoulli(p1 )
(b) Construa um intervalo de confianca de 95% para a diferenca entre os
X21 , . . . , X2n2 Bernoulli(p2 ) tempos medios de vida.
conceitualmente elas sao diferentes. e do teorema central do limite e propriedades da distribuicao normal segue que
Exemplo 5.3 : A mudanca nos nveis de um contaminante numa certa area do p2 p1 N(p2 p1 , 2 )
incio ao final de seis meses de observacao foram (em /l):
sendo s
1, 5 0, 6 0, 3 0, 2 2, 0 1, 2 p1 (1 p1 ) p2 (1 p2 )
2 = + .
n1 n2
Aqui nao estamos interessados nos nveis de contaminacao mas sim em sua va- O erro padrao da diferenca amostral de proporcoes e estimado por
riacao. A media e o desvio padrao amostrais sao d = 0, 9 e s = 0, 81 respectiva-
s
mente. Entao o erro padrao e 0, 81/ 6 = 0, 33. Podemos agora realizar um teste p1 (1 p1 ) p2 (1 p2 )
t pareado para testar a hipotese nula de que a perda na concentracao media e 0. EP (p2 p1 ) = + .
n1 n2
Para isso calculamos
d 0 0, 9 e com isto podemos construir um intervalo de confianca da forma usual, ou seja
t=
EP(d) = 0, 33 = 2, 73.
Note que este valor e negativo (porque a mudanca media observada foi a reducao (p2 p1 ) z/2 EP (p2 p1 ).
na concentracao do poluente, um valor positivo seria um aumento na concentracao
do poluente). Observamos o valor absoluto da estatstica de teste (2,73) na tabela Podemos tambem testar as hipoteses
da distribuicao t, usando a linha com n 1 = 5 graus de liberdade. A quinta
H 0 : p2 p1 = 0
linha da tabela mostra que 0, 04 < p valor < 0, 05 (porque o valor 2,73 esta
entre os valores tabelados 2,571 e 4,032). Entao, rejeitamos a hipotese nula ao H1 : p2 p1 6= 0.
nvel de 5%. Em outras palavras, existe evidencia ao nvel de 5% de que a area
usando a estatstica
em estudo sofreu uma reducao em media nos nveis do contaminante durante o (p2 p1 ) 0
perodo de seis meses. T =
EP
e comparando este valor com a tabela da normal padronizada.
5.4 Comparando proporcoes 5.5 Problemas

1. Uma industria compra componentes eletronicos dos fornecedores A e B,
Em muitos estudos, investiga-se a existencia de igualdade nas proporcoes de ele-
mas o fornecedor A garante que o tempo medio de vida (em horas) do seu
mentos com uma caracteristica de interesse em duas populacoes diferentes.
produto supera o da marca B em 300 horas. Para testar esta afirmacao
Sejam p1 e p2 as verdadeiras proporcoes populacionais nos grupos 1 e 2. Es-
foram selecionadas duas amostras de 5 e 4 componentes, das marcas A e
tamos interessados na diferenca em proporcoes, p2 p1 . Estimativas pontuais
B respectivamente. As medias amostrais foram 1492 e 1182 e as variancias
de p1 e p2 sao dadas pelas respectivas proporcoes amostrais p1 e p2 e entao uma amostrais foram 770 e 3892.
estimativa pontual da diferenca em proporcoes e p2 p1 .
Formalmente temos duas amostras aleatorias independentes com distribuicao (a) Compare as variancias dos tempos de vida atraves de um intervalo de
de Bernoulli, i.e. confianca de 98%.
X11 , . . . , X1n1 Bernoulli(p1 )
(b) Construa um intervalo de confianca de 95% para a diferenca entre os
X21 , . . . , X2n2 Bernoulli(p2 ) tempos medios de vida.
(c) Este intervalo da alguma indicacao sobre a afirmacao do fornecedor indivduo

A? Explique. 1 2 3 4 5 6 7 8 9 10
agua 16 15 11 20 19 14 13 15 14 16
2. Uma industria compra componentes eletronicos dos fornecedores A e B, alcool 13 13 12 16 16 11 10 15 9 16
mas o fornecedor A garante que o tempo medio de vida (em horas) do
seu produto supera o da marca B em 300 horas. Para testar esta afirmacao
foram selecionadas duas amostras de componentes, uma de cada fornecedor, 5. Um estudo realizado para comparacao entre duas lagunas quanto a salini-
e obteve-se os seguintes tempos de vida: dade em Bimini, Bahamas, obteve as seguintes observacoes (em partes por
mil)
marca A 1500 1450 1480 1520 1510
marca B 1100 1200 1180 1250
laguna 1 37,01 36,71 37,03 37,32 37,01 37,03 37,70 37,36
Apos estabelecer claramente as suposicoes que precisam ser feitas, 36,75 37,45 38,85
laguna 2 39,04 39,21 39,05 38,24 38,53 38,71 38,89 38,66
(a) teste a hipotese de igualdade das variancias dos tempos de vida, ao
38,51 40,08
nvel de significancia 0,02;
(b) teste a afirmacao do fornecedor A, ao nvel de significancia 0,05.
O que voce conclui com base nestes dados?
3. Uma droga A foi administrada em um grupo de 8 pacientes selecionados
ao acaso. Apos um perodo fixo de tempo a concentracao da droga em 6. Deseja-se comparar os teores de Sr provenientes de amostras de carbonato
certas celulas de cada paciente foi medida (em unidades apropriadas). O obtidos a partir de dois metodos diferentes: I-fotometro de chama; II-analise
procedimento foi repetido em um outro grupo de 6 pacientes selecionados espectrografica.
ao acaso usando uma droga B. As concentracoes obtidas foram
Especimes Metodo I Metodo II
1 0,96 0,94
droga A 1,23 1,42 1,41 1,62 1,55 1,51 1,60 1,76
2 0,96 0,98
droga B 1,76 1,41 1,87 1,49 1,67 1,81
3 0,85 0,87
4 0,86 0,84
Apos estabelecer claramente as suposicoes que precisam ser feitas,
5 0,86 0,87
(a) teste a hipotese de que a concentracao media de droga A entre todos 6 0,89 0,93
os pacientes e pelo menos tao grande quanto da droga B;
(b) teste a hipotese de que as concentracoes medias das duas drogas sao
iguais. 7. As seguintes amostras aleatorias sao medidas da capacidade de producao
de calor (em milhoes de calorias por tonelada) de especimes de carvao de
4. Em um experimento sobre o efeito do alcool na habilidade perceptual, 10
duas minas:
indivduos sao testados duas vezes, uma depois de ter tomado dois drinks
e uma depois de ter tomado dois copos de agua. Os dois testes foram re- mina 1 8400 8230 8380 7860 7930
alizados em dois dias diferentes para evitar influencia do efeito do alcool. mina 2 7510 7690 7720 8070 7660
Metade dos indivduos tomou a bebida alcoolica primeiro e a outra metade
agua. Os escores dos 10 indivduos sao mostrados abaixo. Escores mais al-
tos refletem uma melhor performance. Deseja-se testar se a bebida alcoolica Use um teste de 0,05 de significancia para testar se a diferenca entre as
teve um efeito significativo ao nvel de significancia de 1%. capacidades medias de calor e significante.
(c) Este intervalo da alguma indicacao sobre a afirmacao do fornecedor indivduo

A? Explique. 1 2 3 4 5 6 7 8 9 10
agua 16 15 11 20 19 14 13 15 14 16
2. Uma industria compra componentes eletronicos dos fornecedores A e B, alcool 13 13 12 16 16 11 10 15 9 16
mas o fornecedor A garante que o tempo medio de vida (em horas) do
seu produto supera o da marca B em 300 horas. Para testar esta afirmacao
foram selecionadas duas amostras de componentes, uma de cada fornecedor, 5. Um estudo realizado para comparacao entre duas lagunas quanto a salini-
e obteve-se os seguintes tempos de vida: dade em Bimini, Bahamas, obteve as seguintes observacoes (em partes por
mil)
marca A 1500 1450 1480 1520 1510
marca B 1100 1200 1180 1250
laguna 1 37,01 36,71 37,03 37,32 37,01 37,03 37,70 37,36
Apos estabelecer claramente as suposicoes que precisam ser feitas, 36,75 37,45 38,85
laguna 2 39,04 39,21 39,05 38,24 38,53 38,71 38,89 38,66
(a) teste a hipotese de igualdade das variancias dos tempos de vida, ao
38,51 40,08
nvel de significancia 0,02;
(b) teste a afirmacao do fornecedor A, ao nvel de significancia 0,05.
O que voce conclui com base nestes dados?
3. Uma droga A foi administrada em um grupo de 8 pacientes selecionados
ao acaso. Apos um perodo fixo de tempo a concentracao da droga em 6. Deseja-se comparar os teores de Sr provenientes de amostras de carbonato
certas celulas de cada paciente foi medida (em unidades apropriadas). O obtidos a partir de dois metodos diferentes: I-fotometro de chama; II-analise
procedimento foi repetido em um outro grupo de 6 pacientes selecionados espectrografica.
ao acaso usando uma droga B. As concentracoes obtidas foram
Especimes Metodo I Metodo II
1 0,96 0,94
droga A 1,23 1,42 1,41 1,62 1,55 1,51 1,60 1,76
2 0,96 0,98
droga B 1,76 1,41 1,87 1,49 1,67 1,81
3 0,85 0,87
4 0,86 0,84
Apos estabelecer claramente as suposicoes que precisam ser feitas,
5 0,86 0,87
(a) teste a hipotese de que a concentracao media de droga A entre todos 6 0,89 0,93
os pacientes e pelo menos tao grande quanto da droga B;
(b) teste a hipotese de que as concentracoes medias das duas drogas sao
iguais. 7. As seguintes amostras aleatorias sao medidas da capacidade de producao
de calor (em milhoes de calorias por tonelada) de especimes de carvao de
4. Em um experimento sobre o efeito do alcool na habilidade perceptual, 10
duas minas:
indivduos sao testados duas vezes, uma depois de ter tomado dois drinks
e uma depois de ter tomado dois copos de agua. Os dois testes foram re- mina 1 8400 8230 8380 7860 7930
alizados em dois dias diferentes para evitar influencia do efeito do alcool. mina 2 7510 7690 7720 8070 7660
Metade dos indivduos tomou a bebida alcoolica primeiro e a outra metade
agua. Os escores dos 10 indivduos sao mostrados abaixo. Escores mais al-
tos refletem uma melhor performance. Deseja-se testar se a bebida alcoolica Use um teste de 0,05 de significancia para testar se a diferenca entre as
teve um efeito significativo ao nvel de significancia de 1%. capacidades medias de calor e significante.
98 CAPITULO 5. COMPARANDO GRUPOS
8. Um metodo de semeadura de nuvens foi bem sucedido em 57 dentre 150

tentativas, enquanto outro metodo foi eficaz em 33 dentre 100 tentativas.
Ao nvel de significancia de 5% podemos concluir que o primeiro metodo e
melhor do o segundo?
Captulo 6
Correlacao e Regressao
Em diversas investigacoes deseja-se avaliar a relacao entre duas medidas quanti-

tativas. Por exemplo, as alturas dos filhos estao relacionadas com as alturas dos
seus pais? O faturamento de uma empresa e afetado pelo numero de funcionarios?
A producao de uma maquina depende do nvel de treinamento do operador? Note
que nestes casos nao estamos mais interessados em amostras independentes como
na secao anterior.
Em geral os principais objetivos de tais investigacoes sao os seguintes.
Verificar se as variaveis estao associados, isto e se os valores de uma variavel

tendem a crescer (ou decrescer) a medida que os valores da outra variavel
crescem.
Predizer o valor de uma variavel a partir de um valor conhecido da outra.
Descrever a relacao entre as variaveis, isto e dado um aumento especfico

numa variavel, qual o crescimento medio esperado para a outra variavel?
Uma primeira aproximacao para o tipo de associacao entre duas variaveis e

atraves de funcoes lineares. O grau de associacao linear entre duas variaveis e
medido usando um parametro chamado coeficiente de correlacao. Ja para predizer
o valor de uma variavel contnua a partir de uma outra variavel e para descrever
a relacao entre duas variaveis utiliza-se metodos de regressao que serao estudados
no proximo captulo.
O primeiro estagio em qualquer um dos casos e fazer um grafico de pon-
tos dos dados para ter alguma ideia da forma e grau de associacao entre duas
variaveis (como na Figura 1.10). Na Figura 6.1 temos um outro exemplo deste
tipo de grafico. Mesmo com apenas 18 observacoes, parece existir algum tipo de
associacao entre estas variaveis.
99
98 CAPITULO 5. COMPARANDO GRUPOS
8. Um metodo de semeadura de nuvens foi bem sucedido em 57 dentre 150

tentativas, enquanto outro metodo foi eficaz em 33 dentre 100 tentativas.
Ao nvel de significancia de 5% podemos concluir que o primeiro metodo e
melhor do o segundo?
Captulo 6
Correlacao e Regressao
Em diversas investigacoes deseja-se avaliar a relacao entre duas medidas quanti-

tativas. Por exemplo, as alturas dos filhos estao relacionadas com as alturas dos
seus pais? O faturamento de uma empresa e afetado pelo numero de funcionarios?
A producao de uma maquina depende do nvel de treinamento do operador? Note
que nestes casos nao estamos mais interessados em amostras independentes como
na secao anterior.
Em geral os principais objetivos de tais investigacoes sao os seguintes.
Verificar se as variaveis estao associados, isto e se os valores de uma variavel

tendem a crescer (ou decrescer) a medida que os valores da outra variavel
crescem.
Predizer o valor de uma variavel a partir de um valor conhecido da outra.
Descrever a relacao entre as variaveis, isto e dado um aumento especfico

numa variavel, qual o crescimento medio esperado para a outra variavel?
Uma primeira aproximacao para o tipo de associacao entre duas variaveis e

atraves de funcoes lineares. O grau de associacao linear entre duas variaveis e
medido usando um parametro chamado coeficiente de correlacao. Ja para predizer
o valor de uma variavel contnua a partir de uma outra variavel e para descrever
a relacao entre duas variaveis utiliza-se metodos de regressao que serao estudados
no proximo captulo.
O primeiro estagio em qualquer um dos casos e fazer um grafico de pon-
tos dos dados para ter alguma ideia da forma e grau de associacao entre duas
variaveis (como na Figura 1.10). Na Figura 6.1 temos um outro exemplo deste
tipo de grafico. Mesmo com apenas 18 observacoes, parece existir algum tipo de
associacao entre estas variaveis.
99
100 CAPITULO 6. CORRELACAO E REGRESSAO 6.2. INTERPRETACAO DO COEFICIENTE DE CORRELACAO 101
Embora seja intuitiva esta medida e de difcil interpretacao pois esta definida
Figura 6.1: Exemplo de grafico de pontos entre duas variaveis contnuas.
na reta dos reais e depende das escalas dos dados. Por exemplo se multiplicar-
mos todos os valores de x por uma constante entao a covariancia tambem fica
multiplicada por esta constante.
Dividindo-se a covariancia amostral pelos desvios padrao amostrais obtemos
2.0
uma medida do grau de associacao linear entre duas variaveis que e adimensional
e de mais facil interpretacao. Esta nova medida chama-se coeficiente de correlacao
amostral e e definida como
sxy
r= .
1.5
sx sy
y
Pode-se mostrar que 1 r 1. Quanto mais proximo de -1 ou 1 estiver

o valor calculado de r maior e o grau de associacao linear (negativa ou positiva)
1.0
entre as variaveis e quanto mais proximo de zero menor e o grau de associacao.
Exemplo 6.1 : Foram observados n = 18 valores de duas variaveis x e y e

0.5
P
0.2 0.3 0.4 0.5 0.6 0.7 0.8 obteve-se x = 0, 48, y = 1, 58, sx = 0, 18, sy = 0, 54 e xi yi = 12, 44. A partir
x destes valores podemos calcular a covariancia amostral sxy = 0, 0712 e portanto
a correlacao amostral e r = 0, 732. Isto indica que possivelmente estas variaveis
estao negativamente correlacionadas (ao menos linearmente).
6.1 Definicoes
O coeficiante de correlacao populacional (que e um parametro desconhecido) e
Seja x1 , . . . , xn e y1 , . . . , yn os valores amostrais de duas variaveis X e Y . Sejam denotado pela letra grega e tambem esta definido no intervalo [-1,1]. Os valores
x, y, sx e sy as medias e desvios padrao amostrais dos dois conjuntos de dados. -1 e 1 representam correlacao linear perfeita (negativa ou positiva) enquanto o
A ideia aqui e tentar quantificar o grau de associacao linear entre X e Y a partir valor zero representa ausencia de correlacao linear. Podemos considerar r como
dos desvios em torno das medias amostrais, definindo-se para cada par (xi , yi) o sendo uma estimativa de , da mesma forma que x e uma estimativa da media
produto populacional . Na Figura 6.2 estao alguns exemplos de graficos de pontos com
ci = (xi x) (yi y). seus coeficientes de correlacao amostrais calculados.
Intuitivamente, se valores altos de x tendem a acompanhar valores altos de y, e
se valores baixos de x acompanham valores baixos de y entao ci tendera a ser
positivo em sua maioria (correlacao positiva). Se valores altos de x acompanham 6.2 Interpretacao do coeficiente de correlacao
valores baixos de y e vice-versa entao a maioria dos valores ci serao negativos
(correlacao negativa). Se nao existir associacao entre x e y entao se tomarmos O valor de r esta sempre entre -1 e 1, com r = 0 correspondendo a nao associacao.
a media aritmetica dos valores ci , valores positivos e negativos tenderao a se
negativos negativa
cancelar e a media sera proxima de zero. Valores de r indicam uma associacao
positivos positiva
A covariancia amostral de x e y e definida como
Pn Pn Usamos o termo correlacao positiva quando r > 0, e nesse caso a medida que
(xi x)(yi y) xi yi nxy
sxy = i=1 = i=1 . x cresce tambem cresce y, e correlacao negativa quando r < 0, e nesse caso a
n1 n1
medida que x cresce, y decresce (em media).
sendo essencialmente a media dos valores de ci acima. Quanto maior o valor de r (positivo ou negativo), mais forte a associacao. Nos
Embora seja intuitiva esta medida e de difcil interpretacao pois esta definida
Figura 6.1: Exemplo de grafico de pontos entre duas variaveis contnuas.
na reta dos reais e depende das escalas dos dados. Por exemplo se multiplicar-
mos todos os valores de x por uma constante entao a covariancia tambem fica
multiplicada por esta constante.
Dividindo-se a covariancia amostral pelos desvios padrao amostrais obtemos
2.0
uma medida do grau de associacao linear entre duas variaveis que e adimensional
e de mais facil interpretacao. Esta nova medida chama-se coeficiente de correlacao
amostral e e definida como
sxy
r= .
1.5
sx sy
y
Pode-se mostrar que 1 r 1. Quanto mais proximo de -1 ou 1 estiver

o valor calculado de r maior e o grau de associacao linear (negativa ou positiva)
1.0
entre as variaveis e quanto mais proximo de zero menor e o grau de associacao.
Exemplo 6.1 : Foram observados n = 18 valores de duas variaveis x e y e

0.5
P
0.2 0.3 0.4 0.5 0.6 0.7 0.8 obteve-se x = 0, 48, y = 1, 58, sx = 0, 18, sy = 0, 54 e xi yi = 12, 44. A partir
x destes valores podemos calcular a covariancia amostral sxy = 0, 0712 e portanto
a correlacao amostral e r = 0, 732. Isto indica que possivelmente estas variaveis
estao negativamente correlacionadas (ao menos linearmente).
6.1 Definicoes
O coeficiante de correlacao populacional (que e um parametro desconhecido) e
Seja x1 , . . . , xn e y1 , . . . , yn os valores amostrais de duas variaveis X e Y . Sejam denotado pela letra grega e tambem esta definido no intervalo [-1,1]. Os valores
x, y, sx e sy as medias e desvios padrao amostrais dos dois conjuntos de dados. -1 e 1 representam correlacao linear perfeita (negativa ou positiva) enquanto o
A ideia aqui e tentar quantificar o grau de associacao linear entre X e Y a partir valor zero representa ausencia de correlacao linear. Podemos considerar r como
dos desvios em torno das medias amostrais, definindo-se para cada par (xi , yi) o sendo uma estimativa de , da mesma forma que x e uma estimativa da media
produto populacional . Na Figura 6.2 estao alguns exemplos de graficos de pontos com
ci = (xi x) (yi y). seus coeficientes de correlacao amostrais calculados.
Intuitivamente, se valores altos de x tendem a acompanhar valores altos de y, e
se valores baixos de x acompanham valores baixos de y entao ci tendera a ser
positivo em sua maioria (correlacao positiva). Se valores altos de x acompanham 6.2 Interpretacao do coeficiente de correlacao
valores baixos de y e vice-versa entao a maioria dos valores ci serao negativos
(correlacao negativa). Se nao existir associacao entre x e y entao se tomarmos O valor de r esta sempre entre -1 e 1, com r = 0 correspondendo a nao associacao.
a media aritmetica dos valores ci , valores positivos e negativos tenderao a se
negativos negativa
cancelar e a media sera proxima de zero. Valores de r indicam uma associacao
positivos positiva
A covariancia amostral de x e y e definida como
Pn Pn Usamos o termo correlacao positiva quando r > 0, e nesse caso a medida que
(xi x)(yi y) xi yi nxy
sxy = i=1 = i=1 . x cresce tambem cresce y, e correlacao negativa quando r < 0, e nesse caso a
n1 n1
medida que x cresce, y decresce (em media).
sendo essencialmente a media dos valores de ci acima. Quanto maior o valor de r (positivo ou negativo), mais forte a associacao. Nos
E importante notar que as correlacoes nao dependem da escala de valores dos

Figura 6.2: Exemplos de correlacao entre variaveis.
dados. Por exemplo, obteramos o mesmo valor de r se medssemos altura e peso
0.99 0.75
em metros e quilogramas ou em pes e libras.
Se pudermos supor que as amostras sao provenientes de distribuicoes normais

entao testes de hipoteses e intervalos de confianca podem ser construidos para o
coeficiente de correlacao teorico . Neste caso a estatstica a ser utilizada e
r
T =r
1 r2
n2
que tem distribuicao t com n 2 graus de liberdade. Assim, um I.C. de
0.03 1 100(1 )% para apos as amostras serem observadas e dado por
s s
1 r2 1 r2
r t/2 < < r + t/2 .
n2 n2
As hipoteses de interesse sao em geral do tipo bilateral, ou seja
H0 : = 0
H1 : 6= 0.
Assim, apos observar as amostras calcula-se o valor de r e o p-valor do teste e

dado pela probabilidade
extremos, se r = 1 ou r = 1 entao todos os pontos no grafico de dispersao caem
exatamente numa linha reta. No outro extremo, se r = 0 nao existe nenhuma r
P |T | > r 1 r 2

associacao linear.
A seguinte quadro fornece um guia de como podemos descrever uma correlacao n2
em palavras dado o valor numerico. E claro que as interpretacoes dependem de onde T tn2 . Note que a nao rejeicao de H0 nos diz que nao ha evidencia
cada contexto em particular. amostral de haver correlacao linear entre as variaveis. Em outras palavras, a
correlacao entre as variaveis nao e significativa.
Valor de (+ ou ) Interpretacao
0,00 a 0,19 Uma correlacao bem fraca
0,20 a 0,39 Uma correlacao fraca Exemplo 6.2 : Na Figura 6.2 os dados foram simuladas de distribuicoes normais
0,40 a 0,69 Uma correlacao moderada e cada amostra tem 30 observacoes. As correlacoes amostrais r, estatistica t
0,70 a 0,89 Uma correlacao forte observadas, I.C. de 95% e os p-valores de testes de hipoteses bilaterais estao na
0,90 a 1,00 Uma correlacao muito forte Tabela 6.1.
E importante notar que as correlacoes nao dependem da escala de valores dos

Figura 6.2: Exemplos de correlacao entre variaveis.
dados. Por exemplo, obteramos o mesmo valor de r se medssemos altura e peso
0.99 0.75
em metros e quilogramas ou em pes e libras.
Se pudermos supor que as amostras sao provenientes de distribuicoes normais

entao testes de hipoteses e intervalos de confianca podem ser construidos para o
coeficiente de correlacao teorico . Neste caso a estatstica a ser utilizada e
r
T =r
1 r2
n2
que tem distribuicao t com n 2 graus de liberdade. Assim, um I.C. de
0.03 1 100(1 )% para apos as amostras serem observadas e dado por
s s
1 r2 1 r2
r t/2 < < r + t/2 .
n2 n2
As hipoteses de interesse sao em geral do tipo bilateral, ou seja
H0 : = 0
H1 : 6= 0.
Assim, apos observar as amostras calcula-se o valor de r e o p-valor do teste e

dado pela probabilidade
extremos, se r = 1 ou r = 1 entao todos os pontos no grafico de dispersao caem
exatamente numa linha reta. No outro extremo, se r = 0 nao existe nenhuma r
P |T | > r 1 r 2

associacao linear.
A seguinte quadro fornece um guia de como podemos descrever uma correlacao n2
em palavras dado o valor numerico. E claro que as interpretacoes dependem de onde T tn2 . Note que a nao rejeicao de H0 nos diz que nao ha evidencia
cada contexto em particular. amostral de haver correlacao linear entre as variaveis. Em outras palavras, a
correlacao entre as variaveis nao e significativa.
Valor de (+ ou ) Interpretacao
0,00 a 0,19 Uma correlacao bem fraca
0,20 a 0,39 Uma correlacao fraca Exemplo 6.2 : Na Figura 6.2 os dados foram simuladas de distribuicoes normais
0,40 a 0,69 Uma correlacao moderada e cada amostra tem 30 observacoes. As correlacoes amostrais r, estatistica t
0,70 a 0,89 Uma correlacao forte observadas, I.C. de 95% e os p-valores de testes de hipoteses bilaterais estao na
0,90 a 1,00 Uma correlacao muito forte Tabela 6.1.
Tabela 6.1: Correlacoes amostrais, estatisticas observadas, I.C. de 95% e p-valores

bilaterais.
5
r t g.l. IC 95% p-valor
0
0,9914 40,1368 28 0,9819 0,9960 < 0,001
3
0,7477 5,9590 28 0,5303 0,8729 < 0,001
5
0,0259 0,1372 28 -0,3375 0,3826 0,8918
y
r= 0.11
2
-0,9981 -84,8822 28 -0,9991 -0,9959 < 0,001
10
r= 0.21
15
0
20
Observacoes Discrepantes 2 1 0 1 2 2 1 0 1 2 3
x x
(a) (b)
A reta de regressao e estimada com base na soma de quadrados das distancias dos
pontos em relacao a reta. Por isso, observacoes discrepantes ou outliers podem Figura 6.3: Exemplos de associacao nao linear entre duas variaveis simuladas.
ter uma grande influencia na estimativa da inclinacao da reta e consequentemente
no coeficiente de correlacao amostral.
Correlacao nao significa causalidade
Um dos erros de interpretacao mais comuns e assumir que correlacoes signifi-
Linearidade e normalidade
cativas necessariamente implicam em uma relacao de causa e efeito entre duas
E bom enfatizar que somente relacoes lineares sao detectadas pelo coeficiente de variaveis. Esta interpretacao e incorreta. Na verdade e extremamente difcil es-
correlacao que acabamos de descrever (tambem chamado coeficiente de correlacao tabelecer relacoes causais a partir de dados observados. Seria preciso realizar
de Pearson). Ou seja, aceitar a hipotese de que = 0 nao necessariamente implica experimentos controlados para obter mais evidencias de um relacao causal.
que as variaveis nao estejam de alguma forma associadas. Tambem e preciso ter cuidado ao assumir que existe correlacao somente porque
duas variaveis seguem o mesmo padrao de variabilidade. A correlacao pode ser
Por exemplo, nos graficos da Figura 6.3, mesmo existindo uma clara relacao
devida a uma terceira variavel influenciando as duas primeiras.
(nao-linear) entre as variaveis x e y, o coeficiente de correlacao e estatisticamente
Finalmente, vale notar que correlacoes estatisticamente significativas (i.e.
zero (Verifique!).
quando se rejeita a hipotese de correlacao nula) nao necessariamente tem sig-
A mensagem aqui e que deve-se sempre fazer o grafico dos dados de modo que se nificado pratico. Por exemplo, que conclusoes poderia-se tirar de uma correlacao
possa tentar visualizar tais relacoes. significativa positiva entre nascimento de bebes e numero de cegonhas em deter-
minada regiao?
Resumindo, se encontramos uma associacao ou correlacao entre duas variaveis
Transformacoes X e Y podem existir diversas explicacoes do porque elas variam conjuntamente,
incluindo:
Em alguns casos pode ser apropriado e mesmo justificavel fazer transformacoes
em x e/ou y induzindo uma relacao linear na escala transformada. Por exemplo, Mudancas em X causam mudancas em Y .
na Figura 6.4 o grafico da esquerda mostra os gastos militares contra o produto
Mudancas em Y causam mudancas em X.
interno bruto em 75 pases. E difcil vizualizar uma relacao linear entre estas
variaveis especialmente para valores grandes. No grafico da direita foi tomado o Mudancas em outras variaveis causam mudancas tanto em X quanto em
logaritmo natural das variaveis e a relacao linear fica bem mais aparente. Y.
Tabela 6.1: Correlacoes amostrais, estatisticas observadas, I.C. de 95% e p-valores

bilaterais.
5
r t g.l. IC 95% p-valor
0
0,9914 40,1368 28 0,9819 0,9960 < 0,001
3
0,7477 5,9590 28 0,5303 0,8729 < 0,001
5
0,0259 0,1372 28 -0,3375 0,3826 0,8918
y
r= 0.11
2
-0,9981 -84,8822 28 -0,9991 -0,9959 < 0,001
10
r= 0.21
15
0
20
Observacoes Discrepantes 2 1 0 1 2 2 1 0 1 2 3
x x
(a) (b)
A reta de regressao e estimada com base na soma de quadrados das distancias dos
pontos em relacao a reta. Por isso, observacoes discrepantes ou outliers podem Figura 6.3: Exemplos de associacao nao linear entre duas variaveis simuladas.
ter uma grande influencia na estimativa da inclinacao da reta e consequentemente
no coeficiente de correlacao amostral.
Correlacao nao significa causalidade
Um dos erros de interpretacao mais comuns e assumir que correlacoes signifi-
Linearidade e normalidade
cativas necessariamente implicam em uma relacao de causa e efeito entre duas
E bom enfatizar que somente relacoes lineares sao detectadas pelo coeficiente de variaveis. Esta interpretacao e incorreta. Na verdade e extremamente difcil es-
correlacao que acabamos de descrever (tambem chamado coeficiente de correlacao tabelecer relacoes causais a partir de dados observados. Seria preciso realizar
de Pearson). Ou seja, aceitar a hipotese de que = 0 nao necessariamente implica experimentos controlados para obter mais evidencias de um relacao causal.
que as variaveis nao estejam de alguma forma associadas. Tambem e preciso ter cuidado ao assumir que existe correlacao somente porque
duas variaveis seguem o mesmo padrao de variabilidade. A correlacao pode ser
Por exemplo, nos graficos da Figura 6.3, mesmo existindo uma clara relacao
devida a uma terceira variavel influenciando as duas primeiras.
(nao-linear) entre as variaveis x e y, o coeficiente de correlacao e estatisticamente
Finalmente, vale notar que correlacoes estatisticamente significativas (i.e.
zero (Verifique!).
quando se rejeita a hipotese de correlacao nula) nao necessariamente tem sig-
A mensagem aqui e que deve-se sempre fazer o grafico dos dados de modo que se nificado pratico. Por exemplo, que conclusoes poderia-se tirar de uma correlacao
possa tentar visualizar tais relacoes. significativa positiva entre nascimento de bebes e numero de cegonhas em deter-
minada regiao?
Resumindo, se encontramos uma associacao ou correlacao entre duas variaveis
Transformacoes X e Y podem existir diversas explicacoes do porque elas variam conjuntamente,
incluindo:
Em alguns casos pode ser apropriado e mesmo justificavel fazer transformacoes
em x e/ou y induzindo uma relacao linear na escala transformada. Por exemplo, Mudancas em X causam mudancas em Y .
na Figura 6.4 o grafico da esquerda mostra os gastos militares contra o produto
Mudancas em Y causam mudancas em X.
interno bruto em 75 pases. E difcil vizualizar uma relacao linear entre estas
variaveis especialmente para valores grandes. No grafico da direita foi tomado o Mudancas em outras variaveis causam mudancas tanto em X quanto em
logaritmo natural das variaveis e a relacao linear fica bem mais aparente. Y.
106 CAPITULO 6. CORRELACAO E REGRESSAO 6.3. PROBLEMAS 107
ou 64%. Ou seja, cerca de 36% da variabilidade nos gastos militares nao pode ser
Figura 6.4: Gastos militares contra o produto interno bruto de 75 pases na escala
original (esquerda) e logaritmica (direita). descrita ou explicada pela variabilidade nos PIB e portanto fica claro que existem
outros fatores que poderiam ser importantes.
6.3 Problemas
1. Dados os valores x=(-2,-1,0,1,2) e y=(4,2,0,1,2) calcule o coeficiente de

8 correlacao amostral e teste a hipotese de correlacao nula. Faca um grafico
6000 de dispersao e comente os resultados.
Log Military expenditure

Military expenditure

2. Dados os valores x=(-2,-1,0,1,2) e y=(-8,-1,0,1,8) calcule o coeficiente de
6
4000 correlacao amostral. Teste a hipotese de nao haver correlacao linear. Qual

a sua conclusao notando que yi = x3i ?

2000 4 3. Verifique o que ocorre com a covariancia amostral se

(a) uma constante k for somada a todos os valores de x;

0
2
(b) todos os valores de x forem multiplicados por uma constante k;
0 50000 100000 150000 6 7 8 9 10 11 12
(c) idem para o coeficiente de correlacao amostral
Gross Domestic Product Log Gross Domestic Product 4. Comente os resultados da Tabela 6.1. Nesta tabela obtenha intervalos de
confianca de 98% para o coeficiente de correlacao linear populacional.
5. Os resultados abaixo foram obtidos em um pacote estatstico. Comente.

A relacao observada e somente uma coincidencia.
correlac~
ao de Pearson
A terceira explicacao e frequentemente a mais apropriada. Por exemplo, o numero
de pessoas usando oculos-de-sol e a quantidade de sorvete consumido num parti- t = -2,0134, gl = 28, p-valor = 0,05378
cular dia sao altamente correlacionados. Isto nao significa que usar oculos-de-sol
causa a compra de sorvetes ou vice-versa, mas sim que existe uma outra variavel, Hipotese alternativa: correlac~
ao verdadeira diferente de 0.
a temperatura, causando as duas primeiras.
Intervalo de confianca de 95%: [-0,6346; 0,0053]
estimativa amostral: -0,3556
Coeficiente de determinacao
O quadrado do coeficiente de correlacao de Pearson e chamado de coeficiente de
6. No item anterior suponha que o grafico das variaveis e similar ao da Figura
determinacao e costuma ser denotado por R2 . Esta e uma medida da proporcao
6.3. Qual a sua conclusao?
da variabilidade em uma variavel que e explicada pela variabilidade da outra. Na
pratica nao se espera encontrar uma correlacao perfeita (i.e. R2 = 1), porque 7. Um estudo geoqumico foi realizado utilizando amostras compostas de se-
existem muitos fatores que determinam as relacoes entre variaveis no mundo real. dimentos de corrente com granulometria de 100-150 mesh e profundidade
Por exemplo, na Figura 6.4 se o coeficiente de correlacao calculado para os de 40cm, provenientes de riachos correndo sobre granulitos e revelou os
logaritmos dos gastos militares e PIB dos pases for r = 0, 80, entao R2 = 0, 64 seguintes resultados em ppm:
ou 64%. Ou seja, cerca de 36% da variabilidade nos gastos militares nao pode ser
Figura 6.4: Gastos militares contra o produto interno bruto de 75 pases na escala
original (esquerda) e logaritmica (direita). descrita ou explicada pela variabilidade nos PIB e portanto fica claro que existem
outros fatores que poderiam ser importantes.
6.3 Problemas
1. Dados os valores x=(-2,-1,0,1,2) e y=(4,2,0,1,2) calcule o coeficiente de

8 correlacao amostral e teste a hipotese de correlacao nula. Faca um grafico
6000 de dispersao e comente os resultados.
Log Military expenditure

Military expenditure

2. Dados os valores x=(-2,-1,0,1,2) e y=(-8,-1,0,1,8) calcule o coeficiente de
6
4000 correlacao amostral. Teste a hipotese de nao haver correlacao linear. Qual

a sua conclusao notando que yi = x3i ?

2000 4 3. Verifique o que ocorre com a covariancia amostral se

(a) uma constante k for somada a todos os valores de x;

0
2
(b) todos os valores de x forem multiplicados por uma constante k;
0 50000 100000 150000 6 7 8 9 10 11 12
(c) idem para o coeficiente de correlacao amostral
Gross Domestic Product Log Gross Domestic Product 4. Comente os resultados da Tabela 6.1. Nesta tabela obtenha intervalos de
confianca de 98% para o coeficiente de correlacao linear populacional.
5. Os resultados abaixo foram obtidos em um pacote estatstico. Comente.

A relacao observada e somente uma coincidencia.
correlac~
ao de Pearson
A terceira explicacao e frequentemente a mais apropriada. Por exemplo, o numero
de pessoas usando oculos-de-sol e a quantidade de sorvete consumido num parti- t = -2,0134, gl = 28, p-valor = 0,05378
cular dia sao altamente correlacionados. Isto nao significa que usar oculos-de-sol
causa a compra de sorvetes ou vice-versa, mas sim que existe uma outra variavel, Hipotese alternativa: correlac~
ao verdadeira diferente de 0.
a temperatura, causando as duas primeiras.
Intervalo de confianca de 95%: [-0,6346; 0,0053]
estimativa amostral: -0,3556
Coeficiente de determinacao
O quadrado do coeficiente de correlacao de Pearson e chamado de coeficiente de
6. No item anterior suponha que o grafico das variaveis e similar ao da Figura
determinacao e costuma ser denotado por R2 . Esta e uma medida da proporcao
6.3. Qual a sua conclusao?
da variabilidade em uma variavel que e explicada pela variabilidade da outra. Na
pratica nao se espera encontrar uma correlacao perfeita (i.e. R2 = 1), porque 7. Um estudo geoqumico foi realizado utilizando amostras compostas de se-
existem muitos fatores que determinam as relacoes entre variaveis no mundo real. dimentos de corrente com granulometria de 100-150 mesh e profundidade
Por exemplo, na Figura 6.4 se o coeficiente de correlacao calculado para os de 40cm, provenientes de riachos correndo sobre granulitos e revelou os
logaritmos dos gastos militares e PIB dos pases for r = 0, 80, entao R2 = 0, 64 seguintes resultados em ppm:
108 CAPITULO 6. CORRELACAO E REGRESSAO 6.4. REGRESSAO 109
Ni Cr Ni Cr 6.4 Regressao
5.2 16,8 4,5 15,5
5.0 20,0 5,4 13,0 Em muitas situacoes o fenomeno a ser estudado envolve duas ou mais variaveis
6.8 14,2 8,8 12,5 e para responder a certas questoes cientficas precisamos estabelecer uma relacao
7.5 17,5 18,0 20,2 funcional entre elas. Um problema de regressao consiste em determinar a funcao
2.5 10,1 6,2 12,5 que descreve esta relacao. Aqui estudaremos somente o caso em que esta relacao
5.0 15,5 20,5 13,5 e descrita por uma funcao linear. Veremos primeiro o caso particular de duas
7.5 13,8 10,0 17,8 variaveis.
7.0 18,2 4,0 12,8 Por exemplo, se conhecemos a altura de um indivduo, mas nao o seu peso,
8.0 13,0 4,4 12,2 qual seria um bom chute para o peso deste indivduo? O coeficiente de correlacao
4.0 15,0 15,9 13,0 apenas indica a grau de associacao como um unico numero. Suponha que dis-
pomos de amostras de alturas x1 , . . . , xn e pesos y1 , . . . , yn de n indivduos. Por
enquanto vamos ignorar se eles sao do sexo masculino ou feminino. Se estamos
(a) Faca o grafico destes dados com Ni no eixo x. interessados em predizer o peso a partir da altura entao nao temos uma relacao
(b) Calcule o coeficiente de correlacao amostral para estes dados e verifique simetrica entre as duas variaveis. Chamamos peso de variavel resposta ou depen-
se o valor obtido parece consistente com seu grafico. dente, e altura de variavel explicativa, preditora, regressora ou independente.
Em um grafico de pontos os valores da variavel resposta (y) sao em geral
(c) Qual proporcao da variabilidade na concentracao de Cr pode ser ex- dispostos no eixo vertical, e da variavel explicativa (x) no eixo horizontal. Por
plicada pela concentracao de Ni? exemplo, na Figura 6.5 temos 30 observacoes de pesos e alturas de indivduos
selecionados aleatoriamente em uma populacao.
8. Em um estudo da influencia de processos praianos no condicionamento do
angulo de inclinacao do fundo oceanico situado logo apos a linha da mare
90
baixa a estirancio mediu-se a profundidade da lamina dagua (em pes). Os
dados coletados foram:
80
angulo de 0.68 0.85 0.66 0.50 1.86 2.33 2.17 1.83 1.68
pesos
inclinacao y 2.05 1.83 1.84 1.87 1.82 1.85 1.75 1.51 1.38
70
profundidade x 12.4 11.4 10.7 11.6 11.3 10.7 11.1 12.8 13.3
13.3 14.1 13.4 13.5 13.3 14.4 14.1 15.3 14.0
60
(a) Faca o grafico desses dados com profundidade da lamina dagua no 150 155 160 165
alturas
170 175 180
eixo x.
Figura 6.5: 30 observacoes de pesos e alturas de indivduos em uma populacao.
(b) Calcule o coeficiente de correlacao, r e interprete o resultado obtido.
(c) Qual proporcao da variabilidade em angulo de inclinacao pode ser Se a relacao entre as duas variaveis e aproximadamente linear, entao os dados
explicada por profundidade da lamina dagua? podem ser resumidos atraves do ajuste de uma reta passando pelos pontos. A
Ni Cr Ni Cr 6.4 Regressao
5.2 16,8 4,5 15,5
5.0 20,0 5,4 13,0 Em muitas situacoes o fenomeno a ser estudado envolve duas ou mais variaveis
6.8 14,2 8,8 12,5 e para responder a certas questoes cientficas precisamos estabelecer uma relacao
7.5 17,5 18,0 20,2 funcional entre elas. Um problema de regressao consiste em determinar a funcao
2.5 10,1 6,2 12,5 que descreve esta relacao. Aqui estudaremos somente o caso em que esta relacao
5.0 15,5 20,5 13,5 e descrita por uma funcao linear. Veremos primeiro o caso particular de duas
7.5 13,8 10,0 17,8 variaveis.
7.0 18,2 4,0 12,8 Por exemplo, se conhecemos a altura de um indivduo, mas nao o seu peso,
8.0 13,0 4,4 12,2 qual seria um bom chute para o peso deste indivduo? O coeficiente de correlacao
4.0 15,0 15,9 13,0 apenas indica a grau de associacao como um unico numero. Suponha que dis-
pomos de amostras de alturas x1 , . . . , xn e pesos y1 , . . . , yn de n indivduos. Por
enquanto vamos ignorar se eles sao do sexo masculino ou feminino. Se estamos
(a) Faca o grafico destes dados com Ni no eixo x. interessados em predizer o peso a partir da altura entao nao temos uma relacao
(b) Calcule o coeficiente de correlacao amostral para estes dados e verifique simetrica entre as duas variaveis. Chamamos peso de variavel resposta ou depen-
se o valor obtido parece consistente com seu grafico. dente, e altura de variavel explicativa, preditora, regressora ou independente.
Em um grafico de pontos os valores da variavel resposta (y) sao em geral
(c) Qual proporcao da variabilidade na concentracao de Cr pode ser ex- dispostos no eixo vertical, e da variavel explicativa (x) no eixo horizontal. Por
plicada pela concentracao de Ni? exemplo, na Figura 6.5 temos 30 observacoes de pesos e alturas de indivduos
selecionados aleatoriamente em uma populacao.
8. Em um estudo da influencia de processos praianos no condicionamento do
angulo de inclinacao do fundo oceanico situado logo apos a linha da mare
90
baixa a estirancio mediu-se a profundidade da lamina dagua (em pes). Os
dados coletados foram:
80
angulo de 0.68 0.85 0.66 0.50 1.86 2.33 2.17 1.83 1.68
pesos
inclinacao y 2.05 1.83 1.84 1.87 1.82 1.85 1.75 1.51 1.38
70
profundidade x 12.4 11.4 10.7 11.6 11.3 10.7 11.1 12.8 13.3
13.3 14.1 13.4 13.5 13.3 14.4 14.1 15.3 14.0
60
(a) Faca o grafico desses dados com profundidade da lamina dagua no 150 155 160 165
alturas
170 175 180
eixo x.
Figura 6.5: 30 observacoes de pesos e alturas de indivduos em uma populacao.
(b) Calcule o coeficiente de correlacao, r e interprete o resultado obtido.
(c) Qual proporcao da variabilidade em angulo de inclinacao pode ser Se a relacao entre as duas variaveis e aproximadamente linear, entao os dados
explicada por profundidade da lamina dagua? podem ser resumidos atraves do ajuste de uma reta passando pelos pontos. A
equacao dessa reta e dada por metodo de mnimos quadrados (MMQ) e as estimativas de e , denotadas por
e , sao entao as estimativas de mnimos quadrados1.
y = + x Igualando a zero a primeira derivada de S(, ) em relacao a e e resolvendo
para e nao e difcil verificar que a melhor reta segundo este criterio de
onde o intercepto e a inclinacao sao parametros desconhecidos. Existe uma
estimacao e aquela tal que
infinidade de possveis retas passando pelos pontos mas intuitivamente queremos
P P
aquela que forneca pequenas diferencas entre os pesos observados (yi ) e aqueles (yi y)(xi x) x y nxy sxy
= P = P i 2i = 2
dados pela reta para as alturas correspondentes. Estas diferencas (ou erros) sao (xi x)2 x nx2 sx
entao dadas por = y x. (6.1)
yi xi
As condicoes de segunda ordem tambem devem ser verificadas para garantir que
e estao representadas pelas linhas verticais na Figura 6.6 para 11 pontos.
este e um ponto de mnimo. Note que pode reescrito como
sy sxy sy
= =r
sy s2x sx
90
e assim o coeficiente de correlacao amostral pode ser obtido a partir da reta

estimada.
80
Exemplo 6.3 : Suponha que para o exemplo das alturas e pesos de indivduos
obtivemos = 51, 17 kg e = 0, 68 kg/cm. Entao a reta de regressao estimada
e dada por
70
y = 51, 17 + 0, 68x.
O valor estimado de (0,68) pode ser interpretado como o aumento medio (ou
aumento esperado) no peso quando a altura aumenta de 1cm. O valor estimado
60
de (-51,17) nao possui qualquer significado ja que neste caso nao faz sentido
incluir o ponto x = 0. Esta reta ajustada e uma estimativa da reta de regressao
150 155 160 165 170 175 180 populacional (desconhecida), y = + x.
O proximo passo e construir intervalos de confianca e testar hipoteses para

Figura 6.6: Diferencas entre valores de y e uma reta de regressao hipotetica. e , mas para fazer isto precisamos pensar mais cuidadosamente sobre nossas
suposicoes acerca da populacao.
Parece razoavel tentar minimizar alguma funcao destes erros. Em geral nao
importa se as diferencas sao positivas ou negativas e todas elas tem o mesmo grau
de importancia. Assim, uma funcao que pode ser minimizada e 6.4.1 Modelo de regressao linear simples
n
X n
X Este e o modelo mais simples para descrever a relacao entre uma variavel explica-
S(, ) = (yi yi )2 = (yi xi )2 tiva x e uma variavel resposta y. O modelo faz a seguintes suposicoes, em ordem
i=1 i=1
decrescente de importancia:
onde yi = + xi sao chamados valores ajustados. O metodo que minimiza 1
Outras funcoes dos erros podem ser consideradas, e.g. soma dos erros absolutos, erro
esta soma de quadrados dos erros para obter a melhor reta ajustada e chamado absoluto maximo, etc.
equacao dessa reta e dada por metodo de mnimos quadrados (MMQ) e as estimativas de e , denotadas por
e , sao entao as estimativas de mnimos quadrados1.
y = + x Igualando a zero a primeira derivada de S(, ) em relacao a e e resolvendo
para e nao e difcil verificar que a melhor reta segundo este criterio de
onde o intercepto e a inclinacao sao parametros desconhecidos. Existe uma
estimacao e aquela tal que
infinidade de possveis retas passando pelos pontos mas intuitivamente queremos
P P
aquela que forneca pequenas diferencas entre os pesos observados (yi ) e aqueles (yi y)(xi x) x y nxy sxy
= P = P i 2i = 2
dados pela reta para as alturas correspondentes. Estas diferencas (ou erros) sao (xi x)2 x nx2 sx
entao dadas por = y x. (6.1)
yi xi
As condicoes de segunda ordem tambem devem ser verificadas para garantir que
e estao representadas pelas linhas verticais na Figura 6.6 para 11 pontos.
este e um ponto de mnimo. Note que pode reescrito como
sy sxy sy
= =r
sy s2x sx
90
e assim o coeficiente de correlacao amostral pode ser obtido a partir da reta

estimada.
80
Exemplo 6.3 : Suponha que para o exemplo das alturas e pesos de indivduos
obtivemos = 51, 17 kg e = 0, 68 kg/cm. Entao a reta de regressao estimada
e dada por
70
y = 51, 17 + 0, 68x.
O valor estimado de (0,68) pode ser interpretado como o aumento medio (ou
aumento esperado) no peso quando a altura aumenta de 1cm. O valor estimado
60
de (-51,17) nao possui qualquer significado ja que neste caso nao faz sentido
incluir o ponto x = 0. Esta reta ajustada e uma estimativa da reta de regressao
150 155 160 165 170 175 180 populacional (desconhecida), y = + x.
O proximo passo e construir intervalos de confianca e testar hipoteses para

Figura 6.6: Diferencas entre valores de y e uma reta de regressao hipotetica. e , mas para fazer isto precisamos pensar mais cuidadosamente sobre nossas
suposicoes acerca da populacao.
Parece razoavel tentar minimizar alguma funcao destes erros. Em geral nao
importa se as diferencas sao positivas ou negativas e todas elas tem o mesmo grau
de importancia. Assim, uma funcao que pode ser minimizada e 6.4.1 Modelo de regressao linear simples
n
X n
X Este e o modelo mais simples para descrever a relacao entre uma variavel explica-
S(, ) = (yi yi )2 = (yi xi )2 tiva x e uma variavel resposta y. O modelo faz a seguintes suposicoes, em ordem
i=1 i=1
decrescente de importancia:
onde yi = + xi sao chamados valores ajustados. O metodo que minimiza 1
Outras funcoes dos erros podem ser consideradas, e.g. soma dos erros absolutos, erro
esta soma de quadrados dos erros para obter a melhor reta ajustada e chamado absoluto maximo, etc.
1. o valor medio da variavel resposta e uma funcao linear de x,
1.4

2. a variancia de y e constante, ou seja e a mesma para todos os valores de x,

1.2

1.5

3. a variacao aleatoria de y para qualquer valor fixo de x segue uma distri-
1.0

buicao normal, e estes termos de erro sao independentes.

0.8

1.0

sqrt(y)

0.6

Em termos algebricos, dada uma amostra de pontos (xi , yi ), i = 1, . . . , n o

modelo de regressao linear e dado por
0.4

0.5

0.2

yi = + xi + i (6.2)

0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
onde i representa desvios aleatorios (supostos independentes) da relacao linear x x
(a) (b)
entre y e x. Para satisfazer as tres suposicoes acima segue entao que
Figura 6.7: Diagramas de dispersao. (a) Dados que satisfazem as suposicoes do modelo
i Normal(0, 2 ) de regressao linear simples, (b) dados que nao satisfazem as suposicoes.
o que e equivalente a
yi|xi Normal( + xi , 2 ). ajustada y = + x sobre um diagrama de dispersao dos dados para checar se o
modelo e razoavel. Devemos procurar por evidencias de uma relacao nao-linear,
Os parametros e sao frequentemente chamados de coeficientes da regressao. ou desvios muito extremos da reta ajustada.
Em particular, e denominado coeficiente ou efeito de x sobre y ja que representa
Se julgamos que o modelo esta razoavel, podemos tambem estimar 2 , a
o aumento (ou reducao) esperado em y quando x aumenta de 1 unidade. O
variancia dos erros i. Em geral a formula utilizada e
parametro e a resposta media no ponto x = 0 e so tem interpretacao pratica
se o modelo inclui este ponto. 1 X
n
Na Figura 6.7, os dados representados no grafico da esquerda parecem satis- 2 = (yi xi )2

n 2 i=1
fazer as tres suposicoes, enquanto os dados representados no grafico da direita
nao satisfazem a nenhuma das suposicoes.
e substituindo as expressoes de e obtem-se que
2
6.4.2 Estimando os parametros do modelo n1 Sxy
2 = Sy2 2 (6.3)
n2 Sx
Aqui tambem os coefficientes da regressao (e agora 2 ) precisam ser estimados
para obter a equacao da reta ajustada. Um metodo de estimacao muito utilizado
em estatstica e chamado metodo de maxima verossimilhanca. No caso particular Exemplo 6.4 : Para os dados de alturas (x) e pesos (y) na Figura 6.5, sabendo-
em que assumimos distribuicao normal para os erros este metodo leva as mesmas se que as medias amostrais sao x = 164, 3 e y = 66, 7, as variancias amostrais sao
estimativas de mnimos quadrados, i.e. Sx2 = 91 e Sy2 = 81 e a covariancia amostral e Sxy = 52, 6 segue que as estimativas
dos coeficientes sao
= sxy /s2x e = y x.
= 52, 6/91 = 0, 58
Em aplicacoes praticas, nao existe garantia de que o modelo de regressao e
linear sera razoavel para nossos dados. Por isso devemos sempre sobrepor a reta = 66, 7 0, 58 164, 3 = 28, 6.
1. o valor medio da variavel resposta e uma funcao linear de x,
1.4

2. a variancia de y e constante, ou seja e a mesma para todos os valores de x,

1.2

1.5

3. a variacao aleatoria de y para qualquer valor fixo de x segue uma distri-
1.0

buicao normal, e estes termos de erro sao independentes.

0.8

1.0

sqrt(y)

0.6

Em termos algebricos, dada uma amostra de pontos (xi , yi ), i = 1, . . . , n o

modelo de regressao linear e dado por
0.4

0.5

0.2

yi = + xi + i (6.2)

0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
onde i representa desvios aleatorios (supostos independentes) da relacao linear x x
(a) (b)
entre y e x. Para satisfazer as tres suposicoes acima segue entao que
Figura 6.7: Diagramas de dispersao. (a) Dados que satisfazem as suposicoes do modelo
i Normal(0, 2 ) de regressao linear simples, (b) dados que nao satisfazem as suposicoes.
o que e equivalente a
yi|xi Normal( + xi , 2 ). ajustada y = + x sobre um diagrama de dispersao dos dados para checar se o
modelo e razoavel. Devemos procurar por evidencias de uma relacao nao-linear,
Os parametros e sao frequentemente chamados de coeficientes da regressao. ou desvios muito extremos da reta ajustada.
Em particular, e denominado coeficiente ou efeito de x sobre y ja que representa
Se julgamos que o modelo esta razoavel, podemos tambem estimar 2 , a
o aumento (ou reducao) esperado em y quando x aumenta de 1 unidade. O
variancia dos erros i. Em geral a formula utilizada e
parametro e a resposta media no ponto x = 0 e so tem interpretacao pratica
se o modelo inclui este ponto. 1 X
n
Na Figura 6.7, os dados representados no grafico da esquerda parecem satis- 2 = (yi xi )2

n 2 i=1
fazer as tres suposicoes, enquanto os dados representados no grafico da direita
nao satisfazem a nenhuma das suposicoes.
e substituindo as expressoes de e obtem-se que
2
6.4.2 Estimando os parametros do modelo n1 Sxy
2 = Sy2 2 (6.3)
n2 Sx
Aqui tambem os coefficientes da regressao (e agora 2 ) precisam ser estimados
para obter a equacao da reta ajustada. Um metodo de estimacao muito utilizado
em estatstica e chamado metodo de maxima verossimilhanca. No caso particular Exemplo 6.4 : Para os dados de alturas (x) e pesos (y) na Figura 6.5, sabendo-
em que assumimos distribuicao normal para os erros este metodo leva as mesmas se que as medias amostrais sao x = 164, 3 e y = 66, 7, as variancias amostrais sao
estimativas de mnimos quadrados, i.e. Sx2 = 91 e Sy2 = 81 e a covariancia amostral e Sxy = 52, 6 segue que as estimativas
dos coeficientes sao
= sxy /s2x e = y x.
= 52, 6/91 = 0, 58
Em aplicacoes praticas, nao existe garantia de que o modelo de regressao e
linear sera razoavel para nossos dados. Por isso devemos sempre sobrepor a reta = 66, 7 0, 58 164, 3 = 28, 6.
Podemos agora obter uma estimativa da variancia dos erros, Ambas tem distribuicao t de Student com n 2 graus de liberdade e as demons-
tracoes sao omitidas. Assim, podemos construir intervalos de confianca obtendo
29 52, 62 o valor de t na tabela apropriada
2 = 81 = 52, 4.
28 91
s P 2
Um grafico dos dados com a reta ajustada e dado na Figura 6.8 O ajuste da xi t
t P e pP .
n (xi x)2 (xi x)2
Geralmente estamos interessados em testar as hipoteses

90
H0 : = 0
H1 : 6= 0
80
ou seja, de que nao exista relacao entre x e y. Nesse caso, apos observar os dados
calcula-se o valor da estatstica de teste sob H0
peso
!
qX
2

t= (xi x)
70
e na tabela t de Student com n 2 graus de liberdade obtem-se o p-valor na

forma usual.
60
Exemplo 6.5 : Para os dados da Figura 6.5, para testar a hipotese nula de nao
existencia de relacao entre altura e peso calculamos
130 140 150 160 170 180 190
altura
qX p
(xi x)2 = (n 1)Sx2 = 29 91 = 51, 37
Figura 6.8: Dados de altura e peso com a reta de regressao ajustada. e a estatstica de teste fica
reta nao parece tao bom. Existem dois pontos bem distantes da reta ajustada, p
t = 51, 37 0, 58/ 52, 4 = 4, 12.
que parecem ter tido uma grande influencia no ajuste. Na pratica e aconselhavel
investigar a acuracia destes valores e/ou verificar quanto muda a reta ajustada Na tabela t com 28 graus de liberdade obtem-se que o p-valor e menor do que
quando estes pontos sao removidos. 0,1% e portanto ha evidencia forte contra a hipotese H0 : = 0.
6.4.3 Construindo intervalos e testando hipoteses

6.4.4 Transformacoes de dados
Usualmente e de interesse saber qual a precisao nas estimativas de e principal-
mente de . Para construir intervalos de confianca e testar hipoteses usaremos Uma forma de estender a aplicabilidade do modelo de regressao linear e aplicar
as seguintes estatsticas uma transformacao em x ou y, ou ambos, antes de ajustar o modelo. Se a relacao
s P ! entre duas variaveis e nao-linear (uma curva pareceria ajustar melhor do que uma
qX
n (xi x)2 2
reta), entao frequentemente a relacao pode ser feita linear transformando uma
P 2 e (xi x) .
xi ou ambas as variaveis.
Podemos agora obter uma estimativa da variancia dos erros, Ambas tem distribuicao t de Student com n 2 graus de liberdade e as demons-
tracoes sao omitidas. Assim, podemos construir intervalos de confianca obtendo
29 52, 62 o valor de t na tabela apropriada
2 = 81 = 52, 4.
28 91
s P 2
Um grafico dos dados com a reta ajustada e dado na Figura 6.8 O ajuste da xi t
t P e pP .
n (xi x)2 (xi x)2
Geralmente estamos interessados em testar as hipoteses

90
H0 : = 0
H1 : 6= 0
80
ou seja, de que nao exista relacao entre x e y. Nesse caso, apos observar os dados
calcula-se o valor da estatstica de teste sob H0
peso
!
qX
2

t= (xi x)
70
e na tabela t de Student com n 2 graus de liberdade obtem-se o p-valor na

forma usual.
60
Exemplo 6.5 : Para os dados da Figura 6.5, para testar a hipotese nula de nao
existencia de relacao entre altura e peso calculamos
130 140 150 160 170 180 190
altura
qX p
(xi x)2 = (n 1)Sx2 = 29 91 = 51, 37
Figura 6.8: Dados de altura e peso com a reta de regressao ajustada. e a estatstica de teste fica
reta nao parece tao bom. Existem dois pontos bem distantes da reta ajustada, p
t = 51, 37 0, 58/ 52, 4 = 4, 12.
que parecem ter tido uma grande influencia no ajuste. Na pratica e aconselhavel
investigar a acuracia destes valores e/ou verificar quanto muda a reta ajustada Na tabela t com 28 graus de liberdade obtem-se que o p-valor e menor do que
quando estes pontos sao removidos. 0,1% e portanto ha evidencia forte contra a hipotese H0 : = 0.
6.4.3 Construindo intervalos e testando hipoteses

6.4.4 Transformacoes de dados
Usualmente e de interesse saber qual a precisao nas estimativas de e principal-
mente de . Para construir intervalos de confianca e testar hipoteses usaremos Uma forma de estender a aplicabilidade do modelo de regressao linear e aplicar
as seguintes estatsticas uma transformacao em x ou y, ou ambos, antes de ajustar o modelo. Se a relacao
s P ! entre duas variaveis e nao-linear (uma curva pareceria ajustar melhor do que uma
qX
n (xi x)2 2
reta), entao frequentemente a relacao pode ser feita linear transformando uma
P 2 e (xi x) .
xi ou ambas as variaveis.
No entanto deve-se tomar um certo cuidado com transformacoes. Elas podem 4. Explique porque na Figura 6.7(b) os dados nao parecem satisfazer as su-
ser muito uteis em algumas situacoes, mas so devem ser consideradas como um posicoes do modelo de regressao linear (6.2).
ultimo recurso ja que quando uma ou ambas as variaveis sao transformadas, os
coeficientes deixam de ter interpretacoes diretas. 5. Comente os resultados na Figura 6.8.
Na pratica precisamos entao escolher uma transformacao que faca a relacao
6. Deseja-se verificar se uma determinada substancia encontrada em pastos
ser aproximadamente linear e que ainda permaneca interpretavel. Por exemplo,
pode ser usada para melhorar o ganho de peso em bovinos. Foram sele-
frequentemente as relacoes sao multiplicativas ao inves de aditivas e nestes casos
cionadas acaso 15 bois de mesma raca e idade e cada um recebeu uma
transformacoes logartmicas sao particularmente uteis.
concentracao X da substancia (em mg/l). Apos 30 dias foram medidos
os ganhos de peso Y (em Kg) para cada animal. Com os dados resultan-
P P 2
6.4.5 Representacao Matricial tes obteve-se: x = 2, 7, y = 16, 14,
P 2
xi yi = 785, 55, xi = 163, 39 e
yi = 4329, 43.
O modelo de regressao linear (6.2) pode ser representado em forma matricial.
Empilhando todas as observacoes e definindo (a) Estime a reta de regressao e interprete os valores dos coeficientes.
(b) Teste a hipotese de que esta substancia influencia no ganho de peso
y1 1 x1 1
dos animais.
y = ... X = ... ... = = ...

yn 1 xn n 7. Na analise de um certo combustvel obteve-se as observacoes abaixo das
variaveis poder calorfico (y) e percentual de cinzas (x)
podemos reescrever o modelo como y = X + . Esta representacao sera util
quando mais variaveis explicativas forem introduzidas.
y 13100 11200 10200 9600 8800
x 18,3 27,5 36,4 48,5 57,8
6.4.6 Problemas
1. No modelo de regressao linear simples (6.2), (a) Obtenha a reta de regressao estimada e interprete os coeficientes esti-
mados,
(a) mostre que as estimativas de mnimos quadrados sao aquelas dadas (b) estime o poder calorfico para 30% de cinzas,
pelas expressoes (6.1);
(c) esboce o diagrama de pontos com a reta ajustada.
(b) verifique o que ocorre com as estimativas se uma constante k for so-
mada a todos os valores de x; 8. Comente os resultados abaixo que foram obtidos ao estimar um modelo de
(c) verifique o que ocorre com as estimativas se todos os valores de x forem regressao linear em um pacote estatstico.
multiplicados por uma constante k;
Estimativas EP estatistica t P-valor
(d) derive a expressao (6.3) para estimativa de 2 .
Intercepto 3.7960 2.1616 1.756 0.09001
2. No modelo de regressao log(yi ) = + xi + i , i = 1, . . . , n, qual o efeito inclinac~
ao -0.7400 0.2417 -3.062 0.00482
esperado sobre y quando x aumenta de 1 unidade.
variancia dos erros: 11.33 com 28 graus de liberdade
3. Em um modelo de regressao linear as variaveis y e x sao medidas em Kg e
metros respectivamente. Se o modelo estimado foi y = 2, 3 + 8, 2 x qual 9. Os dados abaixo sao referentes ao consumo per capita de vinho (x) e a taxa
o aumento esperado em y se x aumentar em 1cm? de mortalidade por infarto (y) observada em 9 pases.
No entanto deve-se tomar um certo cuidado com transformacoes. Elas podem 4. Explique porque na Figura 6.7(b) os dados nao parecem satisfazer as su-
ser muito uteis em algumas situacoes, mas so devem ser consideradas como um posicoes do modelo de regressao linear (6.2).
ultimo recurso ja que quando uma ou ambas as variaveis sao transformadas, os
coeficientes deixam de ter interpretacoes diretas. 5. Comente os resultados na Figura 6.8.
Na pratica precisamos entao escolher uma transformacao que faca a relacao
6. Deseja-se verificar se uma determinada substancia encontrada em pastos
ser aproximadamente linear e que ainda permaneca interpretavel. Por exemplo,
pode ser usada para melhorar o ganho de peso em bovinos. Foram sele-
frequentemente as relacoes sao multiplicativas ao inves de aditivas e nestes casos
cionadas acaso 15 bois de mesma raca e idade e cada um recebeu uma
transformacoes logartmicas sao particularmente uteis.
concentracao X da substancia (em mg/l). Apos 30 dias foram medidos
os ganhos de peso Y (em Kg) para cada animal. Com os dados resultan-
P P 2
6.4.5 Representacao Matricial tes obteve-se: x = 2, 7, y = 16, 14,
P 2
xi yi = 785, 55, xi = 163, 39 e
yi = 4329, 43.
O modelo de regressao linear (6.2) pode ser representado em forma matricial.
Empilhando todas as observacoes e definindo (a) Estime a reta de regressao e interprete os valores dos coeficientes.
(b) Teste a hipotese de que esta substancia influencia no ganho de peso
y1 1 x1 1
dos animais.
y = ... X = ... ... = = ...

yn 1 xn n 7. Na analise de um certo combustvel obteve-se as observacoes abaixo das
variaveis poder calorfico (y) e percentual de cinzas (x)
podemos reescrever o modelo como y = X + . Esta representacao sera util
quando mais variaveis explicativas forem introduzidas.
y 13100 11200 10200 9600 8800
x 18,3 27,5 36,4 48,5 57,8
6.4.6 Problemas
1. No modelo de regressao linear simples (6.2), (a) Obtenha a reta de regressao estimada e interprete os coeficientes esti-
mados,
(a) mostre que as estimativas de mnimos quadrados sao aquelas dadas (b) estime o poder calorfico para 30% de cinzas,
pelas expressoes (6.1);
(c) esboce o diagrama de pontos com a reta ajustada.
(b) verifique o que ocorre com as estimativas se uma constante k for so-
mada a todos os valores de x; 8. Comente os resultados abaixo que foram obtidos ao estimar um modelo de
(c) verifique o que ocorre com as estimativas se todos os valores de x forem regressao linear em um pacote estatstico.
multiplicados por uma constante k;
Estimativas EP estatistica t P-valor
(d) derive a expressao (6.3) para estimativa de 2 .
Intercepto 3.7960 2.1616 1.756 0.09001
2. No modelo de regressao log(yi ) = + xi + i , i = 1, . . . , n, qual o efeito inclinac~
ao -0.7400 0.2417 -3.062 0.00482
esperado sobre y quando x aumenta de 1 unidade.
variancia dos erros: 11.33 com 28 graus de liberdade
3. Em um modelo de regressao linear as variaveis y e x sao medidas em Kg e
metros respectivamente. Se o modelo estimado foi y = 2, 3 + 8, 2 x qual 9. Os dados abaixo sao referentes ao consumo per capita de vinho (x) e a taxa
o aumento esperado em y se x aumentar em 1cm? de mortalidade por infarto (y) observada em 9 pases.
118 CAPITULO 6. CORRELACAO E REGRESSAO 6.5. REGRESSAO LINEAR MULTIPLA 119
x 2,8 3,2 3,3 5,1 5,9 6,0 7,9 10,2 10,8 um modelo de regressao linear multipla levara em conta todas estas correlacoes
y 11,2 14,0 12,6 8,2 7,0 4,2 2,6 1,8 3,2 simultaneamente.
P9 P9
Sabe-se que x = 6, 1, y = 7, 2, i=1 xi yi = 299, 5, i=1 x2i = 409 e Exemplo 6.7 : Um fabricante de borrachas (de apagar lapis) tem interesse em
P9 2
i=1 yi = 634. determinar a perda de abrasividade apos certo tempo de uso, porem esta variavel e
muito cara de ser medida diretamente. Uma sada e tentar medi-la indiretamente
(a) Calcule o coeficiente de correlacao amostral e comente.
a partir de outras variaveis e para isto foi coletada uma amostra de 30 borrachas
(b) Teste a hipotese de que nao existe correlacao linear. aonde foram medidas as variaveis Perda de abrasividade, Dureza e Resistencia a
(c) Obtenha a reta de regressao estimada e interprete os coeficientes esti- tensao.
mados.
(d) Estime a taxa de mortalidade se o consumo per capita for igual a 9. Figura 6.9: Investigando associacao entre as 4 variaveis do Exemplo 6.6.
(e) Teste a hipotese de que o consumo per capita de vinho nao influencia 10 5 0 5 10 10 5 0 5 10
40
a taxa de mortalidade por infarto.
20
(f) Como fica a reta de regressao se estes 9 pases duplicarem o consumo
y
0
per capita de vinho?
20
40
6.5 Regressao Linear Multipla
10
Dada uma variavel dependente y e k variaveis explicativas x1 , . . . , xk e n ob-
5
servacoes destas variaveis o modelo de regressao linear multipla e dado por x1
0
5
yi = + 1 xi1 + + k xik + i , i = 1, . . . , n. (6.4)
10
10
Em palavras,
y = combinacao linear dos X s + erro.
5
x2
0
Os erros i representam desvios (supostos independentes) da relacao linear
entre y e x1 , . . . , xk e assume-se que i N(0, 2 ). Equivalentemente,
5
10
yi |xi1 , . . . , xik N( + 1 xi1 + + k xik , 2 ).
10
5
Aqui cada coeficiente j representa o efeito de xj sobre y quando todas as outras
x3
0
variaveis sao mantidas constantes. Neste caso temos k + 2 parametros a serem
estimados.
5
10
Exemplo 6.6 : Em um problema de regressao com uma variavel resposta y e 40 20 0 20 40 10 5 0 5 10
3 variaveis explicativas x1 , x2 , x3 podemos investigar o grau de associacao entre

cada par de variaveis atraves de graficos de dispersao como na Figura 6.9. Parece
haver alguma associacao linear entre y e cada uma das variaveis explicativas, e Para usar a representacao matricial em regressao multipla, i.e. y = X +
x 2,8 3,2 3,3 5,1 5,9 6,0 7,9 10,2 10,8 um modelo de regressao linear multipla levara em conta todas estas correlacoes
y 11,2 14,0 12,6 8,2 7,0 4,2 2,6 1,8 3,2 simultaneamente.
P9 P9
Sabe-se que x = 6, 1, y = 7, 2, i=1 xi yi = 299, 5, i=1 x2i = 409 e Exemplo 6.7 : Um fabricante de borrachas (de apagar lapis) tem interesse em
P9 2
i=1 yi = 634. determinar a perda de abrasividade apos certo tempo de uso, porem esta variavel e
muito cara de ser medida diretamente. Uma sada e tentar medi-la indiretamente
(a) Calcule o coeficiente de correlacao amostral e comente.
a partir de outras variaveis e para isto foi coletada uma amostra de 30 borrachas
(b) Teste a hipotese de que nao existe correlacao linear. aonde foram medidas as variaveis Perda de abrasividade, Dureza e Resistencia a
(c) Obtenha a reta de regressao estimada e interprete os coeficientes esti- tensao.
mados.
(d) Estime a taxa de mortalidade se o consumo per capita for igual a 9. Figura 6.9: Investigando associacao entre as 4 variaveis do Exemplo 6.6.
(e) Teste a hipotese de que o consumo per capita de vinho nao influencia 10 5 0 5 10 10 5 0 5 10
40
a taxa de mortalidade por infarto.
20
(f) Como fica a reta de regressao se estes 9 pases duplicarem o consumo
y
0
per capita de vinho?
20
40
6.5 Regressao Linear Multipla
10
Dada uma variavel dependente y e k variaveis explicativas x1 , . . . , xk e n ob-
5
servacoes destas variaveis o modelo de regressao linear multipla e dado por x1
0
5
yi = + 1 xi1 + + k xik + i , i = 1, . . . , n. (6.4)
10
10
Em palavras,
y = combinacao linear dos X s + erro.
5
x2
0
Os erros i representam desvios (supostos independentes) da relacao linear
entre y e x1 , . . . , xk e assume-se que i N(0, 2 ). Equivalentemente,
5
10
yi |xi1 , . . . , xik N( + 1 xi1 + + k xik , 2 ).
10
5
Aqui cada coeficiente j representa o efeito de xj sobre y quando todas as outras
x3
0
variaveis sao mantidas constantes. Neste caso temos k + 2 parametros a serem
estimados.
5
10
Exemplo 6.6 : Em um problema de regressao com uma variavel resposta y e 40 20 0 20 40 10 5 0 5 10
3 variaveis explicativas x1 , x2 , x3 podemos investigar o grau de associacao entre

cada par de variaveis atraves de graficos de dispersao como na Figura 6.9. Parece
haver alguma associacao linear entre y e cada uma das variaveis explicativas, e Para usar a representacao matricial em regressao multipla, i.e. y = X +
sendo X a transposta da matrix X. Os valores ajustados da variavel resposta

Figura 6.10: Investigando associacao entre as 3 variaveis do Exemplo 6.7.
sao y = X e uma estimativa de 2 e dada por
50 60 70 80 90
n
1 X
350
2 = (yi 1 xi1 k xik )2 .
n k 1 i=1
300
250
Abrasividade Para construir intervalos de confianca e testar hipoteses sobre os coeficientes
200
usa-se novamente a distribuicao t. Neste caso pode-se mostrar que a estatstica
150
100
j j
p ,
50
hj
90
sendo que hj e o elemento j na diagonal da matriz (X X)1 , tem distribuicao t

80
com n k 1 graus de liberdade. Assim, um I.C. para j fica

70
Dureza p
j t 2 hj .
60
Em geral as hipoteses a serem testadas sao do tipo

50
240
H0 : j = 0
220
H1 : j 6= 0
200
ou seja queremos testar se xj nao explica significativamente a variabilidade em
180
Tensao
y.
160
Apos estimar o modelo gostariamos de ter uma ideia sobre qual proporcao da
140
variabilidade em y esta sendo explicada pelas outras variaveis. Esta variabilidade
120
50 100 150 200 250 300 350 120 140 160 180 200 220 240 pode ser particionada da seguinte forma,
n
X n
X n
X
(yi y)2 = (yi y)2 + (yi yi )2
definimos
i=1 i=1 i=1
| {z } | {z } | {z }
SQT SQReg SQR
y1 1 x11 x1k 1 1
y = ... X = ... ... .. = ... . sendo

. = .
..
yn 1 xn1 xnk n
k SQT: a soma de quadrados total (a variabilidade total em y).
O elemento xij da matriz X representa a i-esima observacao da variavel xj e SQReg: a soma de quadrados da regressao (a variabilidade em y induzida
queremos estimar os elementos do vetor . pelas variaveis regressoras).
Pode-se mostrar que as estimativas dos coeficientes da regressao sao dadas
por SQR: a soma de quadrados residual (a variabilidade em y nao induzida
= (X X)1 X y pelas variaveis regressoras).
sendo X a transposta da matrix X. Os valores ajustados da variavel resposta

Figura 6.10: Investigando associacao entre as 3 variaveis do Exemplo 6.7.
sao y = X e uma estimativa de 2 e dada por
50 60 70 80 90
n
1 X
350
2 = (yi 1 xi1 k xik )2 .
n k 1 i=1
300
250
Abrasividade Para construir intervalos de confianca e testar hipoteses sobre os coeficientes
200
usa-se novamente a distribuicao t. Neste caso pode-se mostrar que a estatstica
150
100
j j
p ,
50
hj
90
sendo que hj e o elemento j na diagonal da matriz (X X)1 , tem distribuicao t

80
com n k 1 graus de liberdade. Assim, um I.C. para j fica

70
Dureza p
j t 2 hj .
60
Em geral as hipoteses a serem testadas sao do tipo

50
240
H0 : j = 0
220
H1 : j 6= 0
200
ou seja queremos testar se xj nao explica significativamente a variabilidade em
180
Tensao
y.
160
Apos estimar o modelo gostariamos de ter uma ideia sobre qual proporcao da
140
variabilidade em y esta sendo explicada pelas outras variaveis. Esta variabilidade
120
50 100 150 200 250 300 350 120 140 160 180 200 220 240 pode ser particionada da seguinte forma,
n
X n
X n
X
(yi y)2 = (yi y)2 + (yi yi )2
definimos
i=1 i=1 i=1
| {z } | {z } | {z }
SQT SQReg SQR
y1 1 x11 x1k 1 1
y = ... X = ... ... .. = ... . sendo

. = .
..
yn 1 xn1 xnk n
k SQT: a soma de quadrados total (a variabilidade total em y).
O elemento xij da matriz X representa a i-esima observacao da variavel xj e SQReg: a soma de quadrados da regressao (a variabilidade em y induzida
queremos estimar os elementos do vetor . pelas variaveis regressoras).
Pode-se mostrar que as estimativas dos coeficientes da regressao sao dadas
por SQR: a soma de quadrados residual (a variabilidade em y nao induzida
= (X X)1 X y pelas variaveis regressoras).
O ajuste sera tanto melhor quanto mais proximo a SQReg estiver da SQT, ou Este teste pode ser formulado como
equivalentemente quanto menor for a SQR. Uma forma de medir isto e atraves
do chamado coeficiente de correlacao multipla denotado por R2 e definido como H0 : 1 = 2 = = k = 0
P H1 : ao menos um coeficiente e nao nulo.
SQReg SQR (yi y)2
R2 = =1 =P
SQT SQT (yi y)2 ou seja os coeficientes de todas as regressoras sao conjuntamente iguais a zero.
2 A estatstica de teste neste caso e
sendo que 0 R 1. Quanto mais proximo de 1 melhor e o ajuste do modelo.
SQReg/k
F = .
Exemplo 6.8 : Para um conjunto de 100 observacoes foi ajustando um modelo SQR/(n k + 1)
de regressao usando um pacote estatstico e obteve-se os resultados abaixo.
Quando H0 e verdadeira esta estatstica tem distribuicao F com k e n k + 1
graus de liberdade no numerador e denominador. Se H0 for falsa entao espera-se
Estimativa EP estatistica t p-valor
que SQReg > SQR e portanto valores grandes de F indicam evidencia contra H0 .
Intercepto 0.19 0.09 2.11 0.03746
Assim, o teste e do tipo unilateral.
x1 -1.51 0.51 -2.96 0.00387
Tambem nao e difcil verificar a relacao da estatstica F com o R2 ja que
x2 2.23 1.21 1.84 0.06842
x3 -1.25 1.01 -1.24 0.218 SQReg = R2 SQT e SQR = (1 R2 )SQT.
sigma: 0.9695 com 96 graus de liberdade
correlac~
ao multipla: 0.68 Portanto,
n k + 1 R2
F = .
Note que os coeficientes de x2 e x3 nao sao significativos ao nvel de 5% ja os k 1 R2
p-valores correspondentes sao maiores do que 0,05. Ou seja existe evidencia nos
dados de que 2 = 0 e 3 = 0. O coeficiente de correlacao multipla tambem e Exemplo 6.9 : No Exemplo 6.8 temos que n = 100, k = 3 e R2 = 0, 68. A
muito pequeno (0,68) indicando que em torno de 32% da variabilidade em y e estatstica F entao fica
explicada por outras variaveis que nao entraram no modelo. 100 3 + 1 0, 68
F = = 69, 41667
3 0, 32
Deve-se ter um certo cuidado na interpretacao do R2 uma vez que e sem-
pre possvel aumentar o seu valor acrescentando-se mais variaveis regressoras ao e comparando com o valor tabelado para o
modelo. Uma forma de corrigir isto e calcular o R2 ajustado,
(1 R2 )(n 1) Efeito de Interacao

R2 ajustado = 1 .
nk Considere o seguinte modelo de regressao linear com duas variaveis regressoras
Este valor nao necessariamente aumentara com a inclusao de mais regressoras ja
que isto aumentara o valor de k. y = 0 + 1 x1 + 2 x2 + 3 x1 x2 + .
Neste modelo, x1 x2 representa a interacao entre as variaveis independentes x1 e

O Teste F x2 . Se a interacao e significativa, i.e. rejeitamos a hipotese 3 = 0, entao, o efeito
de x1 na resposta media depende do nvel de x2 e, analogamente, o efeito de x2
Suponha agora que queremos testar a hipotese mais geral de que nao existe na resposta media depende do nvel de x1 .
qualquer relacao linear entre a variavel dependente e as regressoras no seu modelo. A interpretacao dos coeficientes da regressao agora fica
O ajuste sera tanto melhor quanto mais proximo a SQReg estiver da SQT, ou Este teste pode ser formulado como
equivalentemente quanto menor for a SQR. Uma forma de medir isto e atraves
do chamado coeficiente de correlacao multipla denotado por R2 e definido como H0 : 1 = 2 = = k = 0
P H1 : ao menos um coeficiente e nao nulo.
SQReg SQR (yi y)2
R2 = =1 =P
SQT SQT (yi y)2 ou seja os coeficientes de todas as regressoras sao conjuntamente iguais a zero.
2 A estatstica de teste neste caso e
sendo que 0 R 1. Quanto mais proximo de 1 melhor e o ajuste do modelo.
SQReg/k
F = .
Exemplo 6.8 : Para um conjunto de 100 observacoes foi ajustando um modelo SQR/(n k + 1)
de regressao usando um pacote estatstico e obteve-se os resultados abaixo.
Quando H0 e verdadeira esta estatstica tem distribuicao F com k e n k + 1
graus de liberdade no numerador e denominador. Se H0 for falsa entao espera-se
Estimativa EP estatistica t p-valor
que SQReg > SQR e portanto valores grandes de F indicam evidencia contra H0 .
Intercepto 0.19 0.09 2.11 0.03746
Assim, o teste e do tipo unilateral.
x1 -1.51 0.51 -2.96 0.00387
Tambem nao e difcil verificar a relacao da estatstica F com o R2 ja que
x2 2.23 1.21 1.84 0.06842
x3 -1.25 1.01 -1.24 0.218 SQReg = R2 SQT e SQR = (1 R2 )SQT.
sigma: 0.9695 com 96 graus de liberdade
correlac~
ao multipla: 0.68 Portanto,
n k + 1 R2
F = .
Note que os coeficientes de x2 e x3 nao sao significativos ao nvel de 5% ja os k 1 R2
p-valores correspondentes sao maiores do que 0,05. Ou seja existe evidencia nos
dados de que 2 = 0 e 3 = 0. O coeficiente de correlacao multipla tambem e Exemplo 6.9 : No Exemplo 6.8 temos que n = 100, k = 3 e R2 = 0, 68. A
muito pequeno (0,68) indicando que em torno de 32% da variabilidade em y e estatstica F entao fica
explicada por outras variaveis que nao entraram no modelo. 100 3 + 1 0, 68
F = = 69, 41667
3 0, 32
Deve-se ter um certo cuidado na interpretacao do R2 uma vez que e sem-
pre possvel aumentar o seu valor acrescentando-se mais variaveis regressoras ao e comparando com o valor tabelado para o
modelo. Uma forma de corrigir isto e calcular o R2 ajustado,
(1 R2 )(n 1) Efeito de Interacao

R2 ajustado = 1 .
nk Considere o seguinte modelo de regressao linear com duas variaveis regressoras
Este valor nao necessariamente aumentara com a inclusao de mais regressoras ja
que isto aumentara o valor de k. y = 0 + 1 x1 + 2 x2 + 3 x1 x2 + .
Neste modelo, x1 x2 representa a interacao entre as variaveis independentes x1 e

O Teste F x2 . Se a interacao e significativa, i.e. rejeitamos a hipotese 3 = 0, entao, o efeito
de x1 na resposta media depende do nvel de x2 e, analogamente, o efeito de x2
Suponha agora que queremos testar a hipotese mais geral de que nao existe na resposta media depende do nvel de x1 .
qualquer relacao linear entre a variavel dependente e as regressoras no seu modelo. A interpretacao dos coeficientes da regressao agora fica
Quando x2 e mantida constante, a cada mudanca de uma unidade em x1 , E.P. residual: 3.803 com 45 g.l.
a mudanca na resposta media sera 1 + 3 x2 . R-Quadrado: 0.3385
Estatistica F: 5.76 com 4 e 45 g.l., p-valor: 0.0007904
Quando x1 e mantida constante, a cada mudanca de uma unidade em x2 ,
a mudanca na resposta media sera 2 + 3 x1 . 5. Escreva em notacao matricial os seguintes modelos
(a) yi = 0 + 1 xi + 2 x2i + 3 x3i + i , i = 1, . . . , n.

6.6 Problemas
(b) yi = 0 + 1 xi1 + 2 xi2 + 3 xi1 xi2 + i , i = 1, . . . , n.
1. Comente os resultados na Figura 6.9. (c) yi = 0 + 1 xi1 + 2 log(xi2 ) + 3 xi1 senxi2 + i , i = 1, . . . , n.
2. Comente os resultados na Figura 6.10. (d) yij = i + ij , i = 1, 2 e j = 1, . . . , ni .
3. No Exemplo 6.7, foi estimado um modelo de regressao linear para a Abra- 6. No itens (b) e (c) do Exerccio 5 qual o efeito de um aumento de 1 unidade
sividade tendo Dureza e Resistencia a tensao como regressoras. Comente em x1 sobre a resposta media?
os resultados obtidos abaixo.
7. Explique intuitivamente por que a inclusao de variaveis regressoras no mo-
delo aumenta o valor de R2 .
Estimativa E.P. Estatistica t p-valor
Intercepto 885.1611 61.7516 14.334 3.84e-14 8. No modelo de regressao log(yi ) = + 1 xi1 + 2 xi2 + i , i = 1, . . . , n, qual
Dureza -6.5708 0.5832 -11.267 1.03e-11 o efeito esperado sobre y quando x1 aumenta de 2 unidades.
Tensao -1.3743 0.1943 -7.073 1.32e-07
E.P. residual: 36.49 com 27 g.l.

R-Quadrado 0.8402
Estatistica F: 71 com 2 e 27 g.l., p-valor: 1.767e-11
4. Em um conjunto de dados economicos para 50 pases temos os valores

medios para o perodo 1960-1970 das seguintes variaveis: Renda per ca-
pita (Renda), Taxa de crescimento da renda per capita (Taxa), Poupanca
agregada dividida pela renda disponvel (PoupR), percentual da populacao
abaixo dos 15 (Pop15) e acima dos 75 anos (Pop75). Interprete o resultado
abaixo de um modelo de regressao linear tendo a variavel PoupR como
resposta e as outras como regressoras.

Intercepto 28.566 7.35 3.884 0.000334
Pop15 -0.461 0.14 -3.189 0.002603
Pop75 -1.691 1.08 -1.561 0.125530
Renda -0.000 0.00 -0.362 0.719173
Taxa 0.409 0.19 2.088 0.042471
Quando x2 e mantida constante, a cada mudanca de uma unidade em x1 , E.P. residual: 3.803 com 45 g.l.
a mudanca na resposta media sera 1 + 3 x2 . R-Quadrado: 0.3385
Estatistica F: 5.76 com 4 e 45 g.l., p-valor: 0.0007904
Quando x1 e mantida constante, a cada mudanca de uma unidade em x2 ,
a mudanca na resposta media sera 2 + 3 x1 . 5. Escreva em notacao matricial os seguintes modelos
(a) yi = 0 + 1 xi + 2 x2i + 3 x3i + i , i = 1, . . . , n.

6.6 Problemas
(b) yi = 0 + 1 xi1 + 2 xi2 + 3 xi1 xi2 + i , i = 1, . . . , n.
1. Comente os resultados na Figura 6.9. (c) yi = 0 + 1 xi1 + 2 log(xi2 ) + 3 xi1 senxi2 + i , i = 1, . . . , n.
2. Comente os resultados na Figura 6.10. (d) yij = i + ij , i = 1, 2 e j = 1, . . . , ni .
3. No Exemplo 6.7, foi estimado um modelo de regressao linear para a Abra- 6. No itens (b) e (c) do Exerccio 5 qual o efeito de um aumento de 1 unidade
sividade tendo Dureza e Resistencia a tensao como regressoras. Comente em x1 sobre a resposta media?
os resultados obtidos abaixo.
7. Explique intuitivamente por que a inclusao de variaveis regressoras no mo-
delo aumenta o valor de R2 .
Intercepto 885.1611 61.7516 14.334 3.84e-14 8. No modelo de regressao log(yi ) = + 1 xi1 + 2 xi2 + i , i = 1, . . . , n, qual
Dureza -6.5708 0.5832 -11.267 1.03e-11 o efeito esperado sobre y quando x1 aumenta de 2 unidades.
Tensao -1.3743 0.1943 -7.073 1.32e-07
E.P. residual: 36.49 com 27 g.l.

R-Quadrado 0.8402
Estatistica F: 71 com 2 e 27 g.l., p-valor: 1.767e-11
4. Em um conjunto de dados economicos para 50 pases temos os valores

medios para o perodo 1960-1970 das seguintes variaveis: Renda per ca-
pita (Renda), Taxa de crescimento da renda per capita (Taxa), Poupanca
agregada dividida pela renda disponvel (PoupR), percentual da populacao
abaixo dos 15 (Pop15) e acima dos 75 anos (Pop75). Interprete o resultado
abaixo de um modelo de regressao linear tendo a variavel PoupR como
resposta e as outras como regressoras.

Intercepto 28.566 7.35 3.884 0.000334
Pop15 -0.461 0.14 -3.189 0.002603
Pop75 -1.691 1.08 -1.561 0.125530
Renda -0.000 0.00 -0.362 0.719173
Taxa 0.409 0.19 2.088 0.042471
Referencias Apendice A
Bolfarine, H. and W. O. Bussab (2005). Elementos de Amostragem. Edgard Tabelas Estatsticas

Blucher, Sao Paulo.
Cleveland, W. S. (1993). Visualizing Data. Summit, NJ: Hobart Press.
Cleveland, W. S. (1994). The Elements of Graphing Data (2nd ed.). Summit,
NJ: Hobart Press.
DeGroot, M. H. (1989). Probability and Statistics (2nd ed.). Addison Wesley.
Good, P. I. and J. W. Hardin (2003). Common Errors in Statistics (and how
to avoid them). Wiley: London.
Migon, H. S. and D. Gamerman (1999). Statistical Inference: An Integrated
Approach. Arnold.
Morettin, P. A. and T. C. M. (2004). Analise de Series Temporais. Edgard
Blucher, Sao Paulo.
R Development Core Team (2006). R: A language and environment for statis-
tical computing. Vienna, Austria: R Foundation for Statistical Computing.
ISBN 3-900051-07-0.
126 127
Referencias Apendice A
Bolfarine, H. and W. O. Bussab (2005). Elementos de Amostragem. Edgard Tabelas Estatsticas

Blucher, Sao Paulo.
Cleveland, W. S. (1993). Visualizing Data. Summit, NJ: Hobart Press.
Cleveland, W. S. (1994). The Elements of Graphing Data (2nd ed.). Summit,
NJ: Hobart Press.
DeGroot, M. H. (1989). Probability and Statistics (2nd ed.). Addison Wesley.
Good, P. I. and J. W. Hardin (2003). Common Errors in Statistics (and how
to avoid them). Wiley: London.
Migon, H. S. and D. Gamerman (1999). Statistical Inference: An Integrated
Approach. Arnold.
Morettin, P. A. and T. C. M. (2004). Analise de Series Temporais. Edgard
Blucher, Sao Paulo.
R Development Core Team (2006). R: A language and environment for statis-
tical computing. Vienna, Austria: R Foundation for Statistical Computing.
ISBN 3-900051-07-0.
126 127
137
Captulo 1
Secao 1.7
Apendice B P P
1. (a) Basta espandir o quadrado e usar ni=1 xi = nx, (b) use ni=1 (k + xi ) =
Pn Pn Pn
nk + i=1 xi , (c) use i=1 (kxi ) = k i=1 xi .
Solucoes de Exerccios 3. x = 1000, s2 = 400 reais2 , CV (X) 2% e Mediana(X) = 900.
Selecionados
Captulo 2
Secao 2.5
3. S = {(CC), (CR), (RC), (RR)} onde C=cara e R=coroa. Por exemplo
o evento A=pelo menos 2 caras e dado por A = {(CC)} que e equivalente
ao evento B=exatamente 2 caras.
5. A = {(3, 3), (4, 2), (2, 4), (1, 5), (5, 1)}
B = {(3, 1), . . . , (3, 6), (4, 1), . . . , (4, 6), (5, 1), . . . , (5, 6), (6, 1), . . . , (6, 6)}
A B = {(3, 3), (4, 2), (5, 1)}
P (A B) = 3/36
6.(a) 2/3 (b) 6/11
7. (a) 1 p q + pq (b) p + q pq
8. (a) p = 0, 3 (b) p = 0, 2 (a resposta correta e p = 0, 5)
9. 1/2
10. (a) 5/9 (b) 8/21
11. (a) A B (b) (A B) (A B) (c) A B (d) A B
14. (a) 0, 785 (b) 0, 847
15. (a) 0, 65 (b) 0, 0205 (c) 0, 24
17. (a) 1/3 (b) 1/5
Secao 2.8
4 P (acertar mais de 80% das questoes) 0,001
7. (a) Modelo binomial, assumindo que eles aumentam ou nao sua produtividade
de forma independente e que a probabilidade disto ocorrer e a mesma para
todos eles. (b) 0, 82 (c) 0, 003 (aproximacao de Poisson).
136
11. 0, 61
137
Captulo 1
Secao 1.7
Apendice B P P
1. (a) Basta espandir o quadrado e usar ni=1 xi = nx, (b) use ni=1 (k + xi ) =
Pn Pn Pn
nk + i=1 xi , (c) use i=1 (kxi ) = k i=1 xi .
Solucoes de Exerccios 3. x = 1000, s2 = 400 reais2 , CV (X) 2% e Mediana(X) = 900.
Selecionados
Captulo 2
Secao 2.5
3. S = {(CC), (CR), (RC), (RR)} onde C=cara e R=coroa. Por exemplo
o evento A=pelo menos 2 caras e dado por A = {(CC)} que e equivalente
ao evento B=exatamente 2 caras.
5. A = {(3, 3), (4, 2), (2, 4), (1, 5), (5, 1)}
B = {(3, 1), . . . , (3, 6), (4, 1), . . . , (4, 6), (5, 1), . . . , (5, 6), (6, 1), . . . , (6, 6)}
A B = {(3, 3), (4, 2), (5, 1)}
P (A B) = 3/36
6.(a) 2/3 (b) 6/11
7. (a) 1 p q + pq (b) p + q pq
8. (a) p = 0, 3 (b) p = 0, 2 (a resposta correta e p = 0, 5)
9. 1/2
10. (a) 5/9 (b) 8/21
11. (a) A B (b) (A B) (A B) (c) A B (d) A B
14. (a) 0, 785 (b) 0, 847
15. (a) 0, 65 (b) 0, 0205 (c) 0, 24
17. (a) 1/3 (b) 1/5
Secao 2.8
4 P (acertar mais de 80% das questoes) 0,001
7. (a) Modelo binomial, assumindo que eles aumentam ou nao sua produtividade
de forma independente e que a probabilidade disto ocorrer e a mesma para
todos eles. (b) 0, 82 (c) 0, 003 (aproximacao de Poisson).
136
11. 0, 61
138 APENDICE B. SOLUCOES DE EXERCICIOS SELECIONADOS 139
12. (a) 0,1359, (b) acima de 44 anos. 5 Defina X: tempo de execucao da tarefa, sendo que X N(, 2 ). (a) teste
H0 : = 100 H1 : < 100. (b) teste H0 : 2 = 225 H1 : 2 6= 225.
13. 0, 025
6 Rejeita-se com p-valor bilateral igual a 0,02652
14. O numero esperado de alunos com alturas superiores a 1,68 e 1000 x 0,6554
= 655 8 (a) teste unilateral, p-valor<0,01. (b) teste unilateral, 0,05<p-valor<0,10.
15. (a) m = 17, 4 (b) 0, 5753 h = 5, 3 = 2, 05
Secao 4.10
Captulo 3 1 n > 18, 642
Secao 3.5 Secao 4.12

4 E(X) = 3, 0, V ar(X) = 4, 5 e P (X > 3, 5) 0, 10 1 Para o modelo proposto Poisson 0,025 < P -valor < 0,04.
5 (a) 0.9332 (b) 0.0062 (c) 0.9270 (c) 0.0062 2 P-Valor > 0,90
7 0,9873 3 Estatstica de teste 11,487. Da Tabela A.3 com 3 g.l. 0,002< p-valor < 0,01
8 0,2146
10 0,0898 Captulo 5
Secao 3.8 Secao 5.5
1 [72,19; 73,61] 1 (a) IC de 98% para a razao de variancias [0,00689; 3,302]. (b) Assumindo
variancias iguais (do item (a)) IC de 95% para a diferenca entre os tempos
2 IC de 95% [1,27; 1,73] medios fica [237,16; 382,84].
6 [1,799; 0,4701] 4 H0 : D = 0 H1 : D > 0. Da Tab. A.2 com 9 g.l. obtemos que P (T >
2, 821) = 0, 01. Valor observado da estatstica foi 3,6 > 2,821 e rejeita-se
7 [0,3148; 0,4452]
H0 ao nvel de 1%, i.e. a bebida alcoolica teve um efeito significativo.
8 Teste unilateral. Nao podemos concluir que o 1o metodo e melhor ao nvel de

Captulo 4
5%.
Secao 4.8
2 p-valor=0,10, nao ha evidencia nos dados para rejeitar H0 , decisao: nao parar Captulo 6
a producao.
Secao 6.3
3 Nao ha evidencia ao nvel de 10% para rejeitar H0 : ndice de nicotina igual a
23mg. 1 r = 0, 5330018, p-valor=0,355. Aceita-se a hipotese de correlacao linear
nula, mas existe correlacao (nao linear) entre x e y.
4 H0 : proporcao p de TVs ligadas no programa =0,6, H1 :p < 0, 60. Estatstica
calculada -2,26, valor tabelado -1,65, entao ha evidencia para rejeitar H0 3 (a) Covariancia amostral nao se altera, (b) Covariancia amostral fica multipli-
ao nvel de 5%. cada por k, (c) Correlacao amostral nao se altera.
138 APENDICE B. SOLUCOES DE EXERCICIOS SELECIONADOS 139
12. (a) 0,1359, (b) acima de 44 anos. 5 Defina X: tempo de execucao da tarefa, sendo que X N(, 2 ). (a) teste
H0 : = 100 H1 : < 100. (b) teste H0 : 2 = 225 H1 : 2 6= 225.
13. 0, 025
6 Rejeita-se com p-valor bilateral igual a 0,02652
14. O numero esperado de alunos com alturas superiores a 1,68 e 1000 x 0,6554
= 655 8 (a) teste unilateral, p-valor<0,01. (b) teste unilateral, 0,05<p-valor<0,10.
15. (a) m = 17, 4 (b) 0, 5753 h = 5, 3 = 2, 05
Secao 4.10
Captulo 3 1 n > 18, 642
Secao 3.5 Secao 4.12

4 E(X) = 3, 0, V ar(X) = 4, 5 e P (X > 3, 5) 0, 10 1 Para o modelo proposto Poisson 0,025 < P -valor < 0,04.
5 (a) 0.9332 (b) 0.0062 (c) 0.9270 (c) 0.0062 2 P-Valor > 0,90
7 0,9873 3 Estatstica de teste 11,487. Da Tabela A.3 com 3 g.l. 0,002< p-valor < 0,01
8 0,2146
10 0,0898 Captulo 5
Secao 3.8 Secao 5.5
1 [72,19; 73,61] 1 (a) IC de 98% para a razao de variancias [0,00689; 3,302]. (b) Assumindo
variancias iguais (do item (a)) IC de 95% para a diferenca entre os tempos
2 IC de 95% [1,27; 1,73] medios fica [237,16; 382,84].
6 [1,799; 0,4701] 4 H0 : D = 0 H1 : D > 0. Da Tab. A.2 com 9 g.l. obtemos que P (T >
2, 821) = 0, 01. Valor observado da estatstica foi 3,6 > 2,821 e rejeita-se
7 [0,3148; 0,4452]
H0 ao nvel de 1%, i.e. a bebida alcoolica teve um efeito significativo.
8 Teste unilateral. Nao podemos concluir que o 1o metodo e melhor ao nvel de

Captulo 4
5%.
Secao 4.8
2 p-valor=0,10, nao ha evidencia nos dados para rejeitar H0 , decisao: nao parar Captulo 6
a producao.
Secao 6.3
3 Nao ha evidencia ao nvel de 10% para rejeitar H0 : ndice de nicotina igual a
23mg. 1 r = 0, 5330018, p-valor=0,355. Aceita-se a hipotese de correlacao linear
nula, mas existe correlacao (nao linear) entre x e y.
4 H0 : proporcao p de TVs ligadas no programa =0,6, H1 :p < 0, 60. Estatstica
calculada -2,26, valor tabelado -1,65, entao ha evidencia para rejeitar H0 3 (a) Covariancia amostral nao se altera, (b) Covariancia amostral fica multipli-
ao nvel de 5%. cada por k, (c) Correlacao amostral nao se altera.
140 APENDICE B. SOLUCOES DE EXERCICIOS SELECIONADOS
Secao 6.4.6
1 (b) = e = k . (c) = k1 e = .
2 exp()y.
6 (a) =7,587315 e =3,167661 (b) 2 =7,699549. Estatstica t observada

6,465299 e p-valor <0,001.Ha influencia significativa da substancia no ganho
de peso dos animais.
Secao 6.5
8 exp(21 )y.
Estatstica II - 1a lista de exerccios
1. Identifique cada uma das variaveis abaixo como quantitativa (discreta ou contnua)
ou qualitativa (nominal ou ordinal)
(a) A concentracao de impurezas em uma amostra de leite, em mg por litro.

(b) A procedencia de cada candidato ao vestibular de uma universidade em
um certo ano.
(c) O tempo de reacao de um indivduo apos ser submetido a um certo estmulo.
(d) O numero de moradores em cada residencia de uma cidade.
(e) A temperatura de uma regiao em determinada epoca do ano.
(f) A producao por hectare de certo tipo de grao.
2. Os dados abaixo referem-se a dureza (resistencia a pressao) em 30 pecas de

alumnio.
53.0 70.2 84.3 69.5 77.8 87.5

53.4 82.5 67.3 54.1 70.5 71.4
95.4 51.1 74.4 55.7 63.5 85.8
53.5 64.3 82.7 78.5 55.7 69.1
72.3 59.5 55.3 73.0 52.4 50.7
(a) Faca uma tabela de distribuica de frequencias.

(b) Faca uma representacao grafica para a distribuicao de frequencias.
(c) Calcule media, mediana e desvio padrao.
(d) Faca um histograma dos dados.
(e) Faca um grafico de ramo-e-folhas e um box-plot.
(f) Comente os resultados.
3. A tabela abaixo apresenta valores medidos da altura (em polegadas), peso (em
libras) e cintura (em polegadas) de 20 indivduos.
individuo 1 2 3 4 5
Altura 67.75 72.25 66.25 72.25 71.25
Peso 154.25 173.25 154 184.75 184.25
Cintura 94.5 98.7 99.2 101.2 101.9
individuo 6 7 8 9 10
Altura 74.75 69.75 72.5 74 73.5
Peso 210.25 181 176 191 198.25
Cintura 107.8 100.3 97.1 99.9 104.1
individuo 11 12 13 14 15
Altura 74.5 76 69.5 71.25 69.5
Peso 186.25 216 180.5 205.25 187.75
Cintura 98.2 107.7 103.9 108.6 100.1
individu 16 17 18 19 20
Altura 66 71 71 67.75 73.5
Peso 162.75 195.75 209.25 183.75 211.75
Cintura 99.2 105.2 107 102.4 109
(a) Utilize as ferramentas vistas no curso e faca uma analise descritiva de cada
uma destas variaveis individualmente. Comente os resultados. Utilize as
seguintes classes de frequencias para as variaveis Altura e Cintura,
Altura [66,68) [68,70) [70,72) [72,74) [74,76]
Cintura [94,96) [96,98) [98,100) [100,102)
[102,104) [104,106) [106,108) [108,110)
(b) Faca um diagrama de dispersao para cada um dos 3 pares de variaveis.
Comente os resultados.
1. Sabe-se que a probabilidade do aluno A tirar nota baixa em uma prova e 0,5 e
esta probabilidade e 0,2 para o aluno B. Sabe-se tambem que a probabilidade
de ambos tirarem nota baixa e 0,1. Calcule a probabilidade de que
(a) pelo menos um destes alunos tire nota baixa;

(b) nenhum deles tire nota baixa;
(c) exatamente um deles tire nota baixa.
2. Para 3 eventos quaisquer A1 , A2 e A3 ,
P (A1 A2 A3 ) = P (A1 ) + P (A2 ) + P (A3 )

P (A1 A2 ) P (A1 A3 ) P (A2 A3 )
+ P (A1 A2 A3 ).
Em um grupo de 200 alunos, 137 estao matriculados em calculo, 50 em es-

tatstica e 124 em fsica. Alem disso, 33 alunos estao matriculados em tanto
em calculo quanto em estatstica, 29 estao matriculados em fsica e estatstica,
e 92 em calculo e fsica. Finalmente, o numero de alunos matriculados nas 3
turmas e 92. Se um aluno for sorteado deste grupo qual a probabilidade de
estar matriculado em pelo menos uma destas disciplinas?
3. Em um experimento cinco pecas metalicas de diferentes comprimentos serao

submetidas a um teste de resistencia. Os comprimentos da pecas sao 1,2,3,4 e
5 polegadas e a probabilidade de que uma peca se rompa durante o teste e pro-
porcional ao seu comprimento. Calcule a probabilidade de que o comprimento
da peca que se rompe primeiro seja no maximo 3 polegadas.
4. Um canal de comunicacao transmite dois sinais 0 e 1. O sinal 1 e transmitido

40% das vezes e recebido corretamente 95% das vezes. O sinal 0 e recebido
corretamente 90% das vezes. Qual a probabilidade de:
(a) o sinal 1 ser recebido

(b) o sinal 1 ter sido transmitido dado que o sinal 1 e recebido.
5. Sabe-se que a proporcao de eleitores de um certo partido em Curitiba e 48%.

Ao sortear aleatoriamente um grupo de 10 eleitores calcule a probabilidade de
encontrar:
(a) exatamente 2 eleitores deste partido

(b) mais de 5 eleitores deste partido
(c) no maximo 3 eleitores deste partido
6. Sabe-se que o numero de clientes que entram em um banco no perodo das
12:00h as 13:00h segue distribuicao Poisson com parametro de intensidade igual
a 5 clientes por hora. Qual a probabilidade do banco receber, neste perodo,
um numero duas vezes maior do que a intensidade usual.
7. Um investigador esta interessado no numero de ovos depositados por uma

especie de passaro. Na primavera, ele procura e acha 80 ninhos. O numero
medio de ovos por ninho foi 3,8 e o desvio padrao foi 1,9. Porque a variancia
e aproximadamente igual a media, ele acha que pode ser razoavel descrever o
numero de ovos por ninho como tendo uma distribuicao Poisson com media 3,8.
(a) Faca o grafico dessa distribuicao como em suas notas de aula.

(b) Se esta realmente representa a distribuicao populacional, qual seria a pro-
babilidade de encontrar um ninho com mais do que 5 ovos?
(c) Qual seria a probabilidade de nao encontrar nenhum ovo num ninho?
8. O numero de partculas alfa emitidas por segundo em sedimentos radioativos

pode ser descrito por uma distribuicao Poisson com media 6.
(a) Se esta realmente representa a distribuicao populacional, qual seria a pro-

babilidade de pelo menos quatro partculas serem emitidas num segundo?
(b) Qual seria a probabilidade de nao haver nenhuma partcula emitida num
dado segundo?
9. Suponha que o volume em garrafas de uma certa marca de cerveja e normal-

mente distribuido com media 0,5 litro e desvio padrao 0,01 litro.
(a) Calcule a probabilidade de uma garrafa conter pelo menos 0,48 litro.
(b) Calcule o volume x tal que 95% das garrafas tenham menos de x litros.
10. Uma empresa contratada para fazer a descontaminacao do solo de uma area
afetada por um acidente ecologico e paga por cada metro cubico de material
excavado e tratado. A probabilidade de uma particular amostra exceder o nvel
de tolerancia e 0,46. Qual a probabilidade de que no maximo 7 num total de
10 amostras excedam o nvel de tolerancia?
11. Considere uma distribuicao normal com media 10 e desvio padrao 3.
(a) Desenhe um esboco desta distribuicao.

(b) Qual e a proporcao da area sob a curva entre 7 e 13?
12. O comprimento de uma peca de maquina tem distribuicao normal com media
11 cm e desvio-padrao 0.2 cm. Se as especificacoes exigem que o comprimento
esteja entre 10,6 e 11,2 cm centmetros, que proporcao de peca sera rejeitada
em media. Ou seja, qual a probabilidade de sortear aleatoriamente uma peca e
esta nao atender as especificacoes.
13. Usinas nucleares que utilizam agua para refrigeracao de seus condensadores
algumas vezes liberam agua quente em rios, lagos ou oceanos. Sabe-se que a
agua quente acima de certa temperatura tem um efeito indesejado sobre plantas
e animais que vivem nesses ambientes. Suponha que a alta temperatura liberada
por uma certa usina nuclear tem uma distribuicao Normal com media 5 C e um
desvio padrao de 0,5 C.
(a) Faca um esboco da distribuicao.

(b) Qual o percentual de dias nos quais o aumento da temperatura e maior do
que 5,5 C?
14. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma media de
72,9 batidas por minuto (bpm) e um desvio padrao de 11,0 bpm foram obtidos.
Um histograma dos dados mostra uma clara forma normal. De uma amplitude
de referencia de 95% para pulsos em repouso de pessoas sadias com base nesses
dados.
1. Os prazos de substituicao para CD players tem distribuicao normal com media

de 7,1 anos e desvio-padrao de 1,4 anos. Determine a probabilidade de 45 CD
players selecionados aleatoriamente terem prazo medio de substituicao superior
a 7,0 anos.
2. Uma analise dos numeros de horas por semana que os calouros universitarios
dedicam ao estudo acusam media de 7,06 horas e desvio-padrao de 5,32 ho-
ras. Selecionados aleatoriamente 55 calouros, determine a probabilidade de seu
tempo semanal medio de estudo exceder 7,00 horas.
3. As idades dos avioes comerciais dos EUA tem uma media de 13 anos e um desvio
padrao de 7,9 anos (com base em dados de Departamento de Aviacao Civil dos
EUA). Se Administracao Federal de Aviacao seleciona aleatoriamente 35 avioes
comerciais para um teste especial de resistencia, determine a probabilidade de
a idade media desse grupo de avioes ser superior a 15 anos.
4. Os dados abaixo sao uma amostra aleatoria da distribuicao Bernoulli(p), i.e.

sao valores observados da v.a. X = 1 se ocorre sucesso e X = 0 caso contrario
e P (sucesso)=p. Construa os intervalos de confianca de 90% e 99% para p.
0 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1
5. Uma populacao admite distribuicao normal com desvio padrao = 2. Calcule

o tamanho da amostra necessario para que possamos ter 95% de confianca de
que nao erraremos por mais de 0,5 unidades ao estimar a media populacional.
6. Uma populacao de 200 elementos admite a distribuicao normal de probabili-

dades com desvio padrao = 2 unidades. Calcule o tamanho da amostra
necessario para que possamos ter 95% de confianca de que nao erraremos mais
que 0,5 unidades ao estimar a media populacional.
7. A Basf garante que as gravacoes feitas com suas fitas de vdeo podem ser re-
produzidas 1000 vezes com variancia de 900 vezes. Tomada uma amostra de 20
fitas, calcule a probabilidade de obter um desvio padrao para as reproducoes
que seja,
(a) menor que 25

(b) maior que 13
(c) entre 20 e 40
(d) entre 15 e 30
8. Um pesquisador esta estudando a resistencia de um determinado material sob
certas condicoes. Ele sabe que essa variavel e normalmente distribuda com
desvio padrao de duas unidades.
(a) Utilizando os valores amostrais 4,9; 7,0; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2
unidades, determine o intervalo de confianca para a resistencia media com
um coeficiente de confianca 0,90.
(b) Repita o item anterior suponha que nao fosse conhecido o desvio padrao.
1. Escreva as definicoes de testes unilaterais e bilaterais, descreva os tipos de erro

que podem ocorrer, escreva as interpretacoes de p-valor.
2. Sejam as hipoteses H0 : p = 1/2 e H1 : p = 2/3 sendo p a probabilidade de

sucesso em um experimento de Bernoulli. O experimento e repetido 2 vezes e
aceita-se H0 se forem obtidos 2 sucessos. Calcule as probabilidades de erro tipo
I e II.
3. Sabe-se que uma caixa contem 3 bolas vermelhas e 5 pretas ou 5 vermelhas e

3 pretas. Um experimento consiste em retirar 3 bolas da caixa. Se menos do
que 3 bolas retiradas forem vermelhas a decisao sera que a caixa contem 3 bolas
vermelhas e 5 pretas. Calcule as probabilidades de erro (tipo I e tipo II).
4. Levantamentos amostrais indicam que uma certa doenca costuma atingir 10%
da populacao. Foi realizada uma campanha de vacinacao e apos alguns meses
foi selecionada uma amostra de 20 pessoas para verificar se esta proporcao se
reduziu.
(a) Construa um teste de hipoteses apropriado para fazer esta verificacao de

modo que P (Erro tipo I) < 0,025.
(b) Se foram observadas 2 pessoas doentes nesta amostra calcule o p-valor do
teste e tire suas conclusoes.

.Estat - Básica (Ehlers) 2006 Ufpr-1pag

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

.Estat - Básica (Ehlers) 2006 Ufpr-1pag

Caricato da

Copyright:

Formati disponibili

INTRODUCAO A ESTATISTICA

O objetivo principal deste texto e oferecer um material didatico basico em por-

Ehlers, R.S. (2005) Introducao a Estatstica. Departamento de Estatstica,

Primeira publicacao 2002

O objetivo principal deste texto e oferecer um material didatico basico em por-

Ehlers, R.S. (2005) Introducao a Estatstica. Departamento de Estatstica,

Primeira publicacao 2002

2.6.9 Variaveis Aleatorias Contnuas . . . . . . . . . . . . . . . . 43

2.6.9 Variaveis Aleatorias Contnuas . . . . . . . . . . . . . . . . 43

5.2 Comparacao de variancias . . . . . . . . . . . . . . . . . . . . . . 92

5.2 Comparacao de variancias . . . . . . . . . . . . . . . . . . . . . . 92

nominais, por exemplo sexo (masculino, feminino), classificacao de

As distincoes podem ser menos rgidas na pratica. Por exemplo, em geral

nominais, por exemplo sexo (masculino, feminino), classificacao de

As distincoes podem ser menos rgidas na pratica. Por exemplo, em geral

10,6 14,1 13,7 15,2 15,4 12,5 12,9 14,3

espacadas, caso contrario a figura ficara distorcida. Alem de ser um resumo

visual dos dados o grafico de ramo-e-folhas fornece mais informacao do que o

histograma ja que os dados podem ser lidos no grafico.

Exemplo 1.4 : Os valores abaixo correspondem ao tempo (em minutos) que os

alunos matriculados em uma disciplina do curso de Estatstica utilizaram para

100 120 140 160 180

10,6 14,1 13,7 15,2 15,4 12,5 12,9 14,3

espacadas, caso contrario a figura ficara distorcida. Alem de ser um resumo

visual dos dados o grafico de ramo-e-folhas fornece mais informacao do que o

histograma ja que os dados podem ser lidos no grafico.

Exemplo 1.4 : Os valores abaixo correspondem ao tempo (em minutos) que os

alunos matriculados em uma disciplina do curso de Estatstica utilizaram para

100 120 140 160 180

Figura 1.5: Grafico de ramo-e-folhas dos dados geoqumicos do Exemplo 1.3.

Figura 1.5: Grafico de ramo-e-folhas dos dados geoqumicos do Exemplo 1.3.

A presenca de outliers em um conjunto de dados pode ser perfeitamente nor-

ractersticas de diferentes conjuntos de dados (como sera visto na Secao 1.6.5).

A presenca de outliers em um conjunto de dados pode ser perfeitamente nor-

ractersticas de diferentes conjuntos de dados (como sera visto na Secao 1.6.5).

Na pratica pode haver situacoes aonde se pode distinguir claramente dois ou

Exemplo 1.11 : O conjunto de dados discretos 3, 5, 7, 7, 7, 8, 10, 10, 10, 15, 20

de alturas lado a lado para homens e mulheres, ou graficos ramo-e-folhas lado a

Exemplo 1.12 : Na Figura 1.8 sao apresentados os box-plots da renda familiar

Na pratica pode haver situacoes aonde se pode distinguir claramente dois ou

Exemplo 1.11 : O conjunto de dados discretos 3, 5, 7, 7, 7, 8, 10, 10, 10, 15, 20

de alturas lado a lado para homens e mulheres, ou graficos ramo-e-folhas lado a

Exemplo 1.12 : Na Figura 1.8 sao apresentados os box-plots da renda familiar

Tabela 1.5: Tempos de execucao de tarefas por operario.

Operario Tempo antes Tempo depois

0 50 100 150 0 50 100 150

e depois de uma alteracao.

Figura 1.11: Graficos com as series temporais de quatro indicadores de qualidade do

Tabela 1.5: Tempos de execucao de tarefas por operario.

Operario Tempo antes Tempo depois

0 50 100 150 0 50 100 150

e depois de uma alteracao.

Figura 1.11: Graficos com as series temporais de quatro indicadores de qualidade do

(a) Calcule as medias e desvios-padrao nas duas localidades.

10. O percentual de acucar e sal em 9 cereais matinais mais populares foram

Cereal acucar sal

(a) Calcule as medias e desvios-padrao nas duas localidades.

10. O percentual de acucar e sal em 9 cereais matinais mais populares foram

Cereal acucar sal

2. A intersecao entre eles (A B) ocorre se somente se ambos ocorrem simul-

3. Se A nao ocorre dizemos que ocorre o seu complementar, A.

4. Medicao do tempo de vida de um equipamento eletronico em horas. S = 1. 0 P (A) 1,

2. A intersecao entre eles (A B) ocorre se somente se ambos ocorrem simul-