Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RICARDO S. EHLERS
Prefacio
http://www.r-project.org/
Este texto certamente nao esta livre de erros, e comentarios e sugestoes dos
leitores sao bem vindos. Citar este texto como:
Ricardo S. Ehlers
Curitiba, novembro de 2005.
i
INTRODUCAO A ESTATISTICA
RICARDO S. EHLERS
Prefacio
http://www.r-project.org/
Este texto certamente nao esta livre de erros, e comentarios e sugestoes dos
leitores sao bem vindos. Citar este texto como:
Ricardo S. Ehlers
Curitiba, novembro de 2005.
i
SUMARIO iii
Sumario 3 Estimacao
3.1 Inferencia Estatstica . . . . . . . . . . . . . . . . . . . . . . . . .
56
56
3.2 Princpios de estimacao . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Obtendo uma amostra . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . 59
1 Estatstica Descritiva 1
3.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
3.6 Intervalos de Confianca . . . . . . . . . . . . . . . . . . . . . . . . 63
1.2 Tipos de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.1 Intervalos de confianca para a media . . . . . . . . . . . . 63
1.3 Variaveis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.2 Intervalos de confianca para uma proporcao . . . . . . . . 66
1.4 Variaveis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 4
3.6.3 Comparacao de intervalos de confianca . . . . . . . . . . . 67
1.5 Resumos numericos . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.6.4 Intervalo de Confianca para Variancia . . . . . . . . . . . . 68
1.5.1 Media, variancia e desvio padrao . . . . . . . . . . . . . . 9
3.7 Comentario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.2 A mediana e a amplitude inter-quartis . . . . . . . . . . . 11
3.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.3 A moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Dados multiplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Testes de Hipoteses 72
1.6.1 Diagramas de dispersao . . . . . . . . . . . . . . . . . . . 15 4.1 Introducao e notacao . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.6.2 Dados Pareados . . . . . . . . . . . . . . . . . . . . . . . . 17 4.1.1 Decisoes e poder . . . . . . . . . . . . . . . . . . . . . . . 74
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.3 Probabilidade de significancia (P -valor) . . . . . . . . . . . . . . . 76
2 Probabilidades 24 4.4 Procedimento geral de teste . . . . . . . . . . . . . . . . . . . . . 77
2.1 Experimento aleatorio . . . . . . . . . . . . . . . . . . . . . . . . 24 4.5 Teste para a media . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.2 Definicao de probabilidade . . . . . . . . . . . . . . . . . . . . . . 25 4.6 Teste para a proporcao . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3 Probabilidade Condicional e Independencia . . . . . . . . . . . . . 26 4.7 Testes para a variancia da distribuicao normal . . . . . . . . . . . 79
2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.9 Dimensionamento de amostras . . . . . . . . . . . . . . . . . . . . 82
2.6 Algumas distribuicoes de probabilidade . . . . . . . . . . . . . . . 33 4.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.6.1 A distribuicao Uniforme Discreta . . . . . . . . . . . . . . 34 4.11 Testes de Aderencia (Testes 2 ) . . . . . . . . . . . . . . . . . . . 85
2.6.2 A distribuicao Binomial . . . . . . . . . . . . . . . . . . . 34 4.12 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.6.3 A distribuicao de Poisson . . . . . . . . . . . . . . . . . . 36 4.13 Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.6.4 Distribuicao Geometrica . . . . . . . . . . . . . . . . . . . 38
2.6.5 Variaveis Aleatorias Discretas . . . . . . . . . . . . . . . . 38 5 Comparando Grupos 89
2.6.6 A Distribuicao Uniforme Contnua . . . . . . . . . . . . . 40 5.1 Diferenca entre medias de dois grupos . . . . . . . . . . . . . . . . 89
2.6.7 A Distribuicao Normal . . . . . . . . . . . . . . . . . . . . 40 5.1.1 Desvios padrao iguais . . . . . . . . . . . . . . . . . . . . . 90
2.6.8 Distribuicao Exponencial . . . . . . . . . . . . . . . . . . . 43 5.1.2 Desvios padrao diferentes . . . . . . . . . . . . . . . . . . 91
ii
SUMARIO iii
Sumario 3 Estimacao
3.1 Inferencia Estatstica . . . . . . . . . . . . . . . . . . . . . . . . .
56
56
3.2 Princpios de estimacao . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Obtendo uma amostra . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . . 59
1 Estatstica Descritiva 1
3.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
3.6 Intervalos de Confianca . . . . . . . . . . . . . . . . . . . . . . . . 63
1.2 Tipos de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.1 Intervalos de confianca para a media . . . . . . . . . . . . 63
1.3 Variaveis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.6.2 Intervalos de confianca para uma proporcao . . . . . . . . 66
1.4 Variaveis quantitativas . . . . . . . . . . . . . . . . . . . . . . . . 4
3.6.3 Comparacao de intervalos de confianca . . . . . . . . . . . 67
1.5 Resumos numericos . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.6.4 Intervalo de Confianca para Variancia . . . . . . . . . . . . 68
1.5.1 Media, variancia e desvio padrao . . . . . . . . . . . . . . 9
3.7 Comentario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.2 A mediana e a amplitude inter-quartis . . . . . . . . . . . 11
3.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.3 A moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6 Dados multiplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Testes de Hipoteses 72
1.6.1 Diagramas de dispersao . . . . . . . . . . . . . . . . . . . 15 4.1 Introducao e notacao . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.6.2 Dados Pareados . . . . . . . . . . . . . . . . . . . . . . . . 17 4.1.1 Decisoes e poder . . . . . . . . . . . . . . . . . . . . . . . 74
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.3 Probabilidade de significancia (P -valor) . . . . . . . . . . . . . . . 76
2 Probabilidades 24 4.4 Procedimento geral de teste . . . . . . . . . . . . . . . . . . . . . 77
2.1 Experimento aleatorio . . . . . . . . . . . . . . . . . . . . . . . . 24 4.5 Teste para a media . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.2 Definicao de probabilidade . . . . . . . . . . . . . . . . . . . . . . 25 4.6 Teste para a proporcao . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3 Probabilidade Condicional e Independencia . . . . . . . . . . . . . 26 4.7 Testes para a variancia da distribuicao normal . . . . . . . . . . . 79
2.4 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
2.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.9 Dimensionamento de amostras . . . . . . . . . . . . . . . . . . . . 82
2.6 Algumas distribuicoes de probabilidade . . . . . . . . . . . . . . . 33 4.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.6.1 A distribuicao Uniforme Discreta . . . . . . . . . . . . . . 34 4.11 Testes de Aderencia (Testes 2 ) . . . . . . . . . . . . . . . . . . . 85
2.6.2 A distribuicao Binomial . . . . . . . . . . . . . . . . . . . 34 4.12 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.6.3 A distribuicao de Poisson . . . . . . . . . . . . . . . . . . 36 4.13 Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.6.4 Distribuicao Geometrica . . . . . . . . . . . . . . . . . . . 38
2.6.5 Variaveis Aleatorias Discretas . . . . . . . . . . . . . . . . 38 5 Comparando Grupos 89
2.6.6 A Distribuicao Uniforme Contnua . . . . . . . . . . . . . 40 5.1 Diferenca entre medias de dois grupos . . . . . . . . . . . . . . . . 89
2.6.7 A Distribuicao Normal . . . . . . . . . . . . . . . . . . . . 40 5.1.1 Desvios padrao iguais . . . . . . . . . . . . . . . . . . . . . 90
2.6.8 Distribuicao Exponencial . . . . . . . . . . . . . . . . . . . 43 5.1.2 Desvios padrao diferentes . . . . . . . . . . . . . . . . . . 91
ii
iv SUMARIO
6 Correlacao e Regressao 99
6.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Captulo 1
6.2 Interpretacao do coeficiente de correlacao . . . . . . . . . . . . . . 101
6.3 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4 Regressao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.4.1 Modelo de regressao linear simples . . . . . . . . . . . . . 111
Estatstica Descritiva
6.4.2 Estimando os parametros do modelo . . . . . . . . . . . . 112
6.4.3 Construindo intervalos e testando hipoteses . . . . . . . . 114
6.4.4 Transformacoes de dados . . . . . . . . . . . . . . . . . . . 115
6.4.5 Representacao Matricial . . . . . . . . . . . . . . . . . . . 116 1.1 Introducao
6.4.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.5 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . 118
A Estatstica esta presente em todas as areas da ciencia que envolvam a coleta e
6.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
analise de dados e sua consequente transformacao em informacao, para postular,
References 126 refutar ou validar hipoteses cientficas sobre um fenomeno observavel. Sendo
assim, a Estatstica pode ser pensada como a ciencia de aprendizagem a partir
A Tabelas Estatsticas 127 de dados.
B Solucoes de Exerccios Selecionados 136 Em linhas gerais, o papel da Estatstica consiste em desenvolver metodos
de analise de dados que auxiliam o processo de tomada de decisao nos mais
variados problemas onde existe incerteza. Em funcao disto, fica evidente que os
metodos estatsticos podem ser empregados em praticamente todas as areas do
conhecimento, sempre que estiver envolvida a coleta ou analise de dados. Em
ciencia, sao realizados estudos experimentais ou observacionais que dao origem a
um conjunto de dados numericos. O proposito da investigacao e responder uma
questao cientfica, mas o padrao de variacao nos dados faz com que a resposta
nao seja obvia.
Em geral, a disciplina de Estatstica refere-se a metodos para coleta e descricao
de dados, e para quantificacao da evidencia nos dados pro ou contra uma questao
cientfica. A presenca de uma variacao nao previsvel (aleatoria) nos dados faz
disso uma tarefa pouco trivial. Neste captulo serao apresentadas tecnicas para
organizacao e descricao dos dados. No Captulo 2 serao estudados conceitos asso-
ciados a teoria das probabilidades, necessarios para desenvolver os metodos dos
captulos seguintes. A partir do Captulo 3 serao estudados metodos estatsticos
que auxiliam na tomada de decisoes com base nos dados.
1
iv SUMARIO
6 Correlacao e Regressao 99
6.1 Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Captulo 1
6.2 Interpretacao do coeficiente de correlacao . . . . . . . . . . . . . . 101
6.3 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4 Regressao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.4.1 Modelo de regressao linear simples . . . . . . . . . . . . . 111
Estatstica Descritiva
6.4.2 Estimando os parametros do modelo . . . . . . . . . . . . 112
6.4.3 Construindo intervalos e testando hipoteses . . . . . . . . 114
6.4.4 Transformacoes de dados . . . . . . . . . . . . . . . . . . . 115
6.4.5 Representacao Matricial . . . . . . . . . . . . . . . . . . . 116 1.1 Introducao
6.4.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.5 Regressao Linear Multipla . . . . . . . . . . . . . . . . . . . . . . 118
A Estatstica esta presente em todas as areas da ciencia que envolvam a coleta e
6.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
analise de dados e sua consequente transformacao em informacao, para postular,
References 126 refutar ou validar hipoteses cientficas sobre um fenomeno observavel. Sendo
assim, a Estatstica pode ser pensada como a ciencia de aprendizagem a partir
A Tabelas Estatsticas 127 de dados.
B Solucoes de Exerccios Selecionados 136 Em linhas gerais, o papel da Estatstica consiste em desenvolver metodos
de analise de dados que auxiliam o processo de tomada de decisao nos mais
variados problemas onde existe incerteza. Em funcao disto, fica evidente que os
metodos estatsticos podem ser empregados em praticamente todas as areas do
conhecimento, sempre que estiver envolvida a coleta ou analise de dados. Em
ciencia, sao realizados estudos experimentais ou observacionais que dao origem a
um conjunto de dados numericos. O proposito da investigacao e responder uma
questao cientfica, mas o padrao de variacao nos dados faz com que a resposta
nao seja obvia.
Em geral, a disciplina de Estatstica refere-se a metodos para coleta e descricao
de dados, e para quantificacao da evidencia nos dados pro ou contra uma questao
cientfica. A presenca de uma variacao nao previsvel (aleatoria) nos dados faz
disso uma tarefa pouco trivial. Neste captulo serao apresentadas tecnicas para
organizacao e descricao dos dados. No Captulo 2 serao estudados conceitos asso-
ciados a teoria das probabilidades, necessarios para desenvolver os metodos dos
captulos seguintes. A partir do Captulo 3 serao estudados metodos estatsticos
que auxiliam na tomada de decisoes com base nos dados.
1
2 CAPITULO 1. ESTATISTICA DESCRITIVA 1.3. VARIAVEIS QUALITATIVAS 3
1.2 Tipos de Variaveis Tabela 1.1: Frequencias observadas para os dados de itens defeituosos.
Ao inves de tentar interpretar listas de numeros e mais informativo produzir Estado ni ni /n pi Porcentagem
um resumo numerico e usar metodos graficos para descrever as caractersticas Defeituoso 6 6/25 0,24 24,0%
principais dos dados. O metodo mais apropriado dependera da natureza dos Perfeito 12 12/25 0,48 48,0%
dados, e podemos distinguir dois tipos principais apresentados abaixo. Recuperavel 5 5/25 0,20 20,0%
Outros 2 2/25 0,08 8,0%
Variaveis qualitativas ou categoricas que podem ser: Totais n = 25 pi = 1
12
em criancas, adultos jovens, adultos e idosos, entao temos faixa etaria
10
como uma variavel ordenada categorica. No entanto, em geral e recomendado
manter os dados em sua forma original e criar categorias somente para propositos
8
de apresentacao.
frequencias
6
1.3 Variaveis qualitativas
4
Para resumir dados qualitativos numericamente, utiliza-se contagens, proporcoes,
2
porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala
apropriada. Por exemplo, se encontrarmos que 7 de uma amostra de 5000 pes-
0
soas sao portadoras de uma doenca rara poderamos expressar isto como uma defeituoso perfeito recuperavel outros
proporcao observada (0,0014) ou percentual (0,14%), mas melhor seria 1,4 casos
por mil.
Frequentemente o primeiro passo da descricao de dados e criar uma tabela de ser alterada no eixo horizontal ja que nao existe ordenacao natural. Alem disso
frequencias. Por exemplo, na Tabela 1.1 abaixo temos as frequencias observadas a distancia horizontal entre as barras nao tem nenhuma interpretacao.
2 CAPITULO 1. ESTATISTICA DESCRITIVA 1.3. VARIAVEIS QUALITATIVAS 3
1.2 Tipos de Variaveis Tabela 1.1: Frequencias observadas para os dados de itens defeituosos.
Ao inves de tentar interpretar listas de numeros e mais informativo produzir Estado ni ni /n pi Porcentagem
um resumo numerico e usar metodos graficos para descrever as caractersticas Defeituoso 6 6/25 0,24 24,0%
principais dos dados. O metodo mais apropriado dependera da natureza dos Perfeito 12 12/25 0,48 48,0%
dados, e podemos distinguir dois tipos principais apresentados abaixo. Recuperavel 5 5/25 0,20 20,0%
Outros 2 2/25 0,08 8,0%
Variaveis qualitativas ou categoricas que podem ser: Totais n = 25 pi = 1
12
em criancas, adultos jovens, adultos e idosos, entao temos faixa etaria
10
como uma variavel ordenada categorica. No entanto, em geral e recomendado
manter os dados em sua forma original e criar categorias somente para propositos
8
de apresentacao.
frequencias
6
1.3 Variaveis qualitativas
4
Para resumir dados qualitativos numericamente, utiliza-se contagens, proporcoes,
2
porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala
apropriada. Por exemplo, se encontrarmos que 7 de uma amostra de 5000 pes-
0
soas sao portadoras de uma doenca rara poderamos expressar isto como uma defeituoso perfeito recuperavel outros
proporcao observada (0,0014) ou percentual (0,14%), mas melhor seria 1,4 casos
por mil.
Frequentemente o primeiro passo da descricao de dados e criar uma tabela de ser alterada no eixo horizontal ja que nao existe ordenacao natural. Alem disso
frequencias. Por exemplo, na Tabela 1.1 abaixo temos as frequencias observadas a distancia horizontal entre as barras nao tem nenhuma interpretacao.
4 CAPITULO 1. ESTATISTICA DESCRITIVA 1.4. VARIAVEIS QUANTITATIVAS 5
Graficos de setores tambem costumam ser utilizados para apresentacao de Tabela 1.2. Note que foram incluidas as frequencias acumuladas Ni e Fi , assim
dados categoricos. Os setores do grafico sao desenhados de tal forma que eles
tenham area proporcional a frequencia. A Figura 1.2 abaixo ilustra as frequencias Tabela 1.2: Frequencias observadas do numero de itens defeituosos em 35 lotes.
observadas na Tabela 1.1.
defeituosos 0 1 2 3 4 5 6 8
Figura 1.2: Grafico de setores com as frequencias observadas na Tabela 1.1 ni 1 3 5 4 9 5 6 2
pi 0,03 0,09 0,14 0,11 0,26 0,14 0,17 0,06
Ni 1 4 9 13 22 27 33 35
Fi 0,03 0,11 0,26 0,37 0,63 0,77 0,94 1,00
por exemplo podemos dizer que aproximadamente 77% dos lotes inspecionados
defeituoso tem 5 itens defeituosos ou menos. Neste caso, frequencias absolutas e frequencias
acumuladas podem ser representadas graficamente como na Figura 1.3 abaixo.
perfeito
1.0
outros
8
0.8
6
recuperavel
Freq. acumuladas
0.6
frequncias
4
0.4
2
0.2
0.0
0
0 2 4 6 8 0 1 2 3 4 5 6 8
defeituosos defeituosos
No entanto, graficos de setores constituem uma forma muito ruim de apre- (a) (b)
sentar informacao ja que em geral temos dificuldade em comparar areas. Um
Figura 1.3: Grafico de frequencias do numero de itens defeituosos em 35 lotes. (a)
grafico de barras ou de pontos e prefervel para representar este tipo de dados.
Frequencias acumuladas. (b) Frequencias absolutas.
Duas otimas referencias para este assunto sao Cleveland (1993, 1994) e Good and
Hardin (2003).
A construcao de tabelas de frequencias para variaveis quantitativas contnuas
requer certo cuidado uma vez que nao existirao observacoes repetidas. A solucao
1.4 Variaveis quantitativas
entao e agrupar os dados em classes e obter as frequencias observadas em cada
Analogamente, para resumir dados quantitativos discretos, podemos utilizar uma classe. E importante notar que ao resumir dados referentes a uma variavel
tabela de frequencias como no exemplo a seguir. contnua sempre se perde alguma informacao ja que nao temos ideia de como
se distribuem as observacoes dentro de cada classe.
Exemplo 1.1 : Foram inspecionados 35 lotes de componentes eletronicos e ob- O metodo mais comum de representacao grafica de dados contnuos e atraves
tidos os numeros de itens defeituosos em cada lote. Os dados estao resumidos na de um histograma. Neste caso, a frequencia de cada classe e representada por
4 CAPITULO 1. ESTATISTICA DESCRITIVA 1.4. VARIAVEIS QUANTITATIVAS 5
Graficos de setores tambem costumam ser utilizados para apresentacao de Tabela 1.2. Note que foram incluidas as frequencias acumuladas Ni e Fi , assim
dados categoricos. Os setores do grafico sao desenhados de tal forma que eles
tenham area proporcional a frequencia. A Figura 1.2 abaixo ilustra as frequencias Tabela 1.2: Frequencias observadas do numero de itens defeituosos em 35 lotes.
observadas na Tabela 1.1.
defeituosos 0 1 2 3 4 5 6 8
Figura 1.2: Grafico de setores com as frequencias observadas na Tabela 1.1 ni 1 3 5 4 9 5 6 2
pi 0,03 0,09 0,14 0,11 0,26 0,14 0,17 0,06
Ni 1 4 9 13 22 27 33 35
Fi 0,03 0,11 0,26 0,37 0,63 0,77 0,94 1,00
por exemplo podemos dizer que aproximadamente 77% dos lotes inspecionados
defeituoso tem 5 itens defeituosos ou menos. Neste caso, frequencias absolutas e frequencias
acumuladas podem ser representadas graficamente como na Figura 1.3 abaixo.
perfeito
1.0
outros
8
0.8
6
recuperavel
Freq. acumuladas
0.6
frequncias
4
0.4
2
0.2
0.0
0
0 2 4 6 8 0 1 2 3 4 5 6 8
defeituosos defeituosos
No entanto, graficos de setores constituem uma forma muito ruim de apre- (a) (b)
sentar informacao ja que em geral temos dificuldade em comparar areas. Um
Figura 1.3: Grafico de frequencias do numero de itens defeituosos em 35 lotes. (a)
grafico de barras ou de pontos e prefervel para representar este tipo de dados.
Frequencias acumuladas. (b) Frequencias absolutas.
Duas otimas referencias para este assunto sao Cleveland (1993, 1994) e Good and
Hardin (2003).
A construcao de tabelas de frequencias para variaveis quantitativas contnuas
requer certo cuidado uma vez que nao existirao observacoes repetidas. A solucao
1.4 Variaveis quantitativas
entao e agrupar os dados em classes e obter as frequencias observadas em cada
Analogamente, para resumir dados quantitativos discretos, podemos utilizar uma classe. E importante notar que ao resumir dados referentes a uma variavel
tabela de frequencias como no exemplo a seguir. contnua sempre se perde alguma informacao ja que nao temos ideia de como
se distribuem as observacoes dentro de cada classe.
Exemplo 1.1 : Foram inspecionados 35 lotes de componentes eletronicos e ob- O metodo mais comum de representacao grafica de dados contnuos e atraves
tidos os numeros de itens defeituosos em cada lote. Os dados estao resumidos na de um histograma. Neste caso, a frequencia de cada classe e representada por
6 CAPITULO 1. ESTATISTICA DESCRITIVA 1.4. VARIAVEIS QUANTITATIVAS 7
um retangulo cuja base e igual a amplitude da classe e a altura e proporcional a Algumas vezes e conveniente agregar classes de frequencia nos extremos da
frequencia. distribuicao de forma que os intervalos passam a ter larguras diferentes. Neste
caso deve-se ter certo cuidado ao interpretar o histograma. A ideia e que a area
Exemplo 1.2 : Em um rio foram encontrados mortos 150 peixes vtimas de de cada retangulo deve ser preservada, assim por exemplo se a amplitude de um
contaminacao e seus comprimentos foram medidos em milmetros. As medidas intervalo for duplicada ele deve ter altura igual a metada de sua frequencia.
observadas foram agrupadas em classes e as frequencias de cada classe aparecem Neste texto nao discutiremos em detalhes a especificacao do numero e da am-
na Tabela 1.3. O histograma construdo com base nestes dados e apresentado na plitude das classes ja que os pacotes estatsticos utilizam algoritmos para escolha
Figura 1.4. otima destes valores. A ideia e que um numero muito grande de classes nao re-
sume satisfatoriamente os dados e com um numero muito pequeno perde-se muita
Tabela 1.3: Frequencias dos comprimentos de peixes encontrados mortos em um rio. informacao.
Outro metodo grafico que vale a pena ser utilizado quando o numero de ob-
Comprimento (mm) ni pi Ni Fi servacoes nao for muito grande e o grafico de ramo-e-folhas que sera ilustrado
100 110 7 0,05 7 0,05 nos exemplos a seguir. Cada observacao e separada em um ramo (geralmente a
110 120 16 0,11 23 0,15 parte inteira) e uma folha (geralmente a parte decimal). O grafico tera a forma
120 130 19 0,13 42 0,28
de um histograma porem retendo a informacao dos valores observados. A tecnica
130 140 31 0,21 73 0,49
e ilustrada nos exemplo 1.3 abaixo.
140 150 41 0,27 114 0,76
150 160 23 0,15 137 0,91
160 170 10 0,07 147 0,98 Exemplo 1.3 : Um estudo geoqumico foi realizado utilizando-se amostras de
170 180 3 0,02 150 1,00 sedimentos provenientes de riachos e obteve-se as concentracoes de Cromo (em
ppm) abaixo. Podemos facilmente escrever os dados no grafico de ramo-e-folhas
como na Figura 1.5.
Note que os ramos sao numeros inteiros e as folhas sao os valores depois
da vrgula decimal. E importante escrever as folhas em colunas igualmente
30
um retangulo cuja base e igual a amplitude da classe e a altura e proporcional a Algumas vezes e conveniente agregar classes de frequencia nos extremos da
frequencia. distribuicao de forma que os intervalos passam a ter larguras diferentes. Neste
caso deve-se ter certo cuidado ao interpretar o histograma. A ideia e que a area
Exemplo 1.2 : Em um rio foram encontrados mortos 150 peixes vtimas de de cada retangulo deve ser preservada, assim por exemplo se a amplitude de um
contaminacao e seus comprimentos foram medidos em milmetros. As medidas intervalo for duplicada ele deve ter altura igual a metada de sua frequencia.
observadas foram agrupadas em classes e as frequencias de cada classe aparecem Neste texto nao discutiremos em detalhes a especificacao do numero e da am-
na Tabela 1.3. O histograma construdo com base nestes dados e apresentado na plitude das classes ja que os pacotes estatsticos utilizam algoritmos para escolha
Figura 1.4. otima destes valores. A ideia e que um numero muito grande de classes nao re-
sume satisfatoriamente os dados e com um numero muito pequeno perde-se muita
Tabela 1.3: Frequencias dos comprimentos de peixes encontrados mortos em um rio. informacao.
Outro metodo grafico que vale a pena ser utilizado quando o numero de ob-
Comprimento (mm) ni pi Ni Fi servacoes nao for muito grande e o grafico de ramo-e-folhas que sera ilustrado
100 110 7 0,05 7 0,05 nos exemplos a seguir. Cada observacao e separada em um ramo (geralmente a
110 120 16 0,11 23 0,15 parte inteira) e uma folha (geralmente a parte decimal). O grafico tera a forma
120 130 19 0,13 42 0,28
de um histograma porem retendo a informacao dos valores observados. A tecnica
130 140 31 0,21 73 0,49
e ilustrada nos exemplo 1.3 abaixo.
140 150 41 0,27 114 0,76
150 160 23 0,15 137 0,91
160 170 10 0,07 147 0,98 Exemplo 1.3 : Um estudo geoqumico foi realizado utilizando-se amostras de
170 180 3 0,02 150 1,00 sedimentos provenientes de riachos e obteve-se as concentracoes de Cromo (em
ppm) abaixo. Podemos facilmente escrever os dados no grafico de ramo-e-folhas
como na Figura 1.5.
Note que os ramos sao numeros inteiros e as folhas sao os valores depois
da vrgula decimal. E importante escrever as folhas em colunas igualmente
30
A representacao no grafico de ramo-e-folhas e feita de forma que os ramos Note que, sendo definida a partir de uma soma de quadrados a variancia sempre
contenham dezenas de minutos e as folhas contenham unidades de minutos. assume valores positivos. Alem disso, a divisao por n1 retira o efeito do tamanho
do conjunto de dados, assim as dispersoes de dois conjuntos ficam comparaveis
2|3 2|F mesmo que um deles tenha muito mais observacoes do que o outro. Nao e difcil
3|1 3|F mostrar que a expressao da variancia pode ser reescrita como
4|2 5 4|M F Pn 2
5|1 2 7 5|F F M x nx2
s2 = i=1 i
6|1 1 4 8 9 6|F F F F M n1
7|3 5 5 7|M M M
que e uma versao mais facil de ser calculada quando nao se dispoe de recursos
8|2 9 8|M F
computacionais. Mas cuidado porque os erros de arrendondamento podem gerar
9|4 9|F
um valor negativo se a variancia for muito pequena.
10| 10|
A raiz quadrada positiva da variancia, chamada de desvio padrao, e uma
11|8 11|M
medida
de dispersao que esta na mesma escala dos dados. A notacao usual e
12|0 12|M
s = s2 .
Pode-se notar que os valores estao simetricamente dispersos em torno de um valor Algumas propriedades destas mediadas sao,
central e nao ha a indicacao de valores atpicos ou discrepantes (outliers). No P
1. a soma de desvios em torno da media e sempre igual a zero, ni=1 (xi x) =
diagrama da direita a informacao sobre o sexo dos alunos foi adicionada e ha
0.
indicacao de que os homens (M) gastaram um tempo maior do que as mulheres
P
(F). 2. a soma de desvios quadraticos em torno de um valor a, ni=1 (xi a)2 , e
mnima se somente se a = x.
1.5 Resumos numericos 3. somando-se uma constante k aos dados a media sera somada da mesma
constante enquanto a variancia fica inalterada.
Para resumir numericamente dados de uma variavel quantitativa o objetivo e
escolher medidas apropriadas de locacao e de dispersao. Existem tres escolhas 4. multiplicando-se os dados por uma constante k a media sera multiplicada
mais frequentemente utilizadas para medidas de locacao que estao ligadas a certas pela mesma constante enquanto a variancia sera multiplicada pelo quadrado
medidas de dispersao como sera visto adiante. da constante.
8 CAPITULO 1. ESTATISTICA DESCRITIVA 1.5. RESUMOS NUMERICOS 9
A representacao no grafico de ramo-e-folhas e feita de forma que os ramos Note que, sendo definida a partir de uma soma de quadrados a variancia sempre
contenham dezenas de minutos e as folhas contenham unidades de minutos. assume valores positivos. Alem disso, a divisao por n1 retira o efeito do tamanho
do conjunto de dados, assim as dispersoes de dois conjuntos ficam comparaveis
2|3 2|F mesmo que um deles tenha muito mais observacoes do que o outro. Nao e difcil
3|1 3|F mostrar que a expressao da variancia pode ser reescrita como
4|2 5 4|M F Pn 2
5|1 2 7 5|F F M x nx2
s2 = i=1 i
6|1 1 4 8 9 6|F F F F M n1
7|3 5 5 7|M M M
que e uma versao mais facil de ser calculada quando nao se dispoe de recursos
8|2 9 8|M F
computacionais. Mas cuidado porque os erros de arrendondamento podem gerar
9|4 9|F
um valor negativo se a variancia for muito pequena.
10| 10|
A raiz quadrada positiva da variancia, chamada de desvio padrao, e uma
11|8 11|M
medida
de dispersao que esta na mesma escala dos dados. A notacao usual e
12|0 12|M
s = s2 .
Pode-se notar que os valores estao simetricamente dispersos em torno de um valor Algumas propriedades destas mediadas sao,
central e nao ha a indicacao de valores atpicos ou discrepantes (outliers). No P
1. a soma de desvios em torno da media e sempre igual a zero, ni=1 (xi x) =
diagrama da direita a informacao sobre o sexo dos alunos foi adicionada e ha
0.
indicacao de que os homens (M) gastaram um tempo maior do que as mulheres
P
(F). 2. a soma de desvios quadraticos em torno de um valor a, ni=1 (xi a)2 , e
mnima se somente se a = x.
1.5 Resumos numericos 3. somando-se uma constante k aos dados a media sera somada da mesma
constante enquanto a variancia fica inalterada.
Para resumir numericamente dados de uma variavel quantitativa o objetivo e
escolher medidas apropriadas de locacao e de dispersao. Existem tres escolhas 4. multiplicando-se os dados por uma constante k a media sera multiplicada
mais frequentemente utilizadas para medidas de locacao que estao ligadas a certas pela mesma constante enquanto a variancia sera multiplicada pelo quadrado
medidas de dispersao como sera visto adiante. da constante.
10 CAPITULO 1. ESTATISTICA DESCRITIVA 1.5. RESUMOS NUMERICOS 11
5. a media aritmetica sempre pertence ao intervalo de variacao dos dados, i.e. coeficiente de variacao definido como s/|x|. Assim a escala das observacoes esta
min(xi ) x max(xi ) sendo levada em conta.
Das propriedades 3 e 4 e facil verificar que se yi = a + bxi , i = 1, . . . , n entao Exemplo 1.7 : Suponha por exemplo que 2 conjuntos de dados apresentam
a media aritmetica e a variancia de y sao desvios-padroes s1 = 3 e s2 = 4 com medias x1 = 30 e x2 = 80. Embora
em termos absolutos a dispersao seja maior no segundo conjunto as dispersoes
y = a + bx e s2y = b2 s2 .
relativas sao 10% e 5% respectivamente.
Exemplo 1.5 : Sete homens foram pesados, e os resultados em Kg foram: Exemplo 1.8 : Sejam agora as variaveis X e Y cujos valores observados sao 0,0,
0,05 e 0,10 e 1000, 110 e 1200 respectivamente. E facil verificar que
57,0; 62,9; 63,5; 64,1; 66,1; 67,1; 73,6.
x = 0, 05 s2x = 0, 052 sx = 0, 05
Utilizando uma calculadora nao e difcil verificar que a media e 64,9 kg, a variancia y = 1100 s2y = 1002 sx = 100
e 25,16 kg2 e o desvio padrao e 5,02 kg.
e a variabilidade de X e bem menor em termos absolutos. Porem, em termos
Exemplo 1.6 : Foram inspecionados 30 aparelhos fabricados por uma industria relativos,
e obteve-se a distribuicao de frequencias do numero de defeitos por aparelho dada 100
CV (X) = 100% e CV (Y ) = 6%.
na Tabela 1.4. 1100
Tabela 1.4: Frequencias dos numeros de defeitos por aparelho inspecionado. 1.5.2 A mediana e a amplitude inter-quartis
Numero de defeitos 0 1 2 3 4 Aqui vamos apresentar medidas de locacao e dispersao baseadas em dados orde-
ni 12 8 7 1 2 nados (ou estatsticas de ordem) que sao particularmente uteis para distribuicoes
assimetricas e sao pouco sensveis a observacoes muito discrepantes.
A mediana e definida como o valor que divide os dados ordenados em duas
Neste caso o numero medio de defeitos por aparelho sera partes de mesmo tamanho. Quando ha um numero mpar de observacoes a me-
diana e o valor central (de ordem (n + 1)/2) enquanto que para um numero par
12 0 + 8 1 + 7 2 + 1 3 + 2 4 33
x= = = 1, 1 de observacoes a mediada e calculada como a media dos dois valores centrais (de
30 30
ordem n/2 e n/2 + 1). Por exemplo, as medianas dos conjuntos ordenados
e sua variancia sera
5, 7, 9, 13, 17, 19, 20 e 3, 7, 8, 10, 12, 15
12 02 + 8 12 + 7 22 + 1 32 + 2 42 30 1, 12 40, 7
s2 = = 1, 4.
29 29 sao 13 e (8+10)/2=9 respectivamente.
A definicao pode ser estendida para valores que dividem a distribuicao em 4
Vale notar que estas medidas sao extremamente sensveis a observacoes dis- partes de mesmo tamanho (quartis) ou 100 partes de mesmo tamanho (percentis).
crepantes. No Exemplo 1.6, se um unico aparelho apresentasse 15 defeitos ao Os quartis inferior e superior, usualmente denotados por Q1 e Q3 , sao definidos
inves de 4 a media passaria a ser aproximadamente 1,5 e a variancia passaria a como os valores abaixo dos quais estao 1/4 e 3/4, respectivamente, dos dados.
ser aproximadamente 7,6. Estes valores sao frequentemente usados para resumir os dados juntamente com o
Uma medida de dispersao relativa particularmente util quando se deseja com- mnimo, o maximo e a mediana. Para um numero par de observacoes, os quartis
parar dispersoes em dois conjuntos de dados com medias bem diferentes e o tambem serao uma media de valores.
10 CAPITULO 1. ESTATISTICA DESCRITIVA 1.5. RESUMOS NUMERICOS 11
5. a media aritmetica sempre pertence ao intervalo de variacao dos dados, i.e. coeficiente de variacao definido como s/|x|. Assim a escala das observacoes esta
min(xi ) x max(xi ) sendo levada em conta.
Das propriedades 3 e 4 e facil verificar que se yi = a + bxi , i = 1, . . . , n entao Exemplo 1.7 : Suponha por exemplo que 2 conjuntos de dados apresentam
a media aritmetica e a variancia de y sao desvios-padroes s1 = 3 e s2 = 4 com medias x1 = 30 e x2 = 80. Embora
em termos absolutos a dispersao seja maior no segundo conjunto as dispersoes
y = a + bx e s2y = b2 s2 .
relativas sao 10% e 5% respectivamente.
Exemplo 1.5 : Sete homens foram pesados, e os resultados em Kg foram: Exemplo 1.8 : Sejam agora as variaveis X e Y cujos valores observados sao 0,0,
0,05 e 0,10 e 1000, 110 e 1200 respectivamente. E facil verificar que
57,0; 62,9; 63,5; 64,1; 66,1; 67,1; 73,6.
x = 0, 05 s2x = 0, 052 sx = 0, 05
Utilizando uma calculadora nao e difcil verificar que a media e 64,9 kg, a variancia y = 1100 s2y = 1002 sx = 100
e 25,16 kg2 e o desvio padrao e 5,02 kg.
e a variabilidade de X e bem menor em termos absolutos. Porem, em termos
Exemplo 1.6 : Foram inspecionados 30 aparelhos fabricados por uma industria relativos,
e obteve-se a distribuicao de frequencias do numero de defeitos por aparelho dada 100
CV (X) = 100% e CV (Y ) = 6%.
na Tabela 1.4. 1100
Tabela 1.4: Frequencias dos numeros de defeitos por aparelho inspecionado. 1.5.2 A mediana e a amplitude inter-quartis
Numero de defeitos 0 1 2 3 4 Aqui vamos apresentar medidas de locacao e dispersao baseadas em dados orde-
ni 12 8 7 1 2 nados (ou estatsticas de ordem) que sao particularmente uteis para distribuicoes
assimetricas e sao pouco sensveis a observacoes muito discrepantes.
A mediana e definida como o valor que divide os dados ordenados em duas
Neste caso o numero medio de defeitos por aparelho sera partes de mesmo tamanho. Quando ha um numero mpar de observacoes a me-
diana e o valor central (de ordem (n + 1)/2) enquanto que para um numero par
12 0 + 8 1 + 7 2 + 1 3 + 2 4 33
x= = = 1, 1 de observacoes a mediada e calculada como a media dos dois valores centrais (de
30 30
ordem n/2 e n/2 + 1). Por exemplo, as medianas dos conjuntos ordenados
e sua variancia sera
5, 7, 9, 13, 17, 19, 20 e 3, 7, 8, 10, 12, 15
12 02 + 8 12 + 7 22 + 1 32 + 2 42 30 1, 12 40, 7
s2 = = 1, 4.
29 29 sao 13 e (8+10)/2=9 respectivamente.
A definicao pode ser estendida para valores que dividem a distribuicao em 4
Vale notar que estas medidas sao extremamente sensveis a observacoes dis- partes de mesmo tamanho (quartis) ou 100 partes de mesmo tamanho (percentis).
crepantes. No Exemplo 1.6, se um unico aparelho apresentasse 15 defeitos ao Os quartis inferior e superior, usualmente denotados por Q1 e Q3 , sao definidos
inves de 4 a media passaria a ser aproximadamente 1,5 e a variancia passaria a como os valores abaixo dos quais estao 1/4 e 3/4, respectivamente, dos dados.
ser aproximadamente 7,6. Estes valores sao frequentemente usados para resumir os dados juntamente com o
Uma medida de dispersao relativa particularmente util quando se deseja com- mnimo, o maximo e a mediana. Para um numero par de observacoes, os quartis
parar dispersoes em dois conjuntos de dados com medias bem diferentes e o tambem serao uma media de valores.
12 CAPITULO 1. ESTATISTICA DESCRITIVA 1.5. RESUMOS NUMERICOS 13
Podemos agora definir uma medida de dispersao aproprida, a amplitude inter- Para efeito de construcao do Box-plot, uma observacao x sera considerada um
quartis, que e a diferenca entre o quartil superior e o inferior, Q3 Q1 . Note outlier se,
tambem que 50% dos dados estarao entre os quartis inferior e superior.
x < Q1 1, 5(Q3 Q1 ) ou x > Q3 + 1, 5(Q3 Q1 ).
Exemplo 1.9 : O numero de criancas em 19 famlias foi contado e obteve-se os
seguintes valores (ja ordenados),
Exemplo 1.10 : Um box-plot para os dados do Exemplo 1.4 e mostrado na
0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10. Figura 1.7. Os dados originais foram adicionados ao eixo vertical e pode-se notar
que o valor 120 minutos foi considerado um outlier segundo o criterio acima.
Assim, o numero mediano de criancas e o valor de ordem (19+1)/2=10, i.e. 3
criancas. Analogamente, os quartis inferior e superior sao os valores de ordem 5
e 15 respectivamente, i.e. 2 e 6 criancas. Portanto a amplitude inter-quartis e de Figura 1.7: Box-plot dos dados do Exemplo 1.4.
4 criancas.
120
Vale notar tambem que no Exemplo 1.6 se um unico aparelho apresentasse 15
100
defeitos ao inves de 4 a mediana e os quartis ficariam inalterados.
Um importante metodo grafico para apresentar caractersticas de um con-
tempos em minutos
junto de dados chama-se Box-and-Whisker plot ou simplesmente Box-plot
80
e e baseado nas medidas vistas acima, i.e. o mnimo, o maximo, os quartis e a
mediana. Um box-plot para os dados do Exemplo 1.3 e mostrado na Figura 1.6.
60
A altura do retangulo representa a distancia inter-quartis e as linhas se estendem
40
Figura 1.6: Box-plot dos dados geoqumicos do Exemplo 1.3.
20
18
mal, embora eles possam viesar calculos baseados em somas. Eles tambem podem
ser devido a erros (que podem ser corrigidos), ou ainda revelar que a distribuicao
14
dos dados tem caudas pesadas (e.g. dados intra-diarios do mercado financeiro).
Vale notar que este tipo de grafico e particularmente util para comparar ca-
12
1.5.3 A moda
Algumas vezes, especialmente para dados de contagem, um unico valor domina
a amostra. Neste caso, a medida de locacao apropriada e a moda, definida como
o valor que ocorre com maior frequencia. A proporcao da amostra que assume
ate as observacoes extremas, exceto aquelas consideradas discrepantes (outliers). este valor modal pode ser utilizada no lugar de uma medida formal de dispersao.
12 CAPITULO 1. ESTATISTICA DESCRITIVA 1.5. RESUMOS NUMERICOS 13
Podemos agora definir uma medida de dispersao aproprida, a amplitude inter- Para efeito de construcao do Box-plot, uma observacao x sera considerada um
quartis, que e a diferenca entre o quartil superior e o inferior, Q3 Q1 . Note outlier se,
tambem que 50% dos dados estarao entre os quartis inferior e superior.
x < Q1 1, 5(Q3 Q1 ) ou x > Q3 + 1, 5(Q3 Q1 ).
Exemplo 1.9 : O numero de criancas em 19 famlias foi contado e obteve-se os
seguintes valores (ja ordenados),
Exemplo 1.10 : Um box-plot para os dados do Exemplo 1.4 e mostrado na
0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10. Figura 1.7. Os dados originais foram adicionados ao eixo vertical e pode-se notar
que o valor 120 minutos foi considerado um outlier segundo o criterio acima.
Assim, o numero mediano de criancas e o valor de ordem (19+1)/2=10, i.e. 3
criancas. Analogamente, os quartis inferior e superior sao os valores de ordem 5
e 15 respectivamente, i.e. 2 e 6 criancas. Portanto a amplitude inter-quartis e de Figura 1.7: Box-plot dos dados do Exemplo 1.4.
4 criancas.
120
Vale notar tambem que no Exemplo 1.6 se um unico aparelho apresentasse 15
100
defeitos ao inves de 4 a mediana e os quartis ficariam inalterados.
Um importante metodo grafico para apresentar caractersticas de um con-
tempos em minutos
junto de dados chama-se Box-and-Whisker plot ou simplesmente Box-plot
80
e e baseado nas medidas vistas acima, i.e. o mnimo, o maximo, os quartis e a
mediana. Um box-plot para os dados do Exemplo 1.3 e mostrado na Figura 1.6.
60
A altura do retangulo representa a distancia inter-quartis e as linhas se estendem
40
Figura 1.6: Box-plot dos dados geoqumicos do Exemplo 1.3.
20
18
mal, embora eles possam viesar calculos baseados em somas. Eles tambem podem
ser devido a erros (que podem ser corrigidos), ou ainda revelar que a distribuicao
14
dos dados tem caudas pesadas (e.g. dados intra-diarios do mercado financeiro).
Vale notar que este tipo de grafico e particularmente util para comparar ca-
12
1.5.3 A moda
Algumas vezes, especialmente para dados de contagem, um unico valor domina
a amostra. Neste caso, a medida de locacao apropriada e a moda, definida como
o valor que ocorre com maior frequencia. A proporcao da amostra que assume
ate as observacoes extremas, exceto aquelas consideradas discrepantes (outliers). este valor modal pode ser utilizada no lugar de uma medida formal de dispersao.
14 CAPITULO 1. ESTATISTICA DESCRITIVA 1.6. DADOS MULTIPLOS 15
20
apresenta duas modas 7 e 10 sendo assim chamado de bimodal.
15
1.6 Dados multiplos
Os resultados de um estudo tipicamente envolverao mais do que um unico con-
10
junto de dados. Neste caso, representacoes graficas sao uteis para comparar
grupos de dados ou para verificar se exitem relacoes entre eles. Existem mui-
tas possibilidades, mas a mais adequada dependera das peculiaridades de cada
5
conjunto de dados.
Podemos criar combinacoes dos metodos ja discutidos. Por exemplo, se me-
dirmos as alturas e pesos de um conjunto de pessoas, podemos produzir box-plots Num. homic. > 4 Num. homic. <= 4
20
apresenta duas modas 7 e 10 sendo assim chamado de bimodal.
15
1.6 Dados multiplos
Os resultados de um estudo tipicamente envolverao mais do que um unico con-
10
junto de dados. Neste caso, representacoes graficas sao uteis para comparar
grupos de dados ou para verificar se exitem relacoes entre eles. Existem mui-
tas possibilidades, mas a mais adequada dependera das peculiaridades de cada
5
conjunto de dados.
Podemos criar combinacoes dos metodos ja discutidos. Por exemplo, se me-
dirmos as alturas e pesos de um conjunto de pessoas, podemos produzir box-plots Num. homic. > 4 Num. homic. <= 4
Figura 1.9: Box-plots dos dados de comprimento de dente separados por dosagem e Figura 1.10: Diagrama de dispersao das taxas de mortalidade por homicidio em Sao
forma de ingestao. Paulo.
35
30
1
25
Comprimento do dente
3.0
20
2.5
15
Interior
2.0
10
3 2
1.5
Acido Ascorbico
suco de laranja
5
1.0
0
2 4 6 8 10 12 14 16
0.5 0.5 1 1 2 2 Metropolitana
Dose de Vitamina C em mg
para todos os pares possveis produzindo assim uma matriz de graficos de pontos
(Ver Captulo 6).
1.6.2 Dados Pareados
O exemplo abaixo ilustra um tipo de representacao grafica que pode ser util para
visualizar dados pareados.
Grafico temporal
Exemplo 1.15 : Uma alteracao foi introduzida na linha de montagem de um
Um caso especial de um grafico de pontos e um grafico temporal onde a variavel aparelho com o objetivo de reduzir o tempo gasto pelos operarios para execucao
tempo esta no eixo horizontal. Ou seja, as medidas dos dados sao feitas ao de certas tarefas. Uma amostra de 10 operarios foi observada antes e depois da
longo do tempo. Nestes casos e usual unir pontos sucessivos por segmentos de alteracao e a Tabela 1.5 abaixo mostra os tempos de execucao medidos. Uma
reta, e e em geral uma boa pratica deixar o eixo horizontal mais longo do que o representacao grafica destes dados e dada na Figura 1.12. E muito mais facil ver
vertical. do grafico do que da tabela que os operarios tenderam a reduzir seus tempos de
Como exemplo deste tipo de dados, na Figura 1.11 sao apresentados os graficos execucao, e que aqueles que nao reduziram ja tendiam a ter os menores tempos
temporais com medidas diarias de quatro indicadores de qualidade do ar em Nova e provavelmente nao necessitavam da alteracao.
Iorque entre maio e setembro de 1973. Uma referencia para analise deste tipo de
dados e Morettin e Toloi (2004).
16 CAPITULO 1. ESTATISTICA DESCRITIVA 1.6. DADOS MULTIPLOS 17
Figura 1.9: Box-plots dos dados de comprimento de dente separados por dosagem e Figura 1.10: Diagrama de dispersao das taxas de mortalidade por homicidio em Sao
forma de ingestao. Paulo.
35
30
1
25
Comprimento do dente
3.0
20
2.5
15
Interior
2.0
10
3 2
1.5
Acido Ascorbico
suco de laranja
5
1.0
0
2 4 6 8 10 12 14 16
0.5 0.5 1 1 2 2 Metropolitana
Dose de Vitamina C em mg
para todos os pares possveis produzindo assim uma matriz de graficos de pontos
(Ver Captulo 6).
1.6.2 Dados Pareados
O exemplo abaixo ilustra um tipo de representacao grafica que pode ser util para
visualizar dados pareados.
Grafico temporal
Exemplo 1.15 : Uma alteracao foi introduzida na linha de montagem de um
Um caso especial de um grafico de pontos e um grafico temporal onde a variavel aparelho com o objetivo de reduzir o tempo gasto pelos operarios para execucao
tempo esta no eixo horizontal. Ou seja, as medidas dos dados sao feitas ao de certas tarefas. Uma amostra de 10 operarios foi observada antes e depois da
longo do tempo. Nestes casos e usual unir pontos sucessivos por segmentos de alteracao e a Tabela 1.5 abaixo mostra os tempos de execucao medidos. Uma
reta, e e em geral uma boa pratica deixar o eixo horizontal mais longo do que o representacao grafica destes dados e dada na Figura 1.12. E muito mais facil ver
vertical. do grafico do que da tabela que os operarios tenderam a reduzir seus tempos de
Como exemplo deste tipo de dados, na Figura 1.11 sao apresentados os graficos execucao, e que aqueles que nao reduziram ja tendiam a ter os menores tempos
temporais com medidas diarias de quatro indicadores de qualidade do ar em Nova e provavelmente nao necessitavam da alteracao.
Iorque entre maio e setembro de 1973. Uma referencia para analise deste tipo de
dados e Morettin e Toloi (2004).
18 CAPITULO 1. ESTATISTICA DESCRITIVA 1.6. DADOS MULTIPLOS 19
300
150
4 12,0 11,9
250
5 10,0 12,0
6 11,9 12,9
Radiao solar
100
200
Ozonio
7 12,2 11,4
150
8 12,3 12,1
9 11,7 13,5
100
50
50 10 12,0 12,3
0
(a) (b)
20
90
Figura 1.12: Grafico dos tempos de execucao de tarefas por operarios observados antes
15
14
10
70
13
5
60
tempo de execuo
0 50 100 150 0 50 100 150
12
dias dias
(c) (d)
11
ar em Nova Iorque, EUA.
10
18 CAPITULO 1. ESTATISTICA DESCRITIVA 1.6. DADOS MULTIPLOS 19
300
150
4 12,0 11,9
250
5 10,0 12,0
6 11,9 12,9
Radiao solar
100
200
Ozonio
7 12,2 11,4
150
8 12,3 12,1
9 11,7 13,5
100
50
50 10 12,0 12,3
0
(a) (b)
20
90
Figura 1.12: Grafico dos tempos de execucao de tarefas por operarios observados antes
15
14
10
70
13
5
60
tempo de execuo
0 50 100 150 0 50 100 150
12
dias dias
(c) (d)
11
ar em Nova Iorque, EUA.
10
20 CAPITULO 1. ESTATISTICA DESCRITIVA 1.7. PROBLEMAS 21
1.7 Problemas 0 1 11 0 0 0 2 12 0 0
12 1 0 0 0 0 12 0 11 0
1. Para um conjunto de n valores observados x1 , . . . , xn mostre que:
P
(a) a variancia tambem pode ser escrita como ( ni=1 x2i nx2 )/(n 1);
7. Faca um grafico ramo-e-folhas para apresentacao dos dados de altura (em
(b) somando-se uma constante k aos dados a variancia nao se altera e a
metros) de 20 mulheres sendo estudadas para uma certa condicao medica.
media fica somada de k;
(c) multiplicando-se os dados por uma constante k a media fica multipli-
cada por k e a variancia fica multiplicada por k 2 .
1,52 1,60 1,57 1,52 1,60
(d) Calcule a media e a variancia da transformacao yi = axi + b para duas 1,75 1,73 1,63 1,55 1,63
constantes a e b quaisquer. 1,65 1,55 1,65 1,60 1,68
2.50 1,52 1,65 1,60 1,65
2. No Exemplo 1.6 verifique que se um unico aparelho apresentasse 15 defeitos
ao inves de 4 a mediana e os quartis ficariam inalterados.
3. O salario medio dos funcionarios de uma empresa era de R$500,00 com 8. Os dados a seguir fornecem a concentracao de um determinado poluente
variancia 100 reais2 e o salario mediano era de R$450,00. Se todos os (em ppm) em 8 pontos de um afluente medidos antes e uma hora depois de
salarios forem duplicados o que ocorre com a media, variancia, mediana e um acidente ambiental:
coeficiente de variacao?
4. Descreva em palavras quais informacoes podem ser tiradas das Figuras 1.8,
1.9 e 1.10. Antes Depois
4,67 5,44
5. Forneca dois exemplos de variaveis qualitativas e dois de variaveis quanti- 4,97 6,11
tativas (diferentes da apostila). 5,11 6,49
6. Descreva de forma concisa os seguintes dados usando suas palavras e algu- 5,17 6,61
mas estatsticas descritivas, apontando caractersticas principais observa- 5,33 6,67
das. 6,22 6,67
6,50 6,78
(a) As notas (de um total de 100 e ordenadas por tamanho) de 20 estu- 7,00 7,89
dantes de estatstica no primeiro exame do semestre:
30 35 37 40 40 49 51 54 54 55
57 58 60 60 62 62 65 67 74 89 Faca um grafico destes dados, e use o grafico para ajudar a avaliar se o
(b) O numero de faltas de 20 trabalhadores num ano (ordenados por ta- acidente provocou um aumento significativo nos nveis do poluente no aflu-
manho): ente.
0 0 0 0 0 0 0 1 1 1
2 2 3 3 4 5 5 5 8 45 9. A tabela abaixo fornece o numero de granulos de arenito por cm3 em 20
(c) O numero de exemplares de um jornal mensal em particular lidos por amostras tomadas de uma certa localidade (A) e 20 amostras tomadas de
20 pessoas num ano: uma outra localidade (B).
20 CAPITULO 1. ESTATISTICA DESCRITIVA 1.7. PROBLEMAS 21
1.7 Problemas 0 1 11 0 0 0 2 12 0 0
12 1 0 0 0 0 12 0 11 0
1. Para um conjunto de n valores observados x1 , . . . , xn mostre que:
P
(a) a variancia tambem pode ser escrita como ( ni=1 x2i nx2 )/(n 1);
7. Faca um grafico ramo-e-folhas para apresentacao dos dados de altura (em
(b) somando-se uma constante k aos dados a variancia nao se altera e a
metros) de 20 mulheres sendo estudadas para uma certa condicao medica.
media fica somada de k;
(c) multiplicando-se os dados por uma constante k a media fica multipli-
cada por k e a variancia fica multiplicada por k 2 .
1,52 1,60 1,57 1,52 1,60
(d) Calcule a media e a variancia da transformacao yi = axi + b para duas 1,75 1,73 1,63 1,55 1,63
constantes a e b quaisquer. 1,65 1,55 1,65 1,60 1,68
2.50 1,52 1,65 1,60 1,65
2. No Exemplo 1.6 verifique que se um unico aparelho apresentasse 15 defeitos
ao inves de 4 a mediana e os quartis ficariam inalterados.
3. O salario medio dos funcionarios de uma empresa era de R$500,00 com 8. Os dados a seguir fornecem a concentracao de um determinado poluente
variancia 100 reais2 e o salario mediano era de R$450,00. Se todos os (em ppm) em 8 pontos de um afluente medidos antes e uma hora depois de
salarios forem duplicados o que ocorre com a media, variancia, mediana e um acidente ambiental:
coeficiente de variacao?
4. Descreva em palavras quais informacoes podem ser tiradas das Figuras 1.8,
1.9 e 1.10. Antes Depois
4,67 5,44
5. Forneca dois exemplos de variaveis qualitativas e dois de variaveis quanti- 4,97 6,11
tativas (diferentes da apostila). 5,11 6,49
6. Descreva de forma concisa os seguintes dados usando suas palavras e algu- 5,17 6,61
mas estatsticas descritivas, apontando caractersticas principais observa- 5,33 6,67
das. 6,22 6,67
6,50 6,78
(a) As notas (de um total de 100 e ordenadas por tamanho) de 20 estu- 7,00 7,89
dantes de estatstica no primeiro exame do semestre:
30 35 37 40 40 49 51 54 54 55
57 58 60 60 62 62 65 67 74 89 Faca um grafico destes dados, e use o grafico para ajudar a avaliar se o
(b) O numero de faltas de 20 trabalhadores num ano (ordenados por ta- acidente provocou um aumento significativo nos nveis do poluente no aflu-
manho): ente.
0 0 0 0 0 0 0 1 1 1
2 2 3 3 4 5 5 5 8 45 9. A tabela abaixo fornece o numero de granulos de arenito por cm3 em 20
(c) O numero de exemplares de um jornal mensal em particular lidos por amostras tomadas de uma certa localidade (A) e 20 amostras tomadas de
20 pessoas num ano: uma outra localidade (B).
22 CAPITULO 1. ESTATISTICA DESCRITIVA 1.7. PROBLEMAS 23
A B (a) Faca um grafico desses dados para investigar a relacao entre o conteudo
171 397 116 375 de acucar e sal nos cereais matinais.
431 795 375 440 (b) Comente brevemente qualquer padrao observado nos dados.
288 257 151 192
1283 902 752 503
554 1621 979 1252
295 1004 208 688
568 1378 426 771
958 435 675 377
2415 1104 410 700
1212 396 736 315
A B (a) Faca um grafico desses dados para investigar a relacao entre o conteudo
171 397 116 375 de acucar e sal nos cereais matinais.
431 795 375 440 (b) Comente brevemente qualquer padrao observado nos dados.
288 257 151 192
1283 902 752 503
554 1621 979 1252
295 1004 208 688
568 1378 426 771
958 435 675 377
2415 1104 410 700
1212 396 736 315
Algumas operacoes com eventos serao muito uteis e sao definidas a seguir.
Para dois eventos A e B quaisquer:
1. A uniao entre eles (AB) ocorre se somente se pelo menos um deles ocorre.
Em outras palavras, se ocorre apenas o evento A, ou ocorre apenas o evento
Captulo 2 B, ou ambos ocorrem simultaneamente. Podemos dizer ainda que A ou B
ocorrem.
2. Lancamento de um dado e observacao da face superior. S = {1, 2, 3, 4, 5, 6}, 2.2 Definicao de probabilidade
A = {2, 4, 6}
Seja um espaco amostral S associado a um dado experimento aleatorio. A cada
3. Contagem do numero de pecas defeituosas em um lote com 100 pecas. possvel evento A de S podemos associar um numero real, representado por P (A)
S = {0, 1, 2, . . . , 100}, A = {0, 1, . . . , 10} e denominado probabilidade do evento A, satisfazendo as seguintes propriedades,
24
2.2. DEFINICAO DE PROBABILIDADE 25
Algumas operacoes com eventos serao muito uteis e sao definidas a seguir.
Para dois eventos A e B quaisquer:
1. A uniao entre eles (AB) ocorre se somente se pelo menos um deles ocorre.
Em outras palavras, se ocorre apenas o evento A, ou ocorre apenas o evento
Captulo 2 B, ou ambos ocorrem simultaneamente. Podemos dizer ainda que A ou B
ocorrem.
2. Lancamento de um dado e observacao da face superior. S = {1, 2, 3, 4, 5, 6}, 2.2 Definicao de probabilidade
A = {2, 4, 6}
Seja um espaco amostral S associado a um dado experimento aleatorio. A cada
3. Contagem do numero de pecas defeituosas em um lote com 100 pecas. possvel evento A de S podemos associar um numero real, representado por P (A)
S = {0, 1, 2, . . . , 100}, A = {0, 1, . . . , 10} e denominado probabilidade do evento A, satisfazendo as seguintes propriedades,
24
26 CAPITULO 2. PROBABILIDADES 2.3. PROBABILIDADE CONDICIONAL E INDEPENDENCIA 27
Esta ultima propriedade pode ser generalizada para um numero finito ou infinito A partir desta definicao obtemos a chamada regra do produto de probabilida-
de eventos mutuamente exclusivos, A1 , A2 , . . . , An , ou seja des,
P (A B) = P (A|B)P (B).
P (A1 A2 An ) = P (A1 ) + P (A2 ) + + P (An ),
Esta e chamada probabilidade conjunta dos eventos A e B e tambem pode ser
se Ai Aj = , para todo i 6= j. escrita como P (A, B). P (A) e P (B) sao chamadas probabilidades marginais dos
A partir destes axiomas outras propriedades bastante uteis podem ser obtidas, eventos A e B.
por exemplo
1. P (A) = 1 P (A) onde A e o evento complementar de A. Exemplo 2.1 : Duas bolas sao retiradas ao acaso de uma urna contendo 2 bolas
brancas (B) e 3 vermelhas (V ), sem reposicao. Neste caso os possveis resultados
2. P (A A) = 1 e P () = 0. do experimento sao {BB, BV, V B, V V } e suas probabilidades sao,
Para dois eventos A e B, sendo que P (B) > 0, definimos a probabilidade condi- e isto tambem equivalente a dizer que
cional de A dado que B ocorreu como
P (A B) = P (A)P (B).
P (A B)
P (A|B) = .
P (B)
O conceito de independencia pode ser estendido a um numero qualquer de
Vale notar que todas as propriedades vistas anteriormente continuam validas
eventos, i.e.
para probabilidades condicionais. Por exemplo,
P (A1 Ak ) = P (A1 ) . . . P (Ak )
P (A | B) = 1 P (A | B). se somente se os eventos A1 , . . . , Ak forem independentes.
26 CAPITULO 2. PROBABILIDADES 2.3. PROBABILIDADE CONDICIONAL E INDEPENDENCIA 27
Esta ultima propriedade pode ser generalizada para um numero finito ou infinito A partir desta definicao obtemos a chamada regra do produto de probabilida-
de eventos mutuamente exclusivos, A1 , A2 , . . . , An , ou seja des,
P (A B) = P (A|B)P (B).
P (A1 A2 An ) = P (A1 ) + P (A2 ) + + P (An ),
Esta e chamada probabilidade conjunta dos eventos A e B e tambem pode ser
se Ai Aj = , para todo i 6= j. escrita como P (A, B). P (A) e P (B) sao chamadas probabilidades marginais dos
A partir destes axiomas outras propriedades bastante uteis podem ser obtidas, eventos A e B.
por exemplo
1. P (A) = 1 P (A) onde A e o evento complementar de A. Exemplo 2.1 : Duas bolas sao retiradas ao acaso de uma urna contendo 2 bolas
brancas (B) e 3 vermelhas (V ), sem reposicao. Neste caso os possveis resultados
2. P (A A) = 1 e P () = 0. do experimento sao {BB, BV, V B, V V } e suas probabilidades sao,
Para dois eventos A e B, sendo que P (B) > 0, definimos a probabilidade condi- e isto tambem equivalente a dizer que
cional de A dado que B ocorreu como
P (A B) = P (A)P (B).
P (A B)
P (A|B) = .
P (B)
O conceito de independencia pode ser estendido a um numero qualquer de
Vale notar que todas as propriedades vistas anteriormente continuam validas
eventos, i.e.
para probabilidades condicionais. Por exemplo,
P (A1 Ak ) = P (A1 ) . . . P (Ak )
P (A | B) = 1 P (A | B). se somente se os eventos A1 , . . . , Ak forem independentes.
28 CAPITULO 2. PROBABILIDADES 2.4. TEOREMA DE BAYES 29
Suponha agora que os eventos A1 , A2 , . . . , Ak sao dois a dois mutuamente ex- Exemplo 2.2 : Um medico, ao examinar uma pessoa, desconfia que ela possa
clusivos e a uniao deles e o proprio espaco amostral. Em outras palavras, um ter uma certa doenca. Baseado na sua experiencia, ele assume que a probabilidade
destes eventos necessariamente ira ocorrer porem dois deles nao podem ocorrer do paciente ter a doenca e 0,7. Para aumentar sua quantidade de informacao
simultaneamente, sobre a doenca o medico aplica um teste que tem probabilidades 0,4 e 0,95 de dar
resultado positivo em pessoas sadias e pessoas doentes respectivamente. Sabendo
A1 A2 Ak = S e Ai Aj = , i 6= j. que o teste deu positivo como fica a probabilidade da pessoa ter a doenca?
Aqui o evento de interesse e A= o paciente tem a doenca e definimos o
Entao, qualquer outro evento B pode ser escrito como
evento B= teste deu resultado positivo. Assim,
B = (B A1 ) (B A2 ) (B Ak )
P (B|A) = 0, 40 e P (B|A) = 0, 95.
sendo que estes k eventos do lado direito tambem sao mutuamente exclusivos
E bem intuitivo que a probabilidade de doenca deve ter aumentado apos este
(verifique!). Alem disso, P (B Aj ) = P (B|Aj )P (Aj ), j = 1, . . . k e portanto
resultado e a questao aqui e quantificar este aumento. Usando o teorema de
podemos escrever que
Bayes segue que
P (B) = P (B A1 ) + P (B A2 ) + + P (B Ak ) P (B|A)P (A) (0, 95)(0, 7)
= P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + + P (B|Ak )P (Ak ) P (A|B) = = = 0, 847.
P (B|A)P (A) + P (B|A)P (A) (0, 95)(0, 7) + (0, 40)(0, 30)
Xk
= P (B|Aj )P (Aj ).
j=1 Exemplo 2.3 : No Exemplo 2.1 suponha que foram retiradas 2 bolas brancas
mas nao sabemos se as retiradas foram com ou sem reposicao. Definindo o evento
O fato e que em muitas aplicacoes conhecemos as probabilidades do lado
A=retiradas com reposicao gostariamos de calcular a probabilidade de A a luz
direito desta igualdade e estaremos interessados em calcular a probabilidade de
do resultado do experimento (B B). Suponha que antes do sorteio nao temos
um dos eventos Ai ocorrer dado que B ocorreu, isto e
informacao sobre o tipo de experimento (com ou sem reposicao) e atribuimos a
P (Ai B) P (B|Ai)P (Ai ) probabilidade a priori P (A) = 0, 5. Usando o Teorema de Bayes obtemos que
P (Ai|B) = = Pk .
P (B) j=1 P (B|Aj )P (Aj ) P (BB|A)P (A)
P (A|BB) =
Chamamos esta ultima igualdade de teorema de Bayes ou regra de Bayes, que nos P (BB|A)P (A) + P (BB|A)P (A)
mostra como atualizar a nossa crenca no evento Ai apos receber novas informacoes 0, 16 0, 5
= = 0, 615.
(i.e. que B ocorreu). 0, 16 0, 5 + 0, 1 0, 5
Assim, e mais provavel agora (a posteriori) que o experimento tenha sido com
P (Ai ) e a probabilidade a priori do evento Ai , porque antecede a informacao
reposicao.
sobre o evento B.
P (Ai |B) e a probabilidade a posteriori do evento Ai porque e calculada Em muitas situacoes podemos estar interessados em comparar probabilidades
apos termos informacao sobre B. a posteriori atraves da razao
P (Ai |B)
,
Para um valor especfico de B, P (B|Ai) e chamada funcao de verossimi- P (Aj |B)
lhanca de Ai . ou seja, quanto o evento Ai e mais provavel do que o evento Aj apos observar o
28 CAPITULO 2. PROBABILIDADES 2.4. TEOREMA DE BAYES 29
Suponha agora que os eventos A1 , A2 , . . . , Ak sao dois a dois mutuamente ex- Exemplo 2.2 : Um medico, ao examinar uma pessoa, desconfia que ela possa
clusivos e a uniao deles e o proprio espaco amostral. Em outras palavras, um ter uma certa doenca. Baseado na sua experiencia, ele assume que a probabilidade
destes eventos necessariamente ira ocorrer porem dois deles nao podem ocorrer do paciente ter a doenca e 0,7. Para aumentar sua quantidade de informacao
simultaneamente, sobre a doenca o medico aplica um teste que tem probabilidades 0,4 e 0,95 de dar
resultado positivo em pessoas sadias e pessoas doentes respectivamente. Sabendo
A1 A2 Ak = S e Ai Aj = , i 6= j. que o teste deu positivo como fica a probabilidade da pessoa ter a doenca?
Aqui o evento de interesse e A= o paciente tem a doenca e definimos o
Entao, qualquer outro evento B pode ser escrito como
evento B= teste deu resultado positivo. Assim,
B = (B A1 ) (B A2 ) (B Ak )
P (B|A) = 0, 40 e P (B|A) = 0, 95.
sendo que estes k eventos do lado direito tambem sao mutuamente exclusivos
E bem intuitivo que a probabilidade de doenca deve ter aumentado apos este
(verifique!). Alem disso, P (B Aj ) = P (B|Aj )P (Aj ), j = 1, . . . k e portanto
resultado e a questao aqui e quantificar este aumento. Usando o teorema de
podemos escrever que
Bayes segue que
P (B) = P (B A1 ) + P (B A2 ) + + P (B Ak ) P (B|A)P (A) (0, 95)(0, 7)
= P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + + P (B|Ak )P (Ak ) P (A|B) = = = 0, 847.
P (B|A)P (A) + P (B|A)P (A) (0, 95)(0, 7) + (0, 40)(0, 30)
Xk
= P (B|Aj )P (Aj ).
j=1 Exemplo 2.3 : No Exemplo 2.1 suponha que foram retiradas 2 bolas brancas
mas nao sabemos se as retiradas foram com ou sem reposicao. Definindo o evento
O fato e que em muitas aplicacoes conhecemos as probabilidades do lado
A=retiradas com reposicao gostariamos de calcular a probabilidade de A a luz
direito desta igualdade e estaremos interessados em calcular a probabilidade de
do resultado do experimento (B B). Suponha que antes do sorteio nao temos
um dos eventos Ai ocorrer dado que B ocorreu, isto e
informacao sobre o tipo de experimento (com ou sem reposicao) e atribuimos a
P (Ai B) P (B|Ai)P (Ai ) probabilidade a priori P (A) = 0, 5. Usando o Teorema de Bayes obtemos que
P (Ai|B) = = Pk .
P (B) j=1 P (B|Aj )P (Aj ) P (BB|A)P (A)
P (A|BB) =
Chamamos esta ultima igualdade de teorema de Bayes ou regra de Bayes, que nos P (BB|A)P (A) + P (BB|A)P (A)
mostra como atualizar a nossa crenca no evento Ai apos receber novas informacoes 0, 16 0, 5
= = 0, 615.
(i.e. que B ocorreu). 0, 16 0, 5 + 0, 1 0, 5
Assim, e mais provavel agora (a posteriori) que o experimento tenha sido com
P (Ai ) e a probabilidade a priori do evento Ai , porque antecede a informacao
reposicao.
sobre o evento B.
P (Ai |B) e a probabilidade a posteriori do evento Ai porque e calculada Em muitas situacoes podemos estar interessados em comparar probabilidades
apos termos informacao sobre B. a posteriori atraves da razao
P (Ai |B)
,
Para um valor especfico de B, P (B|Ai) e chamada funcao de verossimi- P (Aj |B)
lhanca de Ai . ou seja, quanto o evento Ai e mais provavel do que o evento Aj apos observar o
30 CAPITULO 2. PROBABILIDADES 2.5. PROBLEMAS 31
Agora calcule as probabilidades dos eventos acima. 8. Dois eventos independentes A e B sao tais que P (A) = 0, 4, P (B) = p e
P (A B) = 0, 7. Para que valores de p os eventos serao:
4. Suponha que 300 estudantes de uma universidade foram classificados o sexo
e sua area de estudo. Obteve-se a distribuicao de frequencias abaixo. (a) mutuamente exclusivos,
Se um estudante for selecionado ao acaso calcule, (b) independentes.
30 CAPITULO 2. PROBABILIDADES 2.5. PROBLEMAS 31
Agora calcule as probabilidades dos eventos acima. 8. Dois eventos independentes A e B sao tais que P (A) = 0, 4, P (B) = p e
P (A B) = 0, 7. Para que valores de p os eventos serao:
4. Suponha que 300 estudantes de uma universidade foram classificados o sexo
e sua area de estudo. Obteve-se a distribuicao de frequencias abaixo. (a) mutuamente exclusivos,
Se um estudante for selecionado ao acaso calcule, (b) independentes.
32 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 33
9. Duas maquinas operam de forma independente em uma linha de producao. 15. Um componente eletronico esta sendo testado e sabe-se que ele pode ter
Em um perodo de 8 horas as probabilidades de que cada uma delas apre- sido produzido por maquinas do tipo I, II ou III com probabilidades 0,35,
sente defeito sao 1/3 e 1/4. Qual a probabilidade de que pelo menos uma 0,25 e 0,40 respectivamente. Sabe-se tambem que as probabilidades deste
das maquinas apresente defeito neste perodo? componente ser defeituoso sao 0,01, 0,02 e 0,03 respectivamente para cada
tipo de maquina. Calcule a probabilidade deste componente eletronico
10. Um dado e viciado de tal forma que a probabilidade de sair uma face e
proporcional ao seu valor, i.e. P (face x) x. Calcular: (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Qual a probabilidade deste componente eletronico nao ter sido fabri-
(a) A probabilidade de sair 5, sabendo-se que a face que saiu e mpar.
cada por uma maquina do tipo I?
(b) A probabilidade de sair um numero par, sabendo-se que saiu um
(c) Qual a probabilidade dele ser defeituoso?
numero maior que 3.
(d) Qual a probabilidade dele ter sido fabricado por uma maquina do tipo
11. Expresse as seguintes afirmacoes em termos de operacoes entre eventos. II sabendo-se que e defeituoso?
(a) A ocorre mas B nao ocorre. 16. Uma empresa de credito precisa saber como a inadimplencia esta distribuda
(b) Exatamente um dos eventos A e B ocorre. entre seus clentes. Sabe-se que um cliente pode pertencer a uma de 4 clas-
ses distintas com probabilidades 0,50, 0,20, 0,20 e 0,10 respectivamente.
(c) Nenhum dos dois eventos ocorre. Para cada uma destas classes as probabilidade de um cliente estar inadim-
(d) No maximo um deles ocorre. plente sao 0,30, 0,10, 0,05 e 0,05 respectivamente. Um cliente e sorteado
aleatoriamente.
12. Se A e B sao eventos independentes mostre que tambem sao independentes
A e B, A e B, A e B. (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Calcule a probabilidade de pertencer as classes A ou B.
13. Se A, B e C sao eventos independentes verifique se
(c) Calcule a probabilidade de estar inadimplente e pertencer a classe A.
(a) A e B C sao independentes,
(d) Qual a probabilidade dele estar inadimplente ?
(b) A B e A C sao independentes. (e) Sabendo que ele esta inadimplente, qual a probabilidade dele pertencer
14. Um medico, ao examinar uma pessoa, desconfia que ela possa ter uma a classe B?
certa doenca e assume que a probabilidade do paciente ter a doenca e 0,7. 17. Sejam duas moedas, uma honesta e a outra com 2 caras. Uma destas
Para aumentar sua quantidade de informacao o medico aplica um teste, que moedas foi sorteada e lancada.
da resultado positivo em 40% das pessoas sadias e em 95% das pessoas com
esta doenca. (a) Se o resultado foi cara, qual a probabilidade de ter sido usada a moeda
honesta?
(a) Qual a probabilidade do teste dar resultado positivo?
(b) A moeda selecionada foi lancada novamente e o resultado foi cara.
(b) Sabendo-se que o teste deu resultado positivo qual a probabilidade Qual a probabilidade de ser a moeda honesta?
desta pessoa estar doente?
(c) Foi aplicado um segundo teste que da resultado positivo com pro-
2.6 Algumas distribuicoes de probabilidade
babilidades 0,04 e 0,98 em pessoas sadias e doentes respectivamente.
Calcule a probabilidade deste teste dar positivo e a probabilidade de Nesta secao estudaremos alguns modelos teoricos que se adequam a uma serie
doenca sabendo que ele deu negativo. de problemas praticos. Veremos que estes modelos envolvem parametros cujo
32 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 33
9. Duas maquinas operam de forma independente em uma linha de producao. 15. Um componente eletronico esta sendo testado e sabe-se que ele pode ter
Em um perodo de 8 horas as probabilidades de que cada uma delas apre- sido produzido por maquinas do tipo I, II ou III com probabilidades 0,35,
sente defeito sao 1/3 e 1/4. Qual a probabilidade de que pelo menos uma 0,25 e 0,40 respectivamente. Sabe-se tambem que as probabilidades deste
das maquinas apresente defeito neste perodo? componente ser defeituoso sao 0,01, 0,02 e 0,03 respectivamente para cada
tipo de maquina. Calcule a probabilidade deste componente eletronico
10. Um dado e viciado de tal forma que a probabilidade de sair uma face e
proporcional ao seu valor, i.e. P (face x) x. Calcular: (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Qual a probabilidade deste componente eletronico nao ter sido fabri-
(a) A probabilidade de sair 5, sabendo-se que a face que saiu e mpar.
cada por uma maquina do tipo I?
(b) A probabilidade de sair um numero par, sabendo-se que saiu um
(c) Qual a probabilidade dele ser defeituoso?
numero maior que 3.
(d) Qual a probabilidade dele ter sido fabricado por uma maquina do tipo
11. Expresse as seguintes afirmacoes em termos de operacoes entre eventos. II sabendo-se que e defeituoso?
(a) A ocorre mas B nao ocorre. 16. Uma empresa de credito precisa saber como a inadimplencia esta distribuda
(b) Exatamente um dos eventos A e B ocorre. entre seus clentes. Sabe-se que um cliente pode pertencer a uma de 4 clas-
ses distintas com probabilidades 0,50, 0,20, 0,20 e 0,10 respectivamente.
(c) Nenhum dos dois eventos ocorre. Para cada uma destas classes as probabilidade de um cliente estar inadim-
(d) No maximo um deles ocorre. plente sao 0,30, 0,10, 0,05 e 0,05 respectivamente. Um cliente e sorteado
aleatoriamente.
12. Se A e B sao eventos independentes mostre que tambem sao independentes
A e B, A e B, A e B. (a) Defina os eventos e enumere as probabilidades fornecidas no problema.
(b) Calcule a probabilidade de pertencer as classes A ou B.
13. Se A, B e C sao eventos independentes verifique se
(c) Calcule a probabilidade de estar inadimplente e pertencer a classe A.
(a) A e B C sao independentes,
(d) Qual a probabilidade dele estar inadimplente ?
(b) A B e A C sao independentes. (e) Sabendo que ele esta inadimplente, qual a probabilidade dele pertencer
14. Um medico, ao examinar uma pessoa, desconfia que ela possa ter uma a classe B?
certa doenca e assume que a probabilidade do paciente ter a doenca e 0,7. 17. Sejam duas moedas, uma honesta e a outra com 2 caras. Uma destas
Para aumentar sua quantidade de informacao o medico aplica um teste, que moedas foi sorteada e lancada.
da resultado positivo em 40% das pessoas sadias e em 95% das pessoas com
esta doenca. (a) Se o resultado foi cara, qual a probabilidade de ter sido usada a moeda
honesta?
(a) Qual a probabilidade do teste dar resultado positivo?
(b) A moeda selecionada foi lancada novamente e o resultado foi cara.
(b) Sabendo-se que o teste deu resultado positivo qual a probabilidade Qual a probabilidade de ser a moeda honesta?
desta pessoa estar doente?
(c) Foi aplicado um segundo teste que da resultado positivo com pro-
2.6 Algumas distribuicoes de probabilidade
babilidades 0,04 e 0,98 em pessoas sadias e doentes respectivamente.
Calcule a probabilidade deste teste dar positivo e a probabilidade de Nesta secao estudaremos alguns modelos teoricos que se adequam a uma serie
doenca sabendo que ele deu negativo. de problemas praticos. Veremos que estes modelos envolvem parametros cujo
34 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 35
conhecimento e necessario para calcular probabilidades. Vale notar que na maio- Dizemos que X tem distribuicao de Bernoulli com parametro p ou equivalente-
ria dos problemas reais estes parametros serao desconhecidos e sera preciso fazer mente X Bernoulli(p), 0 < p < 1.
algum tipo de inferencia sobre eles, e este assunto sera abordado no proximo
captulo. Por enquanto vamos assumir que estes parametros sao conhecidos e nos Suponha agora que n experimentos (ou ensaios) independentes, sao executa-
concentrar nas principais caractersticas dos modelos apresentados. dos, onde n e um numero fixo, e que cada experimento resulta num sucesso com
probabilidade p ou numa falha com probabilidade 1 p. Ou seja, o experimento
consiste na observacao das v.a. X1 , . . . , Xn onde Xi Bernoulli(p), i = 1, . . . , n.
2.6.1 A distribuicao Uniforme Discreta
Frequentemente estaremos interessados no numero total de sucessos obtidos,
Suponha um experimento com um numero finito de possveis resultados e cada um independente da ordem em que eles ocorrem. Por exemplo, uma moeda e lancada
deles com a mesma probabilidade de ocorrer. Definindo uma variavel aleatoria 10 vezes e o numero total de caras e contado (aqui cara e um sucesso).
(v.a) X cujos possveis valores {x1 , . . . , xk } estao associados aos resultados deste Pn
experimento, entao O numero total de sucessos, Y = i=1 Xi , cujos possveis valores sao
1 0, 1, . . . , n e uma variavel aleatoria com distribuicao binomial com parametros
P (X = xi ) = , i = 1, . . . , k.
k n e p, ou Y Binomial(n, p). As probabilidades de cada um destes possveis
P valores sao dadas por
O valor medio (ou valor esperado) e E(X) = (1/k) ki=1 xi e sua variancia e
k k n k
1X 1X 2 P (Y = k) = p (1 p)nk , k = 0, 1, . . . , n (2.1)
V ar(X) = [xi E(X)]2 = [ x kE(X)2 ] k
k i=1 k i=1 i
sendo
n n!
=
2.6.2 A distribuicao Binomial k k!(n k)!
Q
e m! = m i=1 i e o fatorial de m (define-se 0! = 1). Alem disso, o numero medio (ou
Em muitos experimentos os possveis resultados apresentam ou nao uma deter-
esperado) de sucessos e E(Y ) = np e a variancia e V ar(Y ) = np(1p). Na Figura
minada caracterstica. Esta caracterstica sera muitas vezes determinada pelo
2.1 estao representadas graficamente distribuicoes Binomiais com probabilidades
pesquisador dependendo dos objetivos do experimento. Por exemplo, se uma
de sucesso p=0,2, 0,5, 0,7 e 0,9. Note como a distribuicao e simetrica em torno
pessoa for escolhida ao acaso dentre 1000 podemos estar interessados apenas se
da media quando p = 1/2 e e assimetrica para os outros valores de p.
ela e do sexo masculino ou nao. Neste tipo de experimento estaremos interessados
na ocorrencia de um sucesso ou falha e esta terminologia sera utilizada daqui em
diante. E usual denotar a probabilidade de sucesso por p, isto e P (sucesso) = p Exemplo 2.4 : Em uma linha de montagem estima-se que a proporcao de itens
e portanto P (fracasso) = 1 p. defeituosos e aproximadamente 0,1. Se esta proporcao e (aproximadamente) cons-
Podemos definir uma variavel aleatoria (v.a) X como a variavel indicadora de tante ao longo do processo e 20 itens sao selecionados de forma independente
sucesso em um experimento binario, i.e. entao o numero medio ou esperado de defeituosos e 2 com variancia 1,8 itens2 .
Definindo a v.a. Y : numero de itens defeituosos podemos calcular por exemplo
1, se ocorre sucesso
X= a probabilidade de no maximo 2 itens defeituosos como
0, se ocorre fracasso
P (Y 2) = P (Y = 0) + P (Y = 1) + P (Y = 2)
e a probabilidade de X assumir cada um dos seus possveis valores e
20 20 20
= 0, 10 0, 920 + 0, 11 0, 919 + 0, 12 0, 918
px (1 p)1x se x = 0, 1 0 1 2
P (X = x) = = 0, 1216 + 0, 2702 + 0, 2852 = 0, 677.
0 caso contrario.
34 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 35
conhecimento e necessario para calcular probabilidades. Vale notar que na maio- Dizemos que X tem distribuicao de Bernoulli com parametro p ou equivalente-
ria dos problemas reais estes parametros serao desconhecidos e sera preciso fazer mente X Bernoulli(p), 0 < p < 1.
algum tipo de inferencia sobre eles, e este assunto sera abordado no proximo
captulo. Por enquanto vamos assumir que estes parametros sao conhecidos e nos Suponha agora que n experimentos (ou ensaios) independentes, sao executa-
concentrar nas principais caractersticas dos modelos apresentados. dos, onde n e um numero fixo, e que cada experimento resulta num sucesso com
probabilidade p ou numa falha com probabilidade 1 p. Ou seja, o experimento
consiste na observacao das v.a. X1 , . . . , Xn onde Xi Bernoulli(p), i = 1, . . . , n.
2.6.1 A distribuicao Uniforme Discreta
Frequentemente estaremos interessados no numero total de sucessos obtidos,
Suponha um experimento com um numero finito de possveis resultados e cada um independente da ordem em que eles ocorrem. Por exemplo, uma moeda e lancada
deles com a mesma probabilidade de ocorrer. Definindo uma variavel aleatoria 10 vezes e o numero total de caras e contado (aqui cara e um sucesso).
(v.a) X cujos possveis valores {x1 , . . . , xk } estao associados aos resultados deste Pn
experimento, entao O numero total de sucessos, Y = i=1 Xi , cujos possveis valores sao
1 0, 1, . . . , n e uma variavel aleatoria com distribuicao binomial com parametros
P (X = xi ) = , i = 1, . . . , k.
k n e p, ou Y Binomial(n, p). As probabilidades de cada um destes possveis
P valores sao dadas por
O valor medio (ou valor esperado) e E(X) = (1/k) ki=1 xi e sua variancia e
k k n k
1X 1X 2 P (Y = k) = p (1 p)nk , k = 0, 1, . . . , n (2.1)
V ar(X) = [xi E(X)]2 = [ x kE(X)2 ] k
k i=1 k i=1 i
sendo
n n!
=
2.6.2 A distribuicao Binomial k k!(n k)!
Q
e m! = m i=1 i e o fatorial de m (define-se 0! = 1). Alem disso, o numero medio (ou
Em muitos experimentos os possveis resultados apresentam ou nao uma deter-
esperado) de sucessos e E(Y ) = np e a variancia e V ar(Y ) = np(1p). Na Figura
minada caracterstica. Esta caracterstica sera muitas vezes determinada pelo
2.1 estao representadas graficamente distribuicoes Binomiais com probabilidades
pesquisador dependendo dos objetivos do experimento. Por exemplo, se uma
de sucesso p=0,2, 0,5, 0,7 e 0,9. Note como a distribuicao e simetrica em torno
pessoa for escolhida ao acaso dentre 1000 podemos estar interessados apenas se
da media quando p = 1/2 e e assimetrica para os outros valores de p.
ela e do sexo masculino ou nao. Neste tipo de experimento estaremos interessados
na ocorrencia de um sucesso ou falha e esta terminologia sera utilizada daqui em
diante. E usual denotar a probabilidade de sucesso por p, isto e P (sucesso) = p Exemplo 2.4 : Em uma linha de montagem estima-se que a proporcao de itens
e portanto P (fracasso) = 1 p. defeituosos e aproximadamente 0,1. Se esta proporcao e (aproximadamente) cons-
Podemos definir uma variavel aleatoria (v.a) X como a variavel indicadora de tante ao longo do processo e 20 itens sao selecionados de forma independente
sucesso em um experimento binario, i.e. entao o numero medio ou esperado de defeituosos e 2 com variancia 1,8 itens2 .
Definindo a v.a. Y : numero de itens defeituosos podemos calcular por exemplo
1, se ocorre sucesso
X= a probabilidade de no maximo 2 itens defeituosos como
0, se ocorre fracasso
P (Y 2) = P (Y = 0) + P (Y = 1) + P (Y = 2)
e a probabilidade de X assumir cada um dos seus possveis valores e
20 20 20
= 0, 10 0, 920 + 0, 11 0, 919 + 0, 12 0, 918
px (1 p)1x se x = 0, 1 0 1 2
P (X = x) = = 0, 1216 + 0, 2702 + 0, 2852 = 0, 677.
0 caso contrario.
36 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 37
2.6.3 A distribuicao de Poisson tempo. Portanto, para 10 intervalos a probabilidade sera 0, 676710 = 0, 0201.
2.6.3 A distribuicao de Poisson tempo. Portanto, para 10 intervalos a probabilidade sera 0, 676710 = 0, 0201.
2.6.4 Distribuicao Geometrica para um conjunto A qualquer. Para distribuicoes discretas de probabilidade
tambem e sempre possvel mostrar que
A distribuicao geometrica tambem esta relacionada a experimentos dicotomicos X
P (X = k) = 1.
realizados de forma independente e com a mesma probabilidade de sucesso. O
k
evento de interesse neste caso e o numero de experimentos X necessarios para a
ocorrencia do primeiro sucesso. Por exemplo o numero de inspecoes necessarias As definicoes de valor esperado (ou valor medio) e variancia tambem podem
ate encontrar-se um item defeituoso em um lote. ser generalizados para qualquer v.a. discreta X. Usaremos a seguinte notacao,
A probabilidade de que exatamente k experimentos sejam necessarios ate a X
E(X) = X = kP (X = k)
ocorrencia do primeiro sucesso e dada por
k
X
2
P (X = k) = (1 p) k1
p, k = 1, 2, . . . . V ar(X) = X = P (X = k) (k X )2
k
Tambem pode-se mostrar que o numero medio de repeticoes do experimento para valor medio e variancia respectivamente. O equivalente teorico ao conceito
ate ocorrer o primeiro sucesso e E(X) = (1 p)/p e a variancia e V ar(X) = de frequencias acumuladas vistas no Captulo 1 e a funcao de distribuicao acu-
(1 p)/p2 = E(X)/p. Ou seja, quanto menor a probabilidade de sucesso menor mulada ou simplesmente funcao de distribuicao definida como,
sera o numero esperado de repeticoes para que ele ocorra. X
F (x) = P (X x) = P (X = k), x R
kx
Exemplo 2.7 : Um motorista ve uma vaga de estacionamento em uma rua. Ha
cinco carros na frente dele, e cada um deles tem probabilidade 0,2 de tomar a vaga.
Qual a probabilidade de a vaga ser tomada pelo carro que esta imediatamente a Exemplo 2.8 : Em um experimento 5 pecas foram inspecionadas e a v.a. X
frente dele? representa o numero de pecas defeituosas com a seguinte distribuicao de proba-
Neste caso, podemos definir a v.a. X como o numero de carros que pas- bilidades
sam pela vaga ate que ela seja tomada (este e o evento definido como sucesso).
Assume-se tambem que cada motorista toma a vaga ou nao de forma indepen- x 0 1 2 3 4 5
dente. Ou seja queremos calcular P (X = x) 0,35 0,45 0,1 0,05 0,04 0,01
P (X = 5) = (0, 8)4 0, 2 = 0, 082. Neste caso podemos calcular o numero medio de defeituosos e a variancia
como
E(X) = 0 0, 35 + 1 0, 45 + 2 0, 1 + 3 0, 05 + 4 0, 04 + 5 0, 01 1 peca
Os modelos vistos ate agora sao chamados distribuicoes de probabilidade dis- + (4 1)2 0, 04 + (5 1)2 0, 01 0, 9 pecas2
cretas ja que a v.a. associada assume valores em um conjunto finito ou infinito
enumeravel. Neste caso, probabilidades sao calculadas como somas, i.e.
Exemplo 2.9 : Um empresario vai abrir uma nova filial de sua empresa. Com
X base na experiencia sobre outras filiais e outras empresas do ramo o lucro foi
P (X A) = P (X = k),
kA
representado como uma v.a. discreta com a distribuicao abaixo.
38 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 39
2.6.4 Distribuicao Geometrica para um conjunto A qualquer. Para distribuicoes discretas de probabilidade
tambem e sempre possvel mostrar que
A distribuicao geometrica tambem esta relacionada a experimentos dicotomicos X
P (X = k) = 1.
realizados de forma independente e com a mesma probabilidade de sucesso. O
k
evento de interesse neste caso e o numero de experimentos X necessarios para a
ocorrencia do primeiro sucesso. Por exemplo o numero de inspecoes necessarias As definicoes de valor esperado (ou valor medio) e variancia tambem podem
ate encontrar-se um item defeituoso em um lote. ser generalizados para qualquer v.a. discreta X. Usaremos a seguinte notacao,
A probabilidade de que exatamente k experimentos sejam necessarios ate a X
E(X) = X = kP (X = k)
ocorrencia do primeiro sucesso e dada por
k
X
2
P (X = k) = (1 p) k1
p, k = 1, 2, . . . . V ar(X) = X = P (X = k) (k X )2
k
Tambem pode-se mostrar que o numero medio de repeticoes do experimento para valor medio e variancia respectivamente. O equivalente teorico ao conceito
ate ocorrer o primeiro sucesso e E(X) = (1 p)/p e a variancia e V ar(X) = de frequencias acumuladas vistas no Captulo 1 e a funcao de distribuicao acu-
(1 p)/p2 = E(X)/p. Ou seja, quanto menor a probabilidade de sucesso menor mulada ou simplesmente funcao de distribuicao definida como,
sera o numero esperado de repeticoes para que ele ocorra. X
F (x) = P (X x) = P (X = k), x R
kx
Exemplo 2.7 : Um motorista ve uma vaga de estacionamento em uma rua. Ha
cinco carros na frente dele, e cada um deles tem probabilidade 0,2 de tomar a vaga.
Qual a probabilidade de a vaga ser tomada pelo carro que esta imediatamente a Exemplo 2.8 : Em um experimento 5 pecas foram inspecionadas e a v.a. X
frente dele? representa o numero de pecas defeituosas com a seguinte distribuicao de proba-
Neste caso, podemos definir a v.a. X como o numero de carros que pas- bilidades
sam pela vaga ate que ela seja tomada (este e o evento definido como sucesso).
Assume-se tambem que cada motorista toma a vaga ou nao de forma indepen- x 0 1 2 3 4 5
dente. Ou seja queremos calcular P (X = x) 0,35 0,45 0,1 0,05 0,04 0,01
P (X = 5) = (0, 8)4 0, 2 = 0, 082. Neste caso podemos calcular o numero medio de defeituosos e a variancia
como
E(X) = 0 0, 35 + 1 0, 45 + 2 0, 1 + 3 0, 05 + 4 0, 04 + 5 0, 01 1 peca
Os modelos vistos ate agora sao chamados distribuicoes de probabilidade dis- + (4 1)2 0, 04 + (5 1)2 0, 01 0, 9 pecas2
cretas ja que a v.a. associada assume valores em um conjunto finito ou infinito
enumeravel. Neste caso, probabilidades sao calculadas como somas, i.e.
Exemplo 2.9 : Um empresario vai abrir uma nova filial de sua empresa. Com
X base na experiencia sobre outras filiais e outras empresas do ramo o lucro foi
P (X A) = P (X = k),
kA
representado como uma v.a. discreta com a distribuicao abaixo.
40 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 41
lucro -100 0 50 100 200 Esta distribuicao e apropriada para modelar variaveis aleatorias contnuas,
P (lucro = k) 0,05 0,05 0,30 0,50 0,10 que assumem valores em algum subconjunto dos numeros reais. Neste caso, so
faz sentido falar na probabilidade da variavel pertencer a um certo intervalo [a, b]
E(Lucro) = 1000, 05 + 00, 05 + 500, 30 + 1000, 50 + 2000, 10 = 80. que e dada pela area sob a curva e dentro deste intervalo.
A seguir estudaremos distribuicoes de probabilidade chamadas contnuas A equacao da curva normal e especificada usando dois parametros: a media
quando a v.a. associada assume valores no conjunto dos numeros reais. , e o desvio padrao , ou equivalentemente a variancia 2 . Denotamos N(, 2 )
a curva normal com media e variancia 2 . A media refere-se ao centro da
distribuicao e o desvio padrao ao grau de espalhamento de curva. A distribuicao
2.6.6 A Distribuicao Uniforme Contnua normal e simetrica em torno da media o que implica que a media, a mediana e a
moda sao todas coincidentes. Para referencia, a equacao da curva e dada por
A forma mais simples de modelar um fenomeno aleatorio cujos valores ocorrem
no intervalo (a, b) da reta dos reais e atraves de uma v.a. X cuja probabilidade 1
(x )2
de pertencer a qualquer subintervalo de (a, b) seja proporcional ao comprimento f (x) = exp , R, 2 > 0. (2.3)
2 2 2 2
do subintervalo. Matematicamente, se (c, d) (a, b) entao
O importante e que se entenda como a curva e afetada pelos valores numericos
P (c X d) d c. de e . A forma da curva e mostrada na Figura 2.4 para alguns valores da media
e desvio padrao.
Isto significa que funcao de densidade de probabilidade de X deve ser escrita A area sob a curva normal (na verdade abaixo de qualquer funcao de densidade
como de probabilidade) e 1. Entao, para quaisquer dois valores especficos podemos
1
, axb determinar a proporcao de area sob a curva entre esses dois valores. Em particular
f (x) = ba
0, caso contrario para a distribuicao normal, a proporcao de valores localizados dentro de um, dois,
ou tres desvios padrao em torno da media sao:
Deste modo, P (c X d) = (d c)/(b a). Pode-se mostrar tambem que
Intervalo Proporcao
E(X) = (a + b)/2 e V ar(X) = (b a) /12. 2 1 68,3%
2 95,5%
3 99,7%
Exemplo 2.10 : Seja X uma v.a. com distribuicao uniforme no intervalo (-1,4). Um exemplo de como utilizar este resultado e o seguinte.
Entao a funcao de densidade de probabilidade de X e
Exemplo 2.11 : Suponha que os comprimentos de um particular tipo de peixe
1/5, 1 x 4 podem ser descritos por uma distribuicao normal, com media 140mm e desvio
f (x) =
0, caso contrario padrao 15mm. Neste caso, a proporcao dos peixes que tem comprimentos entre
110mm e 170mm, por exemplo, e a proporcao da area sob a curva normal entre
e tambem P (0 X 2) = 2/5.
110 e 170. Entao neste exemplo, cerca de 95% dos peixes tem comprimentos entre
110mm e 170mm. Em termos probabilsticos, se a variavel aleatoria X representa
2.6.7 A Distribuicao Normal o comprimento dos peixes e se um peixe for selecionado ao acaso entao
A distribuicao normal e a mais familiar das distribuicoes de probabilidade e P ( 2 < X < + 2) = P (110 < X < 170) = 0, 95.
tambem uma das mais importantes em Estatstica. Esta distribuicao e carac-
terizada por uma funcao de densidade de probabilidade cujo grafico tem uma
forma de sino como na Figura 2.3. Em geral as probabilidades sao obtidas calculando-se a integral definida da
40 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 41
lucro -100 0 50 100 200 Esta distribuicao e apropriada para modelar variaveis aleatorias contnuas,
P (lucro = k) 0,05 0,05 0,30 0,50 0,10 que assumem valores em algum subconjunto dos numeros reais. Neste caso, so
faz sentido falar na probabilidade da variavel pertencer a um certo intervalo [a, b]
E(Lucro) = 1000, 05 + 00, 05 + 500, 30 + 1000, 50 + 2000, 10 = 80. que e dada pela area sob a curva e dentro deste intervalo.
A seguir estudaremos distribuicoes de probabilidade chamadas contnuas A equacao da curva normal e especificada usando dois parametros: a media
quando a v.a. associada assume valores no conjunto dos numeros reais. , e o desvio padrao , ou equivalentemente a variancia 2 . Denotamos N(, 2 )
a curva normal com media e variancia 2 . A media refere-se ao centro da
distribuicao e o desvio padrao ao grau de espalhamento de curva. A distribuicao
2.6.6 A Distribuicao Uniforme Contnua normal e simetrica em torno da media o que implica que a media, a mediana e a
moda sao todas coincidentes. Para referencia, a equacao da curva e dada por
A forma mais simples de modelar um fenomeno aleatorio cujos valores ocorrem
no intervalo (a, b) da reta dos reais e atraves de uma v.a. X cuja probabilidade 1
(x )2
de pertencer a qualquer subintervalo de (a, b) seja proporcional ao comprimento f (x) = exp , R, 2 > 0. (2.3)
2 2 2 2
do subintervalo. Matematicamente, se (c, d) (a, b) entao
O importante e que se entenda como a curva e afetada pelos valores numericos
P (c X d) d c. de e . A forma da curva e mostrada na Figura 2.4 para alguns valores da media
e desvio padrao.
Isto significa que funcao de densidade de probabilidade de X deve ser escrita A area sob a curva normal (na verdade abaixo de qualquer funcao de densidade
como de probabilidade) e 1. Entao, para quaisquer dois valores especficos podemos
1
, axb determinar a proporcao de area sob a curva entre esses dois valores. Em particular
f (x) = ba
0, caso contrario para a distribuicao normal, a proporcao de valores localizados dentro de um, dois,
ou tres desvios padrao em torno da media sao:
Deste modo, P (c X d) = (d c)/(b a). Pode-se mostrar tambem que
Intervalo Proporcao
E(X) = (a + b)/2 e V ar(X) = (b a) /12. 2 1 68,3%
2 95,5%
3 99,7%
Exemplo 2.10 : Seja X uma v.a. com distribuicao uniforme no intervalo (-1,4). Um exemplo de como utilizar este resultado e o seguinte.
Entao a funcao de densidade de probabilidade de X e
Exemplo 2.11 : Suponha que os comprimentos de um particular tipo de peixe
1/5, 1 x 4 podem ser descritos por uma distribuicao normal, com media 140mm e desvio
f (x) =
0, caso contrario padrao 15mm. Neste caso, a proporcao dos peixes que tem comprimentos entre
110mm e 170mm, por exemplo, e a proporcao da area sob a curva normal entre
e tambem P (0 X 2) = 2/5.
110 e 170. Entao neste exemplo, cerca de 95% dos peixes tem comprimentos entre
110mm e 170mm. Em termos probabilsticos, se a variavel aleatoria X representa
2.6.7 A Distribuicao Normal o comprimento dos peixes e se um peixe for selecionado ao acaso entao
A distribuicao normal e a mais familiar das distribuicoes de probabilidade e P ( 2 < X < + 2) = P (110 < X < 170) = 0, 95.
tambem uma das mais importantes em Estatstica. Esta distribuicao e carac-
terizada por uma funcao de densidade de probabilidade cujo grafico tem uma
forma de sino como na Figura 2.3. Em geral as probabilidades sao obtidas calculando-se a integral definida da
42 CAPITULO 2. PROBABILIDADES 2.6. ALGUMAS DISTRIBUICOES DE PROBABILIDADE 43
Neste caso, P (X = x) = 0 e portanto segue que Frequentemente usada para modelar o tempo entre eventos que ocorrem a uma
taxa media constante. Se X e uma v.a. com distribuicao exponencial sua funcao
P (a < X < b) = P (a X < b) = P (a < X b) = P (a X b). de densidade de probabilidade tem a forma
Na pratica desejamos calcular probabilidades para diferentes valores de e f (x) = ex , x > 0, > 0, (2.5)
. Para isso, a variavel X cuja distribuicao e N(, 2 ) e transformada numa
sendo o parametro da distribuicao. Usamos a notacao X Exponencial().
forma padronizada Z com distribuicao N(0, 1) (distribuicao normal padrao) pois
Pode-se mostrar que o valor medio de X e 1/ e sua variancia e 1/2 . Probabi-
tal distribuicao e tabelada. A quantidade Z e dada por
lidades sao facilmente calculadas como
X Z b
Z= (2.4)
P (a < X < b) = ex dx = ea eb
a
Exemplo 2.12 : A concentracao de um poluente em agua liberada por uma Na Figura 2.5 estao representadas graficamente as funcoes de densidade (2.5)
fabrica tem distribuicao normal com media 8 ppm e desvio padrao 1,5 ppm. com =1, 2, e 0,5.
Qual a probabilidade, de que num dado dia, a concentracao do poluente exceda
o limite regulatorio de 10 ppm? Exemplo 2.13 : Em uma empresa os acidentes de trabalho ocorrem a uma taxa
media de 0,1 por dia. Seja T o tempo (em dias) ate a ocorrencia do primeiro
A solucao deste problema resume-se em determinar qual proporcao da dis-
acidente, entao T tem distribuicao exponencial com parametro = 0, 1. Assim,
tribuicao esta acima de 10 ppm. Assim, definindo a v.a. X como sendo a con-
o tempo medio ate ocorrer o primeiro acidente e igual a 10 dias (E(T )=10). A
centracao do poluente na agua segue que X N(9; 1, 52), e devemos calcular
probabilidade de nao haver acidentes em uma semana de trabalho (de 5 dias) e
P (X > 10). Usando a estatstica Z temos que
dada por Z
10 8 P (T > 5) = 0, 1e0,1t dt = e0,15 0, 607.
P (X > 10) = P Z > = P (Z > 1, 33) = 1 P (Z 1, 33)
1, 5 5
Neste caso, P (X = x) = 0 e portanto segue que Frequentemente usada para modelar o tempo entre eventos que ocorrem a uma
taxa media constante. Se X e uma v.a. com distribuicao exponencial sua funcao
P (a < X < b) = P (a X < b) = P (a < X b) = P (a X b). de densidade de probabilidade tem a forma
Na pratica desejamos calcular probabilidades para diferentes valores de e f (x) = ex , x > 0, > 0, (2.5)
. Para isso, a variavel X cuja distribuicao e N(, 2 ) e transformada numa
sendo o parametro da distribuicao. Usamos a notacao X Exponencial().
forma padronizada Z com distribuicao N(0, 1) (distribuicao normal padrao) pois
Pode-se mostrar que o valor medio de X e 1/ e sua variancia e 1/2 . Probabi-
tal distribuicao e tabelada. A quantidade Z e dada por
lidades sao facilmente calculadas como
X Z b
Z= (2.4)
P (a < X < b) = ex dx = ea eb
a
Exemplo 2.12 : A concentracao de um poluente em agua liberada por uma Na Figura 2.5 estao representadas graficamente as funcoes de densidade (2.5)
fabrica tem distribuicao normal com media 8 ppm e desvio padrao 1,5 ppm. com =1, 2, e 0,5.
Qual a probabilidade, de que num dado dia, a concentracao do poluente exceda
o limite regulatorio de 10 ppm? Exemplo 2.13 : Em uma empresa os acidentes de trabalho ocorrem a uma taxa
media de 0,1 por dia. Seja T o tempo (em dias) ate a ocorrencia do primeiro
A solucao deste problema resume-se em determinar qual proporcao da dis-
acidente, entao T tem distribuicao exponencial com parametro = 0, 1. Assim,
tribuicao esta acima de 10 ppm. Assim, definindo a v.a. X como sendo a con-
o tempo medio ate ocorrer o primeiro acidente e igual a 10 dias (E(T )=10). A
centracao do poluente na agua segue que X N(9; 1, 52), e devemos calcular
probabilidade de nao haver acidentes em uma semana de trabalho (de 5 dias) e
P (X > 10). Usando a estatstica Z temos que
dada por Z
10 8 P (T > 5) = 0, 1e0,1t dt = e0,15 0, 607.
P (X > 10) = P Z > = P (Z > 1, 33) = 1 P (Z 1, 33)
1, 5 5
para um conjunto A R qualquer. Tambem e sempre possvel mostrar que (a) Calcule P (X < 1, 8)
Z (b) Calcule P (X > 1, 5)
f (x)dx = 1.
(c) Calcule P (X < 2)
As definicoes de valor esperado (ou valor medio) e variancia tambem podem (d) Calcule P (1 < X < 1)
ser generalizados para qualquer v.a. contnua X, (e) Calcule a media e mediana de X
Z
E(X) = X = xf (x)dx
Z
2.7 Ajuste de Modelos Teoricos
2
V ar(X) = X = f (x) (x X )2 .
Um problema de grande importancia pratica e o ajuste de distribuicoes teoricas
as distribuicoes dos dados observados. Em outras palavras, queremos saber se
Neste caso a funcao de distribuicao acumulada e definida como
a distribuicao das frequencias observadas nos dados segue o padrao de algum
Z x
modelo teorico (normal, binomial, etc.). Nos exemplos a seguir veremos como
F (x) = P (X x) = f (t)dt, x R
fazer este ajuste.
2.6.10 Problemas Exemplo 2.14 : Em uma amostra de 100 lotes com 5 itens cada um, verificou-se
que o numero de itens defeituosos tem a seguinte distribuicao de frequencias,
1. Mostre que as funcoes abaixo sao funcoes de densidade de probabilidade e
determine o valor da constante k.
Tabela 2.1: Frequencias observadas para os dados de itens defeituosos.
(a) f (x) = kx2 para 0 < x < 4.
no de defeituosos 0 1 2 3 4 5 total
(b) f (x) = k(1 + 2x) para 0 < x < 2.
no de lotes 75 21 3 1 0 0 100
(c) f (x) = k exp(x) para x > 0.
para um conjunto A R qualquer. Tambem e sempre possvel mostrar que (a) Calcule P (X < 1, 8)
Z (b) Calcule P (X > 1, 5)
f (x)dx = 1.
(c) Calcule P (X < 2)
As definicoes de valor esperado (ou valor medio) e variancia tambem podem (d) Calcule P (1 < X < 1)
ser generalizados para qualquer v.a. contnua X, (e) Calcule a media e mediana de X
Z
E(X) = X = xf (x)dx
Z
2.7 Ajuste de Modelos Teoricos
2
V ar(X) = X = f (x) (x X )2 .
Um problema de grande importancia pratica e o ajuste de distribuicoes teoricas
as distribuicoes dos dados observados. Em outras palavras, queremos saber se
Neste caso a funcao de distribuicao acumulada e definida como
a distribuicao das frequencias observadas nos dados segue o padrao de algum
Z x
modelo teorico (normal, binomial, etc.). Nos exemplos a seguir veremos como
F (x) = P (X x) = f (t)dt, x R
fazer este ajuste.
2.6.10 Problemas Exemplo 2.14 : Em uma amostra de 100 lotes com 5 itens cada um, verificou-se
que o numero de itens defeituosos tem a seguinte distribuicao de frequencias,
1. Mostre que as funcoes abaixo sao funcoes de densidade de probabilidade e
determine o valor da constante k.
Tabela 2.1: Frequencias observadas para os dados de itens defeituosos.
(a) f (x) = kx2 para 0 < x < 4.
no de defeituosos 0 1 2 3 4 5 total
(b) f (x) = k(1 + 2x) para 0 < x < 2.
no de lotes 75 21 3 1 0 0 100
(c) f (x) = k exp(x) para x > 0.
Tabela 2.2: Frequencias ajustadas e observadas para os dados de itens defeituosos. Tabela 2.4: Frequencias ajustadas e observadas para os dados de defeitos por
item.
frequencias
no de defeituosos (k) P (X = k) ajustada observada frequencias
0 0,7339 73 75 no de defeitos (k) P (X = k) ajustada observada
1 0,2342 23 21 0 0,28 85 80
2 0,0299 3 3 1 0,36 107 122
3 0,0019 0 1 2 0,23 68 53
4 0,0001 0 0 3 0,09 28 31
5 0,0000 0 0 4 0,03 9 14
Tabela 2.2: Frequencias ajustadas e observadas para os dados de itens defeituosos. Tabela 2.4: Frequencias ajustadas e observadas para os dados de defeitos por
item.
frequencias
no de defeituosos (k) P (X = k) ajustada observada frequencias
0 0,7339 73 75 no de defeitos (k) P (X = k) ajustada observada
1 0,2342 23 21 0 0,28 85 80
2 0,0299 3 3 1 0,36 107 122
3 0,0019 0 1 2 0,23 68 53
4 0,0001 0 0 3 0,09 28 31
5 0,0000 0 0 4 0,03 9 14
2.8 Problemas (a) Indique um modelo apropriado para este experimento e diga quais as
hipoteses necessarias para que ele seja valido.
1. Suponha que a variavel aleatoria X possa assumir os seguintes valores -3,- (b) Assumindo que este modelo e valido, qual a probabilidade de que no
2,-1,0,1,2,3 com a mesma probabilidade. Determine distribuicao de proba- maximo 2 funcionarios nao aumentem sua produtividade ?
bilidades de Y = X 2 X.
(c) O que ocorre com o item anterior se a empresa enviar 100 funcionarios
2. Considere um modelo uniforme discreto para a v.a. X no conjunto ? (De uma solucao aproximada).
{1, 2, . . . , 10}. Calcule P (3 X < 7) e P (X 9|X 6). 8. A tabela abaixo representa uma distribuicao de frequencias para o numero
3. A probabilidade de um atirador acertar no alvo num unico tiro e 1/4. Se o de defeitos observados em certo tipo de componente eletronico.
atirador atira 20 vezes no alvo qual a probabilidade de acertar
no defeitos 1 2 3 4 5 6 7
(a) exatamente 5 vezes; frequencia 3 9 8 5 3 1 1
(b) pelo menos 3 vezes; (a) Voce diria que a distribuicao normal e adequada para modelar estes
(c) nenhuma vez; dados? (Justifique).
(d) no maximo 2 vezes. (b) Assumindo que o modelo de Poisson e apropriado calcule a proba-
bilidade de um componente escolhido ao acaso apresentar mais de 2
4. Um professor aplica um teste do tipo certo-errado com 20 questoes. Calcule defeitos.
a probabilidade de um aluno acertar mais de 80% das questoes supondo que
(c) Calcule a probabilidade de exatamente 2 dentre 5 componentes esco-
ele esta respondendo ao acaso.
lhidos ao acaso apresentarem no maximo 2 defeitos por componente.
5. O numero de partculas alfa emitidas por segundo em sedimentos radioati-
9. Uma pessoa a procura de emprego visita varias empresas ate conseguir ser
vos pode ser descrito por uma distribuicao Poisson com media 6.
admitida. A probabilidade de admissao e constante e igual a 0,3. Calcule o
(a) Qual a probabilidade de nao haver nenhuma partcula emitida num numero de empresas que devem ser visitadas para que a probabilidade de
dado segundo? conseguir uma vaga seja maior do que 0,70.
(b) Qual a probabilidade de pelo menos quatro partculas serem emitidas 10. Para a distribuicao Normal calcule a proporcao de valores localizados dentro
num segundo? de 1, 2 e 3 desvios padrao em torno da media utilizando a tabela apropriada.
48 CAPITULO 2. PROBABILIDADES 2.8. PROBLEMAS 49
2.8 Problemas (a) Indique um modelo apropriado para este experimento e diga quais as
hipoteses necessarias para que ele seja valido.
1. Suponha que a variavel aleatoria X possa assumir os seguintes valores -3,- (b) Assumindo que este modelo e valido, qual a probabilidade de que no
2,-1,0,1,2,3 com a mesma probabilidade. Determine distribuicao de proba- maximo 2 funcionarios nao aumentem sua produtividade ?
bilidades de Y = X 2 X.
(c) O que ocorre com o item anterior se a empresa enviar 100 funcionarios
2. Considere um modelo uniforme discreto para a v.a. X no conjunto ? (De uma solucao aproximada).
{1, 2, . . . , 10}. Calcule P (3 X < 7) e P (X 9|X 6). 8. A tabela abaixo representa uma distribuicao de frequencias para o numero
3. A probabilidade de um atirador acertar no alvo num unico tiro e 1/4. Se o de defeitos observados em certo tipo de componente eletronico.
atirador atira 20 vezes no alvo qual a probabilidade de acertar
no defeitos 1 2 3 4 5 6 7
(a) exatamente 5 vezes; frequencia 3 9 8 5 3 1 1
(b) pelo menos 3 vezes; (a) Voce diria que a distribuicao normal e adequada para modelar estes
(c) nenhuma vez; dados? (Justifique).
(d) no maximo 2 vezes. (b) Assumindo que o modelo de Poisson e apropriado calcule a proba-
bilidade de um componente escolhido ao acaso apresentar mais de 2
4. Um professor aplica um teste do tipo certo-errado com 20 questoes. Calcule defeitos.
a probabilidade de um aluno acertar mais de 80% das questoes supondo que
(c) Calcule a probabilidade de exatamente 2 dentre 5 componentes esco-
ele esta respondendo ao acaso.
lhidos ao acaso apresentarem no maximo 2 defeitos por componente.
5. O numero de partculas alfa emitidas por segundo em sedimentos radioati-
9. Uma pessoa a procura de emprego visita varias empresas ate conseguir ser
vos pode ser descrito por uma distribuicao Poisson com media 6.
admitida. A probabilidade de admissao e constante e igual a 0,3. Calcule o
(a) Qual a probabilidade de nao haver nenhuma partcula emitida num numero de empresas que devem ser visitadas para que a probabilidade de
dado segundo? conseguir uma vaga seja maior do que 0,70.
(b) Qual a probabilidade de pelo menos quatro partculas serem emitidas 10. Para a distribuicao Normal calcule a proporcao de valores localizados dentro
num segundo? de 1, 2 e 3 desvios padrao em torno da media utilizando a tabela apropriada.
50 CAPITULO 2. PROBABILIDADES 2.8. PROBLEMAS 51
11. A concentracao de cadmio em cinzas de um certo lixo radioativo tem dis- entre 5cm e 10cm. Sabe-se que o comprimento das pecas e uma variavel
tribuicao normal com media igual a 1 ppm e desvio padrao 0,72 ppm. Qual aleatoria com distribuicao normal de media 7,5 cm e variancia 20,0 cm2 .
a probabilidade de que uma amostra aleatoria das cinzas tenha uma con-
(a) Qual a proporcao esperada de lotes aceitos durante a inspecao.
centracao de cadmio entre 0,5 e 1,75 ppm?
(b) Quantas pecas devem ser retiradas aleatoriamente para que 82% dos
12. A idade dos assinantes de um jornal e uma variavel aleatoria com densidade lotes sejam aceitos.
normal com media 36 anos e desvio padrao 6 anos.
17. Em uma cidade, a duracao das conversas telefonicas em minutos, originarias
(a) Qual a probabilidade que um assinante escolhido aleatoriamente tenha de telefones publicos, segue o modelo exponencial com parametro 1/3.
entre 24 e 30 anos?
(a) Calcule a probabilidade de uma conversa telefonica durar mais do que
(b) Qual a faixa etaria dos 10% assinantes mais velhos?
o tempo medio da cidade.
13. O numero mensal de itens vendidos por uma empresa tem distribuicao (b) Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
aproximadamente normal com media 500 e desvio padrao 50. Se a em- a probabilidade do tempo medio amostral nao ultrapassar 4 minutos?
presa decide fabricar 600 unidades deste produto num certo mes, qual a
probabilidade de esgotar sua producao? 18. O tempo de duracao (em horas) de um componente eletronico tem dis-
tribuicao exponencial. Sabendo que o tempo de duracao medio e 1 hora
14. As alturas (em metros) de 1000 alunos de uma universidade tem distribuicao calcule,
aproximadamente normal com media 1,70 e desvio padrao 0,05.
(a) a probabilidade de que a duracao seja menor do que 10 h.
(a) Qual o numero esperado de alunos com alturas superiores a 1,68 metros (b) a probabilidade de que a duracao esteja entre 5 e 15 horas.
?
(c) o valor de t tal que a probabilidade da duracao ser maior do que t seja
(b) Que intervalos simetricos em torno da media conterao, aproximada- 0,01.
mente, 68% e 95% das alturas dos alunos?
15. Uma maquina produz pecas que cuja resistencia a pressao tem distribuicao
normal com desvio padrao igual a 10.
(a) Qual deve ser a resistencia media m para que 40% das pecas tenham
resistencia maior do que 20?
(b) Usando este valor de m calcule a probabilidade de que uma peca sele-
cionada ao acaso tenha resistencia superior a 15,5.
(c) Uma peca e defeituosa se sua resistencia se desvia mais de h unidades
da media. Calcule o intervalo m h tal que 12,6% das pecas sejam
defeituosas.
(d) Nas condicoes do item anterior qual deve ser o novo desvio padrao tal
que porcentagem de pecas defeituosas seja 1%.
11. A concentracao de cadmio em cinzas de um certo lixo radioativo tem dis- entre 5cm e 10cm. Sabe-se que o comprimento das pecas e uma variavel
tribuicao normal com media igual a 1 ppm e desvio padrao 0,72 ppm. Qual aleatoria com distribuicao normal de media 7,5 cm e variancia 20,0 cm2 .
a probabilidade de que uma amostra aleatoria das cinzas tenha uma con-
(a) Qual a proporcao esperada de lotes aceitos durante a inspecao.
centracao de cadmio entre 0,5 e 1,75 ppm?
(b) Quantas pecas devem ser retiradas aleatoriamente para que 82% dos
12. A idade dos assinantes de um jornal e uma variavel aleatoria com densidade lotes sejam aceitos.
normal com media 36 anos e desvio padrao 6 anos.
17. Em uma cidade, a duracao das conversas telefonicas em minutos, originarias
(a) Qual a probabilidade que um assinante escolhido aleatoriamente tenha de telefones publicos, segue o modelo exponencial com parametro 1/3.
entre 24 e 30 anos?
(a) Calcule a probabilidade de uma conversa telefonica durar mais do que
(b) Qual a faixa etaria dos 10% assinantes mais velhos?
o tempo medio da cidade.
13. O numero mensal de itens vendidos por uma empresa tem distribuicao (b) Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
aproximadamente normal com media 500 e desvio padrao 50. Se a em- a probabilidade do tempo medio amostral nao ultrapassar 4 minutos?
presa decide fabricar 600 unidades deste produto num certo mes, qual a
probabilidade de esgotar sua producao? 18. O tempo de duracao (em horas) de um componente eletronico tem dis-
tribuicao exponencial. Sabendo que o tempo de duracao medio e 1 hora
14. As alturas (em metros) de 1000 alunos de uma universidade tem distribuicao calcule,
aproximadamente normal com media 1,70 e desvio padrao 0,05.
(a) a probabilidade de que a duracao seja menor do que 10 h.
(a) Qual o numero esperado de alunos com alturas superiores a 1,68 metros (b) a probabilidade de que a duracao esteja entre 5 e 15 horas.
?
(c) o valor de t tal que a probabilidade da duracao ser maior do que t seja
(b) Que intervalos simetricos em torno da media conterao, aproximada- 0,01.
mente, 68% e 95% das alturas dos alunos?
15. Uma maquina produz pecas que cuja resistencia a pressao tem distribuicao
normal com desvio padrao igual a 10.
(a) Qual deve ser a resistencia media m para que 40% das pecas tenham
resistencia maior do que 20?
(b) Usando este valor de m calcule a probabilidade de que uma peca sele-
cionada ao acaso tenha resistencia superior a 15,5.
(c) Uma peca e defeituosa se sua resistencia se desvia mais de h unidades
da media. Calcule o intervalo m h tal que 12,6% das pecas sejam
defeituosas.
(d) Nas condicoes do item anterior qual deve ser o novo desvio padrao tal
que porcentagem de pecas defeituosas seja 1%.
Figura 2.1: Graficos das probabilidades (2.1) para p=0,2, 0,5, 0,7 e 0,9. Figura 2.2: Graficos das probabilidades (2.2) para = 1, 2, 5, 15.
p = 0.2 p = 0.5 =1 =2
0.20
0.25
0.15
0.3
0.20
0.15
0.10
0.15
0.2
0.10
0.10
0.05
0.1
0.05
0.05
0.00
0.00
0.00
0.0
0 5 10 15 20 0 5 10 15 20 0 2 4 6 8 10 0 2 4 6 8 10
p = 0.7 p = 0.9 =5 = 15
0.10
0.25
0.15
0.15
0.08
0.20
0.06
0.10
0.15
0.10
0.04
0.10
0.05
0.05
0.02
0.05
0.00
0.00
0.00
0.00
0 5 10 15 20 0 5 10 15 20 0 5 10 15 0 5 10 15 20 25 30
52 CAPITULO 2. PROBABILIDADES 2.8. PROBLEMAS 53
Figura 2.1: Graficos das probabilidades (2.1) para p=0,2, 0,5, 0,7 e 0,9. Figura 2.2: Graficos das probabilidades (2.2) para = 1, 2, 5, 15.
p = 0.2 p = 0.5 =1 =2
0.20
0.25
0.15
0.3
0.20
0.15
0.10
0.15
0.2
0.10
0.10
0.05
0.1
0.05
0.05
0.00
0.00
0.00
0.0
0 5 10 15 20 0 5 10 15 20 0 2 4 6 8 10 0 2 4 6 8 10
p = 0.7 p = 0.9 =5 = 15
0.10
0.25
0.15
0.15
0.08
0.20
0.06
0.10
0.15
0.10
0.04
0.10
0.05
0.05
0.02
0.05
0.00
0.00
0.00
0.00
0 5 10 15 20 0 5 10 15 20 0 5 10 15 0 5 10 15 20 25 30
54 CAPITULO 2. PROBABILIDADES 2.8. PROBLEMAS 55
0.4
0.3
0.2
f(x)
Figura 2.5: Graficos das funcoes de densidades (2.5) para =1,2, e 0,5.
0.1
1.0
0.0
0.8
-4 -2 0 2 4
x
0.6
=1
= 0.5
f (x )
=2
0.4
Figura 2.4: Graficos da curva normal para alguns valores de e .
0.2
0.8
N(6,.25)
0.0
0.6
0 2 4 6 8
x
N(0,1) N(3,1)
0.4
f(x)
0.2
N(6,4)
0.0
0 5 10
x
54 CAPITULO 2. PROBABILIDADES 2.8. PROBLEMAS 55
0.4
0.3
0.2
f(x)
Figura 2.5: Graficos das funcoes de densidades (2.5) para =1,2, e 0,5.
0.1
1.0
0.0
0.8
-4 -2 0 2 4
x
0.6
=1
= 0.5
f (x )
=2
0.4
Figura 2.4: Graficos da curva normal para alguns valores de e .
0.2
0.8
N(6,.25)
0.0
0.6
0 2 4 6 8
x
N(0,1) N(3,1)
0.4
f(x)
0.2
N(6,4)
0.0
0 5 10
x
3.2. PRINCIPIOS DE ESTIMACAO 57
Inferencia estatstica e o processo pelo qual podemos tirar conclusoes acerca de Exemplo 3.2 : Se X N(, 1), entao = { : < < }.
um conjunto maior (a populacao) usando informacao de um conjunto menor (a
amostra). Em estatstica, o termo populacao nao se refere necessariamente a Exemplo 3.3 : Se X N(, 2 ), entao = {(, 2 ) : < < , 2 > 0}.
pessoas, plantas, animais, etc. Ele poderia tambem se referir por exemplo a
fosseis, rochas e sedimentos num determinado local, itens produzidos em uma Podemos estimar o parametro usando a informacao de nossa amostra. Cha-
linha de montagem, etc. mamos este unico numero que representa o valor mais plausvel do parametro
A populacao se refere a todos os casos ou situacoes sobre as quais o pesqui- (baseado nos dados amostrais) de uma estimativa pontual de . Alguns exem-
sador quer fazer inferencias e assim a caraterizacao da populacao depende do plos sao a media amostral, o desvio padrao amostral, a mediana amostral, os
problema em estudo. Diferentes pesquisadores podem querer fazer inferencias quais estimam a verdadeira media, desvio padrao e mediana da populacao (que
acerca da concentracao de poluentes num determinado lencol freatico; predizer a sao desconhecidos). Os verdadeiros (e desconhecidos) valores populacionais sao
quantidade de petroleo num poco a ser perfurado, estimar o tempo de vida util chamados parametros.
de um componente eletronico e assim por diante. Definicao 3.1 Uma estatstica e uma funcao qualquer dos elementos que
Note que o investigador nao esta interessado em todos os aspectos da po- compoem a amostra e que nao depende do parametro desconhecido.
pulacao. O pesquisador pode nao estar interessado em estudar a concentracao
de todos os tipos de poluentes, somente alguns poluentes mais importantes para Estatsticas sao usualmente representadas por letras latinas, (por exemplo,
seu estudo. x para a media amostral, s para o desvio padrao amostral), enquanto que
Uma amostra e um subconjunto qualquer da populacao usado para obter parametros sao usualmente representados por letras gregas (por exemplo, para
informacao acerca do todo. Algumas razoes para se tomar uma amostra ao inves a media populacional, para o desvio padrao populacional).
de usar a populacao toda sao as seguintes, E claro que a medida que a amostra aumenta, mais informacao nos teremos
acerca da populacao de interesse, e portanto mais precisas serao as estimativas
custo alto para obter informacao da populacao toda, dos parametros de interesse.
tempo muito longo para obter informacao da populacao toda, Definicao 3.2 Qualquer estatstica que assume valores em e denominada um
estimador para .
algumas vezes impossvel, por exemplo, estudo de poluicao atmosferica
56
3.2. PRINCIPIOS DE ESTIMACAO 57
Inferencia estatstica e o processo pelo qual podemos tirar conclusoes acerca de Exemplo 3.2 : Se X N(, 1), entao = { : < < }.
um conjunto maior (a populacao) usando informacao de um conjunto menor (a
amostra). Em estatstica, o termo populacao nao se refere necessariamente a Exemplo 3.3 : Se X N(, 2 ), entao = {(, 2 ) : < < , 2 > 0}.
pessoas, plantas, animais, etc. Ele poderia tambem se referir por exemplo a
fosseis, rochas e sedimentos num determinado local, itens produzidos em uma Podemos estimar o parametro usando a informacao de nossa amostra. Cha-
linha de montagem, etc. mamos este unico numero que representa o valor mais plausvel do parametro
A populacao se refere a todos os casos ou situacoes sobre as quais o pesqui- (baseado nos dados amostrais) de uma estimativa pontual de . Alguns exem-
sador quer fazer inferencias e assim a caraterizacao da populacao depende do plos sao a media amostral, o desvio padrao amostral, a mediana amostral, os
problema em estudo. Diferentes pesquisadores podem querer fazer inferencias quais estimam a verdadeira media, desvio padrao e mediana da populacao (que
acerca da concentracao de poluentes num determinado lencol freatico; predizer a sao desconhecidos). Os verdadeiros (e desconhecidos) valores populacionais sao
quantidade de petroleo num poco a ser perfurado, estimar o tempo de vida util chamados parametros.
de um componente eletronico e assim por diante. Definicao 3.1 Uma estatstica e uma funcao qualquer dos elementos que
Note que o investigador nao esta interessado em todos os aspectos da po- compoem a amostra e que nao depende do parametro desconhecido.
pulacao. O pesquisador pode nao estar interessado em estudar a concentracao
de todos os tipos de poluentes, somente alguns poluentes mais importantes para Estatsticas sao usualmente representadas por letras latinas, (por exemplo,
seu estudo. x para a media amostral, s para o desvio padrao amostral), enquanto que
Uma amostra e um subconjunto qualquer da populacao usado para obter parametros sao usualmente representados por letras gregas (por exemplo, para
informacao acerca do todo. Algumas razoes para se tomar uma amostra ao inves a media populacional, para o desvio padrao populacional).
de usar a populacao toda sao as seguintes, E claro que a medida que a amostra aumenta, mais informacao nos teremos
acerca da populacao de interesse, e portanto mais precisas serao as estimativas
custo alto para obter informacao da populacao toda, dos parametros de interesse.
tempo muito longo para obter informacao da populacao toda, Definicao 3.2 Qualquer estatstica que assume valores em e denominada um
estimador para .
algumas vezes impossvel, por exemplo, estudo de poluicao atmosferica
56
58 CAPITULO 3. ESTIMACAO 3.4. TEOREMA CENTRAL DO LIMITE 59
Das definicoes acima segue entao que qualquer estimador e uma estatstica pratica nao existe forma de garantir isto sem ter informacao da populacao in-
mas nem toda estatstica define um estimador. teira para comparar com a amostra. Porem em tais circunstancias nao haveria
necessidade de amostragem.
Exemplo 3.4 : Seja uma v.a. X que representa o resultado de um experimento Ao inves disso, podemos assegurar que nao existem vcios sistematicos em
do tipo sucesso-falha, tal que X = 1 se ocorre sucesso e X = 0 se ocorre falha. O nossa amostra atraves de uma selecao aleatoria dos membros da populacao. Uma
parametro desconhecido aqui e a probabilidade de sucesso p. Se o experimento amostra aleatoria independente e uma amostra selecionada de tal forma que
for repetido digamos 10 vezes de forma independente entao a v.a. Y : numero
total de sucessos e uma estatstica porem nao e um estimador de p ja que pode 1. todos os membros da populacao tem a mesma chance de serem selecionados;
assumir valores 0, 1, . . . , 10.
2. cada combinacao possvel de um dado numero de membros tem a mesma
chance de ser selecionada.
Os exemplos mais conhecidos de estatsticas sao a media (aritmetica) amostral
n
Em princpio, a melhor forma de obter uma amostra aleatoria de tamanho
X
Xi n e ter uma lista de todos os membros da populacao, dar a todos um numero
i=1 digamos de 1 a N, e entao escolher aleatoriamente n numeros de 1 a N para definir
X=
n a amostra. E claro que na pratica isto nao sera possvel quando a populacao for
muito grande ou mesmo infinita. Para o leitor interessado neste topico um texto
a variancia amostral n
X 2 em portugues sobre o assunto e Bolfarine and Bussab (2005).
Xi X A partir de agora vamos assumir que dispomos de uma amostra segundo a
i=1
S2 = definicao a seguir.
n1
eo desvio padrao amostral, diretamente obtido a partir da variancia amostral S = Definicao 3.3 Se X representa uma caracterstica de interesse da populacao,
S 2 . Estas estatsticas sao tambem estimadores pontuais da media, variancia e uma amostra aleatoria de tamanho n e o conjunto de n variaveis aleatorias in-
desvio-padrao. dependentes X1 , . . . , Xn cada uma com a mesma distribuicao de X.
3.3 Obtendo uma amostra Exemplo 3.6 : O diagrama na Figura 3.1 apresenta os resultados de um
experimento no qual 2000 observacoes foram simuladas de duas distribuicoes
Obtemos uma amostra para fazer inferencias de uma populacao. Nossas in- bem diferentes, uniforme discreta em {0, 1, . . . , 10} e exponencial com media 2.
ferencias sao validas somente se a amostra e representativa da populacao. Na Os histogramas destes valores estao na primeira linha. Foram entao geradas
58 CAPITULO 3. ESTIMACAO 3.4. TEOREMA CENTRAL DO LIMITE 59
Das definicoes acima segue entao que qualquer estimador e uma estatstica pratica nao existe forma de garantir isto sem ter informacao da populacao in-
mas nem toda estatstica define um estimador. teira para comparar com a amostra. Porem em tais circunstancias nao haveria
necessidade de amostragem.
Exemplo 3.4 : Seja uma v.a. X que representa o resultado de um experimento Ao inves disso, podemos assegurar que nao existem vcios sistematicos em
do tipo sucesso-falha, tal que X = 1 se ocorre sucesso e X = 0 se ocorre falha. O nossa amostra atraves de uma selecao aleatoria dos membros da populacao. Uma
parametro desconhecido aqui e a probabilidade de sucesso p. Se o experimento amostra aleatoria independente e uma amostra selecionada de tal forma que
for repetido digamos 10 vezes de forma independente entao a v.a. Y : numero
total de sucessos e uma estatstica porem nao e um estimador de p ja que pode 1. todos os membros da populacao tem a mesma chance de serem selecionados;
assumir valores 0, 1, . . . , 10.
2. cada combinacao possvel de um dado numero de membros tem a mesma
chance de ser selecionada.
Os exemplos mais conhecidos de estatsticas sao a media (aritmetica) amostral
n
Em princpio, a melhor forma de obter uma amostra aleatoria de tamanho
X
Xi n e ter uma lista de todos os membros da populacao, dar a todos um numero
i=1 digamos de 1 a N, e entao escolher aleatoriamente n numeros de 1 a N para definir
X=
n a amostra. E claro que na pratica isto nao sera possvel quando a populacao for
muito grande ou mesmo infinita. Para o leitor interessado neste topico um texto
a variancia amostral n
X 2 em portugues sobre o assunto e Bolfarine and Bussab (2005).
Xi X A partir de agora vamos assumir que dispomos de uma amostra segundo a
i=1
S2 = definicao a seguir.
n1
eo desvio padrao amostral, diretamente obtido a partir da variancia amostral S = Definicao 3.3 Se X representa uma caracterstica de interesse da populacao,
S 2 . Estas estatsticas sao tambem estimadores pontuais da media, variancia e uma amostra aleatoria de tamanho n e o conjunto de n variaveis aleatorias in-
desvio-padrao. dependentes X1 , . . . , Xn cada uma com a mesma distribuicao de X.
3.3 Obtendo uma amostra Exemplo 3.6 : O diagrama na Figura 3.1 apresenta os resultados de um
experimento no qual 2000 observacoes foram simuladas de duas distribuicoes
Obtemos uma amostra para fazer inferencias de uma populacao. Nossas in- bem diferentes, uniforme discreta em {0, 1, . . . , 10} e exponencial com media 2.
ferencias sao validas somente se a amostra e representativa da populacao. Na Os histogramas destes valores estao na primeira linha. Foram entao geradas
60 CAPITULO 3. ESTIMACAO 3.5. PROBLEMAS 61
200 400
200 400
linha para a proxima, e como as duas distribuicoes em cada linha tornam-se mais
similares nas suas formas a medida que o tamanho das amostras aumenta. Ainda
mais, cada distribuicao parece mais e mais com uma distribuicao normal. Nao e
necessario uma amostra de tamanho muito grande para ver uma forma normal.
0
As medias populacionais para as duas distribuicoes sao 5 e 2 respectivamente.
0 2 4 6 8 10 0 5 10 15
Note como, quanto maior o tamanho de amostra mais perto as medias amostrais x y
tendem a estar da media populacional.
A justificativa teorica para o que observamos neste exemplo e baseada no
chamado Teorema Central do Limite (TCL). Para amostras grandes X1 , . . . , Xn ,
300
150
se E(Xi ) = e V ar(Xi ) = 2 para i = 1, . . . , n temos o seguinte resultado
150
A distribuicao da media amostral X e aproximadamente
0 50
Normal com media e desvio padrao / n.
0
Usaremos a notacao 0 2 4 6 8 10 0 2 4 6 8 10
x y
X N(, 2 /n).
A aproximacao para a normal melhora a medida que o tamanho amostral
400
cresce. Este resultado nos permite conduzir alguns procedimentos de inferencia
250
sem qualquer conhecimento da distribuicao da populacao.
Uma observacao importante e que se a variavel original X ja tem distribuicao
200
0 100
normal entao X N(, 2 /n) qualquer que seja o valor de n. Este importante
resultado decorre da seguinte propriedade, se X1 , . . . , Xn sao v.a. independentes
0
tais que Xi N(i , i2 ) entao 2 4 6 8 0 1 2 3 4 5 6
! x y
Xn Xn n
X
Y = Xi N i , i2 .
i=1 i=1 i=1
200
250
3.5 Problemas
100
0 100
1. Explique as diferencas entre estatsticas, estimadores e estimativas.
0
2. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 3 4 5 6 7 8 1 2 3 4
distribuicao Bernoulli, isto e P [Xi = 1] = p e P [Xi = 1] = 1 p. Ache a x y
P
distribuicao aproximada (para n grande) de Y = ni=1 Xi .
60 CAPITULO 3. ESTIMACAO 3.5. PROBLEMAS 61
200 400
200 400
linha para a proxima, e como as duas distribuicoes em cada linha tornam-se mais
similares nas suas formas a medida que o tamanho das amostras aumenta. Ainda
mais, cada distribuicao parece mais e mais com uma distribuicao normal. Nao e
necessario uma amostra de tamanho muito grande para ver uma forma normal.
0
As medias populacionais para as duas distribuicoes sao 5 e 2 respectivamente.
0 2 4 6 8 10 0 5 10 15
Note como, quanto maior o tamanho de amostra mais perto as medias amostrais x y
tendem a estar da media populacional.
A justificativa teorica para o que observamos neste exemplo e baseada no
chamado Teorema Central do Limite (TCL). Para amostras grandes X1 , . . . , Xn ,
300
150
se E(Xi ) = e V ar(Xi ) = 2 para i = 1, . . . , n temos o seguinte resultado
150
A distribuicao da media amostral X e aproximadamente
0 50
Normal com media e desvio padrao / n.
0
Usaremos a notacao 0 2 4 6 8 10 0 2 4 6 8 10
x y
X N(, 2 /n).
A aproximacao para a normal melhora a medida que o tamanho amostral
400
cresce. Este resultado nos permite conduzir alguns procedimentos de inferencia
250
sem qualquer conhecimento da distribuicao da populacao.
Uma observacao importante e que se a variavel original X ja tem distribuicao
200
0 100
normal entao X N(, 2 /n) qualquer que seja o valor de n. Este importante
resultado decorre da seguinte propriedade, se X1 , . . . , Xn sao v.a. independentes
0
tais que Xi N(i , i2 ) entao 2 4 6 8 0 1 2 3 4 5 6
! x y
Xn Xn n
X
Y = Xi N i , i2 .
i=1 i=1 i=1
200
250
3.5 Problemas
100
0 100
1. Explique as diferencas entre estatsticas, estimadores e estimativas.
0
2. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 3 4 5 6 7 8 1 2 3 4
distribuicao Bernoulli, isto e P [Xi = 1] = p e P [Xi = 1] = 1 p. Ache a x y
P
distribuicao aproximada (para n grande) de Y = ni=1 Xi .
62 CAPITULO 3. ESTIMACAO 3.6. INTERVALOS DE CONFIANCA 63
3. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 11. Em uma certa cidade, a duracao das conversas telefonicas em minutos,
distribuicao exponencial todas com o mesmo parametro . Ache a distri- originarias de telefones publicos segue o modelo exponencial com parametro
P
buicao aproximada (para n grande) de Y = ni=1 Xi . 1/3. Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
a probabilidade delas, em media, nao ultrapassarem 4 minutos?
4. Uma variavel aleatoria X pode assumir os valores 1, 3 ou 6 com probabili-
dades 0,45; 0,25 e 0,3. Em uma amostra de 30 observacoes desta variavel
calcule a probabilidade da media amostral ser maior do que 3.5.
3.6 Intervalos de Confianca
5. Dada uma populacao normal X com media 605 e desvio-padrao 16, se
uma amostra aleatoria de tamanho 64 for selecionada calcule P (X > 602), Quando estimamos um parametro atraves de um unico valor numerico (es-
P (X > 610), P (602 < X < 610) e P (|X| > 610). timacao pontual) toda a informacao presente nos dados e resumida atraves deste
numero. E importante encontrar tambem um intervalo de valores plausveis para
6. Se uma populacao normal X tem media 100 e variancia 2,25 e uma amostra o parametro.
aleatoria de tamanho 16 for selecionada calcule P (X > 105), P (X < 96), e A ideia e construir um intervalo em torno da estimativa pontual de modo que
P (|X| > 103). ele tenha uma probabilidade conhecida de conter o verdadeiro valor do parametro.
Assim, se
7. O tempo medio de vida de um componente eletronico e igual a 10 (milhares P (T1 < < T2 ) = 1
de horas) e a variancia tambem e igual a 10. Uma amostra aleatoria de
entao t1 < < t2 e denominado intervalo de confianca (I.C.) para com nvel
50 componentes foi selecionada e o tempo ate a falha de cada um deles foi
de confianca 1 . A escolha do nvel de confianca depende da precisao com
registrado. Calcule a probabilidade de que o tempo medio amostral esteja
que queremos estimar o parametro, sendo que 0,90, 0,95 e 0,99 sao os valores
entre 9 e 12.
mais comuns na pratica. Vale notar no entanto que o aumento da confianca no
8. Suponha que um lote contendo 1000 itens possui uma proporcao p de itens intervalo implica necessariamente no aumento de sua amplitude.
defeituosos. Definindo-se a v.a. X = 1 se um item e defeituoso e X = 0 Tecnicamente, dizemos que 100(1 )% de todos os intervalos de confianca
caso contrario entao X tem media igual a p e variancia p(1 p). Calcule que construirmos conterao o verdadeiro valor do parametro (dado que todas as
a probabilidade de uma amostra de 40 itens deste lote apresentar mais do suposicoes envolvidas estejam corretas). Por exemplo se 1 = 0, 95 entao,
que 25% de defeituosos sabendo-se que p = 0, 20. em media, somente 5 a cada 100 intervalos nao conterao . Podemos obter
intervalos de confianca para medias, diferencas de medias, proporcoes, diferencas
9. Uma peca e montada conectando-se tres partes componentes de modo que em proporcoes, etc.
o comprimento da peca e a soma dos comprimentos das partes. Cada uma
de tres maquinas produz, de forma independente, uma das partes segundo
uma distribuicao normal. Sabe-se que as maquinas foram ajustadas para 3.6.1 Intervalos de confianca para a media
produzir partes com comprimentos medios iguais a 2,3; 2,1 e 2,5 cm e
desvios-padroes 1,0. Calcule a probabilidade de uma peca ter comprimento Na Secao 3.4 vimos que para uma amostra suficientemente grande a distribuicao
maior do que 7 cm. das medias amostrais em torno da media populacional e normal com desvio
padrao / n,
10. As alturas de mulheres e homens (em polegadas) em certa populacao tem n(X )
U= N(0, 1).
distribuicoes N(65,12) e N(68,22) respectivamente. Uma mulher e um ho-
mem foram selecionados ao acaso e de forma independente. Qual a proba- Chamamos / n o erro padrao da media amostral, uma vez que quanto menor
bilidade da mulher ser mais alta? seu valor mais proximas estarao as medias amostrais da media populacional
62 CAPITULO 3. ESTIMACAO 3.6. INTERVALOS DE CONFIANCA 63
3. Suponha que X1 , X2 , . . . , Xn sejam variaveis aleatorias independentes com 11. Em uma certa cidade, a duracao das conversas telefonicas em minutos,
distribuicao exponencial todas com o mesmo parametro . Ache a distri- originarias de telefones publicos segue o modelo exponencial com parametro
P
buicao aproximada (para n grande) de Y = ni=1 Xi . 1/3. Observando-se uma amostra aleatoria de 50 dessas chamadas, qual sera
a probabilidade delas, em media, nao ultrapassarem 4 minutos?
4. Uma variavel aleatoria X pode assumir os valores 1, 3 ou 6 com probabili-
dades 0,45; 0,25 e 0,3. Em uma amostra de 30 observacoes desta variavel
calcule a probabilidade da media amostral ser maior do que 3.5.
3.6 Intervalos de Confianca
5. Dada uma populacao normal X com media 605 e desvio-padrao 16, se
uma amostra aleatoria de tamanho 64 for selecionada calcule P (X > 602), Quando estimamos um parametro atraves de um unico valor numerico (es-
P (X > 610), P (602 < X < 610) e P (|X| > 610). timacao pontual) toda a informacao presente nos dados e resumida atraves deste
numero. E importante encontrar tambem um intervalo de valores plausveis para
6. Se uma populacao normal X tem media 100 e variancia 2,25 e uma amostra o parametro.
aleatoria de tamanho 16 for selecionada calcule P (X > 105), P (X < 96), e A ideia e construir um intervalo em torno da estimativa pontual de modo que
P (|X| > 103). ele tenha uma probabilidade conhecida de conter o verdadeiro valor do parametro.
Assim, se
7. O tempo medio de vida de um componente eletronico e igual a 10 (milhares P (T1 < < T2 ) = 1
de horas) e a variancia tambem e igual a 10. Uma amostra aleatoria de
entao t1 < < t2 e denominado intervalo de confianca (I.C.) para com nvel
50 componentes foi selecionada e o tempo ate a falha de cada um deles foi
de confianca 1 . A escolha do nvel de confianca depende da precisao com
registrado. Calcule a probabilidade de que o tempo medio amostral esteja
que queremos estimar o parametro, sendo que 0,90, 0,95 e 0,99 sao os valores
entre 9 e 12.
mais comuns na pratica. Vale notar no entanto que o aumento da confianca no
8. Suponha que um lote contendo 1000 itens possui uma proporcao p de itens intervalo implica necessariamente no aumento de sua amplitude.
defeituosos. Definindo-se a v.a. X = 1 se um item e defeituoso e X = 0 Tecnicamente, dizemos que 100(1 )% de todos os intervalos de confianca
caso contrario entao X tem media igual a p e variancia p(1 p). Calcule que construirmos conterao o verdadeiro valor do parametro (dado que todas as
a probabilidade de uma amostra de 40 itens deste lote apresentar mais do suposicoes envolvidas estejam corretas). Por exemplo se 1 = 0, 95 entao,
que 25% de defeituosos sabendo-se que p = 0, 20. em media, somente 5 a cada 100 intervalos nao conterao . Podemos obter
intervalos de confianca para medias, diferencas de medias, proporcoes, diferencas
9. Uma peca e montada conectando-se tres partes componentes de modo que em proporcoes, etc.
o comprimento da peca e a soma dos comprimentos das partes. Cada uma
de tres maquinas produz, de forma independente, uma das partes segundo
uma distribuicao normal. Sabe-se que as maquinas foram ajustadas para 3.6.1 Intervalos de confianca para a media
produzir partes com comprimentos medios iguais a 2,3; 2,1 e 2,5 cm e
desvios-padroes 1,0. Calcule a probabilidade de uma peca ter comprimento Na Secao 3.4 vimos que para uma amostra suficientemente grande a distribuicao
maior do que 7 cm. das medias amostrais em torno da media populacional e normal com desvio
padrao / n,
10. As alturas de mulheres e homens (em polegadas) em certa populacao tem n(X )
U= N(0, 1).
distribuicoes N(65,12) e N(68,22) respectivamente. Uma mulher e um ho-
mem foram selecionados ao acaso e de forma independente. Qual a proba- Chamamos / n o erro padrao da media amostral, uma vez que quanto menor
bilidade da mulher ser mais alta? seu valor mais proximas estarao as medias amostrais da media populacional
64 CAPITULO 3. ESTIMACAO 3.6. INTERVALOS DE CONFIANCA 65
(i.e. menor sera o erro). Portanto, A Tabela ?? apresenta os valores de t tais que
(i.e. menor sera o erro). Portanto, A Tabela ?? apresenta os valores de t tais que
no primeiro lago e disso, este intervalo nao e simetrico em torno da estimativa pontual e por isso
np = 30 e n(1 p) = 20 temos que obter 2 valores da distribuicao qui-quadrado cujos valores absolutos
sao diferentes, um a ser utilizado no limite inferior e outro a ser utilizado no
no segundo lago. Portanto, os intervalos de confianca aproximados de 95% para
limite superior do intervalo.
a verdadeira proporcao de machos ficam
p p
[0, 75 1, 96 0, 75(0, 25)/43; 0, 75 + 1, 96 0, 75(0, 25)/43] = [0, 621; 0, 879]
p p
3.7 Comentario
[0, 60 1, 96 0, 60(0, 40)/50; 0, 60 + 1, 96 0, 60(0, 40)/50] = [0, 464; 0, 736].
A forma como intervalos de confianca sao construidos pode dar margem a inter-
A conclusao e que temos 95% de confianca de que a proporcao de machos e a pretacoes erroneas, o que alias acontece com bastante frequencia. Um parametro
mesma nos dois lagos. e sempre desconhecido mas fixo e portanto nao e passvel de descricao proba-
bilstica, ou seja nao se trata de um intervalo de probabilidade para (embora
intuitivamente e o que gostariamos que fosse). Na verdade os limites do intervalo
3.6.4 Intervalo de Confianca para Variancia
e que sao variaveis aleatorias e apos a amostra ser observada dizemos por exemplo
Em muitas situacoes existe interesse tambem em estimar a variabilidade do pro- que
cesso. Para obter estimativas intervalares da variancia populacional 2 sao apli- x z/2 x + z/2
n n
cados os mesmos princpios utilizados para estimar a media. Aqui usamos a
seguinte quantidade com confianca 100(1 )%. Nao e possvel inferir se o parametro esta mais
(n 1)S 2 proximo de um ou outro limite, embora novamente seja isto que intuitivamente
2 gostariamos de fazer.
que tem uma distribuicao chamada qui-quadrado (2 ) com n 1 graus de liber- Mas nem tudo esta perdido. A Estatstica Bayesiana admite que um
dade e o intervalo de confianca utiliza valores desta distribuicao. A Tabela ?? parametro pode ser tratado como variavel aleatoria e portanto obtem interva-
fornece valores x desta distribuicao tais que a probabilidade a direita de x e igual los de probabilidade para eles. Este assunto nao sera abordado neste texto e
a p (primeira linha da tabela) segundo o numero de graus de liberdade (primeira algumas referencias sao Migon and Gamerman (1999) ou DeGroot (1989).
coluna da tabela). Por exemplo, se uma v.a. Y tem distribuicao 2 com 10 graus
de liberdade entao P (Y > 18, 307) = 0, 05.
Para construir um IC de 100(1 )% para 2 devemos entao obter os valores 3.8 Problemas
2/2,n1 e 2/2,n1 desta distribuicao tais que
1. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma media
de 72,9 batidas por minuto (bpm) e um desvio padrao de 11,0 bpm foram
(n 1)S 2
P 2/2,n1 2
/2,n1 = 1 . obtidos. Construa um intervalo de confianca de 95% para a pulsacao media
2
em repouso de pessoas sadias com base nesses dados.
Apos observar a amostra teremos o valor numerico s2 de S 2 e segue que
2. Tendo sido medido o eixo maior de 9 graos de quartzo de um corpo arenoso
(n 1)s2 (n 1)s2 em uma lamina de arenito, obteve-se um comprimento amostral medio de
2 < 2 < 2
/2,n1 /2,n1 1,5mm e um desvio padrao de 0,3mm. Deseja-se construir um intervalo de
confianca para o comprimento medio dos graos de quartzo do corpo arenoso.
com 100(1 )% de confianca (ou seja este e o IC).
Note que o intervalo nao depende da media amostral x mas somente do grau 3. Os QIs de 181 meninos com idades entre 6-7 anos de Curitiba foram medi-
de dispersao dos dados, medido atraves do desvio padrao amostral s2 . Alem dos. O QI medio foi 108,08, e o desvio padrao foi 14,38.
68 CAPITULO 3. ESTIMACAO 3.7. COMENTARIO 69
no primeiro lago e disso, este intervalo nao e simetrico em torno da estimativa pontual e por isso
np = 30 e n(1 p) = 20 temos que obter 2 valores da distribuicao qui-quadrado cujos valores absolutos
sao diferentes, um a ser utilizado no limite inferior e outro a ser utilizado no
no segundo lago. Portanto, os intervalos de confianca aproximados de 95% para
limite superior do intervalo.
a verdadeira proporcao de machos ficam
p p
[0, 75 1, 96 0, 75(0, 25)/43; 0, 75 + 1, 96 0, 75(0, 25)/43] = [0, 621; 0, 879]
p p
3.7 Comentario
[0, 60 1, 96 0, 60(0, 40)/50; 0, 60 + 1, 96 0, 60(0, 40)/50] = [0, 464; 0, 736].
A forma como intervalos de confianca sao construidos pode dar margem a inter-
A conclusao e que temos 95% de confianca de que a proporcao de machos e a pretacoes erroneas, o que alias acontece com bastante frequencia. Um parametro
mesma nos dois lagos. e sempre desconhecido mas fixo e portanto nao e passvel de descricao proba-
bilstica, ou seja nao se trata de um intervalo de probabilidade para (embora
intuitivamente e o que gostariamos que fosse). Na verdade os limites do intervalo
3.6.4 Intervalo de Confianca para Variancia
e que sao variaveis aleatorias e apos a amostra ser observada dizemos por exemplo
Em muitas situacoes existe interesse tambem em estimar a variabilidade do pro- que
cesso. Para obter estimativas intervalares da variancia populacional 2 sao apli- x z/2 x + z/2
n n
cados os mesmos princpios utilizados para estimar a media. Aqui usamos a
seguinte quantidade com confianca 100(1 )%. Nao e possvel inferir se o parametro esta mais
(n 1)S 2 proximo de um ou outro limite, embora novamente seja isto que intuitivamente
2 gostariamos de fazer.
que tem uma distribuicao chamada qui-quadrado (2 ) com n 1 graus de liber- Mas nem tudo esta perdido. A Estatstica Bayesiana admite que um
dade e o intervalo de confianca utiliza valores desta distribuicao. A Tabela ?? parametro pode ser tratado como variavel aleatoria e portanto obtem interva-
fornece valores x desta distribuicao tais que a probabilidade a direita de x e igual los de probabilidade para eles. Este assunto nao sera abordado neste texto e
a p (primeira linha da tabela) segundo o numero de graus de liberdade (primeira algumas referencias sao Migon and Gamerman (1999) ou DeGroot (1989).
coluna da tabela). Por exemplo, se uma v.a. Y tem distribuicao 2 com 10 graus
de liberdade entao P (Y > 18, 307) = 0, 05.
Para construir um IC de 100(1 )% para 2 devemos entao obter os valores 3.8 Problemas
2/2,n1 e 2/2,n1 desta distribuicao tais que
1. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma media
de 72,9 batidas por minuto (bpm) e um desvio padrao de 11,0 bpm foram
(n 1)S 2
P 2/2,n1 2
/2,n1 = 1 . obtidos. Construa um intervalo de confianca de 95% para a pulsacao media
2
em repouso de pessoas sadias com base nesses dados.
Apos observar a amostra teremos o valor numerico s2 de S 2 e segue que
2. Tendo sido medido o eixo maior de 9 graos de quartzo de um corpo arenoso
(n 1)s2 (n 1)s2 em uma lamina de arenito, obteve-se um comprimento amostral medio de
2 < 2 < 2
/2,n1 /2,n1 1,5mm e um desvio padrao de 0,3mm. Deseja-se construir um intervalo de
confianca para o comprimento medio dos graos de quartzo do corpo arenoso.
com 100(1 )% de confianca (ou seja este e o IC).
Note que o intervalo nao depende da media amostral x mas somente do grau 3. Os QIs de 181 meninos com idades entre 6-7 anos de Curitiba foram medi-
de dispersao dos dados, medido atraves do desvio padrao amostral s2 . Alem dos. O QI medio foi 108,08, e o desvio padrao foi 14,38.
70 CAPITULO 3. ESTIMACAO 3.8. PROBLEMAS 71
(a) Calcule um intervalo de confianca de 95% para o QI medio popula- 6. Para decidir se uma moeda e balanceada (honesta) ela e lancada 40 vezes
cional dos meninos entre 6-7 anos de idade em Curitiba usando estes e cara aparece 13 vezes. Construa um intervalo de 95% de confianca para
dados. a verdadeira proporcao de caras p. O que voce conclui?
(b) Interprete o intervalo de confianca com palavras. 7. Numa pesquisa eleitoral, 57 dentre 150 entrevistados afirmaram que vota-
(c) Foi necessario assumir que os QIs tem distribuicao normal neste caso? riam no candidato X. Com uma confianca de 90%, o que voce pode dizer
Por que? acerca da proporcao real de votos aquele candidato tera?
4. A tabela abaixo apresenta QIs medios e seus desvios padroes calculados de 8. Dentre 100 peixes capturados num certo lago, 18 nao estavam apropria-
amostras de criancas por classe de atividade profissional dos pais. dos para consumo devido aos nveis de poluicao do ambiente. Construa
um intervalo de confianca de 99% para a verdadeira proporcao de peixes
contaminados.
Ocupacao Media desvio padrao n I.C.
Profissional 112,27 13,16 30 (107,36; 117,18) 9. Os dados abaixo sao uma amostra aleatoria da distribuicao Bernoulli(p),
Gerencial 112,65 11,01 78 i.e. sao valores observados da v.a. X = 1 se ocorre sucesso e X = 0 caso
Nao-Manual 108,86 13,94 28 contrario e P (sucesso)=p. Construa os IC 90% e 99%.
Manual 0001101111011011110111111
com pratica) 104,38 14,41 152
Manual
(pouca pratica) 96,97 10,13 37
Manual
(sem pratica) 98,85 14,02 20
5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
minutos. Foi introduzida uma modificacao para reduzir este tempo e apos
alguns meses foi selecionada uma amostra de 16 operarios medindo-se o
tempo de execucao de cada um. Obteve-se um tempo medio amostral de
90 minutos e um desvio padrao amostral de 16 minutos.
(a) Estime o novo tempo medio de execucao por um intervalo com 95%
de confianca.
(b) Interprete o I.C. obtido no item anterior. Voce diria que a modificacao
surtiu efeito? (Justifique).
(c) Estime a nova variancia populacional por um intervalo com 95% de
confianca.
70 CAPITULO 3. ESTIMACAO 3.8. PROBLEMAS 71
(a) Calcule um intervalo de confianca de 95% para o QI medio popula- 6. Para decidir se uma moeda e balanceada (honesta) ela e lancada 40 vezes
cional dos meninos entre 6-7 anos de idade em Curitiba usando estes e cara aparece 13 vezes. Construa um intervalo de 95% de confianca para
dados. a verdadeira proporcao de caras p. O que voce conclui?
(b) Interprete o intervalo de confianca com palavras. 7. Numa pesquisa eleitoral, 57 dentre 150 entrevistados afirmaram que vota-
(c) Foi necessario assumir que os QIs tem distribuicao normal neste caso? riam no candidato X. Com uma confianca de 90%, o que voce pode dizer
Por que? acerca da proporcao real de votos aquele candidato tera?
4. A tabela abaixo apresenta QIs medios e seus desvios padroes calculados de 8. Dentre 100 peixes capturados num certo lago, 18 nao estavam apropria-
amostras de criancas por classe de atividade profissional dos pais. dos para consumo devido aos nveis de poluicao do ambiente. Construa
um intervalo de confianca de 99% para a verdadeira proporcao de peixes
contaminados.
Ocupacao Media desvio padrao n I.C.
Profissional 112,27 13,16 30 (107,36; 117,18) 9. Os dados abaixo sao uma amostra aleatoria da distribuicao Bernoulli(p),
Gerencial 112,65 11,01 78 i.e. sao valores observados da v.a. X = 1 se ocorre sucesso e X = 0 caso
Nao-Manual 108,86 13,94 28 contrario e P (sucesso)=p. Construa os IC 90% e 99%.
Manual 0001101111011011110111111
com pratica) 104,38 14,41 152
Manual
(pouca pratica) 96,97 10,13 37
Manual
(sem pratica) 98,85 14,02 20
5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
minutos. Foi introduzida uma modificacao para reduzir este tempo e apos
alguns meses foi selecionada uma amostra de 16 operarios medindo-se o
tempo de execucao de cada um. Obteve-se um tempo medio amostral de
90 minutos e um desvio padrao amostral de 16 minutos.
(a) Estime o novo tempo medio de execucao por um intervalo com 95%
de confianca.
(b) Interprete o I.C. obtido no item anterior. Voce diria que a modificacao
surtiu efeito? (Justifique).
(c) Estime a nova variancia populacional por um intervalo com 95% de
confianca.
4.1. INTRODUCAO E NOTACAO 73
Exemplo 4.1 : (Teste unilateral) Um professor aplica um teste do tipo certo- Portanto, para que o nvel de significancia maximo seja 0,025 devemos usar a
errado com 10 questoes. Queremos testar a hipotese de que o aluno esta advi- regiao crtica X 6. Isto e, vamos rejeitar o lote se o numero de itens defeituosos
nhando. na amostra for maior do que 6.
Denotando por p a probabilidade do aluno acertar cada questao a hipotese
estatstica de interesse pode ser formulada como H0 : p = 1/2. Neste caso, a Nestes dois exemplos os testes sao chamados de unilaterais porque somente
hipotese alternativa mais adequada e H1 : p > 1/2 indicando que o aluno tem valores de um lado do espaco amostral foram utilizados para construir a regiao
algum conhecimento sobre o assunto. Temos entao 10 repeticoes do experimento crtica. As regioes crticas sao mostradas nos graficos da Figura 4.1. Podemos ter
72
4.1. INTRODUCAO E NOTACAO 73
Exemplo 4.1 : (Teste unilateral) Um professor aplica um teste do tipo certo- Portanto, para que o nvel de significancia maximo seja 0,025 devemos usar a
errado com 10 questoes. Queremos testar a hipotese de que o aluno esta advi- regiao crtica X 6. Isto e, vamos rejeitar o lote se o numero de itens defeituosos
nhando. na amostra for maior do que 6.
Denotando por p a probabilidade do aluno acertar cada questao a hipotese
estatstica de interesse pode ser formulada como H0 : p = 1/2. Neste caso, a Nestes dois exemplos os testes sao chamados de unilaterais porque somente
hipotese alternativa mais adequada e H1 : p > 1/2 indicando que o aluno tem valores de um lado do espaco amostral foram utilizados para construir a regiao
algum conhecimento sobre o assunto. Temos entao 10 repeticoes do experimento crtica. As regioes crticas sao mostradas nos graficos da Figura 4.1. Podemos ter
72
74 CAPITULO 4. TESTES DE HIPOTESES 4.2. PROBLEMAS 75
tambem testes bilaterais aonde os dois extremos do espaco amostral sao usados
Tabela 4.1: Tipos de decisao e erros associados ao testar hipoteses.
como regiao crtica. A variavel aleatoria X e chamada estatstica de teste, sua
distribuicao deve ser conhecida e ela deve depender do parametro que esta sendo Decisao
testado. Verdade Aceitar H0 Rejeitar H0
H0 verdadeira Decisao correta Erro Tipo I
(probabilidade 1 ) (probabilidade )
H0 falsa Erro Tipo II Decisao correta
0.25
0.4
(probabilidade ) (probabilidade 1 )
0.20
0.3
4.2 Problemas
0.15
Probabilidades
Probabilidades
0.2
1. Em um estudo antropologico deve-se decidir se os habitantes de uma ilha
0.10
0.0
0 2 4 6 8 10 0 2 4 6 8 10
cm. Caso contrario afirma-se que sao descendentes de A. Denotando por
(a) (b)
e os verdadeiros valores da altura media e desvio-padrao das alturas dos
habitantes defina as hipoteses,
Figura 4.1: Probabilidades binomiais com n = 10 e (a) p = 1/2 e (b) p = 0, 90.
Regioes crticas dos Exemplos 4.1 e 4.2 em negrito. H0 : = 175, = 10 (habitantes descendem de A)
H1 : = 177, = 10 (habitantes descendem de B).
2. Nas situacoes abaixo, escolha a sua hipotese H0 de modo que o erro tipo I
Ao tomar uma decisao a favor ou contra uma hipotese existem dois tipos de erros seja mais importante do que o erro tipo II. Descreva quais os dois erros em
que podemos cometer. Podemos rejeitar a hipotese nula quando de fato ela e cada caso.
verdadeira (erro tipo I) ou podemos falhar em rejeitar H0 quando de fato ela
e falsa (erro tipo II). Frequentemente denotamos as probabilidades destes dois (a) Um operador de radar precisa detectar aeronaves inimigas. Quando
tipos de erro como e respectivamente. O poder de um teste e a probabilidade surge alguma coisa estranha na tela ele deve decidir entre as hipoteses:
de rejeitar a hipotese nula quando esta e de fato falsa, isto e 1 . 1. esta comecando um ataque inimigo, 2. e apenas uma leve inter-
ferencia.
Existe um balanco entre esses dois tipos de erros, no sentido de que ao tentar-
se minimizar , aumenta-se . Isto e, nao e possvel minimizar estas duas proba- (b) Um indivduo esta sendo julgado por um crime e o juri deve decidir
bilidades simultaneamente e na pratica e costume fixar um valor (pequeno) para entre as hipoteses: 1. o acusado e inocente, 2. o acusado e culpado.
. Na Tabela 4.1 estao descritas as decisoes que podemos tomar e os tipos de (c) Um pesquisador acredita que descobriu uma vacina contra resfriado.
erro associados. De acordo com resultados de testes em laboratorio ele lancara ou nao
74 CAPITULO 4. TESTES DE HIPOTESES 4.2. PROBLEMAS 75
tambem testes bilaterais aonde os dois extremos do espaco amostral sao usados
Tabela 4.1: Tipos de decisao e erros associados ao testar hipoteses.
como regiao crtica. A variavel aleatoria X e chamada estatstica de teste, sua
distribuicao deve ser conhecida e ela deve depender do parametro que esta sendo Decisao
testado. Verdade Aceitar H0 Rejeitar H0
H0 verdadeira Decisao correta Erro Tipo I
(probabilidade 1 ) (probabilidade )
H0 falsa Erro Tipo II Decisao correta
0.25
0.4
(probabilidade ) (probabilidade 1 )
0.20
0.3
4.2 Problemas
0.15
Probabilidades
Probabilidades
0.2
1. Em um estudo antropologico deve-se decidir se os habitantes de uma ilha
0.10
0.0
0 2 4 6 8 10 0 2 4 6 8 10
cm. Caso contrario afirma-se que sao descendentes de A. Denotando por
(a) (b)
e os verdadeiros valores da altura media e desvio-padrao das alturas dos
habitantes defina as hipoteses,
Figura 4.1: Probabilidades binomiais com n = 10 e (a) p = 1/2 e (b) p = 0, 90.
Regioes crticas dos Exemplos 4.1 e 4.2 em negrito. H0 : = 175, = 10 (habitantes descendem de A)
H1 : = 177, = 10 (habitantes descendem de B).
2. Nas situacoes abaixo, escolha a sua hipotese H0 de modo que o erro tipo I
Ao tomar uma decisao a favor ou contra uma hipotese existem dois tipos de erros seja mais importante do que o erro tipo II. Descreva quais os dois erros em
que podemos cometer. Podemos rejeitar a hipotese nula quando de fato ela e cada caso.
verdadeira (erro tipo I) ou podemos falhar em rejeitar H0 quando de fato ela
e falsa (erro tipo II). Frequentemente denotamos as probabilidades destes dois (a) Um operador de radar precisa detectar aeronaves inimigas. Quando
tipos de erro como e respectivamente. O poder de um teste e a probabilidade surge alguma coisa estranha na tela ele deve decidir entre as hipoteses:
de rejeitar a hipotese nula quando esta e de fato falsa, isto e 1 . 1. esta comecando um ataque inimigo, 2. e apenas uma leve inter-
ferencia.
Existe um balanco entre esses dois tipos de erros, no sentido de que ao tentar-
se minimizar , aumenta-se . Isto e, nao e possvel minimizar estas duas proba- (b) Um indivduo esta sendo julgado por um crime e o juri deve decidir
bilidades simultaneamente e na pratica e costume fixar um valor (pequeno) para entre as hipoteses: 1. o acusado e inocente, 2. o acusado e culpado.
. Na Tabela 4.1 estao descritas as decisoes que podemos tomar e os tipos de (c) Um pesquisador acredita que descobriu uma vacina contra resfriado.
erro associados. De acordo com resultados de testes em laboratorio ele lancara ou nao
76 CAPITULO 4. TESTES DE HIPOTESES 4.4. PROCEDIMENTO GERAL DE TESTE 77
a nova vacina no mercado. As hipoteses a serem testadas sao: 1. a Como ja vimos, o p-valor e a probabilidade de observar resultados tao extre-
vacina e eficaz, 2. a vacina nao e eficaz. mos quanto os obtidos se a hipotese nula for verdadeira. A ideia e que se o p-valor
for grande ele fornece evidencia de que H0 e verdadeira, enquanto que um p-valor
3. Ao lancar uma moeda 3 vezes a hipotese de que ela e honesta sera rejeitada pequeno indica que existe evidencia nos dados contra H0 (ja que ocorreu um re-
se aparecerem 3 caras. sultado pouco provavel). As seguintes interpretacoes de p-valores (P ) podem ser
uteis,
(a) Qual a probabilidade de erro tipo I?
P 0, 10 Nao existe evidencia contra H0
(b) Qual a probabilidade de erro tipo II quando P (cara) = 2/3 ?
P < 0, 10 Fraca evidencia contra H0
P < 0, 05 Evidencia significativa . . .
P < 0, 01 Evidencia altamente significativa . . .
4.3 Probabilidade de significancia (P -valor) P < 0, 001 Evidencia extremamente significativa . . .
Vimos que a escolha do nvel de significancia do teste e completamente ar-
bitraria. Alem disso, quando a distribuicao da estatstica de teste e discreta, 4.4 Procedimento geral de teste
como nos Exemplos 4.1 e 4.2 (binomial), o nvel escolhido pode nem mesmo ser
atingido. Por outro lado, a decisao de aceitar ou rejeitar H0 claramente depende 1. Estabeleca a hipotese nula, H0 e a hipotese alternativa H1 .
desta escolha. Na maioria das aplicacoes praticas o valor escolhido e 0,05 ou 0,01
mas nao ha nada que justifique formalmente o uso destes valores em particular. 2. Decida qual o teste a ser usado, checando se este e valido para o seu pro-
Um enfoque alternativo consiste em calcular o menor nvel de significancia blema.
para o qual H0 e rejeitada, para o valor observado da estatstica de teste. Esta
3. Apos observar a amostra calcule a estatstica de teste, T .
quantidade e chamada nvel crtico ou P-valor. A ideia e que, apos calcular o p-
valor o pesquisador pode escolher o seu proprio nvel de significancia como sendo 4. Encontre a probabilidade de observar um valor tao extremo ou maior do
a probabilidade maxima toleravel para um erro tipo I. que T se a hipotese nula e verdadeira (p-valor). Voce precisara se refe-
rir aos valores crticos nas tabelas estatsticas as quais fornecem p-valores
Exemplo 4.3 : No Exemplo 4.1 suponha que o numero observado de questoes correspondendo aos valores das estatstica de teste.
certas foi X = 9. Entao o p-valor sera
5. Avalie a forca da evidencia contra H0 (quanto menor o p-valor, maior a
10 10
P (X 9 | p = 1/2) = 0, 510 + 0, 510 = 0, 0107 evidencia contra H0 ). Decida se esta evidencia e suficiente para rejeitar (ou
9 10
nao rejeitar) a hipotese nula.
e rejeitaremos H0 para todo nvel de significancia maior do que este valor. Por
6. Estabeleca as conclusoes e interpretacao dos seus resultados.
exemplo, rejeitaremos H0 para = 0, 025 ou = 0, 05 e aceitaremos H0 para
= 0, 01.
E importante notar que existe uma diferenca entre significancia estatstica e
Exemplo 4.4 : No Exemplo 4.2 suponha que o numero observado de nao defei- significancia pratica. Um efeito pode ser estatisticamente significante mas nao ter
tuosos foi X = 4. Neste caso o p-valor e dado por qualquer importancia pratica e vice-versa. Por exemplo, um estudo muito grande
pode estimar a diferenca entre a media de peso de plantas como sendo 0,0001
P (X 4 | p = 0, 90) = 0, 000146 gramas e concluir que a diferenca e estatsticamente significativa. Contudo,
na pratica, esta diferenca e despresvel e provavelmente de pouca importancia
ou seja, rejeitaremos H0 para praticamente todos os nveis de significancia usuais. pratica.
76 CAPITULO 4. TESTES DE HIPOTESES 4.4. PROCEDIMENTO GERAL DE TESTE 77
a nova vacina no mercado. As hipoteses a serem testadas sao: 1. a Como ja vimos, o p-valor e a probabilidade de observar resultados tao extre-
vacina e eficaz, 2. a vacina nao e eficaz. mos quanto os obtidos se a hipotese nula for verdadeira. A ideia e que se o p-valor
for grande ele fornece evidencia de que H0 e verdadeira, enquanto que um p-valor
3. Ao lancar uma moeda 3 vezes a hipotese de que ela e honesta sera rejeitada pequeno indica que existe evidencia nos dados contra H0 (ja que ocorreu um re-
se aparecerem 3 caras. sultado pouco provavel). As seguintes interpretacoes de p-valores (P ) podem ser
uteis,
(a) Qual a probabilidade de erro tipo I?
P 0, 10 Nao existe evidencia contra H0
(b) Qual a probabilidade de erro tipo II quando P (cara) = 2/3 ?
P < 0, 10 Fraca evidencia contra H0
P < 0, 05 Evidencia significativa . . .
P < 0, 01 Evidencia altamente significativa . . .
4.3 Probabilidade de significancia (P -valor) P < 0, 001 Evidencia extremamente significativa . . .
Vimos que a escolha do nvel de significancia do teste e completamente ar-
bitraria. Alem disso, quando a distribuicao da estatstica de teste e discreta, 4.4 Procedimento geral de teste
como nos Exemplos 4.1 e 4.2 (binomial), o nvel escolhido pode nem mesmo ser
atingido. Por outro lado, a decisao de aceitar ou rejeitar H0 claramente depende 1. Estabeleca a hipotese nula, H0 e a hipotese alternativa H1 .
desta escolha. Na maioria das aplicacoes praticas o valor escolhido e 0,05 ou 0,01
mas nao ha nada que justifique formalmente o uso destes valores em particular. 2. Decida qual o teste a ser usado, checando se este e valido para o seu pro-
Um enfoque alternativo consiste em calcular o menor nvel de significancia blema.
para o qual H0 e rejeitada, para o valor observado da estatstica de teste. Esta
3. Apos observar a amostra calcule a estatstica de teste, T .
quantidade e chamada nvel crtico ou P-valor. A ideia e que, apos calcular o p-
valor o pesquisador pode escolher o seu proprio nvel de significancia como sendo 4. Encontre a probabilidade de observar um valor tao extremo ou maior do
a probabilidade maxima toleravel para um erro tipo I. que T se a hipotese nula e verdadeira (p-valor). Voce precisara se refe-
rir aos valores crticos nas tabelas estatsticas as quais fornecem p-valores
Exemplo 4.3 : No Exemplo 4.1 suponha que o numero observado de questoes correspondendo aos valores das estatstica de teste.
certas foi X = 9. Entao o p-valor sera
5. Avalie a forca da evidencia contra H0 (quanto menor o p-valor, maior a
10 10
P (X 9 | p = 1/2) = 0, 510 + 0, 510 = 0, 0107 evidencia contra H0 ). Decida se esta evidencia e suficiente para rejeitar (ou
9 10
nao rejeitar) a hipotese nula.
e rejeitaremos H0 para todo nvel de significancia maior do que este valor. Por
6. Estabeleca as conclusoes e interpretacao dos seus resultados.
exemplo, rejeitaremos H0 para = 0, 025 ou = 0, 05 e aceitaremos H0 para
= 0, 01.
E importante notar que existe uma diferenca entre significancia estatstica e
Exemplo 4.4 : No Exemplo 4.2 suponha que o numero observado de nao defei- significancia pratica. Um efeito pode ser estatisticamente significante mas nao ter
tuosos foi X = 4. Neste caso o p-valor e dado por qualquer importancia pratica e vice-versa. Por exemplo, um estudo muito grande
pode estimar a diferenca entre a media de peso de plantas como sendo 0,0001
P (X 4 | p = 0, 90) = 0, 000146 gramas e concluir que a diferenca e estatsticamente significativa. Contudo,
na pratica, esta diferenca e despresvel e provavelmente de pouca importancia
ou seja, rejeitaremos H0 para praticamente todos os nveis de significancia usuais. pratica.
78 CAPITULO 4. TESTES DE HIPOTESES 4.6. TESTE PARA A PROPORCAO 79
2. calcule a estatstica de teste avaliada sob H0 , 4. encontre o p-valor usando o valor absoluto da estatstica de teste da tabela
da distribuicao normal.
x 0
t= ;
s/ n Assim como em intervalos de confianca uma regra geral para que este teste
seja valido e quando temos ambos np e n(1 p) maiores ou iguais a 5.
3. encontre o p-valor na tabela da distribuicao t, com n 1 graus de liberdade
usando os valores absolutos da estatstica de teste, i.e.
4.7 Testes para a variancia da distribuicao nor-
P (|T | > t) = P (T < t) + P (T > t); mal
Se o objetivo e testar se a variancia da distribuicao normal e igual a um deter-
4. estabeleca conclusoes e interprete os resultados. minado valor 02 , entao as hipoteses podem ser formuladas como
H0 : 2 = 02
Se a variancia populacional for conhecida a estatstica de teste avaliada sob
H0 e H1 : 2 6= 02 .
x 0
z= A regra de decisao sobre estas hipotese e baseada na estatstica
/ n
e o p-valor sera agora obtido na tabela da distribuicao normal padronizada como (n 1)S 2
P (|Z| > z). T =
02
78 CAPITULO 4. TESTES DE HIPOTESES 4.6. TESTE PARA A PROPORCAO 79
2. calcule a estatstica de teste avaliada sob H0 , 4. encontre o p-valor usando o valor absoluto da estatstica de teste da tabela
da distribuicao normal.
x 0
t= ;
s/ n Assim como em intervalos de confianca uma regra geral para que este teste
seja valido e quando temos ambos np e n(1 p) maiores ou iguais a 5.
3. encontre o p-valor na tabela da distribuicao t, com n 1 graus de liberdade
usando os valores absolutos da estatstica de teste, i.e.
4.7 Testes para a variancia da distribuicao nor-
P (|T | > t) = P (T < t) + P (T > t); mal
Se o objetivo e testar se a variancia da distribuicao normal e igual a um deter-
4. estabeleca conclusoes e interprete os resultados. minado valor 02 , entao as hipoteses podem ser formuladas como
H0 : 2 = 02
Se a variancia populacional for conhecida a estatstica de teste avaliada sob
H0 e H1 : 2 6= 02 .
x 0
z= A regra de decisao sobre estas hipotese e baseada na estatstica
/ n
e o p-valor sera agora obtido na tabela da distribuicao normal padronizada como (n 1)S 2
P (|Z| > z). T =
02
80 CAPITULO 4. TESTES DE HIPOTESES 4.8. PROBLEMAS 81
onde S 2 e a variancia amostral calculada em uma amostra aleatoria com n ob- 5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
servacoes. Ja vimos que T tem distribuicao qui-quadrado com n 1 graus de minutos com desvio padrao 15 minutos. Foi introduzida uma modificacao
liberdade e portanto a regiao de rejeicao ao nvel de significancia e dada pelos para reduzir este tempo e apos alguns meses foi selecionada uma amostra
valores de T tais que de 16 operarios medindo-se o tempo de execucao de cada um. Obteve-se
um tempo medio amostral de 90 minutos e um desvio padrao amostral de
T > 21 ,n1 ou T < 2 n1 . 16 minutos.
2 2
Em termos de p-valor o procedimento consiste em avaliar a estatstica de teste (a) Verifique se existem evidencias, ao nvel de significancia de 5%, de que
t e calcular P (T > t). a modificacao surtiu efeito?
(b) Verifique se ha evidencias, ao nvel de significancia de 5%, de que a
modificacao alterou a variancia populacional.
4.8 Problemas (c) Estime o novo desvio padrao populacional por um intervalo com 98%
1. Suponha que a variavel X: custo de manutencao de uma maquina pode ser de confianca.
considerada como tendo distribuicao normal com media e desvio-padrao (d) O I.C. obtido no item anterior esta de acordo com sua conclusao no
20. Sabe-se tambem que os possveis valores do custo medio sao 200 ou item (b)? (Justifique).
210. Com base em uma amostra de 25 maquinas,
6. Uma fabrica de automoveis anuncia que seus carros consomem, em media,
(a) defina as hipoteses a serem testadas, 11 litros por 100 km, com desvio padrao de 0,8 litros. Uma revista resolve
testar essa afirmacao e analisa 35 automoveis dessa marca, obtendo 11,3
(b) defina uma regra de decisao e encontre as probabilidades de erros tipo litros por 100 km como consumo medio (considerar distribucao normal). O
I e tipo II. que a revista pode concluir sobre o anuncio da fabrica, no nvel de 10%?
2. Uma maquina automatica de encher pacotes de cafe enche-os segundo uma 7. Num levantamento feito com operarios da industria mecanica concluiu-se
distribuicao normal, com media e variancia 400g2 . A maquina foi regulada que o salario medio e 3,64 sm (salarios mnimos) com desvio padrao 0,85
para = 500 g. A cada meia hora colher-se uma amostra de 16 pacotes e sm. Supeita-se que os salarios de subclasse de torneiros mecanicos sao
verifica-se se a producao esta sob controle, isto e se = 500 g ou nao. Se diferentes dos salarios do conjunto todo, tanto na media como na variancia.
uma dessas amostras apresentasse uma media x = 492 g, voce pararia ou Que conclusoes voce obteria se uma amostra de 25 torneiros apresentasse
nao a producao para verificar se a maquina esta ajustada? salario medio igual a 4,22 sm e desvio padrao igual a 1,25 sm?
3. Uma companhia de cigarros anuncia que o ndice medio de nicotina dos ci- 8. A tensao media de ruptura dos cabos produzidos em uma industria e 500
garros que fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratorio Kgf com desvio padrao de 25 Kgf. Uma nova tecnica de producao para
realiza 6 analises desse ndice, obtendo 27, 24, 21, 25, 26, 22. Sabe-se que o aumentar esta tensao media foi introduzida e coletou-se uma amostra de
ndice de nicotina se distribui normalmente, com variancia igual a 4, 86mg2 . 25 cabos medindo-se a tensao em cada um. Obteve-se uma tensao media
Pode-se aceitar, ao nvel de 10%, a afirmacao do fabricante. amostral de 515 Kgf e desvio padrao amostral de 30 Kgf.
onde S 2 e a variancia amostral calculada em uma amostra aleatoria com n ob- 5. O tempo medio, por operario, para executar uma tarefa, tem sido de 100
servacoes. Ja vimos que T tem distribuicao qui-quadrado com n 1 graus de minutos com desvio padrao 15 minutos. Foi introduzida uma modificacao
liberdade e portanto a regiao de rejeicao ao nvel de significancia e dada pelos para reduzir este tempo e apos alguns meses foi selecionada uma amostra
valores de T tais que de 16 operarios medindo-se o tempo de execucao de cada um. Obteve-se
um tempo medio amostral de 90 minutos e um desvio padrao amostral de
T > 21 ,n1 ou T < 2 n1 . 16 minutos.
2 2
Em termos de p-valor o procedimento consiste em avaliar a estatstica de teste (a) Verifique se existem evidencias, ao nvel de significancia de 5%, de que
t e calcular P (T > t). a modificacao surtiu efeito?
(b) Verifique se ha evidencias, ao nvel de significancia de 5%, de que a
modificacao alterou a variancia populacional.
4.8 Problemas (c) Estime o novo desvio padrao populacional por um intervalo com 98%
1. Suponha que a variavel X: custo de manutencao de uma maquina pode ser de confianca.
considerada como tendo distribuicao normal com media e desvio-padrao (d) O I.C. obtido no item anterior esta de acordo com sua conclusao no
20. Sabe-se tambem que os possveis valores do custo medio sao 200 ou item (b)? (Justifique).
210. Com base em uma amostra de 25 maquinas,
6. Uma fabrica de automoveis anuncia que seus carros consomem, em media,
(a) defina as hipoteses a serem testadas, 11 litros por 100 km, com desvio padrao de 0,8 litros. Uma revista resolve
testar essa afirmacao e analisa 35 automoveis dessa marca, obtendo 11,3
(b) defina uma regra de decisao e encontre as probabilidades de erros tipo litros por 100 km como consumo medio (considerar distribucao normal). O
I e tipo II. que a revista pode concluir sobre o anuncio da fabrica, no nvel de 10%?
2. Uma maquina automatica de encher pacotes de cafe enche-os segundo uma 7. Num levantamento feito com operarios da industria mecanica concluiu-se
distribuicao normal, com media e variancia 400g2 . A maquina foi regulada que o salario medio e 3,64 sm (salarios mnimos) com desvio padrao 0,85
para = 500 g. A cada meia hora colher-se uma amostra de 16 pacotes e sm. Supeita-se que os salarios de subclasse de torneiros mecanicos sao
verifica-se se a producao esta sob controle, isto e se = 500 g ou nao. Se diferentes dos salarios do conjunto todo, tanto na media como na variancia.
uma dessas amostras apresentasse uma media x = 492 g, voce pararia ou Que conclusoes voce obteria se uma amostra de 25 torneiros apresentasse
nao a producao para verificar se a maquina esta ajustada? salario medio igual a 4,22 sm e desvio padrao igual a 1,25 sm?
3. Uma companhia de cigarros anuncia que o ndice medio de nicotina dos ci- 8. A tensao media de ruptura dos cabos produzidos em uma industria e 500
garros que fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratorio Kgf com desvio padrao de 25 Kgf. Uma nova tecnica de producao para
realiza 6 analises desse ndice, obtendo 27, 24, 21, 25, 26, 22. Sabe-se que o aumentar esta tensao media foi introduzida e coletou-se uma amostra de
ndice de nicotina se distribui normalmente, com variancia igual a 4, 86mg2 . 25 cabos medindo-se a tensao em cada um. Obteve-se uma tensao media
Pode-se aceitar, ao nvel de 10%, a afirmacao do fabricante. amostral de 515 Kgf e desvio padrao amostral de 30 Kgf.
4.9 Dimensionamento de amostras estimativa de 2 . O tamanho da amostra para estimar com digamos 95% de
confianca e calculado usando a seguinte expressao
Em geral, quanto maior o tamanho da amostra, maior o poder do teste (1-). 2
E desejavel decidir sobre um tamanho de amostra conveniente antes de conduzir t(n0 1;0,05) s
n= .
um estudo de forma que o resultados do teste de hipotese tera poder suficiente d
para responder a questao cientfica de interesse. Se n n0 , a amostra-piloto ja tera sido suficiente para a estimacao. Caso
Vimos no Captulo 3 e nas secoes anteriores deste captulo como construir contrario, deveremos retirar ainda da populacao os elementos necessarios a com-
intervalos e testes de hipoteses para os principais parametros populacionais. Em plementacao do tamanho mnimo de amostra.
todos os casos, supusemos dado o nvel de confianca desses intervalos e testes. Procedemos de forma analoga se desejamos estimar uma proporcao populaci-
Evidentemente, o nvel de confianca deve ser fixado de acordo com a probabi- onal com determinada confianca e dada precisao. No caso de populacao suposta
lidade de acerto que se deseja ter na estimacao por intervalo e testes. Sendo infinita, da expressao r
conveniente, o nvel de confianca pode ser aumentado ate tao proximo de 100% p(1 p)
quanto se queira, mas isso resultara em intervalos de amplitude cada vez maiores d=z ,
n
(e testes com poderes cada vez menores), o que significa perda de precisao na podemos obter
estimacao. E claro que seria desejavel termos intervalos com alto nvel de con- z 2
n= p(1 p).
fianca e pequena probabilidade de erro e grande precisao. Isso porem requer uma d
amostra suficientemente grande, pois, para n fixo, confianca e precisao variam O obstaculo a determinacao do tamanho de amostra por meio da expressao
em sentidos opostos. acima esta em desconhecermos p. Essa dificuldade pode ser resolvida atraves
Veremos a seguir como determinar o tamanho das amostras necessarias nos de uma amostra-piloto, analogamente ao caso descrito para a estimacao de , ou
casos de estimacao da media ou de uma proporcao populacional. Vimos na Secao analisando-se o comportamento do fator p(1 p) para 0 p 1. Segue que
3.6 que o intervalo de confianca de 95% para a media da populacao quando p(1 p) e a expressao de uma parabola cujo ponto de maximo e p = 1/2.
e conhecido tem semi-amplitude d dada pela expressao Se substituirmos, p(1 p) por seu valor maximo, 1/4, seguramente o tamanho
de amostra obtido sera suficiente para a estimacao de qualquer que seja p. Isso
d = z , equivale a considerar
n z 2 1 z 2
n= = .
onde z = 1, 96. O problema entao resolvido foi, fixados o nvel de confianca d 4 2d
(1 = 0, 95) e n, determinar d. Mas, e evidente dessa expressao que podemos Evidentemente, usando-se essa expressao corre-se o risco de se superdimensionar
resolver outro problema. Fixados, d e o nvel de confianca, determinar n, que e a amostra. Isso ocorrera se p for na realidade proximo de 0 ou 1. Se o custo
o problema da determinacao do tamanho de amostra necessario para se realizar envolvido for elevado e proporcional ao tamanho de amostra, e mais prudente a
a estimacao por intervalo com a confianca e a precisao (d) desejadas. Vemos tomada de uma amostra-piloto.
imediatamente que z 2
n=
d
. 4.10 Problemas
Essa sera a expressao usada se for conhecido.
1. Qual o tamanho de amostra necessario para se estimar a media de uma
Como o desvio-padrao populacional e desconhecido, deveramos subtitu-lo populacao infinita cujo desvio-padrao e igual a 4, com 98% de confianca e
por sua estimativa s e usar t de Student na expressao acima. Porem a amostra precisao de 0,5?
ainda nao foi retirada e portanto nao dispomos em geral do valor de s. Se nao
conhecemos nem ao menos um limite superior para , a unica solucao sera colher 2. Qual o tamanho de amostra suficiente para estimarmos a proporcao da area
uma amostra-piloto de n0 elementos, X1 , . . . , Xn0 e com base nela obter uma com solo contaminado que precisa de tratamento, com precisao de 0,02 e
82 CAPITULO 4. TESTES DE HIPOTESES 4.10. PROBLEMAS 83
4.9 Dimensionamento de amostras estimativa de 2 . O tamanho da amostra para estimar com digamos 95% de
confianca e calculado usando a seguinte expressao
Em geral, quanto maior o tamanho da amostra, maior o poder do teste (1-). 2
E desejavel decidir sobre um tamanho de amostra conveniente antes de conduzir t(n0 1;0,05) s
n= .
um estudo de forma que o resultados do teste de hipotese tera poder suficiente d
para responder a questao cientfica de interesse. Se n n0 , a amostra-piloto ja tera sido suficiente para a estimacao. Caso
Vimos no Captulo 3 e nas secoes anteriores deste captulo como construir contrario, deveremos retirar ainda da populacao os elementos necessarios a com-
intervalos e testes de hipoteses para os principais parametros populacionais. Em plementacao do tamanho mnimo de amostra.
todos os casos, supusemos dado o nvel de confianca desses intervalos e testes. Procedemos de forma analoga se desejamos estimar uma proporcao populaci-
Evidentemente, o nvel de confianca deve ser fixado de acordo com a probabi- onal com determinada confianca e dada precisao. No caso de populacao suposta
lidade de acerto que se deseja ter na estimacao por intervalo e testes. Sendo infinita, da expressao r
conveniente, o nvel de confianca pode ser aumentado ate tao proximo de 100% p(1 p)
quanto se queira, mas isso resultara em intervalos de amplitude cada vez maiores d=z ,
n
(e testes com poderes cada vez menores), o que significa perda de precisao na podemos obter
estimacao. E claro que seria desejavel termos intervalos com alto nvel de con- z 2
n= p(1 p).
fianca e pequena probabilidade de erro e grande precisao. Isso porem requer uma d
amostra suficientemente grande, pois, para n fixo, confianca e precisao variam O obstaculo a determinacao do tamanho de amostra por meio da expressao
em sentidos opostos. acima esta em desconhecermos p. Essa dificuldade pode ser resolvida atraves
Veremos a seguir como determinar o tamanho das amostras necessarias nos de uma amostra-piloto, analogamente ao caso descrito para a estimacao de , ou
casos de estimacao da media ou de uma proporcao populacional. Vimos na Secao analisando-se o comportamento do fator p(1 p) para 0 p 1. Segue que
3.6 que o intervalo de confianca de 95% para a media da populacao quando p(1 p) e a expressao de uma parabola cujo ponto de maximo e p = 1/2.
e conhecido tem semi-amplitude d dada pela expressao Se substituirmos, p(1 p) por seu valor maximo, 1/4, seguramente o tamanho
de amostra obtido sera suficiente para a estimacao de qualquer que seja p. Isso
d = z , equivale a considerar
n z 2 1 z 2
n= = .
onde z = 1, 96. O problema entao resolvido foi, fixados o nvel de confianca d 4 2d
(1 = 0, 95) e n, determinar d. Mas, e evidente dessa expressao que podemos Evidentemente, usando-se essa expressao corre-se o risco de se superdimensionar
resolver outro problema. Fixados, d e o nvel de confianca, determinar n, que e a amostra. Isso ocorrera se p for na realidade proximo de 0 ou 1. Se o custo
o problema da determinacao do tamanho de amostra necessario para se realizar envolvido for elevado e proporcional ao tamanho de amostra, e mais prudente a
a estimacao por intervalo com a confianca e a precisao (d) desejadas. Vemos tomada de uma amostra-piloto.
imediatamente que z 2
n=
d
. 4.10 Problemas
Essa sera a expressao usada se for conhecido.
1. Qual o tamanho de amostra necessario para se estimar a media de uma
Como o desvio-padrao populacional e desconhecido, deveramos subtitu-lo populacao infinita cujo desvio-padrao e igual a 4, com 98% de confianca e
por sua estimativa s e usar t de Student na expressao acima. Porem a amostra precisao de 0,5?
ainda nao foi retirada e portanto nao dispomos em geral do valor de s. Se nao
conhecemos nem ao menos um limite superior para , a unica solucao sera colher 2. Qual o tamanho de amostra suficiente para estimarmos a proporcao da area
uma amostra-piloto de n0 elementos, X1 , . . . , Xn0 e com base nela obter uma com solo contaminado que precisa de tratamento, com precisao de 0,02 e
84 CAPITULO 4. TESTES DE HIPOTESES 4.11. TESTES DE ADERENCIA (TESTES 2 ) 85
95% de confianca, sabendo que essa proporcao seguramente nao e superior 7. Refaca o exerccio anterior, sabendo que temos boas razoes para acreditar
a 0,2? que a proporcao que estamos tentando estimar e no mnimo 0,65.
95% de confianca, sabendo que essa proporcao seguramente nao e superior 7. Refaca o exerccio anterior, sabendo que temos boas razoes para acreditar
a 0,2? que a proporcao que estamos tentando estimar e no mnimo 0,65.
Tabela 4.2: e portanto podemos concluir que P -valor < 0,002. Ou seja, existe forte evidencia
contra a hipotese de independencia entre as variaveis Colegio e Classe social.
Classe social
Colegio Alta Media Baixa Total
A 20 40 40 100
B 50 40 30 120 4.12 Problemas
Total 70 80 70 220
1. Nos Exemplos 2.14 e 2.15 teste a adequacao dos modelos propostos (Bino-
mial e Poisson respectivamente).
variaveis Colegio e Classe social forem independentes espera-se que as frequencias
de alunos das 3 classes sejam as mesmas nos 2 colegios, i.e. 70/220, 80/220 e 2. Em seus experimentos com ervilhas, Mendel ao cruzar plantas de semen-
70/220. As frequencias esperadas sob a hipotese de independencia sao entao tes amarelas lisas com plantas de sementes verdes enrugadas observou a
dadas por seguinte descendencia na 2a geracao: 315 plantas com sementes amarelas
lisas, 108 com sementes amarelas enrugadas, 101 com sementes verdes li-
70 80 70
Colegio A: 100 = 31, 82 100 = 36, 36 100 = 31, 82 sas e 32 com sementes verdes enrugadas. De acordo com os postulados de
220 220 220
Mendel a segregacao esperada nesta geracao deveria seguir a proporcao de
70 80 70 9:3:3:1. Verifique se a teoria de Mendel explica a segregacao observada.
Colegio B: 120 = 38, 18 120 = 43, 64 120 = 38, 18
220 220 220
86 CAPITULO 4. TESTES DE HIPOTESES 4.12. PROBLEMAS 87
Tabela 4.2: e portanto podemos concluir que P -valor < 0,002. Ou seja, existe forte evidencia
contra a hipotese de independencia entre as variaveis Colegio e Classe social.
Classe social
Colegio Alta Media Baixa Total
A 20 40 40 100
B 50 40 30 120 4.12 Problemas
Total 70 80 70 220
1. Nos Exemplos 2.14 e 2.15 teste a adequacao dos modelos propostos (Bino-
mial e Poisson respectivamente).
variaveis Colegio e Classe social forem independentes espera-se que as frequencias
de alunos das 3 classes sejam as mesmas nos 2 colegios, i.e. 70/220, 80/220 e 2. Em seus experimentos com ervilhas, Mendel ao cruzar plantas de semen-
70/220. As frequencias esperadas sob a hipotese de independencia sao entao tes amarelas lisas com plantas de sementes verdes enrugadas observou a
dadas por seguinte descendencia na 2a geracao: 315 plantas com sementes amarelas
lisas, 108 com sementes amarelas enrugadas, 101 com sementes verdes li-
70 80 70
Colegio A: 100 = 31, 82 100 = 36, 36 100 = 31, 82 sas e 32 com sementes verdes enrugadas. De acordo com os postulados de
220 220 220
Mendel a segregacao esperada nesta geracao deveria seguir a proporcao de
70 80 70 9:3:3:1. Verifique se a teoria de Mendel explica a segregacao observada.
Colegio B: 120 = 38, 18 120 = 43, 64 120 = 38, 18
220 220 220
88 CAPITULO 4. TESTES DE HIPOTESES
H0 : 1 2 = 0
H1 : 1 2 6= 0.
89
88 CAPITULO 4. TESTES DE HIPOTESES
H0 : 1 2 = 0
H1 : 1 2 6= 0.
89
90 CAPITULO 5. COMPARANDO GRUPOS 5.1. DIFERENCA ENTRE MEDIAS DE DOIS GRUPOS 91
e como as sao independentes segue tambem que Analogamente, para testar por exemplo as hipoteses
2 2 H0 : 1 = 2 H1 : 1 6= 2
X 1 X 2 N 1 2 , 1 + 2 .
n1 n2
pode-se especificar um nvel de significancia e obter o valor de t/2 como acima.
Aqui no entanto precisamos levar em conta duas possveis situacoes ja que os
Como o teste e bilateral a regra de decisao consiste em rejeitar H0 se
desvios padrao podem ser iguais (1 = 2 ) ou nao (1 6= 2 ).
(x1 x2 ) (x1 x2 )
r < t/2 ou r > t/2 .
1 1 1 1
sp + sp +
n1 n2 n1 n2
5.1.1 Desvios padrao iguais
Primeiramente, assumimos que os desvios padrao populacionais sao os mesmos Exemplo 5.1 : Com o objetivo de comparar as alturas medias em centmetros
em cada grupo, i.e. 1 = 2 = . Podemos combinar os dois desvios padroes dos estudantes dos sexos masculino (X1 ) e feminino (X2 ) em uma universidade
amostrais para formar uma estimativa combinada do desvio padrao atribuindo foram selecionadas duas amostras de tamanhos n1 = 20 e n2 = 17. As medidas
mais peso as amostras maiores. Este desvio padrao combinado denotado por sp amostrais obtidas foram x1 = 178, 85, s1 = 7, 734, x2 = 164, 09, e s2 = 9, 750. A
e a raiz quadrada da variancia combinada dada por estimativa pontual para a diferenca entre as medias e entao dada por 178, 85
164, 09 = 14, 76. A variancia amostral combinada fica
(n1 1)s21 + (n2 1)s22
s2p = .
n1 + n2 2 s2p = (19 7, 7342 + 16 9, 7502 )/35 = 75, 92801
Note que min{s21 , s22 } s2p max{s21 , s22 } sempre ja que a soma dos pesos e igual e entao sp =p 75, 92801 = 8, 71. Finalmente o erro padrao pode ser calculado
a 1. Se isto nao ocorrer seus calculos estao errados. Agora podemos calcular o como 8, 71 1/20 + 1/17 = 2, 87. Fixando o nvel de confianca em 0,95 obtemos
erro padrao das diferencas nas medias como na tabela t com 35 graus de liberdade que P (|T | > 2, 03) = 0, 05 e entao um I.C.
r de 95% para 1 2 e dado por
1 1
EP (X 1 X 2 ) = Sp + .
n1 n2 [14, 76 2, 03 2, 87; 14, 76 + 2, 03 2, 87] = [8, 93; 20, 59].
Pode-se mostrar que
Note que este resultado tambem implica em rejeitar a hipotese de igualdade
(X 1 X 2 ) (1 2 ) entre as medias populacionais ao nvel de significancia 0,05.
T = r tn1 +n2 2
1 1
Sp +
n1 n2
e esta e a estatstica utilizada para construir intervalos de confianca e testar 5.1.2 Desvios padrao diferentes
hipoteses sobre a diferenca de medias.
A violacao da suposicao de igualdade leva a problemas teoricos e praticos uma vez
Assim para construir um IC de 100(1 )% para a diferenca obtem-se o
que nao e trivial encontrar uma estatstica de teste com distribuicao conhecida.
valor t/2 na tabela da distribuicao t com n1 + n2 2 graus de liberdade tal que
Assim, o pesquisador deve levar isto em conta caso haja diferenca substancial
P (t/2 < T < t/2 ) = 1 . Apos observar as amostras o intervalo fica
entre 12 e 22
r r
1 1 1 1 A literatura estatstica apresenta varios metodos para resolver este problema
x1 x2 t/2 sp + ; x1 x2 + t/2 sp + . mas nenhum deles e completamente satisfatorio. Um procedimento possvel (e
n1 n2 n1 n2
90 CAPITULO 5. COMPARANDO GRUPOS 5.1. DIFERENCA ENTRE MEDIAS DE DOIS GRUPOS 91
e como as sao independentes segue tambem que Analogamente, para testar por exemplo as hipoteses
2 2 H0 : 1 = 2 H1 : 1 6= 2
X 1 X 2 N 1 2 , 1 + 2 .
n1 n2
pode-se especificar um nvel de significancia e obter o valor de t/2 como acima.
Aqui no entanto precisamos levar em conta duas possveis situacoes ja que os
Como o teste e bilateral a regra de decisao consiste em rejeitar H0 se
desvios padrao podem ser iguais (1 = 2 ) ou nao (1 6= 2 ).
(x1 x2 ) (x1 x2 )
r < t/2 ou r > t/2 .
1 1 1 1
sp + sp +
n1 n2 n1 n2
5.1.1 Desvios padrao iguais
Primeiramente, assumimos que os desvios padrao populacionais sao os mesmos Exemplo 5.1 : Com o objetivo de comparar as alturas medias em centmetros
em cada grupo, i.e. 1 = 2 = . Podemos combinar os dois desvios padroes dos estudantes dos sexos masculino (X1 ) e feminino (X2 ) em uma universidade
amostrais para formar uma estimativa combinada do desvio padrao atribuindo foram selecionadas duas amostras de tamanhos n1 = 20 e n2 = 17. As medidas
mais peso as amostras maiores. Este desvio padrao combinado denotado por sp amostrais obtidas foram x1 = 178, 85, s1 = 7, 734, x2 = 164, 09, e s2 = 9, 750. A
e a raiz quadrada da variancia combinada dada por estimativa pontual para a diferenca entre as medias e entao dada por 178, 85
164, 09 = 14, 76. A variancia amostral combinada fica
(n1 1)s21 + (n2 1)s22
s2p = .
n1 + n2 2 s2p = (19 7, 7342 + 16 9, 7502 )/35 = 75, 92801
Note que min{s21 , s22 } s2p max{s21 , s22 } sempre ja que a soma dos pesos e igual e entao sp =p 75, 92801 = 8, 71. Finalmente o erro padrao pode ser calculado
a 1. Se isto nao ocorrer seus calculos estao errados. Agora podemos calcular o como 8, 71 1/20 + 1/17 = 2, 87. Fixando o nvel de confianca em 0,95 obtemos
erro padrao das diferencas nas medias como na tabela t com 35 graus de liberdade que P (|T | > 2, 03) = 0, 05 e entao um I.C.
r de 95% para 1 2 e dado por
1 1
EP (X 1 X 2 ) = Sp + .
n1 n2 [14, 76 2, 03 2, 87; 14, 76 + 2, 03 2, 87] = [8, 93; 20, 59].
Pode-se mostrar que
Note que este resultado tambem implica em rejeitar a hipotese de igualdade
(X 1 X 2 ) (1 2 ) entre as medias populacionais ao nvel de significancia 0,05.
T = r tn1 +n2 2
1 1
Sp +
n1 n2
e esta e a estatstica utilizada para construir intervalos de confianca e testar 5.1.2 Desvios padrao diferentes
hipoteses sobre a diferenca de medias.
A violacao da suposicao de igualdade leva a problemas teoricos e praticos uma vez
Assim para construir um IC de 100(1 )% para a diferenca obtem-se o
que nao e trivial encontrar uma estatstica de teste com distribuicao conhecida.
valor t/2 na tabela da distribuicao t com n1 + n2 2 graus de liberdade tal que
Assim, o pesquisador deve levar isto em conta caso haja diferenca substancial
P (t/2 < T < t/2 ) = 1 . Apos observar as amostras o intervalo fica
entre 12 e 22
r r
1 1 1 1 A literatura estatstica apresenta varios metodos para resolver este problema
x1 x2 t/2 sp + ; x1 x2 + t/2 sp + . mas nenhum deles e completamente satisfatorio. Um procedimento possvel (e
n1 n2 n1 n2
92 CAPITULO 5. COMPARANDO GRUPOS 5.3. AMOSTRAS PAREADAS 93
aproximado) que sera considerado aqui consiste em utilizar a estatstica liberdade do denominador.
Uma propriedade bastante util para calcular probabilidades com a distribuicao
(X 1 X 2 ) (1 2 ) F vem do fato de que se X F (m, n) entao X 1 F (n, m). Devido a esta
T = r 2
S1 S2 propriedade e usual que os livros fornecam tabelas somente com os percentis
+ 2
n1 n2 superiores da distribuicao F para varias combinacoes de valores dos graus de
liberdade.
com distribuicao t de Student e numero de graus de liberdade dado por
(w1 + w2 )2 Exemplo 5.2 : Suponha por exemplo que X F (4, 6) e queremos obter o valor
= x tal que P (X < x) = 0, 05. Neste caso devemos obter primeiro o valor y tal que
w12 w22
+ P (X 1 > y) = 0, 05 onde X 1 F (6, 4) que e dado na Tabela ?? por y = 6, 16.
n1 1 n2 1
Podemos agora calcular x = 1/y = 1/6, 16 0, 16.
onde
s21 s22
w1 = e w2 = .
n1 n2 5.3 Amostras pareadas
Novamente pode-se construir intervalos de confianca e testar hipoteses sobre
a diferenca entre as medias populacionais usando esta estatstica. Nas secoes anteriores fizemos a suposicao de que as amostras eram independentes,
mas esta nem sempre e uma suposicao razoavel. Em estudos chamados pareados,
temos duas amostras mas cada observacao na primeira amostra e pareada com
5.2 Comparacao de variancias uma observacao da segunda amostra. Tal situacao ocorre por exemplo em um
estudo de medidas feitas antes e depois no mesmo indivduo (ou mesma maquina,
Outra situacao de interesse e a comparacao das duas variancias populacionais. ou processo de producao, etc). Como esperado, as duas observacoes do mesmo
Neste caso, faz mais sentido utilizar a razao de variancias ao inves da diferenca indivduo sao mais provaveis de serem similares, e portanto nao podem ser con-
ja que elas medem a escala de uma distribuicao e sao sempre positivas. Ou seja sideradas estatisticamente independentes.
estamos interessados em estimar a quantidade 12 /22 construindo intervalos de Analogamente ao caso anterior, as observacoes pareadas sao representadas
confianca em torno da estimativa pontual s21 /s22 . As hipoteses a serem testadas pelas variaveis aleatorias
neste caso podem ser
X11 , . . . , X1n : medida 1
H0 : 12 = 22
H1 : 12 6= 22 . X21 , . . . , X2n : medida 2
e entao escrevemos as diferencas nas medidas de cada par como Di = X2i X1i ,
Para fazer inferencia sobre esta razao de variancias a estatstica utilizada e
i = 1, . . . , n. Temos agora uma amostra de diferencas e assumindo que
S12 22
F (n1 1, n2 1). 2
D1 , . . . , Dn N(D , D )
S22 12
A distribuicao associada e chamada distribuicao F de Fisher (ou simplesmente podemos usar os metodos que ja estamos familiares. Podemos calcular um inter-
F ) com n1 1 e n2 1 graus de liberdade. Os valores dos percentis estao ta- valo de confianca para a diferenca media e testar se a diferenca media e igual a
belados no Apendice ?? para varias probabilidades e estes podem ser utilizados um particular valor (usualmente zero) ou nao. Nos referimos a tal teste como um
na construcao de intervalos de confianca e testes de hipoteses para a razao de teste t pareado. Note que neste caso estamos interessados na diferenca media en-
variancias. A primeira linha das tabelas apresenta os chamados graus de liber- quanto que para duas amostras independentes, estamos interessados na diferenca
dade do numerador enquanto a primeira coluna apresenta os chamados graus de das medias. Ainda que numericamente estas quantidades possam ser as mesmas,
92 CAPITULO 5. COMPARANDO GRUPOS 5.3. AMOSTRAS PAREADAS 93
aproximado) que sera considerado aqui consiste em utilizar a estatstica liberdade do denominador.
Uma propriedade bastante util para calcular probabilidades com a distribuicao
(X 1 X 2 ) (1 2 ) F vem do fato de que se X F (m, n) entao X 1 F (n, m). Devido a esta
T = r 2
S1 S2 propriedade e usual que os livros fornecam tabelas somente com os percentis
+ 2
n1 n2 superiores da distribuicao F para varias combinacoes de valores dos graus de
liberdade.
com distribuicao t de Student e numero de graus de liberdade dado por
(w1 + w2 )2 Exemplo 5.2 : Suponha por exemplo que X F (4, 6) e queremos obter o valor
= x tal que P (X < x) = 0, 05. Neste caso devemos obter primeiro o valor y tal que
w12 w22
+ P (X 1 > y) = 0, 05 onde X 1 F (6, 4) que e dado na Tabela ?? por y = 6, 16.
n1 1 n2 1
Podemos agora calcular x = 1/y = 1/6, 16 0, 16.
onde
s21 s22
w1 = e w2 = .
n1 n2 5.3 Amostras pareadas
Novamente pode-se construir intervalos de confianca e testar hipoteses sobre
a diferenca entre as medias populacionais usando esta estatstica. Nas secoes anteriores fizemos a suposicao de que as amostras eram independentes,
mas esta nem sempre e uma suposicao razoavel. Em estudos chamados pareados,
temos duas amostras mas cada observacao na primeira amostra e pareada com
5.2 Comparacao de variancias uma observacao da segunda amostra. Tal situacao ocorre por exemplo em um
estudo de medidas feitas antes e depois no mesmo indivduo (ou mesma maquina,
Outra situacao de interesse e a comparacao das duas variancias populacionais. ou processo de producao, etc). Como esperado, as duas observacoes do mesmo
Neste caso, faz mais sentido utilizar a razao de variancias ao inves da diferenca indivduo sao mais provaveis de serem similares, e portanto nao podem ser con-
ja que elas medem a escala de uma distribuicao e sao sempre positivas. Ou seja sideradas estatisticamente independentes.
estamos interessados em estimar a quantidade 12 /22 construindo intervalos de Analogamente ao caso anterior, as observacoes pareadas sao representadas
confianca em torno da estimativa pontual s21 /s22 . As hipoteses a serem testadas pelas variaveis aleatorias
neste caso podem ser
X11 , . . . , X1n : medida 1
H0 : 12 = 22
H1 : 12 6= 22 . X21 , . . . , X2n : medida 2
e entao escrevemos as diferencas nas medidas de cada par como Di = X2i X1i ,
Para fazer inferencia sobre esta razao de variancias a estatstica utilizada e
i = 1, . . . , n. Temos agora uma amostra de diferencas e assumindo que
S12 22
F (n1 1, n2 1). 2
D1 , . . . , Dn N(D , D )
S22 12
A distribuicao associada e chamada distribuicao F de Fisher (ou simplesmente podemos usar os metodos que ja estamos familiares. Podemos calcular um inter-
F ) com n1 1 e n2 1 graus de liberdade. Os valores dos percentis estao ta- valo de confianca para a diferenca media e testar se a diferenca media e igual a
belados no Apendice ?? para varias probabilidades e estes podem ser utilizados um particular valor (usualmente zero) ou nao. Nos referimos a tal teste como um
na construcao de intervalos de confianca e testes de hipoteses para a razao de teste t pareado. Note que neste caso estamos interessados na diferenca media en-
variancias. A primeira linha das tabelas apresenta os chamados graus de liber- quanto que para duas amostras independentes, estamos interessados na diferenca
dade do numerador enquanto a primeira coluna apresenta os chamados graus de das medias. Ainda que numericamente estas quantidades possam ser as mesmas,
94 CAPITULO 5. COMPARANDO GRUPOS 5.5. PROBLEMAS 95
conceitualmente elas sao diferentes. e do teorema central do limite e propriedades da distribuicao normal segue que
Exemplo 5.3 : A mudanca nos nveis de um contaminante numa certa area do p2 p1 N(p2 p1 , 2 )
incio ao final de seis meses de observacao foram (em /l):
sendo s
1, 5 0, 6 0, 3 0, 2 2, 0 1, 2 p1 (1 p1 ) p2 (1 p2 )
2 = + .
n1 n2
Aqui nao estamos interessados nos nveis de contaminacao mas sim em sua va- O erro padrao da diferenca amostral de proporcoes e estimado por
riacao. A media e o desvio padrao amostrais sao d = 0, 9 e s = 0, 81 respectiva-
s
mente. Entao o erro padrao e 0, 81/ 6 = 0, 33. Podemos agora realizar um teste p1 (1 p1 ) p2 (1 p2 )
t pareado para testar a hipotese nula de que a perda na concentracao media e 0. EP (p2 p1 ) = + .
n1 n2
Para isso calculamos
d 0 0, 9 e com isto podemos construir um intervalo de confianca da forma usual, ou seja
t=
EP(d) = 0, 33 = 2, 73.
Note que este valor e negativo (porque a mudanca media observada foi a reducao (p2 p1 ) z/2 EP (p2 p1 ).
na concentracao do poluente, um valor positivo seria um aumento na concentracao
do poluente). Observamos o valor absoluto da estatstica de teste (2,73) na tabela Podemos tambem testar as hipoteses
da distribuicao t, usando a linha com n 1 = 5 graus de liberdade. A quinta
H 0 : p2 p1 = 0
linha da tabela mostra que 0, 04 < p valor < 0, 05 (porque o valor 2,73 esta
entre os valores tabelados 2,571 e 4,032). Entao, rejeitamos a hipotese nula ao H1 : p2 p1 6= 0.
nvel de 5%. Em outras palavras, existe evidencia ao nvel de 5% de que a area
usando a estatstica
em estudo sofreu uma reducao em media nos nveis do contaminante durante o (p2 p1 ) 0
perodo de seis meses. T =
EP
e comparando este valor com a tabela da normal padronizada.
conceitualmente elas sao diferentes. e do teorema central do limite e propriedades da distribuicao normal segue que
Exemplo 5.3 : A mudanca nos nveis de um contaminante numa certa area do p2 p1 N(p2 p1 , 2 )
incio ao final de seis meses de observacao foram (em /l):
sendo s
1, 5 0, 6 0, 3 0, 2 2, 0 1, 2 p1 (1 p1 ) p2 (1 p2 )
2 = + .
n1 n2
Aqui nao estamos interessados nos nveis de contaminacao mas sim em sua va- O erro padrao da diferenca amostral de proporcoes e estimado por
riacao. A media e o desvio padrao amostrais sao d = 0, 9 e s = 0, 81 respectiva-
s
mente. Entao o erro padrao e 0, 81/ 6 = 0, 33. Podemos agora realizar um teste p1 (1 p1 ) p2 (1 p2 )
t pareado para testar a hipotese nula de que a perda na concentracao media e 0. EP (p2 p1 ) = + .
n1 n2
Para isso calculamos
d 0 0, 9 e com isto podemos construir um intervalo de confianca da forma usual, ou seja
t=
EP(d) = 0, 33 = 2, 73.
Note que este valor e negativo (porque a mudanca media observada foi a reducao (p2 p1 ) z/2 EP (p2 p1 ).
na concentracao do poluente, um valor positivo seria um aumento na concentracao
do poluente). Observamos o valor absoluto da estatstica de teste (2,73) na tabela Podemos tambem testar as hipoteses
da distribuicao t, usando a linha com n 1 = 5 graus de liberdade. A quinta
H 0 : p2 p1 = 0
linha da tabela mostra que 0, 04 < p valor < 0, 05 (porque o valor 2,73 esta
entre os valores tabelados 2,571 e 4,032). Entao, rejeitamos a hipotese nula ao H1 : p2 p1 6= 0.
nvel de 5%. Em outras palavras, existe evidencia ao nvel de 5% de que a area
usando a estatstica
em estudo sofreu uma reducao em media nos nveis do contaminante durante o (p2 p1 ) 0
perodo de seis meses. T =
EP
e comparando este valor com a tabela da normal padronizada.
Captulo 6
Correlacao e Regressao
99
98 CAPITULO 5. COMPARANDO GRUPOS
Captulo 6
Correlacao e Regressao
99
100 CAPITULO 6. CORRELACAO E REGRESSAO 6.2. INTERPRETACAO DO COEFICIENTE DE CORRELACAO 101
Embora seja intuitiva esta medida e de difcil interpretacao pois esta definida
Figura 6.1: Exemplo de grafico de pontos entre duas variaveis contnuas.
na reta dos reais e depende das escalas dos dados. Por exemplo se multiplicar-
mos todos os valores de x por uma constante entao a covariancia tambem fica
multiplicada por esta constante.
Dividindo-se a covariancia amostral pelos desvios padrao amostrais obtemos
2.0
uma medida do grau de associacao linear entre duas variaveis que e adimensional
e de mais facil interpretacao. Esta nova medida chama-se coeficiente de correlacao
amostral e e definida como
sxy
r= .
1.5
sx sy
y
P
0.2 0.3 0.4 0.5 0.6 0.7 0.8 obteve-se x = 0, 48, y = 1, 58, sx = 0, 18, sy = 0, 54 e xi yi = 12, 44. A partir
x destes valores podemos calcular a covariancia amostral sxy = 0, 0712 e portanto
a correlacao amostral e r = 0, 732. Isto indica que possivelmente estas variaveis
estao negativamente correlacionadas (ao menos linearmente).
6.1 Definicoes
O coeficiante de correlacao populacional (que e um parametro desconhecido) e
Seja x1 , . . . , xn e y1 , . . . , yn os valores amostrais de duas variaveis X e Y . Sejam denotado pela letra grega e tambem esta definido no intervalo [-1,1]. Os valores
x, y, sx e sy as medias e desvios padrao amostrais dos dois conjuntos de dados. -1 e 1 representam correlacao linear perfeita (negativa ou positiva) enquanto o
A ideia aqui e tentar quantificar o grau de associacao linear entre X e Y a partir valor zero representa ausencia de correlacao linear. Podemos considerar r como
dos desvios em torno das medias amostrais, definindo-se para cada par (xi , yi) o sendo uma estimativa de , da mesma forma que x e uma estimativa da media
produto populacional . Na Figura 6.2 estao alguns exemplos de graficos de pontos com
ci = (xi x) (yi y). seus coeficientes de correlacao amostrais calculados.
Intuitivamente, se valores altos de x tendem a acompanhar valores altos de y, e
se valores baixos de x acompanham valores baixos de y entao ci tendera a ser
positivo em sua maioria (correlacao positiva). Se valores altos de x acompanham 6.2 Interpretacao do coeficiente de correlacao
valores baixos de y e vice-versa entao a maioria dos valores ci serao negativos
(correlacao negativa). Se nao existir associacao entre x e y entao se tomarmos O valor de r esta sempre entre -1 e 1, com r = 0 correspondendo a nao associacao.
a media aritmetica dos valores ci , valores positivos e negativos tenderao a se
negativos negativa
cancelar e a media sera proxima de zero. Valores de r indicam uma associacao
positivos positiva
A covariancia amostral de x e y e definida como
Pn Pn Usamos o termo correlacao positiva quando r > 0, e nesse caso a medida que
(xi x)(yi y) xi yi nxy
sxy = i=1 = i=1 . x cresce tambem cresce y, e correlacao negativa quando r < 0, e nesse caso a
n1 n1
medida que x cresce, y decresce (em media).
sendo essencialmente a media dos valores de ci acima. Quanto maior o valor de r (positivo ou negativo), mais forte a associacao. Nos
100 CAPITULO 6. CORRELACAO E REGRESSAO 6.2. INTERPRETACAO DO COEFICIENTE DE CORRELACAO 101
Embora seja intuitiva esta medida e de difcil interpretacao pois esta definida
Figura 6.1: Exemplo de grafico de pontos entre duas variaveis contnuas.
na reta dos reais e depende das escalas dos dados. Por exemplo se multiplicar-
mos todos os valores de x por uma constante entao a covariancia tambem fica
multiplicada por esta constante.
Dividindo-se a covariancia amostral pelos desvios padrao amostrais obtemos
2.0
uma medida do grau de associacao linear entre duas variaveis que e adimensional
e de mais facil interpretacao. Esta nova medida chama-se coeficiente de correlacao
amostral e e definida como
sxy
r= .
1.5
sx sy
y
P
0.2 0.3 0.4 0.5 0.6 0.7 0.8 obteve-se x = 0, 48, y = 1, 58, sx = 0, 18, sy = 0, 54 e xi yi = 12, 44. A partir
x destes valores podemos calcular a covariancia amostral sxy = 0, 0712 e portanto
a correlacao amostral e r = 0, 732. Isto indica que possivelmente estas variaveis
estao negativamente correlacionadas (ao menos linearmente).
6.1 Definicoes
O coeficiante de correlacao populacional (que e um parametro desconhecido) e
Seja x1 , . . . , xn e y1 , . . . , yn os valores amostrais de duas variaveis X e Y . Sejam denotado pela letra grega e tambem esta definido no intervalo [-1,1]. Os valores
x, y, sx e sy as medias e desvios padrao amostrais dos dois conjuntos de dados. -1 e 1 representam correlacao linear perfeita (negativa ou positiva) enquanto o
A ideia aqui e tentar quantificar o grau de associacao linear entre X e Y a partir valor zero representa ausencia de correlacao linear. Podemos considerar r como
dos desvios em torno das medias amostrais, definindo-se para cada par (xi , yi) o sendo uma estimativa de , da mesma forma que x e uma estimativa da media
produto populacional . Na Figura 6.2 estao alguns exemplos de graficos de pontos com
ci = (xi x) (yi y). seus coeficientes de correlacao amostrais calculados.
Intuitivamente, se valores altos de x tendem a acompanhar valores altos de y, e
se valores baixos de x acompanham valores baixos de y entao ci tendera a ser
positivo em sua maioria (correlacao positiva). Se valores altos de x acompanham 6.2 Interpretacao do coeficiente de correlacao
valores baixos de y e vice-versa entao a maioria dos valores ci serao negativos
(correlacao negativa). Se nao existir associacao entre x e y entao se tomarmos O valor de r esta sempre entre -1 e 1, com r = 0 correspondendo a nao associacao.
a media aritmetica dos valores ci , valores positivos e negativos tenderao a se
negativos negativa
cancelar e a media sera proxima de zero. Valores de r indicam uma associacao
positivos positiva
A covariancia amostral de x e y e definida como
Pn Pn Usamos o termo correlacao positiva quando r > 0, e nesse caso a medida que
(xi x)(yi y) xi yi nxy
sxy = i=1 = i=1 . x cresce tambem cresce y, e correlacao negativa quando r < 0, e nesse caso a
n1 n1
medida que x cresce, y decresce (em media).
sendo essencialmente a media dos valores de ci acima. Quanto maior o valor de r (positivo ou negativo), mais forte a associacao. Nos
102 CAPITULO 6. CORRELACAO E REGRESSAO 6.2. INTERPRETACAO DO COEFICIENTE DE CORRELACAO 103
H0 : = 0
H1 : 6= 0.
H0 : = 0
H1 : 6= 0.
5
r t g.l. IC 95% p-valor
0
0,9914 40,1368 28 0,9819 0,9960 < 0,001
3
0,7477 5,9590 28 0,5303 0,8729 < 0,001
5
0,0259 0,1372 28 -0,3375 0,3826 0,8918
y
r= 0.11
2
-0,9981 -84,8822 28 -0,9991 -0,9959 < 0,001
10
r= 0.21
15
0
20
Observacoes Discrepantes 2 1 0 1 2 2 1 0 1 2 3
x x
(a) (b)
A reta de regressao e estimada com base na soma de quadrados das distancias dos
pontos em relacao a reta. Por isso, observacoes discrepantes ou outliers podem Figura 6.3: Exemplos de associacao nao linear entre duas variaveis simuladas.
ter uma grande influencia na estimativa da inclinacao da reta e consequentemente
no coeficiente de correlacao amostral.
Correlacao nao significa causalidade
Um dos erros de interpretacao mais comuns e assumir que correlacoes signifi-
Linearidade e normalidade
cativas necessariamente implicam em uma relacao de causa e efeito entre duas
E bom enfatizar que somente relacoes lineares sao detectadas pelo coeficiente de variaveis. Esta interpretacao e incorreta. Na verdade e extremamente difcil es-
correlacao que acabamos de descrever (tambem chamado coeficiente de correlacao tabelecer relacoes causais a partir de dados observados. Seria preciso realizar
de Pearson). Ou seja, aceitar a hipotese de que = 0 nao necessariamente implica experimentos controlados para obter mais evidencias de um relacao causal.
que as variaveis nao estejam de alguma forma associadas. Tambem e preciso ter cuidado ao assumir que existe correlacao somente porque
duas variaveis seguem o mesmo padrao de variabilidade. A correlacao pode ser
Por exemplo, nos graficos da Figura 6.3, mesmo existindo uma clara relacao
devida a uma terceira variavel influenciando as duas primeiras.
(nao-linear) entre as variaveis x e y, o coeficiente de correlacao e estatisticamente
Finalmente, vale notar que correlacoes estatisticamente significativas (i.e.
zero (Verifique!).
quando se rejeita a hipotese de correlacao nula) nao necessariamente tem sig-
A mensagem aqui e que deve-se sempre fazer o grafico dos dados de modo que se nificado pratico. Por exemplo, que conclusoes poderia-se tirar de uma correlacao
possa tentar visualizar tais relacoes. significativa positiva entre nascimento de bebes e numero de cegonhas em deter-
minada regiao?
Resumindo, se encontramos uma associacao ou correlacao entre duas variaveis
Transformacoes X e Y podem existir diversas explicacoes do porque elas variam conjuntamente,
incluindo:
Em alguns casos pode ser apropriado e mesmo justificavel fazer transformacoes
em x e/ou y induzindo uma relacao linear na escala transformada. Por exemplo, Mudancas em X causam mudancas em Y .
na Figura 6.4 o grafico da esquerda mostra os gastos militares contra o produto
Mudancas em Y causam mudancas em X.
interno bruto em 75 pases. E difcil vizualizar uma relacao linear entre estas
variaveis especialmente para valores grandes. No grafico da direita foi tomado o Mudancas em outras variaveis causam mudancas tanto em X quanto em
logaritmo natural das variaveis e a relacao linear fica bem mais aparente. Y.
104 CAPITULO 6. CORRELACAO E REGRESSAO 6.2. INTERPRETACAO DO COEFICIENTE DE CORRELACAO 105
5
r t g.l. IC 95% p-valor
0
0,9914 40,1368 28 0,9819 0,9960 < 0,001
3
0,7477 5,9590 28 0,5303 0,8729 < 0,001
5
0,0259 0,1372 28 -0,3375 0,3826 0,8918
y
r= 0.11
2
-0,9981 -84,8822 28 -0,9991 -0,9959 < 0,001
10
r= 0.21
15
0
20
Observacoes Discrepantes 2 1 0 1 2 2 1 0 1 2 3
x x
(a) (b)
A reta de regressao e estimada com base na soma de quadrados das distancias dos
pontos em relacao a reta. Por isso, observacoes discrepantes ou outliers podem Figura 6.3: Exemplos de associacao nao linear entre duas variaveis simuladas.
ter uma grande influencia na estimativa da inclinacao da reta e consequentemente
no coeficiente de correlacao amostral.
Correlacao nao significa causalidade
Um dos erros de interpretacao mais comuns e assumir que correlacoes signifi-
Linearidade e normalidade
cativas necessariamente implicam em uma relacao de causa e efeito entre duas
E bom enfatizar que somente relacoes lineares sao detectadas pelo coeficiente de variaveis. Esta interpretacao e incorreta. Na verdade e extremamente difcil es-
correlacao que acabamos de descrever (tambem chamado coeficiente de correlacao tabelecer relacoes causais a partir de dados observados. Seria preciso realizar
de Pearson). Ou seja, aceitar a hipotese de que = 0 nao necessariamente implica experimentos controlados para obter mais evidencias de um relacao causal.
que as variaveis nao estejam de alguma forma associadas. Tambem e preciso ter cuidado ao assumir que existe correlacao somente porque
duas variaveis seguem o mesmo padrao de variabilidade. A correlacao pode ser
Por exemplo, nos graficos da Figura 6.3, mesmo existindo uma clara relacao
devida a uma terceira variavel influenciando as duas primeiras.
(nao-linear) entre as variaveis x e y, o coeficiente de correlacao e estatisticamente
Finalmente, vale notar que correlacoes estatisticamente significativas (i.e.
zero (Verifique!).
quando se rejeita a hipotese de correlacao nula) nao necessariamente tem sig-
A mensagem aqui e que deve-se sempre fazer o grafico dos dados de modo que se nificado pratico. Por exemplo, que conclusoes poderia-se tirar de uma correlacao
possa tentar visualizar tais relacoes. significativa positiva entre nascimento de bebes e numero de cegonhas em deter-
minada regiao?
Resumindo, se encontramos uma associacao ou correlacao entre duas variaveis
Transformacoes X e Y podem existir diversas explicacoes do porque elas variam conjuntamente,
incluindo:
Em alguns casos pode ser apropriado e mesmo justificavel fazer transformacoes
em x e/ou y induzindo uma relacao linear na escala transformada. Por exemplo, Mudancas em X causam mudancas em Y .
na Figura 6.4 o grafico da esquerda mostra os gastos militares contra o produto
Mudancas em Y causam mudancas em X.
interno bruto em 75 pases. E difcil vizualizar uma relacao linear entre estas
variaveis especialmente para valores grandes. No grafico da direita foi tomado o Mudancas em outras variaveis causam mudancas tanto em X quanto em
logaritmo natural das variaveis e a relacao linear fica bem mais aparente. Y.
106 CAPITULO 6. CORRELACAO E REGRESSAO 6.3. PROBLEMAS 107
ou 64%. Ou seja, cerca de 36% da variabilidade nos gastos militares nao pode ser
Figura 6.4: Gastos militares contra o produto interno bruto de 75 pases na escala
original (esquerda) e logaritmica (direita). descrita ou explicada pela variabilidade nos PIB e portanto fica claro que existem
outros fatores que poderiam ser importantes.
6.3 Problemas
1. Dados os valores x=(-2,-1,0,1,2) e y=(4,2,0,1,2) calcule o coeficiente de
8 correlacao amostral e teste a hipotese de correlacao nula. Faca um grafico
6000 de dispersao e comente os resultados.
2. Dados os valores x=(-2,-1,0,1,2) e y=(-8,-1,0,1,8) calcule o coeficiente de
6
4000 correlacao amostral. Teste a hipotese de nao haver correlacao linear. Qual
a sua conclusao notando que yi = x3i ?
2000 4 3. Verifique o que ocorre com a covariancia amostral se
(a) uma constante k for somada a todos os valores de x;
0
2
(b) todos os valores de x forem multiplicados por uma constante k;
0 50000 100000 150000 6 7 8 9 10 11 12
(c) idem para o coeficiente de correlacao amostral
Gross Domestic Product Log Gross Domestic Product 4. Comente os resultados da Tabela 6.1. Nesta tabela obtenha intervalos de
confianca de 98% para o coeficiente de correlacao linear populacional.
ou 64%. Ou seja, cerca de 36% da variabilidade nos gastos militares nao pode ser
Figura 6.4: Gastos militares contra o produto interno bruto de 75 pases na escala
original (esquerda) e logaritmica (direita). descrita ou explicada pela variabilidade nos PIB e portanto fica claro que existem
outros fatores que poderiam ser importantes.
6.3 Problemas
1. Dados os valores x=(-2,-1,0,1,2) e y=(4,2,0,1,2) calcule o coeficiente de
8 correlacao amostral e teste a hipotese de correlacao nula. Faca um grafico
6000 de dispersao e comente os resultados.
2. Dados os valores x=(-2,-1,0,1,2) e y=(-8,-1,0,1,8) calcule o coeficiente de
6
4000 correlacao amostral. Teste a hipotese de nao haver correlacao linear. Qual
a sua conclusao notando que yi = x3i ?
2000 4 3. Verifique o que ocorre com a covariancia amostral se
(a) uma constante k for somada a todos os valores de x;
0
2
(b) todos os valores de x forem multiplicados por uma constante k;
0 50000 100000 150000 6 7 8 9 10 11 12
(c) idem para o coeficiente de correlacao amostral
Gross Domestic Product Log Gross Domestic Product 4. Comente os resultados da Tabela 6.1. Nesta tabela obtenha intervalos de
confianca de 98% para o coeficiente de correlacao linear populacional.
Ni Cr Ni Cr 6.4 Regressao
5.2 16,8 4,5 15,5
5.0 20,0 5,4 13,0 Em muitas situacoes o fenomeno a ser estudado envolve duas ou mais variaveis
6.8 14,2 8,8 12,5 e para responder a certas questoes cientficas precisamos estabelecer uma relacao
7.5 17,5 18,0 20,2 funcional entre elas. Um problema de regressao consiste em determinar a funcao
2.5 10,1 6,2 12,5 que descreve esta relacao. Aqui estudaremos somente o caso em que esta relacao
5.0 15,5 20,5 13,5 e descrita por uma funcao linear. Veremos primeiro o caso particular de duas
7.5 13,8 10,0 17,8 variaveis.
7.0 18,2 4,0 12,8 Por exemplo, se conhecemos a altura de um indivduo, mas nao o seu peso,
8.0 13,0 4,4 12,2 qual seria um bom chute para o peso deste indivduo? O coeficiente de correlacao
4.0 15,0 15,9 13,0 apenas indica a grau de associacao como um unico numero. Suponha que dis-
pomos de amostras de alturas x1 , . . . , xn e pesos y1 , . . . , yn de n indivduos. Por
enquanto vamos ignorar se eles sao do sexo masculino ou feminino. Se estamos
(a) Faca o grafico destes dados com Ni no eixo x. interessados em predizer o peso a partir da altura entao nao temos uma relacao
(b) Calcule o coeficiente de correlacao amostral para estes dados e verifique simetrica entre as duas variaveis. Chamamos peso de variavel resposta ou depen-
se o valor obtido parece consistente com seu grafico. dente, e altura de variavel explicativa, preditora, regressora ou independente.
Em um grafico de pontos os valores da variavel resposta (y) sao em geral
(c) Qual proporcao da variabilidade na concentracao de Cr pode ser ex- dispostos no eixo vertical, e da variavel explicativa (x) no eixo horizontal. Por
plicada pela concentracao de Ni? exemplo, na Figura 6.5 temos 30 observacoes de pesos e alturas de indivduos
selecionados aleatoriamente em uma populacao.
8. Em um estudo da influencia de processos praianos no condicionamento do
angulo de inclinacao do fundo oceanico situado logo apos a linha da mare
90
baixa a estirancio mediu-se a profundidade da lamina dagua (em pes). Os
dados coletados foram:
80
angulo de 0.68 0.85 0.66 0.50 1.86 2.33 2.17 1.83 1.68
pesos
inclinacao y 2.05 1.83 1.84 1.87 1.82 1.85 1.75 1.51 1.38
70
profundidade x 12.4 11.4 10.7 11.6 11.3 10.7 11.1 12.8 13.3
13.3 14.1 13.4 13.5 13.3 14.4 14.1 15.3 14.0
60
(a) Faca o grafico desses dados com profundidade da lamina dagua no 150 155 160 165
alturas
170 175 180
eixo x.
Figura 6.5: 30 observacoes de pesos e alturas de indivduos em uma populacao.
(b) Calcule o coeficiente de correlacao, r e interprete o resultado obtido.
(c) Qual proporcao da variabilidade em angulo de inclinacao pode ser Se a relacao entre as duas variaveis e aproximadamente linear, entao os dados
explicada por profundidade da lamina dagua? podem ser resumidos atraves do ajuste de uma reta passando pelos pontos. A
108 CAPITULO 6. CORRELACAO E REGRESSAO 6.4. REGRESSAO 109
Ni Cr Ni Cr 6.4 Regressao
5.2 16,8 4,5 15,5
5.0 20,0 5,4 13,0 Em muitas situacoes o fenomeno a ser estudado envolve duas ou mais variaveis
6.8 14,2 8,8 12,5 e para responder a certas questoes cientficas precisamos estabelecer uma relacao
7.5 17,5 18,0 20,2 funcional entre elas. Um problema de regressao consiste em determinar a funcao
2.5 10,1 6,2 12,5 que descreve esta relacao. Aqui estudaremos somente o caso em que esta relacao
5.0 15,5 20,5 13,5 e descrita por uma funcao linear. Veremos primeiro o caso particular de duas
7.5 13,8 10,0 17,8 variaveis.
7.0 18,2 4,0 12,8 Por exemplo, se conhecemos a altura de um indivduo, mas nao o seu peso,
8.0 13,0 4,4 12,2 qual seria um bom chute para o peso deste indivduo? O coeficiente de correlacao
4.0 15,0 15,9 13,0 apenas indica a grau de associacao como um unico numero. Suponha que dis-
pomos de amostras de alturas x1 , . . . , xn e pesos y1 , . . . , yn de n indivduos. Por
enquanto vamos ignorar se eles sao do sexo masculino ou feminino. Se estamos
(a) Faca o grafico destes dados com Ni no eixo x. interessados em predizer o peso a partir da altura entao nao temos uma relacao
(b) Calcule o coeficiente de correlacao amostral para estes dados e verifique simetrica entre as duas variaveis. Chamamos peso de variavel resposta ou depen-
se o valor obtido parece consistente com seu grafico. dente, e altura de variavel explicativa, preditora, regressora ou independente.
Em um grafico de pontos os valores da variavel resposta (y) sao em geral
(c) Qual proporcao da variabilidade na concentracao de Cr pode ser ex- dispostos no eixo vertical, e da variavel explicativa (x) no eixo horizontal. Por
plicada pela concentracao de Ni? exemplo, na Figura 6.5 temos 30 observacoes de pesos e alturas de indivduos
selecionados aleatoriamente em uma populacao.
8. Em um estudo da influencia de processos praianos no condicionamento do
angulo de inclinacao do fundo oceanico situado logo apos a linha da mare
90
baixa a estirancio mediu-se a profundidade da lamina dagua (em pes). Os
dados coletados foram:
80
angulo de 0.68 0.85 0.66 0.50 1.86 2.33 2.17 1.83 1.68
pesos
inclinacao y 2.05 1.83 1.84 1.87 1.82 1.85 1.75 1.51 1.38
70
profundidade x 12.4 11.4 10.7 11.6 11.3 10.7 11.1 12.8 13.3
13.3 14.1 13.4 13.5 13.3 14.4 14.1 15.3 14.0
60
(a) Faca o grafico desses dados com profundidade da lamina dagua no 150 155 160 165
alturas
170 175 180
eixo x.
Figura 6.5: 30 observacoes de pesos e alturas de indivduos em uma populacao.
(b) Calcule o coeficiente de correlacao, r e interprete o resultado obtido.
(c) Qual proporcao da variabilidade em angulo de inclinacao pode ser Se a relacao entre as duas variaveis e aproximadamente linear, entao os dados
explicada por profundidade da lamina dagua? podem ser resumidos atraves do ajuste de uma reta passando pelos pontos. A
110 CAPITULO 6. CORRELACAO E REGRESSAO 6.4. REGRESSAO 111
equacao dessa reta e dada por metodo de mnimos quadrados (MMQ) e as estimativas de e , denotadas por
e , sao entao as estimativas de mnimos quadrados1.
y = + x Igualando a zero a primeira derivada de S(, ) em relacao a e e resolvendo
para e nao e difcil verificar que a melhor reta segundo este criterio de
onde o intercepto e a inclinacao sao parametros desconhecidos. Existe uma
estimacao e aquela tal que
infinidade de possveis retas passando pelos pontos mas intuitivamente queremos
P P
aquela que forneca pequenas diferencas entre os pesos observados (yi ) e aqueles (yi y)(xi x) x y nxy sxy
= P = P i 2i = 2
dados pela reta para as alturas correspondentes. Estas diferencas (ou erros) sao (xi x)2 x nx2 sx
entao dadas por = y x. (6.1)
yi xi
As condicoes de segunda ordem tambem devem ser verificadas para garantir que
e estao representadas pelas linhas verticais na Figura 6.6 para 11 pontos.
este e um ponto de mnimo. Note que pode reescrito como
sy sxy sy
= =r
sy s2x sx
90
Exemplo 6.3 : Suponha que para o exemplo das alturas e pesos de indivduos
obtivemos = 51, 17 kg e = 0, 68 kg/cm. Entao a reta de regressao estimada
e dada por
70
y = 51, 17 + 0, 68x.
O valor estimado de (0,68) pode ser interpretado como o aumento medio (ou
aumento esperado) no peso quando a altura aumenta de 1cm. O valor estimado
60
de (-51,17) nao possui qualquer significado ja que neste caso nao faz sentido
incluir o ponto x = 0. Esta reta ajustada e uma estimativa da reta de regressao
150 155 160 165 170 175 180 populacional (desconhecida), y = + x.
equacao dessa reta e dada por metodo de mnimos quadrados (MMQ) e as estimativas de e , denotadas por
e , sao entao as estimativas de mnimos quadrados1.
y = + x Igualando a zero a primeira derivada de S(, ) em relacao a e e resolvendo
para e nao e difcil verificar que a melhor reta segundo este criterio de
onde o intercepto e a inclinacao sao parametros desconhecidos. Existe uma
estimacao e aquela tal que
infinidade de possveis retas passando pelos pontos mas intuitivamente queremos
P P
aquela que forneca pequenas diferencas entre os pesos observados (yi ) e aqueles (yi y)(xi x) x y nxy sxy
= P = P i 2i = 2
dados pela reta para as alturas correspondentes. Estas diferencas (ou erros) sao (xi x)2 x nx2 sx
entao dadas por = y x. (6.1)
yi xi
As condicoes de segunda ordem tambem devem ser verificadas para garantir que
e estao representadas pelas linhas verticais na Figura 6.6 para 11 pontos.
este e um ponto de mnimo. Note que pode reescrito como
sy sxy sy
= =r
sy s2x sx
90
Exemplo 6.3 : Suponha que para o exemplo das alturas e pesos de indivduos
obtivemos = 51, 17 kg e = 0, 68 kg/cm. Entao a reta de regressao estimada
e dada por
70
y = 51, 17 + 0, 68x.
O valor estimado de (0,68) pode ser interpretado como o aumento medio (ou
aumento esperado) no peso quando a altura aumenta de 1cm. O valor estimado
60
de (-51,17) nao possui qualquer significado ja que neste caso nao faz sentido
incluir o ponto x = 0. Esta reta ajustada e uma estimativa da reta de regressao
150 155 160 165 170 175 180 populacional (desconhecida), y = + x.
1.4
2. a variancia de y e constante, ou seja e a mesma para todos os valores de x,
1.2
1.5
3. a variacao aleatoria de y para qualquer valor fixo de x segue uma distri-
1.0
buicao normal, e estes termos de erro sao independentes.
0.8
1.0
sqrt(y)
0.6
Em termos algebricos, dada uma amostra de pontos (xi , yi ), i = 1, . . . , n o
modelo de regressao linear e dado por
0.4
0.5
0.2
yi = + xi + i (6.2)
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(a) (b)
entre y e x. Para satisfazer as tres suposicoes acima segue entao que
Figura 6.7: Diagramas de dispersao. (a) Dados que satisfazem as suposicoes do modelo
i Normal(0, 2 ) de regressao linear simples, (b) dados que nao satisfazem as suposicoes.
o que e equivalente a
yi|xi Normal( + xi , 2 ). ajustada y = + x sobre um diagrama de dispersao dos dados para checar se o
modelo e razoavel. Devemos procurar por evidencias de uma relacao nao-linear,
Os parametros e sao frequentemente chamados de coeficientes da regressao. ou desvios muito extremos da reta ajustada.
Em particular, e denominado coeficiente ou efeito de x sobre y ja que representa
Se julgamos que o modelo esta razoavel, podemos tambem estimar 2 , a
o aumento (ou reducao) esperado em y quando x aumenta de 1 unidade. O
variancia dos erros i. Em geral a formula utilizada e
parametro e a resposta media no ponto x = 0 e so tem interpretacao pratica
se o modelo inclui este ponto. 1 X
n
1.4
2. a variancia de y e constante, ou seja e a mesma para todos os valores de x,
1.2
1.5
3. a variacao aleatoria de y para qualquer valor fixo de x segue uma distri-
1.0
buicao normal, e estes termos de erro sao independentes.
0.8
1.0
sqrt(y)
0.6
Em termos algebricos, dada uma amostra de pontos (xi , yi ), i = 1, . . . , n o
modelo de regressao linear e dado por
0.4
0.5
0.2
yi = + xi + i (6.2)
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
(a) (b)
entre y e x. Para satisfazer as tres suposicoes acima segue entao que
Figura 6.7: Diagramas de dispersao. (a) Dados que satisfazem as suposicoes do modelo
i Normal(0, 2 ) de regressao linear simples, (b) dados que nao satisfazem as suposicoes.
o que e equivalente a
yi|xi Normal( + xi , 2 ). ajustada y = + x sobre um diagrama de dispersao dos dados para checar se o
modelo e razoavel. Devemos procurar por evidencias de uma relacao nao-linear,
Os parametros e sao frequentemente chamados de coeficientes da regressao. ou desvios muito extremos da reta ajustada.
Em particular, e denominado coeficiente ou efeito de x sobre y ja que representa
Se julgamos que o modelo esta razoavel, podemos tambem estimar 2 , a
o aumento (ou reducao) esperado em y quando x aumenta de 1 unidade. O
variancia dos erros i. Em geral a formula utilizada e
parametro e a resposta media no ponto x = 0 e so tem interpretacao pratica
se o modelo inclui este ponto. 1 X
n
Podemos agora obter uma estimativa da variancia dos erros, Ambas tem distribuicao t de Student com n 2 graus de liberdade e as demons-
tracoes sao omitidas. Assim, podemos construir intervalos de confianca obtendo
29 52, 62 o valor de t na tabela apropriada
2 = 81 = 52, 4.
28 91
s P 2
Um grafico dos dados com a reta ajustada e dado na Figura 6.8 O ajuste da xi t
t P e pP .
n (xi x)2 (xi x)2
H0 : = 0
H1 : 6= 0
80
ou seja, de que nao exista relacao entre x e y. Nesse caso, apos observar os dados
calcula-se o valor da estatstica de teste sob H0
peso
!
qX
2
t= (xi x)
70
Exemplo 6.5 : Para os dados da Figura 6.5, para testar a hipotese nula de nao
existencia de relacao entre altura e peso calculamos
130 140 150 160 170 180 190
altura
qX p
(xi x)2 = (n 1)Sx2 = 29 91 = 51, 37
Figura 6.8: Dados de altura e peso com a reta de regressao ajustada. e a estatstica de teste fica
reta nao parece tao bom. Existem dois pontos bem distantes da reta ajustada, p
t = 51, 37 0, 58/ 52, 4 = 4, 12.
que parecem ter tido uma grande influencia no ajuste. Na pratica e aconselhavel
investigar a acuracia destes valores e/ou verificar quanto muda a reta ajustada Na tabela t com 28 graus de liberdade obtem-se que o p-valor e menor do que
quando estes pontos sao removidos. 0,1% e portanto ha evidencia forte contra a hipotese H0 : = 0.
Podemos agora obter uma estimativa da variancia dos erros, Ambas tem distribuicao t de Student com n 2 graus de liberdade e as demons-
tracoes sao omitidas. Assim, podemos construir intervalos de confianca obtendo
29 52, 62 o valor de t na tabela apropriada
2 = 81 = 52, 4.
28 91
s P 2
Um grafico dos dados com a reta ajustada e dado na Figura 6.8 O ajuste da xi t
t P e pP .
n (xi x)2 (xi x)2
H0 : = 0
H1 : 6= 0
80
ou seja, de que nao exista relacao entre x e y. Nesse caso, apos observar os dados
calcula-se o valor da estatstica de teste sob H0
peso
!
qX
2
t= (xi x)
70
Exemplo 6.5 : Para os dados da Figura 6.5, para testar a hipotese nula de nao
existencia de relacao entre altura e peso calculamos
130 140 150 160 170 180 190
altura
qX p
(xi x)2 = (n 1)Sx2 = 29 91 = 51, 37
Figura 6.8: Dados de altura e peso com a reta de regressao ajustada. e a estatstica de teste fica
reta nao parece tao bom. Existem dois pontos bem distantes da reta ajustada, p
t = 51, 37 0, 58/ 52, 4 = 4, 12.
que parecem ter tido uma grande influencia no ajuste. Na pratica e aconselhavel
investigar a acuracia destes valores e/ou verificar quanto muda a reta ajustada Na tabela t com 28 graus de liberdade obtem-se que o p-valor e menor do que
quando estes pontos sao removidos. 0,1% e portanto ha evidencia forte contra a hipotese H0 : = 0.
No entanto deve-se tomar um certo cuidado com transformacoes. Elas podem 4. Explique porque na Figura 6.7(b) os dados nao parecem satisfazer as su-
ser muito uteis em algumas situacoes, mas so devem ser consideradas como um posicoes do modelo de regressao linear (6.2).
ultimo recurso ja que quando uma ou ambas as variaveis sao transformadas, os
coeficientes deixam de ter interpretacoes diretas. 5. Comente os resultados na Figura 6.8.
Na pratica precisamos entao escolher uma transformacao que faca a relacao
6. Deseja-se verificar se uma determinada substancia encontrada em pastos
ser aproximadamente linear e que ainda permaneca interpretavel. Por exemplo,
pode ser usada para melhorar o ganho de peso em bovinos. Foram sele-
frequentemente as relacoes sao multiplicativas ao inves de aditivas e nestes casos
cionadas acaso 15 bois de mesma raca e idade e cada um recebeu uma
transformacoes logartmicas sao particularmente uteis.
concentracao X da substancia (em mg/l). Apos 30 dias foram medidos
os ganhos de peso Y (em Kg) para cada animal. Com os dados resultan-
P P 2
6.4.5 Representacao Matricial tes obteve-se: x = 2, 7, y = 16, 14,
P 2
xi yi = 785, 55, xi = 163, 39 e
yi = 4329, 43.
O modelo de regressao linear (6.2) pode ser representado em forma matricial.
Empilhando todas as observacoes e definindo (a) Estime a reta de regressao e interprete os valores dos coeficientes.
(b) Teste a hipotese de que esta substancia influencia no ganho de peso
y1 1 x1 1
dos animais.
y = ... X = ... ... = = ...
yn 1 xn n 7. Na analise de um certo combustvel obteve-se as observacoes abaixo das
variaveis poder calorfico (y) e percentual de cinzas (x)
podemos reescrever o modelo como y = X + . Esta representacao sera util
quando mais variaveis explicativas forem introduzidas.
y 13100 11200 10200 9600 8800
x 18,3 27,5 36,4 48,5 57,8
6.4.6 Problemas
1. No modelo de regressao linear simples (6.2), (a) Obtenha a reta de regressao estimada e interprete os coeficientes esti-
mados,
(a) mostre que as estimativas de mnimos quadrados sao aquelas dadas (b) estime o poder calorfico para 30% de cinzas,
pelas expressoes (6.1);
(c) esboce o diagrama de pontos com a reta ajustada.
(b) verifique o que ocorre com as estimativas se uma constante k for so-
mada a todos os valores de x; 8. Comente os resultados abaixo que foram obtidos ao estimar um modelo de
(c) verifique o que ocorre com as estimativas se todos os valores de x forem regressao linear em um pacote estatstico.
multiplicados por uma constante k;
Estimativas EP estatistica t P-valor
(d) derive a expressao (6.3) para estimativa de 2 .
Intercepto 3.7960 2.1616 1.756 0.09001
2. No modelo de regressao log(yi ) = + xi + i , i = 1, . . . , n, qual o efeito inclinac~
ao -0.7400 0.2417 -3.062 0.00482
esperado sobre y quando x aumenta de 1 unidade.
variancia dos erros: 11.33 com 28 graus de liberdade
3. Em um modelo de regressao linear as variaveis y e x sao medidas em Kg e
metros respectivamente. Se o modelo estimado foi y = 2, 3 + 8, 2 x qual 9. Os dados abaixo sao referentes ao consumo per capita de vinho (x) e a taxa
o aumento esperado em y se x aumentar em 1cm? de mortalidade por infarto (y) observada em 9 pases.
116 CAPITULO 6. CORRELACAO E REGRESSAO 6.4. REGRESSAO 117
No entanto deve-se tomar um certo cuidado com transformacoes. Elas podem 4. Explique porque na Figura 6.7(b) os dados nao parecem satisfazer as su-
ser muito uteis em algumas situacoes, mas so devem ser consideradas como um posicoes do modelo de regressao linear (6.2).
ultimo recurso ja que quando uma ou ambas as variaveis sao transformadas, os
coeficientes deixam de ter interpretacoes diretas. 5. Comente os resultados na Figura 6.8.
Na pratica precisamos entao escolher uma transformacao que faca a relacao
6. Deseja-se verificar se uma determinada substancia encontrada em pastos
ser aproximadamente linear e que ainda permaneca interpretavel. Por exemplo,
pode ser usada para melhorar o ganho de peso em bovinos. Foram sele-
frequentemente as relacoes sao multiplicativas ao inves de aditivas e nestes casos
cionadas acaso 15 bois de mesma raca e idade e cada um recebeu uma
transformacoes logartmicas sao particularmente uteis.
concentracao X da substancia (em mg/l). Apos 30 dias foram medidos
os ganhos de peso Y (em Kg) para cada animal. Com os dados resultan-
P P 2
6.4.5 Representacao Matricial tes obteve-se: x = 2, 7, y = 16, 14,
P 2
xi yi = 785, 55, xi = 163, 39 e
yi = 4329, 43.
O modelo de regressao linear (6.2) pode ser representado em forma matricial.
Empilhando todas as observacoes e definindo (a) Estime a reta de regressao e interprete os valores dos coeficientes.
(b) Teste a hipotese de que esta substancia influencia no ganho de peso
y1 1 x1 1
dos animais.
y = ... X = ... ... = = ...
yn 1 xn n 7. Na analise de um certo combustvel obteve-se as observacoes abaixo das
variaveis poder calorfico (y) e percentual de cinzas (x)
podemos reescrever o modelo como y = X + . Esta representacao sera util
quando mais variaveis explicativas forem introduzidas.
y 13100 11200 10200 9600 8800
x 18,3 27,5 36,4 48,5 57,8
6.4.6 Problemas
1. No modelo de regressao linear simples (6.2), (a) Obtenha a reta de regressao estimada e interprete os coeficientes esti-
mados,
(a) mostre que as estimativas de mnimos quadrados sao aquelas dadas (b) estime o poder calorfico para 30% de cinzas,
pelas expressoes (6.1);
(c) esboce o diagrama de pontos com a reta ajustada.
(b) verifique o que ocorre com as estimativas se uma constante k for so-
mada a todos os valores de x; 8. Comente os resultados abaixo que foram obtidos ao estimar um modelo de
(c) verifique o que ocorre com as estimativas se todos os valores de x forem regressao linear em um pacote estatstico.
multiplicados por uma constante k;
Estimativas EP estatistica t P-valor
(d) derive a expressao (6.3) para estimativa de 2 .
Intercepto 3.7960 2.1616 1.756 0.09001
2. No modelo de regressao log(yi ) = + xi + i , i = 1, . . . , n, qual o efeito inclinac~
ao -0.7400 0.2417 -3.062 0.00482
esperado sobre y quando x aumenta de 1 unidade.
variancia dos erros: 11.33 com 28 graus de liberdade
3. Em um modelo de regressao linear as variaveis y e x sao medidas em Kg e
metros respectivamente. Se o modelo estimado foi y = 2, 3 + 8, 2 x qual 9. Os dados abaixo sao referentes ao consumo per capita de vinho (x) e a taxa
o aumento esperado em y se x aumentar em 1cm? de mortalidade por infarto (y) observada em 9 pases.
118 CAPITULO 6. CORRELACAO E REGRESSAO 6.5. REGRESSAO LINEAR MULTIPLA 119
x 2,8 3,2 3,3 5,1 5,9 6,0 7,9 10,2 10,8 um modelo de regressao linear multipla levara em conta todas estas correlacoes
y 11,2 14,0 12,6 8,2 7,0 4,2 2,6 1,8 3,2 simultaneamente.
P9 P9
Sabe-se que x = 6, 1, y = 7, 2, i=1 xi yi = 299, 5, i=1 x2i = 409 e Exemplo 6.7 : Um fabricante de borrachas (de apagar lapis) tem interesse em
P9 2
i=1 yi = 634. determinar a perda de abrasividade apos certo tempo de uso, porem esta variavel e
muito cara de ser medida diretamente. Uma sada e tentar medi-la indiretamente
(a) Calcule o coeficiente de correlacao amostral e comente.
a partir de outras variaveis e para isto foi coletada uma amostra de 30 borrachas
(b) Teste a hipotese de que nao existe correlacao linear. aonde foram medidas as variaveis Perda de abrasividade, Dureza e Resistencia a
(c) Obtenha a reta de regressao estimada e interprete os coeficientes esti- tensao.
mados.
(d) Estime a taxa de mortalidade se o consumo per capita for igual a 9. Figura 6.9: Investigando associacao entre as 4 variaveis do Exemplo 6.6.
(e) Teste a hipotese de que o consumo per capita de vinho nao influencia 10 5 0 5 10 10 5 0 5 10
40
a taxa de mortalidade por infarto.
20
(f) Como fica a reta de regressao se estes 9 pases duplicarem o consumo
y
0
per capita de vinho?
20
40
6.5 Regressao Linear Multipla
10
Dada uma variavel dependente y e k variaveis explicativas x1 , . . . , xk e n ob-
5
servacoes destas variaveis o modelo de regressao linear multipla e dado por x1
0
5
yi = + 1 xi1 + + k xik + i , i = 1, . . . , n. (6.4)
10
10
Em palavras,
y = combinacao linear dos X s + erro.
5
x2
0
Os erros i representam desvios (supostos independentes) da relacao linear
entre y e x1 , . . . , xk e assume-se que i N(0, 2 ). Equivalentemente,
5
10
yi |xi1 , . . . , xik N( + 1 xi1 + + k xik , 2 ).
10
5
Aqui cada coeficiente j representa o efeito de xj sobre y quando todas as outras
x3
0
variaveis sao mantidas constantes. Neste caso temos k + 2 parametros a serem
estimados.
5
10
Exemplo 6.6 : Em um problema de regressao com uma variavel resposta y e 40 20 0 20 40 10 5 0 5 10
x 2,8 3,2 3,3 5,1 5,9 6,0 7,9 10,2 10,8 um modelo de regressao linear multipla levara em conta todas estas correlacoes
y 11,2 14,0 12,6 8,2 7,0 4,2 2,6 1,8 3,2 simultaneamente.
P9 P9
Sabe-se que x = 6, 1, y = 7, 2, i=1 xi yi = 299, 5, i=1 x2i = 409 e Exemplo 6.7 : Um fabricante de borrachas (de apagar lapis) tem interesse em
P9 2
i=1 yi = 634. determinar a perda de abrasividade apos certo tempo de uso, porem esta variavel e
muito cara de ser medida diretamente. Uma sada e tentar medi-la indiretamente
(a) Calcule o coeficiente de correlacao amostral e comente.
a partir de outras variaveis e para isto foi coletada uma amostra de 30 borrachas
(b) Teste a hipotese de que nao existe correlacao linear. aonde foram medidas as variaveis Perda de abrasividade, Dureza e Resistencia a
(c) Obtenha a reta de regressao estimada e interprete os coeficientes esti- tensao.
mados.
(d) Estime a taxa de mortalidade se o consumo per capita for igual a 9. Figura 6.9: Investigando associacao entre as 4 variaveis do Exemplo 6.6.
(e) Teste a hipotese de que o consumo per capita de vinho nao influencia 10 5 0 5 10 10 5 0 5 10
40
a taxa de mortalidade por infarto.
20
(f) Como fica a reta de regressao se estes 9 pases duplicarem o consumo
y
0
per capita de vinho?
20
40
6.5 Regressao Linear Multipla
10
Dada uma variavel dependente y e k variaveis explicativas x1 , . . . , xk e n ob-
5
servacoes destas variaveis o modelo de regressao linear multipla e dado por x1
0
5
yi = + 1 xi1 + + k xik + i , i = 1, . . . , n. (6.4)
10
10
Em palavras,
y = combinacao linear dos X s + erro.
5
x2
0
Os erros i representam desvios (supostos independentes) da relacao linear
entre y e x1 , . . . , xk e assume-se que i N(0, 2 ). Equivalentemente,
5
10
yi |xi1 , . . . , xik N( + 1 xi1 + + k xik , 2 ).
10
5
Aqui cada coeficiente j representa o efeito de xj sobre y quando todas as outras
x3
0
variaveis sao mantidas constantes. Neste caso temos k + 2 parametros a serem
estimados.
5
10
Exemplo 6.6 : Em um problema de regressao com uma variavel resposta y e 40 20 0 20 40 10 5 0 5 10
n
1 X
350
2 = (yi 1 xi1 k xik )2 .
n k 1 i=1
300
250
Abrasividade Para construir intervalos de confianca e testar hipoteses sobre os coeficientes
200
usa-se novamente a distribuicao t. Neste caso pode-se mostrar que a estatstica
150
100
j j
p ,
50
hj
90
Dureza p
j t 2 hj .
60
240
H0 : j = 0
220
H1 : j 6= 0
200
ou seja queremos testar se xj nao explica significativamente a variabilidade em
180
Tensao
y.
160
Apos estimar o modelo gostariamos de ter uma ideia sobre qual proporcao da
140
variabilidade em y esta sendo explicada pelas outras variaveis. Esta variabilidade
120
50 100 150 200 250 300 350 120 140 160 180 200 220 240 pode ser particionada da seguinte forma,
n
X n
X n
X
(yi y)2 = (yi y)2 + (yi yi )2
definimos
i=1 i=1 i=1
| {z } | {z } | {z }
SQT SQReg SQR
y1 1 x11 x1k 1 1
y = ... X = ... ... .. = ... . sendo
. = .
..
yn 1 xn1 xnk n
k SQT: a soma de quadrados total (a variabilidade total em y).
O elemento xij da matriz X representa a i-esima observacao da variavel xj e SQReg: a soma de quadrados da regressao (a variabilidade em y induzida
queremos estimar os elementos do vetor . pelas variaveis regressoras).
Pode-se mostrar que as estimativas dos coeficientes da regressao sao dadas
por SQR: a soma de quadrados residual (a variabilidade em y nao induzida
= (X X)1 X y pelas variaveis regressoras).
120 CAPITULO 6. CORRELACAO E REGRESSAO 6.5. REGRESSAO LINEAR MULTIPLA 121
n
1 X
350
2 = (yi 1 xi1 k xik )2 .
n k 1 i=1
300
250
Abrasividade Para construir intervalos de confianca e testar hipoteses sobre os coeficientes
200
usa-se novamente a distribuicao t. Neste caso pode-se mostrar que a estatstica
150
100
j j
p ,
50
hj
90
Dureza p
j t 2 hj .
60
240
H0 : j = 0
220
H1 : j 6= 0
200
ou seja queremos testar se xj nao explica significativamente a variabilidade em
180
Tensao
y.
160
Apos estimar o modelo gostariamos de ter uma ideia sobre qual proporcao da
140
variabilidade em y esta sendo explicada pelas outras variaveis. Esta variabilidade
120
50 100 150 200 250 300 350 120 140 160 180 200 220 240 pode ser particionada da seguinte forma,
n
X n
X n
X
(yi y)2 = (yi y)2 + (yi yi )2
definimos
i=1 i=1 i=1
| {z } | {z } | {z }
SQT SQReg SQR
y1 1 x11 x1k 1 1
y = ... X = ... ... .. = ... . sendo
. = .
..
yn 1 xn1 xnk n
k SQT: a soma de quadrados total (a variabilidade total em y).
O elemento xij da matriz X representa a i-esima observacao da variavel xj e SQReg: a soma de quadrados da regressao (a variabilidade em y induzida
queremos estimar os elementos do vetor . pelas variaveis regressoras).
Pode-se mostrar que as estimativas dos coeficientes da regressao sao dadas
por SQR: a soma de quadrados residual (a variabilidade em y nao induzida
= (X X)1 X y pelas variaveis regressoras).
122 CAPITULO 6. CORRELACAO E REGRESSAO 6.5. REGRESSAO LINEAR MULTIPLA 123
O ajuste sera tanto melhor quanto mais proximo a SQReg estiver da SQT, ou Este teste pode ser formulado como
equivalentemente quanto menor for a SQR. Uma forma de medir isto e atraves
do chamado coeficiente de correlacao multipla denotado por R2 e definido como H0 : 1 = 2 = = k = 0
P H1 : ao menos um coeficiente e nao nulo.
SQReg SQR (yi y)2
R2 = =1 =P
SQT SQT (yi y)2 ou seja os coeficientes de todas as regressoras sao conjuntamente iguais a zero.
2 A estatstica de teste neste caso e
sendo que 0 R 1. Quanto mais proximo de 1 melhor e o ajuste do modelo.
SQReg/k
F = .
Exemplo 6.8 : Para um conjunto de 100 observacoes foi ajustando um modelo SQR/(n k + 1)
de regressao usando um pacote estatstico e obteve-se os resultados abaixo.
Quando H0 e verdadeira esta estatstica tem distribuicao F com k e n k + 1
graus de liberdade no numerador e denominador. Se H0 for falsa entao espera-se
Estimativa EP estatistica t p-valor
que SQReg > SQR e portanto valores grandes de F indicam evidencia contra H0 .
Intercepto 0.19 0.09 2.11 0.03746
Assim, o teste e do tipo unilateral.
x1 -1.51 0.51 -2.96 0.00387
Tambem nao e difcil verificar a relacao da estatstica F com o R2 ja que
x2 2.23 1.21 1.84 0.06842
x3 -1.25 1.01 -1.24 0.218 SQReg = R2 SQT e SQR = (1 R2 )SQT.
sigma: 0.9695 com 96 graus de liberdade
correlac~
ao multipla: 0.68 Portanto,
n k + 1 R2
F = .
Note que os coeficientes de x2 e x3 nao sao significativos ao nvel de 5% ja os k 1 R2
p-valores correspondentes sao maiores do que 0,05. Ou seja existe evidencia nos
dados de que 2 = 0 e 3 = 0. O coeficiente de correlacao multipla tambem e Exemplo 6.9 : No Exemplo 6.8 temos que n = 100, k = 3 e R2 = 0, 68. A
muito pequeno (0,68) indicando que em torno de 32% da variabilidade em y e estatstica F entao fica
explicada por outras variaveis que nao entraram no modelo. 100 3 + 1 0, 68
F = = 69, 41667
3 0, 32
Deve-se ter um certo cuidado na interpretacao do R2 uma vez que e sem-
pre possvel aumentar o seu valor acrescentando-se mais variaveis regressoras ao e comparando com o valor tabelado para o
modelo. Uma forma de corrigir isto e calcular o R2 ajustado,
O ajuste sera tanto melhor quanto mais proximo a SQReg estiver da SQT, ou Este teste pode ser formulado como
equivalentemente quanto menor for a SQR. Uma forma de medir isto e atraves
do chamado coeficiente de correlacao multipla denotado por R2 e definido como H0 : 1 = 2 = = k = 0
P H1 : ao menos um coeficiente e nao nulo.
SQReg SQR (yi y)2
R2 = =1 =P
SQT SQT (yi y)2 ou seja os coeficientes de todas as regressoras sao conjuntamente iguais a zero.
2 A estatstica de teste neste caso e
sendo que 0 R 1. Quanto mais proximo de 1 melhor e o ajuste do modelo.
SQReg/k
F = .
Exemplo 6.8 : Para um conjunto de 100 observacoes foi ajustando um modelo SQR/(n k + 1)
de regressao usando um pacote estatstico e obteve-se os resultados abaixo.
Quando H0 e verdadeira esta estatstica tem distribuicao F com k e n k + 1
graus de liberdade no numerador e denominador. Se H0 for falsa entao espera-se
Estimativa EP estatistica t p-valor
que SQReg > SQR e portanto valores grandes de F indicam evidencia contra H0 .
Intercepto 0.19 0.09 2.11 0.03746
Assim, o teste e do tipo unilateral.
x1 -1.51 0.51 -2.96 0.00387
Tambem nao e difcil verificar a relacao da estatstica F com o R2 ja que
x2 2.23 1.21 1.84 0.06842
x3 -1.25 1.01 -1.24 0.218 SQReg = R2 SQT e SQR = (1 R2 )SQT.
sigma: 0.9695 com 96 graus de liberdade
correlac~
ao multipla: 0.68 Portanto,
n k + 1 R2
F = .
Note que os coeficientes de x2 e x3 nao sao significativos ao nvel de 5% ja os k 1 R2
p-valores correspondentes sao maiores do que 0,05. Ou seja existe evidencia nos
dados de que 2 = 0 e 3 = 0. O coeficiente de correlacao multipla tambem e Exemplo 6.9 : No Exemplo 6.8 temos que n = 100, k = 3 e R2 = 0, 68. A
muito pequeno (0,68) indicando que em torno de 32% da variabilidade em y e estatstica F entao fica
explicada por outras variaveis que nao entraram no modelo. 100 3 + 1 0, 68
F = = 69, 41667
3 0, 32
Deve-se ter um certo cuidado na interpretacao do R2 uma vez que e sem-
pre possvel aumentar o seu valor acrescentando-se mais variaveis regressoras ao e comparando com o valor tabelado para o
modelo. Uma forma de corrigir isto e calcular o R2 ajustado,
Quando x2 e mantida constante, a cada mudanca de uma unidade em x1 , E.P. residual: 3.803 com 45 g.l.
a mudanca na resposta media sera 1 + 3 x2 . R-Quadrado: 0.3385
Estatistica F: 5.76 com 4 e 45 g.l., p-valor: 0.0007904
Quando x1 e mantida constante, a cada mudanca de uma unidade em x2 ,
a mudanca na resposta media sera 2 + 3 x1 . 5. Escreva em notacao matricial os seguintes modelos
3. No Exemplo 6.7, foi estimado um modelo de regressao linear para a Abra- 6. No itens (b) e (c) do Exerccio 5 qual o efeito de um aumento de 1 unidade
sividade tendo Dureza e Resistencia a tensao como regressoras. Comente em x1 sobre a resposta media?
os resultados obtidos abaixo.
7. Explique intuitivamente por que a inclusao de variaveis regressoras no mo-
delo aumenta o valor de R2 .
Estimativa E.P. Estatistica t p-valor
Intercepto 885.1611 61.7516 14.334 3.84e-14 8. No modelo de regressao log(yi ) = + 1 xi1 + 2 xi2 + i , i = 1, . . . , n, qual
Dureza -6.5708 0.5832 -11.267 1.03e-11 o efeito esperado sobre y quando x1 aumenta de 2 unidades.
Tensao -1.3743 0.1943 -7.073 1.32e-07
Quando x2 e mantida constante, a cada mudanca de uma unidade em x1 , E.P. residual: 3.803 com 45 g.l.
a mudanca na resposta media sera 1 + 3 x2 . R-Quadrado: 0.3385
Estatistica F: 5.76 com 4 e 45 g.l., p-valor: 0.0007904
Quando x1 e mantida constante, a cada mudanca de uma unidade em x2 ,
a mudanca na resposta media sera 2 + 3 x1 . 5. Escreva em notacao matricial os seguintes modelos
3. No Exemplo 6.7, foi estimado um modelo de regressao linear para a Abra- 6. No itens (b) e (c) do Exerccio 5 qual o efeito de um aumento de 1 unidade
sividade tendo Dureza e Resistencia a tensao como regressoras. Comente em x1 sobre a resposta media?
os resultados obtidos abaixo.
7. Explique intuitivamente por que a inclusao de variaveis regressoras no mo-
delo aumenta o valor de R2 .
Estimativa E.P. Estatistica t p-valor
Intercepto 885.1611 61.7516 14.334 3.84e-14 8. No modelo de regressao log(yi ) = + 1 xi1 + 2 xi2 + i , i = 1, . . . , n, qual
Dureza -6.5708 0.5832 -11.267 1.03e-11 o efeito esperado sobre y quando x1 aumenta de 2 unidades.
Tensao -1.3743 0.1943 -7.073 1.32e-07
126 127
Referencias Apendice A
126 127
137
Captulo 1
Secao 1.7
Apendice B P P
1. (a) Basta espandir o quadrado e usar ni=1 xi = nx, (b) use ni=1 (k + xi ) =
Pn Pn Pn
nk + i=1 xi , (c) use i=1 (kxi ) = k i=1 xi .
Solucoes de Exerccios 3. x = 1000, s2 = 400 reais2 , CV (X) 2% e Mediana(X) = 900.
Selecionados
Captulo 2
Secao 2.5
3. S = {(CC), (CR), (RC), (RR)} onde C=cara e R=coroa. Por exemplo
o evento A=pelo menos 2 caras e dado por A = {(CC)} que e equivalente
ao evento B=exatamente 2 caras.
5. A = {(3, 3), (4, 2), (2, 4), (1, 5), (5, 1)}
B = {(3, 1), . . . , (3, 6), (4, 1), . . . , (4, 6), (5, 1), . . . , (5, 6), (6, 1), . . . , (6, 6)}
A B = {(3, 3), (4, 2), (5, 1)}
P (A B) = 3/36
7. (a) 1 p q + pq (b) p + q pq
9. 1/2
Secao 2.8
4 P (acertar mais de 80% das questoes) 0,001
7. (a) Modelo binomial, assumindo que eles aumentam ou nao sua produtividade
de forma independente e que a probabilidade disto ocorrer e a mesma para
todos eles. (b) 0, 82 (c) 0, 003 (aproximacao de Poisson).
136
11. 0, 61
137
Captulo 1
Secao 1.7
Apendice B P P
1. (a) Basta espandir o quadrado e usar ni=1 xi = nx, (b) use ni=1 (k + xi ) =
Pn Pn Pn
nk + i=1 xi , (c) use i=1 (kxi ) = k i=1 xi .
Solucoes de Exerccios 3. x = 1000, s2 = 400 reais2 , CV (X) 2% e Mediana(X) = 900.
Selecionados
Captulo 2
Secao 2.5
3. S = {(CC), (CR), (RC), (RR)} onde C=cara e R=coroa. Por exemplo
o evento A=pelo menos 2 caras e dado por A = {(CC)} que e equivalente
ao evento B=exatamente 2 caras.
5. A = {(3, 3), (4, 2), (2, 4), (1, 5), (5, 1)}
B = {(3, 1), . . . , (3, 6), (4, 1), . . . , (4, 6), (5, 1), . . . , (5, 6), (6, 1), . . . , (6, 6)}
A B = {(3, 3), (4, 2), (5, 1)}
P (A B) = 3/36
7. (a) 1 p q + pq (b) p + q pq
9. 1/2
Secao 2.8
4 P (acertar mais de 80% das questoes) 0,001
7. (a) Modelo binomial, assumindo que eles aumentam ou nao sua produtividade
de forma independente e que a probabilidade disto ocorrer e a mesma para
todos eles. (b) 0, 82 (c) 0, 003 (aproximacao de Poisson).
136
11. 0, 61
138 APENDICE B. SOLUCOES DE EXERCICIOS SELECIONADOS 139
12. (a) 0,1359, (b) acima de 44 anos. 5 Defina X: tempo de execucao da tarefa, sendo que X N(, 2 ). (a) teste
H0 : = 100 H1 : < 100. (b) teste H0 : 2 = 225 H1 : 2 6= 225.
13. 0, 025
6 Rejeita-se com p-valor bilateral igual a 0,02652
14. O numero esperado de alunos com alturas superiores a 1,68 e 1000 x 0,6554
= 655 8 (a) teste unilateral, p-valor<0,01. (b) teste unilateral, 0,05<p-valor<0,10.
15. (a) m = 17, 4 (b) 0, 5753 h = 5, 3 = 2, 05
Secao 4.10
Captulo 3 1 n > 18, 642
10 0,0898 Captulo 5
1 [72,19; 73,61] 1 (a) IC de 98% para a razao de variancias [0,00689; 3,302]. (b) Assumindo
variancias iguais (do item (a)) IC de 95% para a diferenca entre os tempos
2 IC de 95% [1,27; 1,73] medios fica [237,16; 382,84].
6 [1,799; 0,4701] 4 H0 : D = 0 H1 : D > 0. Da Tab. A.2 com 9 g.l. obtemos que P (T >
2, 821) = 0, 01. Valor observado da estatstica foi 3,6 > 2,821 e rejeita-se
7 [0,3148; 0,4452]
H0 ao nvel de 1%, i.e. a bebida alcoolica teve um efeito significativo.
12. (a) 0,1359, (b) acima de 44 anos. 5 Defina X: tempo de execucao da tarefa, sendo que X N(, 2 ). (a) teste
H0 : = 100 H1 : < 100. (b) teste H0 : 2 = 225 H1 : 2 6= 225.
13. 0, 025
6 Rejeita-se com p-valor bilateral igual a 0,02652
14. O numero esperado de alunos com alturas superiores a 1,68 e 1000 x 0,6554
= 655 8 (a) teste unilateral, p-valor<0,01. (b) teste unilateral, 0,05<p-valor<0,10.
15. (a) m = 17, 4 (b) 0, 5753 h = 5, 3 = 2, 05
Secao 4.10
Captulo 3 1 n > 18, 642
10 0,0898 Captulo 5
1 [72,19; 73,61] 1 (a) IC de 98% para a razao de variancias [0,00689; 3,302]. (b) Assumindo
variancias iguais (do item (a)) IC de 95% para a diferenca entre os tempos
2 IC de 95% [1,27; 1,73] medios fica [237,16; 382,84].
6 [1,799; 0,4701] 4 H0 : D = 0 H1 : D > 0. Da Tab. A.2 com 9 g.l. obtemos que P (T >
2, 821) = 0, 01. Valor observado da estatstica foi 3,6 > 2,821 e rejeita-se
7 [0,3148; 0,4452]
H0 ao nvel de 1%, i.e. a bebida alcoolica teve um efeito significativo.
Secao 6.4.6
1 (b) = e = k . (c) = k1 e = .
2 exp()y.
Secao 6.5
8 exp(21 )y.
Estatstica II - 1a lista de exerccios
1. Identifique cada uma das variaveis abaixo como quantitativa (discreta ou contnua)
ou qualitativa (nominal ou ordinal)
3. A tabela abaixo apresenta valores medidos da altura (em polegadas), peso (em
libras) e cintura (em polegadas) de 20 indivduos.
individuo 1 2 3 4 5
Altura 67.75 72.25 66.25 72.25 71.25
Peso 154.25 173.25 154 184.75 184.25
Cintura 94.5 98.7 99.2 101.2 101.9
individuo 6 7 8 9 10
Altura 74.75 69.75 72.5 74 73.5
Peso 210.25 181 176 191 198.25
Cintura 107.8 100.3 97.1 99.9 104.1
individuo 11 12 13 14 15
Altura 74.5 76 69.5 71.25 69.5
Peso 186.25 216 180.5 205.25 187.75
Cintura 98.2 107.7 103.9 108.6 100.1
individu 16 17 18 19 20
Altura 66 71 71 67.75 73.5
Peso 162.75 195.75 209.25 183.75 211.75
Cintura 99.2 105.2 107 102.4 109
(a) Utilize as ferramentas vistas no curso e faca uma analise descritiva de cada
uma destas variaveis individualmente. Comente os resultados. Utilize as
seguintes classes de frequencias para as variaveis Altura e Cintura,
Altura [66,68) [68,70) [70,72) [72,74) [74,76]
Cintura [94,96) [96,98) [98,100) [100,102)
[102,104) [104,106) [106,108) [108,110)
(b) Faca um diagrama de dispersao para cada um dos 3 pares de variaveis.
Comente os resultados.
Estatstica II - 2a lista de exerccios
1. Sabe-se que a probabilidade do aluno A tirar nota baixa em uma prova e 0,5 e
esta probabilidade e 0,2 para o aluno B. Sabe-se tambem que a probabilidade
de ambos tirarem nota baixa e 0,1. Calcule a probabilidade de que
(a) Calcule a probabilidade de uma garrafa conter pelo menos 0,48 litro.
(b) Calcule o volume x tal que 95% das garrafas tenham menos de x litros.
10. Uma empresa contratada para fazer a descontaminacao do solo de uma area
afetada por um acidente ecologico e paga por cada metro cubico de material
excavado e tratado. A probabilidade de uma particular amostra exceder o nvel
de tolerancia e 0,46. Qual a probabilidade de que no maximo 7 num total de
10 amostras excedam o nvel de tolerancia?
12. O comprimento de uma peca de maquina tem distribuicao normal com media
11 cm e desvio-padrao 0.2 cm. Se as especificacoes exigem que o comprimento
esteja entre 10,6 e 11,2 cm centmetros, que proporcao de peca sera rejeitada
em media. Ou seja, qual a probabilidade de sortear aleatoriamente uma peca e
esta nao atender as especificacoes.
13. Usinas nucleares que utilizam agua para refrigeracao de seus condensadores
algumas vezes liberam agua quente em rios, lagos ou oceanos. Sabe-se que a
agua quente acima de certa temperatura tem um efeito indesejado sobre plantas
e animais que vivem nesses ambientes. Suponha que a alta temperatura liberada
por uma certa usina nuclear tem uma distribuicao Normal com media 5 C e um
desvio padrao de 0,5 C.
14. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma media de
72,9 batidas por minuto (bpm) e um desvio padrao de 11,0 bpm foram obtidos.
Um histograma dos dados mostra uma clara forma normal. De uma amplitude
de referencia de 95% para pulsos em repouso de pessoas sadias com base nesses
dados.
Estatstica II - 3a lista de exerccios
2. Uma analise dos numeros de horas por semana que os calouros universitarios
dedicam ao estudo acusam media de 7,06 horas e desvio-padrao de 5,32 ho-
ras. Selecionados aleatoriamente 55 calouros, determine a probabilidade de seu
tempo semanal medio de estudo exceder 7,00 horas.
3. As idades dos avioes comerciais dos EUA tem uma media de 13 anos e um desvio
padrao de 7,9 anos (com base em dados de Departamento de Aviacao Civil dos
EUA). Se Administracao Federal de Aviacao seleciona aleatoriamente 35 avioes
comerciais para um teste especial de resistencia, determine a probabilidade de
a idade media desse grupo de avioes ser superior a 15 anos.
0 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1
7. A Basf garante que as gravacoes feitas com suas fitas de vdeo podem ser re-
produzidas 1000 vezes com variancia de 900 vezes. Tomada uma amostra de 20
fitas, calcule a probabilidade de obter um desvio padrao para as reproducoes
que seja,
(a) Utilizando os valores amostrais 4,9; 7,0; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2
unidades, determine o intervalo de confianca para a resistencia media com
um coeficiente de confianca 0,90.
(b) Repita o item anterior suponha que nao fosse conhecido o desvio padrao.
Estatstica II - 4a lista de exerccios
4. Levantamentos amostrais indicam que uma certa doenca costuma atingir 10%
da populacao. Foi realizada uma campanha de vacinacao e apos alguns meses
foi selecionada uma amostra de 20 pessoas para verificar se esta proporcao se
reduziu.