Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
i 1
xi x
n
i 1
yi y
xi x
i 1
xiyi
2
n
i 1
a y bx
i 1
i 1
yi b
n
n
i 1
2
i
xi
i 1
n
n
x
i 1 i
yi
s xy
s2x
xi
EXERCCIOS RESOLVIDOS
R7.1) O problema mais grave do estado do RJ
Considere uma pesquisa por amostragem feita em 1986 junto populao do estado do Rio de Janeiro.
Foram ouvidas 1.230 pessoas que, entre outras coisas, apontaram qual era, em sua opinio, o problema mais
grave do estado naquele momento. Com base nos dados brutos, foi obtida a tabela a seguir.
Frequncias e percentuais dos 1.230 respondentes da Pesquisa junto populao
do estado do RJ em 1986, segundo o problema mais grave do Estado
Construa o grfico de barras e o grfico de setores (ou grfico pizza) com base nessa tabela de frequncias.
264
ook.indb 264
07/08/2012 09:5
EXERCCIOS PROPOSTOS
P7.1) Um erro grosseiro, mas (infelizmente) bastante comum
A partir dos dados x 1 , x 2 ,..., x n , calcula-se a varincia da varivel X pela expresso
n
x i
n
2
x i i =1
n
s2 = i = 1
n1
Ento, se n
5
i 1
5, x 1
3, x 2
5, x 3
0, x 4
2, x 5
6 , temos:
x i 2 32 52 02 22 62 74
74
74
74
5 =
5 = 14,8
Logo, s2 =
51
4
74
No de Obs.
5
4
Mdia
7,4
11,5
Desvio Padro
6,309
9,983
a) Considerando agora a amostra combinada, ou seja, a amostra composta por todas as nove observaes, qual o valor da sua mdia?
b) Qual o seu desvio padro?
P7.3) Atualizao da mediana
Temos um conjunto de dados com 11 observaes j devidamente ordenadas:
x (1) < x (2) < x (3) < ... < x (11).
Quais das seguintes afirmaes esto corretas e quais esto erradas? Por qu?
a) A mediana desses dados Q2 x 6 .
b) Suponha que foi eliminada desse conjunto de dados original a maior observao x(11). Ento a nova
1
x 1 x 10 .
mediana agora
2
c) Suponha que foi adicionada ao conjunto de dados original mais uma observao, de modo que ele
passou a ter 12 observaes. Ento a diferena entre o maior valor possvel da nova mediana e o
ELSEVIER
P R O B A B I L I D A D E E E S TAT S T I C A
80,1
66,5
70,4
64,1
67,8
79,0
70,9
70,6
72,1
70,3
75,1
63,1
73,0
64,4
59,4
74,9
77,2
75,3
1
2
3
4
5
6
7
72,2 80,1 70,4 67,8 70,9 72,1 75,1
Posio
Valor
11
12
13
65,1 66,5 64,1
Posio Q2
1 20
10,5
2
Posio(Q1)
1 10,5
5,75
2
Posio(Q3)
10,5 20
15,25
2
14
79
8
73
9
10
59,4 77,2
15
16
17
18
19
20
70,6 70,3 63,1 64,4 74,9 75,3
1
1
77,2
65,1 71,15
2
2
Q2
Q1
1
3
70,9
72,1 71,8
4
4
Q3
3
1
70,6
70,3 70,525
4
4
Frequncia
344
419
530
443
320
229
220
ELSEVIER
P R O B A B I L I D A D E E E S TAT S T I C A
80,1
66,5
70,4
64,1
67,8
79,0
70,9
70,6
72,1
70,3
75,1
63,1
73,0
64,4
59,4
74,9
77,2
75,3
1
2
3
4
5
6
7
72,2 80,1 70,4 67,8 70,9 72,1 75,1
Posio
Valor
11
12
13
65,1 66,5 64,1
Posio Q2
1 20
10,5
2
Posio(Q1)
1 10,5
5,75
2
Posio(Q3)
10,5 20
15,25
2
14
79
8
73
9
10
59,4 77,2
15
16
17
18
19
20
70,6 70,3 63,1 64,4 74,9 75,3
1
1
77,2
65,1 71,15
2
2
Q2
Q1
1
3
70,9
72,1 71,8
4
4
Q3
3
1
70,6
70,3 70,525
4
4
Frequncia
344
419
530
443
320
229
220
99
80
11
2.695
278
book.indb 278
07/08/2012 09:54:31
Acre
Alagoas
Amap
Amazonas
Bahia
Cear
D. Federal
E. Santo
Gois
183,8
125,4
193,3
162,0
142,3
140,6
456,8
228,7
231,4
Maranho
M. Grosso
M. G. do Sul
Minas Gerais
Par
Paraba
Paran
Pernambuco
Piau
86,1
199,6
235,3
218,6
128,0
125,4
244,2
147,8
118,2
Rio Janeiro
R. G. do Norte
R. G. do Sul
Rondnia
Roraima
Santa Catarina
So Paulo
Sergipe
Tocantins
347,5
150,1
236,9
214,6
214,1
257,3
362,8
140,7
113,8
a)
b)
c)
d)
Rio Janeiro
Gois
R. G. do Sul
Paran
M. G. do Sul
Sta. Catarina
Pernambuco
Paraba
Piau
341,30
344,83
354,61
362,32
364,96
375,94
395,26
398,41
404,86
Minas Gerais
Mato Grosso
R. G. do Norte
Acre
So Paulo
Maranho
E. Santo
Bahia
Cear
414,94
418,41
418,41
421,94
436,68
440,53
446,43
456,62
467,29
D. Federal
Tocantins
Rondnia
Alagoas
Par
Sergipe
Amazonas
Roraima
Amap
469,48
471,70
497,51
507,61
520,83
552,49
641,03
653,59
800,00
a)
b)
c)
d)
279
book.indb 279
07/08/2012 09:54:31
ELSEVIER
P R O B A B I L I D A D E E E S TAT S T I C A
e .
Obs.: Essa uma avaliao probabilstica do procedimento para apontar observaes aberrantes (usando
medidas resistentes) que foi exposto na teoria, para o caso de dados provenientes de um modelo Gaussiano.
P7.9) Proximidade entre medidas de centralidade e entre medidas de disperso
Quando o ramo-folha, obtido com base em um conjunto de dados relativos a uma determinada varivel,
sugere que:
existe simetria em torno de um valor central;
no h observaes discrepantes;
qual a sua expectativa no que se refere:
proximidade entre a mdia e a mediana dessa varivel?
proximidade entre o desvio padro e a distncia interquartil dessa varivel?
Justifique as suas respostas.
Sugesto: Imagine, por exemplo, que os dados foram gerados a partir de uma distribuio Normal.
P7.10) Nmero de hotis nos municpios da Regio Serrana do RJ
Os dados a seguir se referem ao nmero de estabelecimentos hoteleiros em cada um dos 37 municpios
da Regio Serrana do Estado de Rio de Janeiro em 2001.
Nmero de hotis na Regio Serrana do RJ 2001
Municpio
Areal
Barra Mansa
Barra do Pira
Engo. Paulo de Frontin
Itatiaia
Maring
Maromba
Penedo
Mendes
Paraba do Sul
Pira
Porto Real
Quatis
Hotis
3
22
18
8
121
17
20
55
5
12
7
4
5
Municpio
Resende
Engenheiro Passos
Visconde de Mau
Rio Claro
Rio das Flores
Sapucaia
Trs Rios
Valena
Conservatria
Volta Redonda
C. de Macacu
Guapimirim
Miguel Pereira
Hotis
36
4
12
10
2
5
15
34
20
14
14
7
12
Municpio
Nova Friburgo
Lumiar
So Pedro da Serra
Paty do Alferes
Petrpolis
Petrpolis / arredores
Rio Bonito
S. J. do Vale do Rio Preto
Silva Jardim
Terespolis
Vassouras
Hotis
84
16
14
8
83
58
6
5
6
44
9
280
book.indb 280
07/08/2012 09:54:31
ok.indb 279
Acre
Alagoas
Amap
Amazonas
Bahia
Cear
D. Federal
E. Santo
Gois
183,8
125,4
193,3
162,0
142,3
140,6
456,8
228,7
231,4
Maranho
M. Grosso
M. G. do Sul
Minas Gerais
Par
Paraba
Paran
Pernambuco
Piau
86,1
199,6
235,3
218,6
128,0
125,4
244,2
147,8
118,2
Rio Janeiro
R. G. do Norte
R. G. do Sul
Rondnia
Roraima
Santa Catarina
So Paulo
Sergipe
Tocantins
347,5
150,1
236,9
214,6
214,1
257,3
362,8
140,7
113,8
a)
b)
c)
d)
Rio Janeiro
Gois
R. G. do Sul
Paran
M. G. do Sul
Sta. Catarina
Pernambuco
Paraba
Piau
341,30
344,83
354,61
362,32
364,96
375,94
395,26
398,41
404,86
Minas Gerais
Mato Grosso
R. G. do Norte
Acre
So Paulo
Maranho
E. Santo
Bahia
Cear
414,94
418,41
418,41
421,94
436,68
440,53
446,43
456,62
467,29
D. Federal
Tocantins
Rondnia
Alagoas
Par
Sergipe
Amazonas
Roraima
Amap
469,48
471,70
497,51
507,61
520,83
552,49
641,03
653,59
800,00
a)
b)
c)
d)
279
07/08/2012 09:5
book.indb 281
Q3
DIQ
20
14
Se for utilizado o critrio para identificao de observaes discrepantes que se baseia em medidas resistentes, teremos Cerca Superior Q3 1,5 DIQ 20 1,5 14 41 . Assim, seis das 37 observaes
(16%) seriam apontadas como possveis outliers, isto , municpios onde haveria um nmero anormalmente
alto de hotis: Terespolis (44), Penedo (55), Petrpolis/arredores (58), Petrpolis (83), Nova Friburgo (84)
e Itatiaia (121).
Responda:
a) Por que a mdia resultou em um valor bem maior que a mediana nesse caso?
b) Por que tantos municpios teriam sido apontados pelo critrio que identifica outliers?
P7.11) Dficit habitacional no Estado do Rio de Janeiro
A tabela a seguir contm o nmero de domiclios rsticos em alguns municpios do Estado do Rio de
Janeiro no ano 2000.
Nmero de domiclios rsticos no RJ 2000
572
117
741
250
339
566
1.119
556
51
132
70
74
122
143
567
64
Miracema
Niteri
Nova Friburgo
Nova Iguau
Petrpolis
Queimados
Resende
Rio das Ostras
Sto. Antnio de Pdua
So Gonalo
So Joo de Meriti
So Pedro da Aldeia
Saquarema
Seropdica
Terespolis
Valena
216
914
295
457
1.839
81
66
123
88
394
103
77
289
159
329
229
a. Determine os quartis.
b. Obtenha um grfico box plot para esses dados.
c. Seria o grfico ramo-folha adequado para representar estes dados? Por qu?
281
07/08/2012 09:54
Sexo Masculino:
Sexo Feminino:
Mdia: 22; 30
Moda: 22; 00
3o Quartil: 25; 00
Mnimo: 17; 00
Mdia: 20; 88
Moda: 22; 00
3o Quartil: 23; 00
Mnimo: 10; 00
Mediana: 22; 00
1o Quartil: 20; 00
Varincia: 7; 51
Mximo: 26; 00
Mediana: 21; 00
1o Quartil: 19; 00
Varincia: 11; 93
Mximo: 28; 00
3
30
4
13
5
9
6
7
7
5
Coeciente de Correlao
8
4