Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estatstica
APRESENTAO
com satisfao que a Unisa Digital oferece a voc, aluno(a), esta apostila de Estatstica, parte integrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinmico e autnomo que a
educao a distncia exige. O principal objetivo desta apostila propiciar aos(s) alunos(as) uma apresentao do contedo bsico da disciplina.
A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidisciplinares, como chats, fruns, aulas web, material de apoio e e-mail.
Para enriquecer o seu aprendizado, voc ainda pode contar com a Biblioteca Virtual: www.unisa.br,
a Biblioteca Central da Unisa, juntamente s bibliotecas setoriais, que fornecem acervo digital e impresso,
bem como acesso a redes de informao e documentao.
Nesse contexto, os recursos disponveis e necessrios para apoi-lo(a) no seu estudo so o suplemento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para
uma formao completa, na qual o contedo aprendido influencia sua vida profissional e pessoal.
A Unisa Digital assim para voc: Universidade a qualquer hora e em qualquer lugar!
Unisa Digital
SUMRIO
INTRODUO................................................................................................................................................ 5
1 NOES BSICAS.................................................................................................................................. 7
2 ORGANIZAO DE DADOS........................................................................................................... 13
3 GRFICOS ESTATSTICOS................................................................................................................ 23
4 MEDIDAS.................................................................................................................................................... 29
5 PROBABILIDADES................................................................................................................................ 41
5.1 Fenmeno Determinstico.....................................................................................................................................41
5.2 Fenmeno Aleatrio ou Probabilstico..............................................................................................................41
5.3 Espao Amostral (S)..................................................................................................................................................42
5.4 Evento (E).....................................................................................................................................................................42
5.5 Probabilidade.............................................................................................................................................................42
5.6 Propriedades...............................................................................................................................................................42
5.7 Varivel Aleatria Discreta......................................................................................................................................43
5.8 Funo Discreta de Probabilidade......................................................................................................................43
5.9 Varivel Aleatria Contnua...................................................................................................................................44
5.10 Funo Contnua de Probabilidade..................................................................................................................44
5.11 Resumo do Captulo..............................................................................................................................................44
5.12 Atividades Propostas.............................................................................................................................................45
7 ESTIMAO.............................................................................................................................................. 51
8 CORRELAO.......................................................................................................................................... 59
INTRODUO
Prezado(a) aluno(a), esta apostila rene os principais tpicos de Estatstica, de forma condensada
e objetiva, com a finalidade de orient-lo(a), aluno(a) do Curso de Ensino a Distncia (EaD), no desenvolvimento do contedo desta disciplina.
Em sua elaborao, no tive a pretenso de demonstrar as diversas frmulas matemticas nela
existentes, mas de mostrar suas aplicaes nos diversos assuntos abordados. , portanto, um guia indispensvel para acompanhar as aulas web.
A disciplina de Estatstica tem por objetivo fornecer ao() aluno(a) subsdios que o(a) auxiliem nas
demais disciplinas do Curso de EaD, bem como desenvolver-lhe a capacidade de utilizar os diversos
mtodos estatsticos e o raciocnio necessrio para a interpretao e anlise de pesquisas na rea a que
se destina.
1 NOES BSICAS
Prezado(a) aluno(a), voc conhece a origem
da palavra estatstica? Conhece algumas aplicaes desta cincia? Vamos iniciar este texto abordando esses pontos.
A palavra estatstica, de origem latina, significou por muito tempo cincia dos negcios
do Estado. Os que governavam, sentindo necessidade de informaes, organizavam departamentos, que tinham a responsabilidade de fazer essas
investigaes.
Dicionrio
A palavra estatstica surge da expresso em latim
statisticum collegium ou palestra sobre os assuntos do Estado, de onde surgiu a palavra em lngua
italiana statista, que significa homem de estado,
ou poltico, e a palavra alem Statistik, designando
a anlise de dados sobre o Estado. A palavra adquiriu um significado de coleta e classificao de
dados, no incio do sculo 19.
Fonte: http://pt.wikiversity.org
Voc deve saber que a realizao de uma pesquisa envolve muitas etapas, tais como: a escolha
da amostra, a coleta e a organizao dos dados, o
resumo e a apresentao desses dados e, tambm,
a interpretao dos resultados para a obteno de
concluses e tomada de decises razoveis. Todas
essas etapas so trabalhadas com mtodos cientficos pela Estatstica.
Exemplos:
1. O ndice de analfabetismo no Brasil;
2. A mortalidade infantil no Nordeste brasileiro;
3. A porcentagem de crianas vacinadas na
ltima campanha de vacinao;
Saiba mais
A Estatstica uma rea do conhecimento que utiliza teorias probabilsticas para explicao de eventos,
estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlaes
que apresentem, tirando delas suas consequncias para descrio e explicao do que passou e previso e organizao do futuro. Em suma, estatstica a cincia que estuda os dados. Dentro dela, existem duas subdivises: a estatstica descritiva (que estuda mtodos e ferramentas de coleta de dados e
modelos matemticos para descrev-los e interpret-los) e a estatstica inferencial (sistemas e tcnicas
utilizadas para tomar boas decises baseadas nos dados).
A estatstica tambm uma cincia e prtica de desenvolvimento de conhecimento humano atravs
do uso de dados empricos. Baseia-se na teoria estatstica, um ramo da matemtica aplicada. Na teoria
estatstica, a aleatoriedade e incerteza so modeladas pela teoria da probabilidade. Algumas prticas
estatsticas incluem, por exemplo, o planejamento, a sumarizao e a interpretao de observaes.
Porque o objetivo da estatstica a produo da melhor informao possvel a partir dos dados disponveis, alguns autores sugerem que a estatstica um ramo da teoria da deciso.
Fonte: http://pt.wikiversity.org
Como na maioria das vezes, os dados disponveis no so nmeros inteiros, para efetuar os clculos estatsticos, necessrio efetuar o arredondamento desses dados. A seguir, apresentamos os
critrios utilizados para efetuar o arredondamento.
De acordo com o Instituto Brasileiro de Geografia e Estatstica (IBGE)2, o arredondamento
feito da seguinte forma:
a. Quando o primeiro algarismo a ser abandonado 0, 1, 2, 3 ou 4, fica inalterado o
ltimo algarismo a permanecer.
Exemplo: aproximao de uma casa
decimal: 53,24 passa a 53,2.
b. Quando o primeiro algarismo a ser abandonado 6, 7, 8 ou 9, aumenta-se em
uma unidade o algarismo a permanecer.
Estatstica
Populao
Amostra
Quando so obtidos dados de toda uma po o conjunto de elementos retirados da populao para a realizao do estudo. , portanto, pulao, dizemos que foi feito um recenseamento e
a este conjunto de dados damos o nome de censo.
um subconjunto da populao.
Quando os dados so obtidos de parte da populao, foi feita uma amostragem.
Exemplos:
1. Queremos obter informaes sobre a
audincia de certo programa de TV, na A Escolha da Amostra
Grande So Paulo:
Os mtodos de escolha da amostra devem
Populao: o conjunto de todos os domiclios da Grande So Paulo que possuem TV; garantir a representatividade do grupo. necesAmostra: o conjunto dos domiclios que srio escolher, no mnimo, 10% do nmero total
dos elementos da populao e garantir, por meio
sero visitados.
de um critrio de seleo, que nenhum elemento
tenha maior chance de ser escolhido do que outro.
2. Estudar a procedncia dos candidatos a
Desse modo, podemos recorrer a diferentes formas
uma determinada universidade:
de amostragem: amostragem aleatria simples,
Populao: conjunto de todos os candida- amostragem sistemtica e amostragem estratitos referida universidade;
ficada proporcional.
Amostra: conjunto dos candidatos que sero entrevistados.
Ateno
3. Queremos fazer um estudo sobre a idade dos alunos do curso de Publicidade
243
564
720
121
167
Observem que devemos descartar 811, 891 e 819, porque no pertencem populao, e 643, porque j foi selecionado.
Continuamos o sorteio, at completarmos os 80 elementos da amostra.
b. Amostragem sistemtica: sorteamos um nmero de 1 a 10, ao acaso. Supondo que tenha
sido obtido o nmero 6, ele ser o primeiro elemento da amostra e os demais sero determinados em intervalos de dez unidades. Nossa amostra, ento, ser:
6
16 26 36 46 56 66 76 86 96 106
. . . 796
Este tipo de amostragem simples de ser realizado e aconselhvel no caso de amostras muito
grandes.
10
Estatstica
Exemplo 2: na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos de
idade. Existem 120 crianas na faixa de 7 anos de idade, distribudas em cinco classes, do seguinte modo:
a primeira srie A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos
escolher uma amostra com, no mnimo, 12 crianas (10% de 120), selecionadas atravs de:
c. Amostragem estratificada proporcional: sorteamos os nomes das crianas em quantidades
proporcionais ao nmero de crianas com 7 anos de cada classe, que constituem os estratos
da amostra. Vamos, agora, determinar a porcentagem de crianas com 7 anos, em cada classe,
em relao populao (120 crianas):
D: d = 25%
E: e = 16,7%
Para calcularmos quantas crianas de cada classe sero sorteadas, para uma amostra de 12 crianas, fazemos:
A: 16,7% de 12 = 16,7/100 . 12 = 0,167 . 12 = 2,004 = 2
B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2
C: 29,2% de 12 = 0,292 . 12 = 3,504 =3 (nesse caso, arredondamos para 3, ao invs de 4, porque o
total de crianas da amostra 12)
D: 25% de 12 = 0,25 . 12 = 3
E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2
Desse modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra.
Prezado(a) aluno(a), vimos neste captulo que a palavra estatstica, de origem latina, significou por
muito tempo cincia dos negcios do Estado. Estudamos tambm que a Estatstica Descritiva utiliza
mtodos numricos e grficos para mostrar os padres de comportamento dos dados, para resumir
a informao contida nesses dados e para apresentar a informao de forma conveniente, e que a Inferncia Estatstica utiliza dados de amostras para obter estimativas sobre a populao. Aprendemos
ainda sobre arredondamentos e amostra.
Vamos, agora, avaliar a sua aprendizagem.
Unisa | Educao a Distncia | www.unisa.br
11
28,255
299,951
265,0
265
12
2 ORGANIZAO DE DADOS
Prezado(a) aluno(a), falaremos agora sobre a
organizao de dados. Vamos l!
Suponhamos, por exemplo, que um questionrio foi aplicado a alunos do 1 ano de uma escola
fornecendo as seguintes informaes:
Variveis qualitativas
Seus valores representam uma qualidade (ou
atributo) do indivduo pesquisado.
13
Saiba mais
Por exemplo, a varivel idade, medida em anos completos, quantitativa (contnua); mas, se
for informada apenas a faixa etria (0 a 5 anos, 6 a 10 anos etc.), qualitativa (ordinal). Outro
exemplo o peso dos lutadores de boxe, uma varivel quantitativa (contnua), se trabalhamos
com o valor obtido na balana, mas qualitativa (ordinal) se o classificarmos nas categorias do
boxe (peso-pena, peso-leve, peso-pesado etc.).
Outro ponto importante que nem sempre uma varivel representada por nmeros quantitativa. O nmero do telefone de uma pessoa, o nmero da casa, o nmero de sua identidade.
s vezes o sexo do indivduo registrado na planilha de dados como 1 se macho e 2 se fmea,
por exemplo. Isso no significa que a varivel sexo passou a ser quantitativa!
Exemplo dos ursos marrons:
Num levantamento de dados de uma amostra da populao de ursos marrons coletados nos
EUA, teremos como qualitativas as variveis sexo (nominal) e ms da observao (ordinal); so
quantitativas contnuas: idade, comprimento da cabea, largura da cabea, permetro do pescoo, permetro do trax, altura e peso.
14
Estatstica
Exerc
Cine
Op
Cine
TV
OpTV
No
16
No
No
15
80,9
No
20
55,0
No
1,76
60,0
No
20
1,60
58,0
No
18
1,64
47,0
Sim
10
18
1,62
57,8
No
12
17
1,64
58,0
No
10
18
1,72
70,0
Sim
10
12
18
1,66
54,0
No
13
21
1,70
58,0
No
30
14
19
1,78
68,5
Sim
15
18
1,65
63,5
No
10
16
19
1,63
47,4
No
18
17
14
1,82
66,0
No
10
18
18
1,80
85,2
No
10
19
20
1,60
54,5
No
20
18
1,68
52,5
No
14
21
21
1,70
60,0
No
22
18
1,65
58,5
No
23
18
1,57
49,2
Sim
10
24
20
1,55
48,0
Sim
28
25
20
1,69
51,6
No
26
19
1,54
57,0
No
27
23
1,62
63,0
No
28
18
1,62
52,0
No
10
29
18
1,57
49,0
No
12
30
25
1,65
59,0
No
Id
Turma
Sexo
Idade
Alt
Peso
Filho
Fuma
17
1,60
60,5
18
1,69
55,0
18
1,85
72,8
25
1,85
19
1,58
19
10
11
15
Turma
Sexo
Idade
Alt
Peso
Filho
Fuma
Toler
Exerc
Cine
Op
Cine
TV
OpTV
31
18
1,61
52,0
No
32
17
1,71
73,0
No
20
33
17
1,65
56,0
No
14
34
17
1,67
58,0
No
10
35
18
1,73
87,0
No
25
36
18
1,60
47,0
No
14
37
17
1,70
95,0
No
10
12
38
21
1,85
84,0
Sim
10
39
18
1,70
60,0
No
12
40
18
1,73
73,0
No
41
17
1,70
55,0
No
10
42
23
1,45
44,0
No
25
43
24
1,76
75,0
No
14
44
18
1,68
55,0
No
45
18
1,55
49,0
No
10
46
19
1,70
50,0
No
47
19
1,55
54,5
No
48
18
1,60
50,0
No
49
17
1,80
71,0
No
14
50
18
1,83
86,0
No
20
Notao:
A partir da tabela de dados brutos (Tabela
1), vamos construir uma nova com as informaes
resumidas, para cada varivel, denominada tabela
de frequncia, que conter os valores da varivel
e suas respectivas contagens, as quais so denominadas frequncias absolutas ou, simplesmente,
Para efeito de comparao com outros grufrequncias.
pos ou conjuntos de dados, conveniente trabaNo caso de variveis qualitativas ou quantita- lharmos com a frequncia relativa, definida por
tivas discretas, a tabela de frequncia consiste em
listar os valores possveis da varivel, numricos ou
no, e fazer a contagem na tabela de dados brutos
do nmero de suas ocorrncias.
16
Estatstica
Exemplos
Tabela de Frequncia para a Varivel Sexo (extrada da Tabela 1)
Tabela 2 Varivel Sexo.
Note que, para variveis cujos valores possuem ordenao natural (qualitativas ordinais e quantitativas em geral), inclumos na tabela de frequncia uma coluna contendo as frequncias acumuladas
(fac), quando o nmero de valores i for maior do que 2. A frequncia acumulada at certo valor obtida
pela soma das frequncias de todos os valores da varivel menores ou iguais ao valor considerado.
Tabela de Frequncia para a Varivel Toler (extrada da Tabela 1)
Tabela 3 Varivel Toler.
Entretanto, deve-se observar que, com um pequeno nmero de classes, perde-se informao e,
com um nmero grande de classes, o objetivo de
resumir os dados fica prejudicado. No geral, conveniente trabalharmos com 5 a 8 faixas de mesma
amplitude, devendo ressaltar que faixas de tamanho desigual podem ser convenientes para representar valores nas extremidades da tabela.
Para a varivel Peso, usaremos faixas de amplitude 10 e iniciaremos com 40,0 kg.
A varivel Peso, classificada como quantitativa contnua, apresenta valores que podem ser
qualquer nmero real num certo intervalo.
17
Observe, pela fac, que 76% dos alunos pesam menos que 70,0 kg e 100 88 = 12% tm peso maior
ou igual a 80,0 kg.
Na Tabela 5, temos 6 faixas ou classes ou intervalos. Consideremos, por exemplo, a 1 classe ou
intervalo: 40,0 50,0, onde temos:
Limite inferior (li): 40,0
Ponto Mdio (PM) =
Limite superior (ls): 50,0
Amplitude ou tamanho do intervalo (h): h = ls li; (h = 50,0 40,0 = 10,0)
O smbolo indica que o intervalo fechado esquerda e aberto direita (40,0 faz parte dessa
classe, mas 50,0 no; 50,0 est na 2 classe).
Na Tabela 1, a varivel TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela representando tais valores e respectivas frequncias seria muito extensa e pouco prtica. Por esse motivo,
trataremos essa varivel como quantitativa contnua, criando, por exemplo, faixas de amplitude 6 para
representar seus valores.
18
Estatstica
Observe que, na ltima classe, o intervalo fechado esquerda e direita, incluindo, portanto, o
valor 30 e no tendo, assim, que abrir mais uma classe por causa de um nico valor. Outra sugesto seria
usar uma amplitude maior nessa ltima classe, por exemplo, 24 36, que inclui o valor 30.
Saiba mais
Frequncia Absoluta (ni ) - o nmero de vezes que o valor de determinada varivel observado
Frequncia Absoluta Acumulada (fac)- a soma das frequncias absolutas anteriores com a frequncia absoluta deste valor.
Frequncia Relativa (fi) - o quociente entre a frequncia absoluta do valor da varivel e o nmero total de
observaes.
Frequncia Relativa Acumulada (fac %) - a soma das frequncias relativas anteriores com a frequncia relativa desse valor.
fac% =
i=1
Prezado(a) aluno(a), neste captulo estudamos sobre variveis e suas frequncias. O conjunto de
informaes, aps a tabulao do questionrio ou pesquisa de campo, denominado de tabela de dados
brutos. Cada uma das caractersticas perguntadas aos alunos tais como, o peso, a idade, a altura etc.,
denominada de varivel, e, como podemos observar, possuem naturezas diferentes quanto aos possveis
valores que podem assumir, sendo classificadas como variveis qualitativas (nominal e ordinal) ou variveis quantitativas (continuas e discretas).
Vamos, agora, avaliar a sua aprendizagem.
Unisa | Educao a Distncia | www.unisa.br
19
1. Monte a tabela com as distribuies de frequncia da varivel Idade de acordo com os dados
da Tabela 1.
2. Na Escola So Leopoldo, para estudar a preferncia em relao a refrigerantes, sortearam-se
150 estudantes, entre os 1.000 matriculados. Responda:
a. Qual a populao envolvida na pesquisa?
b. Que tipo de amostragem foi utilizado e qual a amostra considerada?
3. A populao envolvida em uma pesquisa sobre a incidncia de crie dentria em escolares da
cidade de Morro Grande apresentada na Tabela 6.
Tabela 6 Incidncia de crie em escolares.
20
Estatstica
21
3 GRFICOS ESTATSTICOS
Muitas vezes, a informao contida nas taPrezado(a) aluno(a), neste captulo, iremos
estudar sobre grficos. A organizao dos dados belas pode ser mais facilmente visualizada atravs
em tabelas de frequncia proporciona um meio de grficos. Vamos definir quatro tipos bsicos de
eficaz de estudo do comportamento de caracters- grficos: setores ou pizza, colunas ou barras, histograma e polgono de frequncias.
ticas de interesse.
Ateno
A utilizao de tabelas e grficos so frequentes na Estatstica. As tabelas servem para organizar e tabular os dados, j os grficos transmitem as informaes com clareza e transparncia, contribuindo para uma leitura objetiva.
Adapta-se muito bem s variveis qualitati- cada valor da varivel. Se, ao contrrio, formos travas, mas tambm pode ser usado para as variveis ar o grfico com o auxlio de compasso e transferidor, precisamos determinar a medida em graus de
quantitativas discretas.
Fazendo uso do computador para o traa- cada setor correspondente aos valores da varivel,
do do grfico, basta conhecer as porcentagens de lembrando que o disco todo mede 360.
Exemplo: grfico de setores para a varivel Toler (Tabela 3):
I: 20% P:42% M: 38%
23
Grfico 1 Setores.
24
Estatstica
3.3 Histograma
Dicionrio
Um histograma uma representao grfica da distribuio de frequncias de uma massa de
medies, normalmente um grfico de barras verticais.
O histograma um grfico composto por retngulos justapostos em que a base de cada um
deles corresponde ao intervalo de classe e a sua altura respectiva frequncia. A construo
de histogramas tem carter preliminar em qualquer estudo e um importante indicador da
distribuio de dados.
tambm utilizado para variveis quantitati- correspondente) em relao a cada intervalo, estes
so ligados entre si por meio de segmentos de revas contnuas.
Para construir o polgono de frequncias, ad- tas, sendo que o primeiro e o ltimo so ligados ao
mitem-se, como representantes de cada classe, os eixo das abscissas, na metade de classes hipottipontos mdios de cada intervalo que as definem. cas, imediatamente anterior primeira e posterior
Aps obter os pontos (ponto mdio, frequncia ltima.
Unisa | Educao a Distncia | www.unisa.br
25
Saiba mais
Voc poder obter esses grficos, utilizando o Excel.
Abaixo segue o link onde voc poder obter informaes, caso ainda no as saiba, de quais grficos so possveis construir com o Excel e como constru-los.
Porm importante voc observar que essa apenas uma dica.
O fato de poder utilizar o Excel para a construo de grficos no o exime do dever de saber construir esses grficos
manualmente, ou seja, sem o auxlio desta ferramenta, pois certamente voc precisar desenvolver essas atividades nas
avaliaes presenciais.
Confira as dicas em:
http://office.microsoft.com/pt-br/excel-help/tipos-de-graficos-disponiveis-HA001233737.aspx.
Prezado(a) aluno(a), muitas vezes, a informao contida nas tabelas pode ser mais facilmente visualizada atravs de grficos. Nesse sentido, definimos, neste captulo, quatro tipos bsicos de grficos:
setores ou pizza, colunas ou barras, histograma e polgono de frequncias. E, por fim, vimos que o histograma utilizado para variveis quantitativas contnuas.
Vamos, agora, avaliar a sua aprendizagem.
26
Estatstica
1. Com relao s variveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 1:
a. Classifique essas variveis.
b. Faa a distribuio de frequncia para cada uma delas.
c. A varivel Exerc poderia ser tratada de forma diferente com relao sua classificao?
Justifique sua resposta e, em caso afirmativo, construa a nova distribuio de frequncia.
d. Construa os grficos que melhor se adaptam a cada uma das variveis apresentadas.
2. Quinze pacientes de uma clnica de ortopedia foram entrevistados quanto ao nmero de meses previstos de fisioterapia, se haver (S) ou no (N) sequelas aps o tratamento e o grau de
complexidade da cirurgia realizada: alto (A), mdio (M) ou baixo (B). Os dados so apresentados na Tabela 8:
Tabela 8 Levantamento em clnica de ortopedia.
Os dados da Tabela 9 referem-se ao salrio (em salrios-mnimos) de 20 funcionrios administrativos em uma indstria.
Tabela 9 Salrios de funcionrios administrativos (em salrios-mnimos).
27
4. Um grupo de estudantes do ensino mdio foi submetido a um teste de Matemtica resultando em:
Tabela 10 Teste de Matemtica.
a. Construa o histograma.
b. Se a nota mnima para aprovao 5, qual ser a porcentagem de aprovao?
28
4 MEDIDAS
Prezado(a) aluno(a), agora falaremos sobre o, por exemplo, representando a tendncia cenmedidas.
tral dos dados ou a maneira pela qual esses dados
Nosso interesse caracterizar o conjunto de esto dispersos.
dados atravs de medidas que resumam a informa-
29
5, 6, 8, 9, 11, 12, 14
3) Aplica-se a frmula:
Dicionrio
Rol a sequncia de dados obtida aps a ordenao dos dados (crescente ou decrescente).
onde:
limd = limite inferior da classe md
n = n total de elementos da amostra
fac = frequncia acumulada da classe anterior classe md
h = amplitude da classe md
nimd = frequncia da classe md
Moda (mo)
n = 6 (par)
Temos ento duas modas, portanto a distribuio bimodal. Quando a distribuio no apreA mediana ser dada pela mdia aritmtica sentar moda, ser chamada amodal; se tiver uma
entre o 3 e 4 elementos da sequncia:
s moda, recebe o nome de unimodal e, se apresentar vrias modas, ser multimodal.
Para calcularmos a moda quando os dados
esto agrupados em classes, usaremos o seguinte
processo:
30
Estatstica
onde:
limo = limite inferior da classe modal
= diferena entre a frequncia da classe
modal e a imediatamente anterior
= diferena entre a frequncia da classe
modal e a imediatamente posterior
h = amplitude da classe modal
Exemplos:
1. Calcule mdia, mediana e moda para a varivel Idade (Tabela 11) (Ver Tabela 23):
Tabela 11 Varivel Idade.
n = 50 par, portanto, a mediana ser a mdia aritmtica dos dois valores centrais
Para o clculo de mo, olhamos a maior frequncia (22), que corresponde idade de 18 anos.
2. Calcule mdia, mediana e moda para a varivel Peso (Tabela 12) (Ver Tabela 4):
31
Pela fac (30), a 2 classe contm a mediana, isto , o intervalo 50,0 60,0.
Saiba mais
As medidas de posio podem ser utilizadas em conjunto para auxiliar a anlise dos dados, mas existem situaes
em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito discrepantes, a mdia muito influenciada por este valor e se torna inadequada para representar o conjunto de dados, sendo
melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenao custosa e
a mediana se torna difcil de calcular.
32
Estatstica
As medidas de disperso ou de variabiliUm bairro nobre da capital paulista inclui dade servem para quantificar a variabilidade dos
uma das maiores favelas de So Paulo. O que pode- valores da varivel, isto , a disperso dos dados, ou
mos dizer da renda mdia do bairro? Certamente, a forma como os valores de cada conjunto se espaos altos rendimentos de alguns residentes sero lham ao redor das medidas de tendncia central.
Medidas de Disperso para um Conjunto de Dados
Sejam
com
= 12,5 e md = 12,5
com
= 12,5 e md = 12,5
Observamos que essas sries no so homogneas, apesar de ambas terem o mesmo valor para a
mdia e a mediana. preciso, pois, calcular as constantes de disperso, que medem os afastamentos dos
valores dessas sries em torno do valor central.
Entre as medidas de disperso ou de variabilidade mais usadas, temos: amplitude total, varincia, desvio padro e coeficiente de variao.
Amplitude total (R)
a diferena entre o maior e o menor valor de um conjunto de dados.
Exemplos:
Para a srie A: R = 15 10 = 5.
Para a srie B: R = 23 7 = 16.
Unisa | Educao a Distncia | www.unisa.br
33
A utilizao da amplitude total como medida de disperso muito limitada, pois s leva em considerao dois valores de todo o conjunto de dados.
Varincia (
Para medir a disperso dos valores de uma varivel em torno da mdia, interessante estudar o
comportamento dos desvios de cada valor em relao mdia, isto ,
. Na determinao de cada
desvio d i , estaremos medindo a disperso entre cada x i e a mdia x . Porm, se somarmos todos os
desvios, teremos
i =1
i =1
A seguir, esto outras frmulas que podem ser usadas para facilitar o clculo da varincia populacional e amostral.
34
2=
1 N 2
1 n
x i 2 (dados no agrupados) S 2 = x i2 ( x ) 2 (dados no agrupados)
N i =1
n i =1
2=
n
1 N
2 1
2
2
(
n
x
)
=
S
(dados
agrupados)
i i
( n i x i2 ) ( x )2 (dados agrupados)
n i =1
N i =1
Estatstica
Exemplos:
Desvio padro (
O desvio padro a raiz quadrada da varincia.
assim definido para que a unidade original da varivel, se houver, seja mantida, pois, pela frmula
do clculo da varincia, a unidade elevada ao quadrado.
S=
Exemplos:
Para a srie A:
Para a srie B:
Observao: O desvio padro define, em torno da mdia populacional ou amostral, um intervalo
[ , + ] ou [ x S , x + S ] de amplitude 2 ou 2S, respectivamente, chamado zona de normalidade.
Exemplos:
Para a srie A:
Para a srie B:
Vemos, portanto, que h maior variao na srie B do que na A, pois o CV, na srie B, bem maior
que na srie A.
Unisa | Educao a Distncia | www.unisa.br
35
Exemplos:
1. Calcule amplitude total, varincia, desvio padro e coeficiente de variao para a varivel Idade (Tabela 13) (Ver Tabela 11):
Tabela 13 Varivel Idade.
R = 25 17 = 8 (amplitude total)
2. Calcule amplitude total, varincia, desvio padro e coeficiente de variao para a varivel Peso
(Tabela 14) (Ver Tabela 12):
Tabela 14 Varivel Peso.
36
Estatstica
Prezado(a) aluno(a), vimos neste captulo que as medidas de posio ou medidas de tendncia
central para um conjunto de dados qualquer (populao ou amostra) so: a mdia, a mediana e a moda.
Tambm foram apresentadas as medidas de disperso. Entre as medidas de disperso ou de variabilidade mais usadas, temos: amplitude total, varincia, desvio padro e coeficiente de variao, que complementaro as informaes necessrias para a anlise dos dados.
Vamos, agora, avaliar a sua aprendizagem.
1. Vinte e cinco residncias de certo bairro foram sorteadas e visitadas por um entrevistador,
que, entre outras questes, perguntou sobre o nmero de televisores.
Os dados foram os seguintes:
2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2.
Organize os dados numa tabela de frequncia e determine todas as medidas de posio e de
disperso.
2. Num experimento, 15 coelhos foram alimentados com uma nova rao e seu peso avaliado
no fim de um ms.
Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes:
1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2.
Unisa | Educao a Distncia | www.unisa.br
37
Responda:
a. Qual a turma mais homognea? Por qu?
b. Um aluno com mdia 40 considerado normal na turma A? E na turma B? Por qu?
38
Estatstica
Responda:
a. Qual a mdia aritmtica?
b. Qual o desvio padro?
c. Qual a zona considerada de normalidade?
d. Uma criana que obteve 28 pontos considerada com motricidade normal? Por qu?
8. Na pesagem de 20 crianas de quinta srie, obtiveram-se os seguintes resultados, em kg:
38 40 45 42 45 40 43 38
45 45 40 41 41 38 46 32
48 46 42 43 44 50 38 40
Nesse grupo de crianas, um menino com 35 kg seria considerado com peso normal? Por qu?
39
5 PROBABILIDADES
Prezado(a) aluno(a), neste captulo, no ser conceitos que sero necessrios para o estudo da
efetuado um estudo completo sobre a teoria das Estatstica e aplicados posteriormente.
probabilidades, mas sero apresentados alguns
Veremos que modelos podem ser estabele aquele cujo resultado no pode ser previsto
com certeza, ainda que mantidas as mesmas con- cidos para quantificar as incertezas das diversas
ocorrncias.
dies de realizao.
Exemplo: no lanamento de um dado, no
podemos dizer, com certeza, qual ser o resultado.
S podemos saber que provvel que ocorra o resultado 1 ou 2 ou 3 ou 4 ou 5 ou 6.
Ateno
A maioria dos fenmenos tratada pela Estatstica de natureza aleatria ou probabilstica. Observe que durante a escolha
da amostra, temos um fenmeno probabilstico.
41
Exemplo: um experimento consiste em retirar uma lmpada de um lote e medir seu tempo
Exemplo: lanamos uma moeda duas vezes. de vida antes de se queimar. Um espao amostral
conveniente : S = {t: t 0}, isto , o conjunto de toSe C indica cara e R, coroa, temos:
dos os nmeros reais no negativos. Seja o evento
S = {(C, C); (C, R); (R, C); (R, R)} (espao amoso tempo de vida da lmpada inferior a 20 horas,
tral)
temos: E = {t: 0 t < 20}. Este um exemplo de esSeja o evento obteno de faces iguais, te- pao amostral contnuo, enquanto os outros antemos: E = {(C, C); (R, R)} (evento)
riores so discretos.
Seja o evento obteno de cara no 1 lanamento, temos: E = {(C, C); (C, R)} (evento)
um subconjunto do espao amostral.
5.5 Probabilidade
a relao entre o nmero de possveis resultados de E e todos os possveis resultados do experimento. Indicamos: P(E).
2 1
= .
4 2
5.6 Propriedades
42
Estatstica
Saiba mais
Um pouco de Histria
Os primeiros estudos envolvendo probabilidades foram motivados pela anlise de jogos de azar. Sabe-se que um
dos primeiros matemticos que se ocupou com o clculo das probabilidades foi Cardano (1501-1576). Data dessa poca
a expresso que utilizamos at hoje para o clculo da probabilidade de um evento (nmero de casos favorveis dividido
pelo nmero de casos possveis).
Com Fermat (1601-1665) e Pascal (1623-1662), a teoria das probabilidades comeou a evoluir e ganhar mais
consistncia, passando a ser utilizada em outros aspectos da vida social, como, por exemplo, auxiliando na descoberta
da vacina contra a varola no sculo XVIII.
Atualmente, a teoria das probabilidades muito utilizada em outros ramos da Matemtica (como o Clculo e a
Estatstica), da Biologia (especialmente nos estudos da Gentica), da Fsica (como na Fsica Nuclear), da Economia, da
Sociologia etc.
Uma quantidade X, associada a cada possvel resultado do espao amostral S, denominada varivel aleatria discreta se assume valores num conjunto enumervel de pontos do conjunto real, com
certa probabilidade de ocorrncia.
pi = 1 .
ou, ainda,
43
Funo contnua de probabilidade ou funo densidade de probabilidade para uma varivel aleatria contnua X toda funo f (X) que
satisfaz a duas condies:
Prezado(a) aluno(a), neste captulo, apresentamos alguns conceitos fundamentais sobre Probabilidade, entre eles a definio de Espao Amostral (S), Evento (E), Probabilidade, Varivel Aleatria Discreta,
Funo Discreta de Probabilidade, Varivel Aleatria Contnua e Funo Contnua de Probabilidade.
O clculo das probabilidades pertence ao campo da Matemtica, entretanto a maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou probabilstica. O conhecimento dos aspectos
fundamentais do clculo das probabilidades uma necessidade essencial para o estudo da Estatstica
Indutiva ou Inferncia.
Vamos, agora, avaliar a sua aprendizagem.
44
Estatstica
1. Um nmero escolhido ao acaso entre os 50 inteiros compreendidos entre 1 e 50. Qual a probabilidade do nmero:
a. Ser mltiplo de 9?
b. Ser mltiplo de 3 e de 4?
c. Ser mltiplo de 3 ou de 4?
d. Ser um nmero primo?
2. Numa caixa esto guardadas peas nas cores e formatos conforme a tabela abaixo:
Ao sortear-se ao acaso uma das peas, qual a probabilidade de ocorrer uma pea:
a. Circular Amarela?
b. Retangular?
c. No Triangular?
45
Dizemos que uma varivel aleatria contnua X tem distribuio normal com parmetros , respectivamente a mdia e a varincia da distribuio, < < + e 0 < 2 < +, se a sua funo densidade
de probabilidade dada por:
, para < X < +
Ateno
A funo densidade de probabilidade dada por:
47
X ) 00 quando
quando
f ( X )X0;
quando
b. ff((X)
c. o valor mximo de f ( X ) se d para X = , isto , a curva normal unimodal e mdia (), mediana (Md) e moda (Mo) coincidem;
d. E (X) = (valor esperado ou mdia);
e. Var (X) = 2 (varincia);
Saiba mais
Modelo Normal
O modelo normal, ou Gaussiano, certamente o mais importante dos modelos para variveis aleatrias contnuas. Isto se justifica pelo grande nmero de aplicaes que a utilizam e pela sua capacidade de aproximar outros modelos.
Nesta distribuio, a mdia, mediana e moda so valores coincidentes.
O clculo de probabilidades na distribuio normal feito mediante o conhecimento da mdia e desvio padro
da varivel aleatria. Dada a importncia desta distribuio, estas duas medidas so consideradas as mais importantes
para verificar tendncia central e disperso, respectivamente.
As probabilidades para o modelo normal so calculadas com o auxlio de tabelas e, para evitarmos
a multiplicao desnecessria de tabelas para cada par de valores (, 2), utiliza-se uma transformao
que conduz sempre ao clculo de probabilidades com uma varivel de parmetros (0, 1), isto , = 0
(mdia) e = 1 (varincia).
X
Desse modo, se X ~ N(, 2) , definimos uma nova varivel Z =
, para qual se demonstra que
( Z ) = 0 e 2 ( Z ) = 1.
Logo Z ~ N(, 2) e denominada Normal padro ou Normal reduzida.
48
Estatstica
-1
a
b
),
Z
onde X ~ N(, ).
Portanto, quaisquer que sejam os valores de e , utilizamos a normal padro para obter probabilidades com a distribuio normal.
Os valores P ( 0 Z z ), z 0 so tabelados.
Pela simetria da curva normal, podemos calcular valores de probabilidades em outros intervalos e,
tambm, temos que a probabilidade de estar direita (ou esquerda) de zero 0,5. Como a probabilidade sempre um nmero compreendido entre 0 e 1, a tabela contm apenas a parte decimal.
Dicionrio
Simetria
Matemtica: disposio de duas figuras que se correspondem ponto por ponto de tal sorte que os dois pontos correspondentes de uma e da outra estejam a igual distncia de um ponto, de uma reta ou de um plano dado.
Eixo de simetria, reta comum a todos os planos de simetria.
Note que temos um eixo central na curva normal.
Se pegarmos um ponto pertencente curva normal direita do eixo central, teremos um ponto correspondente esquerda deste eixo que estar mesma distncia do eixo central.
Prezado(a) aluno(a), neste captulo, vimos como criar um modelo probabilstico e o que uma funo densidade de probabilidade.
De modo geral, podemos dizer que as variveis aleatrias, cujos valores resultam de mensuraes
ou medies, so variveis aleatrias contnuas.
A construo de modelos probabilsticos para variveis aleatrias contnuas envolve a ideia da ge-
49
neralizao do histograma, fazendo o nmero de classes e o nmero de valores tenderem para o infinito,
que significa construir intervalos de classes extremamente pequenos, nfimos.
Observe que a forma do histograma sofre uma modificao, passando a apresentar uma curva suave, ou seja, uma linha contnua, como visto no Grfico 5. Esta curva contnua a representao grfica de
uma funo da varivel aleatria X, chamada de funo densidade de probabilidade.
Vamos, agora, avaliar a sua aprendizagem.
50
7 ESTIMAO
Prezado(a) aluno(a), neste captulo iremos
abordar aspectos relacionados Inferncia Estatstica.
At o presente momento, voc aprendeu a
descrever uma amostra por meio de medidas de
tendncia central e medidas de disperso, que
compem a Estatstica Descritiva. A partir de agora, voc ir aprender a utilizar a Inferncia Estatstica para inferir indutivamente propriedades de
uma populao, com base nos resultados obtidos
com uma amostra.
plo, com base nos dados amostrais, podemos decidir se uma determinada droga eficiente para o
tratamento de uma doena entre outros.
Ateno
A estimao faz parte da Inferncia Estatstica, que tem por objetivo fazer generalizaes sobre uma populao com
base em dados de uma amostra.
Dicionrio
Inferir: Tirar uma concluso a partir de um fato, de
um princpio. Concluir, deduzir.
Na estimao por ponto, proposto um nico valor para substituir o parmetro (dado da
populao). Assim, o estimador por ponto da mdia aritmtica populacional a mdia aritmtica amostral x ; o estimador por ponto da varincia
populacional a varincia amostral S.
51
2
2
2
2
z obtido da tabela da normal padro, localizando o valor de
2
X =
anteriormente
so
os
nmeros
obtidos
por
A expresso IC ( , ) envolve a quantidade X , que uma varivel aleatria e, sendo assim, o intervalo obtido tambm aleatrio, com probabilidade de conter o verdadeiro valor da mdia populacional .
Assim, uma interpretao conveniente para o intervalo de confiana : se obtivermos vrias
amostras de mesmo tamanho e, para cada uma delas, calcularmos os correspondentes intervalos
de confiana com coeficiente de confiana , esperamos que a proporo de intervalos que contenham o valor de seja igual a .
Exemplo:
Suponha que os comprimentos de jacars adultos de certa raa sigam o modelo normal com mdia desconhecida e varincia igual a 0,01 m. Uma amostra de dez animais foi sorteada e forneceu mdia 1,69 m. Desejamos uma estimativa para o parmetro desconhecido , com coeficiente de confiana
de 95%.
Identificando os dados do problema, temos: = 0,01; n = 10; X = 1,69; = 95%;
52
Estatstica
2
X ~ N ( ,
)
n
IC ( , ) = [ X z . X ; X + z . X ]
2
53
54
Estatstica
Fixado um valor tal que 0 < <1, definimos o intervalo de confiana para p, com coeficiente de
confiana , como:
IC (p , ) = [ p z . p ; p + z . p ] = p z . p p p + z . p , onde:
2
p a proporo amostral.
p =
p . q
o desvio padro da proporo amostral, com q = 1 p .
n
Exemplo:
Suponha que, em n = 400 provas, obtemos k = 80 sucessos. Vamos obter um intervalo de confiana
para p, com coeficiente de confiana = 90%.
Identificando os dados do problema, temos:
n = 400; = 90%
55
X a mdia amostral.
X =
S
o desvio padro da mdia amostral, com
n
n
S = S2 e S2 =
1
{ x i2
n 1 i =1
n
( x i )2
i =1
} ou
S2 =
2
1 n 2
{ x i n X }
n 1 i =1
Exemplo:
1. De uma populao normal com parmetros desconhecidos, tiramos uma amostra de tamanho 100, obtendo-se X = 112 e S = 11. Fazer um IC para ao nvel de 10%.
Identificando os dados do problema, temos: n = 100; X = 112 ; S = 11; 1 = 10% = 0,10
56
Estatstica
IC ( , ) = [ X z . X ; X + z . X ]
2
Prezado(a) aluno(a), aprendemos que a estimao faz parte da Inferncia Estatstica, que tem por
objetivo fazer generalizaes sobre uma populao com base em dados de uma amostra. Existem dois
tipos de estimao: por ponto e por intervalo, sendo esta ltima mais precisa.
Vamos, agora, avaliar a sua aprendizagem.
57
1. A altura dos homens de uma cidade apresenta distribuio normal. Para estimar a altura mdia dessa populao, levantou-se uma amostra de 150 indivduos obtendo-se
. Ao nvel de 2%, determinar um IC para a
altura mdia dos homens da cidade.
2. Para determinar o faturamento mensal das 500 maiores empresas de uma regio, coletou-se
uma amostra com o faturamento mensal de 60 dessas empresas. A mdia encontrada nessa
amostra foi de $ 3.542,00. Sabendo-se que o desvio padro do faturamento das 500 empresas
de $ 380,00, determine o intervalo que dever conter a mdia populacional. Utilize 68,26%
como nvel de confiana.
3. Uma amostra do teor de Zn em ppm no dedo mdio de n = 100 aves de postura apresentou
mdia de X = 112
400 e varincia S2 = 420.
Essa amostra foi obtida em um plantel em que no foi realizado nenhum tratamento especial
com fonte de Zn na rao.
Obtenha o intervalo de 95% de confiana para a mdia populacional .
Dado t0;025;_=99 = 1;984.
58
8 CORRELAO
as medidas de tendncia central, disperso, assimetria etc. Com duas ou mais variveis alm destas
medidas individuais tambm de interesse conhecer se elas possuem algum relacionamento entre
si, isto , se valores altos (baixos) de uma das variveis implicam em valores altos (ou baixos) da outra
Observou?
varivel. Por exemplo, pode-se verificar se existe
associao entre a taxa de desemprego e a taxa de
criminalidade em uma grande cidade, entre verba
Dicionrio
investida em propaganda e retorno nas vendas, veCorrelao: Podemos desmembr-la em co + relao,
rificar a relao entre o peso e a idade das pessoas,
que nos leva a investigar, compreender a relao exisse o consumo das famlias pode estar relacionado
tente entre dois termos ou objetos.
com sua renda, se as vendas de uma empresa e os
gastos promocionais podem relacionar-se, bem
Portanto, correlao o estudo da existncia como a demanda de um determinado produto e
e do grau de relao entre variveis, tendo por ob- seu preo.
A anlise de correlao fornece um nmero
jetivo medir e avaliar o grau de relao existente
que resume o grau de relacionamento linear entre
entre duas variveis aleatrias.
Ao se estudar uma varivel o interesse eram as duas variveis
Prezado(a) aluno(a), neste captulo, iremos
abordar a correlao. Voc sabe o que significa a
palavra correlao? Antes de ler o prximo pargrafo, observe a formao da palavra correlao e
pense a respeito.
Procura medir a relao entre as variveis X e Y atravs da disposio dos pontos (X, Y) em torno de
uma reta.
Coeficiente de correlao de Pearson
o instrumento de medida da correlao linear.
onde:
59
n = nmero de observaes e;
Quando todos os pontos pertencerem reta, a correlao chamada correlao linear perfeita
positiva e rXY = 1.
Correlao Linear Negativa
A correlao ser negativa quando valores crescentes de X estiverem associados a valores decrescentes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y.
Grfico 9 Correlao linear negativa (-1 < rxy < 0)
Quando todos os pontos pertencerem reta, a correlao chamada correlao linear perfeita
negativa e rxy = -1.
60
Estatstica
Correlao nula
A correlao ser nula quando no houver relao entre as variveis X e Y, ou seja, quando as
variaes de X e Y ocorrerem independentemente, no existe correlao entre elas.
Grfico 10 Correlao nula (rxy = 0)
Ateno
A correlao ser tanto mais forte quanto mais prximo estiver o resultado de +
1 ou de 1 e ser tanto mais fraca quanto mais prximo o resultado estiver de
zero.
Exemplos:
1. Calcular o coeficiente de correlao linear entre as variveis X e Y, usando os dados da Tabela
17.
Observao: Para maior facilidade, construiremos uma tabela na qual, a partir dos valores de X
e Y, determinaremos todas as somas necessrias (Tabela 18).
Tabela 17 Dados de X e Y.
61
2. A Tabela 19 mostra os resultados de uma pesquisa com 10 famlias de uma determinada regio.
Calcular o coeficiente de correlao linear entre Poupana e Nmero de filhos das dez famlias.
62
Estatstica
A correlao linear entre as variveis X e Y forte e negativa, isto , famlias com poupana alta tm
menor nmero de filhos.
Saiba mais
Correlao no o mesmo que causa e efeito. Duas variveis podem estar altamente correlacionadas e, no entanto, no haver relao de causa e efeito entre elas.
Se duas variveis estiverem amarradas por uma relao de causa e efeito elas estaro, obrigatoriamente, correlacionadas.
O estudo de correlao pressupe que as variveis X e Y tenham uma distribuio normal.
A palavra simples que compe o nome correlao linear simples, indica que esto envolvidas no clculo somente
duas variveis.
63
Prezado(a) aluno(a), neste captulo, estudamos a correlao e vimos que a correlao procura entender como duas variveis esto inter-relacionadas do ponto de vista estatstico. Uma das possibilidades de se efetuar este estudo medir a relao entre as variveis X e Y atravs da disposio dos pontos
(X, Y) em torno de uma reta.
Vimos tambm que a correlao ser positiva quando valores crescentes de X estiverem associados
a valores crescentes de Y, ou valores decrescentes de X estiverem associados a valores decrescentes de
Y, ou seja, a correlao ser positiva quando um atributo tender a aumentar, o outro tambm tender a
aumentar.
A correlao ser negativa quando valores crescentes de X estiverem associados a valores decrescentes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y, ou seja, quando
um atributo tender a aumentar, o outro tender a diminuir.
A correlao ser nula quando no houver relao entre as variveis X e Y, ou seja, quando as variaes de X e Y ocorrerem independentemente, no existir correlao entre elas. Podemos dizer ainda
que, no h um padro definido de tendncia. Tambm ocorre quando ao aumentar um atributo no h
mudana significativa nos valores do outro atributo.
Para medir a correlao, iremos utilizar o Coeficiente de correlao de Pearson. Este um ndice que
varia de -1 a 1.
Vamos, agora, avaliar a sua aprendizagem.
64
Estatstica
65
11. A Tabela 21 mostra o volume de vendas (em 1000 unidades) e os gastos promocionais (em
100000 reais). Calcular a correlao entre as duas variveis.
Tabela 21 Volume de vendas e gastos promocionais.
12. Querendo se estimar a mdia de uma populao X com distribuio normal, levantou-se uma
amostra de 100 observaes, obtendo-se X = 30 e S = 4. Ao nvel de 90%, determinar o limite
de confiana para a verdadeira mdia da populao.
13. Um pesquisador deseja estabelecer o peso mdio dos jovens entre 14 e 20 anos. Apesar de
desconhecer a mdia e o desvio padro populacional, sabe por literatura da rea que a distribuio dos pesos aproximadamente normal. Retira-se uma amostra casual simples de 60
jovens, obtendo peso mdio de 67 kg e desvio padro de 9 kg.
a. Ao nvel de 5% de significncia, estabelecer um IC para o peso mdio populacional.
b. Qual o tamanho da amostra que o pesquisador deveria tomar para ter uma probabilidade
de 95% de certeza de cometer um erro de 1,5 kg?
66
Estatstica
67
Captulo 1
1. Seguindo as regras de arredondamento, importante sabermos em quantas casas decimais o
nmero ser arredondado. Seguem as respostas:
2,36 = 2,4
3,57 = 3,6
4,62 = 4,6
8,81 = 8,8
4,451 = 4,5
5,501 = 5,6
5,55 = 5,6
5,650 = 5,6
2.
a. 23,4; 48,9; 120,4; 234,8; 78,8; 130,0; 45,1; 12,4; 200,0
b. 46,73; 253,65; 28,26; 123,84; 299,95; 37,48
c. 27; 68; 128; 50; 68; 39
d. 40; 270; 300; 60; 260; 300; 450; 260; 3000
69
Captulo 2
1. Tabela de Frequncia para a varivel Idade (extrada da Tabela 1)
Tabela 23 Varivel idade.
70
Estatstica
5.
a. PM: 350; 450; 550; 650; 750; 850; 950; 1050; 1150
fac: 14; 60; 118; 194; 262; 324; 372; 394; 400
fi: 0,04; 0,11; 0,14; 0,19; 0,17; 0,16; 0,12; 0,05; 0,02
fi . 100%: 4; 11; 14; 19; 17; 16; 12; 5; 2
b. 100 horas; c. li = 500; d. ls = 1100; e. PM = 750; f. fi = 0,16; g. 15%; h. 19%
Captulo 3
1.
a. Qualitativa nominal; Quantitativa contnua; Quantitativa discreta; Qualitativa nominal.
b. Quantitativa discreta; Quantitativa discreta; Qualitativa ordinal; Qualitativa ordinal.
c. Sim, como quantitativa contnua, pois existe um nmero grande de valores diferentes. Sugesto: iniciar em 0, com amplitude de classe igual a 2.
d. Setores; Histograma e Polgono de frequncia; Colunas; Setores; Colunas ou Histograma e
Polgono de frequncias; Colunas; Setores ou Colunas; Setores ou Colunas.
2.
a. Fisioterapia: quantitativa discreta;
Sequelas: qualitativa nominal;
Cirurgia: qualitativa ordinal.
b. Fisioterapia: grfico de colunas;
Sequelas: grfico de setores;
Cirurgia: grfico de colunas;
c. Grfico de colunas.
O nmero de meses de Fisioterapia diminuiu para os pacientes sem sequelas.
4. b. 34%
Captulo 4
1. Mdia: 1,56; Mediana: 2; Moda:1 e 2.
2.
a. Mdia: 1,88; Mediana:1,8; Moda: 1,5.
c. Mdia: 1,93; Mediana:1,8; Moda:1,6 e 1,8. As diferenas no foram grandes. A soluo (a)
mais exata.
d. O de (c), pois, sem o computador, praticamente impossvel organizar 500 dados brutos.
71
3. Mdia: 86,20 bat/min; Varincia: 16,36 (bat/min)2; Desvio padro: 4,04 bat/min.
4. Mdia: 9,85; Varincia: 1,88; Desvio padro: 1,37.
5. No, porque a zona de normalidade est entre 155 cm e 195 cm.
6.
a. B, pois o desvio padro menor.
b. considerada normal em A, pois a zona de normalidade est entre 35 e 55. Em B, no, pois
a zona de normalidade est entre 41,5 e 48,5.
7. a. Mdia: 21,9; b. Desvio Padro:6,34; c. Zona de normalidade: 15,56 a 28,24; d. Sim, pois 28
est dentro da zona de normalidade.
8. No, pois est fora da zona de normalidade.
Captulo 5
1. a. Nmeros de casos possveis de E = 5
Mltiplos de 9 entre 1 e 50: (9,18,27,36,45)
Nmeros de resultados possveis na experincia: 50
Logo: P(E) =
b. Mltiplos de 3 e de 4 (simultaneamente, ao mesmo tempo), implica ser mltiplo de 12, pois
12 o m.m.c. (menor mltiplo comum) entre 3 e 4.
Nmeros de casos possveis de E = 4
Mltiplos de 12 entre 1 e 50: (12, 24, 36, 48)
Logo: P(E) =
c) Observe a diferena entre este item e o anterior. Ambos se diferenciam pela partcula OU.
Ser mltiplo de 3 ou de 4 significa que servem todos os mltiplos de 3 OU todos os mltiplos
de 4. Observe que nesta situao, no h a necessidade de serem mltiplos simultaneamente.
Atendendo a uma das condies (ser mltiplo de 3 ou de 4 ) ser suficiente.
Ento temos:
Mltiplos de 3 entre 1 e 50: (3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48)
72
Estatstica
Mltiplos de 4 entre 1 e 50: (4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48)
Nmeros de casos possveis de E = 25 (Observe para no contar os valores em negrito duas
vezes)
Logo: P(E) =
d) Nmeros primos (nmeros que possuem apenas dois divisores, 1 e ele mesmo) entre 1 e 50:
(2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47)
Nmeros de casos possveis de E = 15
Logo: P(E) =
Captulo 6
1. Resoluo:
Varivel X: altura, com X ~N ( 170, 25 ); = 170 cm e = 25.
a
b
)
Z
P ( a X b) = P (
170 170
165 170
) = P ( -1< Z < 0 ) (na tabela no exis<Z<
a. P ( 165 < X < 170 ) = P (
5
5
tem valores negativos; pela simetria da curva normal, a rea representada por P ( -1 < Z
< 0 ) igual rea representada por P ( 0 < Z < 1 ) = 0,3413 (Tabela da Normal Reduzida)
P ( 165 < X < 170 ) = 34,13%.
180 170
165 170
) = P ( -1 < Z < 2 ) = P ( -1 < Z < 0 ) +
<Z<
5
5
P (0 < Z < 2 ) = P (0 < Z < 1 ) + P ( 0 < Z < 2 ) (Tabela da Normal Reduzida) = 0,3413 + 0,4772
73
185 170
168 170
) = P ( - 0,4 < Z < 3 ) = P (- 0,4 < Z < 0 )
<Z<
5
5
+ P ( 0 < Z < 3 ) = P ( 0 < Z < 0,4 ) + P ( 0 < Z < 3 ) (Tabela da Normal Reduzida) = 0,1554 +
160 170
) = P ( Z < - 2 ) = P ( Z > 2 ) (pela simetria da Normal)
5
P ( Z > 2 ) = 0,5 P ( 0 < Z < 2 ) = 0,5 0,4772 = 0,0228 P ( X < 160 ) =2,28%
180 170
) = P ( Z > 2 ) = 0,5 P ( 0 < Z < 2 ) = 0,5 0,4772 = 0,0228
e. P ( X > 180 ) = P ( Z >
5
P ( X > 180 ) = 2,28%
165 170
) = P ( Z > - 1 ) = P ( Z < 1 ) (pela simetria da Normal)
5
P ( Z < 1 ) = 0,5 + P ( 0 < Z < 1 ) = 0,5 + 0,3413 = 0,8413 P ( X > 165 ) = 84,13%.
Como so 10.000 alunos, teremos: 10000 . 0,8413 = 8413 alunos o nmero esperado de
alunos com altura superior a 165 cm.
2. Conseguiram responder? A seguir temos duas explicaes.
Na Escala de Z, 2 significa dois desvios padres a partir da mdia (0+ 2= 2); na Escala de X,
esse deslocamento anlogo (75+2*6=87).
Outra forma de relacionar esses valores atravs da frmula de transformao apresentada
anteriormente:
3. Como proceder?
Transformar as variveis X em variveis normais padronizadas Z:
Logo, temos a probabilidade P(0Z1), que ilustrada a seguir e cujo valor determinado
consultando a tabela a seguir:
74
Estatstica
IC ( , ) = [ X z . X ; X + z . X ]
2
75
Logo, podemos afirmar com uma certeza de 98% que, apesar de os parmetros populacionais
serem desconhecidos, a altura mdia dos homens dessa cidade est compreendida entre 1,71
m e 1,73 m.
Captulo 8
1. a. 0,5000; b. 0,3413; c. 0,8185; d. 0,1574; e. 0,0013; f. 0,0228.
2. a. 0,9938; b. 0,8413; c. 0,0668; d. 0,6826; e. 19,6.
3. a. 0,3289; b. 0,5286.
4. Magros: 116,6 kg; Obesos: 143,4 kg.
5. Mdia: 4,745; [ 3,828; 5,662 ].
6. [ 0,677; 0,732 ].
7. IC ( , 95%) = [ 30,26 ; 32,74 ].
8. 196.
9. 377; 515.
10. a. 0,9835; b. -0,7586; c. -0,736; d. 0,947.
11. 0,9817.
12. IC (, 90%) = [29,34; 30,66].
13. a. IC (, 95%) = [64,723; 69,278]; b. n = 139.
76
REFERNCIAS
77