Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTATSTICA PARTE 1
1. CONCEITOS BSICOS
Obs. A amostra sempre finita. Quanto maior for a amostra mais significativa o
estudo.
Parmetro
populao.
Quando o primeiro algarismo aps aquele que vai ser arredondado for 0, 1, 2, 3
e 4 despreza-se este algarismo e conserva-se o anterior.
78,846970 = 78,8.
Quando o primeiro algarismo aps aquele que vai ser arredondado for 5, 6, 7, 8
e 9 aumentamos uma unidade no algarismo anterior.
78,886970 = 78,9.
3. DIVISO DA ESTATSTICA
4. VARIVEIS
Uma varivel qualquer caracterstica de um elemento observado (pessoa,
objeto ou animal).
Algumas variveis, como sexo e designao de emprego, simplesmente enquadram
os indivduos em categorias. Outras, como altura e renda anual, tomam valores numricos
com os quais podemos fazer clculos.
Os exemplos acima nos dizem que uma varivel pode ser:
a Qualitativa: quando seus valores so expressos por atributos: sexo (masculino
feminino), cor da pele (branca, preta, amarela, vermelha);
b Quantitativa: quando seus valores so expressos em nmeros (salrios dos
operrios, idade dos alunos de uma escola, nmero de filhos, etc.). Uma varivel
quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o
3
nome de varivel contnua (altura, peso, etc.); uma varivel que s pode assumir valores
pertencentes a um conjunto enumervel recebe o nome de varivel discreta (nmero de
filhos, nmero de vitrias).
Exerccios
1.
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(k)
Componentes Bsicos
Em termos genricos, uma tabela se compe dos seguintes elementos
bsicos:
Ttulo
Cabealho
Indicadora
de
Coluna
Casa
C
o
l
u
n
a
Linha
Rodap
Exemplo:
Brasil - Estimativa de Populao
1970 76
Ano
Populao
(1000 habitantes)
1970
93.139
1971
95.993
1972
98.690
1973
101.433
1974
104.243
1975
107.145
1976
110.124
Fonte: Anurio Estatstico do Brasil
5
Ttulo: Conjunto de informaes, as mais completas possveis, localizado no
topo da tabela, respondendo s perguntas: O qu? Onde? Quando?
Cabealho: Parte superior da tabela que especifica o contedo das colunas.
Coluna Indicadora: Parte da tabela que especifica o contedo das linhas.
Linhas: Retas imaginrias que facilitam a leitura, no sentido horizontal, de
dados que se inscrevem nos seus cruzamentos com as colunas.
Casa ou Clula: Espao destinado a um s nmero.
Rodap: so mencionadas a fonte se a srie extrada de alguma publicao e
tambm as notas ou chamadas que so esclarecimentos gerais ou particulares relativos aos
dados.
SRIES ESTATSTICAS
toda tabela que apresenta a distribuio de um conjunto de dados
estatsticos em funo de trs elementos:
a. Da poca;
b. Do local;
c. Da espcie.
Esses elementos determinam o surgimento de quatro tipos fundamentais de sries
estatsticas:
Sudeste
35.212
Sul
18.702
Centro-oeste
15.652
Fonte Brasil em dados.
Sries Especficas: so aquelas nas quais os dados so reunidos segundo o
espcie que varia permanecendo fixos o tempo e o local.
Exemplo:
Produo pesqueira (mar) Brasil
1969.
Itens
Produo (ton.)
Peixes
314
Crustceos
62
Moluscos
3
Mamferos
12
Fonte Brasil em dados.
7
Exerccio 3: De acordo com Ministrio da Educao a quantidade e alunos
matriculados no ensino de 1 grau no Brasil nos de 1990 a 1996 em milhares de
alunos, so: 19.720 20.567 21.473 21.887 20.598 22.473 23.564. Faa
uma tabela para apresentar esses dados.
Exerccio 4: Estabelecimentos de ensino da regio norte do Brasil em 1982. A
regio norte subdivide-se em: Rondnia, Acre, Amazonas, Roraima, Par e Amap e
possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino,
respectivamente, segundo o MEC. . Faa uma tabela para apresentar esses dados.
Exerccio 5: De acordo com o IBGE(1988), a distribuio dos suicdios ocorridos no
Brasil em 1986, segundo a causa atribuda, foi a seguinte: 263 por alcoolismo, 198 por
dificuldade financeira, 700 por doena mental, 189 por outro tipo de doena, 416 por
desiluso amorosa e 217 por outras causas. Apresente essa distribuio em uma tabela.
Exerccio 6: Muitos sistemas escolares fornecem o acesso a Internet para seus estudantes
hoje em dia. Desde 1996, o acesso Internet foi facilitado a 21.733 escolas elementares,
7.286 escolas do nvel mdio e 10.682 escolas de nvel superior (Statistical Abstract of
United States, 1997). Existe nos Estados Unidos um total de 51.745 escolas elementares,
14.012 escolas do nvel mdio e 17.229 escolas do nvel superior.
8
5 |-- 6
18
6 |-- 7
15
7 |-- 8
12
8 |-- 9
03
9 |--10
02
Elementos Principais:
a) Classe cada um dos intervalos em que os dados so agrupados.
b) Limites de classes so os valores extremos de cada classe.
li = limite inferior de uma classe;
Li = limite superior de uma classe.
c) Amplitude a diferena entre o maior valor e o menor valor de certo conjunto de
dados. Pode ser referida ao total de dados ou a uma das classes em particular.
Amplitude Total (At) calculada pela seguinte expresso:
At = Max. (rol) Min.(rol).
n N
onde
10
Exerccios
1) Abaixo so relacionados os salrios semanais (em Reais) de 60 operrios de uma
fbrica de sapatos.
110
110
115
115
117
117
120
120
120
120
120
123
125
125
130
130
130
135
136
140
140
140
140
142
145
145
145
147
150
150
150
155
158
158
160
163
165
165
168
168
170
170
172
172
175
175
175
178
180
180
180
180
180
185
185
190
190
195
195
198
a)
Classes
xi
fi
Fi
0 |-- 2
2 |-- 4
4 |-- 6
...
8 |-- 10
10 |-- 12
...
14 |-- 16
1
...
5
7
...
...
13
...
4
8
...
27
15
...
10
...
...
...
...
30
...
72
83
93
...
fri
(%)
4
...
18
27
...
...
10
7
....
b)
Salrios
xi
fi
Fi
600
11
...
900 |-- 1.100
1.100 |-- 1.300
1.300 |-- 1.500
...
1.700 |-- 1.900
Total
800
...
...
1.400
...
1.800
20
...
5
...
1
...
44
...
35
40
...
43
...
GRFICOS ESTATSTICOS
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais
rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido compreenso
que as sries.
A representao grfica de um fenmeno deve obedecer a certos requisitos
fundamentais para ser realmente til:
a) Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, assim como de traos desnecessrios que possam levar o observador
a uma anlise com erros.
b) Clareza o grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo.
c) Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.
Tipos de grficos
Histograma, Polgono de Freqncia e Ogiva: So utilizados para representar a
distribuio de freqncia.
Histograma e Polgono de Freqncia:
Exemplo:
Notas obtidas na disciplina de
Programao I
Notas
fi
5 |-- 6
18
6 |-- 7
15
7 |-- 8
12
8 |-- 9
03
9 |--10
02
FONTE: Dados hipotticos.
Ogiva ou polgono de freqncia acumulada:
Exemplo:
12
20
15
NDICES
10
5
0
1992
1994
1996
1998
2000
ANOS
Cirurgia Plstica
Oftalmologia
Cirurgia Geral
Ortopedia
Pediatria
Outros
13
Engenheiros do Hawai
T ch Barbaridade
GRUPOS
Os Serranos
Tch Garotos
10
12
NDICE
48
51,5
55
PA
TO
62
66,5
68
71
AC
CE
AM
75
76
RR
BA
26,5
10
0
MA
PI
AP
ESTA DOS
14
Pictograma. Constitui um dos processos grficos que melhor fala ao pblico, pela
sua forma ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras.
Ex.: Populao Urbana do Brasil em 1980 (x 10)
15
b.
O estado das florestas do planeta e o que
foi devastado
pela ocupao humana - em milhes de km
CONTINENTE
REA
REA ATUAL DE
DESMATADA
FLORESTAS
OCEANIA
0.5
0.9
SIA
10.8
4.3
FRICA
4.5
2.3
EUROPA
6.8
9.6
AMRICA DO
2.9
6.8
SUL
AMRICA DO
3.2
9.4
NORTE E
CENTRAL
FONTE: World Resources Institute
c.
_______________________________
REGIES
PERCENTUAL
_______________________________
NORTE
45,25
NORDESTE
18,28
SUDESTE
10,85
SUL
6,76
CENTRO-OESTE 18,86
_______________________________
FONTE: IBGE
d.
COMRCIO EXTERIOR
BRASIL - 1988/1993
QUANTIDADE (1000 t)
ANOS
EXPORTAO
IMPORTAO
1988
169666
58085
1989
177033
57293
1990
168095
57184
1991
165974
63278
1992
1993
167295
182561
68059
77813
MEDIDAS ESTATSTICAS
Estudaremos dois tipos fundamentais de medidas estatsticas: medidas de
tendncia central e medidas de disperso.
As medidas de tendncia central mostram o valor representativo em torno do
qual os dados tendem a agrupar-se, com maior ou menor freqncia. So utilizadas para
sintetizar em um nico nmero o conjunto de dados observados.
As medidas de disperso mostram o grau de afastamento dos valores observados
em relao quele valor representativo.
MEDIDAS DE TENDNCIA CENTRAL
A mdia aritmtica simples
A mdia aritmtica simples de um conjunto de valores o valor obtido somandox
se todos eles e dividindo-se o total pelo nmero de valores. denotada por (leia-se x
barra)
x
x
n
, onde x so os valores observados.
xi . f i
x
fi
, se os dados estiverem organizados em distribuio de freqncia.
Onde xi e fi so os valores do ponto mdio e da freqncia absoluta da classe i-sima
respectivamente.
Exemplos:
1) Calcule a mdia aritmtica dos valores abaixo:
a. X = {0, 6, 8, 7, 4, 6}
b. Y = {25, 16, 29, 19, 17}
c. Z = {105, 123, 98, 140}
2) Encontre a mdia para o salrio destes funcionrios.
Salrios semanais para 100 operrios no especializados
Salrios
fi
xi
xi.fi
semanais
140 |-- 160
7
160 |-- 180
20
180 |-- 200
33
200 |-- 220
25
220 |-- 240
11
240 |-- 260
4
100
Exerccios:
1) Encontre a mdia dos seguintes conjuntos de observaes.
a) X = {2, 3, 7, 8, 9}.
R: 5,8
b) Y = {10, 15, 22, 18, 25, 16}.
R: 16,67
c) Z = {1, 3, 6, 8}.
R: 4,5
R: 27,5
d) T = {1, 3, 6, 100}.
2) Encontre a mdia das notas na disciplina de Programao I.
Notas obtidas na disciplina de
Programao I
Notas
fi
5 |-- 6
18
6 |-- 7
15
7 |-- 8
12
8 |-- 9
03
9 |--10
02
FONTE: Dados hipotticos.
Resp 6,62.
A mediana um valor central de um rol, ou seja, a mediana de um conjunto de
valores ordenados (crescente ou decrescente) a medida que divide este conjunto em
duas partes iguais.
Exemplo: Calcule a mediana dos conjuntos abaixo:
a- X={3, 7, 4, 12, 15, 10, 18, 14}
b- Y={29, 33, 42, 38, 31, 34, 45, 51, 95}
c- Z={29, 33, 42, 38, 31, 34, 45, 120, 95}
Moda
Seja X um conjunto de dados estatsticos. Define-se Moda de X, denotada por
Mo como sendo o elemento mais freqente no conjunto.
Um conjunto de dados pode ter:
Nenhuma moda (amodal);
Uma moda (unimodal);
Duas ou mais modas (multimodal).
Exerccios: Calcule a moda para os conjuntos abaixo:
a) X= {2, 3, 4, 3, 7, 8, 9, 14}.
b) Y= {2, 4, 6, 2, 8, 4, 10}.
c) Z= {32, 56, 76, 4, 8, 97}.
OBSERVAES:
No h regra para se dizer qual a melhor medida de tendncia central. Em cada
situao especfica o problema deve ser analisado pelo estatstico, que concluir pela
medida mais adequada a situao. Assim que:
a)
b)
Exerccios:
1) Dados os conjuntos abaixo, calcule a mdia aritmtica, mediana e moda.
x
MEDIDAS DE DISPERSO
Servem para verificarmos a representatividade das medidas de posio, pois
muito comum encontrarmos sries que, apesar de terem a mesma mdia, so compostas
de maneira distinta.
Assim, para as sries:
a) 25, 28, 31, 34, 37
b) 17, 23, 30, 39, 46
x a xb 31
temos
.
Nota-se que os valores da srie a esto mais concentrados em torno da mdia
31, do que a srie b. Precisamos medir a disperso dos dados em torno da mdia, para
isto utilizaremos as medidas de disperso:
Desvio Padro
Coeficiente de Variao
Desvio Padro:
a raiz quadrada positiva da mdia aritmtica dos quadrados das diferenas entre cada
(x
x) 2
(x x)
f
i
fi
freqncia.
Exemplo 1:
Encontre o desvio padro para os dados das sries a), e b) acima.
Exemplo 2:
Salrios semanais para 100 operrios no especializados
x
x
Salrios
fi
xi
2
(x
)
(x
)2fi
i
i
semanais
140 |-- 160
7
160 |-- 180
20
180 |-- 200
33
200 |-- 220
25
220 |-- 240
11
240 |-- 260
4
100
Cv
x
.100
Exemplo 4:
Para duas emisses de aes ordinrias da indstria eletrnica, o preo mdio
dirio, no fechamento dos negcios, durante um perodo de um ms, para as aes A,
foi de R$ 150,00 com um desvio padro de R$ 5,00. Para as aes B, o preo mdio foi
de R$ 50,00 com um desvio padro de R$ 3,00. Em relao ao nvel do preo, qual dos
tipos de aes mais varivel?
Exerccios.
122
126
128
128
130
134
138
140
140
146
150
150
152
156
156
156
160
160
162
162
164
170
170
176
176
176
178
180
180
184
186
186
188
190
190
192
192
194
196
196
200 216
200 218
200
210
a) Construa uma distribuio de freqncias, com h = 20 e limite inferior para a primeira classe
igual a 100.
b) Quantos funcionrios tem um salrio semanal situado entre R$ 120,00 (inclusive) e R$
160,00 (exclusive)? 17 funcionrios
c) Que porcentagem de funcionrios tem um salrio semanal situado entre R$ 180,00 (inclusive)
e R$ 200,00 (exclusive)?26%
d) Qual o salrio mdio semanal destes funcionrios utilizando o item a)?166,4
e) Determine o desvio padro e o coeficiente de variao da distribuio. 28,76; 17,28%
5) A distribuio das alturas de um grupo de pessoas apresentou uma altura mdia de
182 cm e um desvio padro de 15 cm, enquanto que a distribuio dos pesos, apresentou um
peso mdio de 78 kg, com um desvio padro de 8 kg. Qual das duas distribuies apresentou
maior disperso? Por qu?