Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
descrever
de
interesse
2
Estatstica
uma cincia baseada na Teoria das Probabilidades, cujo
objetivo principal nos auxiliar a tomar decises ou obter
concluses em situao de incerteza, a partir de informaes
numricas.
Grandes reas da Estatstica
3.
os custos envolvidos;
exame das informaes disponveis;
o delineamento da amostra (se necessria);
a forma como sero escolhidos os dados;
elaborao do questionrio.
5.
Populao e Amostra
Populao:
Conjunto de todos os indivduos, objetos ou informaes que
apresentam pelo menos uma caracterstica (observvel)
comum cujo comportamento interessa-nos analisar.
Quanto ao nmero de elementos, a populao pode ser finita
ou infinita.
Exemplo: Deseja-se estudar os salrios mensais pagos no setor
industrial baiano no ano de 2013.
8
Amostra:
Qualquer subconjunto finito de elementos extrados da
populao, em geral com dimenso sensivelmente menor, sobre
o qual se faz as observaes.
9
Parmetro e Estatstica
A qualquer medida estatstica calculada com os dados da
populao d-se o nome de parmetro. A medida estatstica
calculada com as informaes obtidas a partir da amostra
chamada estatstica.
Exemplo: Deseja-se estudar os salrios mensais pagos no setor
industrial baiano no ano de 2013.
Populao: conjunto de todos os trabalhadores alocados nas
indstrias localizadas no Estado da Bahia em 2013.
Caracterstica de interesse: salrios pagos a esses trabalhadores.
11
Parmetro e Estatstica
Exemplo: Deseja-se estudar os salrios mensais pagos no setor
industrial baiano no ano de 2013.
Parmetro: salrio mdio dos trabalhadores alocados nas
indstrias localizadas no Estado da Bahia em 2013.
Estatstica: salrio mdio da amostra de trabalhadores.
12
Noes gerais de
Amostragem
13
Classificao de Variveis
As caractersticas da populao so comumente chamadas de
variveis. Estas, quanto sua natureza, so classificadas como
qualitativas e quantitativas.
14
Variveis qualitativas
Variveis quantitativas
Nominal
Ordinal
Discreta
Contnua
17
Escala nominal
Escala ordinal
Escala intervalar
Escala de razo
19
Fonte publicada;
Pesquisa;
Estudo observacional;
Simulao.
Sries Estatsticas
22
23
24
Corpo da tabela
Cabealho
Coluna indicadora
Fonte
25
26
Elementos complementares:
Nota
Chamadas
27
ALERTA!!!!
28
Distribuies de Frequncias
29
Algumas definies:
Frequncia acumulada
TIPOS DE FREQUNCIAS
31
32
33
34
35
Slide 43
36
37
min
39
mi linf
1
hi ; i 1, 2 , k
2
40
Dados brutos
Passos
1.
Fazer o rol dos dados, identificando o menor e o maior valor
do conjunto. Verificar o tamanho da amostra e calcular a
amplitude total;
2.
Obteno do nmero de classes;
3.
Calcular a amplitude das classes;
4.
Montar a tabela de distribuio de frequncias.
42
43
Apresentao Grfica
Simplicidade;
Clareza;
Veracidade.
44
Fator
Variante
Histrica
Tempo
Linhas, colunas
Especfica
Fenmeno
Geogrfica
Local
Distribuio
Intensidade
de frequncias do fenmeno
47
Grfico de Setores
Grfico de Setores
49
Grfico de Colunas
51
Grfico em Linhas
Histograma
Histograma
54
Histograma
55
56
Simtrico
Ilhas Isoladas
Assimtrico
esquerda
Assimtrico
direita
57
58
59
60
61
62
Grfico interessante
63
64
65
66
Medidas estatsticas de
sumarizao ou resumo
Valores que resumem um conjunto de dados podem ser
classificados em:
67
Medidas de posio
ou localizao
q
Mdia
Mediana
Moda
Separatrizes
n
i 1 xi
Mdia Amostral
n
Mdia Populacional
iN1 xi
N
69
70
in1 xi . pi
n
i 1
pi
k
i 1 xi . f i
ik1 f i
ik1 mi . f i
ik1 f i
72
fi
25
10
5
6
4
50
Frequncia
0 |-- 5
5 |-- 10
10 |-- 15
15 |-- 20
20 |-- 25
Total
6
5
8
4
2
25
Comentrios
76
Desvantagem
77
Mediana
79
Mdia x Mediana
A mediana uma medida de posio resistente, pois pouco
afetada por mudanas de pequena poro dos dados, ao
contrrio da mdia que sensvel a valores atpicos
(discrepantes).
Exemplo: Calcule a mdia e a mediana.
Conjunto 1 = {200, 250, 250, 300, 450, 460, 510}
Conjunto 2 = {200, 250, 250, 300, 450, 460, 2.300}
Moda
81
Frequncia
(%)
40
30
20
10
100
Qual a moda?
82
Separatrizes
Mediana
Quartis
Decis
Centis ou Percentis
83
~
x = Q2 = D5 = P50.
84
2.
i
P
n,
100
3.
P um nmero inteiro?
Medidas de disperso
ou variabilidade
Absolutas
q
Amplitude total
Desvio mdio
Varincia
Desvio padro
Medidas de disperso
ou variabilidade
Relativas
q
Varivel padronizada
Independem da unidade de medida da varivel
observada. Servem para estudar
comparativamente a variabilidade de duas ou
mais distribuies.
88
Motivao
Produo diria da pea Z de trs empregados de uma
indstria no perodo de 15 19 de abril de 2000.
Dia
Empregado
Carlos
Daniel
Eduardo
Mdia
Diria
82
60
53
70
78
72
65
68
75
60
62
75
73
82
75
70
70
70
Motivao
Considerando agora apenas dois empregados com produo
mdia diria diferente.
Produo diria da pea Z de dois empregados de uma
indstria no perodo de 15 19 de abril de 2000.
Dia
Empregado
Antnio
Benedito
Mdia
Diria
70
60
71
80
69
70
70
62
70
83
70
71
Amplitude total
R xmax xmin
Exemplo: Calcule a amplitude total da produo da pea Z
para cada empregado da indstria e identifique qual
empregado apresentou a menor disperso e qual apresentou a
maior disperso na produo diria.
Seriam idnticas as produes dirias observadas de Daniel e
Eduardo?
91
Observaes
92
Varincia
i 1
( xi )
Varincia Populacional
i 1
( xi x ) 2
n 1
Varincia Amostral
93
94
Desvio padro
N
i 1
( xi )
s s2
n
i 1
( xi x ) 2
n 1
96
amplitude interquartlica Q3 Q1
DQ
2
2
98
Observaes
99
S
CV
X
100
S 0,08
Peso: X 78,2
S 11,9
101
Medidas de assimetria
As medidas de assimetria so utilizadas para avaliar o grau de
assimetria da distribuio de frequncias, sendo que assimetria
pode ser definida como o grau de deformao de uma curva de
frequncias.
102
~
a) X X distribuio
Mo,
simtrica
103
~
Mo,
b) X X distribuio
assimtrica positiva ou direita
~
Mo,
c) X X distribuio
assimtrica negativa ou esquerda
104
Medidas de curtose
As medidas de curtose indicam at que ponto a curva de
frequncias de uma distribuio se apresenta mais afilada ou
mais achatada em relao a uma curva tomada como padro,
denominada curva normal.
A curva normal simtrica em relao media aritmtica e
tem a forma semelhante a de um sino.
105
106
107
108
Diagramas em Caixas
Box-plot
110
1,92
1,24
1,90
1,79
1,64
2,31
1,58
1,68
2,46
2,09
1,79
2,03
1,51
1,88
1,75
2,28
1,70
1,64
2,08
1,63
1,74
2,17
0,72
1,67
2,37
1,47
2,60
1,69
1,37
1,75
1,97
2,11
1,85
1,93
1,69
111
ROL
0,72 1,40 1,64 1,69
1,79
0,85 1,47
1,09
1,51
1,67
1,74
1,82
1,24
1,58
1,68
1,75
1,85
1,93
2,11 2,46
1,37
1,63 1,69
1,75
1,86
1,97
2,17 2,60
Q1 =
1,635
Q2 = 1,77
Q3 = 2,00
d = 0,365
113
115
Box-Plot e Assimetria
116
Anlise Bivariada
119
Variveis Qualitativas
Varivel 2
Total
Categoria 1
Categoria 2
Categoria 1
a+b
Categoria 2
c+d
Total
a+c
b+d
Sexo
Hbito de Fumar
Total
Fuma
No-Fuma
Masculino
20
37
57
Feminino
27
35
Total
28
64
92
121
Curso
Sexo
Total
Masculino
Feminino
Contbeis
100
20
120
ADM
40
40
80
140
60
200
Total
122
123
Coeficiente de YULE
Varivel 2
Total
Categoria 1
Categoria 2
Categoria 1
a+b
Categoria 2
c+d
Total
a+c
b+d
ad bc
Y
ad bc
O valor de Y est compreendido no intervalo fechado de -1 at 1.
Y = 0 corresponde a independncia.
Y 0 corresponde a associao entre as variveis.
124
Variveis Quantitativas
125
Anos de
Servio (X)
Nmero de
clientes (Y)
48
50
56
52
43
60
62
58
64
10
72
127
x y
i
nx y
i 1
n
n
2
2
2
2
xi nx
yi ny
i 1
i 1
0 r 1
Correlao linear
positiva
Y
1 r 0
r 1
Correlao linear
perfeita positiva
Y
r0
r 1
X
Correlao nula
Correlao linear
negativa
Correlao linear
perfeita negativa
129
Conjunto 2
X
Y
10
9,14
8
8,14
13
8,74
9
8,77
11
9,26
14
8,1
6
6,13
4
3,1
12
9,13
7
7,26
5
4,74
Conjunto 3
X
Y
10
7,46
8
6,77
13
12,74
9
7,11
11
7,81
14
8,84
6
6,08
4
5,39
12
8,15
7
6,42
5
5,73
Conjunto 4
X
Y
8
6,58
8
5,76
8
7,71
8
8,84
8
8,47
8
7,04
8
5,25
19
12,5
8
5,56
8
7,91
8
6,89
131
133
(1-Masculino e 2- Feminino)
134
135