Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Aula 02
Prof. Christopher Freire Souza
Centro de Tecnologia
Universidade Federal de Alagoas
www.ctec.ufal.br/professor/cfs
2
Anlise Preliminar dos
Dados
Objetivo
Compreenso e descrio dos dados a partir da
organizao, resumo e elaborao de grficos e
estimao de estatsticas.
3
Anlise Preliminar dos
Dados
4
Anlise Preliminar dos
Dados
5
Anlise Preliminar dos
Dados
Resumos e Grficos
Distribuio de freqncia
Histogramas
Histogramas polares
Polgono de freqncia
Ogiva
Grfico de Pareto
Diagramas de disperso
Grficos de sries temporais
Criao de grficos estatsticos (Curva de permanncia e
grfico polar)
6
Anlise Preliminar dos
Dados
Idade
Freqncia
21-30
28
31-40
30
41-50
12
51-60
61-70
71-80
7
Anlise Preliminar dos
Dados
Idade
Freqncia
21-30
28
31-40
30
41-50
12
51-60
61-70
71-80
2
Mesmo procedimento para
freqncia relativa ou
acumulada
8
Anlise Preliminar dos
Dados
9
Anlise Preliminar dos
Dados
90
120
60
3
2
150
30
1
180
210
330
240
300
270
10
Anlise Preliminar dos
Dados
11
Anlise Preliminar dos
Dados
12
Anlise Preliminar dos
Dados
Prioridade de adequao
250
97%
200
78%
150
58%
100
39%
50
19%
0%
13
Anlise Preliminar dos
Dados
14
Anlise Preliminar dos
Dados
dados no-usados
dados em uso
14000
12000
Q(m/s)
Grfico onde as
informaes de uma
varivel so
representadas no eixo
das ordenadas com seus
pares equivalentes ao
momento/tempo de
ocorrncia no eixo das
abcissas.
MATLAB: plot
10000
8000
6000
4000
2000
0
31 34 37 40 43 4649 52 55 58 61 64 6770 73 76 79 82 8588 91 94 97 00 03 06
Ano
15
Anlise Preliminar dos
Dados
16
Anlise Preliminar dos
Dados
Curva de permanncia
Freqncia acumulada de
excedncia de valores
Procedimento:
Ordena dados de forma
decrescente
Calcula a % de excedncia
pela razo da ordem de
cada registro pela
quantidade de dados
Grfico das vazes
ordenadas contra a % de
excedncia
10000
8000
6000
4000
2000
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100
Frao do tempo (%)
17
Anlise Preliminar dos
Dados
press
postss
prebs
postbs
J
100
A
200
S
300
O
18
Anlise Preliminar dos
Dados
Estatsticas
Medidas de centro
Medidas de variao
Medidas de forma (posio relativa)
Medidas de associao entre variveis
19
Anlise Preliminar dos
Dados
Estatsticas
Quantis: dividem a amostra ordenada de dados
em grupos com aproximadamente o mesmo
nmero de dados
99 percentis - diviso em 100 partes
3 quartis diviso em 4 partes
20
Anlise Preliminar dos
Dados
21
Anlise Preliminar dos
Dados
MATLAB: prctile
Como em curvas de permanncia a ordem dos dados decrescente,
PL=Q(100-L). Ex. P10=Q90
22
Anlise Preliminar dos
Dados
23
Anlise Preliminar dos
Dados
Ponto Mdio
Mediana
Moda
Mdia
Mdia aparada
24
Anlise Preliminar dos
Dados
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
Ponto mdio = (1+36)/2 = 18,5
25
Anlise Preliminar dos
Dados
MATLAB: median
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
Mediana = 12,5
26
Anlise Preliminar dos
Dados
MATLAB: mean
Por exemplo, para a amostra [1, 3, 6, 15, 15, 21, 28, 36]
Mdia = (1+3+6+21+28+36).1/8+15.2/8 = 15,625
27
Anlise Preliminar dos
Dados
28
Anlise Preliminar dos
Dados
29
Anlise Preliminar dos
Dados
Amplitude
Desvio mdio absoluto
Desvio padro
Varincia
Coeficiente de variao
Intervalo interquartil
Intervalo percentlico
30
Anlise Preliminar dos
Dados
31
Anlise Preliminar dos
Dados
32
Anlise Preliminar dos
Dados
33
Anlise Preliminar dos
Dados
MATLAB: mad
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36], mdia=15
Desvios
|xi-media|=[14,12,9,5, 0, 6, 13, 21]
Desvio mdio absoluto = 10
34
Anlise Preliminar dos
Dados
MATLAB: var
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
var = 156
35
Anlise Preliminar dos
Dados
36
Anlise Preliminar dos
Dados
MATLAB: std
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
Desvios
(xi-media)=[-14,-12,-9,-5, 0, 6, 13, 21]
Quadrados (xi-media)=[196,144,81,25,0,36,169,441]
Soma dos Quadrados = 1092
Desvio padro =12,49
37
Graus de Liberdade
Christopher Souza:
Anlise Preliminar de
Dados
Amostra
Mdia
Mediana
Amp.
Var.(n1)
Std(n-1)
Var.(n)
std(n)
1,1
1,0
1,0
0,0
0,0
1,2
1,5
1,5
0,5
0,707
0,25
0,5
1,5
3,0
3,0
8,0
2,828
2,1
1,5
1,5
0,5
0,707
0,25
0,5
2,2
2,0
2,0
0,0
0,0
2,5
3,5
3,5
4,5
2,121
2,25
1,5
5,1
3,0
3,0
8,0
2,828
5,2
3,5
3,5
4,5
2,121
2,25
1,5
5,5
5,0
5,0
0,0
0,0
Mdia amostral
8/3
8/3
16/9
26/9
1,3
1,44
0,89
Parmetro
8/3
26/9
1,7
2,89
1,7
Populao: 1, 2, 5
38
Anlise Preliminar dos
Dados
39
Anlise Preliminar dos
Dados
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
Cv=83,27%
40
Anlise Preliminar dos
Dados
Escore z
Quartil
Percentil
Simetria/Assimetria
Curtose
41
Anlise Preliminar dos
Dados
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
42
Anlise Preliminar dos
Dados
MATLAB: skewness
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
assimetria=0,5
43
Anlise Preliminar dos
Dados
MATLAB: kurtosis
Por exemplo, para a amostra [1, 3, 6, 10, 15, 21, 28, 36]
Curtose = 1,95
44
Anlise Preliminar dos
Dados
MATLAB: corrcoef
45
Anlise Preliminar dos
Dados
Q(mm/dia)
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1.5
2.5
P(mm/dia)
3.5
46
Christopher Souza: Teste
de hipteses
Postos
Nmero atribudo a um item
da amostra de acordo com sua
posio na lista ordenada.
Em caso de empates, aplica-se
a mdia dos postos como valor
de posto de cada item com
igual valor
Ex:
x: [12 10 5 5 4 5 11 12]
xo: [4 5 5 5 10 11 12 12]
io: [1 3 3 3 5 6 7,5 7,5]
i: [7,5 5 3 3 1 3 6 7,5]
47
Anlise Preliminar dos
Dados
rposto 1
6d 2
n (n 2 1)
MATLAB: corr
Spearman = 0,7143
48
Anlise Preliminar dos
Dados
49
Anlise Preliminar dos
Dados
50
Anlise Preliminar dos
Dados
MATLAB: boxplot