Sei sulla pagina 1di 43

Estatstica para Cursos de

Engenharia e Informtica
Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia
So Paulo: Atlas, 2004

Cap. 3 Anlise exploratria de


dados
APOIO:
Fundao de Apoio Pesquisa Cientfica e Tecnolgica do Estado de Santa Catarina
(FAPESC)
Departamento de Informtica e Estatstica UFSC (INE/CTC/UFSC)

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Dados e variveis

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Dados e variveis

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Dados e variveis
quantitativa

dados quantitativos

varivel
qualitativa ou
categrica

dados qualitativos
ou categorizados

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Distribuio de freqncias
A distribuio de freqncias consiste na
organizao dos dados de acordo com as
ocorrncias dos diferentes resultados observados.

Pode ser apresentada em tabela ou grfico.

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Dados
Provedor usado por cada usurio
indivduo

provedor

indivduo

provedor

indivduo

provedor

indivduo

provedor

1
2
3
4
5
6
7
8
9
10

C
A
B
B
C
B
D
B
B
A

11
12
13
14
15
16
17
18
19
20

C
A
B
D
A
B
B
C
D
B

21
22
23
24
25
26
27
28
29
30

B
A
A
B
A
A
B
D
D
C

31
32
33
34
35
36
37
38
39
40

A
A
B
C
B
D
B
B
B
C

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Distribuio de freqncias para variveis qualitativas


Tabela. Distribuio de freqncias do
provedor usado pelo visitante do site.
Provedor

Freqncia

Percentagem

10

25,0

17

42,5

17,5

15,0

Total

40

100,0

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Distribuio de freqncias para variveis qualitativas

50%
40%
30%
20%
10%
0%
A

provedor

Grfico de colunas para a apresentao da distribuio


de freqncias do provedor usado pelo visitante do site.
BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Distribuio de freqncias para variveis qualitativas

15%
25%

A
18%

B
C
D

42%

Grfico de setores para a apresentao da distribuio


de freqncias do provedor usado pelo visitante do site.
BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Distribuio de freqncias para variveis


quantitativas discretas
% de itens
16
14
12
10
8
6
4
2
0

Nmero de defeitos

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Variveis contnuas
Construo da distribuio de freqncias
5,2
5,5
8,9
8,2
5,7
4,9
6,5

6,4
6,2
7,3
7,1
6,2
5,0
5,9

5,7
4,9
5,4
4,9
4,9
5,7

8,3
5,7
4,8
5,0
5,1
6,3

7,0
6,3
5,6
8,2
6,0
6,0

5,4
5,1
6,8
9,9
4,7
6,8

4,8
8,4
5,0
5,4
14,1
7,3

9,1
6,2
6,7
5,6
5,3
6,9

amplitude dos dados

14,1

4,7
4

10

11

12

13

14

15

11 classes de amplitude unitria


BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Tabela de freqncias: varivel contnua


Classes de
tempo

4
5
6
7
8
9
10
11
12
13
14

Ponto
mdio

Percentagem de
observaes

Percentagem
acumulada

nj

100fj

100Fj

Nmero de
observaes

5
6
7
8
9
10
11
12
13
14
15

4,5
5,5
6,5
7,5
8,5
9,5
10,5
11,5
12,5
13,5
14,5

7
18
13
4
5
2
0
0
0
0
1

14
36
26
8
10
4
0
0
0
0
2

14
50
76
84
94
98
98
98
98
98
100

Total

50

100

|
|
|
|
|
|
|
|
|
|
|

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Histograma
20
18

nmero de observaes

16
14
12
10
8
6
4
2
0

10

11

12

13

14

15

tempo (em segundos) para carga de um aplicativo

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Formas de uma distribuio de freqncias


Distribuies diferentes em termos da posio
central

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Formas de uma distribuio de freqncias


Distribuies diferentes quanto disperso

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Formas de uma distribuio de freqncias


Distribuies diferentes quanto assimetria

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Formas de uma distribuio de freqncias


Distribuies diferentes quanto curtose

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Medidas descritivas
A mdia aritmtica: uma medida de posio
central.

x1 x 2 ... x n 1 n
x
xi
n
n i 1

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Exemplo
Tempo (minutos)
Temperatura (0C)

20

25

30

60

29,7 28,7 30,2


31,3 31,2 31,7

31,0 30,6 32,8


31,9 31,2 31,2

32,9 32,7 34,8


34,9 33,8 34,9

70

36,6 35,7 35,3


35,1 30,2 37,2

35,7 40,4 41,7


36,9 34,5 40,0

34,8 36,8 37,4


38,9 38,7 42,5

80

40,2 33,6 33,4


35,2 38,1 33,0

37,0 34,4 29,8


33,9 43,2 35,5

36,0 31,3 36,6


32,5 39,2 35,9

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Exemplo
Mdias aritmticas do rendimento, para diferentes nveis de
temperatura e tempo de reao, num processo qumico.
Tempera-

Tempo (minutos)

tura (0C)

20

25

30

60

30,5

31,4

34,0

70

35,0

38,2

38,2

80

35,6

35,6

35,3

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Exemplo
Rendimento mdio em funo
do tempo e temperatura
39
38
37

Rendimento (%)

36
35
34
33
32
31
30
29
20

25

30

60 graus
70 graus
80 graus

Tempo (minutos)
BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Exemplo: notas dos alunos de trs turmas

Turma
A
B
C

Notas dos alunos


4
1
0

5
2
6

5
4
7

6
6
7

6
6
7

7
7 8
9 10 10
7,5 7,5

Mdia da turma
6,00
6,00
6,00

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Exemplo: notas dos alunos de trs turmas

Turma A
Turma B
Turma C
0

10

12

notas

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Como medir a disperso?


Exemplo: Turma A (4 5 5 6 6 7 7 8)

distncia (desvio) em relao mdia

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Como medir a disperso?


Descrio

notao

resultados numricos

Valores (notas dos alunos)

xi

Mdia

xi x

-2 -1 -1 0 0 1 1 2

Desvios em relao mdia


Desvios quadrticos

Varincia (da amostra):

4 5 5 6 6 7 7 8

xi x

4 1 1 0 0 1 1 4

n
1
2

s2
x
x

i
n 1 i 1

4 1 1 0 0 1 1 4
s
8 1
2

1,71

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Como medir a disperso?


Descrio

notao

resultados numricos

Valores (notas dos alunos)

xi

Mdia

xi x

-2 -1 -1 0 0 1 1 2

Desvios em relao mdia


Desvios quadrticos

4 5 5 6 6 7 7 8

xi x

Desvio padro (da amostra):

4 1 1 0 0 1 1 4
s
8 1

4 1 1 0 0 1 1 4

1 n
2
x i x

n 1 i 1

1,71 1,31

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Medidas descritivas das notas finais dos


alunos de trs turmas.
Turma

Nmero de
alunos

Mdia

Desvio
padro

A
B
C

8
8
7

6,00
6,00
6,00

1,31
3,51
2,69

Interprete.

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Ex: Rendimento de um processo qumico


Rendimento mdio em funo
do tempo e temperatura

Desvio padro do rendimento em


funo do tempo e temperatura

38

5,0

37

4,5

36
35
34
33
32
31
30
29
20

25

Tempo (minutos)

30

60 graus
70 graus
80 graus

Desvio padro do rendimento

Rendimento (%)

39

4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
20

25

30

60 graus
70 graus
80 graus

Tempo

Interprete.
BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Outra forma de calcular o desvio padro


s

1 n 2
2
xi nx
n1 i 1

xi : 4 5 5 6 6 7 7 8
Valores ao quadrado xi2 : 16 25 25 36 36 49 49 64
Valores

i 1

48

x 6

2
x
i 300
i 1

300 8.(6 )2
300 288
12
s=
=
=
= 1,31
7
7
7
BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Medidas baseadas na ordenao dos dados

25%

25%

25%
25%

qi
Quartil
inferior

md
mediana

qs

Quartil
superior

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Medidas baseadas na ordenao dos dados


Dados ordenados:

n 1
posio de qi :
4
25%

25%

25%
25%

qi

md

qs

n 1
posio de md :
2
3(n 1)
posio de q s :
4
Se fracionrio interpolao linear

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Exemplo
Observaes: 15, 18, 5, 7, 9, 11, 3, 5, 6, 8, 12.
Ordenando:
3 5 5
6 7 8 9 11 12 15 18
n = 11
n 1
posio de qi :
3
4

qi 5

n 1
6
2

md 8

3(n 1)
9
4

q s 12

posio de md :
posio de q s :

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Comparao entre mdia e mediana


A mdia mais influenciada por valores
discrepantes.
50% dos valores

10

50% dos valores

20

md = 22,5

30

40

50

60

x 24,7

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

70

Comparao entre mdia e mediana


(a) distribuio
simtrica
50%

50%

mdia = mediana

(b) distribuio
assimtrica
50%
50%
mediana

mdia

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Aplicao

Interpretar.

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Diagrama em caixas
max
qs + 1,5dq
qs
dq = qs - qi

md
qi

min

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Diagrama em caixas e forma da distribuio

25%
25%
25%

25% 25%
25%

25%
25%

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Interprete o grfico
28
Renda
familiar

23

(sal. mn.) 18
13
8
3

Monte
Verde

Encosta
do Morro

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Observaes ao longo do tempo


EXEMPLO: todos os dias retirada uma amostra
de dez sacos de leite de um laticnio, durante 23
dias.
Quer-se acompanhar o nvel e a variabilidade do
peso.

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Observaes ao longo do tempo


Grfico das mdias amostrais
1037
1036,2

1036
1035

peso (g)

1034
1033,0

1033
1032
1031
1030

1029,8

1029
1

10

15

20

amostra

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Observaes ao longo do tempo


Grfico dos desvios padro amostrais
7
6

5,68

peso (g)

5
4
3,30

3
2
1

0,92

0
1

10

15

20

amostra

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Orientao geral para anlise exploratria de


dados no temporais
Tabela

Varivel
qualitativa

Distribuio de
freqncias

Percentagens

Grfico de
barras, colunas
ou setores

Anlise
univariada

Varivel
quantitativa

Distribuio de
freqncias

Histograma
Ramo-e-folhas

Medidas descritivas (mdia,


desvio padro, mediana, etc.)

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Orientao geral para anlise exploratria de


dados no temporais

Uma varivel quantitativa


e outra qualitativa

Medidas descritivas da
varivel quantitativa em cada
categoria da qualitativa
Diagrama em caixas mltiplo

Anlise
biivariada

Duas variveis
qualitativas

Duas variveis
quantitativas

Tabela de contingncia (Cap. 10)


Diagrama de disperso (Cap. 11)
Coeficiente de correlao (Cap. 11)

BARBETTA, REIS e BORNIA Estatstica para Cursos de Engenharia e Informtica. Atlas, 2004

Potrebbero piacerti anche