Sei sulla pagina 1di 26

BC-0005

Bases Computacionais da
Cincia
Aula 08
Noes de Estatstica
Mdia, desvio padro, erro padro
Exercicos utilizao da base de dados da turma

2009

Roteiro da Aula

PARTE I Noes de Estatstica

O que Estatstica Descritiva e Estatstica Inferencial

Medidas de Tendncia Central


Medidas de Disperso

PARTE II Exerccios
Determinao da altura mdia, peso mdio
Grficos
idade X altura; idade x peso
Histograma de times

Idade

Altura

Peso

Taxa
Pulsao

Presso
Sistlica

Presso
diastlica

Colesterol

IMC

(anos)

(m)

(Kg)

bat/min

mmHg

mmHg

mg

58

1,8

76,1

68

125

78

522

23,5

22

1,68

64,9

64

107

54

127

23

32

1,82

80,7

88

126

81

740

24,3

31

1,74

79,1

72

110

68

49

26

28

1,72

68,7

64

110

66

230

23,3

46

1,76

75,1

72

107

83

316

24,3

41

1,69

60,8

60

113

71

590

21,3

56

1,71

90,7

88

126

72

466

31,1

20

1,73

78,8

76

137

85

121

26,2

54

1,67

62,6

60

110

71

578

22,5

17

1,6

70,3

96

109

65

78

27,5

73

1,73

84

72

153

87

265

27,9

52

1,86

86

56

112

77

250

24,9

25

1,72

68,1

64

119

81

265

23,1

29

1,73

94,2

60

113

82

273

31,6

17

1,8

106,7

64

125

76

272

32,8

41

1,56

79,5

84

131

80

972

32,8

52

1,94

99,3

76

121

75

75

26,5

32

1,68

74,7

84

132

81

138

26,4

20

1,77

61,8

88

112

44

139

19,7

20

1,66

73,9

72

121

65

638

26,8

29

1,78

73,1

56

116

64

613

23,1

Estatstica
Quais so a altura, peso
e IMC mdios desta
amostra?
Qual a altura mdia da
turma?
Qual a taxa de
aprovao no vestibular
de uma determinada
escola?
Qual a maior torcida
presente nesta sala?

A Estaststica capaz de responder com maior


exatido essas questes
Estatstica Descritiva apresentao, organizao e resumo dos dados

Pode incluir a construo de grficos, tabelas e computao de vrias medidas, tais como, medidas de
tendncia central (mdia, mediana, moda), medidas de disperso (amplitude, desvio mdio, varincia,
desvio padro), percentagem e outras

O propsito desta estatstica fazer com que os dados coletados sejam compreendidos mais facilmente
Estatstica Inferencial generalizao de uma amostra de dados para um grande nmero de
sujeitos

mtodos estatsticos so usados para tirar concluses, fazer estimativas, predies e generalizaes
sobre todo um conjunto de dados, estudando apenas parte dele, ou seja, a estatstica inferencial nos
permite usar informaes de pequenos grupos para fazer inferncias sobre grandes grupos dos quais os
dados foram retirados

Medidas de Tendncia Central


Valor mdio ou tpico de um conjunto
de dados
Mdia Aritmtica ou Mdia: utilizada
para dados quantitativos
Mediana: utilizada para dados ordinais
Moda: utilizada tambm para dados
nominais (variveis qualitativas)

Mdia Aritmtica
o centro de gravidade dos dados
Soma de um conjunto de valores dividida pelo nmero de
dados do conjunto :
Alunos

Notas

3,0

5,0

6,0

o nmero total de valores do conjunto

4,0

um valor do conjunto

5,0

8,0

9,0

6,0

2,0

10

5,0

Total

53

Mdia

5,3

X =

N
Xi

i= 1

Xi

Funo no Excel ou BrOffice: MDIA


5
6
0

Mediana:

valor central do conjunto que divide a


distribuio em duas partes iguais
(mesmo nmero de dados abaixo e
acima do valor)
Os dados devem estar ordenados
Notao: Mediana = X i
Posio da mediana =>
N+1
i=

No caso de um nmero par de sujeitos


a mediana ser a mdia entre os dois
valores centrais.

i= 11 + 1 = 6 Posio 6 Nota 5
2
Notas

Freqncia
Simples

Freqncia
Acumulada

10

Dadas as alturas: 62 54 82 49 75 64
9
1
Ordene: 49 54 62 64 75 82
Funo no Excel ou BrOffice: MED
Med = 62+64 = 63
2

11

Moda

Distribuio Unimodal
4
3
2
1
0
2

Nota

Notas

Freq.

Notas

Freq.

Distribuio Bimodal

ia
c
n

u
q
re
F

a categoria que ocorre com


maior frequncia
A moda pode no existir OU pode
no ser nica
Exemplos:
1,1,3,3,5,7,7,7,11,13 moda 7
3,5,8,11,13,18 no tem moda
3,5,5,5,6,6,7,7,7,11,12 tem
duas modas: 5,7 (bimodal)

ia
c
n

u
q
re
F

Funo no Excel ou BrOffice: MODO

4
3
2
1
0
2

5
Nota

Caractersticas das medidas de tendncia central


Mdia influncia de
cada amostra depende
de seu valor (os valores
extremos influenciam
fortemente)
160000

Mediana influncia
de cada amostra
depende de sua posio
(valor central)

Moda

140000
120000

Frequncia

100000

Mediana

80000

Mdia

60000

Moda influncia de
cada amostra depende
de sua frequncia (valor
com mais ocorrncia)
Mediana e Moda so
menos influenciadas por
valores extremos

40000
20000
0
100
Abaixo de 100

500
300

900
700

3000
1000

Renda Mdia Mens al (R$)


Fonte: Censo Demogrfico IBGE 2000

acima de 5000
5000

Distribuio de Renda na Califrnia e nos EUA

Medidas de Disperso ou Variabilidade:


quanto os dados numricos dispersam-se em torno de um valor
mdio
Varincia: Soma dos quadrados dos desvios, onde desvio a
diferena entre cada dado e a mdia do conjunto.
2
(
x

X
)

s2 =
= 40 / 4 = 10
Funo no Excel ou BrOffice: VAR
N1

Dados

Desvios

Quadrados dos Desvios

(X )

(X X )

(X X )2

0
4
6
8
7

-5
-1
1
3
2

25
1
1
9
4

X= 5

(X X ) = 0

( X X ) 2 = 40

Medidas de Disperso ou
Variabilidade:

Desvio Padro reflete o quanto os dados se


dispersam da mdia
a raiz quadrada da varincia

s=

( x X )2
N1

10 = 3,16

Funo no Excel ou BrOffice: DESVPAD

Erro Padro da Mdia - EPM


Quando se obtm uma amostra aleatria de tamanho n,
estima-se a mdia populacional. bastante intuitivo supor
que se uma nova amostra aleatria for realizada a estimativa
obtida ser diferente daquela primeira. Desta forma,
reconhece-se que as mdias amostrais esto sujeitas
variao e formam populaes de mdias amostrais, quando
todas as possveis amostras so retiradas de uma
populao.
O erro padro analisa a variabilidade de uma mdia
Quanto maior o nmero de dados, menor o erro padro da
mdia

N1

Alunos

Notas

3,0

5,0

6,0

4,0

5,0

8,0

9,0

6,0

2,0

10

5,0

Total

53

Mdia

5,3

DVP

2,11

EPM

0,7

Erro Padro da Mdia - EPM


No existe uma Funo direta no Excel ou BrOffice para clculo do EPM
Portanto, calcula-se a partir do desvio padro

Alunos

Turma A

Turma B

10

10

Total

53

53

Mdia

5,1

5,2

DVP

0,57

3,49

EPM

0,18

1,1

EPM = s/ RAIZ (CONT.NM-1)

N1

10

3
2
1
0
Turma A

Turma B

Distribuio Normal

A distribuio normal (tambm chamada distribuio gaussiana, em homenagem


a Carl Friedrich Gauss) um importante modelo de distribuio estatstica,
observado frequentemente em experimentos relacionados ao estudo de
fenmenos de cincias to distintas quanto biologia, fsica e economia.
Exemplo
Um instituto de pesquisas realiza uma
amostragem com 5000 pessoas para
obter uma estimativa da altura mdia do
brasileiro adulto. Estas pessoas so
sorteadas para a pesquisa atravs de
uma estratificao adequada, que reflita
os dados de toda a populao do pas.
Observe os resultados, categorizados
por faixas de altura:

Clculo da frequncia relativa


(porcentagem) =
freq. Absoluta/ freq. total * 100
www.financasnet.com.br

Distribuio Normal

Mdia:
1,653

Desvio
Padro:
0,173

Ela hipottica e essencial na tomada de decises em estatstica. Muitos dos


testes estatsticos s tm validade se seus dados constiturem uma distribuio
normal.

www.financasnet.com.br

Caractersticas da Distribuio Normal

Quanto mais valores so


plotados em uma distribuio,
mais ela se assemelha a uma
normal
determinada por dois
parmetros:
- Mdia da populao
- Desvio padro da
populao
Distribuio simtrica e
unimodal em relao mdia
Valores de mdia, moda e
mediana so iguais
rea total sob a curva igual
a 100%, com exatos 50%
distribudos esquerda da
mdia e 50% sua direita

reas sob a Curva Normal

A rea sob a curva de uma


distribuio normal
fundamental na soluo de
problemas. Ela corresponde a
100% dos dados
Uma rea de 34,13 % da
totalidade dos dados
delimitada entre a mdia e 1
desvio padro da mdia
Quando o desvio padro da
mdia 2 a rea aumenta para
47,87%
Quando 3 a rea aumenta
para 49,87%.
Estas propores so
constantes em uma
distribuio normal

Tipos de distribuio
Distribuio Unimodal e Simtrica: Mdia, Mediana e Moda
so iguais!!!!
o ponto de Freqncia Mxima (moda) tambm o mais
central (mediana) e o centro de gravidade (mdia)

Em geral, em uma distribuio assimtrica:

A moda est sempre prxima ao pico


A mdia est mais prxima da cauda (sofre influncia dos
valores extremos)

mediana est entre a moda e mediana

Medida de Tendncia Central mais adequada:

Distribuio Simtrica Mdia


Distribuio Assimtrica Mediana ou Moda
Distribuio Bimodal Modas

Tipos de Distribuio e medidas de tendncia


central
Distribuio Unimodal e
Simtrica:

Distribuies assimtricas =>


mediana !!!
Distribuio bimodal => Moda!!!

Mdia, Mediana e Moda so


iguais!!!!
Ponto de Freqncia Mxima
(moda) tambm o mais central
(mediana) e o centro de
gravidade (mdia).

D is trib u i o As s im tric a
5

Distribuio assimtrica:

A moda est sempre prxima ao


pico
A mdia est mais prxima da
cauda (sofre influncia dos
valores extremos)
A mediana est entre a moda e
mediana

4
F re q n c ia

M oda

3
M ediana

2
1

M dia

0
2

N o ta

10

Exerccio 1 em sala:
Calcule Mdia, Mediana,Moda, desvio padro e erro padro dos dados abaixo
Idade

Altura

Peso

Taxa
Pulsao

Presso
Sistlica

Presso
diastlica

Colesterol

IMC

(anos)

(m)

(Kg)

bat/min

mmHg

mmHg

mg

58

1,8

76,1

68

125

78

522

23,5

22

1,68

64,9

64

107

54

127

23

32

1,82

80,7

88

126

81

740

24,3

31

1,74

79,1

72

110

68

49

26

28

1,72

68,7

64

110

66

230

23,3

46

1,76

75,1

72

107

83

316

24,3

41

1,69

60,8

60

113

71

590

21,3

56

1,71

90,7

88

126

72

466

31,1

20

1,73

78,8

76

137

85

121

26,2

54

1,67

62,6

60

110

71

578

22,5

17

1,6

70,3

96

109

65

78

27,5

73

1,73

84

72

153

87

265

27,9

52

1,86

86

56

112

77

250

24,9

25

1,72

68,1

64

119

81

265

23,1

29

1,73

94,2

60

113

82

273

31,6

17

1,8

106,7

64

125

76

272

32,8

41

1,56

79,5

84

131

80

972

32,8

52

1,94

99,3

76

121

75

75

26,5

32

1,68

74,7

84

132

81

138

26,4

Exerccio 2 em sala:
Um teste de memria foi aplicado a 10 idosos e 10 jovens com o objetivo de verificar o
declnio de memria decorrente do processo de envelhecimento. Alm do resultado do teste,
foram registrados outros dados dos indivduos, tais como: idade, sexo e anos de escolaridade
(ver apostila). Estas caractersticas foram registradas pois podem influenciar o desempenho
dos indivduos nos testes. Construa uma planilha no BROffice utilizando os dados destas
amostras.
a) Desempenho de cada sujeito: (varia de 0 a 20)
Idosos: 16/17/19/19/15/17/18/20/20/16
Jovens: 20/20/19/19/20/20/17/19/20/18
b) Calcule a mdia, desvio padro e erro padro da mdia do desempenho para idosos e
jovens
c) Faa um grfico de colunas da mdia do desempenho de idosos e jovens, com o ttulo Teste
de Memria
d) Inclua as barras de erros com o erro padro da mdia
e) Discuta a diferena do desempenho entre os grupos com base nos valores de mdia e erro.

Para inserir o erro padro no BROffice

Selecionar
os valores
de erro
calculados
na planilha

I ndivduo

Exerccio 3 em Sala
Considere a seguinte tabela de dados de
presso sangunea obtida para um grupo de 40
pessoas:
Utilizando os dados de presso diastlica,
calcule a mdia, desvio padro e construa
duas tabelas de frequncia:
1) com intervalos de 5 batimentos (<50, 5155, 56-60, ...)
2) com intervalos de 10 batimentos (<50, 5160, 61-70, ...)
Faa os respectivos grficos de
distribuio.
Qual das duas tabelas de frequncia
melhor representa uma distribuio
normal? Por qu? E se ao invs de 40,
tomssemos a presso sangunea de 4000
indivduos, qual das tabelas de frequncia
voc acredita que seria mais adequada?
Por qu?

P res s o
S is t lic a

P res s o
dia s tlic a

mmHg

mmHg

1 25

78

1 07

54

1 26

81

110

68

110

66

1 07

83

113

71

1 26

72

1 37

85

10

110

71

11

1 09

65

12

1 53

87

13

112

77

14

119

81

15

113

82

16

1 25

76

17

1 31

80

18

1 21

75

19

1 32

81

20

112

44

21

1 21

65

22

116

64

23

95

58

24

110

70

25

110

66

26

1 25

82

27

1 24

79

28

1 31

69

29

1 09

64

30

112

79

31

1 27

72

32

1 32

74

33

116

81

34

1 25

84

35

112

77

36

1 25

77

Exerccio 1 para Casa


Escolha um cruzamento que tenha o trfego controlado por um semforo.
Pode ser o que voc observa diretamente da janela de seu apartamento ou
da padaria.
Enquanto voc toma um caf (isso opcional) conte o nmero de carros que
passa (escolha uma direo e sentido) a cada intervalo de tempo em que o
sinal verde. Tome no mnimo 30 medidas. Faa uma tabela que registre
cada medida. Anote o cruzamento, direo, sentido e hora da experincia.
Calcule a mdia e o desvio padro.
Elabore tabelas de frequncia considerando diferentes intervalos (observe
que o intervalo aqui dado em nmero de carros). Faa os respectivos
grficos de distribuio.
Faa uma nova srie de medidas para comparao. Pode ser outro
cruzamento, outro horrio (hora do rush/trnsito livre, dia til/domingo)
etc. Que concluses voc pode tirar comparando as duas sries? Baseie sua
resposta nos valores mdios, desvio padro e forma da distribuio.

Exerccio 2 para Casa Finalizar


exerccio da planilha de memria
como est na apostila

Potrebbero piacerti anche