Sei sulla pagina 1di 129

HEP5800 DPBergamaschi 1

HEP 5800 Bioestatstica


DATA AULA CONTEDO PROGRAMTICO
02/03 1 Levantamento e apresentao tabular de dados
04/03 2 Apresentao tabular e grfica
09/03 3 Apresentao tabular e grfica Exerccios
11/03 4 Medidas de tendncia central ou de posio
16/03 5 Medidas de disperso ou de variabilidade Exerccios
18/03 6 Medidas de correlao, noes de regresso linear simples, estimando a equao
da reta - Exerccios
23/03 7 Medidas de associao
25/03 8 AVALIAO
06/04 9 Noes de probabilidade; noes de amost ragem
08/04 10 Distribuio binomial
13/04 11 Distribuio normal, distribuio amostral da mdia
15/04 12 Teste de hipteses de parmetros populacionais
20/04 13 Teste de hipteses de uma proporo populacional
22/04 14 Teste de hipteses de uma mdia populacional
27/04 15 Exerccios
29/04 16 Teste de hipteses de associao
04/05 17 Estimao de parmetros por intervalo de confiana: mdia e proporo
06/05 18 Exerccios
11/05 19 AVALIAO

HEP5800 DPBergamaschi 2
Levantamento de dados e apresentao tabular
Nveis de mensurao
Apurao de dados
Apresentao tabular
Exerccios
Nveis de mensurao (Berqu et al, 1981)
Escalas
Nominal
Ordinal
Intervalar
De razes
Discreta
Contnua
HEP5800 DPBergamaschi 3
Escala nominal
Os indivduos so classificados em categorias segundo uma
caracterstica.
Ex: sexo (masculino, feminino),
hbito de fumar (fumante, no fumante),
sobrepeso (sim, no)
causa de bito (C1,C2, C3, C4)
Nveis de mensurao
HEP5800 DPBergamaschi 4
Escala ordinal
Os indivduos so classificados em categorias que possuem
algum tipo inerente de ordem. Neste caso, uma categoria pode
ser "maior" ou "menor" do que outra.
EX: nvel scio-econmico (A, B, C e D)
Nveis de mensurao
HEP5800 DPBergamaschi 5
Escala intervalar
Este nvel de mensurao possui um valor zero arbitrrio.
Ex: temperatura em graus Celsius e Fahrenheit.
Como o zero, da escala, arbitrrio, somente faz sentido o clculo
da diferena mas no o da razo entre dois valores.
Exemplo:
material
0
C
0
F |dif
0
C| |dif
0
F| dif
0
C/dif
0
F razo
0
C razo
0
F Razo
0
C/razo
0
F
A 20 68 |A-B|=20 |A-B|=36 0,56 A/B=0,50 A/B=0,65 0,77
B 40 104 |B-C|=20 |B-C|=36 0,56 B/C=0,67 B/C=0,74 0,91
C 60 140 |A-C|=40 |A-C|=72 0,56 A/C=0,33 A/C=0,49 0,67

a temperatura em graus Fahrenheit dada por
|

\
|
+ 32 ) (
5
9
Celsious graus em a temperatur da
comprimento cm polegada |difcm| |dif

pol| Difcm/difpol Razocm Razopol Razocm/razopol
A 20 50,8 |A-B|=15 |A-B|=38,1 0,394 A/B=0,571 A/B=0,571 1
B 35 88,9 |B-C|=5 |B-C|=12,7 0,394 B/C=0,875 B/C=0,875 1
C 40 101,6 |A-C|=20 |A-C|=50,8 0,394 A/C=0,5 A/C=0,5 1

1 polegada = 2,54 cm
Nveis de mensurao
HEP5800 DPBergamaschi 6
Escala de razes discreta
O resultado numrico da mensurao um valor inteiro
Ex: nmero de refeies em um dia (0, 1, 2, 3,...)
Escala de razes contnua
O resultado numrico um valor pertencente ao conjunto dos
nmeros reais
Ex: idade (anos), peso (g), altura (cm), nvel de retinol srico
(g/dl), circunferncia da cintura (cm)
Nveis de mensurao
HEP5800 DPBergamaschi 7
Outra denominao:
Varivel qualitativa nominal
qualitativa ordinal
quantitativa discreta
quantitativa contnua
nominal
ordinal
intervalar
razes
Idoso (sim/no) Criana 1, 4, 15, 24, 32, 40, 51, 56, 59, 61, 63, 70, 74, 80, 86
Jovem
Adulto
Idoso
Nveis de mensurao
HEP5800 DPBergamaschi 8
Apurao de dados
Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado
valor (freqncia de ocorrncia).
Pode ser manual, mecnica ou eletrnica
programas estatsticos: Epi info[1], Stata, Excel, SPSS, SAS, R, S-Plus
Distribuio de freqncias - correspondncia entre categorias (valores) e freqncia
de ocorrncia.
[1] www.cdc.gov/epiinfo/
HEP5800 DPBergamaschi 9
Apurao de dados
. tab ir
ir | Freq. Percent Cum.
------------+-----------------------------------
no | 428 88.25 88.25
sim | 57 11.75 100.00
------------+-----------------------------------
Total | 485 100.00
| ir
sexo | no sim | Total
-----------+----------------------+----------
masc | 334 46 | 380
| 87.89 12.11 | 100.00
-----------+----------------------+----------
fem | 94 11 | 105
| 89.52 10.48 | 100.00
-----------+----------------------+----------
Total | 428 57 | 485
| 88.25 11.75 | 100.00
. tab sexo ir,row chi
HEP5800 DPBergamaschi 10
Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora.
Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde?
quando?
Fonte
notas, chamadas
OBS: nenhuma casela (interseco entre linha e coluna) deve ficar em branco.
A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os
smbolos ou 0 quando o valor numrico nulo e ... quando no se dispe do
dado.
Apresentao tabular
Varivel n %



Total

HEP5800 DPBergamaschi 11
Apresentao tabular
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo condio de sobrevivncia, New South Wales, Australia, 1973*.
Condio do recm-nascido n %
Sobrevivente 23 46
No sobrevivente 27 54
Total 50 100
Fonte: van Vliet PKJ, Gupta JM. (1973)
* ano da publicao do artigo
Nvel de colesterol (mg / 100ml) n %
120|--140 1 2,5
140|--160 2 5,0
160|--180 2 5,0
180|--200 6 15,0
200|--220 6 15,0
220|--240 6 15,0
240|--260 10 25,0
260|--280 3 7,5
280|--300 1 2,5
300|--320 1 2,5
320|--340 1 2,5
340|--360 1 2,5
Total 40 100
Distribuio de homens de meia idade segundo nvel de colesterol (mg/100ml), San Fracisco, EUA, 1961-62
Como o nvel de colesterol varivel
quantitativa contnua, a melhor forma de
apresent-la em tabelas utilizando
intervalos de valores denominados
intervalos de classe .
Fonte: Western Collaborative Group Study
HEP5800 DPBergamaschi 12
Apresentao tabular
Exemplo
X: 5,5,15,20,20,20,21,21,22,22
Idade Freqncia %
5|-- 10 2 20
10|--15 0 -
15|--20 1 10
20|--25 7 70
Total 10 100
Intervalos de classe: conjunto de observaes contidas entre dois valores limite
(limite inferior e limite superior)

Representao:
5 | -- 10 intervalo fechado no limite inferior e aberto no limite
superior (contm o valor 5 mas no contm o valor 10)
5 -- 10 intervalo aberto nos limites inferior e superior
(no contm os valores 5 e 10)
5 |-- | 10 intervalo fechado nos limites inferior e superior
(contm os valores 5 e 10)

OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como
0 |-- 12 meses

HEP5800 DPBergamaschi 13
Os intervalos de classe devem ser mutuamente exclusivos (um indivduo
no pode ser classificado em dois intervalos ao mesmo tempo) e
exaustivos (nenhum indivduo pode ficar sem classificao).
A amplitude do intervalo o tamanho do intervalo de classe. A amplitude
do intervalo e o nmero de intervalos dependem basicamente do
problema especfico e da literatura existente sobre o assunto.
O ponto mdio do intervalo calculado somando-se o limite inferior e
limite superior, dividindo-se o resultado por dois.
Perceber que o ponto mdio do intervalo da varivel idade, 5|--10 7,5
[ou seja, (5+10)/2] e o ponto mdio do intervalo 5|--|10 8 [ou seja,
(5+11)/2]
Apresentao tabular
HEP5800 DPBergamaschi 14
Apresentao tabular
Tabela de dupla entrada ou de contingncia
N % N % N %
Baixo peso (<2500) 24 64,9 13 35,1 37 100
No baixo peso (2500 e mais) 3 23,1 10 76,9 13 100
Total 27 54 23 46 50 100
No sobrevivente Sobrevivente Total
Peso (g)
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo condio de sobrevivncia e peso ao nascer (g), New South Wales, Australia, 1973*.
N % N % N %
Baixo peso (<2500) 24 13 37
No baixo peso (2500 e mais) 3 10 13
Total 27 100 23 100 50 100
No sobrevivente Sobrevivente Total
Peso (g)
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo condio de sobrevivncia e peso ao nascer (g), New South Wales, Australia, 1973*.
Calcular percentuais com uma casa decimal.
Fonte: van Vliet PKJ, Gupta JM. (1973)
Fonte: van Vliet PKJ, Gupta JM. (1973)
* ano da publicao do artigo
* ano da publicao do artigo
HEP5800 DPBergamaschi 15
Apresentao tabular
N % N % N %
Baixo peso (<2500) 24 64,9 13 35,1 37 100
No baixo peso (2500 e mais) 3 23,1 10 76,9 13 100
Total 27 54 23 46 50 100
No sobrevivente Sobrevivente Total
Peso (g)
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo condio de sobrevivncia e peso ao nascer (g), New South Wales, Australia, 1973*.
Fonte: van Vliet PKJ, Gupta JM. (1973)
* ano da publicao do artigo
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo condio de sobrevivncia e peso ao nascer (g), New South Wales, Australia, 1973*.
Calcular percentuais com uma casa decimal.
Fonte: van Vliet PKJ, Gupta JM. (1973)
* ano da publicao do artigo
Peso (g)
No sobrevivente Sobrevivente Total
N % N % N %
Baixo peso (<2500) 24 88,9 13 56,5 37 74
No baixo peso (2500 e mais) 3 11,1 10 43,5 13 26
Total 27 100 23 100 50 100
HEP5800 DPBergamaschi 16
Exerccios
Classificar quanto natureza, as seguintes variveis:
Varivel Tipo (natureza)
condio de sade (doente, no doente)
tipo de parto (normal, cesrio)
Nvel de colesterol srico (mg/100cc)
tempo de um procedimento cirrgico (minutos)
nmero de praias consideradas poludas
Custo do procedimento (reais)

Questo 1
HEP5800 DPBergamaschi 17
Questo 2
Exerccios
Os dados a seguir so de peso (kg) de 80 mulheres. Apresente-os em uma tabela
Peso (kg)
58 65 67 70 72 75 81 81
59 65 68 70 72 75 81 81
59 65 68 71 72 75 81 81
61 65 68 71 73 75 81 81
63 65 68 71 73 76 82 82
63 66 68 71 73 76 82 82
64 66 69 72 73 76 82 82
64 66 69 72 74 76 83 83
64 66 70 72 74 77 84 84
58 67 70 72 75 77 85 85
Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons
Inc., 1979. (adaptado)
HEP5800 DPBergamaschi 18
Exerccios
Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com
sndrome de desconforto respiratrio idioptico grave. Algumas crianas foram a
bito (*) e outras sobrevieram. Apresente os dados em uma tabela de dupla
entrada considerando as variveis peso ao nascer e condio de sobrevivncia.
1050* 2500* 1890* 1760 2830
1175* 1030* 1940* 1930 1410
1230* 1100* 2200* 2015 1715
1310* 1185* 2270* 2090 1720
1500* 1225* 2440* 2600 2040
1600* 1262* 2560* 2700 2200
1720* 1295* 2730* 2950 2400
1750* 1300* 1130 2550 3160
1770* 1550* 1575 2570 3400
2275* 1820* 1680 3005 3640
Fonte: Hand DJ et al., 1994.

Questo 3
HEP5800 DPBergamaschi 19
Os dados a seguir so de altura de uma amostra de 351 mulheres idosas
selecionadas aleatoriamente de uma comunidade para um estudo de
osteoporose. Faa uma apurao dos dados e represente-os em uma tabela.
Interprete os resultados.
Exerccios
Questo 4
142 152 154 156 157 158 160 161 163 164 165 169
145 152 154 156 157 158 160 161 163 164 165 169
145 152 154 156 157 158 160 161 163 164 165 169
145 152 154 156 157 158 160 161 163 164 165 169
146 152 155 156 157 158 160 161 163 164 166 169
147 152 155 156 157 158 160 161 163 164 166 169
147 153 155 156 158 158 160 161 163 164 166 169
147 153 155 156 158 158 160 161 163 164 166 170
147 153 155 156 158 159 160 162 163 164 166 170
148 153 155 156 158 159 160 162 163 164 166 170
148 153 155 156 158 159 160 162 163 164 166 170
149 153 155 156 158 159 160 162 163 164 166 170
150 153 155 156 158 159 160 162 163 164 166 170
150 153 155 156 158 159 160 162 163 164 166 170
150 153 155 156 158 159 160 162 163 164 166 170
150 153 155 157 158 159 160 162 163 165 167 170
150 153 155 157 158 159 160 162 163 165 167 170
150 153 155 157 158 159 161 162 163 165 167 170
151 153 155 157 158 159 161 162 163 165 167 171
151 153 155 157 158 159 161 162 163 165 167 171
151 153 155 157 158 159 161 162 163 165 167 171
151 153 155 157 158 159 161 162 163 165 167 173
151 153 155 157 158 159 161 162 163 165 168 173
151 154 155 157 158 159 161 162 163 165 168 173
152 154 155 157 158 159 161 162 163 165 168 174
152 154 156 157 158 160 161 162 163 165 168 176
152 154 156 157 158 160 161 163 163 165 168 177
152 154 156 157 158 160 161 163 164 165 168 178
152 154 156 157 158 160 161 163 164 165 169 178
152 154 156

Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 20
Exerccios
Os dados abaixo so de um estudo de prevalncia de doena cardaca e investigao de
fatores de risco associados. Calcular os valores relativos (percentuais).
Distribuio de pacientes segundo ronco noturno e doena cardaca
Ronco noturno Doena cardaca
Sim No Total
N % N % N %
No 24 1355 1379
Ocasional 35 603 638
Quase todas as noites 21 192 213
Sempre 30 224 254
Total 110 2374 2484
Fonte: Hand DJ et al., 1994.
Questo 5
HEP5800 DPBergamaschi 21
Exerccios
Questo 6
Com base nos dados da tabela abaixo,
a) Calcular o percentual de mes com dieta boa, razovel e pobre entre os casos
de spina bfida e entre os controles (fixando o 100% no total de casos e de
controles);
b) Analise e discuta os resultados.

Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da
me.
Dieta materna Casos Controles Total
n % n % n %
Boa 34 43 77
Razovel 110 48 158
Pobre 100 32 132
Total 244 123 367
Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 22
Exerccios
Questo 7
A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo (1976-1998) de
MONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40).
Comente os resultados apresentados.
HEP5800 DPBergamaschi 23
Apresentao grfica
Diagrama de barras
Setores circulares
Diagrama linear
Histograma
Polgono de freqncias simples
Polgono de freqncias acumuladas
Representao de duas variveis
Escalas aritmtica e logartmica
Exerccios
HEP5800 DPBergamaschi 24
Diagrama de barras representa variveis qualitativas e quantitativa
discreta
Apresentao grfica
Distribuio de pacientes segundo estado nutricional.
IBRANUTRI, maio a novembro, 1996
Estado nutricional n %
Nutrido 2061 51,5
Desnutrido 1905 47,6
Sem diagnstico 34 0,9
Total 4000 100
Fonte: adaptado de Soares JF et al., 2002.







Fonte: adaptado de Soares JF et al.,
2002.
Distribuio de pacientes
segundo estado nutricional.
IBRANUTRI, maio a
novembro, 1996

0
500
1000
1500
2000
2500
Nutrido Desnutrido Sem
diagnstico
Estado nutricional
N

m
e
r
o

HEP5800 DPBergamaschi 25
Caractersticas:
Barras separadas e bases de mesmo tamanho.
Apropriados para representar as variveis qualitativa
nominal, ordinal e quantitativa discreta.
Apresentao grfica
Diagrama de barras
HEP5800 DPBergamaschi 26
Apresentao grfica
Excluindo-se os registros com informao ignorada








0
500
1000
1500
2000
2500
Nutrido Desnutrido
Estado nutricional
N

m
e
r
o
Fonte: adaptado de Soares JF et al., 2002.
Distribuio de pacientes segundo estado nutricional.
IBRANUTRI, maio a novembro, 1996
Diagrama de barras
HEP5800 DPBergamaschi 27
Apresentao grfica
Diagrama de barras
A representao grfica abaixo est correta?







1800
1850
1900
1950
2000
2050
2100
Nutrido Desnutrido
Estado nutricional
N

m
e
r
o
3966 Total
1905 Desnutrido
2061 Nutrido
n Estado nutricional
HEP5800 DPBergamaschi 28
Apresentao grfica
Diagrama de barras
Distribuio de famlias segundo nmero de bens* que possuem.
Nmero de bens n %
0 146 40,6
1 97 26,9
2 87 24,2
3 26 7,2
4 4 1,1
Total 360 100
* automvel, telefone, TV a cabo e computador


0
10
20
30
40
50
0 1 2 3 4
Nmero de bens
%
HEP5800 DPBergamaschi 29
Apresentao grfica
Distribuio de pacientes segundo estado nutricional.
IBRANUTRI, maio a novembro, 1996.
Estado nutricional
a
n %
Nutrido 2061 52,0
Desnutrido moderado 1407 35,4
Desnutrido grave 498 12,6
Total 3966 100
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico
Fonte: adaptado de Soares JF et al., 2002.





a
excluindo-se 34 (0,9%) de pacientes
sem diagnstico
Fonte: adaptado de Soares JF et al., 2002.
Distribuio de pacientes
(a)

segundo estado nutricional.
IBRANUTRI, maio a novembro,
1996.
52,0%
35,4%
12,6%
Nutrido Desnutrido moderado Desnutrido grave
Diagrama de setores circulares -
Adequado para representar
variveis: qualitativa nominal,
ordinal e quantitativa discreta
HEP5800 DPBergamaschi 30
Diagrama linear - representa variveis qualitativas ordinais relativas
a tempo. Constitui uma exceo das variveis qualitativas ordinais
Apresentao grfica
Coeficientes de mortalidade por cncer de esfago (por 100.000 hab.) segundo
sexo.
Municpio de So Paulo, 1968-1998.









Fonte: Incidncia de cncer no Municpio de So Paulo, 1997-1998. Registro de Cncer de So Paulo.
FSP/USP.

Masculino
0
2
4
6
8
10
12
14
1970 1980 1990 2000
Ano
C
o
e
f
i
c
i
e
n
t
e

(
1
0
0
.
0
0
0
h
a
b
)

Feminino
0
0,5
1
1,5
2
2,5
3
1970 1980 1990 2000
Ano
C
o
e
f
i
c
i
e
n
t
e

(
1
0
0
.
0
0
0

h
a
b
)

HEP5800 DPBergamaschi 31
Apresentao grfica
Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.
Ano ndia Estados Unidos
1966 20 58
1970 23 56
1980 29 60
1990 50 70
2000 80 75
Fonte: State of the World, 2001. W W Norton&Company,
N.Y.

Diagrama linear


Fonte: State of the World, 2001. W W Norton&Company, N.Y.
Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.


0
20
40
60
80
100
1970 1980 1990 2000
Ano
m
i
l
h

e
s

d
e

t
o
n
e
l
a
d
a
s

ndia
EUA
HEP5800 DPBergamaschi 32
Histograma
Adequado para representar uma varivel
quantitativa contnua
Intervalos de classe com mesma amplitude
Intervalos de classe com amplitudes diferentes
Apresentao grfica
HEP5800 DPBergamaschi 33
Apresentao grfica
Distribuio de recm-nascidos acometidos de sndrome de desconforto
respiratrio grave segundo peso ao nascer (g)
Peso(g) N
o
%
1000 |-- 1500 13 26
1500 |-- 2000 15 30
2000 |-- 2500 9 18
2500 |-- 3000 9 18
3000 |-- 3500 3 6
3500 |-- 4000 1 2
Total 50 100
Fonte: van Vliet PKJ et al., 1973.
Histograma- amplitudes iguais











Fonte: van Vliet PKJ et al., 1973.
Distribuio de recm-nascidos acometidos de sndrome de desconforto
idioptico grave segundo peso ao nascer (g).

0
5
10
15
20
25
30
35
1000 1500 2000 2500 3000 3500 4000
Peso ao nascer (g)
%
HEP5800 DPBergamaschi 34
Apresentao grfica
Histograma- amplitudes diferentes
Distribuio de mulheres idosas segundo a altura.
Altura (cm) N
o
%
140|--150 12 3,4
150|--155 52 14,8
155|--160 109 31,1
160|--170 156 44,4
170|--180 22 6,3
Total 351 100
Fonte: Hand DJ et al., 1994.

necessrio fazer o ajuste
Altura (cm) N
o
Amplitude N
o
/amplitude
140|--150 12 10 1,2
150|--155 52 5 10,4
155|--160 109 5 21,8
160|--170 156 10 15,6
170|--180 22 10 2,2
Total 351

HEP5800 DPBergamaschi 35
Apresentao grfica
Histograma- amplitudes diferentes
Altura (cm) N
o
Amplitude N
o
/amplitude
140|--150 12 10 1,2
150|--155 52 5 10,4
155|--160 109 5 21,8
160|--170 156 10 15,6
170|--180 22 10 2,2
Total 351
Fonte: Hand DJ et al., 1994.
Distribuio de mulheres idosas segundo a altura.

0
5
10
15
20
25
140 145 150 155 160 165 170 175 180
altura (cm)
Mulheres/cm
Distribuio de mulheres idosas segundo a altura.
Altura (cm) N
o
%
140|--150 12 3,4
150|--155 52 14,8
155|--160 109 31,1
160|--170 156 44,4
170|--180 22 6,3
Total 351 100
Fonte: Hand DJ et al., 1994.

0
10
20
30
40
50
140 145 150 155 160 165 170 175 180
Altura (cm)
%
HEP5800 DPBergamaschi 36
Apresentao grfica
Polgono de freqncia simples
Adequado para representar uma varivel
quantitativa contnua
Intervalos de classe com mesma amplitude
Intervalos de classe com amplitudes diferentes
HEP5800 DPBergamaschi 37
Polgono de freqncia simples amplitudes
iguais
Apresentao grfica
Distribuio de recm-nascidos acometidos de sndrome de desconforto
respiratrio grave segundo peso ao nascer (g).
Peso(g) N
o
%
1000 |-- 1500 13 26
1500 |-- 2000 15 30
2000 |-- 2500 9 18
2500 |-- 3000 9 18
3000 |-- 3500 3 6
3500 |-- 4000 1 2
Total 50 100
Fonte: Hand DJ et al., 1994.

0
2
4
6
8
10
12
14
16
0 500 1000 1500 2000 2500 3000 3500 4000 4500
peso (g)
Nmero

Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo peso ao nascer (g).
HEP5800 DPBergamaschi 38
Apresentao grfica
Polgono de freqncia simples amplitudes diferentes
Distribuio de mulheres idosas segundo a altura.
Altura (cm) n
o
%
140|--150 12 3,4
150|--155 52 14,8
155|--160 109 31,1
160|--170 156 44,4
170|--180 22 6,3
Total 351 100
Fonte: Hand DJ et al., 1994.

Fazendo-se o ajuste:
Altura (cm) N
o
Amplitude N
o
/amplitude
140|--150 12 10 1,2
150|--155 52 5 10,4
155|--160 109 5 21,8
160|--170 156 10 15,6
170|--180 22 10 2,2
Total 351




Fonte: Hand DJ et al., 1994.
Distribuio de mulheres idosas
segundo a altura (cm).
0
5
10
15
20
25
130 135 140 145 150 155 160 165 170 175 180 185 190
Altura (cm)
n

m
e
r
o

d
e

p
e
s
s
o
a
s
/
c
m
HEP5800 DPBergamaschi 39
Polgono (ogiva) de freqncias acumuladas
Apresentao grfica
Distribuio de mulheres idosas segundo a altura.
Altura (cm) N
o
% %
acumulado
140|-145 1 0,29 0,29
145|-150 11 3,13 3,42
150|-155 52 14,81 18,23
155|-160 109 31,05 49,28
160|-165 106 30,20 79,48
165|-170 50 14,25 93,73
170|-175 18 5,13 98,86
175|-180 4 1,14 100
Total 351 100
Fonte: Hand DJ et al., 1994.
0
20
40
60
80
100
140 145 150 155 160 165 170 175 180
altura (cm)
% acumulado
Fonte: Hand DJ et al., 1994.
Distribuio acumulada de mulheres idosas segundo a altura
Percentil Valor da
varivel
Medidas estatsticas
25% 156 cm Q1 primeiro quartil
50% 160 cm Q2 - segundo quartil ou mediana
75% 164 cm Q3 terceiro quartil

HEP5800 DPBergamaschi 40
Apresentao grfica
Polgono (ogiva) de freqncias acumuladas





















Fonte: Koga CR, 2004. Avaliao nutricional de escolares de 7 a 10 anos.
Dissertao de Mestrado. FSP/USP


Grfico 2- Distribuio acumulada de escolares de 7 a 10 anos, segundo estatura
(cm) e idade. Duas escolas pblicas de So Paulo, 2004.

0
10
20
30
40
50
60
70
80
90
100

110 120 130 140 150 160
estatura (cm)
f
r
e
q

n
c
i
a

a
c
u
m
u
l
a
d
a

(
%
)

7 anos 8 anos 9 anos 10 anos
HEP5800 DPBergamaschi 41
Representao grfica de duas variveis
Medida do trceps
Idade da menarca Pequeno Intermedirio Grande
< 12 anos 15 29 36
12 anos e mais 156 197 150
Fonte: Hand DJ et al., 1994.

Calculando-se as porcentagens tem-se:
Medida do trceps
Idade
(anos)
Pequeno Intermedirio Grande Total
n % n % n % n %
<12 15 18,8 29 36,2 36 45,0 80 100
12 e + 156 31,0 197 39,2 150 29,8 503 100
Total 171 29,3 226 38,8 186 31,9 583 100













Distribuio de mulheres segundo idade da menarca e medida do trceps.


0
5
10
15
20
25
30
35
40
45
50
<12 12 e +
Idade da menarca
%
Pequeno
Intermedirio
Grande
HEP5800 DPBergamaschi 42
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo peso ao nascer (g) e condio do recm-nascido
Sobrevivente No sobrevivente Total
Peso(g) n
o
% n
o
% n
o
%
1000 |-- 1500 2 9 11 41 13 26
1500 |-- 2000 6 26 9 33 15 30
2000 |-- 2500 5 22 4 15 9 18
2500 |-- 3000 6 26 3 11 9 18
3000 |-- 3500 3 13 0 - 3 6
3500 |-- 4000 1 4 0 - 1 2
Total 23 100 27 100 50 100
Fonte: Hand DJ et al., 1994.














Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave
segundo peso ao nascer (g) e condio do recm-nascido.

0
5
10
15
20
25
30
35
40
45
Sobrevivente No sobrevivente
Condio do recm nascido
%
1000 1500 2000 2500 3000 3500 4000 1000 1500 2000 2500 3000
HEP5800 DPBergamaschi 43
Polgono de freqncias
















Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto
idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

0
5
10
15
20
25
30
35
40
45
500 1000 1500 2000 2500 3000 3500 4000 4500
peso ao nascer (g)
%
Sobrevivente
No sobrevivente
HEP5800 DPBergamaschi 44
Distribuio de recm-nascidos acometidos de sndrome de desconforto
idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
Sobrevivente No sobrevivente Total
Peso(g) N
o
% N
o
% N
o
%
1000 |-- 1500 2 15 11 85 13 100
1500 |-- 2000 6 40 9 60 15 100
2000 |-- 2500 5 56 4 44 9 100
2500 |-- 3000 6 67 3 33 9 100
3000 |-- 3500 3 100 0 - 3 100
3500 |-- 4000 1 100 0 - 1 100
Total 23 46 27 54 50 100
Fonte: Hand DJ et al., 1994.















Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto
idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

0
20
40
60
80
100
120
1000 |--1500 1500 |--2000 2000 |--2500 2500 |--3000 3000 |--3500 3500 |--4000
peso (g)
%
Sobrevivente
No sobrevivente
HEP5800 DPBergamaschi 45
Distribuio de recm-nascidos acometidos de sndrome de desconforto
idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
Sobrevivente No sobrevivente Total
Peso(g) N
o
% N
o
% N
o
%
1000 |-- 1500 2 15 11 85 13 100
1500 |-- 2000 6 40 9 60 15 100
2000 |-- 2500 5 56 4 44 9 100
2500 |-- 3000 6 67 3 33 9 100
3000 |-- 3500 3 100 0 - 3 100
3500 |-- 4000 1 100 0 - 1 100
Total 23 46 27 54 50 100
Fonte: Hand DJ et al., 1994.

Outro grfico possvel:










Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de
sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.

0
20
40
60
80
100
1000 1500 2000 2500 3000 3500 4000
peso (g)
%
no sobreviviente
sobrevivente
HEP5800 DPBergamaschi 46
Apresentao grfica escalas aritmtica e logartmica
Nmero de crianas segundo massa corporal. Escola
X, 2000 e 2002.
Ano Sobrepeso Obesas
2000 300 100
2002 150 50
Fonte: dados hipotticos

Grfico em escala aritmtica











Fonte: dados hipotticos
Nmero de crianas segundo massa corporal.
Escola X, 2000 e 2002.

0
100
200
300
400
2000 2002
Ano
N

m
e
r
o

Sobrepeso
Obesa
HEP5800 DPBergamaschi 47
Apresentao grfica escalas aritmtica e logartmica

















Fonte: dados hipotticos
Nmero de crianas segundo massa corporal. Escola
X, 2000 e 2002.

1
10
100
1000
2000 2002
Ano
N

m
e
r
o

Sobrepeso
Obesa
HEP5800 DPBergamaschi 48
Apresentao grfica escalas aritmtica e logartmica
Coeficiente de mortalidade pela doena X e Y (100.000hab).
Determinada localidade, 1990- 1995.
Ano Doena X Doena Y
1990 123,5 28,7
1991 121,4 22,4
1992 111,9 17,7
1993 85,9 13,9
1994 77,1 14,8
1995 62,2 10,5
Fonte: Dados hipotticos


Fonte: Dados hipotticos
Coeficiente de mortalidade
pela doena X e Y
(100.000hab). Determinada
localidade, 1990- 1995.

0
50
100
150
1990 1991 1992 1993 1994 1995
Ano
C
o
e
f
i
c
i
e
n
t
e

Doena X
Doena Y
HEP5800 DPBergamaschi 49
Apresentao grfica escalas aritmtica e logartmica
Grfico em escala logartmica















Fonte: dados hipotticos
Coeficiente de mortalidade pela doena X e Y (100.000hab).
Determinada localidade, 1990- 1995.

1
10
100
1000
1990 1991 1992 1993 1994 1995
Ano
C
o
e
f
i
c
i
e
n
t
e

Doena X
Doena Y

0
50
100
150
1990 1991 1992 1993 1994 1995
Ano
C
o
e
f
i
c
i
e
n
t
e

Doena X
Doena Y
HEP5800 DPBergamaschi 50
Apresentao grfica escalas aritmtica e logartmica
Grfico em escala logartmica















Fonte: dados hipotticos
Coeficiente de mortalidade pela doena X e Y (100.000hab).
Determinada localidade, 1990- 1995.

1
10
100
1000
1990 1991 1992 1993 1994 1995
Ano
C
o
e
f
i
c
i
e
n
t
e

Doena X
Doena Y
HEP5800 DPBergamaschi 51
Questo 9
Apresente os dados da tabela em um grfico apropriado.
Distribuio de crianas segundo nvel de retinol srico. Cansao, Bahia, 1992.
Retinol srico (g/dl) N
o
%
Aceitvel (20-49) 89 55,3
Baixo (10-19,9) 65 40,4
Deficiente (<10 ) 7 4,3
Total 161 100
Fonte: Prado MS et al, 1995.
Apresentao grfica
Exerccios
HEP5800 DPBergamaschi 52
Apresentao grfica
Questo 10
Apresente os dados da tabela em:
a) um histograma.
b) um polgono de freqncias.
Distribuio de homens adultos segundo comprimento do
antebrao
Comprimento (polegadas) N
o
%
16,0 |-- 16,5 4 2,9
16,5 |-- 17,0 3 2,1
17,0 |-- 17,5 12 8,6
17,5 |-- 18,0 11 7,9
18,0 |-- 18,5 21 15,0
18,5 |-- 19,0 25 17,9
19,0 |-- 19,5 23 16,4
19,5 |-- 20,0 19 13,6
20,0 |-- 20,5 10 7,1
20,5 |-- 21,0 10 7,1
21,0 |-- 21,5 2 1,4
Total 140 100
Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 53
Apresentao grfica
Questo 11
Apresente os dados da tabela em um grfico apropriado.
Distribuio de homens segundo presena de doena coronariana (CHD) e
consumo de caf
Condio Alto consumo de caf
(>=100xcaras/ms)
Moderado consumo de caf
(<100 xcaras/ms)
Total
n % n % n %
Com CHD 38 4,8 39 4,2 77 4,5
Sem CHD 752 95,2 889 95,8 1641 95,5
Total 790 100 928 100 1718 100

HEP5800 DPBergamaschi 54
Questo 12
Interprete os grficos dos itens a seguir
a) Artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes
critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica,
2000;34(5):506-13).
Apresentao grfica
HEP5800 DPBergamaschi 55
Apresentao grfica
b) Artigo: Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997 de OTERO
UB et al. (Rev. Sade Pblica, 2002; 36(2):141-48).
HEP5800 DPBergamaschi 56
d) Artigo: Tendncia secular da anemia na cidade de So Paulo (1984-1996) de
MONTEIRO CA et al. (Rev. Sade Pblica, 2000; 34(6, sup):62-72).
HEP5800 DPBergamaschi 57
Medidas de tendncia central e de disperso
Mdia aritmtica
Mediana
Moda
Valores mnimo e mximo
Amplitude de variao
Varincia
Desvio padro
Coeficiente de variao de Pearson
Quartis
Percentis
Box plot
Exerccios
HEP5800 DPBergamaschi 58
Medidas de tendncia central e de disperso
Mdia aritmtica
Valores individuais
Valores em distribuio de freqncia
Valores em intervalos de classe
HEP5800 DPBergamaschi 59
Medidas de tendncia central e de disperso
Notao:
X varivel
N tamanho da populao
n tamanho da amostra

mdia populacional (parmetro, geralmente desconhecido)


X Estatstica (frmula)

x
mdia amostral (estimativa, valor calculado na amostra)
HEP5800 DPBergamaschi 60
Mdia aritmtica
Medidas de tendncia central e de disperso
Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12
Mdia = anos 8
5
12 12 8 5 3
=
= + + +

Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores.
Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de
freqncias de uma varivel quantitativa
Desvios em torno da mdia:
3 8 =-5 anos
5 8 =-3 anos
8 8 = 0 anos
2 8 = 4 anos
12 8 = 4 anos
soma = 0 anos
HEP5800 DPBergamaschi 61
Medidas de tendncia central e de disperso
s existe para variveis quantitativas e seu valor nico;
da mesma natureza da varivel considerada (mdia = 8 anos); e
sofre influncia dos valores aberrantes (3, 5, 8, 12, 42; mdia = 14 anos)
X: idade (anos) 3, 5, 8, 12, 12
x
1
= 3; x
2
= 5; x
3
=8; x
4
=12; x
5
= 12
x
x x x
n
x
n
n
i
i
n
=
+ + +
=
=

1 2 1
...
Valores individuais
Mdia aritmtica
HEP5800 DPBergamaschi 62
Medidas de tendncia central e de disperso
Os dados a seguir so provenientes do grupo Western Collaborative Group Study,
Califrnia (1960-61). Foram estudados 3154 homens de meia idade para investigar a
relao entre padres de comportamento e risco de doena coronariana.
Os dados apresentados so de 40 homens para os quais foram medidos os nveis
de colesterol (mg por 100ml) e realizada uma categorizao segundo
comportamento.
O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio.
O de tipo B relaxado, no competitivo e menos preocupado.

Tipo A: nvel de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

ml mg x
A
100 / 05 , 245
20
325 212 ... 291 233
=
+ + + +
=
Mdia aritmtica
HEP5800 DPBergamaschi 63
Medidas de tendncia central e de disperso
Mdia aritmtica
Tipo B: nvel de colesterol
344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

ml mg x
B
100 / 3 , 210
20
213 169 ... 226 344
=
+ + + +
=
HEP5800 DPBergamaschi 64
Medidas de tendncia central e de disperso
Mdia aritmtica
Valores em distribuio de freqncias
grupo A
Colesterol (X) f
i
x
i
f
i

181 1 181
197 1 197
202 1 202
212 1 212
218 1 218
224 1 224
233 1 233
234 1 234
239 2 478
246 1 246
248 1 248
250 1 250
252 1 252
254 1 254
268 1 268
276 1 276
291 1 291
312 1 312
325 1 325
soma 20 4901

05 , 245
20
4901
= = x
n
f x
x
k
i
i i

=
=
1
mg/100ml
i representa o i-simo valor da varivel
HEP5800 DPBergamaschi 65
Medidas de tendncia central e de disperso
Mdia aritmtica - valores em intervalos de classe
n
f x
X
k
i
i ipm

=
=
1
i representa o i-simo intervalo
ipm
x
representa o ponto mdio do intervalo,
fi a freqncia de indivduos no intervalo i,
k o nmero de intervalos e
n o nmero de observaes
concentrao f
i
ponto mdio (x
ipm
) x
ipm
f
i

180,0|--200,0 2 190 380
200,0|--220,0 3 210 630
220,0|--240,0 5 230 1150
240,0|--260,0 5 250 1250
260,0|--280,0 2 270 540
280,0|--300,0 1 290 290
300,0|--320,0 1 310 310
320,0|--340,0 1 330 330
total 20 4880
ml mg x 100 / 0 , 244
20
4880
= =
HEP5800 DPBergamaschi 66
Medidas de tendncia central e de disperso
Mediana (Med)
o valor que ocupa a posio central de uma srie de n observaes, quando
estas esto ordenadas de forma crescente ou decrescente.
a) valores individuais
Quando nmero de observaes (n) for mpar:
a mediana o valor da varivel que ocupa o posto
n + 1
2


Quando o nmero de observaes (n) for par:
a mediana a mdia aritmtica dos valores da varivel que ocupam os
postos
n
2
e
n + 2
2

HEP5800 DPBergamaschi 67
Medidas de tendncia central e de disperso
Mediana (Med)
Exemplo:
Tipo A: nvel de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Ordenando-se os valores:
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325
Mediana = ml mg 100 / 5 , 242
2
246 239
=
+
HEP5800 DPBergamaschi 68
Medidas de tendncia central e de disperso
Mediana (Med)
valores em distribuio de freqncia pontual
Colesterol (X) f
i
f
acumulada

181 1 1
197 1 2
202 1 3
212 1 4
218 1 5
224 1 6
233 1 7
234 1 8
239 2 10
246 1 11
248 1
250 1
252 1
254 1
268 1
276 1
291 1
312 1
325 1
Total 20
Mediana =
ml mg 100 / 5 , 242
2
246 239
=
+
HEP5800 DPBergamaschi 69
Medidas de tendncia central e de disperso
Mediana (Med)
Valores em intervalos de classe
Nvel de Colesterol (mg/100ml) (x
i
) fi f
acumulada

180|--200 2 2
200|--250 10 12
250|--300 6
300|--350 2
Total 20
Como so 20 observaes, a mediana estar na posio 10 (20/2)
Mediana est na classe de 200|-- 250 mg/100ml
10 observaes -------50 mg/100ml
8 observaes ------- x
40
10
50 8
= =
x
x
Mediana = valor inicial do intervalo + 40 = 240 mg/100ml
HEP5800 DPBergamaschi 70
Medidas de tendncia central e de disperso
Mediana (Med) Valores em intervalos de classe
ana classemedi
or acumanteri
i
f
f
n
a L Med

+ =
2
Li o limite inferior da classe que contm a mediana
a a amplitude da classe que contm a mediana
or acumanteri
f
a freqncia acumulada at a classe anterior classe que contm a mediana
ana classemedi
f
a freqncia da classe que contm a mediana
ml mg Med 100 / 240 40 200
10
2
2
20
50 200 = + =

+ =
HEP5800 DPBergamaschi 71
Medidas de tendncia central e de disperso
OBS:
existe para varivel quantitativa e qualitativa ordinal;

da mesma natureza da varivel considerada;

torna-se inadequada quando h muitos valores repetidos;

no sofre influncia de valores aberrantes;
EX: 4,3 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8
Mdia aritmtica: 8,43 pmol/l; Mediana: 7,2 pmol/l
4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 37,8
Mdia aritmtica: 10,25 pmol/l; Mediana: 7,2 pmol/l

pode ser calculada mesmo quando os dados esto agrupados em intervalos
de classe e os extremos de algum intervalo no esteja definido (a no ser
que a mediana caia neste intervalo).
Mediana (Med)
HEP5800 DPBergamaschi 72
Medidas de tendncia central e de disperso
Moda (Mo)
o valor da varivel que apresenta freqncia mxima.
Classe modal: intervalo de classe onde se encontra a moda.
OBS:
pode ser calculada para varivel quantitativa e qualitativa;

nem sempre existe ou nica;

da mesma natureza da varivel considerada;

no caso da varivel quantitativa estar apresentada em intervalos de classes
muito afetada pela maneira como as classes foram construdas.
HEP5800 DPBergamaschi 73
Distribuio de mulheres idosas segundo a altura.
Altura (cm) N
o
% %
acumulado
140|-145 1 0,29 0,29
145|-150 11 3,13 3,42
150|-155 52 14,81 18,23
155|-160 109 31,05 49,28
160|-165 106 30,20 79,48
165|-170 50 14,25 93,73
170|-175 18 5,13 98,86
175|-180 4 1,14 100
Total 351 100
Fonte: Hand DJ et al., 1994.
Moda (Mo)
Medidas de tendncia central e de disperso
HEP5800 DPBergamaschi 74
Medidas de disperso

Valores mnimo e mximo: valores extremos da distribuio

Amplitude de variao: a diferena entre os 2 valores extremos da
distribuio

Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17 amplitude de variao = 17-2 = 15

Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17 amplitude de variao = 15
Medidas de tendncia central e de disperso
HEP5800 DPBergamaschi 75
Medidas de tendncia central e de disperso
Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

Mdia = anos 8
5
12 12 8 5 3
=
= + + +



Desvios em torno da mdia:
3 8 =-5 anos
5 8 =-3 anos
8 8 = 0 anos
12 8 = 4 anos
12 8 = 4 anos
soma = 0 anos
Desvios quadrticos em torno da mdia:
(3 8)
2
=(-5 anos)
2
= 25 anos
2

(5 8)
2
=(-3 anos)
2
= 9 anos
2

(8 8)
2
= (0 anos)
2
= 0 anos
2

(12 8)
2
= (4 anos)
2
= 16 anos
2

(12 8)
2
= (4 anos)
2
= 16anos
2

soma dos desvios quadrticos em torno da mdia = 66 anos
2


Varincia e desvio padro
HEP5800 DPBergamaschi 76
Varincia e desvio padro
Medidas de tendncia central e de disperso
Varincia = soma dos desvios quadrticos em torno da mdia/nmero de
observaes

Varincia =
2
2 , 13
5
66
anos =

Desvio padro: a raiz quadrada da varincia , ou seja
=
=
2
2
S S


Desvio padro = anos anos 63 , 3 2 , 13
2
=
HEP5800 DPBergamaschi 77
Medidas de tendncia central e de disperso
Valores individuais:
Varincia populacional:
N
X X
N
i
i
=

=
1
2
2
) (


Varincia amostral:
1
) (
1
2
2

=
n
x x
S
n
i
i

HEP5800 DPBergamaschi 78
Medidas de tendncia central e de disperso
Exemplo:
Tipo A: nvel de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Varincia:
2
2 2
2
) 100 / ( 37 , 1342
19
) 05 , 245 325 ( ... ) 05 , 245 233 (
ml mg s =
+ +
=

Desvio padro ml mg s 100 / 64 , 36 37 , 1342 = =
Tipo B: nvel de colesterol
344 185 263 246 224 212 188 250 148
226 175 242 252 153 183 137 202 194
Varincia:
2
2 2
2
) 100 / ( 747 , 2336
19
) 3 , 210 213 ( ... ) 3 , 210 344 (
ml mg s =
+ +
=
Desvio padro ml mg s 100 / 34 , 48 747 , 2336 = =
HEP5800 DPBergamaschi 79
Medidas de tendncia central e de disperso
Valores em distribuio de freqncias
Varincia amostral:
1
) (
1
2
2

=
n
f x x
S
n
i
i i

Tipo A:
Nvel de Colesterol
(mg/100ml)
(x
i
)
f
i
x
i
f
i
2
) ( x x
i

i i
f x x
2
) (
181 1 181 4102,40 4102,40
197 1 197 2308,80 2308,80
202 1 202 1853,30 1853,30
212 1 212 1092,30 1092,30
218 1 218 731,70 731,70
224 1 224 443,10 443,10
233 1 233 145,20 145,20
234 1 234 122,10 122,10
239 2 478 36,60 73,21
246 1 246 0,90 0,90
248 1 248 8,70 8,70
250 1 250 24,50 24,50
252 1 252 48,30 48,30
254 1 254 80,10 80,10
268 1 268 526,70 526,70
276 1 276 957,90 957,90
291 1 291 2111,40 2111,40
312 1 312 4482,30 4482,30
325 1 325 6392,00 6392,00
Total 20 4901 25504,95

2 2
) 100 / ( 37 , 1342
19
95 , 25504
ml mg s
A
= = ; ml mg s
A
100 / 64 , 36 37 , 1342 = =
HEP5800 DPBergamaschi 80
Medidas de tendncia central e de disperso
Tipo B:
Nvel de Colesterol (mg/100ml) (x
i
) f
i
x
i
f
i
2
) ( x x
i

i i
xf x x
2
) (
137 1 137 5372,89 5372,89
148 1 148 3881,29 3881,29
153 1 153 3283,29 3283,29
169 1 169 1705,69 1705,69
175 1 175 1246,09 1246,09
183 1 183 745,29 745,29
185 1 185 640,09 640,09
188 1 188 497,29 497,29
194 1 194 265,69 265,69
202 1 202 68,89 68,89
212 1 212 2,89 2,89
213 1 213 7,29 7,29
224 1 224 187,69 187,69
226 1 226 246,49 246,49
242 1 242 1004,89 1004,89
246 1 246 1274,49 1274,49
250 1 250 1576,09 1576,09
252 1 252 1738,89 1738,89
263 1 263 2777,29 2777,29
344 1 344 17875,69 17875,69
Total 20 4206 44398,2
2 2
) 100 / ( 747 , 2336
19
2 , 44398
ml mg s
B
= = ; ml mg s
B
100 / 34 , 48 747 , 2336 = =
HEP5800 DPBergamaschi 81
Medidas de tendncia central e de disperso
Valores em intervalos de classe
Varincia amostral:
1
) (
1
2
2

=
n
f x x
S
n
i
i ipm


Nvel de Colesterol
(mg/100ml) (x
i
)
fi x
i
ponto
mdio (x
ipm
)
x
ipm
f
i

2
) ( x x
ipm

i ipm
f x x
2
) (
180|--200 2 190 380 3192,25 6384,5
200|--250 10 225 2250 462,25 4622,5
250|--300 6 275 1650 812,25 4873,5
300|--350 2 325 650 6162,25 12324,5
Total 20 4930 28205,0

ml mg
x x
x
A
100 / 5 , 246
20
4930
20
2 325 ... 0 155
= =
+ +
=
2 2
) 100 / ( 47 , 1484
19
0 , 28205
ml mg s
A
= = ; ml mg s
A
100 / 53 , 38 47 , 1484 = =
HEP5800 DPBergamaschi 82
Medidas de tendncia central e de disperso
Tipo B
Nvel de
Colesterol
(mg/100ml) (x
i
)
fi x
i
ponto
mdio (x
ipm
)
x
ipm
f
i

2
) ( x x
ipm

i ipm
f x x
2
) (
130|--180 5 155 775 3364 16820
180|--200 4 190 760 529 2116
200|--250 7 225 1575 144 1008
250|--300 3 275 825 3844 11532
300|--350 1 325 325 12544 12544
Total 20 4260 44020

ml mg
x x
x
B
100 / 0 , 213
20
4260
20
1 325 ... 5 155
= =
+ +
=

2 2
) 100 / ( 84 , 2316
19
44020
ml mg s
A
= = ; ml mg s
A
100 / 13 , 48 84 , 2316 = =
HEP5800 DPBergamaschi 83
Medidas de tendncia central e de disperso
Coeficiente de Variao de Pearson (CV):
o quociente entre o desvio padro e a mdia, ou seja 100
x
S
= CV x

CV
tipo A
: % 0 , 15 100
05 , 245
64 , 36
= x ; CV
tipoB
: % 0 , 23 100
3 , 210
34 , 48
= x ;
Questo 13
So fornecidos valores de nvel de triglicrides (mg/dL) de 9 pessoas
166 158 202 166 135 86 150 86 121
Calcule, apresentando o desenvolvimento da frmula:


a) o nvel mdio de triglicrides;
b) o nvel mediano de triglicrides;
c) o desvio padro do nvel de triglicrides e
d) o coeficiente de variao do nvel de triglicrides.

HEP5800 DPBergamaschi 84
Medidas de tendncia central e de disperso
Questo 14
A tabela abaixo foi extrada do artigo: Diagnstico de sobrepeso em
adolescentes: estudo do desempenho de diferentes critrios para o ndice de
Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;.34(5):506-
13).
Discuta os resultados obtidos ignorando a coluna do valor de p (este tpico ser abordado na
disciplina Bioestatstica II).

HEP5800 DPBergamaschi 85
Medidas de tendncia central e de disperso
Quartil
Valores da varivel que dividem a distribuio em quatro partes iguais.

25% 25% 25% 25%

Q1: deixa abaixo 25% das observaes
25% 75%

Q2: deixa abaixo 50% das observaes
50% 50%

Q3: deixa abaixo 75% das
observaes
75% 25%
Primeiro quartil:
)) 1 (
4
1
(
1
+
=
n
x Q
; Terceiro quartil:
)) 1 (
4
3
(
3
+
=
n
x Q

onde x o valor da varivel e )) 1 (
4
1
( + n e )) 1 (
4
3
( + n so ndices que
representam as posies ocupadas por x.
HEP5800 DPBergamaschi 86
Medidas de tendncia central e de disperso
1.030* 1.310* 2.200* 1.680 2.550
1.050* 1.500* 2.270* 1.715 2.570
1.100* 1.550* 2.275* 1.720 2.600
1.175* 1.600* 2.440* 1.760 2.700
1.185* 1.720* 2.500* 1.930 2.830
1.225* 1.750* 2.560* 2.015 2.950
1.230* 1.770* 2.730* 2.040 3.005
1.262* 1.820* 1.130 2.090 3.160
1.295* 1.890* 1.410 2.200 3.400
1.300* 1.940* 1.575 2.400 3.640

Entre os recm-nascidos que sobreviveram:
g x x Q 1720 1
6
)) 1 23 (
4
1
(
= = =
+

g x x Q 2830 3
18
)) 1 23 (
4
3
(
= = =
+

Observe que g x x Q 2200 2
12
)) 1 23 (
2
1
(
= = =
+

Entre os recm-nascidos que foram a bito
g x x Q 1230 1
7
)) 1 27 (
4
1
(
= = =
+

g x x Q 2200 3
21
)) 1 27 (
4
3
(
= = =
+
e g x x Q 1600 2
14
)) 1 27 (
2
1
(
= = =
+

HEP5800 DPBergamaschi 87
Medidas de tendncia central e de disperso
Supor o exemplo com 22 observaes:
n=22

)
4
3
5 ( )
4
23
( )) 1 22 (
4
1
(
1 x x x Q = = =
+

que do caminho entre x
5
=1715 e x
6
=1720
g Q 8 , 1718 ) 1715 1720 (
4
3
1715 1 = + =
)
4
1
17 ( )) 1 22 (
4
3
(
3 x x Q = =
+

que do caminho entre x
17
=2700 e x
18
=2830

g Q 5 , 2732 ) 2700 2830 (
4
1
2700 3 = + =

HEP5800 DPBergamaschi 88
Medidas de tendncia central e de disperso
Percentil
Valores da varivel que dividem a distribuio em cem partes iguais.

Entre os recm-nascidos que sobreviveram

Percentil 5:

)
5
1
1 ( )
100
120
( )) 1 23 (
100
5
(
5 x x x P = = =
+

g P 1186 ) 1130 1410 (
5
1
1130 5 = + =
que 1/5 do caminho entre x
1
=1130 e x
2
=1410


Percentil 10:
)
5
2
2 ( )
100
240
( )) 1 23 (
100
10
(
10 x x x P = = =
+
; g P 1476 ) 1410 1575 (
5
2
1410 10 = + =
Percentil 50:
) 12 (
)
100
1200
( )) 1 23 (
100
50
(
50 x x x P = = =
+
; g P 2200 50 =
Percentil 75:
) 18 (
)
100
1800
( )) 1 23 (
100
75
(
75 x x x P = = =
+
; g P 2830 75=
Percentil 90:
)
5
3
21 ( )
100
2160
( )) 1 23 (
100
90
(
90 x x x P = = =
+
; g P 3304 ) 3160 3400 (
5
3
3160 90 = + =
HEP5800 DPBergamaschi 89
Medidas de tendncia central e de disperso
Box plot e identificao de valores aberrantes (outliers)

O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas
da base e do topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a
mediana. Linhas verticais que iniciam no meio da base e do topo do retngulo, terminam em
valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60).

O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-
Q1) e o valor adjacente inferior definido como o menor valor que maior ou igual a Q1-
1,5(Q3-Q1), sendo a diferena Q3-Q1 denominada intervalo inter-quartil (IIQ).

Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos
dados. O box plot alm de apresentar a disperso dos dados torna-se til tambm para
identificar a ocorrncia destes valores como sendo os que caem fora dos limites estabelecidos
pelos valores adjacentes superior e inferior.

120
140
160
180
200
220
240
260
280
300
320
340
360
380
colesterol
A B
HEP5800 DPBergamaschi 90
Tipo A: nvel de colesterol
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325

Tipo A:
n=20;
5 , 219 5 , 1 218 ) 218 224 (
4
1
218 1
4
1
5
4
21
) 1 (
4
1
= + = + = = = =
+
x x x Q
n

5 , 264 5 , 10 254 ) 254 268 (
4
3
254 3
4
3
15 ) 21 (
4
3
) 1 (
4
3
= + = + = = = =
+
x x x Q
n


Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45

325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332,
onde 332 dado por: 332 45 5 , 1 5 , 264 = + x .

181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde
152 dado por: 152 45 5 , 1 5 , 219 = x .
Box plot
HEP5800 DPBergamaschi 91
Tipo B
n=20
177 2 175 ) 175 183 (
4
1
175 1
4
1
5
4
21
) 1 (
4
1
= + = + = = = =
+
x x x Q
n

245 3 242 ) 242 246 (
4
3
242 3
4
3
15 ) 21 (
4
3
) 1 (
4
3
= + = + = = = =
+
x x x Q
n


Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68

344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347,
onde 347 dado por: 347 68 5 , 1 245 = + x .

137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75
dado por: 75 68 5 , 1 177 = x .
Box plot
HEP5800 DPBergamaschi 92
Box plot
Tipo A:
n=20;
5 , 219 5 , 1 218 ) 218 224 (
4
1
218 1
4
1
5
4
21
) 1 (
4
1
= + = + = = = =
+
x x x Q
n

5 , 264 5 , 10 254 ) 254 268 (
4
3
254 3
4
3
15 ) 21 (
4
3
) 1 (
4
3
= + = + = = = =
+
x x x Q
n


Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45

325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332,
onde 332 dado por: 332 45 5 , 1 5 , 264 = + x .

181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde
152 dado por: 152 45 5 , 1 5 , 219 = x .

Tipo B
n=20
177 2 175 ) 175 183 (
4
1
175 1
4
1
5
4
21
) 1 (
4
1
= + = + = = = =
+
x x x Q
n

245 3 242 ) 242 246 (
4
3
242 3
4
3
15 ) 21 (
4
3
) 1 (
4
3
= + = + = = = =
+
x x x Q
n


Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68

344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347,
onde 347 dado por: 347 68 5 , 1 245 = + x .

137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75
dado por: 75 68 5 , 1 177 = x .
HEP5800 DPBergamaschi 93
Box plot
Questo 16
Os dados a seguir so de uma pesquisa que investigou as concentraes de
minerais no leite materno, no perodo de 1984 a 1985. Foram coletadas
amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital
Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas em
perodo de lactao: colostro e leite maduro.
clcio (g/mL de leite) grupo colostro
113 181 254 311 334 145 221 256 312 344
163 225 275 313 372 163 231 296 323 375
167 241 303 325 375 437
clcio (g/mL de leite) grupo maduro
159 175 181 188 200 206 213 214 217 231
238 238 242 244 256 259 260 263 264 275
277 279 281 293 302 303 314 344 394
a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo.
b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo.
c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos
em um s grfico.
d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e
igualdade de medianas.
HEP5800 DPBergamaschi 94
Questo 17
O boxplot abaixo foi extrado do artigo: Vigilncia epidemiolgica e avaliao da assistncia
s meningites de ESCOSTEGUY CC et al. (Rev. Sade Pblica, 2004;38(5):657-63). Avalie
os resultados apresentados
HEP5800 DPBergamaschi 95
Noes de correlao
X e Y so variveis aleatrias quantitativas

Y
X

Y
X


X
Y

correlao positiva correlao negativa correlao inexistente
HEP5800 DPBergamaschi 96
Noes de correlao
Coeficiente de correlao de Pearson (

): Mede o grau de associao entre 2


variveis quantitativas X e Y.

Definio:


=
XY
X Y

onde,
XY

a covarincia de X e Y (disperso conjunta de X e Y)


X

o desvio padro de X (disperso de X)


Y

o desvio padro de Y (disperso de Y)


HEP5800 DPBergamaschi 97
estimador (r)
(
(

\
|

|

\
|

|

\
|

|

\
|

=

2
_
i
2
_
i
_
i
_
i
y y x x
y y x x
r

Noes de correlao
+ 1 1

Propriedades
no possui dimenso, isto , no depende da unidade de medida das variveis X e Y
HEP5800 DPBergamaschi 98
Grficos de disperso para diferentes valores do coeficiente de correlao (rho).
Noes de correlao
HEP5800 DPBergamaschi 99
Noes de correlao
Exemplo:
Os dados a seguir so provenientes de um estudo que investiga a composio
corporal e fornece o percentual de gordura corporal (%), idade e sexo para 18
adultos com idades entre 23 e 61 anos.
Idade % gordura sexo Idade % gordura sexo
23 9,5 M 53 34,7 F
23 27,9 F 53 42,0 F
27 7,8 M 54 29,1 F
27 17,8 M 56 32,5 F
39 31,4 F 57 30,3 F
41 25,9 F 58 33,0 F
45 27,4 M 58 33,8 F
49 25,2 F 60 41,1 F
50 31,1 F 61 34,5 F
M=masculino ; F= feminino
Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 100
Noes de correlao
Disperso entre % de gordura e idade

i
d
a
d
e
gordura
5 10 15 20 25 30 35 40 45
20
30
40
50
60
70
m f
m m
f
f
m
f
f
f f
f
f
f
f f
f
f

Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 101
Noes de correlao
Disperso entre % de gordura e idade

i
d
a
d
e
gordura
5 10 15 20 25 30 35 40 45
20
30
40
50
60
70
m f
m m
f
f
m
f
f
f f
f
f
f
f f
f
f

Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 102
Noes de correlao
Disperso entre % de gordura e idade

i
d
a
d
e
gordura
5 10 15 20 25 30 35 40 45
20
30
40
50
60
70
m f
m m
f
f
m
f
f
f f
f
f
f
f f
f
f

Fonte: Hand DJ et al., 1994.
HEP5800 DPBergamaschi 103
Noes de correlao
Clculo do coeficiente de correlao de Pearson
Sexo: masculino
Idade % gordura
) ( y y ) ( x x ) )( ( y y x x
2
) ( y y
2
) ( x x
23 9,5 -7,5 -6,13 45,94 56,25 37,52
27 7,8 -3,5 -7,83 27,39 12,25 61,23
27 17,8 -3,5 2,18 -7,61 12,25 4,73
45 27,4 14,5 11,78 170,74 210,25 138,65
y =30,5
x =15,63
Total 236,45 291,00 242,13
Coeficiente de correlao
(idade,%gordura) masculino
:
89 , 0
13 , 242 291
45 , 236
= =
x
r

HEP5800 DPBergamaschi 104
Noes de correlao
Sexo: feminino
Idade % gordura
) ( y y ) ( x x ) )( ( y y x x
2
) ( y y
2
) ( x x
23 27,9 -27,86 -4,42 123,17 776,02 19,55
39 31,4 -11,86 -0,92 10,93 140,59 0,85
41 25,9 -9,86 -6,42 63,30 97,16 41,23
49 25,2 -1,86 -7,12 13,23 3,45 50,71
50 31,1 -0,86 -1,22 1,05 0,73 1,49
53 34,7 2,14 2,38 5,10 4,59 5,66
53 42 2,14 9,68 20,74 4,59 93,67
54 29,1 3,14 -3,22 -10,12 9,88 10,38
56 32,5 5,14 0,18 0,92 26,45 0,03
57 30,3 6,14 -2,02 -12,42 37,73 4,09
58 33 7,14 0,68 4,85 51,02 0,46
58 33,8 7,14 1,48 10,56 51,02 2,19
60 41,1 9,14 8,78 80,26 83,59 77,06
61 34,5 10,14 2,18 22,10 102,88 4,75
y = 50,86
x 32,32
Total 333,64 1389,71 312,12

Coeficiente de correlao
(idade,%gordura) feminino
:
51 , 0
12 , 312 71 , 1389
64 , 333
= =
x
r

HEP5800 DPBergamaschi 105
Noes de correlao
Abaixo temos o peso (kg) e a altura (cm) de 30 meninas de 11 anos de idade
atendidas na escola Heaton Midldlel em Bradford, Inglaterra.
a) Fazer o diagrama de disperso e investigue como a relao entre as
variveis.
b) Calcular o coeficiente de correlao de Pearson.
Altura
(cm)
Peso (kg) Altura (cm) Peso
(kg)
Altura
(cm)
Peso
(kg)
Altura
(cm)
Peso (kg)
135 26 133 31 136 28 146 35
146 33 149 34 154 36 143 42
153 55 141 32 151 48 148 32
154 50 164 47 155 36 143 36
139 32 146 37 149 32 140 33
131 25 149 46 141 29 141 28
149 44 147 36 137 34
137 31 152 47 135 30
1275 ) )( ( =

y y x x ;

= 80 , 1716 ) (
2
x x ;

= 17 , 1718 ) (
2
y y
HEP5800 DPBergamaschi 106
Noes de correlao
Os grficos abaixo foram extrados do artigo: Excesso de peso e gordura
abdominal para a sndrome metablica em nipo-brasileiros de LERARIO DG et
al. (Rev. Sade Pblica, 2002;36(1):4-11). Interprete as figuras apresentadas
no artigo.


HEP5800 DPBergamaschi 107
Coeficiente de correlao
(idade,%gordura) feminino
:
51 , 0
12 , 312 71 , 1389
64 , 333
= =
x
r


Coeficiente de correlao considerando homens e mulheres : 0,792


Regresso linear simples estimando a reta de regresso

Admitindo-se y como funo linear de x, ajusta-se a melhor reta ao conjunto de dados.
Equao de reta:
bx a y + =

, onde

y

= valor ajustado (valor mdio predito)



x
= valor escolhido de X
x b y a =
; a denominado intercepto; o valor predito para x=0
x
y
xy
s
s
r b =
; b denominado coeficiente angular (slope). Indica quantas unidades de Y
mudam para a mudana de uma unidade de X.
HEP5800 DPBergamaschi 108
Aplicando-se aos dados do exemplo:
a = 28,61 b 46,33 ;
548 , 0
22 , 13
14 , 9
79 , 0 = = x b

Para aumento de 1 ano, o percentual de gordura aumenta 0,55%.

Substituindo-se o valor b em a, obtm-se a=3,221.

Equao ajustada % gordura= 3,22 + 0,55 (idade)

Com base nesta equao possvel traar a reta que passa pelos pontos.

Para x = 30; y = 19,7; para x = 50, y = 30,7











y = 0,55x + 3,22
0
10
20
30
40
50
0 20 40 60
idade (anos)
%

g
o
r
d
u
r
a
HEP5800 DPBergamaschi 109
OBS: o coeficiente angular depende das unidades de medida de X e Y. Isto deve ser considerado na
deciso da importncia do coeficiente angular.
O coeficiente angular da equao de Y=f(X) diferente do coeficiente angular de X=f(Y), a menos
que os desvios padro de X e Y sejam iguais.

Usos da reta de regresso:
- Predio - utilizar X para predizer Y; quando a correlao for forte, melhor a predio;
- Correlao mede o grau de relacionamento linear entre X e Y;
- Resumir os dados cada valor de X tem um valor mdio de Y.

Exemplo 13
So apresentados valores da massa do corpo sem gordura (kg) e da taxa de metabolismo (calorias)
de 10 pessoas de ambos os sexos

Pessoa Sexo Massa Taxa
1 M 62 1792
2 M 62,9 1666
3 F 36,1 995
4 F 54,6 1425
5 F 48,5 1396
6 F 42 1418
7 M 47,4 1362
8 F 50,6 1502
9 F 42 1256
10 M 48,7 1614
Fonte: Moore et al., 2004 (adaptado)

a) Apresente os dados em um diagrama de disperso com pontos identificando os sexos.
Apresente a varivel Y, taxa de metabolismo, como varivel resposta (dependente) e a
varivel X, massa do corpo sem gordura, como explicativa (independente);
b) Calcule o coeficiente de correlao entre as variveis sexo e massa;
c) Calcule os coeficientes da reta de regresso e desenhe a reta;
d) Interprete os coeficientes da reta.
e) Com base no grfico de disperso, voc diria que o coeficiente de correlao de Pearson para
o sexo feminino maior, menor ou igual ao do sexo masculino? Justifique.
HEP5800 DPBergamaschi 110
Medidas de associao
X e Y so variveis aleatrias quantitativas
Razo de prevalncias
Razo de incidncias
Odds ratio
Qui quadrado de Pearson
Coeficiente de associao de Yule
Exerccios
HEP5800 DPBergamaschi 111
Medidas de associao
Razo de prevalncias
Estudo de prevalncia
n indivduos so observados e classificados segundo duas variveis X e Y
Ex: X- ronco noturno (X1 sim, X0 no) e Y - presena de problema cardaco (Y1
sim, Y0 no)
Varivel Y
Varivel X Y1 (sim) Y0 (no) Total (%)
X1 (sim) a b n1 (100)
X0 (no) c d n0 (100)
Total m1 m2 n (100)

p= prevalncia de Y1= m1/n

p1= prevalncia de Y1|X1= a/n1

p0= prevalncia de Y1|X0= c/n0
rp= razo de prevalncias= p1/p0
dp=diferena de prevalncias= p1-p0
HEP5800 DPBergamaschi 112
Medidas de associao razo de prevalncias
A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os
meninos apresentam uma prevalncia 56% maior do que as meninas.
A prevalncia de desnutrio entre meninos 1,56 vezes (uma vez e meia) a prevalncia de
desnutrio entre meninas
Exemplo:
So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade,
segundo sexo.
Estado nutricional (Y) Masculino (X1) Feminino (X0) Total
(Y1) Desnutridas 29 20 49
(Y0) Normais 574 603 1177
Total 603 623 1226

Prevalncia de desnutrio:
040 , 0
1226
49
=
ou 4%

Prevalncia de desnutrio segundo sexo:
Masculino:
05 , 0
603
29
=
ou 5,0%; Feminino:
032 , 0
623
20
=
ou 3,2%

Razo de prevalncias:
498 , 1
603 20
29 623
623
20
603
29
= =
x
x


Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8%
HEP5800 DPBergamaschi 113
Medidas de associao razo de incidncias
Utilizado em estudos de coorte. Neste tipo de estudo, um grupo de pessoas sadias identificada e
seguida por um perodo de tempo. Observa-se a ocorrncia de eventos de interesse que acontecem
durante este perodo. O objetivo investigar se a incidncia de um determinado evento est
relacionada a uma determinada exposio.
Varivel Y
Varivel X Y1 Y0 Total
X1 a b n1 (100%)
X0 c d n0 (100%)
Total m1 m2 n (100%)
Estudo de incidncia
r= incidncia de Y1= m1/n

r1= incidncia de Y1 entre os X1= a/n1

r0= incidncia de Y1 entre os X0= c/n0
ri= razo de incidncias= r1/r0

di= diferena de incidncias= r1-r0
incidncia risco
r1 r0 r1/r0 r1-r0

ri=rr=razo de riscos=risco relativo=r1/r0

di= ra= risco atribuvel= r1-r0
HEP5800 DPBergamaschi 114
Medidas de associao
Estudo de incidncia
Morte em 5 anos por DIC
Fumar
Sim No
Total
Sim 208 850 1058
No 264 1467 1731
Total 472 2317 2789
r= 472/2789= 0,17 = 17%

r
1
=208/1058= 0,20= 20%

r
0
=264/1731= 0,15=15%

rr=0,20/0,15= 1,33

ra= 0,20- 0,15= 0,05= 5%
A incidncia de mortes parece ser maior
entre as pessoas que fumam. Os fumantes
apresentam uma incidncia 33% maior do
que os no fumantes.
A mortalidade entre fumantes 1,33 vezes
a mortalidade entre no fumantes.
HEP5800 DPBergamaschi 115
Medidas de associao
Razo de odds (odds ratio) - Estudo do tipo caso-controle
Varivel Y
Varivel X Y1 (caso) Y0 (controle) Total
X1 a b n1
X0 c d n0
Total m1 (100%) m2 (100%) n
odds a favor de Y1:
na categoria X1= (a/n1)(b/n1)
na categoria X0= (c/n0)(d/n0)

Razo de odds ou odds ratio:
[(a/n
1
)(b/n
1
)][(c/n
0
)(d/n
0
)]=( ) ( )
c b
d a
d
c
b
a
d c b a
.
.
= =
HEP5800 DPBergamaschi 116
Medidas de associao
Os dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool.

Condio Consumo mdio de lcool (g/dia) Total
80 e + 0-79
Casos 96 104 200
Controles 109 666 775
Total 205 770 975
Fonte: Tuyns et al.,1977.
Razo de odds (odds ratio) - Estudo do tipo caso-controle
(entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia:
88 , 0
109
96
205
109
:
205
96
= =


(entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia:
16 , 0
666
104
770
666
:
770
104
= =

odds ratio:
6 , 5
104 109
666 96
666
104
:
109
96
= =
x
x

A fora de morbidade de cncer
de esfago entre consumidores
de 80 e + g/dias de bebida
alcolica 5,6 vezes a fora de
morbidade entre os que
consomem de 0 a 79g/dia.
HEP5800 DPBergamaschi 117
Medidas de associao
Qui-quadrado de Pearson
Duas variveis qualitativas:
X - curso universitrio e Y sexo do aluno
Questo: sexo do indivduo influi na escolha do curso?
Situao 1
Curso Masculino Feminino Total
n n n
Economia 24 36 60
Administrao 16 24 40
Total 40 60 100

Curso Masculino Feminino Total
n proporo n proporo n proporo
Economia 24 0,6 36 0,6 60 0,6
Administrao 16 0,4 24 0,4 40 0,4
Total 40 1 60 1 100 1

As propores de escolha dos cursos no diferem segundo sexo do estudante
HEP5800 DPBergamaschi 118
Medidas de associao
Qui-quadrado de Pearson
Situao 2

Curso Masculino Feminino Total
n n n
Fsica 100 (a) 20 (b) 120
Cincias Sociais 40 (c) 40 (d) 80
Total 140 60 200


Curso Masculino Feminino Total
n proporo n proporo n proporo
Fsica 100 0,7 20 0,3 120 (120/200) = 0,6
Cincias Sociais 40 0,3 40 0,7 80 (80/200) = 0,4
Total 140 1 60 1 200 1


A distribuio de alunos em cada curso, segundo sexo no a mesma; sexo e curso podem estar
associados.
HEP5800 DPBergamaschi 119
Medidas de associao
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos
esperaramos em Fsica, entre os homens?
Esperaramos: 6 , 0
140
=
x
ou x= 0,6 x 140 = 84
Homens-Fsica: n observado=100; o valor esperado seria: 0,6x140 ou
84 140
200
120
= x
1 200 1 60 1 140 Total
0,4 80 0,7 40 0,3 40 Cincias
Sociais
0,6 120 0,3 20 0,7 100 Fsica
proporo n proporo n Proporo n
Total Feminino Masculino Curso
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos
esperaramos em Cincias Sociais, entre os homens?
Esperaramos:
ou x= 0,4 x 140 = 56
4 , 0
140
=
x
Homens-C Sociais: n observado=40; o valor esperado seria: 0,4x140 ou
56 140
200
80
= x
HEP5800 DPBergamaschi 120
Medidas de associao
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos
esperaramos em Fsica, entre os mulheres?
Mulheres-Fsica: n observado=20; o valor esperado seria: 0,6x60 ou
1 200 1 60 1 140 Total
0,4 80 0,7 40 0,3 40 Cincias
Sociais
0,6 120 0,3 20 0,7 100 Fsica
proporo n proporo n Proporo n
Total Feminino Masculino Curso
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos
esperaramos em Cincias Sociais, entre as mulheres?
Esperaramos:
ou x= 0,4 x 60 = 24
4 , 0
60
=
x
mulheres-C Sociais: n observado=40; o valor esperado seria: 0,4x60 ou
24 60
200
80
= x
6 , 0
60
=
x
Esperaramos: ou x= 0,6 x 60 = 36
36 60
200
120
= x
HEP5800 DPBergamaschi 121
Tabela esperada, sob a condio de independncia
Medidas de associao
1 200 1 60 1 140 Total
0,4 80 0,7 40 0,3 40 Cincias
Sociais
0,6 120 0,3 20 0,7 100 Fsica
proporo n proporo n Proporo n
Total Feminino Masculino Curso
1 200 1 60 1 140 Total
0,4 80 0,7 40 0,3 40 Cincias
Sociais
0,6 120 0,3 20 0,7 100 Fsica
proporo n proporo n Proporo n
Total Feminino Masculino Curso
Curso Masculino Feminino Total
n n n
Fsica 84 36 120
Cincias Sociais 56 24 80
Total 140 60 200
HEP5800 DPBergamaschi 122

Valores
observados
O
Valores
esperados
E
(O-E) (O-E)
2

E
E O
2
) (

100 84 16 256 3,048
40 56 -16 256 4,571
20 36 -16 256 7,11
40 24 16 256 10,667


Qui-quadrado=25,397

Medidas de associao
O Qui-quadrado obtido somando-se a diferena ao quadrado entre as
freqncias observadas e as esperadas, dividido pelas freqncias esperadas

2
2
=

( ) O E
E
HEP5800 DPBergamaschi 123
Se o Qui-quadrado for igual a zero, ento no existe associao entre as
variveis. O Qui-quadrado no mede fora de associao.
Medidas de associao
Coeficiente de associao de Yule (Y)
Curso Masculino Feminino Total
N N %
Fsica 100 (a) 20 (b) 120
Cincias Sociais 40 (c) 40 (d) 80
Total 140 60 200
Y
a d b c
a d b c
Y =

+
+
. .
. .
, onde: 1 1
HEP5800 DPBergamaschi 124
Frmula equivalente para clculo do Qui-quadrado:
Medidas de associao
2 . 1 . . 2 . 1
2
21 12 22 11 2
f f f f
n ) f f f f (
=

Curso Masculino Feminino Total
N N %
Fsica f
11
=100 f
12
= 20 f
1.
= 120
Cincias Sociais f
21
= 40 f
22
= 40 f
2.
= 80
Total f
.1
= 140 f
.2
= 60 n

= 200

397 , 25
60 140 80 120
200 ) 40 20 40 100 (
2
2
=

=
x x x
x x

HEP5800 DPBergamaschi 125


Exemplo:
Com o objetivo de investigar a associao entre histria de bronquite na infncia e
presena de tosse diurna ou noturna em idades mais velhas, foram estudados
1.319 adolescentes com 14 anos. Destes, 273 apresentaram histria de bronquite
at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou noturna aos 14
anos.
Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou
noturna aos 14 anos de idade. Local X, ano Y.
Bronquite
Tosse Sim No Total
Sim 26 44 70
No 247 1002 1249
Total 273 1046 1319
Fonte: Holland WW et al.,1978.
HEP5800 DPBergamaschi 126
Bronquite
Tosse Sim No Total
Sim 26 44 70
No 247 1002 1249
Total 273 1046 1319

Clculo do qui-quadrado de Pearson
Valores
observados
O
Valores
esperados
E
(O-E) (O-E)
2

E
E O
2
) (

26 14,488 11,512 132,526 9,147
247 258,512 -11,512 132,526 0,513
44 55,512 -11,512 132,526 2,387
1002 990,488 11,512 132,526 0,134


Qui-quadrado= 12,181

Y
a d b c
a d b c
Y =

+
+
. .
. .
, onde: 1 1
Coeficiente de associao de Yule (Y)
=
+

=
247 4 1002 26
247 44 1002 26
x x
x x
Y
+ 0,41
HEP5800 DPBergamaschi 127
Distribuio de recm-nascidos acometidos de sndrome de desconforto
idioptico grave segundo condio de sobrevivncia e peso ao nascer (g).
50 23 27 Total
13 10 3 No baixo peso (2500 e mais)
37 13 24 Baixo peso (<2500)
Total Sobrevida bito
Peso ao nascer
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Com base nos dados apresentados na tabela calcule:
a) a incidncia de bitos entre crianas com baixo peso,
b) a incidncia de bitos entre crianas sem baixo peso,
c) a razo de incidncias
d) a diferena de incidncias
e) o qui-quadrado do Pearson
f) interprete os resultados
HEP5800 DPBergamaschi 128
Defeitos do tubo neural so malformaes congnitas que surgem durante o
desenvolvimento fetal. Estes dados so de um estudo conduzido no pas de Gales
Reino Unido, para investigar possvel associao entre defeitos do tubo neural e
dieta materna. O estudo do tipo caso-controle: mes que tinham tido bebs com
defeitos do tubo neural (casos) e suas irms que no tinham tido (controles) foram
avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.
Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo
neural; controle recm-nascidos que no tinham defeitos do tubo neural e dieta
materna.
100 367 100 123 100 244 Total
36,0 132 26,0 32 41,0 100 Pobre
43,0 158 39,0 48 45,1 110 Razovel
21,0 77 35,0 43 13,9 34 Boa
% n % n % n
Total Controles Casos Dieta
HEP5800 DPBergamaschi 129
Considere a dieta boa como categoria de referncia (basal) e calcule:
a) o odds ratio de dieta razovel em relao a dieta boa;
b) o odds ratio de dieta pobre em relao a boa;
c) o qui-quadrado de Pearson e
d) interprete os resultados.
100 367 100 123 100 244 Total
36,0 132 26,0 32 41,0 100 Pobre
43,0 158 39,0 48 45,1 110 Razovel
21,0 77 35,0 43 13,9 34 Boa
% n % n % n
Total Controles Casos Dieta

Potrebbero piacerti anche