Sei sulla pagina 1di 158

Programa de Ps-graduao em

Sade da Criana e da Mulher


Bioestatstica
Saint Clair S. Gomes Jr
Liana W. Pinto
Referncias Bibliogrficas
Estatstica Aplicada s Cincias Sociais
Pedro Alberto Barbetta.
Editora: UFSC. 2004.
Ferramentas Estatsticas no Contexto Clnico
Rafael Perera, Carl Heneghan e Douglas Badenoch.
Editora: Artmed. 2009.
Anlise Descritiva de Dados
Tipos de variveis
Distribuio de freqncias
Grficos
Medidas de tendncia central e de posio
Medidas de disperso
Conceitos Preliminares
Estatstica: cincia que tem por objetivo coletar dados e obter
informao em situaes de incertezas.
Dados: qualquer caracterstica passvel de observao em
uma populao ou amostra;
Populao: conjunto de elementos que possuem
caractersticas em comum;
Amostra: qualquer subconjunto de uma populao;
Informao: dados analisados que possuem significado em
um contexto especfico.
Conceitos Preliminares
Bioestatstica: estatstica aplicada as cincias da sade.
Tipos de dados:
Dados primrios: so dados obtidos de fontes especficas
para fins especficos;
SIM Sistema de Informao de Mortalidade
Fonte: Registro de bito; Objetivo: obter a taxa de
mortalidade.
Conceitos Preliminares
Tipos de dados:
Dados secundrios: obtidos de fontes variadas para fins
especficos;
SIM - Sistema de Informao de Mortalidade e Registro
de Cncer de Base Populacional.
Fonte: Registro de bito; Objetivo: estimar a
incidncia de cncer nos locais onde existe RCBP.
Tipos de variveis
Variveis Nominais: se enquadram em categorias sem
ordenao natural, descritas geralmente em percentuais ou
propores e moda.
Exemplo:
Dicotmicas: sim/no; 1/2; masculino/feminino; 0/1;
doente/no doente; fumante/no fumante;
Multinomiais: fumante/ex-fumante/nunca fumou; cor dos
olhos; raa; estado civil; tipo sanguneo.

Tipos de variveis
Variveis Ordinais: se enquadram em categorias com
ordenao natural ou estabelecida, representadas pelos
percentuais e propores e algumas vezes pelo valor mediano
e moda.
Exemplo:
Estadiamento de uma doena; faixas etrias; Escala de
APGAR, SNAPPE, Bayley.
Tipos de variveis
Variveis Numricas: admitem como resposta nmeros inteiros
ou fracionrios, que podem ser manipulados algebricamente
permitindo o clculo de medidas como mdias, desvios padro,
entre outras estatsticas (proporo, mediana, moda etc);
Exemplos:
Dado discreto: nmero de filhos, nmero de leitos, idade
gestacional; freqncia cardaca;
Dado contnuo: idade; presso arterial; estatura; IMC.
Distribuio de freqncias
Relaciona categoria ou classe de valores com as freqncias
de ocorrncia;
Mortalidade Neonatal segundo Idade Gestacional (Capurro)
Idade gestacional (semanas) Casos %
< 28 43 6,9
28 - 37 458 73,8
38 - 41 101 16,3
> 41 10 1,6
Ign 9 1,4
Total 621 100,0
Distribuio de freqncias
Mortalidade neonatal segundo fatores de risco
Risco neonatal Casos n = 621 %
SDR 560 90,2
Peso < 2500g 512 82,4
IG < 37 semanas 501 80,7
Estatura < 45 cm 461 74,2
Apneia 253 40,7
Ictercia 218 35,1
Sepse 209 33,7
Asfixia 190 30,6
Anemia 145 23,3
Malformao congnita 98 15,8
Hemorragia pulmonar 81 13,0
Hemorragia intracraniana 45 7,2
Grficos
Facilitam a identificao do padro de distribuio de uma ou
mais variveis.
Importantes instrumentos na anlise exploratria de dados, pois
permitem a identificao de valores discrepantes, evoluo
temporal, distribuio proporcional e de probabilidade etc.
Os principais grficos utilizados na anlise exploratria so:
Histograma;
Barras;
Setores;
Linhas;
Box-plot (caixa).
Grficos - Histograma
Mortalidade Neonatal segundo Idade Gestacional
(Capurro)
0
50
100
150
200
250
300
350
400
450
500
< 28 28 - 37 37 - 41 > 41 Ign
Idade Gestacional (semanas)
C
a
s
o
s
Grficos - Barras
Mortalidade neonatal segundo fatores de risco
0,0 20,0 40,0 60,0 80,0 100,0
SDR
Peso < 2500g
IG < 37 semanas
Estatura < 45 cm
Apneia
Ictercia
Sepse
Asfixia
Anemia
Malformao congnita
Hemorragia pulmonar
Hemorragia intracraniana
F
a
t
o
r
e
s

d
e

R
i
s
c
o

n
e
o
n
t
a
l
Freqncia %
Grficos - Setores
Distribuio do tipo sanguneo
A
27%
B
14%
AB
8%
O
51%
Grficos - Linha
Casos de AIDS identificados no Brasil, freqncia por ano de
notificao e sexo (1985-2006)
0
5000
10000
15000
20000
25000
1
9
8
5
1
9
8
6
1
9
8
7
1
9
8
8
1
9
8
9
1
9
9
0
1
9
9
1
1
9
9
2
1
9
9
3
1
9
9
4
1
9
9
5
1
9
9
6
1
9
9
7
1
9
9
8
1
9
9
9
2
0
0
0
2
0
0
1
2
0
0
2
2
0
0
3
2
0
0
4
2
0
0
5
2
0
0
6
ano de notificao
n

m
e
r
o

d
e

c
a
s
o
s
Masculino
Feminino
Grfico Boxplot
So teis na comparao da
disperso de dois ou mais grupos
(tamanho da caixa ou distncia entre
os extremos);
Adicionalmente utilizado para
identificar a amplitude dos dados, a
presena de pontos discrepantes
(outliers).
Se no existirem observaes
discrepantes a distncia entre as
extremidades do grfico
correspondem a amplitude total.
Outliers so marcados com * por
quase todos os pacotes estatsticos.
Grfico Boxplot
Boxplot e assimetria
Simtrica: mediana fica no
centro;
Assimetria direita: a mediana
fica mais prxima do valor
mnimo;
Assimetria esquerda: a
mediana fica mais prxima do
valor mximo.
Grfico Boxplot
Banco de dados: low birth weight
Varivel: peso materno no ltimo
perodo menstrual, em kg.
Observa-se da figura a grande
variabilidade da varivel e a presena
de valores extremos (os nmero
identificam as pacientes).
Obs: SPSS Outliers moderados - entre 1.5 e 3 IQR. Outliers
extremos: acima de 3 IQR. IQR = Inter Quartile Range (Q3 Q1)
Grfico Boxplot
Boxplot do peso materno no
ltimo perodo menstrual
segundo varivel Peso do RN
(0 = peso > 2500g e 1 = peso
< 2500g)
Comparando os grupos,
verifica-se que o peso das
mes de RN de baixo peso:
mais homogneo;
Exibe uma assimetria a
esquerda (tendem a ter
pesos maiores);
Apresentam um nmero
menor de outliers;
Medidas de tendncia central e
de posio
Moda
Mediana
Mdia
Quartis e Percentis
Moda
Definio: valor que ocorre com maior freqncia;
Exemplo:
1 1 1 3 5 6 8 Moda = 1
1 1 2 2 3 4 5 Moda = 1 ou 2
M F M M M F Moda = M
A B AB O O Moda = O
Vantagem: fcil obteno e pode ser obtida para todos os tipos
de variveis.
Desvantagem: s pode ser obtida quando houver repeties
para o dado observado.
Mediana
Definio: valor que divide o conjunto de dados em duas partes
iguais.
Vantagem: no sofre influncia de valores extremos.
Desvantagem: necessidade de ordenar o conjunto de dados de
modo crescente ou decrescente.
Exemplo:
1 2 3 6 8 Mediana = 3 1 2 3 6 18 Mediana = 3
1 2 3 6 Med = (2+3)/2 = 2,5 0,1 2 3 6 Med = 2,5
Observe que o valor extremo exerce pouca
influncia o valor da mediana.
Mdia
Definio: o valor que representa um conjunto de dados
numricos.
Vantagem: facilidade de clculo;
Desvantagem: influenciada por valores extremos.
Mais empregada: mdia aritmtica.

n
x
X
n
i
i

=
=
1
Exemplo: Peso de RN (kg)
84 , 2
5
9 , 2 1 , 2 8 , 2 2 , 3 2 , 3
=
+ + + +
= X
46 , 3
5
0 , 6 1 , 2 8 , 2 2 , 3 2 , 3
=
+ + + +
= X
0,62
Observe a influncia de um valor extremo no resultado da mdia.
Medidas de disperso
Varincia
Desvio padro
Coeficiente de variao
Varincia
Definio: uma medida que fornece o grau de preciso da
mdia.

1
) (
1
2
2

=
n
X x
s
n
i
i
( ) ( ) ( ) ( ) ( )
20 , 0
4
84 , 2 9 , 2 84 , 2 1 , 2 84 , 2 8 , 2 84 , 2 2 , 3 84 , 2 2 , 3
2 2 2 2 2
2
=
+ + + +
=
A
s
( ) ( ) ( ) ( ) ( )
22 , 2
4
46 , 3 0 , 6 46 , 3 1 , 2 46 , 3 8 , 2 46 , 3 2 , 3 46 , 3 2 , 3
2 2 2 2 2
2
=
+ + + +
=
B
s
Interpretao: pop A mais homognea que a pop B; a mdia da pop A mais precisa
que a mdia da pop B.
Desvio padro
Definio: representa o desvio mdio dos valores em relao a
mdia. obtida por meio da extrao da raiz quadrada da
varincia.


1
) (
1
2

=

=
n
X x
s
n
i
i
( ) ( ) ( ) ( ) ( )
45 , 0
4
84 , 2 9 , 2 84 , 2 1 , 2 84 , 2 8 , 2 84 , 2 2 , 3 84 , 2 2 , 3
2 2 2 2 2
=
+ + + +
=
A
s
( ) ( ) ( ) ( ) ( )
49 , 1
4
46 , 3 0 , 6 46 , 3 1 , 2 46 , 3 8 , 2 46 , 3 2 , 3 46 , 3 2 , 3
2 2 2 2 2
=
+ + + +
=
B
s
Interpretao: Na pop A os dados variam mais ou menos 0,45 e na pop B 1,49 kg.
Coeficiente de variao
Definio: representa o desvio mdio relativo dos valores em
relao a mdia.
Vantagem: permite a comparao entre variveis ou
populaes distintas.
X
s
CV = 100 (%)
8 , 15
84 , 2
45 , 0
100 (%) = = CV 1 , 43
46 , 3
49 , 1
100 (%) = = CV
Quartis e Percentis
Quartil
Definio: valor que divide o conjunto de dados em quatro
partes iguais.
Exemplo: 2,1 2,8 2,9 3,0 3,1 3,2 3,2 3,5 4,0
Q
1
= 2,9 Q
2
= 3,1 Q
3
= 3,2 Q
4
= 4,0
Percentil
Definio: valor que divide o conjunto de dados em cem
partes iguais.
P
3
= 2,3 P
5
= 2,4 P
10
= 2,7 P
90
= 3,6
P
95
= 3,8 P
97
= 3,9 P
97.5
= 3,9 P
99
= 4,0
Z-Score
Padronizao que permite a comparao entre indivduos, grupos
ou variveis.
Obtido a partir da comparao dos valores observados com valores
de referncia fornecidos por dados da literatura ou por estudos
anteriores.


Populaes prximas aos valores de referncia apresentam z-score
com mdia e desvio padro prximos a zero e um, respectivamente.
Quanto mais afastados dos valores de referncia mais discrepantes
so os valores da mdia e do desvio padro do z-score.
referncia de Padro Desvio
referncia de valor - observado valor
- = score z
Z-Score
Exemplo: Supondo que os valores de referncia obtidos no
SINASC para a mdia e DP do peso dos RN so 3,2 0,52.
Peso 1 Z-score 1 Peso 2 Z-score 2
3,2 0,04 3,2 0,04
3,2 0,04 3,2 0,04
2,8 -0,73 2,8 -0,73
2,1 -2,08 2,1 -2,08
6,0 5,44 2,9 -0,54
Mdia 0,54 Mdia -0,66
DP 2,87 DP 0,87
Mediana 0,04 Mediana -0,54
Probabilidade
Conceitos bsicos
Risco relativo
Razo de chances (Odds Ratio)
Sensibilidade e Especificidade
Testes diagnsticos
Prevalncia nos testes diagnsticos
Curva ROC
Razo de Verossimilhanas
Distribuio Normal
Probabilidade
Conceitos Bsicos: proporo de ocorrncia de um evento.




Exemplo: Evento A: Casos notificados de dengue,
considerando que todas as pessoas possam ser infectadas pelo
vrus mais de uma vez (com reposio).

( )
possveis eventos de total nmero
ocorreu A evento o que vezes de nmero
= A P
( ) 0083 , 0
6.000.000
50.000
= = A P
Conceitos Bsicos
Fenmeno aleatrio: aquele cujos resultados so conhecidos,
no entanto, a ordem de ocorrncia desconhecida.
Espao amostral: conjunto de resultados possveis de um
fenmeno aleatrio.
Evento: realizao particular de um fenmeno aleatrio dentro
de um espao amostral.
Conceitos Bsicos
Eventos podem ser:
Complementares: so todos os eventos diferentes daquele
no qual se est interessado.
Ex: P(sexo=Masculino) + P(sexo=feminino) = 1
Mutuamente exclusivos: quando o eventos no ocorrem de
forma simultnea dentro de um espao amostral.
Ex: Cncer de colo de tero e sexo masculino
Independentes: quando a ocorrncia de um dos eventos no
altera a probabilidade de ocorrncia de outros eventos
dentro de um espao amostral.
Ex: tipo de parto e sexo do RN
Risco
Definio: probabilidade de ocorrncia de um evento
(doena) no grupo (exposto e no exposto) em determinado
perodo de tempo.

Desfecho
Doente
(+)
No Doente
(-)
Tratado (Y)
(+)
A B
Controle (X)
(-)
C D
) (
) (
B A
A
Y P
+
=
) (
) (
D C
C
X P
+
=
Risco
Exemplo:

Cirrose
Sim No
Sim 9 26
No 2 43
Risco de um alcolatra apresentar
cirrose:

Risco de um no alcolatra
apresentar cirrose:


2571 , 0
26 9
9
=
+
= P
0444 , 0
43 2
2
=
+
= P
Risco Relativo
Definio: a razo do risco de ocorrncia do evento no grupo
exposto contra o risco de ocorrncia no grupo controle (no
exposto) em determinado perodo de tempo.
Exemplo:


Interpretao: indica o nmero de vezes que a probabilidade de
um grupo superior ou inferior em relao ao grupo de
comparao.
79 , 5
0444 , 0
2571 , 0
= = RR
Razo de Chances
(Odds Ratio - OR)
Definio: expressa o nmero de vezes em que a presena do
fator aumenta a chance de ocorrncia de um evento (doena)
quando comparado com a ausncia deste fator, independente
do perodo de tempo.
Exemplo:
Grupo
Com angstia
respiratria
Sem angstia
respiratria
Total
TRH 260 132 392
Placebo 244 133 377
Total 504 265 769
Razo de Chances
Chance de um lactente com a sndrome de angstia
respiratria tenha sido exposto ao TRH:


Chance de que um lactente sem a sndrome de angstia
respiratria tenha sido exposto ao TRH:

0656 , 1
) 504 / 244 (
) 504 / 260 (
exposto no
exposto
= = = Chance
9925 , 0
) 265 / 133 (
) 265 / 132 (
exposto no
exposto
= = = Chance
Razo de Chances
A razo de chances ser dada por:
ou

Interpretao: significa que um lactente no grupo TRH tem uma
chance 1,1 vezes maior de desenvolver a sndrome da angstia
respiratria do que um lactente no grupo placebo.

0737 , 1
9925 , 0
0656 , 1
= = OR 0736 , 1
244 132
133 260
=

= OR
Sensibilidade
Definio: proporo entre o nmero de indivduos doentes
com resultado positivo sobre o total de indivduos doentes. So
os realmente doentes identificados pelo teste.
Diagnstico de
certeza
Doena + Doena -
Exame + A B
Exame - C D
c a
a
ade Sensibilid
+
=
Especificidade
Definio: proporo entre o nmero de indivduos sadios com
resultado negativo sobre nmero de indivduos sadios. So os
realmente sadios identificados pelo teste.
Diagnstico de
certeza
Doena + Doena -
Exame + A B
Exame - C D
d b
d
dade Especif ici
+
=
Testes diagnsticos
Quando se avalia um teste diagnstico 4 situaes so
possveis:
O teste positivo e o paciente tem a doena Valor
preditivo positivo (VPP);


O teste positivo mas o paciente no tem a doena
Probabilidade de falso positivo (FP);

b a
a
VPP
+
=
VPP FP =1
Testes diagnsticos
O teste negativo e o paciente no tem a doena Valor
preditivo negativo (VPN).



O teste negativo e o paciente tem a doena Probabilidade
de falso negativo (FN)

d c
d
VPN
+
=
VVN FN =1
Sensibilidade e Especificidade
Exemplo: Uso do eletrocardiograma para identificao de
estenose em homens com estenose confirmada



Eletrocardiograma
de esforo
Mais de 75% de estenose
(padro ouro)
Presente Ausente Total
Positivo 55 7 62
Negativo 49 84 133
Total 104 91 195
Sensibilidade e Especificidade
Exemplo:
5288 , 0
104
55
= = ade Sensibilid
9231 , 0
91
84
= = de Especifida
VPP, VPN, FN e FP
Exemplo:
1129 , 0 1 = = VPP FP
3684 , 0
84 49
84
=
+
=
+
=
d c
d
VPN 6316 , 0 1 = = VVN FN
8871 , 0
7 55
55
=
+
=
+
=
b a
a
VPP
Prevalncia no teste diagnstico
Definio: total de pacientes doentes sobre o total de pacientes.


Exemplo:
d c b a
c a
P
+ + +
+
=
533 , 0
195
104
= = P
Prevalncia no teste diagnstico
Impacto nos testes diagnsticos:




Eletro
Mais de 75% de estenose
(padro ouro)
Presente Ausente Total
Positivo 55 7 62
Negativo 49 84 133
Total 104 91 195
S 0,529
E 0,923
VPP 0,887
VPN 0,632
P 0,533
Prevalncia no teste diagnstico
Impacto nos testes diagnsticos:




Eletro
Mais de 75% de estenose
(padro ouro)
Presente Ausente Total
Positivo 21 12 33
Negativo 18 144 162
Total 39 156 195
S 0,529
E 0,923
VPP 0,632
VPN 0,887
P 0,200
Prevalncia no teste diagnstico
Impacto nos testes diagnsticos:




Eletro
Mais de 75% de estenose
(padro ouro)
Presente Ausente Total
Positivo 58 7 65
Negativo 52 79 130
Total 110 85 195
S 0,529
E 0,923
VPP 0,899
VPN 0,603
P 0,563
Prevalncia no teste diagnstico
Impacto nos testes diagnsticos:




Eletro
Mais de 75% de estenose
(padro ouro)
Presente Ausente Total
Positivo 80 3 84
Negativo 71 40 111
Total 152 43 195
S 0,529
E 0,923
VPP 0,960
VPN 0,359
P 0,778
Curva Roc
A curva ROC (Receiver Operator Caracteristic) otimiza a
sensibilidade e especificidade de um teste diagnstico.
Permite estabelecer um ponto de corte factvel para um novo
teste diagnstico que est sendo avaliado.
Permite identificar testes diagnsticos com maior poder de
discriminao entre diferentes testes diagnsticos.
Curva ROC
O pesquisador dever selecionar vrios pontos de corte ou
nveis de alterao do teste de acordo com as necessidades,
dados de literatura etc.
O pesquisador define um grfico da sensibilidade em funo da
proporo dos resultados falsos-positivos (1 Especificidade).
O ponto de corte ideal encontrado na extremidade superior
esquerda do grfico (ponto em que a curva comea a ficar
estvel).
Uma das vantagens deste mtodo que as curvas de
diferentes testes diagnsticos podem ser comparadas.
Curva ROC Exemplo 1
O questionrio SF-36 e o AQLQ (Questionrio de Qualidade de Vida do
Asmtico) so importantes instrumentos para avaliar a qualidade de vida de
pacientes asmticos em ensaios clnicos.
Entretanto, as propriedades discriminantes destas escalas no esto bem
avaliadas.
Este trabalho analisou o poder AQLQ e SF-36 em classificar a asma em
cinco categorias que so: extrema, grave, moderada, leve e ausente.
Estas categorias foram definidas a partir do exame clnico.
A curva ROC foi utilizada para identificao dos pontos de corte das
escalas fornecidas por cada questionrio.
De acordo com a curva ROC, o AQLQ e o SF-36 apresentaram bom poder
de discriminao (rea sob a curva de 0,81 e 0,75, respectivamente).
Observou-se que ambos os questionrios so capazes de identificar asma
moderada.
Curva ROC Exemplo 1
Curva ROC Exemplo 1
Fonte: Mancuso CA, Peterson MG, Charlson ME.Comparing discriminative validity between a disease-specific and a
general health scale in patients with moderate asthma.J Clin Epidemiol. 2001 Mar;54(3):263-74.
Curva ROC Exemplo 2
Este estudo tem por objetivo determinar o estado nutricional de
pre-termos a partir dos nveis de vitamina A, proteinas de
ligao do retinol (RBP), Pre-albumina (ttr) e demais problemas
relacionados com a carencia de vitamina A.
A sensibilidade e especificidade para todos os possveis pontos
de corte foram determinados por meio de uma curva ROC.
A rea sob a curva forneceu uma estimava da acuracia do teste
realizado.

Curva ROC Exemplo 2
Curva ROC Exemplo 2
Razo de Verossimilhana
Definio: a razo entre a probabilidade de se encontrar o
resultado em algum com a doena e a probabilidade de se
encontrar o mesmo resultado em algum sem a doena.
Representa a informao contida num teste diagnstico.
Quanto maior o resultado da RV, maior o poder de
informao (discriminao) do teste.
Razo de Verossimilhana
RV positiva (RV+): a razo entre a probabilidade de um teste
ser positivo, dado que existe a doena e a probabilidade de um
teste ser positivo, dado que no existe a doena.




Onde: VP = verdadeiro positivo; FN = falso negativo; FP = falso positivo e
VN = verdadeiro negativo.
OU
dade especifici 1
ade sensibilid

=
+
RV
VN FP
FP
FN VP
VP
RV
+
+
=
+
Razo de Verossimilhana
RV negativa (RV-): a razo entre a probabilidade de um teste
ser negativo, dado que existe a doena e a probabilidade de
um teste ser negativo, dado que no existe a doena.




Onde: VP = verdadeiro positivo; FN = falso negativo; FP = falso positivo e
VN = verdadeiro negativo.
OU
dade especifici
ade sensibilid - 1
=

RV
VN FP
VN
FN VP
FN
RV
+
+
=

Razo de Verossimilhana
Doena
Presente Ausente Total

Teste

Positivo A
Verdadeiro +
B
Falso +
A + B
Negativo C
Falso -
D
Verdadeiro -
C + D
Total A + C B + D
( )
( ) D B
B
C A
A
RV
+
+
= +
( )
( ) D B
D
C A
C
RV
+
+
=
Razo de Verossimilhana
Exemplo: Foi realizado um estudo com o objetivo de avaliar a propedutica
em mulheres com atipias de clulas glandulares no resultado
colpocitolgico.
Foram avaliadas prospectivamente 159 mulheres atendidas por resultado
citolgico de atipias de clulas glandulares, entre janeiro e dezembro de
2000.
Todas foram submetidas a coleta de nova colpocitologia e a colposcopia.
Foi realizada bipsia dirigida em 50 casos, curetagem endocervical em 21 e
conizao em 75.
O desempenho dos mtodos propeduticos foi descrito por estimativas de
sensibilidade, especificidade, valores preditivos e razo de
verossimilhanas, tendo como padro-ouro o resultado histolgico.
Razo de Verossimilhana
Exemplo:
Fonte: VERDIANI, Luiz Antonio, DERCHAIN, Sophie Franoise Mauricette, SCHWELLER, Marcelo et al. Atipia de clulas glandulares em
esfregaos do colo do tero: avaliao dos mtodos propeduticos. Rev. Bras. Ginecol. Obstet., abr. 2003, vol.25, no.3, p.193-200.
Razo de Verossimilhana
Exemplo:
Interpretao: A curetagem e a colpocitologia apresetaram os maiores valores de RV+ (3,250 e
1,450, respectivamente), indicando que so os exames melhor idenficam as mulheres para
cancer. A colposcopia associada com a citologia e a colpocitologia apresentaram melhores
desempenho para excluso do diagnostico positivo de cancer, uma vez que apresentaram os
menores valores para RV- (0,161 e 0,294).
Distribuio Normal
Importante para descrever os mais variados fenmenos
biolgicos.
Na natureza a maioria dos indivduos vai estar prximo de um
valor mdio e os demais estaro distribudos de forma
proporcional ao redor deste valor mdio.
O afastamento dos valores em torno do valor mdio definido
pelo desvio padro.
Indivduos com valores prximos ao valor mdio tero maior
probabilidade de ocorrncia.
Quanto mais distante da mdia, menor a probabilidade de
ocorrncia.
Distribuio Normal
Distribuies de probabilidade
Distribuies Representao Representa dados como
Normal N (,o) Peso, altura, colesterol
Binomial Bin (p,n) Gnero (M,F), presena de
uma caracterstica (sim/no)
Poisson Poi () Contagem de hemcias,
nmero de filhos
Exponencial Exp () Dosagem de bilirrubina nas
primeiras horas de vida
Intervalo de Confiana
Conceitos bsicos
Estimao pontual e por intervalos
Interpretao do intervalo de confiana
Intervalo de confiana para a mdia
Intervalo de confiana para uma proporo
Intervalo de confiana para o risco relativo
Intervalo de confiana para a razo de chances
Inferncia estatstica
O objetivo representar fenmenos que teoricamente se
distribuem de acordo com alguma distribuio de probabilidade.
A inferncia vai fornecer ferramentas para a estimao dos
parmetros das distribuies de probabilidade associadas ao
fenmeno que se deseja estudar.
Ferramentas da inferncia: estimao (pontual e intervalo de
confiana) e testes de hiptese.
Estimao
Pontual: consiste na obteno de um valor para o parmetro de
interesse.
Exemplo: deseja-se conhecer a mdia de peso de recm
nascidos de muito baixo peso. A partir de uma amostra 644
RN de 8 maternidades. Os resultados so:
Unidade Total de RN Peso Mdio DP
100 58 1.076,9 268,9
110 58 1.063,4 304,2
120 89 1.043,0 265,0
130 99 1.048,5 282,1
140 57 1.070,5 288,2
150 71 1.074,1 290,4
160 117 1.046,4 284,6
170 95 1.062,2 287,9
Total Global 644 1.058,0 282,2
Estimao
Intervalo de confiana: consiste no estabelecimento de um
conjunto de valores no qual o parmetro de interesse pode
estar contido com determinada probabilidade.
Exemplo: Supondo que somente a unidade 100 forneceu
dados para o clculo da estimativa de peso do RN. A partir
do intervalo de confiana poderia se estimar que os RNs
nas demais unidades teriam entre 1.007,7 e 1.146,1g.

Total de RN Peso Mdio DP
58 1.076,9 268,9
Intervalo 69,2
Limite inferior 1.007,7
Limite superior 1.146,1
Intervalo de confiana
Como determinar um intervalo de confiana?

A preciso define o limite inferior e superior do intervalo em que
o verdadeiro valor do parmetro deve estar contido.
IC muito grandes aumentam a probabilidade de conterem o
verdadeiro valor do parmetro, porm apresentam baixo poder
de informao por serem pouco precisos.
IC so medidas importantes da qualidade da informao obtida
a partir de uma amostra.
desejada Preciso Pontual Estimativa I = C
Intervalo de confiana
Como determinar um intervalo de confiana?
Inicialmente devemos determinar a preciso desejada.
A preciso funo:
tamanho da amostra
variabilidade da estimativa obtida
significncia
Intervalo de confiana
Tamanho da amostra:
A qualidade do processo de amostragem fundamental
para obteno de boas estimativas.
Em geral, quanto maior o tamanho amostral melhor a
estimativa.
No entanto, possvel obter boas estimativas a partir de
pequenas amostras.
Intervalo de confiana
Variabilidade da estimativa obtida:
Definida a partir do desvio padro do parmetro estimado.
Quanto mais homognea a amostra, menor ser o desvio e,
conseqentemente, mais preciso ser o intervalo.
Significncia:
Probabilidade da amostra conter o verdadeiro valor do
parmetro desejado.
Definido de forma arbitrria (90, 95, 99%).
Intervalo de confiana
Para a Mdia


No exemplo para estimar o peso mdio dos RN:
n
s
z x
2
o
2 , 69 9 , 076 . 1
58
9 , 268
96 , 1 9 , 076 . 1 =
Intervalo de confiana
Para uma Proporo:


Exemplo: Estimar o percentual de RN com peso inferior a 1000g
Suponha que apenas a unidade 100 enviou os dados e que o
percentual de 37,9%. Aplicando na formula com 95% de
confiana temos:
( )
n
f f
z f


1
2
o
6,4 37,9
ou 064 , 0 379 , 0
58
621 , 0 379 , 0
96 , 1 379 , 0


Intervalo de confiana
Para o Risco Relativo



onde , em uma tabela 2x2.

Deseja-se saber a associao do pr-natal com os bitos
perinatais. Para tanto, acompanhou-se uma coorte de 5.294
mulheres durante o perodo gestacional e verificou-se a
freqncia de pelo menos uma consulta no ambulatrio de pr-
natal.
2
2
1
_
o
z
RR

( )
( ) ( ) ( ) ( ) c a d b c d b a
b c d a n
+ + + +

=
2
2
_
Intervalo de confiana
Os resultados deste acompanhamento foram:






RR = 1,49
X
2
= 3,71 (p-valor de 0,0541)
IC(95%) = 0,99 a 2,23

Ausncia de
Pr-Natal
Morte Perinatal
Sim No Total
Sim 58 2.625 2.683
No 38 2.573 2.611
Total 96 5.198 5.294
Intervalo de confiana
Para o Odds Ratio



Exemplo:
OR = 1,50
IC(95%) = 0,97 a 2,31
d c b a
z OR
e
1 1 1 1
) ln(
2 /
+ + +
o
Exemplo RR e OR
Corioamnionite Sepse precoce
+ - Total
+ 28 42 70
- 3 48 51
Total 31 90 121
RR = 6,80 OR = 10,67
IC
RR
(95%) = 2,12 a 21,15 IC
OR
(95%) = 2,80 a 47,63
X
2
= 18,02 (p-valor < 0,001)
Teste de Hiptese
Fundamentao terica
Hipteses
Erros tipo I e II
Nvel de significncia
Estatstica de teste
Deciso (p-valor)
Comparao de dois grupos
Teste t (paramtrico)
Teste de Wilcoxon (no paramtrico)
Teste de Hiptese
Objetivo: auxilia a tomada de decises em situaes de
incerteza com base em dados amostrais.
Numa situao de incerteza a deciso, mesmo que o teste seja
realizado de forma correta, existe uma probabilidade de erro.
No rejeita-se a hiptese e toma-se a deciso correta;
No rejeita-se a hiptese e toma-se a deciso incorreta;
Rejeita-se a hiptese e toma-se a deciso correta;
Rejeita-se a hiptese e toma-se a deciso incorreta;
Teste de hiptese
Deciso
Hiptese Rejeitar a hiptese No rejeitar a hiptese
Correta Errada
(erro tipo I)

Correta
Falsa

Correta
Errada
(erro tipo II)
Erro tipo I: probabilidade de se obter uma estimativa que no
represente adequadamente o parmetro de interesse.
Erro tipo II: probabilidade de se obter uma estimativa incorreta do
parmetro de interesse. Poder = 1 erro tipo II.
Teste de Hiptese
Um teste de hiptese consiste na definio:
Das hipteses a serem avaliadas.
Da estatstica teste apropriada.
Do nvel de significncia do teste.
Da regra de rejeio.
Hiptese estatstica
Definio: trata-se de uma suposio que pode ser verificada
por meio de um teste estatstico.
Essa suposio expressa da seguinte forma:
Hiptese nula (H
0
): no existe evidncia nos dados
amostrais em favor de diferenas estatisticamente
significantes.
Hiptese alternativa (H
1
ou H
a
): existe evidncia nos dados
amostrais em favor da diferena estatisticamente
significante.
Hiptese estatstica
H
0
verifica se a estimativa obtida a partir dos dados amostrais
:
igual a um valor pr-estabelecido.
> ou s que um valor pr-estabelecido.
H
1
pode ser:
Unilateral: a hiptese alternativa definida em direo
oposta quela especificada na hiptese nula.
Bilateral: a hiptese alternativa definida como a diferena,
contrapondo a igualdade estabelecida na hiptese nula.
Estatstica de teste
Definio: o valor que permitir confirmar ou no a suposio
a partir dos dados amostrais
Os testes estatsticos so definidos de acordo com:
a distribuio de probabilidade da varivel de interesse;
o nmero de comparaes que se deseja realizar;
a independncia/dependncia entre os grupos.
Estatstica de teste
Tipos de testes:
Paramtricos: Assumem que as estimativas obtidas a partir
das amostras se distribuem de acordo com alguma
distribuio de probabilidade conhecida. Testes robustos e
geralmente preferidos.
z, t, ANOVA, correlao de Pearson.
No-paramtricos: Utilizados quando as premissas dos
testes paramtricos no podem ser satisfeitas.
Mann-Witney, Wilcoxon, Qui-quadrado (_
2
), Kruskal-
Wallis, correlao de Spearman.
Nvel de Significncia
Define os limites de rejeio da estatstica de teste.
Representa a probabilidade de rejeitar uma hiptese nula dada
que est correta (erro tipo I).
A escolha do valor realizada de forma arbitrria.
Geralmente, empregam-se valores variando de 1 a 10%.
Regra de deciso
Consiste em comparar a estatstica de teste com os limites de
rejeio.
Pode ser realizado de duas formas:
Comparao da estatstica de teste com o valor crtico,
obtido a partir de uma distribuio de probabilidade
(geralmente, funo do tamanho amostral, nvel de
significncia, teste uni ou bi-lateral).
Comparao do nvel de significncia com o p-valor. Este
representa a probabilidade da evidncia dos dados
amostrais ser consistente com H
0
.
Regra de deciso
Deciso baseada na comparao da estatstica de teste com o valor crtico
M

d
u
l
o

d
a


e
s
t
a
t

s
t
i
c
a

d
e

t
e
s
t
e

Menor que o valor crtico No rejeita a hiptese nula
Maior ou igual ao valor
crtico
Rejeita a hiptese nula
Deciso baseada na comparao do nvel de significncia com o p-valor
P-valor
Menor que o nvel de
significncia
Rejeita a hiptese nula
Maior ou igual ao valor
nvel de significncia
No rejeita a hiptese nula
Comparao de dois grupos
Paramtrico
Teste t Pareado
Teste t Independente
No paramtrico
Teste de Wilcoxon Pareado
Teste de Wilcoxon Independente (Mann-Whitney)
Testes Paramtricos
Vantagens dos mtodos paramtricos:
Permitem a extrapolao dos resultados observados nos dados
amostrais para a populao geral.
Apresentam um grau maior de preciso;
Comparao realizada diretamente no parmetro de interesse (mdia,
desvio padro etc).
Desvantagens dos mtodos paramtricos :
Exige que a amostra tenha um determinado padro de distribuio de
probabilidade.
Problemas nos dados (valores extremos, missing, heterogeneidade,
mltiplas modas, assimetria etc) prejudicam a precisam o teste.
Testes no Paramtricos
Vantagens dos mtodos no paramtricos:
No exigem normalidade;
Aplicveis dados categricos;
Clculos mais simples.
Desvantagens dos mtodos no paramtricos :
Desperdiam informao dados numricos reduzidos a uma forma
qualitativa;
Menos eficientes evidncia mais forte para rejeitar a hiptese nula
pode ser compensado com o aumento do tamanho amostral.
Comparao baseada na distribuio dos dados amostrais.
Testes No Paramtricos
Testes no paramtricos comparam-se os postos ou ranks
que cada observao recebe aps a sua ordenao.
Posto: um nmero atribudo a um item amostral individual de
acordo com sua posio na lista ordenada.
Exemplo

5 3 40 10 12 Valores originais
3 5 10 12 40 Valores ordenados
| | | | |
1 2 3 4 5 Postos
Testes No Paramtricos
Empates em postos: achar a mdia dos postos envolvidos e
atribuir esse posto mdio a cada um dos itens empatados.
Exemplo:


2 e 3 esto empatados usaremos (2+3)/2 = 2,5 para as duas
posies
3 5 5 10 12
| | | | |
1 2,5 2,5 4 5
Comparao de dois grupos
Teste t
Usa o valor mdio para realizar a comparao entre dois
grupos. Hipteses:
H
0
: As duas amostras apresentam valores mdios iguais .
H
1
: As duas amostras apresentam valores mdios
diferentes, maiores ou menores.

Comparao de dois grupos
Teste t
Existem dois tipos de desenhos experimentais: independentes
e pareados.
Independentes: valores amostrais de uma populao no esto
relacionados com os valores amostrais da outra populao.
Ex: comparao do peso entre homens e mulheres.
Dependentes ou pareados: os valores de uma amostra esto
relacionados com os valores da outra amostra.
Ex. Comparao do peso do antes e depois de uma dieta
em um grupo de homens.
Teste t dados pareados
Premissas:
As duas sries de dados foram amostradas de populaes
normalmente distribudas.
As populaes de onde os dados foram retirados tm
varincias similares.
A mdia e o desvio padro so boas estimativas da
tendncia central e da disperso desses conjuntos.
O nmero de observaes deve ser igual para os dois
grupos.
Teste t dados pareados
A anlise realizada empregando a estatstica teste dada por:
n S
d
t
d
=
amostra da ho taman
a relacionad amostra 2 a e 1 a entre diferena da padro desvio
a relacionad amostra 2 a e 1 a entre diferena da mdia
onde
n
s
d
d
Teste t dados pareado
Exemplo: Avaliar o crescimento de RN de baixo peso por meio
da variao do peso. Foram analisados dados de peso de
nascimento e menor peso de 707 RN da RBPN.
Hipteses:
H
0
: O peso de nascimento dos RN igual ao menor peso,
isto , no h perda de peso aps o nascimento.
H
1
: O peso de nascimento diferente do menor peso, isto ,
h perda de peso aps o nascimento.
Teste t dados pareado
Exemplo - resultado
Teste-t: duas amostras em par para mdias
Menor peso Peso nasc
Mdia 987,5 1090,0
Varincia 88778,4 95022,2
Observaes 707 707
Correlao de Pearson 0,96
Hiptese da dif de mdia 0
gl 706
Stat t -30,55
P(T<=t) uni-caudal 0,0000
t crtico uni-caudal 1,65
P(T<=t) bi-caudal 0,0000
t crtico bi-caudal 1,96
Teste t dados pareado
Exemplo - Deciso
Como p < o rejeito H
0

OU
Como t
calculado
> t
crtico
rejeito H
0

Logo, h evidncia nos dados amostrais em favor da perda
de peso aps o nascimento.

Teste t dados independentes
Premissas:
As duas sries de dados foram amostradas de populaes
normalmente distribudas.
As populaes de onde os dados foram retirados tm
varincias similares.
A mdia e o desvio padro so boas estimativas da
tendncia central e da disperso desses conjuntos.
O nmero de observaes no precisa ser necessariamente
igual para os dois grupos.
Teste t dados independentes
Dado por:

2
2
2
1
2
1
2 1
n
s
n
s
x x
t
+

=
amostras das s tamanho e
amostras das ias varinc e
amostras das mdias e
onde
2 1
2
2
2
1
2 1
n n
s s
x x
Teste t dados independentes
Exemplo: Avaliar a associao entre o gnero e o menor peso
em RN de baixo peso. Foram analisados dados de menor peso
de 347 meninos e de 360 meninas do banco de dados da
RBPN.
Hipteses:
H
0
: O menor peso dos meninos igual ao menor peso das
meninas, isto , no h associao entre o menor peso e o
gnero.
H
1
: O menor peso de meninos diferente do menor peso de
meninas, isto , h indcios de associao do gnero no
menor peso.
Teste t dados independentes
Exemplo resultados:
Teste-t: duas amostras presumindo varincias diferentes
MP meninos MP meninas
Mdia 1015,7 960,4
Varincia 87410,6 88841,6
Observaes 347 360
Hiptese da dif de mdia 0
gl 704
Stat t 2,47
P(T<=t) uni-caudal 0,0068
t crtico uni-caudal 1,65
P(T<=t) bi-caudal 0,0136
t crtico bi-caudal 1,96
Teste t dados independentes
Exemplo - Deciso
Como p < o rejeito H
0

OU
Como t
calculado
> t
crtico
rejeito H
0

Logo, h evidncia nos dados amostrais diferena no menor
peso entre meninos e meninas. Observa-se da tabela que a
mdia de menor peso dos meninos maior que a das meninas.

Teste de Wilcoxon
Premissas do teste t no satisfeitas.
Teste de Wilcoxon para pares combinados anlogo ao
teste t para dados pareados.
Teste de Wilcoxon para duas amostras independentes
anlogo ao teste t para dados independentes.
Teste de Wilcoxon
dados pareados
Usa os postos de dados amostrais compostos de pares
combinados. Usado para testar diferenas nas distribuies
populacionais. Hipteses:
H
0
: As duas amostras provm de populaes com a mesma
distribuio.
H
1
: As duas amostras provm de populaes com
distribuies diferentes.

Teste de Wilcoxon
dados pareados
Exemplo: Avaliar a recuperao do RN, segundo o ndice de
Apgar. Foram analisados dados de APGAR aos 5 minutos e a 1
minuto de nascimento de 707 RN da RBPN.
Hipteses:
H
0
: O Apgar dos RN a 1 minuto do nascimento possui
mesma distribuio do Apgar aos 5 minutos de nascimento.
H
1
: O Apgar dos RN a 1 minuto do nascimento no possui
mesma distribuio do Apgar aos 5 minutos de nascimento.
Teste de Wilcoxon
dados pareados
Exemplo: no SPSS
Ranks
1
a
239,50 239,50
590
b
296,10 174696,50
35
c
626
Negati ve Ranks
Posi ti ve Ranks
Ti es
Total
apgar5mi n - Apgar1mi n
N Mean Rank Sum of Ranks
apgar5mi n < Apgar1mi n
a.
apgar5mi n > Apgar1mi n
b.
apgar5mi n = Apgar1mi n
c.
Test Statistics
b
-21,122
a
,000
Z
Asymp. Si g. (2-tai l ed)
apgar5min -
Apgar1mi n
Based on negati ve ranks.
a.
Wi l coxon Signed Ranks Test
b.
Deciso
Como p < o rejeito H
0
Teste de Wilcoxon
dados independentes
Usa os postos amostrais de duas populaes independentes.
Equivalente ao teste de Mann-Whitney.
Hipteses:
H
0
: As duas amostras apresentam distribuies
semelhantes
H
1
: As duas amostras apresentam distribuies diferentes.
Teste de Wilcoxon
dados independentes
Exemplo: Avaliar a associao entre o gnero e o Apgar em RN
de baixo peso. Foram analisados dados de menor peso de 316
meninos e de 316 meninas do banco de dados da RBPN.
Hipteses:
H
0
: A distribuio do Apgar a 1 minutos de nascimento
igual para meninos e meninas.
H
1
: A distribuio do Apgar a 1 minutos de nascimento
diferente para meninos e meninas.
Teste de Wilcoxon
dados independentes
Exemplo:



Ranks
313 312,35 97765,00
313 314,65 98486,00
626
sexorn
1
2
Total
apgar5mi n
N Mean Rank Sum of Ranks
Test Statistics
a
48624,000
97765,000
-,163
,870
Mann-Whitney U
Wil coxon W
Z
Asymp. Si g. (2-tai l ed)
apgar5mi n
Groupi ng Variabl e: sexorn
a.
Deciso
Como p > o no rejeito H
0
Comparao de trs
ou mais grupos
Anlise de varincia - ANOVA (paramtrico)
Fundamentao terica
Um fator
Dois fatores
Testes post hoc
Teste de Kruskal Wallis (no paramtrico)
ANOVA
Comparao entre vrios grupos
ANOVA: os grupos de mdias diferem entre si?
Tipo de dado
Varivel independente (explanatria) nvel nominal (fator)
Varivel dependente (resposta) contnua
ANOVA
ANOVA 1 critrio somente um fator com duas ou mais
categorias.
Exemplo: Comparao dos Pesos de RN segundo a Faixa
de IMC (baixo peso, normal, sobrepeso, obesidade) da me.
Associa-se em cada faixa de IMC os pesos dos RN das
mes classificadas naquelas respectivas faixas.
ANOVA
ANOVA 2 critrios dois fatores com duas ou mais
categorias.
Exemplo: Comparao dos Pesos de RN segundo a Faixa
de IMC (baixo peso, normal, sobrepeso, obesidade) e faixa
etria (s15, 16 19, 20 35, > 36) da me.
Associa-se em cada faixa de IMC e de idade os pesos
dos RN das mes classificadas nas respectivas faixas de
IMC e idade.
ANOVA
Premissas:
As duas sries de dados foram amostradas de populaes
normalmente distribudas.
A mdia e o desvio padro so boas estimativas da
tendncia central e da disperso desses conjuntos.
O nmero de observaes no precisa ser necessariamente
igual para os dois grupos.
ANOVA
Hipteses:
H
0
:
1
=
2
=
3
H
1
: pelo menos uma das mdias diferente
Se H
0
rejeitada existe no mnimo um par de mdias
diferentes.
Como determinar qual(is) o(s) par(es) de mdias diferentes?
Realizao do teste post hoc (teste no-planejado ou teste a
posteriori).
ANOVA
Fonte de variao
Entre grupos diferena entre os tratamentos
Dentro dos grupos erro amostral
Variao total = entre grupos + dentro dos grupos
Deciso
Rejeio de H
0
F calculada > F tabelada OU valor p s o
Se H
0
for verdadeira F prxima de 1
Se H
0
for falsa F >> 1 (numerador estima a diferena entre
os grupos)
ANOVA
Tabela da ANOVA
Fonte Soma dos
quadrados
GL Mdia dos quadrados
(varincias)
F
calculada
Valor
crtico
P-valor
Entre
grupos
SQE c - 1
Dentro
dos
grupos
SQD n - c
Total

SQT n - 1
1
=
c
SQE
MQE
c n
SQD
MQD

=
MQD
MQE
F =
O
b
t
i
d
a

n
a

t
a
b
e
l
a


d
a

d
i
s
t
r
i
b
u
i

o

F

O
b
t
i
d
a

n
a

t
a
b
e
l
a


d
a

d
i
s
t
r
i
b
u
i

o

F

ANOVA
Deciso
Se F
calculada
> F tabelada OU valor - p s o Rejeio de H
0

Se F
calculada
prxima de 1 OU valor - p > o no rejeio H
0
Teste Post Hoc
Provas mais conhecidas:
Teste de Scheff, teste de Bonferroni, teste de Tuckey, teste
de Newman-Keuls, teste de Duncan e teste de Dunn.
Comparaes a priori: teste t.
Teste Post Hoc
Teste de Tukey (HSD)
Variao do teste t para dados independentes.
Usado para comparar grupos de igual tamanho.
Pode ser executado mesmo que o F da ANOVA no
significativo.
O valor crtico no o t e sim o studentized range statistic (q).

N
s
q HSD
2
=
onde
s
2
MQD
n tamanho dos grupos
Teste Post Hoc
O teste de Tukey calcula as diferenas crticas entre os pares
de mdias dos tratamentos.
O valor de q consultado em uma tabela especfica.
GL = mdia dos quadrados do erro e k = nmero de grupos
no experimento.
Se a diferena absoluta entre as mdia dos grupos (par) que
esto sendo comparados > HSD rejeitamos H
0
.
Teste Post Hoc
O teste de Bonferroni calcula as diferenas crticas entre os
pares de mdias dos tratamentos.
O nvel de significncia ajustado ao nmero de comparaes
realizadas.

s comparae de nmero
escolhido
ajustado
o
o =
Teste Post Hoc
Exemplo: Supondo que se deseja trabalhar com um nvel de
significncia de 5% e sero realizadas 4 comparaes:


Situao 1: suponha que o p-valor obtido na ANOVA foi de
0,0027 a deciso ser pela rejeio da H
0
;
Situao 2: suponha que o p-valor obtido na ANOVA foi de
0,045 a deciso ser pela no rejeio da H
0
;
0125 , 0
4
05 , 0
= =
ajustado
o
ANOVA
Exemplo: Deseja-se verificar associao entre idade
gestacional no momento do nascimento e diferentes
classificaes de SNAPPE*.
Hipteses:
H
0
: As mdias da varivel idade gestacional so iguais entre
as diferentes classificaes de SNAPPE.
H
1
: As mdias varivel idade gestacional so diferentes
entre as diferentes classificaes de SNAPPE.
*Onde: SNAPPE: 0 = 1; 1 a 44 = 2; 45 a 96 = 3; 97 a 125 = 4 e 126 a 162 = 5 -
Classificao usada na RBPN



ANOVA
Exemplo:






ANOVA
i dadegesta
1123,428 4 280,857 48,084 ,000
3533,746 605 5,841
4657,174 609
Between Groups
Withi n Groups
Total
Sum of
Squares df Mean Square F Si g.
ANOVA
Deciso
valor - p s o Rejeio de H
0
, logo, as mdias das idades
gestacionais classificadas segundo o SNAPPE so diferentes.
Para identificar quais pares so diferentes necessrio realizar
um teste estatstico conhecido como post hoc.
O teste de Bonferroni, por exemplo, permite identificar
diferenas entre pares de mdias em uma ANOVA.




ANOVA
Aplicando o Bonferroni,
observa-se que os grupos 1
e 2 so diferente de todos os
demais. No h diferena
estatisticamente significativa
entre os grupos 3, 4 e 5.
ANOVA
ANOVA 2 fatores
Procedimento anlogo ao empregado com um fator.
No realizar duas anlise de varincia separadas
estaramos ignorando o efeito de uma interao entre os
fatores.
Interao: efeito de um dos fatores muda para diferentes
categorias do outro fator.
Clculos considerando igual nmero de repeties em cada
clula.
ANOVA
ANOVA 2 fatores - so realizados 3 testes:
1) Para testar a hiptese de nenhuma diferena devido ao fator A
2) Para testar a hiptese de nenhuma diferena devido ao fator B
3) Para testar a hiptese de nenhuma interao entre os fatores
A e B (H
0
: a interao entre A e B igual a zero).
ANOVA
Exemplo: Deseja-se verificar para as mes que fizeram ou no
pr-natal a associao entre idade gestacional no momento do
nascimento e diferentes classificaes de SNAPPE*.
ANOVA
Tests of Between-Subj ects Effects
Dependent Vari abl e: i dadegesta
1138,772
a
7 162,682 27,738 ,000
36889,214 1 36889,214 6289,678 ,000
10,042 1 10,042 1,712 ,191
442,010 4 110,503 18,841 ,000
21,603 2 10,801 1,842 ,159
3495,564 596 5,865
555277,000 604
4634,336 603
Source
Corrected Model
Intercept
prenatal
snapee_class
prenatal * snapee_cl ass
Error
Total
Corrected Total
Type III Sum
of Squares df Mean Square F Si g.
R Squared = ,246 (Adjusted R Squared = ,237)
a.
ANOVA
Deciso
Varivel pr-natal: valor - p > o No rejeio de H
0
,
logo, as mdias das idades gestacionais classificadas
segundo a realizao de pr-natal no so diferentes.
Varivel SNAPPE: valor - p s o Rejeio de H
0
, logo, as
mdias das idades gestacionais classificadas segundo o
SNAPPE so diferentes.
Interao entre pr-natal e SNAPPE: a realizao do pr-
natal e a alterao do SNAPPE no interferem na idade
gestacional de nascimento.
Teste de Kruskal-Wallis
Usado para testar a hiptese nula de que trs ou mais amostras
independentes provm de populaes idnticas.
Hipteses:
H
0
: As amostras provm de populaes com a mesma
distribuio.
H
1
: As amostras provm de populaes com distribuies
diferentes.
Teste de Kruskal-Wallis
Suposies:
As amostras so independentes e foram selecionadas
aleatoriamente.
Cada amostra contm pelo menos 5 observaes (caso
contrrio consultar tabelas especiais de valores crticos).
Estatstica de teste H aproximada pela distribuio qui-
quadrado (desde que cada amostra tenha, no mnimo, cinco
observaes).
Teste de Kruskal-Wallis
Exemplo: Deseja-se verificar diferenas na distribuio de peso
e classificao de SNAPPE. O peso encontra-se classificado
em 5 faixas que so: > 750, De 750 a 999, De 100 a 1249, De
1250 a 1500.
Hipteses:
H
0
: As amostras provm de populaes com a mesma
distribuio.
H
1
: As amostras provm de populaes com distribuies
diferentes.
Teste de Kruskal-Wallis
Exemplo:




Deciso
valor - p s o Rejeio de H
0
, logo, a distribuio das faixas
de peso diferente para as categorias de SNAPPE. Para
identificar quais os pares diferentes necessrio realizar um
teste post hoc (Teste de Wilcoxon ou Teste de Mann-Whitney).
Test Statistics
a,b
205,931
4
,000
Chi-Square
df
Asymp. Si g.
pesonasc_
cl ass
Kruskal Wal l i s Test
a.
Groupi ng Variabl e: snapee_class
b.
114 635 500 745
157 875 750 995
171 1124 1000 1245
202 1383 1250 1500
pesonasc 2
pesonasc 3
pesonasc 4
pesonasc 5
pesonasc_cl ass
Count Mean Mini mum Maximum
Teste de Kruskal-Wallis
Exemplo: Verificou-se por meio do teste de Mann-Whitney que
h diferena estatisticamente significativa entre os grupos (de
faixa de peso) 1 e 2 e os demais grupos. No h diferena
entre os grupos 3, 4. Abaixo apresentado somente o
resultado da comparao entre os grupos 1 e 2.
Test Statistics
a
1,000
11,000
-3,919
,000
Mann-Whitney U
Wil coxon W
Z
Asymp. Si g. (2-tai l ed)
pesonasc_
cl ass
Groupi ng Variabl e: snapee_class
a.
Teste do Qui-quadrado (_
2
)
Verifica associao entre variveis qualitativas.
Hipteses:
H
0
: Eventuais diferenas nas freqncias de ocorrncia das
variveis observadas so devidas ao acaso.
H
1
: Eventuais diferenas nas freqncias de ocorrncia das
variveis observadas so devidas a associao existente.
Teste do Qui-quadrado (_
2
)
Os dados so dispostos em uma tabela de contingncia com r
linhas (correspondentes s categorias em que subdividida a
primeira varivel) e s colunas (correspondentes s categorias
em que subdividida a segunda varivel).
As freqncias observadas so comparadas com as
freqncias esperadas no caso de no associao entre linhas
e colunas.
Teste do Qui-quadrado (_
2
)
As freqncias esperadas so calculadas usando:



A estatstica de teste dada por:


Caso a freqncia esperada em pelo menos uma das clulas
for menor do que 5 usa-se o Teste Exato de Fisher.
geral total
coluna da x total linha da total
= E
( )

=
k
1 i
i
2
i i
2
E
E O

Teste do Qui-quadrado (_
2
)
Deciso:
Se _
2
calculada
> _
2

tabelada
OU valor - p s o Rejeio de H
0
,
isto , as variveis so associadas.
Se _
2
calculada
prxima de 1 OU valor - p > o No rejeio
H
0
, isto , as variveis so independentes.
Os graus de liberdade necessrios para a obteno do valor
tabelado de _
2
so dados por (r-1)x(s-1).

Teste do Qui-quadrado (_
2
)
Exemplo: Deseja-se verificar existncia de associao entre a
hipertenso materna e ocorrncia de pneumonia congnita em
RN de baixo peso. Para tanto, foram empregados dados da
RBPN. Na tabela abaixo so observados os valores observados
para o cruzamento dessas duas informaes (hipertenso x
pneumonia), com os respectivos percentuais.
Crosstab
280 51 331
84,6% 15,4% 100,0%
223 17 240
92,9% 7,1% 100,0%
503 68 571
88,1% 11,9% 100,0%
Count
% within hipertensao
Count
% within hipertensao
Count
% within hipertensao
0
1
hipertensao
Total
0 1
pneumoniacongenita
Total
Teste do Qui-quadrado (_
2
)
Hipteses:
H
0
: no existe associao entre hipertenso materna e pneumonia
congnita.
H
1
: existe evidencia de associao entre hipertenso materna e
pneumonia congnita.








Deciso: valor - p s o Rejeio de H
0
Chi-Square Tests
9,190
b
1 ,002
8,414 1 ,004
9,699 1 ,002
,002 ,002
9,174 1 ,002
571
Pearson Chi-Square
Continuity Correction
a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only f or a 2x2 table
a.
0 cells (,0%) have expected count less than 5. The minimum expected count is
28,58.
b.
Teste do Qui-quadrado (_
2
)
Clculo do risco relativo:







Interpretao: A hipertenso arterial reduz em 58,1% a chance
do beb desenvolver pneumonia congnita.
Risk Estimate
,419 ,235 ,745
,910 ,859 ,965
2,175 1,289 3,670
571
Odds Rati o for
hi pertensao (0 / 1)
For cohort
pneumoniacongeni ta = 0
For cohort
pneumoniacongeni ta = 1
N of Val id Cases
Value Lower Upper
95% Confi dence
Interval
Teste Exato de Fisher
Exemplo: Deseja-se verificar associao entre a presena de
corioamnionite e a ocorrncia de sepse precoce em RN de
baixo peso.




Observe que uma das clulas da tabela de contingncia possui
freqncia menor que 5, logo devemos empregar o teste exato
de Fisher.
Crosstab
28 42 70
40,0% 60,0% 100,0%
3 48 51
5,9% 94,1% 100,0%
31 90 121
25,6% 74,4% 100,0%
Count
% within corioamn
Count
% within corioamn
Count
% within corioamn
0
1
corioamn
Total
0 1
sepseprecoce
Total
Teste Exato de Fisher
Hipteses:
H
0
: As variveis presena de corioamnionite e a ocorrncia de sepse
precoce so independentes.
H
1
: As variveis presena de corioamnionite e a ocorrncia de sepse
precoce no so independentes.







Deciso: valor - p s o Rejeio de H
0
Chi-Square Tests
18,022
b
1 ,000
16,276 1 ,000
20,667 1 ,000
,000 ,000
17,873 1 ,000
121
Pearson Chi-Square
Continuity Correction
a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only f or a 2x2 table
a.
0 cells (,0%) have expected count less than 5. The minimum expected count is
13,07.
b.
Teste Exato de Fisher
Clculo do risco relativo







Interpretao: O surgimento da corioamnionite aumenta o risco
de sepse prece em 10,7 vezes.
Risk Estimate
10,667 3,024 37,628
6,800 2,186 21,149
,638 ,520 ,781
121
Odds Ratio f or
corioamn (0 / 1)
For cohort
sepseprecoce = 0
For cohort
sepseprecoce = 1
N of Valid Cases
Value Lower Upper
95% Conf idence
Interval

Potrebbero piacerti anche