Sei sulla pagina 1di 12

Regresso Logstica

Propriedades
Geralmente a grande questo a ser respondida nos estudos epidemiolgicos saber
qual a relao entre uma ou mais variveis que refletem a exposio e a doena
(efeito). Ou sea! desea"se saber qual a probabilidade de ocorr#ncia da doena!
con$ecendo"se como se d a exposio. % probabilidade da doena varia entre & e '.
(ara uma dada pessoa! ) a doena real um evento dicot*mico! que pode ser entendido
como ' quando a doena ocorre e & quando esta no ocorre.
+e deseamos saber se o fumo materno est associado , ocorr#ncia de baixo peso ao
nascer! geralmente deseamos controlar o efeito de outras variveis de
confundimento.
-o modelo log.stico! usamos os valores de uma srie de variveis independentes para
predi/er a ocorr#ncia da doena (varivel dependente). %ssim! todas as variveis
consideradas no modelo esto controladas entre si. 0omo usamos uma srie de
variveis independentes! trata"se de um problema multivarivel (no confundir como
multivariado! termo usado quando se leva em conta uma srie de variveis dependentes
(resposta) no modelo ao mesmo tempo e empregado geralmente fora do contexto
estat.stico na literatura biomdica). % medida de associao calculada a partir do
modelo log.stico o odds ratio. Os odds ratio austados so obtidos atravs da
comparao de indiv.duos que diferem apenas na caracter.stica de interesse e que
ten$am os valores das outras variveis constantes. O auste apenas estat.stico.
% funo log.stica perfeitamente aplicvel aos problemas epidemiolgicos porque
uma funo que varia tambm entre & e '. 1 um funo em forma de + alongado. +eu
modelo calcula a probabilidade do efeito pela seguinte frmula2
Os termos e
i
neste modelo representam par3metros descon$ecidos que sero
estimados com base nos dados amostrais obtidos pelo mtodo da mxima
verossimil$ana (maximi/a a probabilidade de obter o grupo observado de dados).
%travs do modelo estimamos
%ssim! sabendo os par3metros e
i
e con$ecendo os valores das variveis
independentes para um indiv.duo! podemos aplicar a frmula acima para calcular a
probabilidade de que este indiv.duo desenvolva a doena 4 ( (5).
-o exemplo abaixo est calculada a regresso log.stica tendo como varivel
dependente o baixo peso ao nascer e como variveis dependentes fumo materno (&!') 4
1
P X
e
i i
X
( )
( )
=
+
+
1
1

smo6e " e n7mero de consultas pr"natais no primeiro trimestre de gravide/ (de ' a 8)
" ftv.
logit lo9 ftv smo6e
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-114.58313
Iteration 2: Log Likelihood =-114.57008
Iteration 3: Log Likelihood =-114.57008

Logit Estimates !m"er o# o"s = 18$
%hi2&2' = 5.53
(ro" ) %hi2 = 0.062$
Log Likelihood = -114.57008 (se!do *2 = 0.0236

------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
smoke , .6977775 .3203178 2.178 0.02$ .06$$66 1.32558$
#t2 , -.1246574 .1554117 -0.802 0.422 -.42$2588 .17$$44
5%ons , -.9888444 .245176 -4.033 0.000 -1.46$38 -.5083083
------------------------------------------------------------------------------
-o exemplo! a funo log.stica expressa a seguinte probabilidade2
%s estimativas obtidas so :"&.;<<<===!
'
: &.8;>>>>? e
@
: "&.'@=8?>=. Aesse
modo! para uma me fumante (')! que reali/ou B consultas pr"natais no primeiro
trimestre de gravide/! a probabilidade de ter um fil$o com baixo peso ao nascer!
estimada por este modelo B=C2
((5) : ' D ' E e
4("&.888)
: ' D ' E '.;=8
((5): &.BB;: B=C
Fma das grandes vantagens da regresso log.stica que cada coeficiente estimado
fornece uma estimativa do logaritmo natural (ln) do odds ratio austado para todas as
variveis do modelo! permitindo a estimao direta do odds ratio atravs da
exponenciao do coeficiente
'2
OR= e

1
-o caso da varivel fumo materno! smo6e! o coeficiente
'
estimado pela regresso
log.stica foi de &.8;<. Gxponenciando"se este coeficiente obtm"se @.&'&! que
representa uma estimativa austado do odds ratio para fumo materno! controlando"se
pelo n7mero de consultas de pr"natal.
% funo exponencial uma funo contrria ao logaritmo natural. %ssim! extraindo"se
o logaritmo natural do odds ratio obtm"se o coeficiente
'.
O intervalo de confiana de ;? para o OH calculado de forma anloga2
2
P X
e
smoke ftv
( )
( )
=
+
+ +
1
1
1 2

) 3 )( 125 . 0 ( ) 1 ( 698 . 0 989 . 0 (
1
1
) (
+ +
+
=
e
X P
IC 95% (OR)= e
[
1
1.96 x erro padro(
1
)
I0 ;?C (OH): e
J &.8;< '.;8 x &.B@& K
I0 ;?C (OH): e
J &.8;< '.;8 x &.B@& K
I0 ;?C (OH): e
J &.8;< &.8@> K
Limite inferior do I0 ;?C (OH): e
&.&>'
: '.&>=
Limite superior do I0 ;?C (OH): e
'.B@?
: B.>8
M dois comandos para reali/ao da regresso log.stica no +tata2 !ogit para se obter
os coeficientes do modelo ( e
i
) e !ogistic para se obter os odds ratio.
Namos analisar o banco de dados LOP (fatores de risco para o baixo peso ao nascer
em Qassac$usetts! ';<8). Observe as variveis deste arquivo2
id n7mero de identificao do paciente
!o" baixo peso ao nascer &:no ':sim
age idade materna em anos completos ('="=?)
!"t peso no in.cio da gravide/ em libras (<&"@?&)
race raa ':branco @:negro B:outra
s#o$e fumo materno &:no ':sim
pt! n7mero de partos prematuros anteriores (&"B)
%t $ipertenso materna &:no ':sim
&i irritabilidade uterina &:no ':sim
't( n7mero de consultas no pr"natal no primeiro trimestre da gravide/ (&"8)
)"t peso ao nascer em gramas (>&;"=;;&)
% varivel resposta lo9. Namos rodar um modelo de regresso log.stica simples! com
apenas ' fator de risco. Namos utili/ar a varivel categrica dicot*mica fumo materno
(smo6e).
*ari+(e! dicot,#ica
!ogit !o" s#o$e
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood = -114.$123
Iteration 2: Log Likelihood = -114.$023
Logit Estimates !m"er o# o"s = 18$
%hi2&1' = 4.87
(ro" ) %hi2 = 0.0274
Log Likelihood = -114.$023 (se!do *2 = 0.0207
------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
smoke , .7040592 .31$6386 2.203 0.028 .07757$1 1.33053$
5%ons , -1.087051 .21472$$ -5.062 0.000 -1.507$14 -.6661886
------------------------------------------------------------------------------
3
!ogistic !o" s#o$e
Logit Estimates !m"er o# o"s = 18$
%hi2&1' = 4.87
(ro" ) %hi2 = 0.0274
Log Likelihood = -114.$023 (se!do *2 = 0.0207
------------------------------------------------------------------------------
lo+ , 6dds *atio .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
smoke , 2.021$44 .6462$12 2.203 0.028 1.080668 3.783083
------------------------------------------------------------------------------
O coeficiente

1
= 0.7040592 para smo6e! assim2
OR= e
0.7040592
= -..-
0omo se pode observar acima o fumo materno um fator de risco para o baixo peso ao
nascer nesta populao.
*ari+(e! co/t/&a
Namos reali/ar os mesmo procedimentos para a varivel age! quantitativa cont.nua.
!ogit !o" age
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-115.$625$
Iteration 2: Log Likelihood =-115.$55$8
Iteration 3: Log Likelihood =-115.95598
Logit Estimates !m"er o# o"s = 18$
%hi2&1' = 2.76
(ro" ) %hi2 = 0.0966
Log Likelihood = -115.$55$8 (se!do *2 = 0.0118
------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
age , -.051152$ .0315138 -1.623 0.105 -.112$188 .010612$
5%ons , .384581$ .7321251 0.525 0.5$$ -1.050357 1.81$521
------------------------------------------------------------------------------
!ogistic !o" age
Logit Estimates !m"er o# o"s = 18$
%hi2&1' = 2.76
(ro" ) %hi2 = 0.0$66
Log Likelihood = -115.$55$8 (se!do *2 = 0.0118
------------------------------------------------------------------------------
lo+ , 6dds *atio .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
age , .$501333 .02$$423 -1.623 0.105 .8$32232 1.01066$
------------------------------------------------------------------------------
4
O coeficiente para idade materna 4&.&?'. O odds ratio para cada ano de incremento
na idade &.;?! ou sea! a cada ano de idade materna! $ uma reduo de ?C no risco
de baixo peso ao nascer. Qas como o intervalo de confiana incluiu o '! a idade materna
no um fator de risco para o baixo peso ao nascer nesta populao. Observe que a
idade est modelada como varivel cont.nua. -a log.stica as variveis independentes
podem ser quantitativas ou categricas (& " ').
O odds ratio de uma varivel cont.ua representa uma mdia dos odds nos diversos
n.veis desta varivel. (ode"se tambm calcular o odds ratio para incrementos de idade
maior do que ' ano. (or exemplo! se quisermos calcular o incremento no risco associado
a um aumento de '& anos na idade! tem"se2
OH: e

'
5 '&
: e
4&.&?''?@; x '&
: e
4&!?''?@;
: &.?;;?>><>
O +tata tem um comando para reali/ar este clculo2
disp!a0 exp(1)[age21.)
.?;;?>><>
(ortanto o risco de baixo peso cai quase , metade! a cada incremento de '& anos na
idade materna.
O programa calcula dois testes de $iptese para avaliar a signific3ncia da varivel no
modelo2 o teste de Pald e o teste da ra/o de verossimil$anas. O valor / do teste de
Pald obtido dividindo"se o coeficiente
'
pelo seu erro padro. -o exemplo da idade!
"&.&?''?@;D &.&B'?'B< : "'.8@B! o que d uma probabilidade (valor de p) de &.'&?.
Gste teste segue a distribuio normal. (ortanto! se o valor de / do teste der maior
que '.;8! di/"se que a varivel significante. O segundo teste calculado utili/ando"se
a seguinte frmula2
RHN : " @ Jlog da verossimil$ana do modelo com a constante 4 log da verossimil$ana
do modelo com a varivel (age) K
O modelo sem a constante aquele austado no passo interativo & (iteration &)
RHN: "@ J "''>.BB8 4 ("''?.;??;<)K : -.36
Gste teste segue a distribuio do Sui"quadrado com ' grau de liberdade . (ortanto! se
o seu valor for maior que B!<=! ento p T &.&?. O programa calcula o valor exato de p!
fornecendo &.&;88. O teste da ra/o de verossimil$anas mais acurado do que o
teste de Pald! sendo prefer.vel o seu uso em amostras de taman$o pequeno ou
moderado. (ara grandes amostras as duas estimativas fornecem resultados muito
prximos um do outro.
0omo dito acima! age foi modelada como varivel cont.nua. Fm dos poucos pressupostos
do modelo log.stico que voc# s pode modelar uma varivel como cont.nua se $ouver
evid#ncia de linearidade! ou sea de que para cada incremento na idade materna!
corresponda um decrscimo ou acrscimo na probabilidade de ocorr#ncia do evento! no
caso! de baixo peso ao nascer. 1 necessrio verificar se este pressuposto se aplica no
5
caso da idade. +e se aplicar podemos continuar modelando age como varivel cont.nua.
+e no se aplicar! passaremos a modelar age como uma varivel categrica! a partir de
pontos de corte de significado biolgico ou baseados em quartis. M vrias formas de
testar este pressuposto. -uma delas! se plota em um grfico a idade materna versus a
probabilidade de ocorr#ncia de baixo peso ao nascer predita pelo modelo. Os comando
no +tata so2
predict pro))p/
!a)e! (aria)!e pro))p/ 4Pro)a)i!idade predita de 5P67
grap% pro))p/ age8 co//ect(s)

0omo se pode verificar no grfico acima $ uma tend#ncia linear de decrscimo na
probabilidade de baixo peso ao nascer predita pelo modelo na medida em que aumenta
a idade materna. (ortanto! a idade materna pode ser modelada como uma varivel
quantitativa cont.nua no modelo.
*ari+(e! categ9rica co# #ais de dois /(eis
-o caso da varivel race8 categrica! no podemos fa/er a regresso sem antes
fator"la e transform"la em B variveis dumm) (categrica & 4 ')! conforme esquema
abaixo2
race race' race@ raceB
' 4 branca ' & &
@ 4 negra & ' &
B 4 outra & & '
-o caso! a varivel race' a varivel dumm) para raa branca. Gla assumir o valor '
quando a raa for branca e & nos demais casos. % varivel race@ assumir o valor '
quando a raa for negra e & nos demais casos e a varivel raceB assumir o valor '
6
P
r
o
b
a
b
i
l
i
d
a
d
e

p
r
e
d
i
t
a

d
e

B
P
N
age
14 45
.128163
.417861
quando a raa for outra e & nos demais casos. Observe que para cada categoria da
varivel ser criada uma varivel dumm). O comando 2
ta)&!ate race8 ge/erate(race)
% varivel race' no precisa ser utili/ada! pois a raa branca a categoria basal! que
servir como refer#ncia para as outras categorias. Namos fa/er a regresso log.stica
simples para race@ e raceB.
!ogistic !o" race-
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-116.51366
Iteration 2: Log Likelihood =-116.50$35
Iteration 3: Log Likelihood =-116.50$35

Logit Estimates !m"er o# o"s = 18$
%hi2&1' = 1.65
(ro" ) %hi2 = 0.1985
Log Likelihood = -116.50$35 (se!do *2 = 0.0070

------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
ra%e2 , .5635762 .4325561 1.303 0.1$3 -.2842181 1.41137
5%ons , -.8737311 .17184 -5.085 0.000 -1.210531 -.536$30$
------------------------------------------------------------------------------
!ogistic !o" race:
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-116.45064
Iteration 2: Log Likelihood =-116.44$06

Logit Estimates !m"er o# o"s = 18$
%hi2&1' = 1.77
(ro" ) %hi2 = 0.1829
Log Likelihood = -116.44$06 (se!do *2 = 0.0076

------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
ra%e3 , .4321825 .3233$53 1.336 0.181 -.2016606 1.066026
5%ons , -.$50$763 .201$28$ -4.70$ 0.000 -1.34675 -.5552028
------------------------------------------------------------------------------
O +tata tem um comando para gerar variveis dumm) automaticamente. Nerifique
digitando2
xi; !ogistic !o" i.race
i.ra%e 5Ira%e51-3 &nat!rall7 %oded8 5Ira%e51 omitted'
Logisti% regression !m"er o# o"s = 18$
L* %hi2&2' = 5.01
(ro" ) %hi2 = 0.0817
Log likelihood = -114.83082 (se!do *2 = 0.0214
------------------------------------------------------------------------------
lo+ , 6dds *atio .td. Err. / (),/, 0$51 -on#. Inter2al3
-------------4----------------------------------------------------------------
5Ira%e52 , 2.327536 1.078613 1.82 0.068 .$385073 5.772385
5Ira%e53 , 1.88$234 .6571342 1.83 0.067 .$554577 3.7355$7
------------------------------------------------------------------------------
7
<strat=gias de #ode!age#
>ode!o red&?ido
*ari+(eis #edi/do e'eitos pri/cipais
% meta do modelo redu/ido obter o mel$or modelo austado minimi/ando o n7mero de
variveis inclu.das no modelo! descartando aquelas no significantes! que do
contribuio quase nula para o auste. Uicam apenas as variveis com valor de p menor
que &.&?! a no ser que a varivel sea biologicamente muito importante e ten$a um
valor de p prximo a &.&?.
Sualquer mudana biologicamente importante no coeficiente do fator de risco
estimado! comparando"se modelos com e sem o fator de risco! indica que a covarivel
um fator de confuso e deve permanecer no modelo! mesmo que o seu prprio
coeficiente no sea significante.
Inicia"se o processamento reali/ando o que fi/emos acima! a regresso log.stica
simples para cada varivel independente. +elecionam"se! depois as variveis que
apresentarem um p no teste de $iptese de pelo menos &.@& ou menos. -os dois
exemplos acima! todas as variveis vo entrar no modelo! pois o fumo materno
apresentou um p:&.&@>=! e a idade materna! embora no associada na anlise bruta!
mostrou um p:&.&;88! portanto maior do que &.@&. % raa tambm apresentou nas
suas duas categorias valores de p inferiores a @&C.
Heali/e agora a regresso linear simples para as outras variveis do modelo. Namos
fa/er apenas o procedimento !ogistic.
!ogistic !o" !"t
!ogistic !o" pt!
!ogistic !o" %t
!ogistic !o" &i
!ogistic !o" 't(
Os valores de p para cada varivel constam da tabela abaixo2
Narivel Nalor de p
age &.&;88
smo6e &.&@>=
l9t &.&'=?
ptl &.&&;@
$t &.&==;
ui &.&@=B
ftv &.B>;@
race@ &.';<?
raceB &.'<@;
0omo observado acima! apenas a varivel 't( no preenc$e o critrio para entrada no
modelo! pois apresentou um p V &.@&.
8
%gora vamos rodar a regresso log.stica m7ltipla com todas as variveis acima! exceto
't(.
!ogit !o" age s#o$e !"t pt! %t &i race- race:
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-101.38735
Iteration 2: Log Likelihood =-100.72104
Iteration 3: Log Likelihood =-100.71348
Iteration 4: Log Likelihood =-100.71348
Logit Estimates !m"er o# o"s = 18$
%hi2&8' = 33.25
(ro" ) %hi2 = 0.0001
Log Likelihood = -100.71348 (se!do *2 = 0.1417
------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
age , -.02706$8 .0364526 -0.743 0.458 -.0$85156 .044376
smoke , .$2334$2 .4008583 2.303 0.021 .1376813 1.70$017
l+t , -.0151826 .006$27$ -2.1$2 0.028 -.028761 -.0016041
9tl , .5417551 .3462666 1.565 0.118 -.136$14$ 1.220425
ht , 1.8336$6 .6$177 2.651 0.008 .4778514 3.18$54
!i , .7585$65 .45$3$18 1.651 0.0$$ -.1417$4$ 1.658$88
ra%e2 , 1.26321$ .5264677 2.3$$ 0.016 .2313616 2.2$5077
ra%e3 , .8616351 .43$1$75 1.$62 0.050 .000823$ 1.722446
5%ons , .4644033 1.204702 0.385 0.700 -1.8$676$ 2.825576
------------------------------------------------------------------------------
O auste global do modelo pode ser verificado atravs do teste da ra/o de
verossimil$anas. Gste teste verifica a $iptese de nulidade de que todos os coeficientes no
modelo! exceto o da constante so iguais a /ero. O resultado de &.&&&' indica que o modelo
se austa adequadamente aos dados.
O prximo passo na modelagem excluir as variveis que no apresentaram signific3ncia de
&.'& ou mais no modelo completo. -o exemplo acima vamos excluir a varivel age e aplicar o
teste da ra/o de verossimil$anas comparando"se o modelo c$eio com o modelo sem a
varivel age. Qodelos deste tipo! que t#m as mesmas variveis apenas com exceo de
algumas que so retiradas! so ditos modelos anin$ados. %ntes vamos ter que salvar os
resultados do modelo c$eio com o comando2
!rtest8 sa(i/g(.)
!ogit !o" s#o$e !"t pt! %t &i race- race:
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-101.58398
Iteration 2: Log Likelihood =-100.99797
Iteration 3: Log Likelihood =-100.99279
Iteration 4: Log Likelihood =-100.99279
Logit Estimates !m"er o# o"s = 18$
%hi2&7' = 32.6$
(ro" ) %hi2 = 0.0000
Log Likelihood = -100.$$27$ (se!do *2 = 0.13$3
------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4---------------------------------------------------------------------
smoke , .$387268 .3$871$5 2.354 0.01$ .157250$ 1.720203
l+t , -.015$053 .0068553 -2.320 0.020 -.02$3414 -.00246$1
9
9tl , .503214$ .3412323 1.475 0.140 -.1655881 1.172018
ht , 1.855042 .6$51214 2.66$ 0.008 .4$26286 3.217455
!i , .7856$75 .4564423 1.721 0.085 -.108$13 1.680308
ra%e2 , 1.32571$ .5222464 2.538 0.011 .3021351 2.34$304
ra%e3 , .8$7077$ .4338846 2.068 0.03$ .04667$7 1.747476
5%ons , -.08654$5 .$51768 -0.0$1 0.$28 -1.$51$81 1.778882
------------------------------------------------------------------------------
!rtest
Logit: likelihood-ratio test %hi2&1' = 0.56
(ro" ) %hi2 = 0.4548
O teste acima foi calculado pela mesma frmula explicada anteriormente. Nea2
RHN : " @ J"'&&.;;@>; 4 ("'&&.>'B=<)K : &.?8
(ortanto a retirada da varivel idade materna do modelo no influiu no auste do mesmo.
Aesse modo! o modelo preferido o modelo sem a idade materna.
Outra varivel que pode ser retirada para verificar a sua contribuio no auste ptl! que
tem um valor de p de &.'=.
!ogit !o" s#o$e !"t %t &i race- race:
Iteration 0: Log Likelihood = -117.336
Iteration 1: Log Likelihood =-102.68681
Iteration 2: Log Likelihood =-102.11335
Iteration 3: Log Likelihood =-102.10831
Iteration 4: Log Likelihood =-102.10831
Logit Estimates !m"er o# o"s = 18$
%hi2&6' = 30.46
(ro" ) %hi2 = 0.0000
Log Likelihood = -102.10831 (se!do *2 = 0.12$8
------------------------------------------------------------------------------
lo+ , -oe#. .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
smoke , 1.035831 .3$25611 2.63$ 0.008 .2664256 1.805237
l+t , -.0167325 .0068034 -2.45$ 0.014 -.030066$ -.0033$8
ht , 1.871416 .6$0$051 2.70$ 0.007 .5172672 3.225565
!i , .$04$74 .4475541 2.022 0.043 .027784 1.782164
ra%e2 , 1.324562 .521466$ 2.540 0.011 .3025055 2.346618
ra%e3 , .$261$6$ .43038$3 2.152 0.031 .08264$5 1.76$744
5%ons , .0562761 .$378604 0.060 0.$52 -1.7818$7 1.8$444$
------------------------------------------------------------------------------
!rtest
Logit: likelihood-ratio test %hi2&2' = 2.7$
(ro" ) %hi2 = 0.247$
0omo pode ser verificado acima! a retirada de ptl do modelo tambm no alterou o seu
auste. (ortanto um modelo sem ptl e age o prefer.vel. Gste modelo austado
considerado o modelo redu/ido final.
Namos pedir ento o comando logistic para analisar os odds ratio do modelo final2
10
!ogistic !o" s#o$e !"t %t &i race- race:
Logit Estimates !m"er o# o"s = 18$
%hi2&6' = 30.46
(ro" ) %hi2 = 0.0000
Log Likelihood = -102.10831 (se!do *2 = 0.12$8
------------------------------------------------------------------------------
lo+ , 6dds *atio .td. Err. / (),/, 0$51 -on#. Inter2al3
---------4--------------------------------------------------------------------
smoke , 2.817447 1.10602 2.63$ 0.008 1.3052$ 6.081411
l+t , .$834068 .0066$05 -2.45$ 0.014 .$703806 .$$66078
ht , 6.4$74$2 4.48$15 2.70$ 0.007 1.677437 25.1678
!i , 2.471868 1.1062$5 2.022 0.043 1.028174 5.$42703
ra%e2 , 3.760537 1.$60$$6 2.540 0.011 1.353245 10.45017
ra%e3 , 2.52488$ 1.086685 2.152 0.031 1.086161 5.86$353
------------------------------------------------------------------------------
>ode!o passo a passo a&to#+tico
Hegresso log.stica passo a passo (step9ise) com seleo para trs (bac69ard selection)
+tep9ise com bac69ard selection &.'&
xi; s" !ogistic !o" age !"t i.race s#o$e pt! %t &i 't(8 pr (.1)
i.ra%e 5Ira%e51-3 &nat!rall7 %oded8 5Ira%e51 omitted'
"egin +ith #!ll model
9 = 0.7048 )= 0.1000 remo2ing #t2
9 = 0.4577 )= 0.1000 remo2ing age
9 = 0.1403 )= 0.1000 remo2ing 9tl
Logisti% regression !m"er o# o"s = 18$
L* %hi2&6' = 30.46
(ro" ) %hi2 = 0.0000
Log likelihood = -102.10831 (se!do *2 = 0.12$8
------------------------------------------------------------------------------
lo+ , 6dds *atio .td. Err. / (),/, 0$51 -on#. Inter2al3
-------------4----------------------------------------------------------------
!i , 2.471868 1.1062$5 2.02 0.043 1.028174 5.$42703
l+t , .$834068 .0066$05 -2.46 0.014 .$703806 .$$66078
5Ira%e52 , 3.760537 1.$60$$6 2.54 0.011 1.353245 10.45017
5Ira%e53 , 2.52488$ 1.086685 2.15 0.031 1.086161 5.86$353
smoke , 2.817447 1.10602 2.64 0.008 1.3052$ 6.081411
ht , 6.4$74$2 4.48$15 2.71 0.007 1.677437 25.1678
------------------------------------------------------------------------------
11
<xerccios
'. Nerifique se a varivel l9t (peso materno no in.cio da gravide/) pode ser modelada como
uma varivel quantitativa! plotando os valores preditos pelo modelo com o peso materno.
@. O conunto de dados lo9b9t contm a informao para as amostras de '&& beb#s com
baixo peso ao nascer! nascidos em Ooston! Qassac$usetts. % varivel grm$em uma
varivel aleatria dicot*mica que indica se um beb# teve $emorragia da matri/
germinal. O valor ' indica que ocorreu $emorragia e & que no. Os escores %pgar de
cinco minutos dos beb#s esto salvos sob a varivel apgar? e os indicadores de toxemia
4 em que ' representa o diagnstico de toxemia durante a gravide/ para as mes das
crianas e & sem tal diagnstico 4 sob a varivel de nome tox.
a) Fsando a $emorragia da matri/ germinal como resposta! auste o modelo de
regresso log.stica! tendo como varivel explanatria o escore %pgar. Interprete
O'! o coeficiente estimado do escore %pgar.
b) +e determinada criana tem escore %pgar de cinco minutos de B! qual a
probabilidade prevista de que ela ten$a $emorragia no crebroW Sual a
probabilidade se o escore >W
) %o n.vel de signific3ncia de &!&?! teste a $iptese nula de que o par3metro
'
da
populao igual a &. O que voc# concluiW
d) %gora auste o modelo de regresso com a toxemia. Interprete
'
! o coeficiente
estimado da toxemia.
e) (ara uma criana cua me foi diagnosticada com toxemia durante a gravide/! qual a
probabilidade prevista dela ter $emorragia da matri/ germinalW Sual a
probabilidade para uma criana cua me no teve toxemiaW
f) Sual a c$ance estimada de $aver uma $emorragia da matri/ germinal em crianas
cuas mes foram diagnosticadas com toxemia relativa ,s crianas cuas mes no
foram diagnosticadasW
g) 0onstrua um intervalo de confiana de ;?C para a ra/o de c$ances da populao.
Gsse intervalo contm o valor 'W O que isto l$e di/W
$) Nerifique se o sexo e a idade gestacional esto associados com maior c$ance de
$emorragia da matri/ germinal.
i) Hode um modelo austado completo com sexo! apgar?! toxemia e idade gestacional.
!) Hode um modelo step9ise com as mesmas variveis usando (T&!@& para incluso e
(T&!'& para reteno.
6) %o final! quais as suas conclusXesW Sue fatores esto associados com $emorragia
cerebralW
12

Potrebbero piacerti anche