Sei sulla pagina 1di 21

1

>>> APOSTILA STATA 9.0


9.0 <<<

NO ESQUECER DE FAZER O LOG


ANTES DE INICIAR A ANLISE!

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


2

>>> APOSTILA STATA 9.0 <<<


ndice

1. Comandos gerais ............................................................................ 4 4. Desfecho dicotmico - exposio dicotmica .................................... 11


Ajuda ..................................................................................................... 4 Teste X qui-quadrado ............................................................................. 11
Expresses lgicas................................................................................. 4 Teste X com correo de Yates .............................................................. 11
Descrio do banco de dados ............................................................... 4 Teste exato de Fisher .............................................................................. 11
Memria................................................................................................ 4 Teste McNemar ....................................................................................... 11
Organizao do banco de dados ........................................................... 4 Probabilidade binomial exata ................................................................. 11
Limpeza de dados ................................................................................. 5
Gerar variveis ...................................................................................... 5 5. Desfecho dicotmico - exposio politmica ..................................... 12
Variveis dummies ................................................................................ 6 Teste X qui-quadrado ............................................................................. 12
Transformao de variveis .................................................................. 7 Teste X com correo de Yates .............................................................. 12
Clculos e calculadora ........................................................................... 7 Teste de Fisher ........................................................................................ 12
Clculos sem banco de dados ............................................................... 8 Teste X para tendncia linear ............................................................... 12
Teste X de Mantel-Haenszel .................................................................. 12
2. Anlise descritiva ........................................................................... 9
Anlise descritiva bsica ....................................................................... 9 6. Desfecho contnuo - exposio dicotmica ........................................ 13
Tabelas 2 x 2.......................................................................................... 9 Teste T ..................................................................................................... 13
Tabela descrevendo duas ou trs variveis .......................................... 9 Teste T pareado ....................................................................................... 13
Teste T para S desiguais .......................................................................... 13
3. Grficos.......................................................................................... 10 Wilcoxon pareado ................................................................................... 13
Grfico de barras................................................................................... 10 Wilcoxon no-pareado ............................................................................ 13
Diagrama de caixa ................................................................................. 10 Mann-Whitney ........................................................................................ 13
Edio de um grfico............................................................................. 10
Histograma ............................................................................................ 10
Curva Roc .............................................................................................. 10

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


3

>>> APOSTILA STATA 9.0


9.0 <<<
ndice

7. Desfecho contnuo - exposio categrica ordinal ........................... 14 Avaliao de uma varivel na regresso logstica ................................... 17
Anova de uma entrada ......................................................................... 14
Kruskal Wallis ........................................................................................ 14 11. Estratgia de seleo de variveis ................................................... 18
Bonferroni ............................................................................................. 14 Seleo para trs sem modelo conceitual .............................................. 18
Tendncia Linear ................................................................................... 14 Seleo para frente sem modelo conceitual........................................... 18
Anova de duas entradas ....................................................................... 14 Seleo de variveis para frente e para trs sem modelo
Anova com controle de interao......................................................... 14 conceitual ................................................................................................ 18
Seleo para trs com modelo conceitual .............................................. 18
8. Desfecho contnuo - exposio contnua ......................................... 15 Seleo para frente com modelo conceitual .......................................... 18
Correlao de Pearson .......................................................................... 15 Seleo para frente e para trs com modelo conceitual ........................ 18
Correlao de Spearman....................................................................... 15
12. Diagnstico do modelo ................................................................... 19
9. Concordncia e repetibilidade ........................................................ 15 Valores ajustados .................................................................................... 19
Kappa .................................................................................................... 15 Valor dos resduos brutos ....................................................................... 19
Kappa ponderado.................................................................................. 15 Resduos padronizados ........................................................................... 19
Kappa pelo mtodo............................................................................... 15 Grfico dos pontos observados na reta de regresso ............................ 19
Bland & Altmam .................................................................................... 15 Grficos dos IC95% dos pontos e da reta .................................................. 19
Coeficiente de concordncia ................................................................ 15 Desvio padro dos valores ajustados ................................................... 20
Desvio padro p/ a predio ................................................................ 20
10. Regresses ................................................................................... 16 Grfico de resduos ................................................................................. 20
Regresso linear simples....................................................................... 16 Grfico normal de resduos padronizados .............................................. 20
Regresso linear mltipla ..................................................................... 16 Grfico dos resduos ................................................................................ 20
Regresso de Poisson com riscos relativos ........................................... 16 Teste de Shapiro-Wilk ............................................................................. 20
Regresso de Poisson com varincia robusta ....................................... 16 Pontos aberrantes ................................................................................... 20
Regresso de Poisson com exposies categricas .............................. 17 Pontos Influentes .................................................................................... 21
Regresso de Poisson com offset ......................................................... 17 Distncia de Cook .................................................................................... 21
Regresso logstica com razes de odds............................................... 17 Comparar a reta da regresso sem o ponto influente ............................ 21
Regresso logstica com coeficientes ................................................... 17 Vif ............................................................................................................ 21

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


4

1. COMANDOS GERAIS
FUNO SIGNIFICADO COMANDO
Ajuda Solicitar ajuda para a insero de um comando whelp
Igual (atribuio) =
Igual (condio) ==
Expresses lgicas Diferente ~=
Ou |
E &
Descrio do banco de dados describe
Descrio da varivel describe varivel1
Detalha medidas de disperso e tendncia central da varivel summarize varivel1
Aproxima o nome da varivel de seu label na caixa de texto set varlabelpos 12
Intervalo de confiana para variveis contnuas ci varivel1 varivel2 varivelX
Descrio do banco de
dados Intervalo de confiana para variveis dicotmicas ci varivel1 varivel2 varivelX, bin
Tipo de varivel (ex numrica), variao, valores aceitos, missings,
codebook var
percentis, md e dp.
Lista uma varivel conforme outra list varivel1 if varivel2==X
Mostra o rtulo que est codificada a varivel var,nolabel
D uma descrio percentual da varivel tab varivel1
Aumenta a memria do STATA set memory 50m
Memria
Reduz o tamanho (espao ocupado) do banco Compress
Ordena o editor de dados de acordo a varivel sort varivel1
label variable var1 nome varivel1
Organizao do banco de
Colocar rtulo na varivel e a descrio etiqueta de cada categoria. label define var1 0no 2sim
dados
label value var1 var1
Realizar mudana no banco de dados replace var1=0 if nque== 0205001

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


5

FUNO SIGNIFICADO COMANDO


Mostra se h missing varivel1,m
Retirando missing recode var 9=.
Exclui a varivel drop varivel1
gen varivel nova = varivel antiga if varivel
Limpeza de dados Criar varivel nova sem missing da antiga
antiga<. ou <99 ou <88
Retirar os valores 9 entre uma varivel1 e uma varivel3 mv decode varivel1 varivel3, mv (9)
Retirar os valores . e voltar com os 9 entre uma varivel1 e uma
varivel3 mv encode varivel1 varivel3, mv (9)
Cuidado: todos os . sero 9 a partir de agora...
Gerar varivel a partir de outra generate varivel2= varivel1
Gerar varivel a partir de outra com uma condio generate varivel2= varivel1<X
generate baixopeso = peso<2500 if peso<.
Criar varivel numrica contnua em categrica dicotmica (baixo peso La var baixopeso baixo peso
= peso<2500) La define sn 1sim 0 nao
La values baixopeso sn
Gerar varivel nova juntando 2 variveis antigas e somando os valores
das referidas categorias dessas variveis egen var=rsum ( var1 var2)
Gerar variveis Ateno: utilizar para contagens e cuidar missing
gen var4categorias = varnumrica if varnumrica<.
recode var4categorias min/1=0 2/3=1 4/5=2
6/max=3
Categorizar varivel numrica discreta La var var4categorias nome da varivel
La val var4categorias nomedascategorias
La define nomedascategorias 00 a 1 12 a 3 24 a
5 36 a mx
Tabulate var4categorias

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


6

FUNO SIGNIFICADO COMANDO


gen rendagr = renda
recode rendagr min/149.999=1 150/199.999=2
200/max=3
Categorizar varivel numrica contnua
la var rendagr renda em grupos
la val rendagr nomegrupos
la define nomegrupos 0min-149 1150-199
2200-max
Categorizar variveis contnuas definindo os pontos de corte egen varivel2=cut (varivel1), at (20 30 40)
Gerar varivel categrica nova a partir duma continua definindo os
egen varivel2=cut (varivel1), at (20 30 40 104),
Gerar variveis pontos de corte desde um valor mnimo at um valor mximo
icodes label
(continuao) escolhido
Gerar escore
Cuidado: as variveis no podem ter valor 99 ou ., pois pode dar gen var=var1+var2+var3 etc
errado.
Gerando varivel nova a partir duma antiga com a condio de que no
gen var2=var1 if var1~=. ou <.
sejam includos os missing
Gerar e calcular uma varivel como IMC gen imc
Com peso e altura, verificar se peso est kg e altura em metros. imc=peso/alturaxaltura
Se no estiver, transformar... gen altura1=altura/100>
Se estiver em cm dividir por 100 imc=peso/altura^2
tabulate varivel dicotmica, generate (varivel
dicotmica Nova)
ta varivel dicotmicaNova1
Varivel dummies dicotmica
ta varivel dicotmicaNova 2
Variveis dummies rename varivel dicotmicaNova1 nome novo
rename varivel dicotmicaNova2 nome novo
char varivel categrica[omit]2
Mudar a categoria de referencia de 0 para outro valor
(omitindo a categoria2)
Obs.: Pode ser usada para regresso logstica e linear
xi: regress desfecho contnuo i.varivel categrica

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


7

FUNO SIGNIFICADO COMANDO


Transformar uma varivel string (varivel com nome) em nmero destring var nova, gen(var string)
Transformar uma varivel com distr. assimtrica em log da varivel gen var2 = log(var1)
Transforma varivel alfa (classes A a E) em numrica ( classes 1 a 5) encode varivel1, gen (varivel nova )
Faz o inverso do comando acima decode
Transformao de Dividir varivel contnua em partes iguais (quartis, quintis, decil).
xtile varivel2=varivel1, nq (4)
variveis Trocar o valor entre parntes por 5 ou 10
replace pesado = 1 if fumo==1 & cigdia>19 &
Categorizar uma varivel contnua em dicotmica dependendo de
cigdia<88
outras variveis
replace pesado=0 if pesado~=1
Passar valores de categorias para um nmero a menos. Ex: 1 e 2 para 0
generate varivel nova = varivel velha - 1
e1
Ativar calculadora Display 65/ 87
Multiplicao gen varnova= var1*var2
Diviso gen varnova = var1/var2
Subtrao gen varnova = var1-0
Adio gen varnova = var1+var2
Raiz quadrada gen raizquadrvarivel = sqrt(varivel)
Clculo do tamanho de amostra atravs de prevalncias em exposto e
Clculos e calculadora sampsi .70 .45
no exposto
Calcular o DEFF svyset, psu(var)
Definir o setor censitrio c/ unid amostral 1a
que vai servir de referncia (var = var dos setores) svy:prop desfecho
Estabelece a proporo do desfecho para desfechos dicotmicos estat effect, deff
Calcula o coeficiente de correlao intraclasse
loneway desfecho var
(var = var dos setores)
Sorteio de n aleatrio set seed 123456 (nmero de 6 dgitos)
20 nesse caso seria o pulo - setor com 200 domiclios, claro. A seguir faa: display int(uniform()*20+1)

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


8

FUNO SIGNIFICADO COMANDO


Calcular intervalo de confiana sem banco de dados para uma
cii 945 0.583
prevalncia de 58,43%,com 945 observaes.
Comparar propores sem banco de dados
Clculos sem banco de prtesti 618.837 626.788
83,7% com 618 observaes X 78,8% com 626 obs.
dados
Cross Sectional com valores de uma tabela 2x2 com valores no
contidos no Stata csi 650 600 350 400, e
Ateno: porque a tabela do Stata tem exposio na coluna

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


9

2. ANLISE DESCRITIVA

FUNO SIGNIFICADO COMANDO


Medidas de tendncia central e variabilidade para variveis contnuas summarize varivel, detail

Para cada categoria da varivel qualitativa; apresenta as medidas de sort varivel qualitativa
tendncia central da varivel quantitativa (sempre deve fazer sort da by varivel qualitativa: summarize varivel
Anlise descritiva bsica varivel qualitativa) quantitativa, d

Contar registros segundo critrio Count if varivel == critrio


count if nome da varivel < a mdia da varivel -
Conta o nmero das observaes fora do intervalo de + e 2d
2dp | nome da varivel > a mdia da varivel + 2dp
Tabela 2 x 2 com percentagem na coluna tab desfecho varivel, col
Tabelas 2 x 2
Tabela 2 x 2 com percentagem na linha tab desfecho varivel, row
Este comando apresenta uma tabela da varivel1 por md e sd da
table var1, c (mean var2 sd var2) f (%5.1f)
varivel2
Atravs do f(%5.1f), o nmero de casas decimais e total de algarismos
table var1 var2, c (mean var3 sd var3) f(%5.1f)
pode ser definido. Neste ex. o mximo de algarismos 5 com 1 casa
table var1 var2 var3, c (mean var4 sd var4) f(%5.1f)
decimal fixa.

Tabela descrevendo duas ou Tabela de 1 varivel categrica conforme uma outra varivel contnua e table varivel1, c(n varivel2 mean varivel2 sd
trs variveis seu n, mdia, dp, e valore mnimo e mximo varivel2 min varivel2 max varivel2)

Apresenta a mdia e desvio padro da varivel contnua segundo o table varivel1, c(n varivel2 mean varivel2 sd
desfecho dicotmico e a exposio politmica varivel2 min varivel2 max varivel2)
table exposio politmica, by(desfecho
Exposio politmica conforme desfecho dicotmico e valores de uma
dicotmico) c(mean varivel contnua sd varivel
terceira varivel contnua em mdia e dp
contnua)

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


10

3. GRFICOS

FUNO SIGNIFICADO COMANDO


Grfico de barras Grfico onde varivel1 contnua e varivel2 categrica graph bar var1, over(var2)
Diagrama de caixa Diagrama onde varivel1(contnua) e var2(categrica) graph box var1, over(var2)
graph box varivel qualitativa, med type (line) over
Edio de um grfico Editar os eixos X e Y de um grfico e inserir ttulo (varivel quantitativa) y title (varivel quantitative)
title (ttulo do grfico)
Histograma de freqncia hist varcont, frequency
Histograma p/ ver a distribuio de variveis contnuas hist varivel contnua
Histograma p/ ver a distribuio de variveis contnuas com a curva de
hist varivel continua, norm
distribuio normal
Histograma hist varcont, frequency title(Distribuio do peso
Histograma de freqncia com nmeros e curva normal sobreposta ao nascer) ylabel(0 (50) 100) xlabel(200 (500)
4700) addlabel norm
Histograma de distribuio de peso entre os sexos com curva normal histogram ppn, title(Sexo) by(psex,
sobreposta title(Distribuio de peso ao nascer)) normal
Curva Roc baseada em um mtodo padro-ouro e o novo padro a ser
roctab (padro-ouro) (varivel a ser testada),
testado (varivel a ser testada)
Curva Roc binomial detail graph plotopts (recast (connected)
Monta a curva segundo sensibilidade, para ver especificidade agregar ao
mlabel (varivel a ser testada))
final specifity

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


11

4. DESFECHO DICOTMICO - EXPOSIO DICOTMICA


COMPARAO DE DUAS PROPORES (TABELAS 2 x 2 )

TESTE PRESSUPOSTOS COMANDO OBSERVAES


Fornece RR como medida de efeito
cs desfecho exposio Cuidar codificao 1 e 2: passar para
Aproximao da X (ao teste z) boa 0 e 1 (gen var0=var-1)
quando: Fornece OR e o RR como medidas de
Teste X qui-quadrado - Amostras grandes > 40 cs desfecho exposio, or
efeito
- Valor esperado em todas caselas
A partir de valores que no se
5 csi 750 700 450 300
encontram no banco e fornece RR
ta desfecho exposio, col row chi2 e No fornece nem RR nem OR
- Amostras pequenas 20 <40
- Valor esperado em todas
Aproxima distribuio qui-quadrado
Teste X com correo as caselas tb 5. -
distribuio normal
de Yates - ([O-E]- 0,5)2 / E; gl=1

Fornece RR como medida de efeito


- Amostras pequenas (<20) cs desfecho exposio, exact Cuidar codificao 1 e 2: passar para
- Amostras pequenas 20 <40 mas o 0 e 1 (gen var0=var-1)
Teste exato de Fisher valor esperado em ao menos uma A partir de valores que no se
csi 650 600 350 400, e
casela < 5. encontram no banco e fornece RR
ta desfecho exposio, col row chi2 e No fornece nem RR nem OR
- Para dados pareados mcc desfecho exposio Considera os pares discordantes
- Soma de pares discordantes deve A partir de valores que no se
Teste McNemar mcci 4 9 3 16 (sem as variveis no banco)
ser > 10 encontram no banco
Considera os pares discordantes
- Para dados pareados
20 = n eventos
Probabilidade binomial - Soma de pares discordantes deve bitesti 10 3 .5
3 = n sucesso
exata ser < 10
.5 = p de sucesso

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


12

5. DESFECHO DICOTMICO - EXPOSIO POLITMICA


COMPARAO DE VRIAS PROPORES (TABELAS 2 x K )

TESTE PRESSUPOSTOS COMANDO OBSERVAES


Aproximao da X (ao teste z) boa ta desfecho exposio, col row chi2 No fornece nem RR nem OR
quando:
- Amostras grandes > 40
Teste X qui-quadrado A partir de valores que no se
- Valor esperado em todas caselas 5 tabi 48 145 \ 43 169 \ 21 100 \ 44 182
- Tabelas 2 x K no ordinal encontram no banco
- Graus de liberdade = (L-1)x(C-1)
- Amostras pequenas 20 <40
Teste X com correo
- Valor esperado em todas - -
de Yates
as caselas tb 5.
- Amostras pequenas (<20)
Teste exato de Fisher - Amostras pequenas 20 <40 ta desfecho exposio, col row chi2 e No fornece nem RR nem OR
- Valor esperado em 1 casela < 5.
- Mede associao linear nptrend desfecho, by (exposio)
Teste X para - Quando a varivel politmica Mostra um P de homogenidade para
tendncia linear (exposio) for ordinal tabodds desfecho exposio associao e um P de tendncia.
- Graus de liberdade = 1
cs desfecho exposio, e by(possvel var. modificadora Estratificao para controle de
ou confundidora) RR possvel modificador de efeito (teste
cc desfecho exposio, e by(possvel var. modificadora de homogeneidade) ou fator de
- Desfecho e exposio dicotmicos. ou confundidora) OR confuso (RR bruto e RR ajustado, se
Teste X - Possvel modificador de efeito ou >10%). O cs no apresenta o teste
de Mantel-Haenszel fator de confuso dicotmico ou de associao global de M-H.
politmico cc desfecho exposio, e by(possvel var. modificadora e = opcional, teste exacto de Fisher
ou confundidora) tb tb = IC baseado no teste de Miettinen
ou Woolf, e no na aprox. normal
(Cornfield=n grande).

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


13

6. DESFECHO CONTNUO - EXPOSIO DICOTMICA


COMPARAO DE DUAS MDIAS

TESTE PRESSUPOSTOS COMANDO OBSERVAES

Pode-se usar indistintamente,


- Amostras Grandes ttest desfecho, by(exposio dicotmica) valores da diferena obtidos com
- Distr. Normal; teste t igual aos valores
Teste T
- Varincias homognas (Bartletts
P>0,05);
anova desfecho exposio dicotmica, regress Resultante com o teste anova
Se a varincia no homognea ou
a distribuio da varivel contnua
- Amostras grandes no normal, devemos
- Distr. Normal; fazer uma transformao,
Teste T pareado - Dados tipo antes e depois; ttest varivel antes = varivel depois, unpaired geralmente logaritmo, usar o
- Considera os pares de observaes comando unequal para varincias
_ graus de liberdade = (n pares) 1 desiguais ou usar um teste no
paramtrico (menos poderoso, mas
mais robusto.
Teste T para S Amostras menores;
desiguais (teste no - Distr. assimtrica testt desfecho, by(exposio dicotmica) unequal -
paramtrico) - varincias diferentes
Wilcoxon pareado - Amostras pequenas
(teste no - Distribuio assimtrica signrank varivel antes = varivel depois -
paramtrico) - Dados tipo antes e depois;
Wilcoxon no-pareado
- Amostras pequenas
Mann-Whitney (teste ranksum desfecho, by(exposio dicotmica) -
- Distr. Assimtrica
no paramtrico)

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


14

7. DESFECHO CONTNUO - EXPOSIO CATEGRICA ORDINAL


COMPARAO DE MAIS DE DUAS MDIAS

TESTE PRESSUPOSTOS COMANDO OBSERVAES


- Amostras Grandes Tabela com mdia, dp e
oneway desfecho exposio ordinal, means standard
- Distr. Normal; freqncia para cada categoria
ANOVA de uma - Varincias homognas (Bartletts P da exposio alm da tabela
entrada >0,05); oneway desfecho exposio ordinal, tab com a analise de varincia.
- H0 = pelo menos um par de mdia Tabela apenas com a analise de
diferente anova desfecho exposio ordinal
varincia
- Amostras pequenas
- Distr. assimtrica; Valor p de significncia para
Kruskal Wallis kwallis desfecho, by(exposio ordinal)
- Varincias heterognas (Bartletts p comparao das mdias
< 0,05);
- Igual ao ANOVA, apenas indica Testa qual a categoria o grupo
oneway desfecho exposio ordinal, means standard
Bonferroni entre qual (is) grupo(s) est a que tem a mdia diferente das
bonferroni
diferena demais
- Amostras Grandes Continuous (listavar) indica que as
variveis listadas devem ser
- Distr. normal; anova desfecho exposio ordinal, continuous (exposio
Tendncia Linear tratadas como contnuas e no
- Varincias homognas (Bartletts P ordinal) como grupos isto para fazer teste
>0,05); de tendncia linear
- Amostras Grandes
ANOVA de duas - Distr. normal; Comparao de varincias
anova desfecho exposio ordinal varivel confusora
entradas - Varincias homognas (Bartletts p controlando confuso
>0,05);
- Amostras Grandes (distr. normal);
ANOVA com controle anova desfecho exposio ordinalA exposio ordinalB Comparao de varincias com
- Varincias homognas (olhar
de interao exposio ordinalA * exposio ordinalB termo de Interao
Bartletts P >0,05);

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


15

8. DESFECHO CONTNUO - EXPOSIO CONTNUA


COEFICIENTE DE CORRELAO

TESTE PRESSUPOSTOS COMANDO OBSERVAES


pwcorr var1 var2 var3 etc Somente correlao
com pelo menos 1 c/distribuio pwcorr var1 var2 var3 , obs sig Revela o # de obs e a associao
Correlao de Pearson
normal pwcorr desf var1 var2 var3 etc Entende missing
correlate desf var1 var2 var3 etc No entende missing
Coeficiente de correlao de
Correlao de Spearman utilizado para verificar a Revela o coeficiente de correlao,
spearman desfecho varivel
Spearman correlao de variveis contnuas associao e # de observaes
sem distribuio normal

9. CONCORDNCIA E REPETIBILIDADE
TESTE PRESSUPOSTOS COMANDO OBSERVAES
Kappa para avaliar concordncia de Mede concordncia, o tab mostra a
kap var1 var2
Kappa variveis categricas nominais ou tabulao dos resultados de cada
kap var1 var2,tab
ordinais avaliao
Kappa ponderado para variveis kap var1 var2, wgt(w)
Kappa ponderado Mede concordncia
ordinais kap var1 var2, wgt(w) tab
gen vardiferena=var1-var2
Kappa pelo mtodo Kappa para var contnuas (grfico de gen varmedia=(med1+med2)/2
Mede concordncia
Bland & Altmam diferenas x mdias scatter vardiferena varmedia, yline(0) ylabel(-20 15 10
0 5 10 15 20)
Coeficiente de Produto das medidas de correlao
Para variveis contnuas concord varivel1 varivel2
concordncia de Pearson e medida de acurcia

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


16

10. REGRESSES
REGRESSO LINEAR SIMPLES E MLTIPLA, LOGSTICA E POISSON

TESTE PRESSUPOSTOS COMANDO OBSERVAES


- Desfecho contnuo com distribuio normal
- Observaes independentes
Regresso linear - Resduos com distribuio normal
xi: regress desfecho exposio -
simples - Varincia constante para todo intervalo de X
- Relao linear entre X e Y
- Apenas 1 preditor
- Desfecho contnuo com distribuio normal
-Observaes independentes
Regresso linear - Resduos com distribuio normal xi: regress desfecho exposio1 exposio2
-
mltipla - Varincia constante para todo intervalo de X exposioX
- Relao linear entre X e Y
- Para 2 ou mais preditores
- Desfecho contagem
- A taxa de chegada constante
Regresso de Poisson xi: poisson desfecho exposio1 exposio2
- Ocorrncias do desfecho so independentes -
com riscos relativos exposioX irr
- No ocorrem duas chegadas no mesmo tempo
T
- Desfecho contagem
xi: poisson desfecho exposio1 exposio2
- A taxa de chegada constante
Regresso de Poisson exposioX irr r
- Ocorrncias do desfecho so independentes -
com varincia robusta ou
- No ocorrem duas chegadas no mesmo tempo
xi:svypois desfecho variveis, irr
T

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


17

TESTE PRESSUPOSTOS COMANDO OBSERVAES


- Desfecho contagem
- A taxa de chegada constante
Regresso de Poisson
- Ocorrncias do desfecho so xi: poisson desfecho i.exposio1 i.exposio2
com exposies -
independentes i.exposioX irr r
categricas
- No ocorrem duas chegadas no mesmo
tempo T
- Desfecho contagem
Regresso de Poisson - A taxa de chegada constante
xi: Poisson desfecho exposio1 exposio2
com offset (definio - Ocorrncias do desfecho so
exposioX, irr exposure(varivel que se refere ao -
de uma varivel como independentes
tempo de exposio)
tempo de exposio) - No ocorrem duas chegadas no mesmo
tempo T
- Observaes do desfecho so xi: logistic (ou logit) desfecho exposio1
independentes exposio2 exposioX
Regresso logstica
- Desfecho tem distribuio binomial -
com razes de odds
- A varincia acompanha a distribuio svylogit desfecho variveis, or
binomial
- Observaes do desfecho so
independentes
Regresso logstica
- Desfecho tem distribuio binomial logistic, coef -
com coeficientes
- A varincia acompanha a distribuio
binomial
O comando est store A salva as
observaes. O prximo passo
xi: logistic desfecho exposio1exposio2 rodar o modelo retirando a varivel
Avaliao de uma
est store A que se quer avaliar e adicionando o
varivel na regresso -
xi: logistic desfecho exposio1 if e(sample) comando if e(sample) que mantm
logstica
lrtest A as mesmas observaes anteriores.
O comando lrtest A d o valor p da
varivel para o modelo.

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


18

11. ESTRATGIA DE SELEO DE VARIVEIS


TESTE PRESSUPOSTOS COMANDO OBSERVAES
Seleo de variveis
sw, pr(.05): regress desfecho exposio1 exposio2
para trs sem modelo Existncia de um modelo preditivo -
exposioX
conceitual
Seleo de variveis
sw, pe(.05): regress desfecho exposio1 exposio2
para frente sem Existncia de um modelo preditivo -
exposioX
modelo conceitual
Seleo de variveis
para frente e para trs sw, pr(.05) pe(.045): regress desfecho exposio1
Existncia de um modelo preditivo -
sem modelo exposio2 exposioX
conceitual
As variveis entre parnteses so
Seleo de variveis
Existncia de modelo conceitual de sw, pr(.05) lock: regress desfecho (exposio1 exposio2) exposies dos nveis de nalise
para trs com modelo
anlise exposioX anteriores que, pela significncia,
conceitual
permanecero no modelo
As variveis entre parnteses so
Seleo de variveis
Existncia de modelo conceitual de sw, pe(.05) lock: regress desfecho (exposio1 exposies dos nveis de nalise
para frente com
anlise exposio2) exposioX anteriores que, pela significncia,
modelo conceitual
permanecero no modelo
Seleo de variveis As variveis entre parnteses so
para frente e para trs Existncia de modelo conceitual de sw, pr(.05) pe(.045) lock: regress desfecho exposio1 exposies dos nveis de nalise
com modelo anlise exposio2 exposioX anteriores que, pela significncia,
conceitual permanecero no modelo

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


19

12. DIAGNSTICO DO MODELO


TESTE PRESSUPOSTOS COMANDO OBSERVAES
Valores ajustados - predict p -
Valor dos resduos
- predict r, residuals -
brutos
Resduos padronizados - predict rs, rstandard -

Grfico dos pontos


observados em
- sc exposio1 p exposio2, connect(. l) symbol(O i) sort
sobreposio reta de
regresso

predict epreta, stdp


IC95% reta predita = Ypred 2 x _ generate rsup = p + 1,96*epreta
varincia do Ypredito generate rinf = p 1.96*epreta
sc p rsup rinf varpreditora, c(l l l) s(i i i) sort clcolor (black
Grficos dos intervalos red red)
de confiana dos
pontos e da reta
predict eppred, stdf
IC95% pontos individuais= Ypred 2x generate psup = p + 1.96*eppred
_ varYpred + var Ei generate pinf= p - 1.96*epred
sc p psup pinf varpreditora, c(l l l) s(i i i) sort clcolor (black
red red)

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


20

TESTE PRESSUPOSTOS COMANDO OBSERVAES


predict exposio, stdp
Desvio padro dos
- g rsup= p+1.96*exposio -
valores ajustados
g rinf=p-1.96* exposio
predict epred, stdf
Desvio padro p/ a
- g psup= p+1.96*epred -
predio
g pinf=p-1.96* epred
Grfico de resduos - scatter rs p -

Grfico normal de Testa a normalidade da distribuio


pnorm rs
resduos padronizados dos resduos

Grfico dos resduos -


sc rs p, yline(0)

swilk rs
Teste de Shapiro-Wilk - H0= distribuio normal dos resduos
swilk exposio1

Testa se os resduos se distribuem


normalmente Padroniza com
Pontos aberrantes scatter rs p, yline(-2 2)
mdia 0 e dp 2

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez


21

TESTE PRESSUPOSTOS COMANDO OBSERVAES

predict rs, rstandard


gen rs2= rs*rs
Grfico de alavancagem predict h, hat (diagonal da matriz de projeo do modelo)
sc rs2 h (grfico de alavancagem sem as retas limite)

ento se determinam os pontos limite: para o eixo do Y


Grfico em que se traam os o rs; para o eixo do X o menor valor
resduos (padronizados) ao entre 3p/n (p=n preditores e n=nmero de observes) ou
Pontos Influentes
quadrado contra os valores da .
diagonal da matriz de projeo do sc rs2 h, yline(2) xline(3p/n ou )
modelo (hii) sc rs2 h, yline(4) xline(.12) _ [3x1/25=0.12]

Indica qual ponto o influente e/ou


aberrante sc rs2 h, yline(4) xline(.12) mlabel(varpreditora) m(i)

Identificao dos pontos influentes.


predict cook, cooksd
Distncia de Cook - O limite prescrito para o D de Cook
list pemax idade cook if cook>.n
4/n

reg vardependente varpreditora if varpreditora~=valor


Comparar a reta da influente
regresso sem o ponto - predict pr (predicto sem o ponto influente)
influente sc vardependente p(predicto) pr(predito sem influente)
varpreditora, s(o i i) c(. l l)

Faz-se este comando aps o modelo


Vif - vif
estar concludo

BC Velsquez, GF Del Duca, MBJ de Camargo, MCR Mndez

Potrebbero piacerti anche