Sei sulla pagina 1di 33

Modelo com VD contnua e um Preditor com mais de 2 Categorias: Problema

tipo 4 (Caso de amostras independentes)

Regresso Linear Mltipla com Mais de uma Dummy


Neste tipo de problemas necessrio o sistema de codificao Dummy, ou seja, substituir
uma varivel por nmeros, por exemplo: dummyfumar 1, dummynaofumar 2

Nestes problemas o investigador tem uma hiptese unilateral, verifica s o lado do grfico que
quer.
Passos para resolver estes problemas:

Modelo Nulo

i = bo
i = bo + ei

o Modelo Nulo: Indicadores de Erro


erro: ei = Yi i
SSE: Erro2 + Erro2

Erro-Padro
Desvio-Padro

Varincia

Re-especializao do modelo : Modelo Proposto

i = bo + b1Di1 + b2Di2 + b3Di3

bo

b1
Andreia Martins

Dumm
y

Divide-se por 2 para


o teste de hipteses

b2

Valores Preditos: So o resultado do modelo proposto (formula) para cada


individuo

PRE (Reduo Proporcional do Erro) Utiliza-se para descobrir qual dos modelos
melhor.

PRE designado R2 e o seu valor ajustado calcula-se:

Teste de hiptese para bo


1. Hiptese
2. Estatstica de teste

3. Regra de teste Usa-se a distribuio t


4. Deciso
5. Concluso

Desvio-padro

Como unilateral divide-se


o valor-p por 2.

Teste de Hiptese para b1 Testa se o valor de b1 menor que 0.


1. Hiptese

H0: b1 = 0 vs H1: b1 < 0


2. Estatstica de teste

3. Regra de teste Usa-se a distribuio t

4. Deciso
5. Concluso

Teste de Hiptese para b2 Testa se o valor de b2 maior que 0.


1. Hiptese

H0: b2 = 0 vs H1: b2 > 0


Andreia Martins

Mdia
da VI

2.
3.
4.
5.

Estatstica de teste
Regra de teste Usa-se a distribuio t
Deciso
Concluso

Teste de Hiptese para PRE (R, R2)


1. Hiptese
2. Estatstica de teste
3. Regra de teste - Distribuio F de Snedecor com (p = nmero de
parmetros estimados nos modelos):
gl do numerador (pProposto pnulo),
gl do denominador (N pProposto)
4. Deciso
5. Concluso
O coeficiente de regresso estandardizado (Beta)
o Passando b1 para Beta1

o Passando b2 para Beta2

One way ANOVA com Contrastes Planeados

O coeficiente de regresso estandardizado (Beta)


o Passando b1 para Beta1

o Passando b2 para Beta2

Quando se passa para Beta a constante


(bo) passa para 0, 0 porque temos todas
as variveis 0 e 0-0=0

Anlise menos complexa: anlise de Varincias com um Factor (One-way ANOVA)


o Anlise de Varincias
Tcnica estatstica usada quando o teste de hiptese envolve a
comparao de duas ou mais mdias;
Foi desenvolvida pelo estatstico britnico Ronald Fisher (1918,1921) para
a anlise de experimentos;
Posteriormente, George W. Snedecor ampliou a utilizao da tcnica para
pesquisas baseadas em distribuies por amostragem, denominando-o
estatstica "F", em homenagem a Fisher.
ANOVA no se usa o teste t pois tem mais que 3 mdias.

Andreia Martins

Teste de Hiptese
1. Hiptese
H0: G1 = G2 = G3 (Hiptese Nula)
H1: nem todas s so iguais (Hiptese Alternativa)
2. Estatstica de Teste
a. Aceitar Ho

b. Rejeitar Ho

c. Distribuio F de Snedecor com (p = nmero de parmetros estimados


nos modelos):
gl do numerador (pProposto pnulo),
gl do denominador (N pProposto)
Andreia Martins

3. Regra de teste
Quadrados Mdios
Factor
Quadrados Mdios
Residual

4. Deciso
5. Concluso

Soma dos
quadrados Factor
Soma dos
quadrados Residual
Soma dos
quadrados totais.

ANOVA outra vertente de fazer o processo da Regresso Linear


Os resultados da ANOVA no nos dizem nada acerca do problema que o
investigador est a estudar! Para isso precisamos de fazer contrastes planeados.
o Comparao Planeadas
Sistema de comparao de mdias usado quando o investigador tem
hipteses especficas para as diferenas entre as mdias. Esse sistema
muitas vezes chamado contrastes. Abaixo temos um exemplo de codificao
para comparaes planeadas.

C1 = Compara o grupo 1 com o grupo 2;


C2 = Compara o grupo 2 com o grupo 3.

Regras: A quantidade de contraste igual ao nmero de graus de liberdade


do numerador; A soma de cada contraste deve ser igual zero.

Andreia Martins

Contrastes Ortogonais
o Sistema de comparao de mdias usado quando o investigador tem hipteses
especficas para as diferenas entre as mdias. Abaixo temos um exemplo de
codificao para contrastes.

Contraste 1 = Compara o grupo 1 com o grupo 3;


Contraste 2 = Compara os grupos 1 e 3 (juntos) com o grupo 2.
Regras: A quantidade de contraste igual ao nmero de graus de liberdade do
numerador; a soma de cada contraste deve ser igual zero; a soma dos produtos entre
os contrastes deve ser igual a zero.

One-way Anova: Comparaes Mltiplas (Post


Hoc)

Sistema de comparao de mdias quando o investigador no tem hipteses


especificas para as diferenas entre as mdias.
Todas as mdias so comparadas umas contra as outras.
Exemplos:
o LSD Least-Significant Difference (nada conservador)
o Duncan (pouco conservador)
o Bonferroni (conservador)
o Turkey (conservador)
o Scheff (muito conservador)

Teste de Scheff
o Devem ser consideradas

diferentes

todas

as

mdias,

quando:

Quantidade de
grupos
Quadrado mdio
Residual (dentro
dos grupos

Andreia Martins

Nmero de
observaes
num dos
grupos
(pressupe
igual nmero
de
observaes
em cada
grupo)

Valor do F critico
ao nvel de
significncia
adotado

Modelos com uma Varivel Dependente Contnua e Dois Preditores


Categricos: Problema tipo 4

Resoluo do
Regresso

Problema

Usando Anlise

de

1. Definies
Efeito principal o efeito de uma VI (fator) quando as outras Vis esto no seu ponto
mdio
Efeito de interao o efeito resultante da multiplicao entre 2 ou mais Vis.
Tambm chamado efeito de moderao.
1. Codificao de cada VI em Dummy
Exemplo: Normatividade controlo 0 e Presso no fumar 1
Stress baixo 0 e alto 1
1.1. Mdias de cigarros fumados em cada condio

Andreia Martins

Cor de rosa: efeito de interao


Azul: efeito principal de Stress
Amarelo: efeito principal da
Normatividade
1.2. Erro- Padro

2. Especificao dos Modelos


2.1. Modelo Nulo

Dados
previstos

Yi = bo

Constante: valor de Yi no
modelo
quando
no
inclumos VIs grand mean

Modelo Proposto

i = b0 + b1Normatividadei + b2Stressi
Mdia de cigarros na
condio de controlo e
baixo stress

Compara a presso para no


fumar com a condio de
controlo na condio de
baixo stress

Compara o baixo com o alto


stress na condio de controlo
da presso normativa

Para obter os parmetros corretos precisamos de uma correlao


2. Correlao Bivariada (r de Pearson)

Correlaes:
rYX = A + B
rYZ = C + B
rXZ = D + B

Confunde o efeito de cada varivel independente (x e z)


na varivel dependente (y)
necessrio separar os efeitos

2.1. Correlao Parcial (correlao entre 2 variveis controlando o efeito de 3 variveis)


Exemplo: prYX_Z = A (Correlao entre Cigarros e Normas, controlando o stress)
Andreia Martins

1. Modelo Proposto

Legenda:
Mdia da
VD

Mdia da 1
VI

Sy/Sx = Desvio Padro


VD/VI
Ryx = Coeficiente de
correlao bivariada (r de
pearson) entre y e x

2. Especificao do modelo (formula)


3. Interpretao

Nesta situao os clculos do SPSS e os realizados mo no coincidem pois


calculou-se: b1 = A R2 = A + C
b2 = C
Mas precisas de calcular: b1 = A b2= C b3 = B R2 = A+B+C
Ou seja, o modelo especificado est mal, necessitamos da interao
3. Especificao do Modelo
3.1. Modelo Complexo

i = b0 + b1Normatividadei + b2Stressi + b3 (Normatividadei*Stressi )

Andreia Martins

Extrai os outputs da regresso utilizando as duas VIs e o termo de interao

Aps a criao de uma varivel com a interao entre as Vis, volta-se a especificar o
modelo com os valores especficos dos parmetros
4. Interpretao

Andreia Martins

Quando se quer testar a diferena no nmero de cigarros fumados entre a presso


para no fumar e o controlo maior na condio baixo stress do que na condio alto,
tem-se que recodificar uma das VIS (stress) e o termo de interao.
5. Recodificao da Dummy do Stress
Ou seja, inverte-se a codificao; Antes: Stress baixo =0 alto= 1
Depois: Stress baixo = 1 alto = 0

6. Interpretao

Andreia Martins

Resoluo do Problema Usando ANOVA Fatorial

1. Utilizar as duas Vis categorizadas com fatores


2. Interpretao da interao

Andreia Martins

Regresso Linear
Passos Necessrios Antes da Anlise
1. Codificao de cada VI em Dummy
2. Criao de uma varivel com a interao entre as Vis
3. Utilizar as 3 variaveis (2 dummies e a interao) com preditores na regresso
4. Interpretao do primeiro contraste

Recodificao de uma das dummies


1. Clculo de uma nova varivel com a interao entre as Vis
2. Utilizar as 3 variveis (VI recodificada, VI original e interao recalculada) como
preditores na interao
3. Interpretao do segundo contraste

4. Interpretao geral dos contrastes

Andreia Martins

ANOVA
1. Criar contrastes entre as Vis atravs da sintaxe do SPSS
2. Interao com contrastes

Regresso Linear

(apenas quando as condies da interao


tm o mesmo n (dimenso amostral)
1. Codificao de Cada VI em Dummy utilizando cdigo de contrastes para efeitos
principais (assegurar os efeitos)
2. Criar uma varivel com a interao entre as VIs

Regras:
A mdia de cada VI tem de ser igual a zero
A soma dos cdigos deve ser igual a zero
A soma dos produtos dos cdigos deve ser igual a zero
A diferena entre os cdigos deve ser igual a 1. Isto 0,5 (-0,5) =1
Andreia Martins

3. Utilizar as 3 variveis (2 Vis dummies e interao) com preditores na regresso


Especificao do modelo
4. Interpretao dos efeitos principais

ANOVA
1. Utilizar as duas Vis como factores
2. Interpretar os efeitos principais

Modelos com uma Varivel Dependente Contnua e Um Preditor


Categrico e Um Preditor Contnuo: Problema tipo 3

Regresso Linear
1. Centrar as duas variveis (Sexo e TSO)
1.1. TSO centra-se em torno da sua mdia
1.1.1. Subtrair a mdia dos valores da varivel a ser centrada, de modo que a
mdia da varivel centrada seja igual a zero. Isto TSO_C = TSO - 2,375
1.2. Sexo utiliza-se os cdigos de contraste
Necessrio definir um sistema de codificao de modo assegurar os efeitos
principais
Andreia Martins

1. Especificao do Modelo
1.1. Modelo Nulo

Yi = b0

Dados
previstos

Constante: valor de Yi no
modelo
quando
no
inclumos VIs grand mean

1.2. Modelo Completo

i = b0 + b1Sexoi + b2TSO_Ci + b3 Interaoi


Grande mdia quando
so atribudos cdigos
de contraste para a
varivel
categrica (Sexo_C) e a
varivel contnua est
centrada (TSO_C)

Efeito
Principal
do Sexo

Efeito
Principal
da TSO

Compara
masculino
com feminino
quando a
varivel TSO
est centrada
(TSO_C).
Assim, b1 =
efeito
principal do
sexo;

Interao: no
significativa
necessrio corrigir o
modelo

O efeito da
TSO quando
a varivel
sexo est no
seu ponto
mdio.
Assim, b2 =
efeito
principal da
TSO;

Coeficiente de
regresso que
representa a
interao entre
o sexo e a
TSO.

Partial2 = PRE para cada


varivel

1.3. Modelo Reduzido Recalcula-se a regresso sem o termo de interao

i = b0 + b1Sexoi + b2TSO_Ci

Na medida em que aumenta um ponto na escala de TSO, aumenta tambm 2.017


cigarros fumados. Isto acontece tanto nos homens como nas mulheres.

Andreia Martins

ANCOVA

Definio: Anlise de Varincias com ao menos um fator (um preditor categrico) e


tambm ao menos um preditor contnuo.

1. Especificao do Modelo
1.1. Modelo Completo

i = b0 + b1Sexoi + b2TSOi + b3 (Sexoi*TSOi )


2. Estimao dos Parmetros

3. Estimao do Modelo (TSO Centrada)

Andreia Martins

4. Interpretao

Andreia Martins

5. Testar os contrastes
5.1. Codificar o sexo como 0 (homens) e 1 (mulheres)
5.2. Utilizar as variaveis sexo e TSO centrada na regressao
5.3. Intrepretar b2

b2 = variao no nmero de cigarros fumados em funo da TSO para os homens


5.4. Recodificar sexo como 0 (mulheres) e 1 (homens)
5.5. Utilizar a varivel sexo10 e TSO centrada na regresso
5.6. Interpretar b2

b2 = variao no nmero de cigarros fumados em funo da TSO para os homens

Andreia Martins

Introduo Anlise Fatorial

Caractersticas:
o Mtodo estatstico para a descrio de variveis latentes;
o A varincia decomposta em comum (explicada) e nica (erro);
o Tem um modelo de medida subjacente s anlises;
o O nmero de fatores menor do que o nmero de variveis.

O problema deste tipo por exemplo: Eles foram instrudos a estimar em que medida
as pessoas representadas nos itens costumam fumar. As respostas para cada item
podiam variar de 0 (fumam pouco) a 4 (fumam muito). Os item so os seguintes: Item
1: Os amigos da universidade; Item 2: Os familiares; Item 3: As pessoas em
o Neste tipo de anlise as variveis so:

Sistema de Equaes

Variveis manifestas
(observveis) no
individuo. Normalmente
camado de item ou
indicador

Yi1 = 1Fator + ei1


Yi2 = 2Fator + ei2
Yin = nFator + ein

Erros de estimao.
Normalmente
chamados erros de
medida

Coeficiente de
regresso
estandardizados que
representam o peso do
o Mtodo de Centroide fator em cada item
Para calcular os betas sem dados sobre a normatividade:

ri-n = Somatrio das correlaes do item i com todos os itens (incluindo a correo do
item com si prprio).
o Apenas precisa de saber as correlaes entre as variveis
Interpretao

Andreia Martins

Mltiplos Fatores

O problema base: O investidor considera que estes itens medem dimenses


diferentes da adio, especificamente: 3 deles medem a Normatividade, outros 3 a
Compulso, e finalmente outros e a Atitude em relao ao consumo.

Rotao Ortogonal

Sistema de Equaes Fatores ortogonais


Ci1 = 11Fator1 + 12Fator2 + 13Fator3 + ei1
Ci2 = 21Fator1 + 22Fator2 + 23Fator3 + ei2
Ci3 = 31Fator1 + 32Fator2 + 33Fator3 + ei3
Ai1 = 41Fator1 + 42Fator2 + 43Fator3 + ei4
Ai2 = 51Fator1 + 42Fator2 + 53Fator3 + ei5
Ai3 = 61Fator1 + 42Fator2 + 63Fator3 + ei6
Estimao dos parmetros

Andreia Martins

Avaliao de fatores (autovalores)


o Um factor consistente (existe) quando o autovalor > 1.00
o Autovalores = 2F1 F2 2F3
o Calcular-los

Autovalores (Factor 1) = 0.8422 + 0.8662 + ... 0.1792 = 2.435


Autovalores (Factor 2) = 0.1452 + 0.1552 + ... 0.2222 = 1.978
Autovalores (Factor 3) = 0.1872 + 0.1782 + ... 0.6332 = 1.327

o Calcular a varincia explicada

Andreia Martins

Para ser descobrir se um item pertence a um factor temos a comunalidades h2:


O item pertence ao factor se h2 > 0.09 e 0.30
1. Calcular a Comunidade

2. Calcular o Beta

Andreia Martins

Rotao Oblqua

Fatores correlacionados

Sistema Equacionais
Ci1 = 11Fator1 + 12Fator2 + 13Fator3 + ei1
Ci2 = 21Fator1 + 22Fator2 + 23Fator3 + ei2
Ci3 = 31Fator1 + 32Fator2 + 33Fator3 + ei3
Ai1 = 41Fator1 + 42Fator2 + 43Fator3 + ei4
Ai2 = 51Fator1 + 42Fator2 + 53Fator3 + ei5
Ai3 = 61Fator1 + 42Fator2 + 63Fator3 + ei6

Andreia Martins

Para ser descobrir se um item pertence a um factor temos a comunalidades h2:


O item pertence ao factor se h2 > 0.09 e 0.30
1. Calcular a Comunidade

2. Calcular o Beta

Andreia Martins

Anlise No Paramtrica (tipo 4)

Problemas: O investigador quer saber se o nvel de ansiedade influencia

a classificao que os alunos obtm num exame de matemtica. Ele


quer testar a hiptese de que o nvel de ansiedade moderada leva os
alunos a obterem melhores resultados. Para testar esta hiptese, o
investigador manipulou a ansiedade (baixa vs. moderada) enquanto os
alunos realizavam o exame. Em seguida, observou a classificao
obtida por cada aluno no exame.

As variveis tm de ser ordinais (rank)


Estimao dos Parmetros

Andreia Martins

Representaes

Outro Problema: Noutro estudo sobre a influncia do nvel de ansiedade


na classificao que os alunos obtm num exame de matemtica, o
investigador testou as seguintes hipteses: o nvel de ansiedade
moderada leva os alunos a obterem melhores resultados do que o nvel
de ansiedade baixa; o nvel alto de ansiedade leva os alunos a obterem
piores resultados do que a ansiedade moderada. Para testar estas
hipteses, o investigador manipulou a ansiedade (baixa vs. moderada
vs. alta) enquanto os alunos realizavam o exame. (tipo 4)

Andreia Martins

Problema: Um investigador pretende saber se o sexo dos jovens (masculino vs.


feminino) prediz a sua aprovao na seleo para uma bolsa de investigacao.
Os Dados esto apresentados na Tabela seguinte.

Andreia Martins

Anlise dos Pressupostos para Anlise de Dados


4 Bsicos

Ausncia de Outliers
Normalidade da distribuio dos erros;
A Homogeneidade dos erros;
Ausncia de multicolinearidade
1. Outliers
o Definio: so casos\observaes to extremadas que se situam fora da
distribuio prevista da varivel na populao.
o Pode ocorrer tanto na VD como na VI

o Se o Erro/desvio-padro ultrapassar o 3 ou -3 este pressuposto um


outline.

Andreia Martins

Soluo:
o Ver se os outliers resultam de erros (na insero dos dados ou ma
interpretao da resposta)
Se houver algum destes erros, corrigir
o Se no houver, faze-se estes passos:
I. Correr a anlise incluindo os outliers
II. Correr a anlise excluindo os outliers
III. Avaliar os resultados
Se, na analise que fizeste primeiro (com outliers) deu NAO
significativo. e na analise que fizeste depois (sem outliers) deu
significativo. ou seja, se deram interpretaao diferentes, analisas
SEM outliers (a segunda);
No entanto... se derem ambas no significativas, ou seja, se
ambas tiverem a mesma interpretaao, analisas COM outlier (a
primeira)
2. Distribuio Normal dos Erros

o Precisa-se de Anlise do seu achatamento (kurtosis) e o enviesamento


(skewness):

Andreia Martins

Ou ento fazemos pelo Teste de Kolmogorov-Smirnov

Soluo:
o Transformao da varivel dependente:

Andreia Martins

3. Homogeneidade dos Erros


Definio: significa que a sua variabilidade (SSE; varincia; desvio-padro) so
iguais em todas as condies da varivel independente.

Anlise Estatstica:

Soluo:

Andreia Martins

o Escolhe-se o erro que se aproxima mais do zero


4. Multicolinariedade
Definio: ocorre quando as variveis independentes so fortemente
correlacionadas. Os problemas ocorrem sempre quando a correlao entre as
VIs so maiores do que 0.90.
Quando analisamos um modelo com 2 preditores:

Solues
o Usar apenas uma das variveis
o Fazer um compsito das 2 variveis
Ansiedade + stress / 2
o Se houver mais do que 2 VI
Anlise fatorial dos preditores
Se emergir apenas um fator, fazer um compsito
Se emergirem mais do que um fator, fazer os compsitos
consoante o nmero de fatores.

Andreia Martins

Potrebbero piacerti anche