Sei sulla pagina 1di 42

25-10-2013

MTODOS E TCNICAS DE
INVESTIGAO E ANLISE DE
DADOS EM EDUCAO
Prof. Doutor Jos-Antnio Carochinho
jose.antonio.carochinho@gmail.com

25-10-2013

Os Packages estatsticos
Os dados quantitativos requerem tratamento em pacotes estatsticos

Existem vrios pacotes estatsticos no mercado, R Statistica SPSS, etc.

25-10-2013

O mais popular o SPSS que tem tido vrias designaes:


SPSS PAWS SPSS IBM SPSS

PAWS-SPSS 18
Predictive Analytics Software
Statistical Package for Social Sciences

IBM-SPSS verso19 e verso 20

A partir da verso 19 o SPSS foi adquirido pela IBM e passou a


designar-se IBM SPSS

25-10-2013

O SPSS funciona base de Janelas. Eis um exemplo da janela referente base


de dados: nas colunas colocam-se as variveis e nas linhas os sujeitos / casos

Exemplo de uma caixa de dilogo do SPSS

25-10-2013

Exemplo de uma janela de outputs :

Neste momento devem ler o pdf:


SPSS_consideraes elementares

25-10-2013

Apresentao dos resultados

25-10-2013

Tabelas e Grficos
SEXO

Valid

masculino
f eminino
Tot al

Frequency
76
52
128

Percent
59, 4
40, 6
100,0

Valid Percent
59, 4
40, 6
100,0

Cumulat iv e
Percent
59, 4
100,0

SEXO
feminino

Uma das formas de apresentar os


resultados poder ser atravs de
tabelas e grficos.
Normalmente utilizam-se
sectogramas quando a varivel em
questo est operacionalizada em
duas categorias

masculino

Tabelas e Grficos
ANT

Valid

menos de 1 ano
ent re 1 e 5 anos
ent re 6 e 15 anos
mais de 15 anos
Tot al

Frequency
19
25
30
54
128

Percent
14, 8
19, 5
23, 4
42, 2
100,0

Valid Percent
14, 8
19, 5
23, 4
42, 2
100,0

Cumulat iv e
Percent
14, 8
34, 4
57, 8
100,0

ANT
60

50

40

30

20

Frequency

Uma das formas de apresentar os


resultados poder ser atravs de
tabelas e grficos.
Normalmente utilizam-se grficos
de barras quando a varivel em
questo est operacionalizada em
vrias categorias

10
0
menos de 1 ano

entre 6 e 15 anos

entre 1 e 5 anos

mais de 15 anos

ANT

25-10-2013

Tabelas e Grficos

O histograma de frequncias o ideal


para visualmente se analisar uma
determinada distribuio de resultados.
No presente caso refere-se ao
compromisso afectivo de uma
determinada amostra mensurado numa
escala de 7 posicionamentos possveis

IA

1, 75
2, 00
2, 25
2, 38
2, 50
2, 63
2, 75
2, 88
3, 00
3, 13
3, 25
3, 38
3, 50
3, 63
3, 75
3, 88
4, 00
4, 13
4, 25
4, 38
4, 50
4, 63
4, 75
4, 88
5, 00
5, 13
5, 25
5, 38
5, 50
5, 63
5, 75
6, 00
6, 13
6, 25
6, 38
6, 50
6, 63
7, 00
Tot al

Percent
,8
,8
1, 6
,8
,8
,8
3, 1
1, 6
,8
1, 6
1, 6
3, 1
1, 6
3, 1
,8
4, 7
4, 7
3, 9
3, 9
3, 9
5, 5
3, 9
5, 5
4, 7
3, 9
4, 7
3, 1
3, 9
4, 7
2, 3
2, 3
2, 3
3, 9
2, 3
,8
,8
,8
,8
100,0

Valid Perc ent


,8
,8
1, 6
,8
,8
,8
3, 1
1, 6
,8
1, 6
1, 6
3, 1
1, 6
3, 1
,8
4, 7
4, 7
3, 9
3, 9
3, 9
5, 5
3, 9
5, 5
4, 7
3, 9
4, 7
3, 1
3, 9
4, 7
2, 3
2, 3
2, 3
3, 9
2, 3
,8
,8
,8
,8
100,0

Cum ulativ e
Percent
,8
1, 6
3, 1
3, 9
4, 7
5, 5
8, 6
10, 2
10, 9
12, 5
14, 1
17, 2
18, 8
21, 9
22, 7
27, 3
32, 0
35, 9
39, 8
43, 8
49, 2
53, 1
58, 6
63, 3
67, 2
71, 9
75, 0
78, 9
83, 6
85, 9
88, 3
90, 6
94, 5
96, 9
97, 7
98, 4
99, 2
100,0

Frequency

Valid

F requency
1
1
2
1
1
1
4
2
1
2
2
4
2
4
1
6
6
5
5
5
7
5
7
6
5
6
4
5
6
3
3
3
5
3
1
1
1
1
128

IA
30

20

10

Std. Dev = 1,09


Mean = 4,53
N = 128,00

0
2,00

3,00

2,50

4,00

3,50

5,00

4,50

6,00

5,50

7,00

6,50

IA

O tratamento estatstico dos dados

25-10-2013

vejamos um ex de um problema e respectiva formulao de


hipteses:
Problema: Queremos estudar a problemtica da percepo dos
riscos laborais em funo da antiguidade.
Hiptese direccional: Os indivduos com menor antiguidade tm
uma menor percepo dos riscos laborais do que os indivduos que
tm maior antiguidade.
Qual a hiptese nula ?
Qual a hiptese contrria ?
Qual a varivel independente ? ___________________
Qual a varivel dependente ? ____________________

E como esto
operacionalizadas ?

vejamos um outro ex de um problema e respectiva formulao


de hipteses:
Problema: Queremos estudar a problemtica do receio de trabalhar
nos turnos da noite em funo do gnero.
Hiptese direccional: Os homens tm menor receio de trabalhar
noite do que as mulheres.
Qual a hiptese nula ?
Qual a hiptese contrria ?
Qual a varivel independente ? ___________________

Qual a varivel dependente ? ____________________

E como esto
operacionalizadas ?

25-10-2013

Para saber se h diferenas significativas entre as


condies das variveis previstas numa hiptese
necessrio efectuar-se um teste estatstico e os
resultados destes vem associados a uma
probabilidade de aceitao (nvel de significncia).
com base no nvel de significncia que se aceita
ou rejeita uma hiptese!

Ao rejeitarmos uma hiptese pode-se aceitar a sua


contrria ou a nula (que preconiza a no existncia de
diferenas entre os grupos comparados na varivel em
questo).

p< 0,05 = nvel de significncia de 95%


p< 0,01 = nvel de significncia de 100%

Aceitar uma hiptese para um nvel de


significncia de 95% significa 5% de erro em 100.
Ou seja, em 100 sujeitos, 5 devido ao ocaso
(ou a erros).
Aceitar uma hiptese para um nvel de
significncia de 99% significa 1% de erro em 100.
Ou seja, em 100 sujeitos, 1 devido ao ocaso
(ou a erros).
Compete-lhe a si decidir quais os riscos que est disposto a aceitar ao
considerar se os resultados da sua experincia so ou no
significativos.

10

25-10-2013

populao

Amostra

Com base nos resultados dos testes de hipteses (e


respectivo nvel de significncia) e se a amostra for
aleatria, com representatividade e significncia
podemos ento fazer inferncias para a populao de
onde a amostra foi extrada.

Testes estatsticos

Testes paramtricos

Testes no
paramtricos

11

25-10-2013

elaborado por Jos-Antnio Carochinho

ESTATSTICAS
Estatsticas paramtricas

Estatsticas no - paramtricas

A diferena entre testes paramtricos e no paramtricos diz respeito


ao mtodo de clculo das probabilidades (isto a probabilidade
aleatria suficientemente baixa para rejeitar a hiptese nula e aceitar
a hiptese experimental).
O mtodo paramtrico mede a
variabilidade nos resultados dos
sujeitos de forma directa, logo
as estatsticas paramtricas
so mais potentes (mais
poderosas) que as no
paramtricas, no sentido de
terem em considerao mais
informao acerca das
diferenas entre os resultados.

O mtodo no paramtrico
mede a variabilidade nos
resultados dos sujeitos de forma
indirecta

Ter em ateno que existem


requisitos prprios relativos
utilizao de testes
paramtricos

elaborado por Jos-Antnio Carochinho

ESTATSTICAS
Estatsticas paramtricas
Requisitos necessrios para a utilizao de testes paramtricos:
Os resultados experimentais (da varivel dependente) devem
ser medidos em escalas ordinais ou intervalares. Nunca
em escala nominais.
Os resultados so normalmente distribudos. Isto , a
distribuio dos resultados deve seguir uma curva normal.
[Logo h que fazer um teste de normalidade: teste de
Kolmogorov-Smirnov (N>50) ou teste de Shapiro-Wilk (N<50)].
A variabilidade dos resultados para cada situao experimental
deve ser aproximadamente a mesma, ou seja, deve haver
homogeneidade da varincia.
[h que efectuar um teste prprio para o efeito - teste de
homogeneidade da varincia: teste de Levene].

12

25-10-2013

elaborado por Jos-Antnio Carochinho

ESTATSTICAS

Estatsticas paramtricas
Requisitos necessrios para a utilizao de testes paramtricos (continuao):

Testede
de normalidade
normalidade: :
Teste
teste de Kolmogorov-Smirnov ( se N>50) ou teste de Shapiro-Wilk (se N<50)]
Tests of normality

___________________________________________________________
Kolmogorov-smirnov
Shapiro-Wilk_____________
Statistics
df
Sig.
Statisticas
df
Sig.
___________________________________________________________
VD
0.097 30 .200
.958
30
.274
______________________________________________________________
___________________________________

Comandos do SPSS:

Se p > 0.05 ento a distribuio


segue a curva normal

Analyze
Descriptive statistics
Explore
Dependent list: inserir a VD
Display: Plots
Na caixa Plots seleccionar: Normality plots with tests

elaborado por Jos-Antnio Carochinho

ESTATSTICAS
Estatsticas paramtricas
Requisitos necessrios para a utilizao de testes paramtricos (continuao):
teste de
homogeneidade da
varincia: teste de
Levene

Test of homogeneity of variances


_________________________________
Levene satistic df1
df2
Sig.
_________________________________
.705
2
87
.497
_________________________________

Neste caso, o teste de


homogeneidade de varincias revela
que estas no diferem
significativamente entre os grupos
porque o nvel de significncia
superior a 95% (sig. > 0.05)

Comandos do SPSS:
Analyze
Compare means
One-way Anova
Dependet list: indicar a VD
Factor: indicar a VI
Post Hoc : seleccionar Scheffe
Options: descriptive e
Homogeneneity of variance test

13

25-10-2013

Ateno que nos testes de normalidade de Shapiro-Wilk


ou no de Kolmogorov-Smirnov ou no teste de Levene
(homogeneidade das varincias)
o valor da significncia deve ser superior a 0,05
p > 0,05
Nos restantes testes (que vamos falar a seguir) para ser
significativo deve ser o contrrio:
p < 0,05

Mapa elaborado por Jos-Antnio Carochinho

Mapa do percurso estatstico a seguir:

Analyze
Descriptive statistics
Explore
Dependent list indicar a varivel
Plots
Normality plots with tests
Continue
OK

Varivel Dependente

Distribuio normal ?

Kolmogorov-Smirnov (N>50)
Shapiro-Wilk (N<50)

SIM

NO

Estatsticas paramtricas

Estatsticas no - paramtricas

Varivel Independente

t-student

F - Anova-one way

U Mann-Whitney

(VI: operacionalizada em 2 grupos) (VI: operacionalizada em K grupos ou categorias)

Analyze
Compare means
Independent samples T test
Test vaiable (VD)
Grouping variable (VI)
Define Groups
Group 1: 1 Group 2: 2
Continue
OK

Analyze
Compare means
One-way anova
Dependet list: (VD)
Factor: (VI)
Options: descriptive
Post-hoc: Scheffe
Continue
OK

C
o
m
a
n
d
o
s
d
o
S
P
S
S

H Kruskal-Wallis

(VI: operacionalizada em 2 grupos ou cat.) (VI: operacionalizada em K grupos ou cat.)

Analyze
Nonparametric tests
2 independent samples
Test variable list (VD)
Grouping variable (VI)
Define groups
Group 1: 1 Group 2: 2
Continue
OK

Analyze
Nonparametric tests
K independent samples
Test variable list (VD)
Grouping variable (VI)
Define range
minimo : 1 maximo: __
Continue
OK

14

25-10-2013

Estatsticas paramtricas

Como deve vir referido no


texto:

Estatsticas no - paramtricas

O que significa:

t = 1,25; p<0,05

significativo para um nvel de significncia de 95%

t = 1,25; p=0,05

no significativo para um nvel de significncia de 95%

F= 0,25; p<0,05

significativo para um nvel de significncia de 95%

F = 0,25; p=0,05

no significativo para um nvel de significncia de 95%

H= 125,00; p<0,05

significativo para um nvel de significncia de 95%

H = 125,00; p=0,05

no significativo para um nvel de significncia de 95%

U = 145,00; p<0,05

significativo para um nvel de significncia de 95%

U= 145,00; p=0,05

no significativo para um nvel de significncia de 95%

15

25-10-2013

O teste de t de Student
Para amostras independentes e dependentes

Quando queremos compara 2 amostras independentes


com o teste t de Student

Exemplos:
Homens mulheres
Alunos com NEE alunos sem NEE
Professores de Portugus professores de matemtica
Professores do ensino regular professores de EE

16

25-10-2013

Amostras Independentes
O que so amostras independentes ?
FALAMOS DE AMOSTRAS INDEPENDENTES QUANDO COMPARAMOS 2
SITUAES EM OS INDIVDUOS PERTENCEM A GRUPOS DIFERENTES

Queremos comparar 2 grupos aqui e agora


VI = gnero [sexo masculino e sexo feminino]

Queremos comparar indivduos em funo da localizao


geogrfica
VI = Localizao geogrfica [Norte e Sul]

Queremos compara 2 grupos de estudantes


VI = Tipo curso [Estudos de segurana e Direito]

Abordagem de um grupo de indivduos apenas uma vez em relao


a uma ou vrias condies.
A amostra considerada uma parte da populao e podem ser feitas
comparaes entre subgrupos (ex sexo, grupo etrio, habilitaes, )
e ou explorar relaes entre variveis.
Vantagens:
Baixo custo

Alta percentagem de resposta


Pouco tempo de implementao
Replicvel
Exs:
Sondagens, inquritos
Estudos de mercados

Desvantagens:
Susceptveis altura em que os
dados so recolhidos
Influncia de factores externos
incontrolveis para o investigador
No h informao sobre mudanas
em cada indivduo

17

25-10-2013

Lembram-se dos
comandos do
SPSS

t-student
(VI: operacionalizada em 2 grupos)

Analyze
Compare means
Independent samples T test
Test vaiable (VD)
Grouping variable (VI)
Define Groups
Group 1: 1 Group 2: 2
Continue
OK

Quando queremos compara 1 amostra em 2 momentos


diferentes

18

25-10-2013

Testes t de Student para amostras


dependentes
O que so amostras dependentes ?
Amostras dependentes significa que os
indivduos da amostra so os mesmos,
mas observados em 2 momentos diferentes.

Ou seja falamos em amostras dependentes quando


Queremos observar 2 vezes os mesmos indivduos!
Portanto so estamos nesses casos perante estudos
pr-teste, ps-ps teste ou
perante estudos longitudinais

Amostras Dependentes
O que so amostras dependentes ?
FALAMOS DE AMOSTRAS DEPENDENTES QUANDO COMPARAMOS 2 SITUAES
EM OS INDIVDUOS SO OS MESMOS

Quero analisar a
ansiedade antes
dum exame

ANTES

Quero analisar a
ansiedade aps
um exame

DEPOIS

tempo

VI = situao no tempo: antes e depois


VD = Ansiedade

19

25-10-2013

Amostras Dependentes
Vejamos outro ex do que so amostras dependentes ?
FALAMOS DE AMOSTRAS DEPENDENTES QUANDO COMPARAMOS 2 SITUAES
EM OS INDIVDUOS SO OS MESMOS

Quero analisar as
atitude face
importncia da
segurana

ANTES

Quero analisar as
atitude face
importncia da
segurana

DEPOIS

tempo

VI = situao no tempo: antes e depois


VD = Atitude face importncia da segurana

Amostras Dependentes
Vejamos outro ex do que so amostras dependentes ?

Quero analisar o
grau de
preocupao com
as medidas de
segurana

ANTES

Quero analisar o
grau de
preocupao com
as medidas de
segurana

DEPOIS

tempo

VI = _______________________________
VD = ______________________________

20

25-10-2013

Utilizam o mesmo grupo de sujeitos que so avaliados com medidas


repetidas (isto 2 vezes), pr-teste / ps-teste.
Inclui o uso de uma amostra em que as mesmas condies so
avaliadas ao longo de um determinado perodo de tempo.
Vantagens:
Capacidade de seguir e
monitorizar o efeito.
As variveis relativas aos
sujeitos so controladas.

Desvantagens:
Efeito do tempo que medeia o1 e o 2
momento de observao.
Mortalidade experimental

Ex

Os sujeitos que se mantm podem ser


significativamente diferentes do que
desistem

Sondagens sentido de voto

Efeito de aprendizagem

Efeito da aprendizagem

Teste t de Student
Amostras

Amostras
Independentes

Dependentes

Analize

Analize

Compare means

Compare means

Independent-samples T test

Paired-samples T test

Test Variables (seleccionar a VD)

(seleccionar as variveis)

Grouping variable (seleccionar a VI)

--------------------------------------------

Define Groups

Pair

Group 1 : indicar a categoria 1

variable 2

--------------------------------------------

Group 2 : indicar a categoria 2

Continue
OK

variable 1

----------------------------------------------OK

21

25-10-2013

Testes t de Student no SPSS

A-B
Teste t de Student para
amostras independentes

A1-A2
Teste t de Student para
amostras dependentes

Amostras Independentes

22

25-10-2013

Amostras Dependentes

A Comparao post-hoc das mdias

23

25-10-2013

Quando queremos analisar a eventual diferena de


mdias de grupos e a distribuio da VD segue os
padres de Normalidade

VI operacionalizada
em 2 categorias

VI operacionalizada
em k categorias
(K=mais que 2 categorias)

t - student

One-way ANOVA

para amostras independentes

24

25-10-2013

Assumindo que possvel utilizar estatsticas paramtricas

VI Gnero: [S.masculino / S. feminino]

VD Percepo de risco de aumento da insegurana


pblica (operacionalizada atravs de uma escala tipo Likert de 5 posicionamentos)
Teste t de Student para amostras independentes

t=-6,46; p=0,00

( h diferenas significativas)
Depois h que
analisar a tabela das
mdias para ver
qual dos grupos tem
a mdia superior

O sexo masculino apresenta uma mdia superior

25

25-10-2013

Assumindo que possvel utilizar estatsticas paramtricas

VI Grupo etrio: [at aos 30; 30-40, >40 anos]

VD Percepo de risco de ocorrncia de catstrofes naturais (operacionalizada


atravs de uma escala tipo Likert de 5 posicionamentos)

One-way Anova (Anlise de varincia ANOVA ONE-WAY)

F=26,40; p=0,00 ( h diferenas significativas, mas entre que grupos etrios ?)

26

25-10-2013

As mdias dos grupos no chegam!

Temos que solicitar a comparao post-hoc das mdias

Existem diferenas entre o grupo com idade at aos 30 anos e o grupo com
Idades compreendidas entre os 31-40 anos
Existem diferenas entre o grupo com idade at aos 30 anos e o grupo com
Idades superiores aos 40 anos

Existem diferenas entre o grupo com idade at aos 30 anos e o grupo com
Idades compreendidas entre os 31-40 anos
G (idade at aos 30 anos)
(M=1,26; DP=0,44)

G (idade at aos 30 anos)

G (idades 31-40 anos)


(M=2,33; DP=1,15)

<

G (idades 31-40 anos)

Existem diferenas entre o grupo com idade at aos 30 anos e o grupo com
Idades superiores aos 40 anos

G (idade at aos 30 anos)


(M=1,26; DP=0,44)
G (idade at aos 30 anos)

G (idades > 40 anos)


(M=2,16; DP=1,28)
< G (idades 31-40 anos)

Ento podemos concluir que existem diferenas significativas na percepo do risco de


emergncia de catstrofes naturais (F=26,40; p=0,00). A comparao post-hoc das mdias
mediante teste de Sheffe indica-nos que essas diferenas se verificam entre o grupo de
indivduos com idade at aos 30 anos e idades compreendidas entre os 31 e os 40 anos e,
igualmente entre os primeiros e o grupo com idades superiores a 40 anos, sendo que, em
ambos os casos, os indivduos com idades mais avanadas percepcionam maior risco que os
mais novos.

27

25-10-2013

Comandos no SPSS para a anlise de varincia ANOVA ONE-WAY


Analyse
Compare means

One-way Anova
Dependent list colocar a VD
Factor colocar a VI
Post-hoc assinalar Scheffe
Continue
Options assinalar Descriptives
Continue
OK

Os testes de Qui-quadrado

28

25-10-2013

Testes do Qui-quadrado

Os testes de Qui-quadrado de ajustamento so


aplicados na anlise de contagens de dados, cuja
apresentao sumria possa ser feita sobre a forma de
contagem de variveis categoriais ou discretas
Podem ser aplicadas a uma s varivel
Teste de ajustamento do Qui-quadrado

Ou ao estudo da relao entre duas ou mesmo


mais variveis nominais
Teste de independncia do Qui-quadrado

Teste de ajustamento
do Qui-quadrado

Teste de independncia
do Qui-quadrado

29

25-10-2013

Teste de ajustamento do Qui-quadrado

Como o seu nome indica um teste utilizado no estudo


da conformidade da distribuio amostral a uma
determinada varivel categorial ou discreta a um
modelo de distribuio populacional.

Quando se divide uma varivel em 2 categorias pode-se


utilizar o teste Qui-quadrado para verificar se a varivel
no ficou enviesada para uma das categorias, isto se as
categorias tm iguais propores.

Teste de independncia do Qui-quadrado

Tem equivalncia aos testes de diferenas de mdias.


Nos testes de diferenas de mdias, a VD tem qualquer
nvel de medida excepto nominal.
O teste de Qui-quadrado utiliza-se quando a VD tem um
nvel de medida ordinal.

30

25-10-2013

Comandos no SPSS para o teste Qui-quadrado de Ajustamento

Analyse
Non parametric test
Chi-Square
Test variable list seleccionar a varivel
OK

Comandos no SPSS para o teste Qui-quadrado de Ajustamento

O nvel de significncia
superior a 0,05 pelo que se
aceita a hiptese nula que
afirma que os valores
observados se ajustam aos
valores esperados. Por
outras palavras que no h
enviesamentos em
nenhuma das categorias.

31

25-10-2013

Comandos no SPSS para o teste de independncia do Qui-quadrado

Analyse
Descriptives statistics
Crosstabs
Row(s) indicar a varivel independente
Column(s) indicar a varivel dependente
Na caixa Statistics seleccionar chi-square
Na caixa Cells seleccionar: observed e expected
OK

O Conceito de correlao

32

25-10-2013

Associao entre variveis:


O conceito de Correlao
O grau de relao entre duas variveis designa-se por correlao, e a sua
medida quantitativa por coeficiente de correlao.
O conceito de correlao linear uma medida do grau de associao
entre variveis.
Designa-se por correlao linear simples quando definido para 2
variveis.
Designa-se por correlao linear mltiplo quando definido entre mais de
2 variveis.
Designa-se por r e pode ser positiva ou negativa
As medidas de correlao indicam a fora e a direco da associao entre um par de variveis

O coeficiente de correlao toma valores que vo de -1 a +


1, correspondendo o zero a no haver correlao, ou seja,
as variveis serem independentes.
O sinal + e indica a direco da correlao:
+ indica uma relao directa e o uma relao inversa.
Se r = +1 Correlao perfeita positiva (ou directa)
Se r = -1 Correlao perfeita negativa (ou inversa)
Quanto mais prximo de 1 for o valor da correlao maior a
associao entre as variveis.
Quanto mais prximo de 0 for o valor da correlao menor a
associao entre as variveis.

As correlaes so consideradas:
altas se em valor absoluto forem superiores a 0,7 (+ 0,70 ou - 0,70);
mdias se apresentam valores entre 0,4 e 0,6;
baixas se inferiores a 0,3

33

25-10-2013

O valor de r est sempre entre -1 e +1, com r = 0


correspondendo no associao.

Usamos o termo correlao positiva quando r >0 , e nesse caso medida


que x cresce tambm cresce y , e correlao negativa quando r < 0, e
nesse caso medida que x cresce, y decresce.
Quanto maior o valor de r (positivo ou negativo), mais forte a associao. No
extremo, se r = 1 ou r = -1 ento todos os pontos no grfico de
disperso caem exactamente numa linha recta.
No outro extremo, se r = 0 no existe nenhuma associao linear.

34

25-10-2013

Varivel 1

O grfico da representao da correlao entre 2


variveis designa-se por diagrama de disperso

As duas variveis
(varivel 1 e varivel 2)
no
esto correlacionadas

Varivel 2

r = 0,00

Correlao positiva fraca

r = 0,01

Correlao positiva forte

r = 0,87

Correlao positiva perfeita

r = 1,00

35

25-10-2013

Correlao negativa forte

Correlao negativa perfeita

r = - 0,01

r = - 0,87

r = - 1,00

Varivel 1

Correlao negativa fraca

Varivel 2

As duas variveis
(varivel 1 e varivel 2)
no
esto correlacionadas

r = 0,00

36

25-10-2013

Ex de correlao positiva

37

25-10-2013

Vrios diagramas de correlao entre duas variveis:


r = +0.95

r= 0.00

r = +0.75

r=-0.95

r= +0.60

r=-0.75

38

25-10-2013

Pensamos em correlao quando pretendemos saber se existe


alguma relao entre, por exemplo, duas variveis.

H vrias perguntas que ns colocamos no nosso dia-adia, como por exemplo:


Se existe alguma relao entre a beleza e inteligncia,
Se existe alguma relao entre fumar e doenas cardiovasculares
Se existe alguma relao entre a delinquncia e os antecedentes
de classe social
Podemos observar a relao entre duas variveis, atravs
dos diagramas de correlao ou atravs de um coeficiente
numrico (veja-se a projeco seguinte).

diagramas de correlao

um coeficiente numrico

r = 0,87

X e y so 2 variveis
O r (minsculo) o smbolo estatstico da correlao

39

25-10-2013

questes

que

podemos

formular

a) existe uma relao entre duas variveis?


Se a resposta for sim, ento prosseguem as outras duas questes:

b) qual a direco da relao?

c) qual a magnitude?

Duas variveis X e Y
X nvel scio econmico
Y n de criminalidade financeira

r=0,87

a) Existe uma relao entre duas variveis? Sim


b) Qual a direco da relao? positiva ou directa, ou seja a
criminalidade financeira aparece associada ao nvel scio-econmico
c) Qual a magnitude? Elevada (porque o r de 0,87)

40

25-10-2013

Coeficiente de correlao de Pearson

Para variveis do tipo


quantitativo (nveis de medida
intervalares e de rcio)
Coeficiente de correlao de Spearman

Normalmente denominado
pela letra grega (rho),
Para variveis do tipo
qualitativo (nveis de medida
nominais ou ordinais)

N DE INTERNAMENTOS POR DESIDRATAO

Vejamos as seguintes variveis: n de


internamentos hospitalares por
desidratao e n de refrigerantes
vendidos

N DE REFRIGERANTES VENDIDOS

As duas variveis aparecem


associadas

Quando a temperatura
aumenta, aumenta a
venda de refrigerantes e
os casos de desidratao

Poderemos concluir que os


refrigerantes causam
desidratao ?

41

25-10-2013

verificou-se que, nas cidades


escandinavas, existe correlao
positiva entre o n de ninhos
de cegonhas e a taxa de
natalidade.

Ou seja as duas variveis (ninhos de cegonha


e taxa de natalidade)aparecem
associadas

Poderemos concluir que existe alguma


relao entre o n de ninhos de
cegonhas e o nascimento de crianas?

Quanto maior a cidade,


maior o n de telhados
onde as cegonhas fazem
os ninhos e maior o n
de nascimentos.

Se existir uma elevada correlao entre a residncia em bairros problemticos e


casos de toxicodependncia tal no quer dizer que, eu por viver num bairro
problemtico sou toxicodependente, ou que todos os toxicodependentes vivem
em bairros problemticos.

42

Potrebbero piacerti anche