Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
60
0.04
40
v
0
40
(x)
0.02
0.01
20
0.03
20
60
0.00
60
40
20
0
u
20
40
60
20
40
Distncia (m)
60
80
2013/2014
Regina Bispo (DEIO/FCUL)
Laboratrio III
2013/2014
1 / 122
Programa
1
2
Introduo
SPSS-Statistical Package for Social Sciences
Operaes bsicas. Introduo de dados e denio de variveis.
1
1
2
3
4
Transformao de dados
1
2
5
6
Recodicao de valores.
Clculo de uma nova varivel.
A ajuda do SPSS.
Nomes, tipos, rtulos, missing values, escala e formato de apresentao de variveis.
A importao e exportao de dados de e para outras fontes.
Introduo e edio de dados e procura de informao.
Laboratrio III
2013/2014
2 / 122
Programa
1
1
2
2
3
5
6
Expresses e objectos.
Funes e programao estruturada com R.
Laboratrio III
2013/2014
3 / 122
Programa
Mtodo de ensino: As aulas sero baseadas numa exposio terico-prtica do
funcionamento dos softwares. A aprendizagem dos contedos apreendidos ser
feita explorando bases de dados reais em laboratrio.
Ateno
Neste curso ser apresentado aos alunos o modo/lgica de funcionamento dos softwares. No ser
(nem poderia ser) um curso exaustivo! Ser apenas exemplicado o modo de execuo de algumas das
principais tcnicas bsicas de anlise estatstica.
Avaliao:
1
Bibliograa:
1
2
3
Crawley, M. (2008).
. John Wily & Sons.
Faraway, J. (2004).
. Chapman & Hall/CRC.
Maroco, J. (2012). Anlise Estatstica com utilizao do SPSS. Ed.ReportNumber.
Lisboa.
Torgo, L. (2009).
. Escolar
Editora.
The R book
Laboratrio III
2013/2014
4 / 122
Outras questes
Plano de aulas
Questes?
Laboratrio III
2013/2014
5 / 122
Introduo
Introduo ao SPSS
Laboratrio III
2013/2014
6 / 122
Programming
Point-and-click
Laboratrio III
2013/2014
7 / 122
Discussion lists
Laboratrio III
2013/2014
8 / 122
Survey
Laboratrio III
2013/2014
9 / 122
Nmero de livros
Laboratrio III
2013/2014
10 / 122
Laboratrio III
2013/2014
11 / 122
Introduo ao SPSS
Um pouco de histria...
Organizao e menus
Operaes bsicas
Laboratrio III
2013/2014
12 / 122
Introduo ao SPSS
O SPSS um software aplicativo do tipo cientco. Originalmente o nome era
acrnimo de Statistical Package for the Social Sciences, mas na atualidade a
parte SPSS do nome completo do software (IBM SPSS) no tem signicado.
Teve a sua primeira verso em 1968 e um dos programas de anlise estatstica
mais usados nas cincias sociais
Foi criado por Norman H. Nie, C. Hadlai Hull e Dale H. Bent. Entre 1969 e 1975
a Universidade de Chicago por meio do National Opinion Research Center esteve
a cargo do desenvolvimento, distribuio e venda do programa. A partir de 1975
corresponde SPSS Inc.
O SPSS acionado por menus, mas tambm possui uma linguagem de
programao prpria (4GL - Fourth generation programing language ).
A sua lgica de funcionamento bastante simples e user-frendly. Compreende os
passos bsicos:
1
2
3
4
5
Laboratrio III
2013/2014
13 / 122
Introduo ao SPSS
Para abrir o SPSS:
Iniciar 99K Programas 99K IBM SPSS Statistics 99K IBM SPSS Statistics ...
Laboratrio III
2013/2014
14 / 122
Data View
Variable View
Laboratrio III
2013/2014
15 / 122
Name
Type
3
4
5
6
7
8
9
10
With
Decimals
Label
Values
Missing
Columns
Align
Measure
Nominal
Ordinal
99K Scale
99K Scale
Intervalar
Razo
11
Role
Laboratrio III
2013/2014
16 / 122
Laboratrio III
2013/2014
17 / 122
Importao de dados
O modo mais comum e fcil de importar um conjunto de dados faz-lo atravs
dum cheiro Excel:
Laboratrio III
2013/2014
18 / 122
Importao de dados
Escolher diretoria de localizao do cheiro a opo certa em File of type,
seleccionar o cheiro a abrir e clicar em Open
Laboratrio III
2013/2014
19 / 122
Importao de dados
aconselhvel que a primeira linha do cheiro Excel contenha o nome da varivel
(em regra, uma designao alfanumrica com 8 carateres sem espaos). Esse
facto aparece assinalado na janela seguinte:
Clicando em OK
Regina Bispo (DEIO/FCUL)
Laboratrio III
2013/2014
20 / 122
Importao de dados
Ficheiro de dados importado (Separador Data View ):
Laboratrio III
2013/2014
21 / 122
Importao de dados
O separador Variable View permite visualizar as variveis includas na base de
dados
Esta vista inclui 11 campos:
Laboratrio III
2013/2014
22 / 122
Importao de dados
Nas variveis qualitativas podemos associar descries - Value labels - aos cdigos
numricos usados
Clicando em none, surge um quadrado azul onde se pode clicar para introduzir os
labels
Laboratrio III
2013/2014
23 / 122
Importao de dados
Laboratrio III
2013/2014
24 / 122
Importao de dados
Laboratrio III
2013/2014
25 / 122
Exportao de dados
O SPSS inclui a possibilidade de exportar os dados para outros formatos,
escolhendo o tipo de cheiro pretendido:
Laboratrio III
2013/2014
26 / 122
Menus -
Quick Overview
- Contem opes bsicas, e.g., criar e abrir cheiros, imprimir, salvar, etc.
- Contem opes
como, e.g., copiar, cortar, colar,... O subcomando
permite escolher o formato, e.g., dos resultados, grcos, tabelas,...
- Contem opes de visualizao da base de dados e personalizao da barra de
ferramentas (
)
- Contem mltiplas opes para lidar com os dados
- Contem mltiplas opes para transformar variveis e criar novas
- Contem todos os procedimentos de anlise estatstica disponveis na verso
instalada
- Permite construir grcos
- Permite, e.g., identicar as variveis, descrever a base de dados, denir
conjuntos de variveis,...
- Fornece acesso a
adicionais
- Permite selecionar a janela ativa
File
Edit
standard
Options
3
View
Toolbars
4
5
6
7
8
9
10
11
Data
Transform
Analyze
Graphs
Utilities
Add-ons
packages
Window
Help
Laboratrio III
2013/2014
27 / 122
Data
Laboratrio III
2013/2014
28 / 122
Data
Select cases
Laboratrio III
2013/2014
29 / 122
Laboratrio III
2013/2014
30 / 122
Laboratrio III
2013/2014
31 / 122
Transform 99K Recode into Dierent Variables 99K Old & New values
Categorias nutricionais
Laboratrio III
2013/2014
32 / 122
Binning
Laboratrio III
2013/2014
33 / 122
Laboratrio III
2013/2014
34 / 122
Menu Graphs
O SPSS permite criar grcos de vrios tipos: barras, pontos, boxplots,
histogram,...
Na verso atual o SPSS dispes de trs subcomandos: Chart Builder, Graphboard
Template Chooser, Legacy Dialogs
Os grcos clssicos herdados de verses anteriores esto disponveis sob a opo
Legacy Dialogs
Laboratrio III
2013/2014
35 / 122
Limpeza de dados
Anlise descritiva
Laboratrio III
2013/2014
36 / 122
Exemplo
Ao longo das aulas para trabalhar os contedos apreendidos iremos usar uma base
de dados como exemplo
Exemplo: Estudo sobre obesidade infantil
Motivao:
1
Laboratrio III
2013/2014
37 / 122
Kg /m2
Laboratrio III
2013/2014
38 / 122
Laboratrio III
2013/2014
39 / 122
Limpeza de dados
A limpeza de dados visa detectar e remover (sempre que possvel) anomalias dos
dados com o objectivo de melhorar a sua qualidade
As anomalias no cheiro de dados podem corresponder a, e.g.,:
1
2
3
4
Laboratrio III
2013/2014
40 / 122
Laboratrio III
2013/2014
41 / 122
Em Statistics selecionaram-se
as opes mdia, min, max,
desvio-padro, assimetria,
curtose e mediana
Os resultados so fornecidos
por grupo e tambm o total
Laboratrio III
2013/2014
42 / 122
Laboratrio III
2013/2014
43 / 122
Statistics
Plots
Options
Missing values
Laboratrio III
2013/2014
44 / 122
Laboratrio III
2013/2014
45 / 122
Laboratrio III
2013/2014
46 / 122
Laboratrio III
2013/2014
47 / 122
Analyze
Frequencies
Laboratrio III
2013/2014
48 / 122
Tabelas de contingncia
O seguinte caminho permite criar tabelas de contingncia
Cells - Permite pedir o clculo das frequncias relativas (%), esperadas e resduos
(d ainda acesso ao teste assittico de comparao de propores, z-test )
Regina Bispo (DEIO/FCUL)
Laboratrio III
2013/2014
49 / 122
Correlao
Existem mltiplos coeciente de correlao disponveis no SPSS:
Laboratrio III
2013/2014
50 / 122
Laboratrio III
2013/2014
51 / 122
Laboratrio III
2013/2014
52 / 122
Laboratrio III
2013/2014
53 / 122
Laboratrio III
2013/2014
54 / 122
Testes paramtricos
Amostras independentes
Teste de comparao de varincias (Teste F)
Aproximao de Welch
Amostras emparelhadas
Laboratrio III
2013/2014
55 / 122
Hipteses
H1
H0
H0
H1
H1
: < 0
: > 0
Estatstica do teste
Em populaes normais,
3
_ N (, )
0
= XS /
n
, com
_ t(n1)
sob
H0
Deciso
Teste bilateral: ] , ] [
Teste unilateral esquerda: ] ,
Teste unilateral direita: [ ; [,
t1/2
t1 ] p
t1
t1/2 ; [ p
P (|T |
> t)
= P (T < t )
= P (T > t )
Laboratrio III
2013/2014
56 / 122
One-sample t-test
Laboratrio III
2013/2014
57 / 122
Laboratrio III
2013/2014
58 / 122
1
2
Laboratrio III
2013/2014
59 / 122
O
baseia-se na medio da distncia entre a funo de
distribuio emprica vericada numa amostra concreta e uma funo de distribuio
terica que, por hiptese, se admite existir na populao (como por exemplo, a
distribuio normal);
0.6
0.4
0.0
0.2
Funo de distribuio
0.8
1.0
teste de Kolmogorov-Smirnov
2.0
2.5
3.0
3.5
4.0
H0
Laboratrio III
2013/2014
60 / 122
Teste de Shapiro-Wilk
Hipteses: H0 : X _ N (, ) versus H1 : X 6_ N (, )
Laboratrio III
2013/2014
61 / 122
Laboratrio III
2013/2014
62 / 122
Hipteses
Teste bilateral: :
Teste unilateral esquerda:
Teste unilateral direita:
H0
H0
H0
=k
vs.
H1
: 1 2 6= k
vs.
vs.
: 1 2 k
: 1 2 k
H1
H1
: 1 2 < k
: 1 2 > k
Estatstica do teste
( 1 2 )
q
1 + 1
( 1 1) 12 +( 2 1) 22
1 + 2 2
Deciso
Teste bilateral: ] , ] [
Teste unilateral esquerda: ] ,
Teste unilateral direita: [ ; [,
t1/2
t1/2 ; [ p
t1 ] p
t1
t( 1 +n2 2)
P (|T |
sob
H0
> t)
= P (T < t )
= P (T > t )
Laboratrio III
2013/2014
63 / 122
Laboratrio III
Analyze
2013/2014
64 / 122
2
s12
s22
+
n1
n2
T _ t([r ]) , r = (s 2 /n )2 (s 2 /n )2
1 1
2 2
n1 1 + n2 1
Laboratrio III
2013/2014
65 / 122
Hipteses
Teste bilateral: :
Teste unilateral esquerda:
Teste unilateral direita:
H0
H0
H0
vs.
H1
: 1 2 6= D
vs.
D vs.
: 1 2 D
: 1 2
H1
H1
: 1 2 < D
: 1 2 > D
Estatstica do teste
1
T
= D
D
= SD
/ n
t( 1)
H0
Deciso
Teste bilateral: ] , ] [
Teste unilateral esquerda: ] ,
Teste unilateral direita: [ ; +[
t1/2
t1/2 ; +[
t1 ]
t1
Laboratrio III
2013/2014
66 / 122
Laboratrio III
Analyze
2013/2014
67 / 122
Testes no paramtricos
1
Teste Binomial
Teste do Qui-quadrado
Teste de Fisher
Teste de Mann-Whitney (k=2)
Teste de Kruskall-Wallis (k>2) e comparaes mltiplas
Laboratrio III
2013/2014
68 / 122
na populao
2
Testes no paramtricos
Laboratrio III
2013/2014
69 / 122
Teste Binomial
H : p = 0.5 vs . H : p 6= 0.5
0
Laboratrio III
2013/2014
70 / 122
Teste Binomial
Analyze
99K
One sample
Laboratrio III
Nonparametric tests
2013/2014
71 / 122
Teste Binomial
Laboratrio III
2013/2014
72 / 122
Teste Binomial
Laboratrio III
2013/2014
73 / 122
Teste Binomial
Laboratrio III
2013/2014
74 / 122
Teste Binomial
Clicando duas vezes seguidas em cima do quadro permite obter os detalhes da
anlise
Laboratrio III
2013/2014
75 / 122
Teste Binomial
Laboratrio III
2013/2014
76 / 122
Teste do Qui-quadrado
O teste do qui-quadrado (2 ) permite a comparao de duas (ou mais)
populaes a partir de amostras independentes, quando as variveis so nominais
Teste de homogeneidade e permite testar a independncia entre duas
variveis nominais Teste de independncia.
: As variveis e so independentes
: As variveis e no so independentes
X
Varivel X
1
...
l
Total
Regina Bispo (DEIO/FCUL)
Varivel Y
j
... . . . ... . . . ... c
j
O11
Ol 1
C1
O1
Olj
Cj
Laboratrio III
Total
...
O1
L1
Olc
Ll
Cc
2013/2014
77 / 122
Formulao do teste do 2
1
Hipteses
H1
H0
H1
Estatstica do teste
l X
c
X
(Oij Eij )2
L C
, onde Eij = i n j
X2 =
E
ij
i =1 j =1
Deciso
A estatstica X 2 tem distribuio aproximada Qui-quadrado com (c 1) (l 1)
g.l.
Rejeita-se a hiptese nula quando p
Laboratrio III
2013/2014
78 / 122
Correco de Yates
X =
2
l X
c
X
(|Oij Eij | 0.5)2
Eij
i =1 j =1
Laboratrio III
2013/2014
79 / 122
Teste do 2
O teste do 2 est disponvel na opo
.
Crosstabs
Laboratrio III
2013/2014
80 / 122
Teste do 2
Na opo
Statistics e Exact.
Laboratrio III
2013/2014
81 / 122
Teste do 2
Laboratrio III
2013/2014
82 / 122
Amostra
1
2
A
B
C
D
A+C B+D
Total
A+B
C+D
n
Laboratrio III
2013/2014
83 / 122
Hipteses:
Teste bilateral: : =
Teste unilateral esquerda:
Teste unilateral direita:
H0
p1
H0
H0
: p1 6= p2
: p1 p2 vs. H1 : p1 < p2
: p1 p2 vs. H1 : p1 > p2
p2 vs. H1
Laboratrio III
2013/2014
84 / 122
Teste de Fisher
O teste de Fisher est disponvel na mesma opo do teste do 2 .
Laboratrio III
2013/2014
85 / 122
Teste de Mann-Whitney
O teste de Mann-Whitney permite comparar duas populaes com base em
amostras independentes no que respeita a uma varivel pelo menos ordinal.
uma alternativa no paramtrica ao teste t-Student, quando as condies de
aplicao deste falharem.
Permite comparar a distribuio de probabilidade da varivel aleatria em estudo
nas populaes de onde foram extradas as amostras:
Teste de Mann-Whitney
H : FX (x ) = FY (y ) vs. H : FX (x ) 6= FY (y )
0
Teste de Mann-Whitney
H : = vs. H : =
6
H : vs. H : >
H : vs. H : <
0
Para pequenas dimenses amostrais deve optar-se por procedimentos exatos. Para
n sucientemente grande, podem usar-se procedimentos assintticos
(aproximao Normal)
Regina Bispo (DEIO/FCUL)
Laboratrio III
2013/2014
86 / 122
Teste de Mann-Whitney
Laboratrio III
Analyze 99K
2013/2014
87 / 122
Teste de Mann-Whitney
Optando pelo teste de Mann-Whitney
Laboratrio III
2013/2014
88 / 122
Teste de Wilcoxon
O teste de Wilcoxon permite comparar duas populaes com base em amostras
Teste de Wilcoxon
H : F X (x ) = F Y (y )
H : FX (x ) 6= FY (y )
0
1
Teste de Wilcoxon
H : = vs. H : =
6
H : vs. H : >
H : vs. H : <
0
Laboratrio III
2013/2014
89 / 122
Teste de Wilcoxon
Laboratrio III
2013/2014
90 / 122
Teste de Wilcoxon
Optando pelo teste de Wilcoxon
Laboratrio III
2013/2014
91 / 122
k > 2 populaes
O teste de Kruskall-Wallis (ou abreviadamente teste KW):
1
2
3
ANOVA one-way
Teste de Kruskal-Wallis
H : = = ... = k vs. H : i , j : i 6= j (i 6= j , i , j = 1, ..., k )
0
Para pequenas dimenses amostrais deve optar-se por procedimentos exatos. Para
n sucientemente grande, podem usar-se procedimentos assintticos
Regina Bispo (DEIO/FCUL)
Laboratrio III
2013/2014
92 / 122
Teste de Kruskal-Wallis
Optando pelo teste de Kruskal-Wallis
Laboratrio III
2013/2014
93 / 122
Laboratrio III
2013/2014
94 / 122
Teste de Friedman
O teste de Friedman um teste no paramtrico que permite comparar k > 2
populaes:
1
Teste de Friedman
H : = = ... = k vs. H : i , j : i 6= j (i 6= j , i , j = 1, ..., k )
0
Para pequenas dimenses amostrais deve optar-se por procedimentos exatos. Para
n sucientemente grande, podem usar-se procedimentos assintticos
Laboratrio III
2013/2014
95 / 122
Teste de Friedman
Exemplo de aplicao
Num processo de seleco de 4 candidatos para um cargo de chea, foi-lhes dado 3
testes de avaliao (A, B e C) que avaliaram as capacidades de chea, tendo-se
registado as seguintes classicaes (de 1 a 10):
Testes
A
B
C
S1
9
6
6
S2
6
5
2
S3
3
4
4
S4
7
7
5
Com base nas pontuaes obtidas, existe algum candidato com capacidade diferente
para o cargo em questo, ou pelo contrrio a capacidade dos 4 candidatos
semelhante (=0.10)?
Laboratrio III
2013/2014
96 / 122
Teste Friedman
O testede Friedman est disponvel na opo Analyze 99K Nonparametric tests 99K
Related samples. Trs separadores: Objective/Fields/Settings. Em Fields
Laboratrio III
2013/2014
97 / 122
Teste Friedman
Em Settings
Laboratrio III
2013/2014
98 / 122
Teste de Friedman
Optando pelo teste de Friedman
Laboratrio III
2013/2014
99 / 122
Laboratrio III
2013/2014
100 / 122
Regresso
Regresso designa um conjunto de tcnicas estatsticas que visam avaliar a
relao entre uma varivel dependente (tambm, por vezes, designada por varivel
resposta) e uma ou mais variveis independentes (tambm, por vezes, designadas
por variveis preditoras).
Um dos principais objectivos deste procedimento encontrar a relao que
possibilita avaliar a variao mdia que ocorre numa determinada varivel (varivel
dependente) face alterao de outra(s) com a(s) qual(ais) se correlaciona.
Trata-se portanto da procura uma relao estatstica e no uma relao do tipo
causa-efeito.
Laboratrio III
2013/2014
101 / 122
Regresso
Em termos genricos, a regresso:
1
Laboratrio III
2013/2014
102 / 122
Regresso
O SPSS apresenta disponvel mltiplas opes de anlise de regresso
Regression
Laboratrio III
Analyze 99K
2013/2014
103 / 122
Laboratrio III
2013/2014
104 / 122
Laboratrio III
2013/2014
105 / 122
S=
n
X
i =1
Laboratrio III
i
2013/2014
106 / 122
Laboratrio III
2013/2014
107 / 122
True
~~
~~~1\
I \
I
line
Ilo +(3,x
-,
\
\
An -----+
observed
Y value
(Y2)
Xn
Laboratrio III
x
2013/2014
108 / 122
Assim, para detetar violaes dos pressupostos procede-se a uma anlise dos
resduos
Numa primeira fase, pode efetuar-se uma anlise grca (resduos em funo dos
valores estimados para Y ), o que permite vericar:
1
a no-normalidade
heterocedasticidade
linearidade
existncia de outliers
Laboratrio III
2013/2014
109 / 122
Estudo da Nature
Laboratrio III
2013/2014
110 / 122
O perigo da extrapolao
Laboratrio III
2013/2014
111 / 122
Linear
Laboratrio III
2013/2014
112 / 122
Laboratrio III
2013/2014
113 / 122
Laboratrio III
2013/2014
114 / 122
Laboratrio III
2013/2014
115 / 122
Laboratrio III
2013/2014
116 / 122
Laboratrio III
2013/2014
117 / 122
Trabalho prtico 1
TP1
Questes a abordar:
Explorao dos dados originais. Estude a localizao, disperso e forma das
diversas distribuies empricas (tenha em conta o tipo de variveis e verique a
existncia de potenciais observaes discrepantes)
Laboratrio III
2013/2014
118 / 122
Trabalho prtico 2
TP2
ctcios, cedidos por Prof. Doutora Luzia Gonalves, IHMT), realizado durante 8
meses de 2009, num distrito de um pas africano, para avaliar a eccia de dois
tratamentos seguidos por doentes com malria por Plasmodium vivax.
Laboratrio III
1 )
2013/2014
119 / 122
Trabalho prtico 2
Questes a estudar:
Admita que a atribuio do tratamento A ou do tratamento A+B foi aleatria. Vericar
se os dois grupos de doentes (que receberam o tratamento A ou o tratamento A+B) so
semelhantes no que diz respeito as variveis: genro, idade, etnia, peso, febre nas 48
horas anteriores, medicao prvia e parasitmia no dia da admisso.
Estimar a proporo de doentes que admitem o recurso Medicina Tradicional em
paralelo com o tratamento.
Explorar a associao entre a toma de medicamentos antes do tratamento e o recurso
Medicina Tradicional.
Comparar os dois tratamentos no que respeita ao tempo at obter uma parasitmia nula.
Comparar os dois tratamentos no que respeita ao tempo at ter a febre controlada.
Avaliar se o recurso Medicina Tradicional, em paralelo com o tratamento, afectar os
tempos de controlo da parasitmia e da febre.
Comparar os dois tratamentos quanto aos efeitos adversos que os doentes reportaram.
(No nal, apenas se consideraram os mais referidos: vmitos recorrentes e contraces
musculares).
Para cada tratamento, vericar, caso seja possvel, se a percentagem de aparecimento de
cada um dos efeitos adversos semelhante consoante o recurso, ou no, Medicina
Tradicional, o genro e a etnia.
Regina Bispo (DEIO/FCUL)
Laboratrio III
2013/2014
120 / 122
Trabalho prtico 3
TP3
Variveis em estudo:
Salrio (euros)
Antiguidade na empresa (anos)
Questes:
Estime a reta de regresso que permite relacionar os salrios com a antiguidade
dos funcionrios
Analise a adequabilidade do modelo linear
Faa uma anlise dos resduos
Laboratrio III
2013/2014
121 / 122
TP1 (R)
Objectivo : Analisar um conjunto de dados de natureza demogrca e econmica para
algumas regies de Portugal continental e Regies autnomas (cheiro TP1.xls ).
O script deve incluir:
Resumo da base de dados com clculo de estatsticas amostrais (localizao e
disperso) para todas as variveis.
Escolha 1 varivel:
Laboratrio III
2013/2014
122 / 122