Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Direcii de evaluare
1. 2. 3. 4. 5. 6.
Normalitatea distribuiei
Liniaritatea Homoscedasticitatea
introducere
de tip II
?... (ce nseamn?)
identificarea variabilelor importante; detectarea valorilor excesive; verificarea respectrii condiiilor impuse
de diferite proceduri infereniale
5
1. Corectitudinea datelor
Valorile unei variabile sunt corecte atunci cnd nu s-au
produs erori la introducerea de la tastatur sau la preluarea lor dintr-o alt surs
n faza de recoltare
acurateea modelului de investigare
1. Corectitudinea datelor
Valorile unei variabile sunt valide atunci cnd exprim ceea
ce ne ateptm s exprime
1=dezacord total; 2=dezacord parial; 3=nici acord/nici dezacord; 4=acord parial; 5=acord total
Transform/Compute
Profilul rspunsurilor
1-2-1-2-1-2-
Atenie la scalele de minciun
7
Valori extreme
Valori cu influen (influential cases)
Atitudinea subiecilor
Erori de eantionare
Subieci care fac parte din alt populaie
Salariul efilor
9
Efectele pozitive
scot n eviden situaii semnificative din perspectiva obiectivului cercetrii atrag atenia asupra unor aspecte care ies din limitele ipotezei iniiale
10
a) b) c)
11
Detectarea univariat
Metodele grafice
Histogram
stem-and-leaf box-plot
Metode numerice
Transformarea n valori z
Limita de sus poate urca pn la 133,5 Cea mai apropiat valoare este 125
114+1.5x13=133.5
114
Percentila 75 (114)
101-1.5x13=81.5
13
Detectarea univariat
Testul Grubb
Metodele anterioare nu sunt aplicabile pe eantioane mici valorile transformate n z nu pot fi mai mari dect (N-1)/N
14
Detectarea bivariat
Outlier bivariat
15
Detectarea multivariat
Abaterea excesiv prin raportare la un numr mare de variabile
O valoare poate fi neobinuit n raport cu unele variabile, dar obinuit n raport cu altele Diagnosticul de valoare excesiv trebuie pus n raport cu toate dimensiunile simultan
Variabile dummy
Se transform n scoruri z
17
Valori lips
Imposibilitatea recoltrii lor Refuzul subiecilor Rezultate din calcule cu variabile care au valori lips Trebuie sa ascund valori cu aceeai semnificaie cu
valorile valide
19
Valori lips nealeatorii Valori lips complet aleatorii Valori lips aleatorii
20
Eliminarea: reducerea eantionului reducerea puterii Dac nu sunt aleatorii, afecteaz concluziile cercetrii n context multivariat, efectul se multiplic
21
23
Eliminarea valorii
casewise deletion
pairwise deletion
permite exploatarea la maximum a informaiei disponibile listwise deletion Reducere a numrului de cazuri analizate produce o estimare neafectat de erori a parametrilor pn la 10%, poate fi tolerat, dar dincolo de acest procent cazul respectiv ar trebui eliminat cele care au cel puin 15% din valori lips sunt candidate la eliminarea valorilor cele cu procente mai mari de att (20-30%) ar putea face obiectul remedierii valorilor lips 24
Cazuri
Variabile
Transform/Replace
25
4. Normalitatea distribuiei
simetrie boltire
26
27
Mai important pentru testele de corelaie Mai puin important pentru diferenele dintre
medii
Normalitatea multivariat
29
Explore (Statistics-Descriptives-Explore)
Statistic
Std. Error
Skewness
Kurtosis
1,711
4,519
,333
,656
30
Explore
Testul Kolmogorov-Smirnov
Tests of normality
1,0
,8
Dac distribuia cercetat se suprapune peste linia dreapt a distribuiei teoretice, sau nu se abate grav de la aceasta, atunci putem aprecia c variabila investigat este normal.
,5
,3
0,0 0,0
,3
,5
,8
1,0
10
300
200
100
Beginning Salar y
0 0, 00 80 0,0 00 75 0,0 00 70 0,0 00 65 0,0 00 60 0,0 00 55 0,0 00 50 0,0 00 45 0,0 00 40 0,0 00 0 35 00, 0 30 0,0 00 25 0,0 00 20 0,0 00 15 0,0 00
33
Soluii de transformare
transformarea situaia recomandat
x3
x2 x
ridicarea la ptrat
-
asimetrie negativ
simetrie
x
3
x
log(x)
Transform-Compute (SQRT)
80
60
40
140
120
100
20
SQR_SALB
0 0, 2 8 ,0 0 2 7 0 ,0 2 6 0 ,0 2 5 0 ,0 2 4 0 ,0 2 3 0 ,0 2 2 0 ,0 2 1 ,0 0 2 0 0 ,0 1 9 0 ,0 1 8 0 ,0 1 7 0 ,0 1 6 0 ,0 1 5 0 ,0 1 4 ,0 0 1 3 0 ,0 1 2 0 ,0 1 1 ,0 0 10 ,0 90
35
Histogram
60 50
40
30
Statistic
Skewness ,024 -,115 Kurtosis
Std. Error
,112 ,224
20
Frequency
10 0
, -2
, -2
, -1
, -1
0 ,5 00 0, 0 -,5 00
1, 00
1,
2, 00
2,
3,
50
50
00
50
00
50
36
Normalitatea multivariat
37
Afecteaz semnificaia valorilor Trebuie fcut cu grij i numai cnd este necesar Atenie la valoarea minim!
skewness original
Min=10 0
1.58
1.58 1.58
1.11
0.72 0.18
1.21
0.88 0.39
1.31
1.07 0.67
1.42
1.27 1.00
1.56
1.54 1.50
38
5. Liniaritatea
Dect dac este analizat structura variabilelor (analiza factorial, SEM, Path Analysis) Variabile cu r=0,70 sau mai mult nu vor fi de regul incluse n aceeai analiz (analiza de regresie, de exemplu)
39
analiza rezidual
scoruri a cror variaie nu este explicat prin modelul
liniar
Statistics-Regression-Linear
Scatterplot
Regression Stan dardized Predicted Value
6 5 4 3 2 1 0 -1 -2 -6 -4 -2 0 2 4
41
6
variana valorilor VD pentru fiecare din valorile VI este egal
Raportul dintre grupul cel mai mare si cel mai mic nu depete 4/1
Raportul dintre variana cea mai mare i cea mai mic nu depete 10/1 (Fidell & Tabachnick, 2003)
Soluii alternative
Testarea diferenelor la un nivel alfa mai mic dect 0,05 (0,02 sau 0,01)
medii egale
medii diferite
varian egal
medii egale
medii diferite
variane egale
variane diferite
varian diferite
43
Homoscedasticitate
Heteroscedasticitate
heterodasticitate
44
Concluzii
45