Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DIPARTIMENTO DI PSICOLOGIA
prof. Renato Miceli
OTTOBRE 2013
Il presente file (in formato PDF) contiene le diapositive che, nel loro insieme, forniscono supporto visivo alle
lezioni del docente. Si raccomanda di NON considerare questo materiale alla stregua di un libro di testo! In
particolare è fortemente sconsigliata la stampa (su carta) di questo materiale. Alcune diapositive possono
essere presenti più volte in questo stesso insieme (doppioni), perchè questa sequenza di diapositive NON
rappresenta necessariamente l'ordine di utilizzo delle medesime a lezione. Inoltre, NON tutte le diapositive qui
riportate sono sempre utilizzate durante le specifiche lezioni dell'anno in corso...
!!! Si ricorda comunque che il presente materiale didattico non sostituisce i libri di testo !!!
Il presente materiale didattico é:
- utile per ripassare, ripensare e riflettere sugli argomenti trattati a lezione;
- utile per approfondire lo studio svolto sui libri di testo, consentendo di
confrontare modi diversi di presentare gli stessi argomenti e disponendo
di specifici esempi, commenti etc.;
- provvisorio e soggetto a continue revisioni e aggiornamenti;
- nella versione qui resa disponibile può risultare incompleto o di difficile lettura
in quanto alcune diapositive sfruttano caratteri, colori e/o animazioni
specifiche del software utilizzato (PowerPoint) che non sono altrimenti
riproducibili.
Lezioni di Psicometria del prof. Renato Miceli (a.a. 2013-2014)
UNIVERSITA' DEGLI STUDI DI TORINO
Per il Corso di Laurea Triennale (II° ANNO)
DIPARTIMENTO DI PSICOLOGIA
prof. Renato Miceli
Indice degli argomenti OTTOBRE 2013
Introduzione
Regressione lineare (due o più variabili esplicative; un'introduzione al modello lineare classico)
Bibliografia di base
(a) A. Pedon, A. Gnisci, 2004, Metodologia della ricerca psicologica, Bologna, Il Mulino.
Modalità d'esame...
L'esame è orale. Una parte, anche consistente, di domande (del tipo a "scelta multipla") potrà
essere formulata in modalità scritta (correzione e valutazione saranno contestuali).
Gli studenti degli anni precedenti possono portare all'esame il programma dell'anno di riferimento;
l'esame è orale
Il ricevimento studenti si svolge (di norma) il mercoledì pomeriggio (h. 15-17) previo
appuntamento tramite e-Mail all'indirizzo: r.miceli@univda.it
OSSERVAZIONI EMPIRICHE
(FATTI)
Introduzione (3 / 3)
MODELLI .......
Episteme l'insieme dei presupposti teorici della conoscenza scientifica e filosofica (di una data epoca o autore)
REALTÁ
DIMOSTRATIVA
DESCRITTIVA
"AUTOCORREGIBILE" (o "storico-critica")
5
Epistemologia...Cenni (2 / 4) Concezione DIMOSTRATIVA
Concezione DESCRITTIVA
Bacone Newton ILLUMINISMO POSITIVISMO
- <<I paradigmi sono conquiste scientifiche universalmente riconosciute che, per un certo
periodo, forniscono un modello di problemi e soluzioni accettabili da coloro che praticano un
certo campo di ricerca>> (T.S. Kuhn, 1995)
- I paradigmi sono incommensurabili (incomparabili)
Lo sviluppo della scienza è (pertanto) discontinuo e ateleologico
7
Epistemologia...Cenni (4 / 4) Ulteriori spunti di riflessione...
<<... Non abbiamo inteso di scrivere un testo di fisica. Né di esporre in ordine sistematico gli
elementi fenomenologici e teorici della fisica. Abbiamo piuttosto inteso di disegnare a larghi tratti
i tentativi dell'intelletto umano volti a scoprire un nesso fra il mondo delle idee ed il mondo dei
fenomeni. Abbiamo cercato di mostrare quali siano le forze agenti che inducono la scienza a
concepire idee rispondenti alla realtà del mondo in cui viviamo>>
(A. Einstein, L. Infeld, 1938, Prefazione degli Autori a: "L'Evoluzione della fisica")
<<In merito alla concezione del rigore logico ... non si tratta per noi di porre la Scienza su basi più
solide, ma semplicemente di riconoscere quanto tali basi siano fragili. ... Dobbiamo inventare il
mondo per inquadrarvi le nostre sensazioni, ma non dovremmo mai considerarlo come uno schema
rigido e fisso, come una costruzione definitiva: esso non è che il risultato provvisorio di uno sforzo
di sintesi. Le nostre sensazioni, i nostri concetti fondamentali, a cominciare da quelli di tempo e
spazio, non saranno mai i protagonisti di una commedia finita ove ciascuno ha la sua parte e il suo
ruolo, saranno sempre i "sei personaggi in cerca d'autore">>
(B. de Finetti, 1934, L'invenzione della verità; Ed. Raffaello Cortina, Milano, 2006, pag. 124)
8
Psicometria e ricerca empirica (1 / 9)
?
come rilevare e registrare i fenomeni manifesti
....
che legame è possibile stabilire fra fenomeni METODOLOGIA
manifesti e costrutti teorici
MATEMATICA
quali strumenti di misura utilizzare o costruire
STATISTICA
....
9
Psicometria e ricerca empirica (2 / 9)
Il "luogo" della Psicometria...
Indagine conoscitiva: (speculazione filosofica; scienza; contemplazione mistica; critica letteraria; etc)
Scienze (della vita)
Psicologia (scienza che studia, descrive, interpreta la fenomenologia dei processi mentali)
Ricerca empirica: (successione di operazioni per produrre risposte a domande sulla realtà)
- produce affermazioni sulla realtà (asserti) o stabilisce nessi fra asserti;
- giustifica le affermazioni su una base empirica;
- produce un sapere controllabile.
yi = f ( xi )
B A
Attenzione!
x è un elemento di A;
f(x) è un elemento di B;
f è un ente matematico diverso sia da x, sia da f(x); f è la legge che associa all'elemento x di A, l'elemento f(x) di B.
Spesso però si dice <<...la funzione f(x) >> invece di dire <<...la funzione f >>
indicando così sia la funzione, sia il valore da essa assunto in x
11
Psicometria e ricerca empirica (4 / 9) 12
Ripasso
i = 3 − 2 xi
yANALITICA GRAFICA TABULARE
Obs y x
1 5 -1
2 3 0
3 1 1
4 -1 2
5 -3 3
6 -5 4
Psicometria e ricerca empirica (5 / 9)
13
Ripasso
Rappresentazioni di una funzione
yi = x − 4 xi + 2
2
Obs y x
Obs y x
1 -1.00 -2.0
1 14.00 -2.0 2 -0.16 -1.9
3 0.57 -1.8
4 1.19 -1.7
3 7.00 -1.0 5 1.70 -1.6
6 2.13 -1.5
5 2.00 0.0 7 2.46 -1.4
8 2.70 -1.3
7 -1.00 1.0 9 2.87 -1.2
10 2.97 -1.1
9 -2.00 2.0 11 3.00 -1.0
12 2.97 -0.9
11 -1.00 3.0 13 2.89 -0.8
14 2.76 -0.7
13 2.00 4.0 15 2.58 -0.6
16 2.38 -0.5
15 7.00 5.0 17 2.14 -0.4
18 1.87 -0.3
19 1.59 -0.2
17 14.00 6.0 20 1.30 -0.1
21 1.00 0.0
22 0.70 0.1
23 0.41 0.2
24 0.13 0.3
25 -0.14 0.4
26 -0.38 0.5
27 -0.58 0.6
28 -0.76 0.7
29 -0.89 0.8
30 -0.97 0.9
31 -1.00 1.0
32 -0.97 1.1
33 -0.87 1.2
34 -0.70 1.3
yi = x 3 − 3 xi + 1 35
36
37
-0.46
-0.13
0.30
1.4
1.5
1.6
38 0.81 1.7
39 1.43 1.8
40 2.16 1.9
41 3.00 2.0
Psicometria e ricerca empirica (6 / 9)
Ripasso
Funzioni empiriche E' stata rilevata l'abilità logica (x) e il grado di Obs y x
comprensione di testi in lingua italiana (y) 1 -4.0 -10
−−−−−−− 16 5.5 5
17 10.0 6
R 2 = 0.62 18 6.5 7
19 8.0 8
20 5.5 9
21 6.0 10
(Fine Ripasso)
Le fasi della ricerca (empirica)... 14
Psicometria e ricerca empirica (7 / 9)
? "Problema", CONTRADDIZIONE FRA ASSERTI; Es.:
Le fasi o il processo di ricerca (a) di fronte a richiesta di aiuto ci aspettiamo che le persone intervengano;
(b) osserviamo una situazione in cui ciò non accade;
(c) poniamo il problema: "quali sono i meccanismi alla base di comportamenti passivi
Identificazione del problema di fronte ad evidenti richieste di aiuto" (J. Darley, B. Latané, 1968)
Ricerca di base (fondamentale o pura) (d) formuliamo ipotesi: "quanto più numerose sono le persone che in una data
circostanza di pericolo sono effettivamente in condizione di prestare aiuto,
Ricerca applicata tanto meno ciascuna di esse si sente investita della responsabilità di agire"
IPOTESI DI RICERCA : "se le persone subiscono una frustrazione, allora divengono aggressive"
Interpretazione
I risultati conseguiti forniscono una risposta all'ipotesi di ricerca?
Tale risposta costituisce un effettivo avanzamento della conoscenza?
Articolo su rivista
La struttura:
titolo, autore/i, istituzioni di appartenenza
riassunto (abstract), parole chiave (keywords)
introduzione, scopi generali (aspetti teorici), quadro della letteratura corrente
ipotesi (specifiche) di ricerca, metodo, dati
risultati, conclusioni
discussione
bibliografia
importanza-prestigio
Accettazione subordinata
Accettazione RIVISTA
a modifiche lievi
repertori di settore
(PsychInfo)
Accettazione
Accettazione ESITI POSSIBILI subordinata Indice delle riviste
a modifiche scientifiche (I.S.I)
con priorità
sostanziali
Indici quantitativi
(per es.: IF di una rivista nell'anno t)
Rifiuto con possibilità
di risottomissione nuova versione Rifiuto
N°articoli citati (t − 1) + (t − 2)
IF(t ) =
N°articoli pubblicati (t − 1) + (t − 2)
17
Questionari e test (1 / 9)
Strumenti di rilevazione/misura
Questionario
(Intervista, Indagine demoscopica, sondaggio, survey) Questionari
modalità di somministrazione
scopi...
caratteristiche demografiche
comportamenti
opinioni
Domande Dati
etc... (Stimoli-Risposte)
Test
EQUANIMITA'
STESSO
DOCENTE
Interrogazione ? Test
DOCENTI
DIVERSI
PROCEDURA
PROFESSIONALITA' IMPERSONALE
Questionari e test (3 / 9)
Una stessa domanda può essere posta in molti modi diversi e il modo di porla (il fraseggio) influenza le risposte
Una stessa domanda, posta nello stesso modo può essere compresa in modo diverso da gruppi di persone diversi
Ad una stessa domanda si può rispondere in maniera diversa in funzione del contesto definito dal questionario
Gli effetti dovuti al contesto sono stati studiati tramite la messa a punto di un ampio disegno Un esempio...
sperimentale in cui una domanda sull'interesse delle persone per la politica (negli U.S.A.)
veniva posta agli intervistati prima e dopo altre domande (Zammuner V. L., 1996, pp. 87-93);
(l'esempio qui presentato è una semplificazione)
Etc.,etc., ... 20
Questionari e test (4 / 9) Esempio di distorsione indotta dal contesto: la stessa domanda viene posta nell'ambito dello stesso questionario
prima e dopo la domanda (B) contestualizzante...
2 DOMANDE
DOMANDA "A" DOMANDA "B" (B) contestualizzante;
costringe gli intervistati a
riflettere su un comportamento
<<Alcune persone seguono le vicende politiche la maggior parte che concretamente denota
del tempo anche quando non ci sono elezioni imminenti, interesse per le vicende politiche
mentre altre persone non sono molto interessate alla politica.
Lei direbbe di seguire le vicende politiche: <<Si ricorda come ha votato il suo rappresentante presso il Parlamento
(1) la maggior parte del tempo; in una o due leggi che siano state discusse negli ultimi due anni?
(2) in modo abbastanza frequente; (1) Si;
(3) solo qualche volta; (2) No.
(4) quasi mai>> Se si, quale legge ....... come ha votato .... >>
Campione 1
A_B
analogamente rappresentativi
della stessa popolazione 2 CAMPIONI (Diverso ordine di presentazione)
(anche se di numerosità diversa)
Campione 2 B_A
RISULTATI: Risposte alla domanda "A" (interesse per la politica)
<<I dati non esistono al di fuori delle operazioni che il ricercatore compie in rapporto a un
determinanto quadro di riferimento teorico>>
<<I cosiddetti "dati" non crescono nei prati e i ricercatori non li raccolgono, essi sono
piuttosto "costruiti" dal ricercatore stesso attraverso procedure di interpretazione e di
attribuzione di significato>>
trascrizione (su un qualche
Qualche definizione: definisce una qualche supporto) di un "fatto" (risultato
caratteristica dell’entità di un PROCESSO DI
(Oggetto) sotto osservazione DATO RILEVAZIONE)
CONCETTO, (Idea),
COSTRUTTO TEORICO,
TRATTO, PROPRIETA' insieme di REGOLE (algoritmo,
procedura) che governa la
rilevazione e che permette di
evento semplice, asserto rilevare lo STATO di un oggetto VARIABILE..
descrittivo intersoggettivamente DEFINIZIONE (o caso) rispetto ad una
FATTO condiviso (il valore segnato dalla OPERATIVA proprietà (trasformando
lancetta della bilancia; l'osservazione in un "fatto")
il contenuto del documento
amministrativo; la risposta scritta
sul foglio di carta; etc.)
<< [oggettività nella scienza] ... non
implica che lo scienziato si
distacchi freddamente dall’oggetto
dei suoi studi, né che egli tratti la
CONCETTO DATO gente come oggetti anziché come
persone. Essa non comporta
neppure che ciò che lo scienziato
osserva sia ciò che realmente
accade. Oggettività significa che
delle persone, che avessero
guardato sopra la spalla dello
ENTITA' (OGGETTO) STATO dell'OGGETTO scienziato mentre faceva
sotto osservazione (rispetto alla proprietà) l’osservazione,
avrebbero visto le stesse cose>>
(McBurney D.H., 1983, p.19).
DEFINIZIONE OPERATIVA
22
Questionari e test (6 / 9)
grandezza, generalmente indicata con una delle ultime lettere dell'alfabeto (x, y, z),
che può assumere tutti i valori appartenenti a un determinato insieme e che
rappresenta in generale tutti gli elementi di tale insieme
VARIABILE...
MUTABILE
sequenza ordinata e codificata di rilevazioni (osservazioni) vettore (colonna) di una matrice dati
PIU' entità in PIU' archi temporali PIU' entità in UN arco temporale (processo SINCRONICO)
T0 T1 T2 ..... statura
A ...
Renato 1.75
xA,0 xA,1 xA,2
Maria 1.63
B xB,0 xB,1 xB,2 ...
Giuseppe 1.94
C xC,0 xC,1 xC,2 ... .......... ......
23
.... .... ... ... ... esempi...
(Limitatamente a processi SINCRONICI) Questionari e test (7 / 9) Matrici elementari: "2-vie 1-modo"
TEORIA DEI DATI
(Cattel, 1940; Coombs, 1964; Carol, Arabie, 1980)
(Km.) Amsterdam Milano Roma Venezia
un esempio...
Relazione ASIMMETRICA di APPARTENENZA (ad una classe di equivalenza) Relazione ASIMMETRICA di DOMINANZA [se = 1]
CxV D1, D2, D3, ... Domande Likert S1, S2, S3, ...
Stimoli Test
24
25
Tratto da:
R. Miceli, "Gli abitanti della valle del Lys e il rischio idrogeologico",
Indagine psico-sociologica, 2006 (N = 407)
Questionari e test (9 / 9) Inoltre le matrici elementari si distinguono...
PRIMARIE PICO
Esempio di matrice derivata (micro macro)
SECONDARIE MICRO
DERIVATE MACRO
(frequenze; conteggi)
(esempio : f12 = 2)
Ident X Y (esempio : f 21 = 0)
1 1 2 X \ Y 1 2 .. K Tot.
2 1 2
1 f11 f12 .. f1K f1+
3 1 1
4 2 3 2 f21 f22 .. f22 f2+
5 3 1
... .. .. .. .. ...
6 3 3
7 H K H fH1 fH2 .. fHK fH+
… … …
Tot. f+1 f+2 .. f+K f++
N ... ...
26
Approccio
sperimentale
Il processo di rilevazione può essere svolto seguendo due approcci
e osservativo (per matrici di tipo: PRIMARIO-MICRO)
(1 / 9)
SPERIMENTALE OSSERVATIVO
Disegno CONTROLLO Rilevazione
CASUALE STRATIFICATO
Una ditta di servizi desidera sapere se l'introduzione di una novità tecnologica (a2) influisce posititvamente sulla
soddisfazione dei suoi clienti. Due campioni rappresentativi di clienti vengono estratti rispettivamente da due zone
territorialmente distinte (Z e W). La soddisfazione viene misurata tramite due indicatori che riguardano:
1) la percezione di efficienza del servizio (YE);
2) la soddisfazione inerente i costi del servizio (YC).
t1) Tutti gli individui (di Z e W) vengono misurati rispetto agli indicatori di soddisfazione (YE e YC) PRE-TEST
t1 - t2) In Z il servizio resta immutato; in W viene introdotta la modifica tecnologica (a2) TRATTAMENTO
t2) Tutti gli stessi individui vengono nuovamente misurati (con gli stessi strumenti) POST-TEST
[Ulteriore variabile di disturbo controllata: eventuale differente grado "di base" della soddisfazione in Z e W]
Esempio: segue... 30
Approccio
sperimentale SPERIMENTALE TIPI DI DISEGNO ("controllo" tramite assegnazione CASUALE a gruppi)
e osservativo
(5 / 9) Esempio: Disegno IBRIDO MULTIVARIATO PRE-POST TEST
TERRITORIO (campioni): zona Z e W in cui si svolge l'esperimento; MISURE: yE e yC rispettivamente soddisfazione per Efficienza e per Costi)
TRATTAMENTO: a1 = nulla; a2 = innovazione tecnologica; TEMPO: fasi temporali 1 e 2 di esecuzione dell'esperimento
INDIVIDUI: identificati dagli indici i e j (1 ≤ i ≤ NZ ); (1 ≤ j ≤ NW ); dove NZ e NW sono le numerosità dei campioni nelle due zone
Disegno che conduce ad una analisi dei dati che considera:
più variabili esplicative o indipendenti (analisi multivariata); effetti "entro" i soggetti (misure ripetute)
1 2 3 4 5 (colonne)
....
Z y 1EZ
i y 1CZ
i
a1 y 2EZi y 2CZi 1
... (Righe)
...
W y 1EW
j y 1CW
j
a2 y 2EW
j y 2CW
j
2
...
t1 t2
(TEMPO)
Disegno che può essere visto come una "combinazione" dei tipi "base" ... considerando solo certe righe e/o colonne
2 1 3 4 "ENTRO" 1 2 3 4 "FRA"
1 2 1 3 4 "IBRIDO"
31
y1,1=700
1 y2,1=640
...
y15,1=850
y16,2=570
2 y17,2=580
... H0 :µ + ,1 = µ + ,2 = µ + ,3 (Ovvero: i diversi metodi NON hanno alcun effetto)
y30,2=460
y31,3=610
3 y32,3=580
...
y45,3=550
32
Approccio assegnazione: CASUALE
sperimentale SPERIMENTALE ALCUNI ESEMPI di DISEGNO FRA I SOGGETTI
struttura dati tipo: BILANCIATO
e osservativo
(7 / 9)
33
ALCUNI ESEMPI di DISEGNO FRA I SOGGETTI Se le lettere dell'alfabeto
Approccio
sperimentale SPERIMENTALE latino fossero 3...
assegnazione: CASUALE struttura dati tipo: BILANCIATO
e osservativo
(8 / 9)
DISEGNO A QUADRATO LATINO (LS-p) (Latin Square) (LS-3) P Q R
(2 variabili di disturbo ... "C" e "D" (stesso numero di modalità) Q
"C" = "esperienza di lettura pregressa" (3 livelli)
R P
"D" = "tipo di diploma conseguito" (3 livelli) R P Q
Esempio (di fantasia)
Valutazione efficienza di 3 metodi di insegnamento (A) per il perfezionamento della capacità di lettura (adulti, diplomati).
Controllo (non manipolabile) = "esperienza pregressa" N° libri letti ultimi 3 anni (categorizzata in 3 livelli)
Controllo (non manipolabile) = "tipo diploma" Liceo, Tecnici, Professionale (categorizzata in 3 livelli)
(Numero totale degli individui coinvolti nell'esperimento = 45)
(5 individui in ogni cella... Ad ogni cella viene assegnato uno dei 3 livelli del Trattamento "A")
y1,1,1=700 y6,1,2=730
1 H0 :µ + ,1, + = µ + ,2, + = µ + ,3, + (Ovvero: i diversi metodi NON hanno alcun effetto)
y2,1,1=640 y7,1,2=590
..... .....
H0 :µ + , + ,1 = µ + , + ,2 (Ovvero: i diversi docenti NON hanno alcun effetto)
y5,1,1=850 y10,1,2=790
Inoltre è possibile controllare l'effetto congiunto dei due trattamenti...
y11,2,1=570 y16,2,2=650 ovvero l'effetto: INTERAZIONE
2 y12,2,1=580 y17,2,2=850 H 0 : µ + h j − µ + h′ j − µ + h j ′ + µ + h′ j ′ = 0
..... .....
y15,2,1=460 y20,2,2=430
per ogni h,h ′,j e j ′, con h ≠ h ′ e j ≠ j ′
La "VALIDITÁ della ricerca" riguarda gli asserti che l'attività di studio produce; questi ultimi
sono tanto più validi quanto più sono il frutto di procedure rigorose, controllate (ovvero in cui
sono state adottate le più adeguate forme di controllo) e controllabili (da terzi)
La "VALIDITÁ della ricerca" (quindi delle proposizioni che essa produce) deve essere
considerata in funzione degli SCOPI che la ricerca stessa si è data
DESCRIVERE (Com'é Y ?)
Riguarda una variante della validità esterna con specifico riferimento alla
ECOLOGICA generalizzabilità alla vita quotidiana e agli studi sulla percezione
36
Validità della ricerca
(2 / 6)
(BREVE DIGRESSIONE) Può essere opportuno precisare il significato di alcuni termini...
RELAZIONE Si intende il RAPPORTO (o connessione) fra due variabili (che rimandano ai relativi
concetti); generalmente ci si riferisce a variabili espresse almeno ad un livello di scala
di intervalli (il termine "connessione" - più generale - può essere usato anche per
variabili categoriali
CORRELAZIONE Il termine rimanda all'uso del coefficiente (r) di Bravais- Pearson, pertanto si
riferisce esclusivamente a RELAZIONI LINEARI fra variabili espresse almeno
ad un livello di scala di intervalli
Operando con due sole variabili (x e y) tutto ciò che si può fare è DESCRIVERE la relazione e
formulare una congettura sul tipo di legame che le unisce. Per CONTROLLARE la congettura
(sottoporla ad un "test") è necessario - come minimo - introdurre nell'analisi una TERZA variabile
La maggior parte delle congetture sulle relazioni fra variabili sono riconducibili a due tipi logici:
Tipo A Tipo B
(y DIPENDE da x ?) (y e x si comportano come se DIPENDESSERO
da una medesima variabile ?)
x
?
? ? ?
Y
x Y
due variabili (semanticamente autonome,
correlate o no); la prima (y) è assunta due variabili (correlate, semanticamente
come variabile DIPENDENTE, la autonome o no); si assume che fra esse
seconda (x) come "candidata" al ruolo di non vi sia alcun legame diretto
INDIPENDENTE
"modelli di misurazione" 38
"modelli causali"
(analisi fattoriale
(path analysis; equazioni
confermativa; teoria dei
strutturali; etc.)
test; etc.)
Per ulteriori approfondimenti s: L. Ricolfi (1993) Tre Variabili. Un'introduzione all'analisi multivariata, Milano, Franco Angeli
Validità della ricerca
(4 / 6) VALIDITÁ INTERNA
(introduzione della "terza variabile" per "spiegare" una relazione bivariata)
→ Limitatamente alle congetture di tipo A e ryx ≠ 0
L'introduzione di una terza variabile (z) comporta la possibilità delle seguenti relazioni
x x x x
z z z z
Y Y Y Y
esempi
Relazione MEDIATA o INDIRETTA: effetto della pioggia sulla depressione (Brewer, 2000)
+
depressione (y) depressione (y)
40
Validità della ricerca 41
(6 /6) Esempio di relazione originaria SPURIA
Relazione SPURIA o NON GENUINA: il paradosso delle cicogne e dei bambini ( Lazarsfeld, 1955)
<<nelle zone in cui vi sono più cicogne nascono più bambini>>
ANALISI
BIVARIATA Y = numero di bambini nati
X = numero di cicogne
Z = tipo di zona ( U Urbana; R Rurale)
N° cicogne
(x)
tipo zona
(z)
N° nati
(y)
ANALISI
MULTIVARIATA
Attendibilità e validità
misurazione variabili: manifeste/latenti dimensionalità attendibilità validità
della misurazione (1 / 12)
variabili: manifeste/latenti 42
POSSONO PRODURRE
complessitàMISURE
del costrutto e/o scarsa condivisione su def. operativa
(quando – tali variabili -godono di specifiche proprietà formali)
non sono rilevabili sulla base di un'osservazione diretta (es.:risposta a una domanda)
43
Attendibilità e validità
misurazione variabili: manifeste/latenti dimensionalità attendibilità validità
della misurazione (3 /12)
Es.: abilità di far di conto con la tabellina pitagorica dimensionalità dei costrutti
2 domande...
Es.: prudenza degli individui
Definizione
del concetto...
<<... Quando si dice che un uomo è prudente, significa che egli adotta un certo numero di comportamenti
caratteristici della prudenza: che contrae assicurazioni, che non punta tutto su un solo cavallo, che non si
getta a occhi chiusi in un affare ... Il termine "prudente" è così un modo pratico di esprimere astrattamente
un aspetto comune alle sue azioni abituali ... Vi sono nel suo sistema psicofisico dei caratteri che lo portano
ad agire prudentemente ...>> (tratto da: William James, The Meaning of Truth; in Lazarsfeld, 1969)
44
Attendibilità e validità
misurazione variabili: manifeste/latenti dimensionalità attendibilità validità
della misurazione (4 /12)
Definito il concetto, si possono predisporre alcune domande inerenti dimensionalità dei costrutti
ai comportamenti della vita quotidiana; per esempio...
?
TIZIO = CAIO
molto prudente rispetto al patrimonio economico un pò prudente rispetto al patrimonio economico
molto imprudente rispetto alla sua salute un pò prudente rispetto alla sua salute
alcuni concetti (come quello di prudenza) sono così complessi che il loro processo di
trasformazione in dati (la loro operativizzazione) richiede una pluralità di dimensioni
guida auto
patrimonio
etc., etc.
salute
45
Attendibilità e validità
della misurazione (5 /12)
misurazione: attendibilità validità
• La VALIDITÁ (di uno strumento) è il grado in cui lo strumento misura ciò che intende misurare
• L'ATTENDIBILITÁ è il grado di concordanza fra misurazioni indipendenti dello stesso costrutto
CONTENUTO = grado in cui gli agenti elicitanti la proprietà (ITEM) sono rappresentativi dell'universo degli agenti per
quella proprietà
FACCIATA = grado in cui gli agenti elicitanti la proprietà (ITEM) sembrano (SIC!) appropriati
CRITERIO = grado di associazione fra la misurazione del costrutto e misurazioni di altri costrutti che possono essere
considerati come riferimento esterno
PREDITTIVA (se intervine un lasso di tempo fra la misura e il rifeirmento esterno)
CONCORRENTE (quando le misure coinvolte sono concomitanti)
COSTRUTTO = grado in cui la misura riflette accuratamente il costrutto che si intende misurare
CONVERGENTE (presenza di relazione con misurazioni diverse dello stesso costrutto)
DISCRIMINANTE (assenza di relazione con misurazioni inerenti costrutti diversi)
NOMOLOGICA = grado in cui la misurazione del costrutto si inserisce in una serie di relazioni (predittive) con
costrutti affini e/o con criteri di riferimento
46
Attendibilità e validità
della misurazione (6 /12) misurazione attendibilità (teoria classica)
σ V2 σ E2 (0 ≤ rtt ≤ 1)
rtt = 2 rtt = 1 − 2 Coefficiente di determinazione
σX σX
47
α di Cronbach K di Cohen
Attendibilità e validità
della misurazione (7 /12)
misurazione attendibilità α di Cronbach
Per ottenere un punteggio complessivo, ha senso sommare fra loro solo Item (molto) interrelati
Il coefficiente α fornisce una stima dell'attendibilità in termini di coerenza interna del test
Il coefficiente α può essere pensato come una correlazione media degli item entro il test
Gli errori di misurazione (Ej) sono indipendenti fra loro e dai valori veri (Vj)
Siano così definiti il punteggio totale osservato e il punteggio totale vero: X 0 = ∑ X j ;V0 = ∑V j
j j
(K − 1)∑ σ 2V j ≥ ∑ cov(Vi ,V j )
∑ cov(Vi ,V j )
Dato che: Un limite inferiore per σ 2V0 K
j i≠ j è dato da : K − 1 i≠ j
K
∑ cov(X , X )
i j
K ∑σ Xj
2
α =
i≠ j
= 1−
j
K − 1 σ 2X0 K − 1 σ X0
2
continua...
48
Attendibilità e validità
della misurazione (8 /12)
misurazione attendibilità α di Cronbach
Se le varianze degli item variano in maniera ampia è conveniente standardizzare gli item, prima di calcolare α
α raggiunge il valore massimo 1 quando la correlazione fra ogni coppia di item è 1
In presenza di correlazioni negative fra coppie di item α può assumere valori negativi
Se gli item sono dicotomici, α è equivalente alla misura di attendibilità di Kuder-Richardson (KR-20)
Per valutare quanto ciascun item rispecchi l'attendibilità della scala, si calcola un coefficiente α
(indipendentemente per ciascun item) dopo aver cancellato dalla scala quell'item
K −1
K − 1
∑ σ 2
Xj
αi = j ≠i
1 − K −1
K − 2 σ 2∑ X j
j ≠i
Se α CRESCE dopo che un item è stato cancellato dalla scala, si può ritenere che quell'item
NON è fortemente CORRELATO con gli altri
Se α DECRESCE si può ritenere che quell'item È fortemente CORRELATO con gli altri
Esempio continua...
49
Attendibilità e validità misurazione attendibilità Esempio tratto da ... Miceli, R., Sotgiu, I., & Settanni, M. (2008).
della misurazione (9 /12) Disaster preparedness and perception of flood risk:
A study in an alpine valley in Italy
PERCEZIONE DEL RISCHIO IDROGEOLOGICO
α di Cronbach Journal of Environmental Psychology 28, 164-173.
Pensando ai prossimi 5 anni, ad un EVENTO ALLUVIONALE Pensando ai prossimi 5 anni, ad un EVENTO ALLUVIONALE
con FRANE e smottamenti che coinvolga la zona in cui abita con FRANE e smottamenti che coinvolga la zona in cui abita
quanto è PROBABILE che... quanto è PREOCCUPATO/A che...
["per nulla", "poco", "abbastanza", "molto"] [0,1,2,3] ["per nulla", "poco", "abbastanza", "molto"] [0,1,2,3]
?
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
d11_1 0.137704 0.792294 0.146843 0.792814
d11_2 0.532856 0.740070 0.529757 0.744839
d11_3 0.575723 0.732727 0.566770 0.739863
d11_4 0.677670 0.715834 0.670265 0.725619
?
d11_5 0.609470 0.727500 0.603324 0.734888
d12_1 -.046961 0.815073 -.047664 0.814855
d12_2 0.332153 0.764587 0.339227 0.769495 50
d12_3 0.551915 0.738056 0.557794 0.741075
d12_4 0.622569 0.728094 0.629054 0.731349
d12_5 0.499762 0.744861 0.503281 0.748361
Attendibilità e validità
misurazione attendibilità K di Cohen Esempio
della misurazione (10 /12)
51
Misura di concordanza per varibili categoriali (ACCORDO FRA GIUDICI) -- (J. Cohen, 1960)
Due psicologi clinici sono chiamati ad esprimere (in modo indipendente) la diagnosi su 200 pazienti;
essi devono stabilire a quale fra le seguenti categorie appartiene ciascun paziente:
schizofrenico; nevrotico; danno cerebrale.
Frequenze Osservate Frequenze Attese (Indipendenza)
I J I J
Po = 0.25 + 0.02 + 0.02 = 0.29;
Po = ∑∑ pij ; Pc = ∑∑ pˆ ij ; ( per i = j )
Dove : Po = ACCORDO OSSERVATO (proporzioni)
Pc = ACCORDO ATTESO (proporzioni)
i =1 j =1 i =1 j =1 Pc = 0.20 + 0.09 + 0.06 = 0.35
Attendibilità e validità
della misurazione (11 /12) K di Cohen Tre assunti:
1) Le unità (nell'esempio i pazienti) sono indipendenti
misurazione attendibilità 2) Le categorie rispettano i requisiti della logica classica
3) I giudici operano in modo indipendente
nell'esempio c'é associazione, ma – "a occhio" - si vede che non c'é accordo
CHI-QUADRO (e misure derivate) sono INADEGUATE
Po − Pc Fo − Fc
k= k=
1 − Pc N − Fc
k < 0 !! DISACCORDO !! l'accordo osservato è minore di quello dovuto al caso; (MIN ≠ -1)
(Con riferimento all'esempio...) Po = 0.25 + 0.02 + 0.02 = 0.29; Pc = 0.20 + 0.09 + 0.06 = 0.35
0.29 − 0.35 58 − 70 52
k= = −0.09 k= = −0.09
1 − 0.35 200 − 70 continua...
Attendibilità e validità
misurazione attendibilità K di Cohen Ulteriore Esempio
della misurazione (12 /12)
σk =
82
= 0.059 H0: RESPINTA
200(200 − 82)
53
Analisi della Varianza (Fisher, 1935) Esempio: CAMPIONI CASUALI INDIPENDENTI - DATI BILANCIATI
<<Se gli individui sono stati sottoposti a diversi metodi di insegnamento
...Come estensione del TEST sulla differenza fra medie... (a; b; c; ....; z), allora la loro velocità di lettura è differente>>
-------------------------------------------------
per semplicità: 3 metodi (a, b,c); 3 individui ogni campione
Ident y Metodo
Disegno ad Assegnazione Casuale completa
(parole lette / (Completely Randomized CR-3) ANOVA ad UNA VIA
intervallo di
H0 : µ a = µ b = µ c
tempo)
1a 50 a
2a 40 a a ya = 50
3a 60 a
1b 70 b
y = 50
2b 80 b b yb = 80
3b 90 b Per utilizzare il TEST (t) sulla differenza
fra due medie è necessario effettuare
1c 20 c 3 CONFRONTI...
2c 15 c
c yc = 20 In generale con k medie, k ⋅ (k − 1)
3c 25 c il numero dei confronti è pari a: c=
2
Fissato il coefficiente di fiducia (α),
la probabilità di incorrere in un ERRORE
del I° TIPO aumenta all'aumentare dei confronti!
<< Se il diverso metodo di insegnamento influenza la velocità di lettura, allora le medie dei campioni saranno diverse>>
MA SI TRATTA DI DIFFERENZE STATISTICAMENTE SIGNIFICATIVE?
Ovvero:
I tre campioni possono essere ricondotti ad ununico universo di riferimento (con la stessa media)?
Ovvero:
Le differenze osservate fra le medie dei tre campioni sono oscillazioni casuali intorno ad un'unica media?
La Prob. di incorrere in un errore del I° tipo può essere approssimata per eccesso (confronti tutti ortogonali)
Per esempio:
Pr = 1 − (1 − α )
c
Medie Confronti (c) −−−− − −−−−− − Pr. Errore I° tipo
con α = 0.05
2 1 1 − 0.951 = 1 − 0.950 = 0.050
4 6 1 − 0.956 = 1 − 0.735 = 0.265
6 15 1 − 0.9515 = 1 − 0.463 = 0.537
54
8 28 1 − 0.95 28 = 1 − 0.238 = 0.762
10 45 1 − 0.9545 = 1 − 0.099 = 0.901
Analisi della Varianza ...Come estensione del TEST sulla differenza fra medie...
H0 : µ a = µ b = µ c ? H1 : µ a ≠ µ b ≠ µ c
<<eventuali differenze fra le medie empiriche dei <<almeno una differenza fra le medie empiriche dei
campioni sono POCO MARCATE così che possono campioni è ABBASTANZA MARCATA così che
essere attribuite ad oscillazioni casuali intorno si può sostenere l’appartenenza dei diversi
ad un’unica media dell’universo di riferimento>> campioni a universi distinti con medie differenti>>
Test F
Organizzando diversamente i dati dell'esempio, si evidenziano
DUE FONTI DI VARIABILITÀ (unico EFFETTO: "metodo")...
Ident y Metodo
(parole lette /
intervallo di Effettuando i calcoli...
tempo)
NOTAZIONE
1a 50 a
N = numerosità totale
2a 40 a
3a 60 a
n = na = nb = nc = numerosità campione
1b 70 b k = numero di campioni
2b 80 b GdL = Gradi di Libertà
3b 90 b DEV = devianze
1c 20 c VAR = varianze
2c 15 c DEVS ⇔ VARS =" Spiegata" , "FRA" , "between"
3c 25 c DEVR ⇔ VARR ="Residua" , "ENTRO" , " within"
DEVs = n∑ ( y j − y ) = n( ya − y ) + n( yb − y ) + n( yc − y ) =
K
2 2 2 2
GdLS = k − 1 = 3 − 1 = 2
j =1
DEVR = ∑∑ ( yij − y j ) =
n K
2
i =1 j =1
= (50 − 50 ) + (40 − 50 ) + (60 − 50 ) + (70 − 80 ) + (80 − 80 ) + (90 − 80 ) + (20 − 20 ) + (15 − 20 ) + (25 − 20 ) = 450
2 2 2 2 2 2 2 2 2
VARS è affetta da errore sistematico, se le differenze fra le medie sono dovute a universi di riferimento con medie diverse e, in tal caso l'errore
condurrà ad una sovrastima (della varianza fra le medie dei campioni) dato che il numero di campioni è sempre inferiore al numero degli individui
VARR è una stima (campione per campione) e pertanto è sempre priva di errore sistematico
F ha una distribuzione campionaria che fornisce la probabilità di ottenere, per effetto del caso, un valore uguale o maggiore a quello empirico
56
Analisi della Varianza (Fisher, 1935) Esempio: CAMPIONI CASUALI INDIPENDENTI - DATI BILANCIATI
<<Se gli individui sono stati sottoposti a diversi metodi di insegnamento
...Come estensione del TEST sulla differenza fra medie... impartiti da diversi insegnanti, allora la loro velocità di lettura è differente>>
-------------------------------------------------
metodo - A (1, 2, 3); insegnante - B (1, 2) 30 individui ogni gruppo
RIGA
2 56.63 48.20 52.42
nhj
1
S61 56 2 1 y1,11 = 62 y1,12 = 20 yhj =
nhj
∑y hj , i = media di cella
S62 70 2 1
1
i =1
y2,11 = 51 y2,12 = 23
::: ::: ::: ::: 3 58.40 49.07 53.73 1 N
Dal test sulla differenza fra medie... al MODELLO ANOVA (lineare generalizzato classico)...
ANOVA Modello lineare Regressione semplice Scomposizione della variabilità (1)
TEOREMA
La somma dei quadrati totale o da spiegare (SQT) può sempre essere scomposta in due addendi: la somma dei
quadrati spiegata (SQS) e la somma dei quadrati residua o dello scarto (SQR)
DIMOSTRAZIONE
yi = yˆ i + ei Elevando al quadrato
e sommando ... (1 < i < N ) ... ∑ y = ∑ yˆ
2
i
2
i + 2∑ yˆ i ei + ∑ ei2 Ma... (∑ yˆ i ei = 0 ); pertanto...
Ovvero...
y′y = yˆ ′yˆ + e ′e
Se nel modello è presente l'intercetta...
SOMME dei QUADRATI = DEVIANZE
SQθ0
Sfruttando alcune proprietà delle stime
(yˆ = y ; e = 0) SQθ1
vale, anche per le DEVIANZE, SQS
il precedente TEOREMA; infatti... SQθ2
∑ ( y − y) = DevT
2
i
yˆ i = θˆ0 + θˆ1 xi
∑ ( y − yˆ ) = ∑ e = Dev R
2 2
i i
yi
( yi − yˆ i )
( yi − y ) ∑ ( yˆ − y ) = Dev S
2
ŷi i
( yˆ i − y )
y y
θˆ0
θˆ1
59
Variabili categoriali
Variabili booleane 12 individui... rilevazione di:
GRUPPO di riferimento (A, B, C) GENERE (1 = Maschio; 0 = Femmina)
IDENT IDENT
Gruppo Genere A B C M F
FORMA
01 A 1 matrice RIDOTTA 01 1 0 0 1 0
variabili COMPRESSA
02 A 1 02 1 0 0 1 0
03 A 0 03 1 0 0 0 1
04 A 0 04 1 0 0 0 1
05 B 1 05 0 1 0 1 0
06 B 1 06 0 1 0 1 0
07 B 0 07 0 1 0 0 1
08 B 0 08 0 1 0 0 1
09 C 1 09 0 0 1 1 0
10 C 1 FORMA 10 0 0 1 1 0
matrice CANONICA o ESTESA
11 C 0 variabili DISGIUNTIVA COMPLETA 11 0 0 1 0 1
12 C 0 12 0 0 1 0 1
... ...
APPARTENENZA VERITÀ
xi xi
... ... 60
ESEMPIO (1a) ==> 2 gruppi di individui (3 individui ogni grupo) sono stati sottoposti a metodi diversi di insegnamento;
si potrebbero ottenere i seguenti dati...
y = 50; x = 0.5
y
90
80
70 In una situazione così elementare
è possibile seguire, passo-passo,
60 (50;0.5) il procedimento di stima del modello...
50 yˆ i = θˆ0 + θˆ1 xi
40 ⇓ ⇓
30 20 60
20
10 θˆ0
θˆ1
61
0 1 x
ESEMPIO (1a) N N
yi = θˆ0 + θˆ1 xi + ei
Si tratta di trovare quei parametri (a; b) che... ∑e = ∑(y
i =1
2
i
i =1
i − yˆ i ) = min
2
yˆ i = θˆ0 + θˆ1 xi
( )
N N N
Parametro: θ0
∂ N
( ) ( )
N
∑ i 0 1i ∑
2
θ θ θˆ − θˆ x 1 = 0
− − = − −
( ) ( )
ˆ ˆ
y x 2 y ∂ N N
∑ i 0 1i ∑
2
∂θˆ0 i =1 i =1
i 0 1 i
w − θˆ − θˆ z = − 2 z w − θˆ − θˆ z 1 = 0
∂θˆ1 i =1
i i 0 1 i
N N i =1
∑ yi − Nθˆ0 − θˆ1 ∑ xi = 0 N N N
i =1 i =1
∑ wi zi − θˆ0 ∑ zi − θˆ1 ∑ zi2 = 0 ;
i =1 i =1 i =1
1 N 1 N
θ0 = ∑ yi − θˆ1
ˆ
∑ xi N N
N i =1 N i =1
Ma: ∑ zi = ∑ ( xi − x ) = 0
θˆ = y − θˆ x
0 1
i =1 i =1
N N
Parametro: θ1 (traslazione degli assi) wi = yi − y
∑ w z ∑(yi i i − y )( xi − x )
CoDev xy
zi = xi − x θˆ1 = i =1
= i =1
=
Dev x
100
N N
∑z (
∑ i )
y
−
90 w 2
2
80
70
i x x
60 i =1 i =1
50
N
∑(y − y )( xi − x )
40 1
Cov xy
30
i
20
N
10
θ1 Ovvero... θˆ1 = i =1
=
N
Varx
0
∑ (x − x )
-10 x 1 2
-20 i
-30 N i =1
-40
θ1 (y;x)
-50
-60
z
(w;z)
62
-0.5 0.0 +1.0
I calcoli...
yi = θˆ0 + θˆ1 xi + ei yˆ i = θˆ0 + θˆ1 xi
ESEMPIO (1a)
Qualche conto utile...
1
i =1
N
1
1c 20 0 20 0 x =
2
∑x 2
= 3 = 0.5
2c
3c
15
25
0
0
20
20
-5
+5
} ŷ = 20 = MEDIA ("C") N i =1
i
6
COVxy xy − x ⋅ y 40 − 0.5 ⋅ 50 15
θ1 =
ˆ = 2 = = = 60 θˆ0 = y − θˆ1 x = 50 − 60 ⋅ 0.5 = 20
VARx x −x 2 0.5 − 0.25 0.25
Inoltre...
N N N
DEVt = ∑ ( yi − y ) = 5650 ; GdLt = 6 − 1 = 5 DEVs = ∑ ( yˆ i − y ) = 5400 ; GdLs = 1 DEVr = ∑ (ei ) = 250 ; GdLr = 6 − 1 − 1 = 4
2 2 2
i =1 i =1 i =1
Standard
Parameter Estimate Error t Value Pr > |t| proc sort data=uno out=uno;by descending x;
Intercept 20.00000000 B 4.56435465 4.38 0.0119 proc glm data=uno order=data; class x;
x 1 60.00000000 B 6.45497224 9.30 0.0007 64
model y = x /solution;quit;
x 0 0.00000000 B . . .
NOTE: The X'X matrix has been found to be singular, and a generalized inverse
was used to solve the normal equations. Terms whose estimates are
followed by the letter 'B' are not uniquely estimable.
Il modello lineare classico "REGRESSIONE"
ESEMPIO (1b) Il modello è nato come uno strumento per stimare i parametri di
una relazione lineare fra due variabili entrambe cardinali.
Su un campione di 10 donne è stato rilevato
“l’atteggiamento nei confronti della Il termine “regressione” si deve al biologo Galton (1822-1911)
subordinazione della donna” (y) e un tratto che ha cercato di stabilire in che misura la statura dei figli segnasse
di personalità, “autoritarismo” (x) un ritorno (una regressione appunto) verso la statura media della
specie, allorché la statura dei genitori se ne allontanava
Entrambe le varibili sono a livello di scala di intervalli,
con punteggi che variano da 0 a 10
(10 = max subordinazione = max autoritarismo)
Id y x Dai dati...
yi = θˆ0 + θˆ1 xi + ei
y = 4.40; x = 3.00 x 2 = 3.00 2 = 9.00
y
1 2 1
10
9
N
2 4 3 1 1
∑x y
8
7 xy = i i = 144.00 = 14.40
3 5 2 N i =1 10
yˆ i = 2.6 + 0.6 xi
6
5
4 5 5 1 N
1
∑x
4
3 x2 = 2
= 110.00 = 11.00
5 6 5 N
i
10
2 i =1
6 4 1 1
0
0 1 2 3 4 5 6 7 8 9 10 11
x sx = sx2 = 2.00 = 1.414 ; s y = 1.44 = 1.20
7 4 4
8 3 2
COVxy xy − x ⋅ y 14.40 − 3.00 ⋅ 4.40 1.20
9 5 3 θˆ1 = = = = = 0.60 θˆ0 = y − θˆ1 x = 4.40 − 0.60 ⋅ 3.00 = 2.60
10 6 4 VARx x −x2 2 11.00 − 9.00 2.00
N
DEVt = ∑ ( yi − y ) = 14.40 ; GdLt = 10 − 1 = 9 DEVs 7.20
2
R2 = = = 0.50
i =1 DEVt 14.40
N
DEVs = ∑ ( yˆ i − y ) = 7.20 ; GdLs = 1
2 DEVs
GdLs 7.20
i =1 F= = = 8.00;
DEVr 0.90
N GDLr
DEVr = ∑ (ei ) = 7.20 ; GdLr = 10 − 1 − 1 = 8 {per α = 0.05; Fcritico = 5.32}
2
(H0 : respinta)
i =1
65
t = F = 8.00 = 2.83
GdLr = 8; {per α = 0.05; tcritico = 2.306} (H0 : respinta)
ESEMPIO (1b) Quando le variabili (y e x) sono standardizzate, il coefficiente di
regressione stimato coincide con il coefficiente di correlazione (r)
Coefficienti θˆ1 e βˆ1
Interpretazione parametri (θˆ ;θˆ ; βˆ )
0 1 1
Questo coefficiente (peso β ) esprime la variazione attesa in y, in
unità di deviazione standard, per la variazione di 1 dev. standard in x
Stime (ŷ) al di là dei dati empirici (x = ???)
The MEANS Procedure
Variable N Mean Std Dev Minimum Maximum
The REG Procedure proc reg data=uno; model y =x / stb;quit;
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Model: MODEL1
y 10 4.4000000 1.2000000 2.0000000 6.0000000 Dependent Variable: y
x 10 3.0000000 1.4142136 1.0000000 5.0000000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
data uno;input y x;cards; Obs y x ystd xstd Model 1 7.20000 7.20000 8.00 0.0222
2 1 1 2 1 -2.00000 -1.41421 Error 8 7.20000 0.90000
4 3 Corrected Total 9 14.40000
2 4 3 -0.33333 0.00000
5 2
5 5 3 5 2 0.50000 -0.70711
4 5 5 0.50000 1.41421 Root MSE 0.94868 R-Square 0.5000
6 5 Dependent Mean 4.40000 Adj R-Sq 0.4375
4 1 5 6 5 1.33333 1.41421
Coeff Var 21.56098
4 4 6 4 1 -0.33333 -1.41421
3 2 7 4 4 -0.33333 0.70711
Parameter Estimates
5 3 8 3 2 -1.16667 -0.70711 Parameter Standard Standardized
6 4 9 5 3 0.50000 0.00000 Variable DF Estimate Error t Value Pr > |t| Estimate
; 10 6 4 1.33333 0.70711 Intercept 1 2.60000 0.70356 3.70 0.0061 0
x 1 0.60000 0.21213 2.83 0.0222 0.70711
The REG Procedure proc reg data=uno; model ystd = xstd ;quit;
y
yˆ i = 2.6 + 0.6 xi Model: MODEL1
Dependent Variable: ystd
10
Analysis of Variance
9 Sum of Mean
ŷ = 7.4 Source DF Squares Square F Value Pr > F
8 Model 1 5.00000 5.00000 8.00 0.0222
7
Error 8 5.00000 0.62500
Corrected Total 9 10.00000
6
Root MSE 0.79057 R-Square 0.5000
5
Dependent Mean -2.8866E-16 Adj R-Sq 0.4375
4 Coeff Var -2.73878E17
3 Parameter Estimates
2 Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
1 Intercept 1 -2.8866E-16 0.25000 -0.00 1.0000
xstd 1 0.70711 0.25000 2.83 0.0222
0
0 1 2 3 4 5 6 7 8 9 10 11
x
66
Introduzione al Modello Lineare Classico
o Stime OLS
Il modello lineare classico è un dispositivo che connette due entità... INCERTA STRUTTURALE
Esempio
Sono stati rilevati i valori ottenuti tramite due strumenti di misura (x e y )
Si sa che lo strumento x è PRECISO (privo di errore)
Si assume che il "dispositivo" sia di tipo lineare
yi = ~yi + ε i ~y = θ + θ x
i 0 1 i
Id y x 50 y
1 22 -5 45
2 29 -4 40
3 27 -3 35
4
5
27
32
-2
-1
30
yi = θ 0 + θ1 xi + ε i
25
6 30 0
20
7 34 +1
15
8 34 +2
θˆ0 θˆ1
10
9 39 +3
5
10 42 +4 x
0
11 41 +5 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Id y x ŷ e
50 y
yˆ i = 32.45455 + 1.80909 ⋅ xi 1 22 -5 23 -1
yˆ i = θˆ0 + θˆ1 xi
45
2 29 -4 25 +4
40
3 27 -3 27 0
35
4 27 -2 29 -2
30
yi − yˆ i = ei
5 32 -1 31 +1
25
6 30 0 32 -2
20
7 34 +1 34 0
15
8 34 +2 36 -2
10
9 39 +3 38 +1
5
x
10 42 +4 40 +2
0
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 11 41 +5 42 -1
INCERTA STRUTTURALE
Considerazioni:
yi = ~yi + ε i ~y = θ + θ x
i 0 1 i
yi = θ 0 + θ1 xi + ε i
ASIMMETRIA "sintattica" della relazione... osservato "vero
yi ~y "
i
x è una variabile "fissa" o "matematica"
(valori NON soggetti a fluttuazioni probabilistiche) εi "errore"
Stessa
y (e solo y) è una variabile stocastica Distribuzione
di Probabilità
EXPLANANDUM EXPLANANS
RELAZIONI CAUSALI
Causa
DESTINAZIONE
SCOMPOSIZIONI (FILTRAGGIO) (segnale + disturbo) SORGENTE
Filtro
VARIABILITÀ VARIABILITÀ
RIPRODUZIONE (SIMULAZIONI)
Simulatore
Notazione y1 1 x1 y1 1 x11 x21 ... xk1
y 1 x y 1 x x22 ... x k2
2 2 2 12
In matrice dati... ... in generale... 1 ... ... ...
yi = θ 0 + θ1 xi + ε i
... 1 ... ... ...
yi 1 xi yi 1 x1i x2i ... xki
... 1 ... ... 1 ... ... ... ...
yN 1 x N yN 1 x1N x2 N ... xkN
Notazione scalare...
K
yi = θ 0 + θ1 x1i + θ 2 x2i + ... + θ k xki + ε i yi = θ 0 + ∑ θ k xki + ε i
Ovvero...
k =1
! ATTENZIONE !
1 Il valore atteso di ogni (εi ) è pari a zero E (ε ) = 0 Assenza di errori sistematici nei valori della ỹ
3 La varianza dell’errore deve essere costante VAR(ε ) = σ 2 Omoschedasticità del vettore degli errori (ε )
Congiuntamente...
nella parte sistematica del modello devono essere contemplate TUTTE le variabili rilevanti
Qualche nozione di algebra delle matrici (1/3)
• Una MATRICE è un insieme di NxT elementi (generalmente numeri reali) ordinati per righe e per colonne
a′ ⋅ b = π
4
3] ⋅ 5 =
3
[1 2
∑a b i i = 4 + 10 + 18 = 32
i =1
6
Date due matrici A e B è possibile effettuare il loro prodotto solo se il numero di colonne di A è uguale al numero di righe di B
Si dice in tale caso che le matrici sono “conformate” o “compatibili”
Aν τ ⋅ Bτγ = Cν γ
A B C
3 3 1
3 2 9 + 5 + 2;9 + 1 + 6;3 + 1 + 4 16 8
1 =
1 16
2 ⋅ 5 1 =
1 3
6 + 5 + 3;6 + 1 + 9;2 + 1 + 6
14
16 9
1 3 2
Qualche nozione di algebra delle matrici (2/3)
X
Esempio XN,3 (3 vettori colonna: α, β, δ STANDARDIZZATI) α1 β1 δ1
α β2 δ 2
X′ ⋅ X = [devianze, codevianze ] 2
α3 β3 δ3
δ1 α 2
N N N
α1 β1
∑ i ∑α iβi ∑α δ .... .... ....
... α N α 2 δ 2 Ni =1
i i
α 1 α 2 α 3 β2 i =1 i =1
α N βN δ N
β β β ... β N ⋅ α 3
N N
1 β3 δ 3 = ∑ α i β i ∑β 2
∑ β iδ i
2 3
i =1 i =1
i
i =1
δ 1 δ 2 δ 3 ... δ N ... ... ... N N N
α N βN δ N ∑ α iδ i ∑β δ ∑ δ 2
i =1
i i i
i =1 i =1
[varianze, covarianze]
N 2 N N
1 N 2 1 N 1 N
[correlazioni ]
∑α i ∑α β i i ∑ α δ
i i N ∑α i ∑α iβi
N i =1
∑
N i =1
α iδ i
1 rαβ rαδ
Ni =1 i =1
N
i =1
N N
i =1
1 N 2 1 N
β iδ i = ∑ α i β i ∑ β iδ i
1 1
⋅ ∑α iβi
N i =1
∑β i
2
∑ N i =1 ∑ βi rαβ
rαδ
1 rβδ
i =1 i =1 N i =1 N i =1 rβδ 1
N N N 1 N 1 N 1 N 2
∑ α iδ i ∑β δ ∑ δ 2
∑ α iδ i ∑ β iδ i ∑ δ i
i =1 N i =1
i i i
i =1 i =1 N i =1 N i =1
x1 x2 x3 X
1 8 2 1 8 2
2 3 5 2 3 5 X = 54
3 9 3 3 9 3
• Il RANGO di una MATRICE XN,T è il numero massimo di righe o colonne linearmente indipendenti
TEOREMA
• Data una matrice rettangolare X, il rango della matrice ottenuta dal prodotto di X per la sua trasposta e il rango della
matrice ottenuta dal prodotto della trasposta di X per la matrice stessa è uguale al rango della matrice X
• Il rango di una matrice quadrata di ordine τ è pari a τ se, e solo se, il determinante della matrice è diverso da zero;
in questo caso si dice che la matrice è di "rango pieno"
1 Ovvero...
• L'INVERSIONE di una matrice è un'operazione che corrisponde alla divisione nell'algebra elementare α⋅ =1
α α ⋅ α −1 = 1
• L'operazione di inversione è possibile SOLO su matrici QUADRATE
• L'INVERSA di una matrice quadrata X è pertanto quella matrice (X-1) che soddisfa la relazione: X ⋅ X −1 = 1
• NON ESISTE l'inversa di una MATRICE SINGOLARE
Stima dei parametri MINIMI QUADRATI ORDINARI Ordinary Least Squares (OLS) Legendre (1805)
Laplace (1812)
y = X ⋅θ + ε y = X ⋅ θˆ + e
Gauss (1821-23)
L’idea consiste nello stimare i parametri del modello in modo da rendere MINIMO l'errore quadratico medio
Nessun assunto sulla distribuzione di probabilità cui appartengono i singoli valori osservati in y
N
e ′ ⋅ e = ∑ ei2 = ( y − X ⋅ θˆ )′ ⋅ ( y − X ⋅ θˆ ) = min Derivando ( y − X ⋅ θˆ )′ ⋅ ( y − X ⋅ θˆ ) riseptto a
ed eguaglaindo a zero, si ottiene un sistema di equazioni ...
θˆ
i =1
θ = (X ⋅ X) ⋅ X′⋅ y
ˆ ′ −1
yˆ = X ⋅ θˆ e = y − X ⋅ θˆ = y − yˆ
(alcune) Proprietà delle stime
θˆ è uno stimatore campionario del vettore θ
Uno stimatore (stimatore campionario) è:
una formula o un metodo di calcolo impiegato per una stima puntuale;
lineare quando può essere espresso come una somma di prodotti fra un coefficiente o peso fisso e una componente variabile o stocastica
(funzione lineare di una variabile stocastica);
corretto se il suo valore medio, calcolato su un numero infinito di campioni casuali estratti dallo stesso universo di riferimento,
è uguale al parametro da stimare (non-distorto o non affetto da errore sistematico);
efficiente se si tratta di quello stimatore cui corrisponde la minima varianza, fra tutti i possibili stimatori non affetti da errore sistematico
Il vettore degli scarti ha sempre media uguale a zero (se è presente il vettore unitario u in rappresentanza di θ0) e =0
La media dei valori riprodotti dal modello coincide sempre con la media della variabile dipendente yˆ = y
DIMOSTRAZIONE
y = yˆ + e moltiplicando entrambi i membri per ... (1 N )u′ si ottiene ... (1 N )u′y = (1 N )u′yˆ + (1 N )u′e
n
MA ... (1 N )u′e = (1 N )∑ ei =e = 0
i =1
Il vettore degli scarti è sempre ortogonale a ciascuna colonna della matrice X X′⋅e = 0
DIMOSTRAZIONE
X ′ ⋅ y = ( X ′ ⋅ X ) ⋅ θˆ X ′ ⋅ y − X ′ ⋅ X ⋅ θˆ = 0 (
X ′ ⋅ y − X ⋅ θˆ = 0 ) X ′ ⋅ ( y − yˆ ) = 0 X′⋅e = 0
Il vettore dei valori riprodotti dal modello è sempre ortogonale al vettore degli scarti yˆ ′ ⋅ e = 0
Segue dal fatto che ŷ è combinazione lineare di X
Due (o più) variabili esplicative
Interpretazione dei parametri (variabili esplicative: CARDINALI)
Notazione vettoriale...
y1 1 x11 xk1
y = X ⋅θ + ε
x21 ...
y 1 x x22 ... x k2
2 12
In matrice dati... ... 1 ... ... ... ...
Notazione scalare... yi 1 x1i x2i ... x ki
... 1 ... ... ... ...
yi = θ 0 + θ1 x1i + θ 2 x2i + ... + θ k xki + ε i
yN
1 x1N x2 N ...
xkN
K
yi = θ 0 + ∑ θ k xki + ε i
Ovvero...
k =1
yi = yˆ i + ei ; ei = yi − y
ˆi
Interpretazione dei parametri DUE SEQUENZE DI TRE ESEMPI...
(X Cardinali)
Sequenza esempi "A" .... COMPORTAMENTO COMPROMISSORIO (X1) ; COMPORTAMENTO AGGRESSIVO (X2)
Sequenza esempi "B" .... COMPORTAMENTO DEVIANTE (X1) ; ETÀ (X2)
Per ciascuna variabile esplicativa si vuole stabilire l'eventuale presenza di un effetto, la sua direzione, la sua entità...
ESEMPIO (Bivariato)
X y
X1
A1
Autonomia ESEMPIO (Bivariato) A2 ESEMPIO (Multivariato) A3
Comportamento decisionale
Compromissorio Comportamento
y X
Compromissorio
θˆ1 = ? θˆ1 = ?
Autonomia
θˆ1 = ?
Comportamento
y
decisionale Aggressivo Autonomia
decisionale
θˆ2 = ? X2
Comportamento
Aggressivo
ESEMPIO (Bivariato) B1
X y
Devianza
Autonomia
ESEMPIO (Bivariato) B2 ESEMPIO (Multivariato) B3
X1
decisionale Devianza
θˆ1 = ?
y θˆ1 = ? X y θˆ1 = ?
Autonomia
Età Autonomia
decisionale
decisionale
θˆ2 = ? X2
Età
La teoria...
θˆ1 = +0.80 X Parameter Estimates
Sum of Mean
Source DF Squares Square F Value Pr > F
y Parameter Estimates
Autonomia
decisionale
θˆ1 = −0.98 Variable DF
Parameter
Estimate
Standard
Error t Value Pr > |t|
Standardized
Estimate
βˆ1 = −0.29
X Intercept 1 0.19420 0.15101 1.29 0.2015 0
Comportamento
Aggressivo
AGGRESS 1 -0.98425 0.32859 -3.00 0.0035 -0.28961
Interpretazione dei parametri
(X Cardinali) SEQUENZA "A"
ESEMPIO (Multivariato) A3
ident AUTO_DEC COMPROM AGGRESS tre variabili metriche...
MISURAZIONE n1 S82 0.16 0.12 -0.24 analisi di REGRESSIONE (multipla)
n2 S87 2.55 0.21 0.07 (Modello Lineare Classico)
n3 S84 -0.36 -1.86 -0.25
n4 S27 -1.00 -2.10 0.19
n5 S60 5.70 1.51 -0.83
MISURAZIONE
n6 S71 1.18 0.84 -0.96
n7 S47 2.19 1.88 0.53
n8 S75 1.15 -0.89 0.11
n9 S59 1.13 1.35 0.53
MISURAZIONE n10 S37 -0.12 0.77 0.18
(COMPROM) :::::: :::: :::::: :::::: :::: => ~ 55% di variabilità spiegata
(AGGRESS) n100 S79 -1.21 -1.16 0.38 => al crescere di COMPROM
cresce l'AUTONOMIA DECISIONALE
The MEANS Procedure
Variable N Mean Std Dev Minimum Maximum
=> al crescere di AGGRESS
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ decresce l'AUTONOMIA DECISIONALE
AUTO_DEC 100 0.1942000 1.5618900 -3.6700000 5.7000000 .....
COMPROM 100 -0.000100000 1.3292408 -3.0300000 3.4200000
AGGRESS 100 1.249001E-18 0.4595824 -1.2700000 1.2300000
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
X2
Variable DF Estimate Error t Value Pr > |t| Estimate
θˆ1 = +0.80 X1
Comportamento
Compromissorio
y βˆ1 = +0.68
Autonomia
decisionale
θˆ2 = −0.98
X2
βˆ2 = −0.29 Comportamento
Aggressivo
I coefficienti stimati
dei modelli BIVARIATI,
coincidono con quelli
del modello MULTIVARIATO
Interpretazione dei parametri SEQUENZA "B"
(X Cardinali)
ESEMPIO (Bivariato) B1
due variabili metriche...
(AUTO_DEC) ident AUTO_DEC DEVIANZA analisi di REGRESSIONE (semplice)
MISURAZIONE n1 S82 0.16 0.08 (Modello Lineare Classico)
n2 S60 5.70 -0.48
n3 S47 2.19 -1.70
n4 S75 1.15 0.55
n5 S59 1.13 -1.33
n6 S79 -1.21 0.55
n7 S9 -0.89 -2.31
n8 S42 0.25 -0.29
n9 S3 2.04 -1.14
MISURAZIONE n10 S78 0.59 2.29
(DEVIANZA) :::: ::::: :::::
:::::: => ~ 30% di variabilità spiegata
n100 S81 -1.95 1.68
=> al crescere della DEVIANZA
diminuisce l'AUTONOMIA DECISIONALE
The MEANS Procedure
=> per ogni variazione di +1 punto di DEVIANZA...
Variable N Mean Std Dev Minimum Maximum il modello fornisce
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
AUTO_DEC 100 0.1942000 1.5618900 -3.6700000 5.7000000 -6/7 di punto (circa) di AUTONOMIA DECISIONALE
DEVIANZA 100 0.000300000 0.9944923 -2.3600000 2.3400000 => per ogni +1 dev. st. di DEVIANZA
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
il modello fornisce
=> -½ (circa) dev. st. di AUTONOMIA DECISIONALE
=> etc. etc.
The REG Procedure
Il modello... yi = θˆ0 + θˆ1 xi + ei Dependent Variable: AUTO_DEC
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 73.57670 73.57670 42.32 <.0001
Error 98 170.37334 1.73850
La teoria θˆ1 = −0.86 X Corrected Total 99 243.95004
Analysis of Variance
Il modello... yi = θˆ0 + θˆ1 xi + ei Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 122.31419 122.31419 98.55 <.0001
Error 98 121.63585 1.24118
Corrected Total 99 243.95004
La teoria
Root MSE 1.11408 R-Square 0.5014
Dependent Mean 0.19420 Adj R-Sq 0.4963
y
Coeff Var 573.67844
βˆ1 = +0.71
X Variable DF Estimate Error t Value Pr > |t| Estimate
Età
Intercept 1 -13.42630 1.37657 -9.75 <.0001 0
ETA 1 1.05015 0.10579 9.93 <.0001 0.70809
Interpretazione dei parametri SEQUENZA "B"
(X Cardinali)
ESEMPIO (Multivariato) B3
tre variabili metriche...
(AUTO_DEC) analisi di REGRESSIONE (multipla)
n1 ident AUTO_DEC DEVIANZA ETA (Modello Lineare Classico)
MISURAZIONE
n2 S93 3.64 -0.57 14
n3 S14 -2.53 1.54 10
n4 S66 0.09 1.17 13
(ETA anni)
n5 S27 -1.00 1.35 11
MISURAZIONE S82 0.16 0.08 13
n6 => La DEVIANZA comportamentale
n7 S18 -2.25 0.98 13 NON ha alcuna influenza sul grado
n8 S60 5.70 -0.48 15
S9 -0.89 -2.31 14 di AUTONOMIA DECISIONALE;
n9
MISURAZIONE n10 S69 3.16 -2.22 16 => la variabilità osservata è spiegata
(DEVIANZA) :::::: :::: ::::: ::::: ::: dalla variabilità dell'ETÁ
n100 S39 -2.26 2.34 11
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 122.32863 61.16431 48.78 <.0001
Error 97 121.62141 1.25383
La teoria Corrected Total 99 243.95004
y βˆ1 = +0.01
Autonomia
decisionale
θˆ2 = +1.06
X2
βˆ2 = +0.72 Età
I coefficienti stimati
dei modelli BIVARIATI
(almeno uno...),
NON coincidono con quelli
del modello MULTIVARIATO
Riassumendo
(sequenze di esempi "A" e "B")...
Interpretazione dei parametri (RIASSUMENDO): SEQUENZA "A" e "B" Con riferimento ai soli parametri standardizzati...
(X Cardinali)
ESEMPIO (Bivariato) A1
X
Comportamento
y βˆ1 = +0.68
Compromissorio ESEMPIO (Multivariato) A3 X1
=
Comportamento
Autonomia Compromissorio
βˆ1 = +0.68
decisionale
y
Autonomia
decisionale
X2
y ESEMPIO (Bivariato)
βˆ2 = −0.29 Comportamento
Aggressivo
Autonomia A2
decisionale
βˆ1 = −0.29
X
Comportamento
Aggressivo
ESEMPIO (Bivariato) B1
X
Devianza
y βˆ1 = −0.55
Autonomia
ESEMPIO (Multivariato) B3
X1
≠
decisionale Devianza
y βˆ1 = +0.01
Autonomia
decisionale
X2
y ESEMPIO (Bivariato) B2
βˆ2 = +0.72 Età
Autonomia
decisionale
βˆ1 = +0.71
X
Età
In generale, considerate k variabili indipendenti, ciascun coefficiente di regressione multipla indica la variazione
sulla variabile dipendente (riprodotta), dovuta ad una variazione unitaria della corrispondente variabile esplicativa,
al netto dell’influenza esercitata sulla dipendente dalle altre k-1 variabili esplicative
Questa proprietà può essere compresa in maniera più diretta, facendo riferimento ai coefficienti ottenuti quando
TUTTE le variabili del modello sono STANDARDIZZATE (pesi β)
Da questa prospettiva, ciascun coefficiente esprime una misura del contributo netto che ciascuna variabile
esplicativa fornisce alla spiegazione (riproduzione) della variabilità osservata in y
Se le variabili esplicative sono fra loro ortogonali (rx 1 x 2 = 0 ) , Pertanto : βˆ1 = ryx1
θˆk
fra i βeiθ vale la seguente relazione (dove s = dev. st.): βˆk = ⋅ s xk
sy
Interpretazione dei parametri (SEQUENZA "A" e "B")
(X Cardinali) I coefficienti dei modelli BIVARIATI NON coincidono con quelli del modello MULTIVARIATO
A1 y βˆ1 = +0.68
y βˆ1 = −0.55
Autonomia B1 Autonomia
decisionale
decisionale
y
A2
Autonomia y
decisionale B2 Autonomia
decisionale
X
βˆ1 = −0.29 Comportamento
βˆ1 = +0.71
X
Aggressivo Età
X1 X1
Comportamento
Compromissorio Devianza
βˆ1 = +0.68
y y βˆ1 = +0.01
A3 Autonomia B3 Autonomia
decisionale
decisionale
X2 X2
βˆ2 = −0.29 Comportamento
βˆ2 = +0.72
Aggressivo Età
A1, A2 A3 B1, B2 B3
Pearson Correlation Coefficients, N = 100 Pearson Correlation Coefficients, N = 100
Prob > |r| under H0: Rho=0 Prob > |r| under H0: Rho=0
AUTO_DEC COMPROM AGGRESS AUTO_DEC DEVIANZA ETA
AUTO_DEC 1.00000 0.68128 -0.28961 AUTO_DEC 1.00000 -0.54919 0.70809
<.0001 0.0035 <.0001 <.0001
COMPROM 0.68128 1.00000 0.00082 DEVIANZA -0.54919 1.00000 -0.78236
<.0001 0.9936 <.0001 <.0001
AGGRESS -0.28961 0.00082 1.00000 ETA 0.70809 -0.78236 1.00000
0.0035 0.9936 <.0001 <.0001
Interpretazione dei parametri (SEQUENZA "A" e "B")
(X Cardinali) I coefficienti dei modelli BIVARIATI NON
Il modello lineare classico è un dispositivo utile
coincidono con quelli del modello per "spiegare" (stabilire l'esistenza di nessi causali o di dipendenza)
MULTIVARIATO
Stabilire l'esistenza di una relazione fra due fenomeni (variabili) significa essenzialmente riconsiderare tale
relazione alla luce di una terza variabile che assume il ruolo di "variabile di controllo"
Le stime ottenute nell'ambito del modello linare classico sono un esempio di controllo mediante depurazione
(un esempio di operativizzazione del "canone dei residui" di J.S. Mill; 1843)
<<Si sottragga dal fenomeno quella parte che si sa, per previe induzioni,
essere l'effetto di certi antecedenti e il residuo del fenomeno è l'effetto
dei rimanenti antecedenti>>
X Y
Autonomia
Devianza
r = -0.55 decisionale
L’ANALISI FATTORIALE. Una illustrazione introduttiva e informale... Un esempio di modello per "misurare"
tratti "latenti" multidimensionali
Attenzione:
ACP sostituire le variabili osservate con nuove variabili che delle prime sono una combinazione lineare e una sintesi
AF individuare poche dimensioni (o variabili) "non osservabili" che spiegano la covariazione fra le variabili originarie
X1
X4
X5
ANALISI FATTORIALE
Pearson Correlation Coefficients, N = 10
Prob > |r| under H0: Rho=0
LIVELLO MANIFESTO
PESO OSPEDALE SCARPE B_LISCIO INTERNET SORBETTO
(+)
(-)
(-)
(con j < k) The FACTOR Procedure
Initial Factor Method: Principal Components
F = λ x + λ x + λ x + ... + λ x
2 1 1 2 2 3 3 k k Eigenvalues of the Correlation Matrix: Total = 6 Average = 1
...................
1
2
2.44153716
1.44261151
0.99892565
0.27251001
0.4069
0.2404
0.4069
0.6474
3 1.17010150 0.43302997 0.1950 0.8424
F j = λ1 x1 + λ2 x2 + λ3 x3 + ... + λk xk
4 0.73707152 0.56116373 0.1228 0.9652
5 0.17590779 0.14313727 0.0293 0.9945
6 0.03277052 0.0055 1.0000
Factor1 Factor2
(Vecchi)
ID_05
ID_06
ID_03
ID_02
ID_10 (Alti)
ID_01
ID_08
ID_04 ID_09
ID_07
Per concludere ... SOLO PERCHE' E' UN GIOCO, possiamo immaginare di conoscere le medie e le varianze ....
ident vera_s stima_s vera_e stima_e
Supponendo di conoscere ...
ID_01 170 169 35 35
[VERA\ STIMATA]
Media Dev. St.
ID_02 189 183 32 46 r (Bravais-Pearson)
ID_03 193 187 78 77
Statura 176 (cm.) 15.4 ID_04 162 162 48 54
ID_05 203 207 41 41 Statura = + 0.94
ID_06 186 191 36 33
ID_07 160 159 27 19
Età = + 0.92
Età 48 (anni) 17.3
ID_08 156 168 58 58
ID_09 162 162 78 68
ID_10 174 172 43 49
Legenda
= VERA
* = STIMATA
In sintesi le caratteristiche del precedente gioco:
due tratti manifesti degli individui (statura ed età) sono stati immaginati come latenti;
UN ESEMPIO…
Batteria di domande in un questionario sulla precezione soggettiva del rischio idrogeologico…
<<Persone intervistate prima di Lei hanno indicato diversi fattori che, secondo la loro opinione,
possono contribuire a provocare un disastro ambientale.
Le leggerò ora un elenco di tali fattori e, sempre pensando all'alluvione dell'ottobre 2000,
Le chiedo di dirmi quanto- secondo Lei - ciascuno di tali fattori è importante nel provocare
un disastro ambientale>>
(esprima il Suo giudizio con un voto: 0=per nulla importante; 10=molto, del tutto importante)
β
0.128
? β = arcsen = 7.295 ≅ 7° 30'
(c) 1 .008
100 cm.
100 cm.
(a)
γ α
ALESSANDRIA
7° 30 '
7° 30 '
EQUATORE
3) ESEGUO CALCOLI ..... C = "Circonferenza terrestre" (in Km.) C : 800 = 360° : 7° 30'
800 ⋅ 360
4) OTTENGO UNA STIMA DELLA MISURA CERCATA ..... C= = 39452 ≅ 40mila Km.
7.30
c 39452
diametro = = = 12564 ≅ 13 mila Km.
π 3.14 42b
DIGRESSIONE Esempio di misurazione...
(ERATOSTENE)
ANALOGIA ∼240 a.C.
ASTROFISICA PSICOLOGICA
[probabilistica]
[deterministica]
Modellizzazione Prob( R = x ) = f (abilità ;difficoltà ;etc .)
Terra = Sfera
[errore di specificazione +
Stima [errore di specificazione]
errore stocastico]
42c
DIGRESSIONE
(ERATOSTENE)
ANALOGIA D’altra parte, con riferimento al concetto di “tempo” (cronologico)...
FINE (digressione)
42d
Analisi della Varianza ...Come estensione del TEST sulla differenza fra medie. Esempio: CAMPIONI CASUALI INDIPENDENTI - DATI BILANCIATI
<<Se gli individui sono stati sottoposti a diversi metodi di insegnamento impartiti da diversi insegnanti,
... Illustrazione... (EFFETTO INTERAZIONE...) allora la loro velocità di lettura è differente>>
metodo - A (1, 2, 3); insegnante - B (1, 2) 30 individui ogni gruppo
R-Square Coeff Var Root MSE y Mean R-Square Coeff Var Root MSE y Mean
0.413648 18.63936 9.334175 50.07778 0.702086 13.37992 6.689959 50.00000
Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F
A 2 4099.244444 2049.622222 23.52 <.0001 A 2 17141.20000 8570.60000 191.50 <.0001
B 1 6576.355556 6576.355556 75.48 <.0001 B 1 259.20000 259.20000 5.79 0.0172
A*B 2 19.244444 9.622222 0.11 0.8955 A*B 2 952.13333 476.06667 10.64 <.0001
B (1) B (1)
y6563hj B (2) y6765hj B (2)
61 63
59 61
57 Insegnante "1" 59
55 57
Insegnante "2"
53 55
51 53
51
49
49
47
47 Insegnante "1"
45
45
43 43
41 41
39 Insegnante "2" 39
37 37
35 ritorna 35
Metodo (A) A (1) A (2) A (3) Metodo (A) A (1) A (2) A (3)