Sei sulla pagina 1di 28

Programma

Capitolo 1 ad esclusione dei seguenti paragrafi: §1.5, §1.5.1, §1.5.2, §1.6, §1.6.1, §1.6.2;
Capitolo 2 ad
esclusione dei seguenti paragrafi: §2.3.3;
Capitolo 3; Capitolo 4; Capitolo 5;
Capitolo 6 ad esclusione dei seguenti paragrafi: §6.2;
Capitolo 7;
Capitolo 8 ad esclusione dei seguenti paragrafi: §8.1.1, §8.1.2,
§8.1.3, §8.2, §8.3.6;
Capitolo 9;
Capitolo 10 ad esclusione dei seguenti paragrafi: §10.1, §10.1.1 §10.2
§10.2.1 §10.3.3;
Capitolo 11 ad esclusione dei seguenti paragrafi: §11.1, §11.2, §11.3.2;
Capitolo 14.

Inoltre, le slides del corso che sono da considerare materiali didattici integrativi.

1 Introduzione
Pagina 1.53
Psicoterapia sviluppo di serie di modelli teorici e pratici → eclettismo sistematico, integrazione
concettuale → Ricerca importante anche per psicologia clinica → approccio evidence based

approccio ​evidence based​ = integrazione migliore ricerca disponibile con esperienza terapeuta
nel contesto del cliente

Pagina 1.63
(Kohler 1940)
Estrema familiarità e quotidianità fenomeni psicologici è freno per impulso conoscitivo ←
eccessivo focus su eventi insoliti che incrinano le convinzioni

Pagina 1.67
(cronbach 1957)
Psicologia correlazionale VS sperimentale = verificare,tra caratteristiche psicologiche,
variazione concomitante VS causazione

Pagina 1.73
(stevens 1946) Poter misurare →
● scaling (associare numero a caratteristica)
● classificazione (creare intervalli nella scala e determinare se tali valori cadono in uguali o
diverse categorie)
● standardizzazione (misurazioni ripetibili da più operatori e devono dare lo stesso
risultato)
Pagina 1.82
I ​costrutti​ (entità) psicologiche
● Sono alla base di una metodo di misurazione
● Sono strumenti per dare ordine alla complessità (pattern) di comportamenti che
osserviamo nell'uomo

Operazionalizzazione​ = definizione di serie di operazioni empiriche che permettono di creare


parallelo tra costrutto teorico e mondo/comportamento empirico
● definire il ​dominio di contenuto​ = insieme comportamenti che espongono costrutto
● selezionare migliori operaz.
● Scegliere modello di misurazione

Modello di misurazione​ → definisce tale parallelo.


● Componenti: costrutto, osservabili, relazione matematica tra costrutto e osservabili
● Tipi
○ Reflective Indicator (costrutto diventa ​scala​ o causa degli osservabili) (es.
intelligenza)
○ Causal indicator (costrutto diventa ​indice​ o effetto degli osservabili) (es. stress)

Livello di misura
● Scala Nominale​ (categorizzazione, unità di analisi equivalenti o meno), categorie sono
○ Distintive (permettono di misurare equivalenza tra soggetti)
○ Collettivamente esaustive: oggi soggetto deve essere categorizzabile
○ Mutualmente escludentesi: un soggetto entra in una sola categoria
○ Esempi: nomi squadra calcio
● Scala ordinale​ (confronto tra unità di analisi in maggiore/minore, per ottenerne un rango,
senza quantificare il distacco → no unità di misura)
○ Dicotomiche (solo 2 valori) VS Politomiche (3+ valori)
○ Con variabile sottostante
■ Metrica a Soglie note
■ Metrica a Soglie ignote
■ Latente a Soglie ignote (classificazione fatta solo da esperti che si
accordano)
■ Discreta semi-standardizzata (accordo tra esperti ma senza ipotesi di
variabile Metrica sottostante)
■ Discreta non-standardizzata (riferimento standard impossibile)
○ Esempi: gravità di una condizone patologica
● Scala a intervalli equivalenti (confronto quantitativo tra unità di analisi → ​unità di misura​,
ma senza conoscere quantità assoluta ← no zero assoluto)
○ No zero assoluto → rapporto fra valori non è invariante rispetto al cambio di
scala di misura
○ Zero ​ragionevole​ = media della popolazione di riferimento
○ Scala più utilizzata in psicometria
■ Impossibile assumere che esista lo zero assoluto (ovvero che il costrutto
sia del tutto assente)
■ Usata anche come conversione delle scale di Likert (ordinali)
○ Esempi: test psicologici
● Scala a rapporti equivalenti (come scala intervalli eq. ma con zero interpretato in termini
assoluti)
○ Zero razionale = costrutto può essere assente
○ Esempi: tempi di risposta, altezza, peso

1.4 I test psicologici come strumenti per far emergere i costrutti

Test → misura ​oggettiva​ di un costrutto se


● Riferisce ad un modello teorico
● Sia sensitivo e sensibile solo al costrutto sotto assessment
● Sia ripetibile nel tempo
● Valida in senso lato
● Permette confronto con altre misure
● (opzionale) è standardizzato (ovvero fornisce indicazioni delle ​norme​ sui risultati della
popolazione di riferimento)

Item dei test come ​reattivi mentali​ → capaci di far ​emergere​ il costrutto

1.5 Come sono fatti i test psicologici

Caratteristiche osservabili del comportamento


● Latenza = intervallo di tempo stimolo→risposta
○ Metodo sottrattivo​ (Donders)
● Frequenza = numero di volte comportamento si presenta
● Durata = quantità di tempo in cui comportamento viene mantenuto
● Intensità

Test psicologico → metodo per inferire capacità, tendenza, predisposizione a


● Agire, reagire, vivere
● struttuare/ordinare pensiero o comportamento

Parti del test


● Materiale stimolo = parte che contiene domande
○ Titolo test (opzionale)
○ Consegna
○ Elenco item
● Foglio di notazione = foglio per segnare le risposte
● Manuale del test
○ Presentazione cornice teorica
○ Definizione costrutto
○ Campione di soggetti origine di norme
○ Istruzioni per la somministrazione
○ Istruzioni per l’attribuzione di punteggio
○ Suggerimenti per interpretazione dei risultati
● Griglia di correzione

1.6 Tipi di test psicologici

1.6.1 Prestazione massima


● Soggetto richiesto di dare il meglio di sè
● Esiste risposta corretta
● Valutano il funzionamento considerato normale
○ Abilità (capacità non necessariamente apprese, specifiche per ambiti)
○ Profitto (capacità apprese)
○ Attitudinali (capacità future/potenziali)
○ Intelligenza (mancanza definizione comune)

Intelligenza (capacità di adattarsi all’ambiente e risolvere problemi)


● Globale VS complessa ?
● Stanford-Binet: misura della ​capacità di giudizio​ (senso pratico, iniziativa, adattamento)
● Wechsler → (agire con intenzione, pensare con razionalità, affrontare l’ambiente) → 14
scale : intelligenza {verbale, prestazione}
○ Verbale: cultura, memoria, significato vocaboli
○ Prestazione: coord. visuo-motoria, problem-solving, ragionamento
logico-induttivp
● Raven → (pensare con chiarezza, comprendere complessità, immagazzinare e
riprodurre informazione)

Test neuropsicologici → valutazione funzioni in sospetto di deficit ← (invecchiamento, danno)


● Mini mental state examination: 7 aree cognitive

1.6.2 Prestazione tipica

Pagina 156
Personalità

Tipi
● Intervista faccia a faccia
● Intervista semi strutturata
● Test autosomministrato
● Test proiettivo

Intervista faccia a faccia


● Comportamento non verbale
● Latenza risposte
● Dipendenza da capacità/caratteristiche intervistatore
● No info quantitative

Intervista semi-strutturata → domande standard


● Coerenza e replicabilità
● Compromesso tra ricchezzaVSaffidabilità osservazione
● SWAP-200 (disturbi personalità)
○ Stimolo : linguaggio semplice
○ 200 item → punteggio da 0 a 7
○ 3 ripetizioni-test/sedute
■ Verifica: != osservatori ottengono == osservazioni
■ controllo effetto alone
○ Sforzo di rispettare distribuzione puntegg (es. 7 item con voto 8)
○ Interpretazione
■ Item mappati su prototipi di disturbo
■ Differenza da prototipo > 60 → disturbo
■ Differenza da prototipo 55-60 → forti tratti
■ Differenza da prototipo 50-55 → tratti

Test auto-somministrato → soggetto compila da sé


● MMPI-II (inventario di personalità + disturbi emotivi)
○ 567 item → V o F
○ 7 scale di validità → individuare stili di risposta falsati
○ 10 scale cliniche → ipocontria,depressione,isteria, deviazioni psicopatiche, m-f,
paranoide,psicoastenia, schizofrenia, mania, introversione sociale
○ 15 scale di contenuto → ansia, paure, ossessività, depressione, preoccupazione
salute, pensiero bizzarro, rabbia, cinismo, antisocialità, Tipo A, bassa autostima,
disagio sociale, problemi familiari, difficoltà a lavoro, atteggiamento negativo a
psicoterapia
○ 15 scale supplementari
● DES
○ 28 items → segno su linea tratteggiata per valutare item
● Carlson&Putman
○ scala di valutazione a 11 punti
○ Rischio ​response set​ = stile di risposta “estremizzato/polarizzato”
● Metodo differenziale semantico (opinioni e atteggiamenti)
○ Segno su una linea delimitata da due parole bipolari
○ Bipoli prototipici cross-cultural diacronici
■ Buono cattivo
■ Forte debole
■ Attivo passivo
● Scala Likert​ o ​Metodo delle valutazioni sommate
○ insieme di item i cui punteggi sommati per ottenere quantificazione costrutto
○ metodo più comune

Item di Likert​ = item con formato di risposta con scala a più punti finiti o linea orizzontale

Costruzione test di Likert


● Definizione costrutto
● Individuazione item rappresentativi
● Valutazione item da pool di esperti (scala 5 punti)
● Selezione item migliori
● Scelta scala di risposta item con numero pari di livelli

Test proiettivi (far emergere contenuti psichici non consapevolmente riconosciuti)


● Teoria: modelli gestaltici/psicoanalitici → ambiguità
○ accresce influsso variabili intrapsichiche
○ Attenua influsso variabili strutturali stimolo
○ Approccio ​ideografico​ (opposto a quello nomotetico delle scienze naturali)
● Motivazione: test auto-somministrati
○ Incapaci di investigare contenuti psichici inaccessibili a pensiero cosciente
○ inducono risposte con influenze sociali/culturali
● Valutazione risposte effettuata da psicologo clinico
● Critica: poca oggettività
● Test della libera associazione di parole (F.Galton)
○ Soggetto ascolta parole scelte ad hoc
○ Risponde con prima parola che viene
○ Misurazione tempo di risposta
○ Assunzione: tempi reazione aumentano quando parole legate
■ Emozioni negative
■ Complessi normali (erotici, famiglia, casa,materniatòm ambizione,
successo, denaro)
■ Complessi accidentali (eventi particolari)
■ Complessi permanenti (in casi di psicopatologie)
● Test delle macchie d’inchiostro di Rorsharch
○ 10 tavole con macchie bilateralmente simmetriche
○ 5 b/n, 2 b/n + rosso, 3 policrome
○ Intervistatore mostra tavole in modo ​non direttivo​ (no risposte sbagliate, no limiti
di tempo) →
■ 1) “Cosa potrebbe essere questo?”
■ 2) “In quale zona della macchia si è concentrato?”
■ 3) “Quali caratteristiche hanno avuto ruolo?”

1.7 Proprietà psicometriche di un test psicologico: attendibilità e


validità

Misura = k*Osservazione + Errore = Costrutto + Errore

M = k*O + E = C + E
Attendibilità​ = proprietà psicometrica test/scala di misurare variabile psicologica in modo
accurato e di riprodurre stesso risultato al netto dell’errore = proporzione della misura che non
riflette l’errore = A
A = C/M = 1 - E/M

Bias culturali
● Test attitudinali college riflettono cultura caucasica
● Draw-a-man test sottostimava capacità nativi americani (disegno cavallo)

Test di validità = procedura che stabilisce se misurazione con test raggiunge lo scopo di
investigare il criterio
● Validità di contenuto = campione operazionalizzazioni prescelto è un campione
rappresentativo di univeso di op. possibili
● Validità di facciata = operazionalizzazioni sono interpretate da soggetti nel modo che ci
aspettiamo
● Validità di criterio = risultato test può essere usato per prevedere comportamento
soggetto
○ Concorrente = misura e criterio rilevati contemporaneamente e sono
funzionalmente connessi
○ pre/post-dittiva = criterio misurato prima/dopo della misura
○ Possibili criteri
■ Diagnosi → si effettua la misura su una popolazione in cui è certa la
presenza del costrutto → il criterio è la distribuzione dei risultat
● Validità incrementale = contributo test nel migliorare predizione di un criterio quando test
è usato insieme ad altre misure
● Validità di costrutto = test misura effettivamente il costrutto
○ Validità convergente = grado di accordo fra misure ripetute (possibilmente con
somministrazioni diverse)
○ Validità discriminante = grado di distinguibilità tra misure di altri costrutti
● Validità nomologica

Rete nomologica​ di una misura


● cos’è il costrutto
● Relazioni {proprietà-osservabili} del costrutto
● relazioni (costrutto,proprietà)
● Relazioni (costrutto, altri-costrutti)

Scientificità = ​validità nomologica​ → relazioni rete nomologica coinvolgono osservabili

2 La statistica descrittiva
Pagina 222
2.1 Il campionamento

campione è ​rappresentativo​ quando riflette in modo adeguato le caratteristiche della


popolazione

ampiezza​ del campione = numero di suoi elementi

campione normativo​ = campione utilizzato per costruire la misura standardizzata di un costrutto


che sarà utilizzata

generalizzabilità​ = grado in cui risultati studio su campione possono essere estesi a popolazione

variabile​ = caratteristica distintiva di una popolazione


● misurabili su scala qualitativa/ordinale/metrica
● continue/discrete

statistica​ VS ​parametro​ = misura di una variabile del campione VS popolazione

obiettivo studio = ​stima​ dei parametri tramite le statistiche

indice​ = ​stimatore​ ⇒ base per fare le stime

indice corretto/scorretto = suo valor medio è uguale/ diverso al parametro corrispondente

campionamento​ = procedura di individuazione degli elementi del campione

2.1.1 Tipi di campionamento in psicologia

probabilistico​ VS non-probabilistico = ogni unità di popolazione ha prob. (nota e non nulla VS


non-nota) di entrare nel campione

campionamenti probabilistici ⇒ maggior generalizzabilità

probabilistici
● c. casuale semplice ⇒ con VS senza reinserimento
○ estrazione casuale
○ ogni unità ha stessa probabilità
○ probabilità tra unità sono indipendenti
● c. quasi causale
○ estrazione casuale
○ unità possono avere probabilità diverse di essere estratte
● c. stratificato
○ suddivisione della popolazione in ​strati​ in base a caratteristica/caratteristiche
(es.sesso, sessoXstatoCivile)
○ campionamento casuale sui singoli strati, in modo che le caratteristiche del
campione siano distribuite come nella popolazione
● c. per cluster
○ campionamento su popolazione naturalmente divisa in sottogruppi (es.criteri
geografici)
○ campionamento casuale sui singoli cluster in modo che le caratteristiche del
campione siano distribuite come nel cluster
● c. sistematico
○ selezione di unità ogni k=N/n unità della popolazione (ordinate in sequenza)
■ n = ampiezza del campione
■ k = ​passo​ di campionamento
○ ha le stesse proprietà del c.casuale semplice

non probabilistici
● c. a scelta ragionata
○ campione composto dal ricercatore esperto della popolazione
○ selezione di elementi tipici
● c. per quote
○ estrazione non casuale (es. i nonni dei nostri studenti)
○ unità possono avere probabilità diverse di essere estratte

2.3 Rappresentazione tabellare e grafiche

2.3.1 Tabelle

classe di valori = intervallo di valori compresi tra ​limite inferiore​ e ​limite superiore

raggruppamento in classi = rappresentazione dei risultati di una misura tramite classi

frequenza di classe = numero di valori che cadono all’interno dei suoi limiti

f requenza di classe
frequenza relativa di classe FRC =
n
frequenza cumulata di classe = FRC + somma di tutte le frequenze di classe precedenti
● ha senso solo se la variabile è almeno ordinale

range​ di classe = ampiezza di classe = limSuperiore - limInferiore

il ​limite reale​ inferiore è mezza unità di misura minore del​ limite tabulato​ inferiore ed è compreso
nella classe

il limite reale superiore è mezza unità di misura maggiore del limite tabulato superiore e non è
compreso nella classe
tabella di contingenza​ = tabella a doppia entrata

2.3.2 Grafici

diagramma a barre (variabili nominali/ordinali)


● semplice → rappresenta tabelle ad una entrata
● a barre affiancate ⇒ rappresenta tabelle a due o più entrate

diagramma a torta

istogramma (variabili metriche) = diagramma a barre affiancate

poligono di frequenza/proporzione/percentuali
● confrontare distribuzione frequenza di due gruppi/strati/cluster di unità

poligono cumulativo = ogiva = poligono di frequenze cumulative dei risultati

serie temporale/storica = misura su una variabile temporale

variabile circolare​ ⇒ i cui valori hanno limite massimo e minimo coincidono

grafici a radar o polari


● bat’s wing → frainteso per dati interpretati come aree
● coxcomb

funzione psicometrica
● a volte assume forma ad s detta ​sigmoide
● permette di individuare il valore di stimolo soglia

diagramma ramo-foglia

2.4 Misure di tendenza centrale

indice​ = ​misura di tendenza centrale​ = statisticha che sintetizza info della misura con un unico
valore che sia rappresentativo della caratteristica misurata nel campione specifico

2.4.1 Moda

moda​ = valore/categoria più frequente nel campione

se i dati sono rappresentati in classi, la ​classe modale​ è la classe più frequente


distribuzione
● bimodale​ ⇒ due valori possono valere come moda
● multimodale​ ⇒ 2+ valori possono valere come moda
● amodale​ ⇒ tutti i valori hanno la stessa frequenza

2.4.2 Mediana

mediana​ = valore al centro della distribuzione ordinata di valori (ha 50% delle misure con valori
inferiori, e 50%delle misure con valori superiori)

n+1
posizione mediana = 2
procedure per calcolare la mediana
● individuazione posizione nei ranghi dei valori
○ n dispari
■ variabile ordinale/metrica ⇒ semisomma dei due valori mediani
■ variabile nominale ⇒ valore immediatamente superiore
● individuazione posizione nei ranghi delle frequenze cumulate dei valori
● calcolo diretto per dati suddivisi in classi (A = ampiezza classe)
posizionemediana −F cumul inf
○ mediana = limite inf erioreclasse mediana + A · F classe mediana
n
○ posizione mediana = 2

2.4.3 La media

media aritmetica = ​valore atteso​ = valore più probabile che possiamo aspettarci = baricentro di
una distribuzione

outliers ​= valori estremi → ATTENZIONE

trimmed mean​ = media calcolata dopo aver escluso un numero fisso di outliers → in genere 5%
di valori estremi

windordized mean = media calcolata dopo aver escluso % di estremi con estremo
inferiore/superiore distribuzione

Σ(xi − M ) = 0

scarto quadratico
2
Σ(xi − M )
2 2
proprietà dei minimi quadrati​ → Σ(xi − M ) < Σ(xi − ε) ∀ ε

2.4.4 Scelta dell’indice di tendenza più adeguato

Possibilità:
● nominale → moda
● ordinale → moda, mediana
● metrica → moda, mediana, media

Principi
● struttare al massimo informazione fornita dai dati
I moda < I mediana < I media

● mediana più stabile della media rispetto ai valori estremi

distribuzione
● simmetrica​ ⇒ moda = mediana = media
● asimmetrica positiva ⇒ media > mediana
● asimmetrica negativa ⇒ media < mediana

2.5 Misure di dispersione, posizione e variabilità

2.5.1 Variabilità a livello nominale

numero​ di categorie di risposta ⇒ metodo più semplice

rapporto di variazione RV ( f moda = freq. clase modale)


f moda
RV = 1 − n
indice di diversità ID ( pi = proporzione casi classe i, k=#classi)

I D = 1 − Σpi 2
ID non può essere confrontato tra distribuzioni con =! numero di classi

indice variazione qualitativa IVQ (k=#classi)


ID
IV Q = 1−1/k
IVQ confrontabile tra distribuzioni con != numero classi
2.5.2 Varibialitià a livello ordinale

Tutti gli indici di livello nominale sono applicabili

range = ramma = campo di variazione


xmassimo − xminimo
usabile solo per variabili quantitative

quantile = i-esimo rango di una distribuzione divisa in k parti (n=#osservazini)


● terzile = rango di una distr. divisa in 3 parti
● quartile = rango distr. divisa in 4 parti
● percentile = rango di distr. divisa in 100 parti

i·(n+1)
posizione Qk,i = k

per dati raggruppati in classi

i·n
posizione Qk,i = k
per dati metrici possiamo calcolare esattamente il quantile ( F inf = somma freq. inferiori a classe
quantile, A=ampiezza classe quantile)
i·(F inf )
Qk,i = limite inf erioreclasse quantile F ·A
c.quantile

rango quantile​ = posizione occupata da un valore all’interno della distribuzione divisa in k parti
(n=#osservaioni)

rangogrezzo ·k
rango quantile = n+1
per dati raggruppati in classi
rangogrezzo ·k
rango quantile = n

range interquarile IQ = intervallo interquartile ⇒ indica limiti/estensione dei valori riguardo al


50% centrale della distribuzione

I Q = [Q4,1 Q4,3 ]
differenza interquartile DIQ (per dati quantitativi)

Q4,1 − Q4,3

diagramma a scatola e baffi = ​cinque numeri di sintesi​ della distribuzione


● minimo

● Q4,1
● mediana

● Q4,3
● massimo

2.5.3 Variabilità a livello metrico

Tutti indici di livello ordinale sono applicabili, anche se non sfruttano informazione unità misura

scostamento semplice medio SSM (quanto in media i valori si discostano da media) (M media)

Σ|xi −M |
S SM = n

DIFETTO: SSM può essere uguale alla somma del valore assoluto degli scarti da un altro
valore! a questo provvede la devianza…

devianza = somma dei quadrati degli scarti SS


2
S S = Σ(xi − M )

DIFETTO: devianze di distribuzioni != sono confrontabili solo se le distribuzioni hanno stessa


cardinalità

varianza = media degli scarti = sigma quadro s​2


SS
σ2 = n

DIFETTO: non confrontabile con media ⇐ potenze diverse

deviazione standard =scarto quadratico medio = sigma s


σ=
√ SS
n =
√ Σx2
n − M2
se i dati sono riportati in frequenze
2
σ=
√ Σf ·x2
n − ( )
Σf ·x
n

coefficiente di variazione = 100*s/|M|


● confronto tra di variabilità di distribuzioni diverse
● senza unità di misura
● usato per eliminare outlier

2.6 Punteggi standard

Per confrontare distribuzioni diverse si ricorre a ​standardizzazione​ cioè rappresentazione dei


dati su stessa scala
● Quantilizzazione ⇒ valorizza solo informazione a livello ordinale
● Uso deviazione standard come unità di misura = trasformazione in ​punti z​ o ​punti
standard
○ z=(x-M) / s
● Punti T
○ T=50+z*10

2.7 Indici della forma di distribuzione

● media > mediana ⇒ gobba a sinistra


● media < mediana ⇒ gobba a destra
● simmetricità ⇒ skewness = (media-f) / s
○ f={moda, mediana}
○ valida solo se = 0
● asimmetricità ⇒ skewness complessa
○ Valida sempre
● curtosi​ = appiattimento ⇒ quanto pesano le code = quanto i valori sono concentrati
intorno alla media

5 costanti descrittive a livello metrico


● minimo
● Massimo
● Media
● Deviazione standard
● skewness
● curtosi

3 Statistica inferenziale
Scopo = usare i risultati di una misura ossenuti nel campione per fare inferenze sulla
popolazione e per stabilire se tali inferenze sono valide

3.1 Elementi di probabilità

spazio campionatorio​ = insieme di tutti eventi possibili

concezione frequentista​ = prova ripetuta sempre nelle medesime condizioni

p(AeB) = p(A) *p(B|A)

probabilità condizionata​ = p(B|A)

sensibilità​ = veri_positivi/totale_malati

specificità​ = veri_negativi/totale_non_malati

potere predittivo positivo​ = veri_potitivi/totale_positivi

potere predittivo negativo​ = veri_negativi/totale_negativi

teorema di Bayes

p(A|B) = p(A) *p(B|A)/ p(B)

Permutazioni semplici = n!

Permutazioni circolari = (n-1)!

se ci sono elementi ripetuti (nk volte) calcoliamo le


Permutazioni con ripetizione =n! / n1!... nk!

disposizioni semplici a k a k = n! /(n-k)!

disposizioni con ripetizione a k a k = n^k


combinazioni semplici = coefficiente binomiale = n! / (k! (n-k)!)

combinazioni con ripetizione

funzione di densità​ = per ogni valore assumibile dalla variabile aleatoria, la probabilità di
verificarsi

3.2 Distribuzioni di probabilità

distribuzioni
● rettangolare uniforme
● binomiale
○ variabili dicotomiche = i cui 2 valori possibili sono mutualmente escludentisi
○ p(k) = prob di k successi su n prove= coeff_binomiale_n_k * p^k * q^(n-k)
○ simmetrica se p=q
○ media = n*p
○ varianza = n*p*q
● normale
○ solo valori continui
○ Quetelet e i fatti di vita ⇒ tutti distribuiti normalmente
○ Test psicologici di costrutti non patologici seguono distribuzione normale
○ u = media = moda = mediana = massimo
○ u±sigma ⇒ punti di flesso
○ simmetrica rispetto a u
○ asintotica
● normale standardizzata (gli x sostituiti con i z)
● media = 0
● deviazione standard = 1

3.3 Distribuzioni campionarie

distribuzione campionaria​ = distribuzione relativa a una specifica statistica che viene calcolata
​ straibili dalla popolazione
su tutti i possibili campioni di ampiezza ​n e

teorema del limite centrale​ ⇒ la distribuzione campionaria delle medie di tutti i possibili
campioni di ampiezza n tende alla normale all’aumentare di n e lo diventa per n>=30,
indipendentemente dalla forma della distribuzione della variabile nella popolazione

distribuzione campionaria della media


● segue andamento normale per n>=30

● media = ​media campionaria​ μM = μ


● deviazione standard = ​errore standard​ σM


∑ f i (M i −μ)2
σM = n

● se N=inf. o campione estratto con reinserimento


σ
σM = √n
● altrimenti

σM = σ
√n √ N −n
N −1
● errore standard stimato (quando non si conosce σ )
︿ s
σM = √n−1
legge dei grandi numeri

lim = σ M = 0
n→inf
esempi
● (contesto della popolazione di studenti italiani (53% superano))
○ qual è la probabilità che, in un campione di 10 studenti, almeno 8 abbiano
superato l’esame? ⇒ variabile nominale dicotomica ⇒ binomiale (N=10 k=8,9,10
p=0,53) ⇒ risposta p(8)+p(9)+p(10)
○ qual è la probabilità che in un campione di 500, tra 240 e 255 hanno superato
esame ⇒ variabile nominale dicotomica + N molto grande ⇒ normale
(trasformazione punti z) ⇒ tavole di probabilità
x−π
■ z= π(1−π)


√ n
(contesto popolazione punteggi test estroversione (media 60 dev.stand. 20))
○ qual è probabilità estrarre a caso un campione di 58 soggetti che abbia una
media inferiore a 57? ⇒ N>30 ⇒ variabile normale ⇒ trasformazione punti z
x−μ
■ z= σ
√n
● (contesto popolazione finita (N=250) punteggi test estroversione (media 60 dev.stand.
8))
○ qual è prob estrarre a caso un campione di 64 soggetti che abbia media
compresa tra 59 e 63 ⇒ n>30 + N finito ⇒ variabile normale ⇒ trasformazione
punti z con correzione deviazione standard
x−μ
■ z=

σ N −n
√n N −1

3.3.1 Gli intervalli di fiducia della media e di una proporzione

intervallo di fiducia​ = intervallo di valori dentro il quale siamo sicuri che una statistica cada con
una certa probabilità f

1−f
pzf = 2

● intervallo di fiducia per la media


○ assunzioni
■ popolazione distribuita normalmente oppure
■ popolazione distribuita variamente e ampiezza campione > 30
s
○ se σ è ignota, si sostituisce con √n−1
○ (popolazione finita (N), deviazione standard popolazione ignota)
︿
M = μ ± z f · σM
○ (popolazione infinita, deviazione standard popolazione nota)
σ
M = μ ± zf · √n
○ (popolazione finita (N), deviazione standard popolazione nota)

M = μ ± zf · σ
√n √ N −n
N −1

● intervallo di fiducia per la proporzione campionaria


π(1−π)
P =π±z n
● intervallo di fiducia per la proporzione di popolazione


P (1−P )
π =P ±z n−1

3.4 La verifica delle ipotesi


3.4.1 p-value approach (PVA)

Ideato da sir Ronald Fisher (1925)

H​
ipotesi nulla​ ​ 0​ ipotesi scontata, prevedibile, non interessante!
● parametro popolazione = TOT

H​
ipotesi sperimentale​ o ​ 1​ = ipotesi alternativa o sostantiva, interessante!
● monodirezionale
○ parametro popolazione > TOT
○ parametro popolazione < TOT
● bidirezionale ⇒ parametro popolazione != TOT

Testi di verifica delle ipotesi = calcolo probabilità che i dati osservati siano

risultato/manifestazione di ​H​0
Witgenstein ⇒ logica ​falsificazionista​ ⇒ cercare di dimostrare che è troppo improbabile che i
risultati dei test avvengano in una situazione in cui H0 è vera, senza poter dimostrare che H1
sia vera

livello di significatività​ α = valore soglia di probabilità che p(H0) deve superare per passare il
test

errore di I tipo​ = rifiutare H0 quando è vera


● ha propabilità α

errore di II tipo​ = accettare H0 quanto è falsa


● ha probabilità β

potenza del test statistico​ = 1 − β = probabilità di accettare H1 quanto è vera


● carenza di potenza ⇒ campione troppo piccolo ?
● eccesso di potenza ⇒ campione troppo ampio ?

in genere α è 0.05 o 0.01

alternative al PVA
● NHST null hypothesis significance testing
● FAA (Neuman&Pearson 1993) fixed alpha approach
○ test p(dati|H0 vera) < α
3.4.2 Analisi della potenza del test
dimensione dell’effetto​ = il grado in cui il fenomeno è presente nella popolazione = il grado in cui
H0 è false per lo più indipendentemente dall’ampiezza del campione

analisi ⇒ determinazione della dimensione dell’effetto ⇒ g = |stima-parametro|


● trascurabile g<0,05
● piccola 0,05<g<0,15
● moderata 0,15<g<0,25
● grande g>0,25

l’analisi della dimensione dell’effetto ci permette di avere una visone più completa della reale
importanza dell’effetto, quando un H0 è stata rifiutata ma l’effetto ci sembra piccolo

​tipi di significatività
● statistica ⇒ stima probabilità risultati derivino da ipotesi nulla
● pratica = analisi della dimensione dell’effetto ⇒ evitare di
○ sopravvalutare effetti piccoli significativi con campione grandi
○ sottovalutare effetti grandi non significativi con campioni piccoli
● clinica = stima del valore pratico/applicato e dell’importanza degli effetti per la vita
quotidiana della persona

4 Verifica delle ipotesi su un campione di


osservazioni
stabilire se il campione è ​omogeneo​ con la popolazione = stabilire se è rappresentativo

4.4.1 Un campione: scala nominale


L’omogeneità si indaga con la verosimiglianza di una proporzione di successi su n prove
● variabile dicotomica ⇒ test binomiale
● variabile politomica ⇒ test chi-quadro

Test della binomiale:


● variabile dicotomica
● mono- o bi-direzionale

● parametro Π ​della popolazione da testare noto


● test rifiuto H0 se p(H0) < α
● n piccolo
n
p(H0) = p(Successi ≥ k) = ∑ ( n i ) Πi (1 − Π) n−i
i=k
k
p(H0) = p(Successi ≤ k) = ∑ ( n i ) Πi (1 − Π) n−i
i=0
Tede della binomiale con campione ampio
● variabile dicotomica
● trasformazione in punti z
P −Π
z= Π(1−Π)

● test monodirezionale
√ n

p(x < / > z ) < α ⇒ z < / > z critico


● test bidirezionale

p(x <− z ) < α ⋁ p(x > z ) < α ⇒ |z | < ||z critico ||


● n grande

z critico​ = punto z’ per cui p(x < z ′) = α


Test del chi-quadrato
● variabile politomica (k categorie)
● osservazioni indipendenti
● nessuna frequenza è =0
● se k=2 ⇒ f i,campione ≥ 5 ∀i
● se k>2 ⇒ f i,campione < 1 ∀i ⋀ non più del 50% di frequenze sono < 5
● test: ? distribuzione campionaria di frequenze/valori f i,campione è coerente con
distribuzione attesa f i,popolazione
rifiuto H0 se
k (f 2
2 i,campione −f i,popolazione ) 2
χ = f (x, k ) = ∑ f i,popolazione > χcritico
i
● test ​post-hoc​ dicono quali categorie la discrepanza fra frequenze attese e osservate è
significativa
● limiti
○ se le ampiezze di campione (n) e popolazione (N) non sono simili occorre
considerare la ​dimensione dell’effetto​ w


χ2
w= n
○ visione più chiara della reale entità del fenomeno
■ trascurabile w<0,1
■ debole 0,10<w<0,3
■ moderata 0,30<w<0,5
■ grande w>0,50

distribuzione χ2 = somma quadrati dei punti z di una distribuzione normale


2
χcritico = punto x per cui f (x, k − 1) = α

4.2.2 Test per un campione: scala ordinale

Test della mediana: misura significatività differenza mediane tra campione e popolazione
● mediana nota
● osservazioni indipendenti
● esclusione valori = mediana

● nSU P è il numero di valori del campione > della mediana della popolazione

● nIN F è il numero di valori del campione < della mediana della popolazione
● test monodirezionale destra: rifiuto H0 se

nSU P >= T critico


● test monodirezionale sinitra

nIN F >= T critico


● test bidirezionale

max(nSU P , nIN F ) >= T critico


● Tcritico ricavato da tabelle in base a α e nsup+ninf

Test della mediana con binomiale


● mediana nota
● osservazioni indipendenti
● esclusione valori = mediana
● test: p(successi su n >= nsup | Π = 0.5 ) < α
n
∑ ( n i ) Πi (1 − Π) n−i < α
i=nsup

● oppure test: p(successi su n < ninf | Π = 0.5 ) < α


n
∑ ( n i ) Πi (1 − Π) n−i < α
i=ninf

4.4.3 Test per un campione: scala metrica

4.4.3.1 Test z per un campione

Test significatività differenza medie


● intervalli di fiducia: media campionaria cade in intervallo intorno alla media di
popolazione con prob 95%
○ procedimento

1) calcolo puntoz α tramite tabelle


︿
2) test: M ∈ [μ ± z α · σ M ]
● test delle ipotesi: differenza tra media campionaria e di popolazione è fluttuazione
causale
○ procedimento

1) calcolo punto z α tramite tabelle


M −μpopolazione
2) calcolo zM = ︿
σM
3) test bidirezionale:
|z | < |z α |
| M|
4.4.3.2 La distribuzione t di Student e il test t
distribuzione t di Student (Gosset)
● simmetrica
● asintotica
● area sottesa = 1
● deviazione standard > 1
● gradi di libertà ν =n−1

test di t
● deviazione standard popolazione ignota
● ampiezza campione < 30
● procedimento
︿
1) calcolo σM = s/ √n − 1
M −μpopolazione
2) calcolo tM = ︿
σM
3) derivazione di tν,α da tabelle
4)
| | < |tν,α |
test bidirezionale: t
| M| | |

4.4.3.3 Intevallo di fiducia per la media: campioni piccoli

● deviazione standard ignota


● ampiezza campione < 30
● procedimento

tν,α da tabelle
1) derivazione di
s
2) test:​ μM ∈ [M ± tν, α · √n−1
]
La dimensione dell’effetto nel test z e nel test t per un campione è

M −μ M −μ
d= σ ~ n
s√ n−1

e si interpreta
● trascurabile d<0,1
● debole 0,20<d<0,5
● moderata 0,5<w<0,8
● grande w>0,80

La dimensione ottimale del campione per un test z (sulle medie)

● set di α
● set di β
● derivazione da tabelle z di zα e zβ


n
● [opzionale] stimare σ con s n−1
● dimensione ottimale test monodirezionale
2
( σ(z α +z β )
M −μ )
● dimensione ottimale test bidirezioale
σ(z α/2 +z β ) 2
( M −μ )
● potenza a posteriori
√N ·(M −μ)
1 − p(z β ) = 1 − p( σ − zα)

4.4.3.6 Test sulla varianza e suo intervallo di fiducia

test della varianza


| (n−1)s2 | | 2
● test bidirezionale |
σ2 |
< |χcritico ||
| |
(n−1)s2 2
● test monodirezionale
σ 2 < / > χ critico

intervallo di fiducia per la varianza


2 (n−1)s2 (n−1)s2
σ ∈ [ χ2 , χ2 ]
α/2 (1−α)/2
Verifica delle ipotesi su due campioni di osservazioni
Confronto con popolazione Vs confronto con altro campione
● Assunzione: i due campioni provengono da due popolazioni che si differenziano sulla
variabile dipendente

Relazione tra differenze su una variabile e differenze altra variabile ⇒ spiegare la variabilità
della seconda
● Indipendente: distingue i due campioni
● Dipendente: la variabile oggetto/in-esame

Focus su variabili nominali dicotomiche

Campioni indipendenti
I due devono essere identici per ogni altra caratteristica che possa influire su v. Dipendente che
non sia la variabile indipendente

Vero esperimento
● Gruppi indipendenti
● Manipolabilita variabile indipendente
● Soggetti associati casualmente a livelli v.DIpentente
● Presenza gruppo di controllo (senza terapia, con terapia ad effetto noto)

Quasi-esperimento
● Gruppi indipendenti
● Soggetti associati in modo Non casuale a livelli v.dipendente
● livelli v.dipendente non rappresentati come nella popolazione

H0= differenza proporzione su campione = differenza proporzione su popolazione

Test di z
● Almeno 30 osservazioni per campione
● Calcolo z con formula
● Confronto di z con z-critico oppure

Intervallo di fiducia per differenza proporzioni


● Almeno 30 osservazioni
● Calcolo z con formula
● Test: intervallo comprende differenza nella popolazione?

Test di t
● Meno di 30 osservazioni per c
● GL = n1 +n2-2

Dimensione dell'effetto ⇒ indice h

Scala ordinale
Confronto tra mediane ⇒ possibile

Test Mann-Whitney
● Assunzioni
○ Campioni indip
○ Campioni estratti da distrib continua
○ Scala almeno ordinale

Potrebbero piacerti anche