Sei sulla pagina 1di 78

I TEST PSICOLOGICI- Pedrabissi\Santinello CAP 1: Perch i test?

Il test uno strumento che permette di conoscere le persone e facilitano le formulazioni di giudizi, le valutazioni di comportamento e lelaborazione di una diagnosi. Si tratta di uno strumento di conoscenza e di valutazione oggettivo in cui ridotto il margine di errore dovuto alla incostanza e alla soggettivit di chi esprime un giudizio, che permette una valutazione uniforme e costante nel tempo che impedisce forme di discriminazione. Generalmente infatti i giudizi espressi su base intuitiva si dimostrano poco affidabili e poco costanti nel tempo, scarsamente validi e discriminanti in quanto grossolani e frutto di generalizzazioni. I pi rilevanti fonti di errore nelle valutazioni intuitive sono: -Effetto alone: valutazione di un individuo generalizzando il carattere positivo o negativo di un altro tratto emergente -Teorie implicite di personalit: relazioni generalmente non consapevoli tra le diverse caratteristiche della persona percepita; a partire da alcune informazioni su tratti fisici o di personalit di un individuo se ne inferiscono altri. -Caratteristiche del valutatore:organizzazione selettiva e interpretazione personale -Stereotipi culturali e sociali:opinioni precostituite -Equazione personali: errori di osservazione e di valutazione dovuti allinterazione tra le caratteristiche personali dellesaminatore e dellesaminato -Fenomeni proiettivi: meccanismi psicologici pi o meno consapevoli che generano la tendenza ad ascrivere ad unaltra persona disposizioni, sentimenti e pensieri propri. Immagini evocate dai test e test popolari Nellopinione pubblica spesso confusi con i quiz. In realt i test psicologici utilizzati dagli psicologici non hanno niente di misterioso e banale come molti pensano. I test psicologici non sono perfetti, hanno comunque un grado di precisione limitata che pu essere calcolato e quantificato. Comunque secondo lAccademia Nazionale delle Scienze degli Stati Uniti essi rappresentano la forma migliore, pi corretta e pi economica per ottenere le informazioni necessarie per prendere importanti decisioni riguardanti le persone. In che senso i test misurano: la quantificazione in psicologia Cosa sintende per misura in psicologia? Definizione abbastanza condivisa di Misurare= attribuire numeri a oggetti o ad eventi secondo delle regole in modo tale che specifiche relazioni tra i numeri corrispondano ad analoghe relazioni tra gli oggetti. Con questa operazione un relativo empirico viene tradotto in un relativo numerico. Secondo Russell misurare significa stabilire una corrispondenza biunivoca fra tutte le grandezze di un determinato genere e tutti o alcuni mestieri. Un qualsiasi sistema empirico (calore,peso,ecc) viene trasformato in un costrutto ipotetico, ovvero non empirico e non osservabile direttamente.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Tale costrutto ipotetico un continuum suddiviso in n parti a cui viene fatto corrispondere un sistema numerico in modo che ad ogni parte del continuum corrisponde una unica parte del sistema numerico e viceversa. Quando si tratta di misurare variabili psicologiche si presentano delle difficolt che difficilmente si presentano nelle misurazioni fisiche. La problematicit delle misurazioni nelle scienze psicosociali dipende dalla natura delle variabili analizzate, soprattutto perch buona parte di esse non pu essere osservata direttamente. Fasi del processo di misurazione: -definizione teorica del costrutto -definizione in termini operativi di esso e scelta di indicatori comportamentali in grado di rilevare la presenza di una data caratteristica o lappartenenza ad una determinata tipologia psicologica -messa a punto di uno strumento per ottenere valori quantitativi di tali indicatori. Lattribuzione di numeri alle categorie deve seguire metodi razionali e determinate regole. Loperazione di misurazione richiede di solito la determinazione della posizione di un oggetto o evento su una o pi scale di misura. A livello della scala nominale la regola stabilisce di considerare i numeri etichette mutuamente esclusive che la variabile pu assumere, mentre a livello pi alto la regola consiste nel trattare i numeri come numeri reali sui quali possibile svolgere tutte le operazioni aritmetiche. Finalit dei test: I test permettono di fare delle previsioni sul comportamento delle persone in situazioni al di fuori del test, per poter poi fare delle valutazioni, elaborare giudizi, prendere delle decisioni. Il fondamento logico del test implica la generalizzazione del comportamento rilevato con tali mezzi al comportamento manifestato in altre situazioni al di fuori del test. Definizione di test e analisi della definizione: Test= procedura sistematica attraverso la quale viene presentato ad una persona un insieme di stimoli, in grado di elicitare particolari risposte valutabili ed interpretabili quantitativamente sulla base di criteri specifici o di definiti standard prestazionali. Elementi che caratterizzano un test come strumento di misura sino i seguenti: a)un insieme di stimoli (comunemente chiamati item) presentati al soggetto in condizioni uniformi e standardizzate; b) una prestazione o, risposta data agli stimoli proposti(campione,di un comportamento); c)l'attribuzione di un punteggio alla prestazione secondo criteri standardizzati e definiti a priori e interpretabile in relazione a particolari standard di performance. Standardizzazione delle condizioni di somministrazione e dei criteri di interpretazione dei punteggi individuali: Le prestazioni dei soggetti ai test devono essere ottenute in condizioni standardizzate, cio uniformi. La situazione o l'ambiente nel quale si effettua il test, gli stimoli proposti, l'atteggiamento e le istruzioni fornite da chi somministra il test, il tempo assegnato, le modalit con cui rispondere ad eventuali domande devono essere sempre gli stessi e riprodotti in modo il pi possibile uniforme.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Secondo i costruttori dei test si garantiscono maggiori condizioni di standardizzazione se si seguono le istruzioni e le indicazioni fornite dal manuale tecnico di applicazione del test. Ogni alterazione della situazione sia oggettiva, fisica, esterna, sia soggettiva, psicologica, interna al soggetto pu indurre una variazione nelle prestazioni dovuta a fattori non controllabili e non dipendenti dalle caratteristiche individuali. Ma non semp possibile raggiungere condizioni perfette di standardizzazione. Generalmente i test applicati individualmente garantiscono minori condizioni di standardizzazione in quanto il comportamento dello psicologo pu rappresentare uno stimolo suppletivo rispetto al test; infatti il suo comportamento non irrilevante al fine dell'evocazione di risposte nel soggetto. prevedibile che il soggetto esaminato risponder diversamente a seconda dell'atteggiamento e del tipo di rapporto che il testista riesce a creare. Standardizzare, o tarare, un test significa somministrarlo ad un ampio gruppo di soggetti statisticamente rappresentativo della popolazione per la quale il test verr usato. Tale gruppo, chiamato campione di standardizzazione, serve per stabilire le norme del test, cio le prestazioni che, per la popolazione da cui il campione stato casualmente estratto, sono da considerarsi normali, cio medie. Il punteggio grezzo deve essere poi confrontato con dei valori normativi. Grazie alla deviazione standard possibile riconoscere di quando i punteggi grezzi si discostano dalla media e quindi possibile conoscere la posizione occupata dallindividuo allinterno del campione normativo e stabilire se il suo punteggio pu essere considerato normale,oppure superiore o inferiore alla media, e di quanto. Campione di comportamento: Se si vogliono conoscere alcune caratteristiche o aspetti comportamentali di una persona il metodo migliore sarebbe quello di osservarla a lungo, in situazioni e momenti diversi della sua vita quotidiana. Ma quando si ha la necessit di disporre in tempi brevi di informazioni in vista di decisioni da prendere si costretti a ridurre i periodi di osservazione e il numero di comportamenti osservati: necessario fare una selezione di alcuni comportamenti. Le risposte e i comportamenti elicitati dal test devono poter essere rappresentativi di comportamenti che si possono osservare al di fuori della situazione testistica, anche se non possono mai essere una misura completa ed esaustiva di tutti i comportamenti possibili che un soggetto pu esprimere allinterno di una data area. Regole per lo scoring: Un test una misurazione oggettiva di un certo comportamento quindi ogni valutazione e interpretazione dei punteggi deve essere fatta con criteri quantitativi e numerici indipendentemente dal giudizio soggettivo del valutatore. Ogni test deve prevedere, nel manuale tecnico che lo accompagna, delle procedure concrete per classificare in termini quantitativi e numerici le risp date dai soggetti(scoring). Delle regole chiaramente definite e precise permettono a un soggetto di ricevere lo stesso punteggio indipendentemente dal valutatore. Esistono per dei test che prevedono procedure soggettive di valutazione, che lasciano un discreto margine al giudizio soggettivo dellesaminatore (es:valutazione compito da parte degli insegnanti)
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Comunque uno strumento che non faccia in modo che due valutatori indipendenti diano una valutazione simile di una stessa prova non pu essere ritenuto un buon esempio di reattivo psicologico. I test sono conservatori o progressisti? I test sono stati sottoposti a diversi tipi di critiche. L'innesco della rivolta contro i test venne dato, all'inizio degli anni '60, da un intervento del New York Board of Education che sostenne il diritto dei genitori a conoscere i risultati dei reattivi applicati ai loro figli nella scuola, ma che soprattutto critic i test di intelligenza per la loro tendenza ad una classificazione rigida, inflessibile e permanente dei soggetti, ingiustamente selettiva nei confronti degli individui e dei gruppi socioculturalmente svantaggiati o etnicamente minoritari. Un'altra critica rivolta ai test, sempre negli incandescenti anni '60, era che questi (soprattutto alcuni di essi, quelli attitudinali e di profitto) erano strumenti del potere politico, funzionali al mantenimento di un determinato sistema sociale ed economico. Si pensa che tali critiche non riguardassero i test in s, ma l'uso che di essi pu essere fatto, o una loro cattiva applicazione. Infatti possono essere usati non solo per fini di conservazione, di mantenimento di uno status quo, ma anche per scopi evolutivi, di cambiamento, di riforma: di per s essi sono neutrali. Essi possono servire per mantenere inalterata una situazione sociale, ma possono anche essere utilizzati per contestare l'operato di diverse istituzioni, come strumenti di misura oggettivi e standardizzati, che non guardano in faccia in faccia nessuno, garantiscono condizioni di maggiore democrazia e di rispetto dei meriti e delle scelte di ogni individuo, a qualsiasi ceto sociale appartenga. Anche nell'ambito della psicologia dei lavoro, grazie all'impersonale oggettivit dei test, si va sempre pi diffondendo l'idea che l'occupazione di una persona debba dipendere da ci che essa in grado di fare e non dalla posizione sociale dei suoi genitori, dalle loro conoscenze e dalla possibilit di ottenere raccomandazioni. I test hanno il merito di evidenziare diversit e carenze, che solo cos possono essere analizzate ed eventualmente compensate con mirati interventi di recupero. Un limite dei test che essi possono essere utilizzati, e nel corso della loro storia spesso avvenuto, per etichettare le persone, per incasellarle e classificarle in categorie diagnostiche rigide e schematiche (es. rilevazione del QI). Un altro limite:i test cognitivi registrano ci che un individuo in grado di fare in un determinato momento ma non danno informazioni sul perch della sua prestazione. Daltra parte voler nascondere gli effetti dello svantaggio sociale o culturale rifiutando radicalmente i test o costruendone alcuni non sensibili a tali influenze non serve a modificare le disuguaglianze di partenza, semmai potrebbe contribuire a far prendere coscienza del problema e a ritardarne la soluzione.

CAP 2: Breve storia dei test La seconda met del XIX secolo segna una svolta importante per la psicologia. Da allora essa si avviata a diventare una disciplina scientifica autonoma, fondata metodologicamente non pi sulla intuizione, sulla percezione, sull'introspezione e sulla speculazione filosofica, bens sul metodo sperimentale.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Quantit e misura sono diventate pertanto le parole chiave per chi vuole fare seria e credibile ricerca psicologica, e il test si delineato come uno degli strumenti pi adatti a verificare empiricamente la validit delle ipotesi. La scientificit delle conclusioni, secondo tale autore, garantita dalla raccolta oggettiva dei dati (e il test ne il mezzo pi sicuro), dalla verifica a cui questi possono e debbono essere sottoposti ed infine dal confronto degli stessi con altri risultati. Il test psicologico nella sua forma odierna nasce ufficialmente circa cento anni fa nei laboratori scientifici di Galton, di Cattell e di Wundt in cui si studiavano la discriminazione sensoriale, i tempi di reazione e le differenze individuali. Le prime rudimentali forme di testing risalgono per almeno a12200 a.c. e avevano lo scopo di selezionare persone adatte ad esercitare la funzione di mandarino nell'impero cinese. Anche l'interesse per le differenze individuali e per la classificazione tipologica molto antico; per solo intorno alla met dell'800 che dall'area della psichiatria giungono stimoli e spinte innovative che favoriscono l'evoluzione del test. L'esigenza di una definizione del concetto di anormalit, di devianza spinse gli studiosi di psichiatria a predisporre strumenti di misura del comportamento per meglio classificare diagnosticare i loro pazienti. Fu Francis Galton il primo a sistematizzare gli studi sulle differenze individuali; con i suoi lavori concorse ad accreditare l'idea che soltanto attraverso procedure oggettive e standardizzate si potevano ottenere proficui, significativi e fecondi risultati nel campo psicologico, tali da far acquisire scientificit a tale disciplina. Il XX secolo La nuova legislazione sull'obbligo scolastico aveva riempito le aule specialmente di bambini di livello socioculturale basso; molti di essi ottenevano cattive prestazioni scolastiche e venivano giudicati ritardati, deboli di mente dagli insegnanti. Si delineava sempre pi l'esigenza di valutare in modo oggettivo e sicuro tali allievi per capire se i cattivi risultati scolastici fossero dovuti a effettivo ritardo cognitivo-mentale o semplicemente allo svantaggiato background familiare. A questo proposito nel 1904 il ministro della Pubblica istruzione di Parigi incaric Binet e il suo collaboratore Simon di mettere a punto un metodo per identificare quei bambini che non potevano trarre profitto dalla regolare istruzione e che dovevano essere collocati in scuole speciali. Nel 1905 apparso il primo test di intelligenza, la scala Binet-Simon, composto da 30 item disposti in ordine di difficolt crescente e misuranti abilit astratte come la capacit di giudizio, la comprensione e il ragionamento. Esso fu rivisto e migliorato da Binet e Simon nel 1908 con l'introduzione del concetto di et mentale come sistema di attribuzione di punteggio e nel 1911, con l'estensione della scala agli adulti. Nel 1916 Lewis lo tradusse in inglese, lo adott alla cultura americana e introdusse il concetto di Q.I. come indice funzionale per la valutazione di certo numero di prove cognitive e di performance. Il periodo del boom nelluso dei test In America essi si diffusero in altri due campi. Furono utilizzati dapprima per la selezione di ritardati mentali tra gli immigrati e, successivamente. durante la prima guerra mondiale per la classificazione delle reclute.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Agli immigrati e alle reclute vennero applicati per la prima volta test collettivi o di gruppo, al fine di risparmiare tempo, impiego di personale e quindi denaro. Partendo da un test collettivo messo a punto da Otis, gli psicologi dell'esercito americano costruirono due test, l'Army Alfa e l'Army Beta. Il primo era un test verbale destinato a selezionare reclute per compiti medi o difficili e l'Army Beta era di tipo non verbale ed era destinato agli illetterati ,o agli stranieri. Le condizioni in cui tali test di gruppo venivano applicati non erano certo le pi idonee, ci gener da un lato inesattezza e scarsa oggettivit nelle rilevazioni e nelle classificazioni; dall'altro per forn esperienze utili agli psicologi sia rispetto alla costruzione e alla dimensione metrica dei test, sia per l'analisi dei dati. Inoltre questi primi reattivi divennero i prototipi di altri test di gruppo e influenzarono la forma dei successivi test di intelligenza e di quelli attitudinali. I test di attitudini specifiche Il periodo doro del testing dur fino al 1930 anno in cui molti psicologi ampliarono e ridefinirono il concetto di intelligenza e di QI e conclusero che i reattivi in uso, anche se definiti test di intelligenza generale, misuravano prevalentemente l'attitudine scolastica. Per queste ragioni cominciarono ad essere costruiti test finalizzati alla valutazione di attitudini specifiche. La loro diffusione fu possibile perch proprio in quel periodo Thurstone [1938], partendo dagli studi di Spearman, mise a punto un nuovo procedimento statistico l'analisi fattoriale - che permetteva di identificare un certo numero di fattori specifici, di abilit mentali primarie come la comprensione verbale, l'abilit spaziale, la memoria associativa, il ragionamento generale, la fluidit verbale che contribuirono a rendere pi complesso il costrutto teorico dell'intelligenza. Essendo quindi molti, secondo Thurstone, i fattori implicati nella definizione di intelligenza vennero messe a punto delle batterie multiple o batterie multifattoriali che permettevano di valutare la posizione di un soggetto in rapporto a diversi tratti o fattori specifici. I test di personalit e le tecniche proiettive Col termine test di personalit si indicano tutti. quegli strumenti che si propongono di misurare aspetti della personalit, distinti dalle abilit intellettive quali la motivazione, i sentimenti, i rapporti interpersonali, ecc. I primi che cercarono di misurare la personalit furono Galton [18831 e Kraepelin [1895] attraverso il metodo delle libere associazioni. Ai loro soggetti venivano presentate delle parole-stimolo alle quali essi dovevano rispondere liberamente con la parola evocata dallo stimolo stesso. Il tipo di risposta, la risposta mancata e i tempi di reazione alla parola-stimolo venivano utilizzati per tracciare un quadro della personalit dell'individuo. Il primo vero test di personalit fu per il Personal Data Sheet (1919), di Woodworth, messo a punto per identificare soggetti con disturbi nevrotici all'interno dell'esercito statunitense. Si trattava di un questionario di 116 domande a cui il soggetto doveva rispondere con un s o un no; tale strumento serv alla base per altri test di personalit come il Thurstone Personale Schedule, il Bernreuter Personality Inventory e il Minnesota Personality Inventory. Si tratta di un test di 550 item a cui rispondere
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

con vero/falso ed usato ancor oggi molto spesso in ambito clinico per rilevare la tendenza all'ipocondria, alla depressione, alla paranoia, alla schizofrenia all' introversione ecc. Lo svizzero Rorschach fu il primo ad utilizzare, gi nel 1921 uno stimolo neutro,ambiguo, non strutturato quale le macchie d'inchiostro; attraverso l'interpretazione di tali macchie suoi pazienti rivivevano conflitti e problemi inconsci di tipo affettivo-emotivo; Morgana e Murare nel loro TAR si servirono invece di figure ritratte in una scena non definita la cui rielaborazione e interpretazione era sempre affidata ai pazienti che, inconsciamente, trasferivano bisogni e conflitti nella costruzione della storia, Buck [1948] ide il test della Casa-Albero-Persona basato sul presupposto che i soggetti, soprattutto i bambini, rivelassero bisogni interessi e caratteristiche di personalit disegnando i temi sopra indicati. La rivolta antitest Nel ventennio dal 1940 al 1960 ci fu, soprattutto in America, un secondo periodo d'oro per il test. Scuole, ospedali, industrie e uffici pubblici si servirono dei numerosi reattivi psicologici immessi sul mercato per le loro scelte e selezioni, determinando un nuovo business: quello della creazione di strumenti di misura. Si trattava per molto spesso di test non aggiornati o inadeguati. Tale situazione cre un massiccio movimento di critica nei confronti dei test e culmin con la stampa nel 1966 di norme specifiche per costruzione, valutazione, uso, particolari applicazioni e procedure di somministrazione dei test. Tali norme sono contenute nel volume Standards for Educational and Psychological Tests and Manuals pubblicato dall'American Psychological Association (APA) e rivisto negli anni 1974 e 1985. Gli psicologi dovevano poi tenere conto di problematiche pi sottili legate alla costruzione, somministrazione e uso dei test. I test oggi Il test ormai uno strumento indispensabile e insostituibile in molti ambiti (ospedali, prigioni, scuole, istituzioni di custodia, uffici pubblici) perch fornisce una serie di indicazioni che aiutano a prendere decisioni, a verificare, a programmare il lavoro, a selezionare. Nell'ultimo trentennio tre importanti innovazioni scientifiche e metodologiche hanno ulteriormente influenzato la storia del testing: a) l'uso pervasivo e massiccio dei computer, b) l'introduzione della meta-analisi nell'ambito della ricerca e della verifica delle propriet metriche del test, e c) l'utilizzo della teoria del tratto latente. Uso dei computer I computer hanno cominciato ad entrare nel mondo del test a partire dagli anni. Sono usati soprattutto nelle operazioni di somministrazione, di scoring e di lettura dei dati, ma anche in fase di costruzione di un reattivo (aiutano nell'item analysis, nella distribuzione delle subscale, nella stima delle correlazioni, ecc.). Offrono una serie non indifferente di vantaggi.

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Il test risulta uno strumento ancor pi standardizzato perch vengono eliminate differenze nella modalit e nei tempi di somministrazione, errori di correzione, di calcolo, ecc. La somministrazione computerizzata del test pi veloce di quella carta e matita e garantisce un risparmio economico. I dati gi inseriti nel computer sono pronti per le elaborazioni statistiche e si evitano cos anche eventuali errori di trascrizione delle informazioni. Attraverso il computer possibile attualmente rilevare qualcosa di nuovo rispetto ai test di impostazione tradizionale. Le figure in movimento create dai computer possono permettere di misurare abilit spaziali e percettive impossibili prima ed anche di valutare e di interpretare tempi di latenza nella risposta agli item. Rimangono aperti due problemi. Il primo concerne l'interazione uomo-computer, che risulta difficoltosa con bambini, anziani e persone con handicap, oltre che generatrice di ansia. Il secondo quello che riguarda l'equivalenza dei test tradizionali con la versione computerizzata. Contributi della meta-analisi Con il termine meta-analisi, coniato da Glass nel 1977, si indica un procedimento di integrazione dei dati ottenuti da singole indagini e divenuto popolare verso la fine degli anni '70 e all'inizio di quelli '80 quando fu usato in molte autorevoli analisi sull'efficacia delle psicoterapie . Si tratta di una metodologia statistica che consente di arrivare, attraverso un complesso lavoro di ripulitura dei risultati, al ritrovamento di un valore medio, vicino al valore verit. Contributi della teoria del tratto latente L'applicazione della teoria del tratto latente permetterebbe di rintracciare, all'interno di un gruppo di item, quelli con medesimo grado, di difficolt, e di potere discriminativi, ci renderebbe possibile preparare diversi tipi di test con lo stesso grado di difficolt o sottoporre gruppi di soggetti a parti dello stesso test (poich ciascun item ha la medesima difficolt) anzi ch all'intero test e tempo e denaro verrebbero cos risparmiati. CAP 3: La psicometria. Ovvero:cosa misurano realmente i test? I problemi che si incontrano nellusare i test sono dovuti al fatto che ci che si vuole misurare non un oggetto fisico, ma un costrutto teorico, una entit ipotetica. La misurazione di variabili psicologiche strettamente legata alla chiarezza con la quale viene definito il significato dei costrutti. La psicometria la branca della psicologia che applica metodi di misurazione quantitativa alle variabili psicologiche. Storicamente si sono contrapposte due scuole psicometriche caratterizzate da diverse e contrapposte concezioni di ci che il loro oggetto di studio:una psicometria funzionalista e una psicometria di tratto. L'orientamento.funzionalistico nato e si imposto soprattutto nell'ambito del testing occupazionale e scolastico. All'interno di tale approccio, la progettazione e la costruzione di un test sono completamente determinate dall'uso che di esso viene fatto ci che viene misurato non ha altro significato oltre alla sua applicazione. La costruzione di un test, dunque, prevede la definizione di uno scopo, un'analisi delle
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

aree rilevanti per tale obiettivo in termini, per esempio, di mansioni, di attivit, di prestazioni richieste da un lavoro di contenuti di un curricolo educativo, di sintomi che portano ad una diagnosi psichiatrica e.la strutturazione del test su queste specificazioni. Secondo la psicometria di tratto invece i tratti psicologici che i test misurano sono reali e sono oggetti di interesse per se stessi. Essa sorse originariamente per dare una pi scientifica alle nozioni del senso comune riguardanti i diversi tipi di personalit. L'idea centrale era quella dello spettro di personalit secondo cui ogni tipo di personalit non tutto o niente, ma presenta varie possibilit fra i due estremi. Cos, per esempio, le persone non sono completamente buone o cattive, ma tali caratteristiche possono essere rappresentate lungo un continuum. La personalit quindi solo un problema di grado. Il primo studioso a usare questo approccio in modo scientifico fu Galton nel suo tentativo di definire l'essenza del genio. All'interno dell'indirizzo di tratto si ritiene dunque che la base delle differenze individuali nella personalit correlata alle differenze individuali nella biologia dell'organismo umano, sia a livello biochimico che fisiologico, anatomico o neurologico. I test psicometrici vengono perci elaborati per misurare dei tratti considerati come manifestazione delle variazioni biologiche nella personalit o nell'attitudine. I due modelli sono collegati da una stesso teorema, fondamentale della psicologia: la teoria dei punteggi veri. La teoria dei punteggi veri La teoria dei punteggi veri afferma semplicemente che il punteggio ottenuto da un individuo in un item o in un test costituito da due componenti: a) il punteggio vero del soggetto rispetto a ci che misurato; b) alcuni errori di misura. Tradizionalmente ci espresso dalla seguente equazione: X=V+E dove X indica il punteggio osservato, V il punteggio vero ed E l'errore. Quindi se tutto ci che si conosce che una particolare persona ha ottenuto un punteggio di X nel test, allora non si sa proprio nulla. Infatti un punteggio osservato da solo (X) non utile. Noi siamo generalmente interessati a conoscere il punteggio vero (V) e abbiamo bisogno di dati addizionali per trovarlo. Primariamente dobbiamo avere un'idea della dimensione dell'errore (E). In altre parole, non si pu sapere quanto accurato sia un punteggio se non si ha una qualche idea di quanto inaccurato probabile che esso sia. Dalla teoria dei punteggi veri sono derivate varie tecniche per ottenere un'idea della grandezza dell'errore. Alla base di queste si trova il processo di replicazione, ossia si fanno pi misurazioni sugli stessi soggetti, oppure si rilevano punteggi su molti soggetti differenti. Assunti conosciuti come postulati della teoria dei punteggi veri: -Primo assunto: la correlazione tra 2 distribuzioni derrore zero: tutti gli errori sono casuali e normalmente distribuiti -Secondo assunto: i punteggi veri non sono correlati con gli errori. Ossia il variare della variabile punteggi veri non influisce sulla variabile punteggi derroreche varia per proprio conto, cio casualmente. -Terzo assunto: diverse misure di X nello stesso soggetto sono statisticamente indipendenti luna dallaltra. Questo raramente vero in senso stretto poich la stima
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

dellerrore non usualmente molto accurata e il concetto stesso di errore aperto a interpretazioni. Perci la variazione nella dimensione del punteggio vero misurato dipende dal modo particolare con il quale lerrore stimato. Critiche alla teoria dei punteggi veri: La maggiore critica rivolta a questa teoria riguarda il concetto stesso di punteggio vero. Si affermato che non esiste alcunch definibile come punteggio vero in quanto questo una mera entit ipotetica generata dalla teoria. Il punteggio vero come tale sarebbe una cosa mistica e quindi di nessuna importanza teoretica. La risposta a tali critiche stata quella di differenziare due definizioni di punteggio vero: una di tipo platonico e una di tipo statistico. Il punteggio vero statistico La definizione statistica concepisce il punteggio vero come quello che si otterrebbe se si dovesse fare un numero infinito di misure del punteggio osservato sulla stessa persona e se ne facesse la media. Poich il numero delle osservazioni si avvicina all'infinito, allora gli errori, essendo casuali per definizione, si cancellerebbero l'un l'altro permettendo una misura pura del punteggio vero. Naturalmente non possibile effettuare un numero infinito di misure di X sulla stessa persona senza alterare il processo di misurazione stesso a causa della percezione della situazione da parte del soggetto e degli inevitabili effetti pratici. Ma questo non importante dal punto di vista della definizione statistica che stabilisce che il punteggio vero quello che si otterrebbe qualora questo fosse possibile. II punteggio vero platonico Il concetto platonico di punteggio vero basato sulla teoria della verit secondo il filosofo greco Platone. Egli credeva che se una cosa pu essere pensata, anche se non esiste nel mondo, essa deve esistere da qualche parte per rendere possibile un tale pensiero. Una simile idea platonica di punteggio vero generalmente ritenuta un errore con l'implicazione che gli psicometristi che argomentano per l'esistenza di un costrutto (per esempio, l'intelligenza), a partire dai punteggi di un test affidabile, commettono un errore di categoria, un salto logico: dall'empirico al metafisico. Viene detto che non esiste un punteggio vero, ma solo una serie di osservazioni e di deduzioni da esse. Questo modo di ragionare, tuttavia, probabilmente una eccessiva semplificazione. Infatti, nel linguaggio comune si usano molti nomi astratti che, sebbene non siano direttamente collegati ad oggetti, esistono sicuramente, come per esempio giustizia o infelicit. Solo perch un oggetto astratto non ha una esistenza fisica, ci non significa che esso non possa essere di alcun uso o che, a maggior ragione, non sia un oggetto. Tratto o funzione? L'importanza della definizione statistica della teoria dei punteggi veri sta nel fatto che essa in grado di supportare sia i funzionalisti sia la psicometria basata sul tratto. D'altra parte, anche per molti test usati in psicologia per misurare tratti, una semplice definizione statistica del punteggio vero per se stesso probabilmente inadeguata.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Infatti una scala che si prefigge di misurare il livello di depressione di una persona presume che l'infelicit esista realmente e non solo in senso meramente statistico. L'approccio funzionale in grado di produrre test per molteplici obiettivi, anche se presenta una debolezza: non si pu assumere che un test sviluppato con un particolare scopo sar necessariamente fruibile per un altro obiettivo. Il modello funzionale insiste, almeno in linea di principio, sul fatto che nessuna variabile interveniente o tratto possano essere rilevanti. Come per i comportamentisti, il solo aspetto interessante dei tratti il comportamento al quale portano e, poich questo definito e misurato direttamente e funzionalmente, i tratti diventano quindi ridondanti. Per i funzionalisti non ci sono, per esempio, cose come 1'abilit in matematica: esiste solo la performance di un individuo in vari compiti matematici. Spesso per le persone nelle loro interazioni tendono ad usare concetti astratti ed spesso su tale base che anche gli psicologi tendono ad operare delle generalizzazioni dal punteggio di un test ad una attuale decisione, sia essa giustificata o no. Quindi nonostante i vantaggi superficiali e oggettivi dell'approccio funzionalista, la psicologia dei tratti non pu essere eliminata poich rappresenta da vicino il modo in cui le persone prendono le decisioni nel mondo reale. I test funzionali sono costruiti specificatamente per situazioni particolari e non possono essere generalizzati. Se si desidera generalizzarli si ha bisogno di un concetto, di un tratto, per giustificare laffermazione che la scala (es di depressione) potrebbe essere applicabile in diverse situazioni. Il problema di quale dei due modelli sia pi scientificamente corretto non ha significato in quanto sono entrambi modalit alternative per trattare gli stessi fenomeni. Quindi discutere quale delle due teorie pi corretta un problema marginale, vanno piuttosto considerate le conseguenze dells loro applicazione. Il dibattito attuale: Lapproccio funzionale ha gettato una luce nuova su alcuni dibattiti tradizionali allinterno della psicometria. Allinterno del funzionalismo il criterio di decisione luso per il quale il test viene costruito. Perci un test per la selezione deve necessariamente concludersi con la formazione di due categorie:chi passa e chi no. In simili circostanze lesistenza di una sola scala diventa un artefatto del processo decisionale piuttosto che un problema legato alla natura di ci che deve essere misurato. Nelle situazioni valutative invece, in cui nessuna decisione selettiva deve essere fatta, diventa necessario raccogliere misure diverse in modo da ottenere una immagine complessiva e, quindi una singola scala non sarebbe sufficiente. In questo caso dovrebbero essere costruite diverse subscale non necessariamente caratterizzate da elementi comuni. Queste concorrerebbero a costruire un profilo che molto utile quando si chiamati ad effettuare delle valutazioni e non delle selezioni. Legame tra tratti e funzioni: stata l'attenzione sui processi di pensiero implicati nelle decisioni umane che ha permesso di gettare un ponte fra la psicometria basata sui tratti e quella funzionale. Anche se, in linea di principio, si pu immaginare una psicometria funzionale pura in cui, per esempio in un test di selezione tutto basato su
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

ci che ci si aspetta da una persona selezionata, in realt i giudizi su ci che atteso vengono dati da esseri umani e di conseguenza sono limitati dalla psicologia umana. Questi limiti includono i sistemi di classificazione e di generalizzazione tipici della psicologia popolare (es stereotipi). In sintesi si pu affermare che sia l'approccio funzionale sia quello dei tratti presentano vantaggi e svantaggi. Nessuno dei due pu essere considerato migliore dell'altro o esaustivo. L'importante che i costruttori di test siano consapevoli degli assunti teorici sulla base dei quali stanno operando in una particolare situazione e siano preparati a giustificarli (necessaria consapevolezza critica). CAP 4: La classificazione dei test Classificarli aiuta a conoscere le reali caratteristiche dei test e gli attributi da essi realmente misurati. Presentiamo qui una classificazione sulla quale diversi autori convergono [Lyman 1991; Murphy e Davidshofer 1994] e che suddivide i test in due grandi gruppi: - test di massima performance; - test di tipica performance. Test di massima performance Sono quelli che richiedono al soggetto di dare il meglio di s e che valutano abilit raggiunte o potenziali. Il punteggio in questi test determinato dal livello di successo nel completare correttamente ogni prova. Nella somministrazione di tali test si assume che i soggetti siano animati da un alto e analogo livello di motivazione, in quanto non facile verificare questa loro intrinseca disposizione. Se si hanno elementi per non dare per scontata questa assunzione, occorrer tenerne conto nel momento dell'interpretazione dei risultati. I punteggi conseguiti in un test di massima performance possono dipendere da almeno tre fattori: la capacit innata dei soggetti, quella acquisita e la motivazione. Questi interagiscono fra loro e non possibile valutare quanto del punteggio ottenuto determinato da uno singolo di essi. Le nostre prestazioni dipendono infatti sia dal potenziale innato, sia da come questo stato sviluppato e modificato dalle nostre esperienze di vita (scolastiche, sociali, culturali), sia dai nostri interessi e motivazioni. In questa categoria sono generalmente compresi test di intelligenza, test attitudinali e test di rendimento. A- test di intelligenza: i diversi test di intelligenza elaborati nel corso degli anni riflettono le differenti definizioni che i vari autori hanno dato di questo costrutto. Infatti alcuni contengono prevalentemente item verbali, altri molto materiale non verbale, alcuni danno ampio spazio alla soluzione di problemi, altri ancora danno pi peso alla capacit mnestica, ecc. Ancora, alcuni di essi danno luogo ad un unico punteggio totale (generalmente un QI), altri producono diversi punteggi in quanto sono formati da diversi subtest. La capacit di ottenere una buona prestazione in un test di intelligenza pu dipendere dal rendimento nella lettura o nell'aritmetica, o dalla familiarit con parole, oggetti, luoghi o concetti. La mancanza di familiarit crea condizioni di svantaggio e ci pu
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

spiegare il minor rendimento in tali test di un individuo appartenente ad un gruppo etnico minoritario o proveniente da un ambiente sociale e culturale deprivato. B- test attitudinali: Anche tali tipi di test permettono di fare predizioni. Offrono indicazioni per prevedere un livello futuro di prestazione in qualche campo specifico. In genere vengono utilizzati per selezionare individui nel mondo del lavoro, per l'ammissione a corsi di addestramento o di formazione e a volte vengono sostituiti ai test di intelligenza.Anche le misure delle prestazioni attitudinali possono essere influenzate dal rendimento in alcune aree particolari, come ad esempio nella lettura. C- test di rendimento: Servono per rilevare e valutare il livello attuale di conoscenze, di capacit o di competenza di un individuo. A differenza di altri che possono avere un uso pi generale, questi vengono costruiti per essere applicati in situazioni specifiche. Un buon criterio per differenziare i test di rendimento da quelli di attitudine costituito dal loro uso. Lo scopo per cui viene applicato il test il criterio migliore per questa distinzione. I test attitudinali servono a predire come funzioneranno le persone; quelli di rendimento misurano il loro rendimento attuale e quelli di intelligenza la loro capacit o il loro funzionamento intellettivo. Test di tipica performance (o di comportamento tipico) In tale categoria rientrano tutti i test che si prefiggono di conoscere le preferenze di un soggetto, i suoi comportamenti abituali piuttosto che ci che egli in grado di fare. Gli strumenti utilizzati hanno le pi varie denominazioni: test, scale, inventari, moduli, indici, questionari, metodi delle scelte obbligate, per non citare le tecniche proiettive, i test situazionali ecc. Dal momento che la concezione o la base teorica a essi sottostante inevitabilmente pi complessa e meno chiaramente evidente rispetto a quella dei test di prestazione massima, pu nascere una certa confusione su quali siano le caratteristiche rilevate da un test di comportamento tipico; ci che un autore intende per socievole pu non corrispondere a quanto ritenuto da un altro. Inoltre, mentre la capacit di una persona pu essere considerata, entro un certo intervallo di tempo, relativamente stabile, la natura affettiva pu cambiare in un breve periodo di tempo. Ed proprio questo aspetto che si vuole cogliere con i test di performance tipica. Si cerca di capire come veramente un soggetto o come reagisce a certi stimoli o come si sente abitualmente da un punto di vista psicologico. Nei test di massima prestazione sicuro che i soggetti non ottengano punteggi pi alti rispetto alle loro capacit. Le persone non possono far finta di sapere pi cose o di essere pi intelligenti, possono solo dare prestazioni al di sotto delle loro capacit, non impegnandosi a fondo, prestando poca attenzione.. Nei test di prestazione tipica, invece, un individuo pu fingere sia in una direzione sia in un'altra opposta, per esempio aumentando o diminuendo il suo grado di adattamento o di socievolezza. In questi test non si vuole che soggetti facciano meglio che possono ma che rispondano nel modo pi onesto possibile. Proprio per controllare se i soggetti rispondono onestamente e lealmente agli item e non secondo meccanismi psicologici di desiderabilit e di aderenza alle norme sociali, alcuni costruttori di test che rilevano caratteristiche di personalit vi hanno
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

inserito, fra le altre, una subscala (detta scala lie) finalizzata a valutare il grado di sincerit, o di menzogna, degli esaminati. Un altro problema che si incontra con i test di tipica performance che alcuni dei loro item possano presentare un qualche grado di ambiguit di significato. Fattori come questo abbassano, come si vedr in seguito, il grado di attendibilit e di validit di un test. Anche l'atteggiamento e la disposizione motivazionale di un soggetto assumono una grande importanza. Uno psicologo attento e consapevole dovrebbe tener conto delle condizioni e dello scopo della somministrazione di un test nella fase di interpretazione dei punteggi ed utilizzare, qualora fossero disponibili, norme specifiche per gruppi particolari di soggetti e non quelle per la popolazione generale. Queste considerazioni hanno portato un grande numero di psicologi a ritenere che simili test meritino meno fiducia rispetto a quelli di massima performance. Rimane comunque indubbia la loro utilit quando essi vengano utilizzati da psicologi e consulenti esperti, in grado di ridurre l'influenza di fattori di disturbo e di interpretarne correttamente i risultati. Altri criteri di classificazione Oggettivo, soggettivo, proiettivo Un test oggettivo quando la procedura di attribuzione del punteggio alle risposte presentata prima del lavoro di scoring. Cos i test a scelta multipla o che prevedono risposte dicotomiche (vero-falso) di solito sono oggettivi perch l'autore del test ha compilato una griglia di correzione che contiene la risposta giusta o migliore per ciascun item. La qualifica di soggettivo riservata invece a quel test nel quale qualche elemento di giudizio personale viene coinvolto nel lavoro di scoring. Test costituiti da frasi da completare o da prove personali (in cui il soggetto libero di produrre contenuti personali) sono esempi di test soggettivi, perch raramente il costruttore del test potr indicare in anticipo tutte le possibili risposte corrette all'item ed il punteggio relativo. I reattivi proiettivi contengono item soggettivi che sono stati resi ambigui deliberatamente al fine di ottenere risposte individuali. Le macchie di inchiostro di Rorschach e il TAT ne sono esempi. Test con selezione di risposte o con produzione di risposte Una classificazione forse pi precisa, in relazione ai diversi tipi di item, si riferisce alla scelta o alla produzione di risposte. In genere i test con risposte a scelta multipla, in cui il soggetto chiamato a scegliere fra le alternative proposte, rientrano nella prima categoria, mentre una prova o un saggio personale rientrano nella seconda. Scritto, orale o di performance Un altro criterio per classificare i test pu essere rappresentato dal mezzo usato per la presentazione degli item e delle istruzioni. In genere gli item di un test sono scritti: il soggetto scrive le risposte, o fa dei segni che identificano le risposte scelte. Le istruzioni qualche volta vengono date oralmente, ma di solito possono essere impartite sia oralmente sia per iscritto.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Pochi test prevedono risposte orali e in genere sono stati predisposti per individui con deficit visivi o per soggetti con gravi limiti nella capacit di lettura. I test di performance generalmente implicano l'uso di apparati o di dispositivi speciali e possono comprendere una attivit o un campione di lavoro; di solito vengono contrapposti a quelli che richiedono solo l'uso di carta e matita. Test standardizzati o informali I test standardizzati sono stati costruiti in modo da essere utilizzati da un ampio numero di persone. Il loro contenuto prefissato e ben strutturato, le istruzioni per la somministrazione e le procedure di scoring sono completamente specificate. I test informali sono stati elaborati per un uso locale, anche se molte considerazioni riguardanti quelli standardizzati sono applicabili anche agli informali. Test di velocit o di potenza I test che prevedono un limite di tempo sono in genere test di prestazione massima. Quando non c alcun limite di tempo nella somministrazione o cos ampio perch tutti lo completino, questo considerato di potenza. La maggioranza dei test di rendimento rientra tra quelli di potenza, perch il loro obiettivo la stima dei livelli di rendimento piuttosto che la valutazione di quanto velocemente gli individui possono rispondere. Alcuni reattivi sono quasi puramente di potenza e altri quasi puramente di velocit, avendo item cos poco difficili che tutti i soggetti vi potrebbero rispondere in modo corretto sr solo avessero pi tempo. Tra questi 2 estremi si situano alcuni che prevedono limiti di tempo pi o meno ampi. Questi presentano caratteristiche tipiche sia dei test a tempo sia di quelli di potenza e vengono classificati nelluna o nellaltra categoria a seconda che il tempo renda la velocit un determinante decisivo del punteggio. Test di gruppo (collettivi) o individuali Un test individuale se pu essere somministrato solo ad un individuo per volta. A volte pu essere somministrato a piccoli gruppi se esistono le condizioni appropriate e se lo psicologo dispone di pi copie del materiale necessario. I test di gruppo o collettivi possono essere somministrati a pi persone contemporaneamente. Sono di solito test carta e matita, ma non necessariamente. Quelli individuali, invece, spesso implicano luso di materiali diversi da questi. Test verbali e non verbali Un test verbale costituito da item verbali, che implicano l'uso di parole in forma orale o scritta. I test cosiddetti non verbali non contengono invece alcun item verbale; le parole sono usate solo nelle istruzioni. Alcuni autori preferiscono il termine non linguistico per descrivere quest'ultimo tipo di test, che non presenta item verbali ma le cui istruzioni vengono date oralmente o per iscritto, e utilizzano il termine non verbale solo per quelli in cui nessuna parola viene usata, nemmeno per le istruzioni. Secondo questa classificazione, un esempio tipico costituito dal test di intelligenza astratta Culture fair di Cattell. Test culture fair (culturalmente equi) I test culture fair sono particolari tipi di test relativamente indipendenti da influenze ambientali o culturali e possono essere considerati equi nei confronti di persone appartenenti a molte culture diverse. Alcuni autori suggeriscono la dizione
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

culturalmente omogenei riferendosi a test i cui item funzionano bene dentro una specifica cultura o subcultura. All'interno di questa categoria alcuni studiosi collocano specificamente la sottoclasse degli strumenti self-report, cio autodescrittivi. Gli strumenti self-report che servono a identificare gli interessi e le caratteristiche di personalit sono tipicamente e propriamente denominati inventari, questionari o checklists piuttosto che test. Se vengono chiamati test solo per semplificare il linguaggio, ma tale termine dovrebbe essere evitato nel descrivere strumenti selfreport, specialmente nei loro titoli, per non creare fraintendimenti o l'illusione che la personalit si misuri direttamente come una qualsiasi performance. CAP 5: La somministrazione dei test Lo scopo di un test quello di ottenere prestazioni qui e ora da parte di un soggetto, prestazioni che permettano poi di fare una previsione o una generalizzazione circa il comportamento che egli manifester al di fuori della situazione di testing. allora evidente che qualsiasi elemento, che intervenga a modificare la situazione del test, costituisce una possibile fonte di varianza d'errore dei punteggi, in grado quindi di alterarne il significato e di indurre alla formulazione di giudizi scorretti o di decisioni errate. Pertanto molto importante tenere sotto controllo ogni fattore che possa interferire sulla prestazione dei soggetti e possa inficiare una corretta generalizzazione dei risultati del test. Inoltre, poich i risultati di un test potrebbero essere usati per formulare graduatorie, effettuare selezioni od operare delle scelte, necessario, se si vogliono fare dei confronti fra soggetti, che le prestazioni siano ottenute in condizioni standardizzate e uniformi. Ovviamente le procedure di somministrazione di un test possono variare a seconda del tipo di test (individuale/collettivo; tempo/senza limiti di tempo; attitudinale o di personalit, ecc.) e delle caratteristiche del soggetto esaminato (et, livello culturale, condizione fisica e mentale). Tali fattori, interagendo con altri aspetti quali la preparazione del soggetto al test, il suo livello di motivazione, di ansia, di fatica e di salute possono influire sulle prestazioni. Allo stesso modo sia le variabili di tipo situazionale sia le abilit, le caratteristiche, il comportamento dell'esaminatore possono avere effetti sulla performance dei soggetti esaminati. Prima della somministrazione dei test Per prima cosa necessario effettuare una opportuna programmazione dei tempi della prova, identificando il momento o il periodo pi adatto per la somministrazione in un determinato ambiente o organizzazione (studio privato, scuola, azienda, ecc.). assolutamente sconsigliabile effettuare l'esecuzione delle prove durante le pause, il tempo libero o in alternativa ad altre attivit piacevoli. Bisogna evitare di sottoporre i soggetti al test senza adeguato preavviso; poich attraverso il test un soggetto potrebbe rivelare caratteristiche che preferisce non
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

rendere pubbliche, non pu essere sottoposto a test con l'inganno o senza che gli siano forniti chiarimenti su cosa il test misura e sull'uso che verr fatto dei risultati. Per tutelare i diritti di chi esaminato e nel rispetto della sua capacit di scelta, opportuno disporre del suo consenso informato. Per consenso informato si intende un accordo firmato da un individuo o dal suo rappresentante legale (genitori, ecc.) con il quale egli acconsente a sottoporsi al test e a fornire una serie di informazioni private e a che queste vengano usate per uno specifico scopo. Buona conoscenza del test Prima di procedere alla somministrazione necessario leggere accuratamente il manuale tecnico per acquisire familiarit con il contenuto del test e con le istruzioni. Una condizione ottimale si raggiunge provando ad autosomministrarsi il test e sperimentando la procedura di somministrazione con altri soggetti. Se si tratta di test individuali consigliabile imparare le istruzioni a memoria; nel caso di test collettivi, in cui le istruzioni vengono lette ed prevista l'illustrazione di alcuni item d'esempio, una familiarit con queste garantisce una migliore lettura (lenta e chiara) e di conseguenza una miglior comprensione, offrendo nel contempo un'immagine di buona professionalit. Un altro aspetto importante consiste nella preparazione del materiale. I fascicoli del test, i fogli di risposta e altro materiale vanno controllati e predisposti per tempo nel numero necessario. Condizioni ambientali Chi somministra il test deve assicurarsi che l'ambiente sia abbastanza tranquillo e confortevole. Tavolini, sedie, condizioni di illuminazione,temperatura e livello di rumore devono essere soddisfacenti. E in genere da preferirsi una stanza familiare agli esaminati e libera da probabili distrazioni. Durante la somministrazione importante eliminare ogni interruzione od ogni forma di disturbo che provenga dall'esterno (ritardatari, estranei, ecc.), adottando misure preventive. Impedire gli imbrogli Per evitare che i soggetti cerchino di ingannare si dovrebbero predisporre spazi sufficienti per ciascuno, distanziando opportunamente le persone. Poich non sempre possibile garantire che questo avvenga, al fine di evitare la tentazione di copiare opportuno ricorrere alla collaborazione di assistenti che possono avere un ruolo attivo nella distribuzione e nella raccolta del materiale e nel rispondere in modo concordato a richieste procedurali, assicurando in questo modo l'uniformit nella somministrazione del test. Rispetto delle istruzioni Quando si utilizzano test standardizzati assolutamente indispensabile che lo psicologo segua in modo accurato le istruzioni del test, anche quando si tratta di chiarire il compito richiesto agli esaminati.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Se non ci si attiene alle istruzioni si finisce per richiedere loro una prestazione diversa rispetto a quella che gli autori del test si sono proposti di rilevare. Rapporto esaminatore-esaminato A volte basta un semplice sorriso da parte dell'esaminatore per incrementare le prestazioni del soggetto. Pertanto un professionista ben addestrato dovrebbe essere in grado di creare una relazione positiva con i soggetti, in modo da ottenere da parte loro un livello di motivazione e di collaborazione elevato e un rigoroso rispetto delle procedure. Nella somministrazione dei test individuali pi facile che l'esaminatore sia in grado di cogliere nell'esaminato un abbassamento del livello di motivazione, o fenomeni di distrazione e di affaticamento. In tal caso egli dovrebbe mettere in atto dei tentativi e delle strategie per fronteggiare questi fenomeni o comunque prenderne nota per tenerne conto al momento della interpretazione dei risultati. Un atteggiamento amichevole, cordiale ma equilibrato rappresenta in ogni caso una condizione incoraggiante. Un simile comportamento favorisce infatti l'instaurarsi di una relazione positiva e di un clima che spinge il soggetto a rispondere il pi onestamente e accuratamente possibile. Somministrazione a soggetti problematici Doti di sensibilit e di pazienza da parte dello psicologo possono creare le condizioni pi favorevoli perch questi soggetti possano dare prova delle loro capacit. In situazioni di questo genere possibile adottare diverse strategie, quali: - dare pi tempo per rispondere alle domande; - fare un maggior numero di esempi di risposta agli item; - programmare sedute brevi di test; - rilevare indicatori di fatica e di ansia e tenerne conto nell'interpretazione dei risultati; - predisporre misure per ridurre le conseguenze di deficit visivi, uditivi o percettivomotori; - incoraggiare e rinforzare positivamente in modo generalizzato; - non forzare il soggetto a rispondere quando si sia ripetutamente rifiutato. Dopo la somministrazione del test Dopo la somministrazione di qualsiasi test, ma specialmente di quelli individuali, buona regola fornire rassicurazioni circa la performance dei soggetti, indipendentemente dai risultati conseguiti. Lo scoring Solitamente il costruttore del test fornisce nel manuale tutte le indicazioni circa le modalit di correzione e di valutazione delle risposte. Diverse case editrici di test forniscono a pagamento un servizio di scoring automatico, che prevede, oltre alla correzione del foglio di risposta, la costruzione di profili individuali e la relativa interpretazione con una breve relazione. Questa modalit di scoring risulta rapida e anche economica (con un lettore ottico collegato ad un computer appositamente programmato si possono correggere centinaia di fogli di risposta in breve tempo) e quindi particolarmente indicata quando si ha a che fare con grandi numeri di soggetti testati. La correzione tramite computer non completamente esente da possibili
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

errori, anzi raccomandabile ogni tanto un controllo dell'accuratezza dello scoring correggendo manualmente alcuni fogli di risposta e confrontando i punteggi attribuiti con quelli forniti dal computer come raccomandato negli Standards precedentemente citati. In qualsiasi caso la correzione tramite computer risulta molto pi precisa e sicura rispetto a quella manuale. CAP 6 : Linterpretazione dei punteggi Misurare in psicologia Misurare un processo di assegnazione di numeri ad oggetti in modo tale che le caratteristiche di questi ultimi siano fedelmente rappresentate dai numeri. Questa definizione pu ben essere adattata alla misura di caratteristiche psicologiche. In questo ambito per misura si intende l'assegnazione di un sistema di numeri a persone in modo tale che alcune caratteristiche di queste siano ben rappresentate dalle propriet del sistema numerico. Va tenuto presente che le misure psicologiche riguardano non certo la persona nella sua globalit, ma solamente alcune sue caratteristiche specifiche che possono essere rappresentate nei termini di particolari propriet dei numeri. Le differenze individuali Una delle pi frequenti obiezioni all'uso dei test psicologici riguarda l'esistenza di differenze anche notevoli fra gli individui e quindi l'impossibilit di una loro comparazione. In realt proprio l'esistenza di differenze individuali l'assunto teorico fondamentale delle misure psicologiche. La teoria su cui si basano i test presuppone che gli individui differiscano realmente e in modo relativamente stabile nei loro comportamenti, interessi, attitudini, valori, ecc. L'obiettivo dei costruttori di test di mettere a punto delle procedure per trasferire queste eventuali differenze psicologiche in differenze di tipo quantitativo e numerico; l'uso di numeri diversi servir a esprimere tali differenze. Secondo i presupposti teorici dei test, i comportamenti delle persone differiscono fra loro in modo rilevabile e potenzialmente misurabile e tali diversit persistono sufficientemente a lungo nel tempo in modo da rendere utili le loro misure. I test psicologici ci dicono solamente il modo in cui gli individui si assomigliano o sono differenti tra loro, senza esprimere dei giudizi di valore. A volte le differenze constatate sono cos piccole o particolari da avere un modesto impatto sulla vita delle persone; altre volte queste possono influenzare il loro grado di adattamento nei diversi ambiti della vita reale (scuola, lavoro, famiglia, ecc.). Le scale di misura Per scala di misura si intende un insieme di numeri (o simboli) le cui propriet rispecchiano le propriet empiriche degli oggetti alle quali sono stati assegnati dei numeri. Nel linguaggio dei test il termine scala sta anche ad indicare un gruppo di item di un test (o il test stesso) che valuta un determinato costrutto psicologico. Qui per lo si sta usando nel significato di sistema di misura. Una scala che serve per misurare una variabile continua viene chiamata scala continua; se misura una variabile discreta (che pu cio assumere un numero finito di valori) pu essere denominata scala discreta. Per esempio, una scala che permette di classificare i soggetti in relazione alla loro identit di genere (maschi e femmine) costituisce una scala discreta. Per contrasto,
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

una scala continua quando teoricamente possibile suddividerla in una serie di valori, in relazione agli obiettivi della misura. Va osservato che le misure effettuate con scale continue implicano sempre degli errori connessi con il tipo di strumento utilizzato. Un altro modo, pi comune, di categorizzare le diverse forme di misura riguarda la quantit di informazioni fornite dai numeri. In genere si distinguono 4 livelli o scale di misura che comportano differenti tipi di informazioni. Scala nominale La scala nominale la pi semplice forma di misura. Consiste nel classificare o categorizzare le persone sulla base di una o pi caratteristiche distintive rispetto alle quali esse vengono collocate in categorie mutuamente escludentesi ed esaustive. In questi tipi di misura i numeri con cui si identificano classi o categorie possono essere sostituiti da nomi o da etichette verbali o da simboli. Le uniche operazioni aritmetiche che possono essere legittimamente svolte sui dati raccolti con scale nominali comprendono il calcolo del numero dei casi (frequenze) inclusi in una categoria o classe ed eventualmente proporzioni e percentuali. Di conseguenza anche ridotta la quantit di elaborazioni statistiche che possono essere effettuate su dati di tipo nominale. Scala ordinale Anche le scale ordinali, come quelle nominali, permettono di effettuare delle classificazioni fra caratteristiche psicologiche, ma, oltre a ci, consentono di gerarchizzarle e di organizzarle secondo livelli di grandezza. Le scale ordinali specificano lungo un continuum delle differenze relative tra oggetti senza valutare la quantit assoluta delle differenze fra gli stessi. In altre parole esse non hanno uno zero assoluto e non dispongono di una unit di misura Pertanto le grandezze che intercorrono fra i diversi livelli della scala non sono omogenee e la distanza che separa, per esempio, il primo classificato dal secondo non uguale a quella che separa il terzo dal quarto, ecc. Scala a intervalli In aggiunta alle propriet delle scale nominali e ordinali, quelle a intervalli sono caratterizzate da un intervallo uguale tra i diversi valori in quanto dispongono di una unit di misura. Come le scale ordinali, anche quelle a intervalli non prevedono uno zero assoluto. Le uniche operazioni aritmetiche possibili sui dati di una scala a intervalli sono quelle dell'addizione e della sottrazione, e non quelle della moltiplicazione e della divisione a causa dell'assenza in essa di un punto zero fisso. Inoltre a simili dati sono applicabili tutte le operazioni del calcolo statistico (media aritmetica, deviazione standard, correlazione, ecc.) e quindi tutti i test statistici che si basano su di esse (test parametrici quali il t di Student, l'analisi della varianza, ecc.). Scala di rapporto Nelle scale di rapporto il punto zero non arbitrario, ma indica una assenza reale e totale di una qualsivoglia propriet misurata. Di conseguenza, qualsiasi misura si effettui con questo tipo di scale pu essere interpretata in termini di distanza dallo zero reale.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

le scale di rapporto compendiano in s le propriet di tutte le precedenti, con in pi la garanzia che i rapporti fra i valori scalari corrispondono a quelli fra le caratteristiche misurate. Le scale di rapporto sono, per, raramente utilizzabili in psicologia perch in questo ambito difficile identificare un punto zero che abbia un certo significato. Psicologia e statistica Che cosa ha a che fare la statistica con la psicologia e con i test? Dovrebbe essere ormai chiaro che i test producono misure e che queste sono espresse in numeri. La statistica offre un metodo per capire e interpretare questi numeri. Se la gamma dei punteggi, cio l'intervallo tra il minore ed il maggiore, molto ampia questi possono essere raggruppati secondo un certo intervallo di classe. Non esistono criteri univoci per definire in modo ottimale la dimensione di questi intervalli; essa viene lasciata alla valutazione di chi raccoglie i dati secondo principi di opportunit. Per migliorare la percezione di come si distribuiscono i dati, soprattutto quando sono abbastanza numerosi, possibile e consigliabile ricorrere a una rappresentazione grafica degli stessi, ottenendo una curva di distribuzione. Le pi comuni rappresentazioni grafiche sono costituite dagli istogrammi e dai poligoni di frequenza. L'istogramma formato da un insieme di colonne contigue corrispondenti ai singoli punteggi o ai diversi intervalli di classe e la cui altezza varia in funzione delle frequenze dei punteggi. Il poligono di frequenza costituito da una linea continua che congiunge i punti di intersezione tra i punteggi singoli o relativi agli intervalli di classe e quelli delle frequenze. La rappresentazione grafica dei dati attraverso istogrammi o poligoni di frequenza permette di rilevare visivamente quanto la distribuzione dei dati si avvicini o si allontani da quella espressa dalla curva normale o a campana. Una distribuzione di dati pu essere convenientemente descritta nei termini di alcune caratteristiche, quali la tendenza centrale e la variabilit. Misure della tendenza centrale Di fronte ad una distribuzione di dati a volte a noi serve stabilire qual il punteggio tipico, medio o centrale. A tale scopo una modalit operativa molto semplice consiste nell'identificare il punteggio che ricorre pi frequentemente. Questo viene chiamato moda e corrisponde al punto pi alto in un poligono di frequenza. Un'altra modalit per rappresentare un punteggio tipico costituita dalla mediana, cio da quel punteggio che separa in due parti eguali una distribuzione, la met pi alta da quella pi bassa. Nel caso in cui la distribuzione dei punteggi sia costituita da un numero pari, la mediana espressa dalla media dei due punteggi centrali. Nel nostro esempio di 33.5. Quando invece il numero dei punteggi da noi raccolti sia dispari, la mediana corrisponde al punteggio che divide la distribuzione in due parti uguali. Di conseguenza la met dei casi cade al di sopra di essa e l'altra met al di sotto. Il modo pi frequentemente usato per rappresentare la tendenza centrale di una distribuzione per costituito dalla media aritmetica, comunemente chiamata media.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Questa consiste nella somma di una serie dei punteggi divisa per il numero totale degli stessi.

Misure della variabilit Quando noi vogliamo descrivere una distribuzione di punteggi, la media non fornisce una indicazione sufficiente. Infatti due gruppi di soggetti in un test potrebbero ottenere lo stesso punteggio ma una pi ampia variazione nei punteggi individuali, cio una maggiore differenza e distanza tra il punteggio pi basso e quello pi alto. Questa dispersione dei punteggi intorno alla media viene definita variabilit. Una semplice misura di variabilit costituita dalla gamma (o range) dei punteggi di un gruppo e si calcola facendo la differenza tra il punteggio pi alto e quello pi basso. Tale misura piuttosto grossolana e poco utile poich molto influenzata dai due punteggi estremi, soprattutto se anomali.

Deviazione standard La misura di dispersione pi utile e pi frequentemente usata la varianza, che definita come la media aritmetica dei quadrati delle differenze tra i punteggi di una distribuzione e la loro media (scarto quadratico medio) il cui simbolo V. La misura di variabilit che si incontra pi frequentemente, per, la deviazione: standard, simboleggiata da DS o dalla lettera greca J. Essa usata comunemente per confrontare la variabilit di gruppi diversi di punteggi e per eseguire inferenze a grandi popolazioni a partire da misure effettuate in piccoli campioni. La deviazione standard fornisce informazioni su quanto la media rappresentativa della popolazione generale. Una piccola deviazione standard, come nella seconda curva, indica che i valori individuali tendono a raggrupparsi intorno alla media e quindi ci si pu basare con maggiore fiducia su quest'ultima come misura tipica. La deviazione standard sta a indicare il tipo di distribuzione dei punteggi, e si incrementa in proporzione al grado di dispersione degli stessi. Pi grande la deviazione standard e maggiore la variabilit fra gli individui. Come interpretare i punteggi di un test La somma delle risposte corrette date da un individuo agli item di un test cognitivo o, pi genericamente, il computo delle risposte individuali viene chiamato punteggio grezzo. Sia i punteggi grezzi sia quelli percentuali non possono essere chiaramente interpretati se non trasformati in misure ponderate pi chiaramente informative e riferibili a delle norme; cio devono essere messi in rapporto con la distribuzione dei punteggi ottenuta da un gruppo di soggetti chiamato campione di standardizzazione.

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

La standardizzazione Il concetto di standardizzazione implica due specifici significati: in un primo senso indica luniformit delle procedure di somministrazione del test e della determinazione del punteggio (scoring). b- un secondo significato si riferisce alla determinazione delle norme statistiche dei test. Per norma si intende la misura della tendenza centrale della distribuzione dei punteggi ottenuti dal campione di standardizzazione (media), ma anche la misura della variabilit, ossia di come tali punteggi (e le loro trasformazioni in punteggi ponderati presentate nei paragrafi successivi) complessivamente si distribuiscono intorno alla media.

a-

Tipi di campioni normativi Le norme di un test, in qualsiasi modo vengano espresse, sono limitate a una particolare popolazione di cui il campione normativo una rappresentazione. Le norme infatti non possono mai essere considerate assolute, permanenti e universalmente valide; al contrario ci si pu fidare di pi di parametri relativi a popolazioni specifiche, non troppo ampie, delle quali il campione di standardizzazione risulti effettivamente rappresentativo. Anche quando le norme riguardano una popolazione definita in modo ampio, molto utile poter disporre di manuali che riportino allo stesso tempo criteri specifici per sottogruppi, soprattutto quando gruppi ben identificati di soggetti tendono ad ottenere punteggi particolari in un dato test. Tali sottogruppi sono definiti sulla base del sesso, delle fasce det, del livello sociale e culturale, dellarea di residenza o in rapporto ad altri fattori. Le norme differenziate in base all'et sono costituite dal punteggio medio ottenuto in un test da soggetti aventi una determinata et cronologica. Quelle basate, invece, sul livello scolastico indicano il punteggio medio conseguito nel test dagli appartenenti ad una certa classe scolastica. Un'ulteriore possibile modalit di espressione dei valori normativi di un test rappresentata dalla cosiddetta et mentale, introdotta da Binet [1905] nella sua ben nota scala di intelligenza come criterio di valutazione del rendimento individuale. Si tratta di un tipo di norma alquanto diffuso nel campo della misurazione del livello intellettivo. Precisamente, il punteggio di et mentale di un soggetto corrisponde all'et cronologica del sottogruppo di soggetti (omogeneo per et) del campione di standardizzazione la cui prestazione nel test equivale a quella dell'esaminato. Nella scala di Binet [1905] e in quelle ad essa ispirate le singole prove sono raggruppate per livelli di et, per cui in corrispondenza di un dato livello di et mentale vengono riunite tutte le prove superate con successo dalla maggioranza degli individui aventi una determinata et cronologica Modalit di rappresentazione delle norme Le norme di un test rappresentano la prestazione ottenuta in esso dal campione di standardizzazione. Per stabilire pi precisamente l'esatta posizione del soggetto, il punteggio grezzo deve essere trasformato in una misura relativa. I punteggi cos ottenuti, indicando la posizione relativa del soggetto nel campione normativo,
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

permettono una valutazione della sua prestazione rispetto a quella degli altri soggetti; e inoltre costituiscono misure confrontabili, consentendo la comparazione dei punteggi ottenuti dal soggetto in test differenti, anche se questi utilizzano scale caratterizzate da unit di misura diverse. La pi elementare trasformazione dei punteggi grezzi quella di esprimerli in termini di percentuali di risposte corrette. Comunque anche trasformando i punteggi grezzi in punti percentuali rimane il problema del valore da attribuire a questultimi. Pertanto sia i punteggi grezzi sia quelli percentuali possono essere meglio interpretati solo se trasformati in scale pi chiaramente informative in quanto basate sulle medesime unit di misura e riferite a delle norme. Punti centili e ranghi centili Il pi semplice procedimento per effettuare confronti consiste nel disporre i punteggi grezzi in ordine di grandezza, dal pi piccolo al pi grande o viceversa. Se per si volesse operare un confronto fra le prestazioni di gruppi di soggetti numericamente diversi, tale procedimento non darebbe informazioni immediatamente interpretabili. Il valore di un rango per dipende dal numero dei dati di una distribuzione. II rango di 30, in una distribuzione di 60 dati, indica una posizione ben diversa dello stesso rispetto a una distribuzione di 90. Per ovviare a tale differenza i ranghi devono essere espressi in termini relativi e cio le graduatorie devono essere rapportate ad un identico numero, a un ipotetico gruppo di 100 soggetti. In psicometria questa operazione viene definita centilaggio o assegnazione dei gradi o ranghi centili o percentili (RC o RP). I termini centile opercentile vengono usati come inter-cambiabili. In altre parole, il rango centile di una misura indica la percentuale di punteggi che si colloca al di sotto di questa in una distribuzione di dati ordinati secondo una graduatoria. Modalit di calcolo del rango centile Per calcolare i ranghi centili si possono usare le seguenti 2 formule: dove: RC indica il rango centile; N indica il numero totale di punteggi o di soggetti; G indica il posto in graduatoria del soggetto. dove: RC indica il rango centile; X indica il punteggio grezzo di cui si cerca l'equivalente grado centile; L; indica il limite inferiore della classe di punti grezzi; i indica l'intervallo di classe; Se invece i punteggi su cui si lavora sono molti si tende a raggrupparli in classi attraverso una tavola di frequanza; in questo caso per calcolare i ranghi centili si usa la seguente formula:
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

dove: RC indica il rango centile; X il punteggio grezzo; Li il limite inferiore; i lintervallo della classe; Fi le frequenze della classe alla quale appartiene il punteggio; Fc le frequenze comulative al di sotto dellintervallo; N il numero totale di punteggi o di soggetti. i. I punti centili ii. Il punto centile non si identifica concettualmente con il rango centile. Esso viene definito come il punteggio in una scala di misure corrispondente ad un certo rango centile. Modalit di calcolo dei punti centile Per determinare un punto centile in una distribuzione di dati non raggruppati in classi si utilizza la formula seguente: Dove: p.p. indica la posizione del punteggio del centile cercato; C il centile; N il numero dei punteggi nella distribuzione. Nel caso in cui si volesse procedere a calcolare 1'80" punto centile in una distribuzione di dati raggruppati in intervalli di classe (vedi tab. 6.4) il procedimento si svolge attraverso i passaggi previsti dalla seguente formula: Dove: Cn indica il punteggio corrispondente al centile n; Xinf il limite inferiore reale della classe conteente il centile; n il centile cercato; N il num tot dei punteggi o soggetti; Fb la somma delle frequenze di tutte le classi inferiori a quella che contiene il centile; i indica lampiezza dellintervallo di classe che contiene il centile. L'uso dei ranghi centili Nella pratica dei test i punti o i ranghi centili sono frequentemente utilizzati per attribuire significato ai punteggi, anche se il loro uso presenta, accanto a degli indubitabili vantaggi, anche alcuni svantaggi non secondari che verranno analizzati qui di seguito.

Vantaggi I ranghi o i punti centili si possono calcolare con relativa facilit e permettono di conoscere la collocazione di un singolo punteggio in una determinata distribuzione. Inoltre rendono possibile il confronto fra punteggi inseriti in distribuzioni diverse di dati, caratterizzate da unit di misura differenti.

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Possono essere utilizzati per ogni tipo di test; infatti, diversi test per la valutazione sia delle attitudini sia di caratteristiche di personalit esprimono le relative norme in ranghi centili.

Svantaggi La trasformazione dei punteggi `grezzi in centili comporta anche alcuni limiti. Come gi stato detto, la distribuzione centilica costituisce una tipica scala ordinale. In base ad essa sappiamo se un punteggio superiore o inferiore ad un altro ma non di quanto, perch tale scala manca di un'unica unit di misura. In altre parole, diversamente dalla trasformazione dei punteggi grezzi in punti z (vedi par. 5.7), la conversione in centili non di tipo lineare, cio non conserva lo stesso tipo di distribuzione e di rapporti esistenti nei punteggi grezzi. I punti centili non sono in una relazione proporzionale con i punteggi grezzi. In sintesi, i centili danno un'idea precisa della posizione relativa del punteggio di un soggetto rispetto al campione, ma non dell'entit della differenza fra due punteggi. I punti Z La pi comune trasformazione di un punteggio grezzo, non altrimenti interpretabile, ottenuto da un singolo individuo quella che tiene conto dei risultati medi ottenuti in questo tipo di prova da un gruppo di soggetti con caratteristiche analoghe. punteggi ponderati ottenuti con questo tipo di trasformazione sono chiamati punti standard o punti z e possono essere considerati come valori di una scala a intervalli uguali, sui quali si pu operare matematicamente e statisticamente. La media viene assunta come origine della nuova scala di misura, mentre i singoli dati grezzi vengono espressi in scarti dalla media. Un punto z indica la differenza fra un punteggio grezzo e la media del gruppo divisa per la deviazione standard. In altre parole, un punteggio z indica di quante deviazioni standard il punteggio grezzo si scosta dalla media del gruppo, al di sopra o al di sotto della stessa. La formula per il calcolo di un punto z la seguente:

Dove: z inidca il punteggio standard; X il punteggio grezzo; X indica la media della distribuizione; DS inidca la deviazione standard della stessa distribuizione. Il punto z indica la posizione relativa del soggetto all'interno del suo gruppo di riferimento (punteggi positivi indicano prestazioni superiori alla media, mentre punteggi negativi indicano prestazioni inferiori ad essa), ma soprattutto offre la possibilit di fare dei confronti fra le prestazioni o i risultati conseguiti da uno stesso soggetto in test differenti. Poich i punti z possono assumere valori negativi ed essere accompagnati da decimali, molti costruttori di test li
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

hanno sottoposti ad ulteriori trasformazioni lineari che facilitino operazioni di calcolo e di interpretazione in modo da eliminare segni negativi e valori decimali.

Caratteristiche della curva normale La curva normale o di Gauss, caratterizzata da una maggiore concentrazione di dati al centro che vanno assottigliandosi verso gli estremi. Tale curva molto importante sia perch si ottiene anche quando si rappresentano eventi legati alla legge del caso, sia perch possiede importanti propriet matematiche. Le fondamentali propriet della curva normale sono le seguenti: 1) la distribuzione normale simmetrica, con un accumulo di valori al centro e una rarefazione degli stessi verso gli estremi; 2) in essa la media, la moda e la mediana si sovrappongono e coincidono nel punto in cui la curva raggiunge il suo massimo; 3) l'area sottostante la curva di una distribuzione normale considerata pari a 1. Pur trattandosi di una curva ideale, teorica, infinita, essa ha una grande utilit pratica, perch molte variabili indagate, e non solo in psicologia, hanno un andamento che tende a sovrapporsi a tale curva e quindi molte informazioni possono essere ottenute ricorrendo alle propriet della curva normale. Per avere una conoscenza completa di una distribuzione normale di dati basta identificare due valori: 1) il punto dell'ascissa (asse orizzontale) corrispondente alla sommit della curva (media); 2) la distanza a partire dalla media dei punti di flesso della curva, cio dei punti in cui la curva cambia di direzione, situati simmetricamente a destra e a sinistra (deviazione standard). In una curva di distribuzione normale esiste una esatta corrispondenza tra la deviazione standard e la proporzione dei casi che cadono nelle diverse porzioni in cui stata divisa l'arca sottostante la curva normale. La distribuzione normale ha media 0 e deviazione standard di 1. Larea sotto la curva Larea sottostante la curva costituisce il numero totale dei dati della distribuzione. Studi matematici hanno permesso di compilare delle tavole indicanti i valori della probabilit che un individuo preso a caso nella popolazione, in relazione ad un suo attributo, cada in una cerata area della curva. Ricorrendo a queste tavole risulta facile risolvere una quantit di problemi. Le tavole della distribuzione normale permettono, come abbiamo visto, di calcolare agevolmente la percentuale o la proporzione di dati o di punteggi che si trovano al di sopra o al di sotto di un determinato valore, o fra due valori in una distribuzione di misure supposta normale. Ovviamente l'uso delle tavole della distribuzione normale presuppone sempre la trasformazione dei punteggi grezzi in punteggi standard.

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

I percentili della distribuzione normale In una distribuzione normale esiste una precisa corrispondenza tra valori z e percentili. Avendo definito il percentile come quel punteggio al di sotto del quale si colloca una certa % di dati, 1'84 centile corrisponde al punto z = + 1 e indica che circa l'84% dell'area sottostante una curva normale cade alla sinistra di questo z. Poich z50 coincide con la media (o mediana) di una distribuzione normale, i punti z con valori inferiori a 50 presentano un segno algebrico negativo (infatti cadono alla sinistra dello z= 0), quelli con valore superiore a 50 porteranno segno positivo. Punti standard normalizzati I punti standard ricavati attraverso una trasformazione di tipo lineare permettono il confronto fra i punteggi ottenuti da uno stesso soggetto in test differenti solo se le distribuzioni di questi hanno una forma abbastanza uguale. Per cui un punto z di + 1 significa che il soggetto occupa la stessa posizione in entrambe le distribuzioni e che ha superato la stessa percentuale di soggetti in entrambi i test. Per nel caso in cui una distribuzione dei punteggi sia, decisamente asimmetrica e l'altra quasi normale potrebbe verificarsi che un punto z di + 1 superi il 60% dei casi in una distribuzione e l'80% nella seconda. Per permettere la comparazione di punteggi ricavati da distribuzioni non omogenee si convertono i punti standard in punti standard normalizzati. Questi sono espressi in una nuova scala che si approssima alla curva di distribuzione normale e nella stessa forma dei punti z trasformati linearmente con media pari a 0 e deviazione standard + o -1.

Come normalizzare i punteggi La normalizzazione delle misure consiste in una trasformazione forzata della distribuzione per avvicinarla a una di forma normale. Questa trasformazione viene definita non lineare o di area, e in essa i punteggi cambiano di significato. Il procedimento di normalizzazione si svolge attraverso i seguenti passaggi : 1) si dispongono i punteggi grezzi in ordine di grandezza crescente; 2) si riporta la frequenza di tali punteggi; 3) si calcolano le frequenze cumulative; 4) si calcolano i ranghi percentili di ogni punteggio grezzo col metodo della interpolazione lineare; 5) si trovano i punti z al di sotto dei quali, nella curva di distribuzione normale, cade una percentuale di valori pari ad ogni rango percentile . In definitiva, ai punteggi grezzi originari sono stati sostituiti i corrispondenti punti z della distribuzione normale aventi gli stessi ranghi percentili. Per calcolare il rango percentile di un punteggio grezzo con il metodo dell'interpolazione lineare si usa la seguente formula:

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Dove: Rp(Xi) indica il rango percentile di un punteggio Xi; Fco indica la frequenza cumulativa immediatamente inferiore al punteggio Xi; Fi indica la frequenza corrispondente al punteggio Xi; N indica il numero totale di soggetti. I punti T Se noi moltiplichiamo un punto standard normalizzato per 10 e il prodotto lo aggiungiamo a 50 otteniamo un punto T. Il punteggio di 50 infatti corrisponde alla media e quello di 10 alla deviazione standard della cosiddetta scala T ideata da McCall gi nel 1922 e cos chiamata in onore del suo professore E.L. Thorndike. Questo tipo di scala normalizzata offre il vantaggio di eliminare segni algebrici negativi e l'uso dei decimali. Per questo una delle pi utilizzate in campo testistico. Un'altra scala molto nota ed usata nella pratica dei test la stanine. Il nome deriva dalla contrazione di standard nine, in quanto la scala costituita da un sistema di numeri a una sola cifra la cui estensione va da 1 a 9. Essa caratterizzata da una media di 5 e da una deviazione standard di 2 per facilitarne l'impiego. Un vantaggio non indifferente offerto dai punti stanini, oltre alla facilit di calcolo, quello di permettere una immediata differenziazione dei soggetti grazie alla ridotta gamma dei valori utilizzati. Per questa ragione la scala stanine ha avuto frequenti applicazioni in molti test, soprattutto in quelli di profitto e di attitudine. I punteggi grezzi ottenuti in un test possono essere trasformati rapidamente in punti stanini ordinandoli secondo la loro dimensione e assegnando loro i punti stanini secondo le percentuali della curva normale.Tali procedure di normalizzazione dovrebbero essere utilizzate nel caso in cui il gruppo di soggetti sul quale si opera sia sufficientemente ampio da poter essere considerato anche rappresentativo, e quando la anormalit della distribuzione dei punteggi dovuta presumibilmente a fattori legati al test e non alle caratteristiche del campione esaminato. QI di deviazione I primi reattivi mentali, in particolare i primi test di intelligenza, utilizzavano norme riferite all'et per interpretare le prestazioni individuali. Fu ben presto chiaro per che era necessario convertire i punteggi riferiti all'et in un indice di sviluppo. Per esempio, i bambini di 6 anni che avevano un'et mentale corrispondente a 10 anni erano ovviamente superiori alla media, ma di quanto? C'era bisogno di indici che tenessero conto sia dell'et cronologica sia del livello di punteggio raggiunto (et mentale). Un espediente per ovviare a questa esigenza fu di dividere l'et mentale per l'et cronologica e produrre un quoziente. Il QI era definito dal rapporto fra et mentale ed et cronologica moltiplicato per 100 per eliminare i decimali dalla frazione. dove: QI indica il quoziente intellettivo; EM indica l'et mentale; EC indica l'et cronologica. Se l'et mentale corrisponde perfettamente all'et cronologica, il QI uguale a 100. Questo allora esprime la prestazione normale, mentre uno inferiore a 100 pu indicare
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

un ritardo di sviluppo e uno superiore un ritmo di sviluppo pi celere rispetto alla media. Nonostante l'indubbio vantaggio costituito dall'uso del QI di rapporto in quanto dava indicazioni sul ritmo di sviluppo dei soggetti, furono ben presto chiari alcuni limiti tecnici del QI di rapporto. Se, infatti, rispetto ad ogni fascia di et i QI hanno una propria distribuzione e una propria variabilit (DS) non sono pi confrontabili fra soggetti di et diversa. . Il QI non indica pi un rapporto fra et mentale ed et cronologica, ma stato sostituito quasi generalmente dal cosiddetto QI di deviazione, che una forma di punto standard in una scala di misure normalizzate caratterizzata da una media di 100 e da una deviazione standard di circa 15. I QI sono confrontabili tra loro se i test che li adottano attribuiscono lo stesso valore alla DS. Inoltre, i test presentano norme stabilite in tempi diversi e calcolate su campioni scelti spesso con procedure differenti. Queste differenze nelle procedure comportano variazioni nelle norme statistiche e, di conseguenza, nella distribuzione del QI di deviazione che i diversi test forniscono per specifiche popolazioni.

Confronto tra scale diverse Dal momento che ogni scala presentata adattata ad una curva di distribuzione normale, possibile passare dalluna allaltra in quanto tutte sono versioni diverse della medesima scala. I diversi tipi di scale normalizzate permettono di ottenere valori che prescindono dal particolare tipo di misura utilizzata in un test o in un lavoro di ricerca sperimentale, rendendo possibile il confronto fra prestazioni dello stesso individuo in test diversi e fra quelle di individui diversi in una stessa prova. Tutte le scale standard normalizzate presentano il vantaggio che la distribuzione di dati in esse conosciuta, in quanto corrisponde a quella della curva normale. A partire da un particolare punteggio normalizzato, si pu subito stimare la percentuale di dati che si trova al di sopra e al di sotto di esso; ci permette di interpretare e di dare un significato al corrispondente punteggio grezzo. I diversi sistemi di conversione presi in considerazione consentono di trasformare i punteggi grezzi in misure comparabili, anche se espresse in scale diverse.

Come assemblare i punteggi di test diversi E difficile trovare un unico test sufficientemente eterogeneo da permettere una inferenza su comportamenti abbastanza complessi. In tale situazione consigliabile ricorrere alla combinazione di alcuni test, omogenei al loro interno ma in grado di rilevare dimensioni diverse del comportamento-criterio da predire. Un insieme di test, differenziati per contenuti ma concorrenti alla previsione di un singolo criterio complesso, costituisce una batteria di test. Un problema che si incontra quando si utilizzano batterie di test concerne il modo di assemblare i punteggi ottenuti dai soggetti nei vari test per arrivare ad esprimerli in un indice unico, sulla base del quale effettuare confronti, formulare una graduatoria e prendere decisioni riguardanti singoli soggetti.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

I procedimenti pi comunemente usati al riguardo sono: 1) i punteggi discriminanti multipli; 2) la somma di punteggi z ponderati. Punteggi discriminanti multipli Una modalit per combinare (assemblare) i punteggi conseguiti in test diversi quella di utilizzare i punteggi discriminanti multipli. Questa procedura consiste nello stabilire un punteggio minimo discriminante, critico, per ciascun test inserito nella batteria. Non vengono presi in considerazione e quindi esclusi quei soggetti il cui punteggio cade al di sotto di questo punteggio minimo in uno qualunque dei test. Vengono accettati solo quelli che raggiungono o superano i punteggi soglia o critici in tutti i test della batteria. L'individuazione di punteggi attitudinali multipli per escludere chi non possiede requisiti minimi (multiple cut-off scores) viene operata sulla base delle correlazioni con il criterio, nonch delle medie prestazionali e delle deviazioni standard di individui impiegati in occupazioni specifiche. Somma di punteggi z ponderati I punteggi di diversi test non possono essere sommati tra loro per dare origine ad un solo indicatore complessivo in quanto tali strumenti misurano secondo una propria scala. Un criterio che potrebbe essere usato consiste nel porre linsieme dei test usati pari a 1 e quindi si decide quale test pi determinate ai fini della valutazione. La grandezza del coefficiente risponde ad una decisione dello psicologo sulla base della bibliografia esistente. A questo punto si trasformano in punti z, con media zero e deviazione standard 1, i punteggi grezzi conseguiti dai soggetti in ogni test e si moltiplicano per i pesi relativi loro assegnati. Si sommano poi i risultati di tali prodotti ottenendo dei punti standard ponderati che si presume possano distribuirsi normalmente. Di conseguenza possibile interpretarli sulla base delle propriet della funzione normale (media zero e deviazione standard + o - 1). CAP 7: Lattendibilit Nel linguaggio statistico l'attendibilit (o affidabilit) fa riferimento al grado di accuratezza e di precisione di una procedura di misurazione. Pi specificamente, un test si definisce attendibile, affidabile o anche quando i punteggi ottenuti da un gruppo di soggetti sono coerenti, stabili nel tempo e costanti dopo molte somministrazioni e in assenza di cambiamenti evidenti quali variazioni psicologiche e fisiche degli individui che si sottopongono al test, o anche dell'ambiente in cui questo ha luogo. Il concetto di affidabilit si comprende meglio se lo si inquadra in un continuum in cui i poli opposti sono una minima coerenza della misurazione e una perfetta replicabilit dei risultati. Le teorie psicometriche dell'affidabilit sono state sviluppate per stimare gli effetti dell'inattendibilit nella accuratezza delle misurazioni psicologiche. Il punto di partenza di quasi tutte queste teorie l'idea che i punteggi nel test riflettano l'influenza di due tipi di fattori: 1) fattori che contribuiscono alla coerenza dei punteggi, essenzialmente le caratteristiche stabili dei soggetti che si vogliono misurare; 2) fattori che contribuiscono all'incoerenza degli stessi, ossia le caratteristiche individuali o della situazione che comunque influenzano la misurazione ma che non hanno niente a che fare con le caratteristiche che si desiderano misurare.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

L'attendibilit di un test, quindi, esprime la misura in cui le differenze fra i punteggi di un gruppo di soggetti sottoposti allo stesso test in tempi diversi, o a versioni equivalenti dello stesso, possano essere attribuite a errori casuali nella misurazione o all'effettivo variare nei soggetti delle caratteristiche misurate. X=V+E dove X corrisponde al punteggio ottenuto nel test (punteggio osservato), V al punteggio vero, E all'errore di misurazione legato a fattori non controllabili. L'errore di misurazione quindi rappresenta la discrepanza tra il punteggio osservato e il corrispondente punteggio reale: E=X-V Per quanto ci si sforzi di ridurre al minimo l'errore di misura, una piccola percentuale di esso sempre presente in qualsiasi processo di misurazione.

Fonti di errori Di maggior interesse sono invece gli errori non sistematici o casuali, che possono riguardare caratteristiche legate alla persona testata, alla situazione in cui avviene la somministrazione, al contenuto del test, ecc. Gli errori causati da fattori come quelli sopra citati sono definiti casuali perch imprevedibili. Non possiamo conoscere il grado in cui questi influenzano le reazioni individuali a determinati item in determinati momenti. Tutto quello che ci dato di sapere che ogni fattore potrebbe influenzare le persone in maniera diversa e che quindi alcuni punteggi saranno sovrastimati in relazione al punteggio reale, mentre altri saranno sottostimati. L'ammontare della sovrastima o della sottostima l'errore: maggiore l'errore casuale nel punteggio di un test, minore la sua attendibilit. Gli errori di misurazione possono nascere da molteplici fonti [Feldt e Brennan 1989]. Sottolineiamo qui le pi importanti e quelle che servono al nostro scopo: la selezione degli item, la somministrazione del test, lo scoring del test, gli errori sistematici di misurazione.

La selezione degli item e la costruzione del test Una sorgente d'errore la costruzione dello strumento. La selezione degli item cruciale per l'accuratezza della misurazione. Anche nel caso di due test che vogliono misurare una stessa caratteristica alcuni item potrebbero sovrapporsi e altri differire nel modo in cui sono formulati o nel contenuto. Pertanto il campionamento degli item pu rappresentare una fonte di errore di misurazione. Ovviamente, in un test ben costruito l'errore di misurazione dovuto al campionamento degli item sar minimo.

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

La somministrazione Alcuni elementi legati alla applicazione di un test possono comunque agire come fattori derrore. Un'altra potenziale fonte di errore rappresentata dalle condizioni soggettive di chi si sottopone al test. Per esempio, lo stato di salute, le condizioni fisiche, l'affaticamento pregresso, l'ansia, il livello di motivazione, l'attenzione e la concentrazione, la presenza di problemi emotivi, ecc. Un'altra potenziale causa di errore potrebbe consistere nella presenza o nell'assenza di un esaminatore, dal suo aspetto fisico, dal suo comportamento (freddo, distaccato, minaccioso) e dal suo livello pi o meno alto di professionalit nella gestione della situazione. Lo scoring Se il formato di un test non prevede l'attribuzione del punteggio (scoring) con procedure automatizzate, si richiede una adeguata capacit nell'assegnazione del punteggio alle varie risposte. In genere la maggior parte dei test standardizzati presenta dei criteri ben definiti per la valutazione delle risposte, che riducono l'influenza delle soggettivit di giudizio.L'avvento dello scoring computerizzato ha virtualmente eliminato in molti test l'errore di misura dovuto alle differenze fra valutatori. Comunque la soggettivit nella fase di scoring pu costituire un problema serio nel caso si faccia ricorso ai test proiettivi. A questo proposito, Nunnally [1978] sottolinea che l'esaminatore con test proiettivi dovrebbe poter migliorare e sviluppare la propria abilit nell'utilizzo dei criteri di scoring con l'addestramento o con l'esperienza. Errore di misurazione e affidabilit L'errore di misurazione riduce l'affidabilit o replicabilit dei risultati di un test. Infatti l'affidabilit definita come indipendenza dall'errore casuale, cio in una precisa relazione statistica con l'errore di misurazione. Affidabilit e presenza/assenza dell'errore di misurazione sono due modi differenti per esprimere lo stesso dato: 1) l'errore di misurazione agisce sotto forma di influenza casuale. 2) la media degli errori di misurazione uguale a zero. Dato che si tratta di eventi casuali, gli errori di misurazione possono essere sia positivi sia negativi, tenderanno quindi ad eliminarsi vicendevolmente e ad essere uguali a zero se si in presenza di un campione molto ampio di soggetti. 3) i punteggi reali e gli errori non sono fra loro in correlazione. Infatti se i punteggi d'errore fossero in relazione con altri punteggi, sarebbero sistematici e non casuali. 4) gli errori di misurazione in test differenti non sono correlati fra loro. Sulla base di queste assunzioni stata sviluppata un'ampia teoria. Si sa che ogni test che viene somministrato ad un campione ampio di soggetti presenter una variabilit nei punteggi osservati: questa variabilit viene espressa statisticamente con il termine varianza (V). Secondo la teoria classica dell'affidabilit la varianza dei punteggi ottenuti (Vx) pu essere considerata come la somma della varianza dei punteggi veri (Vv) e della varianza dovuta agli errori di misura (Ve). Cio: Vx = Vv+ Ve Questa formula dimostra che i punteggi del test variano come risultato di due fattori: la variabilit dei punteggi reali e la variabilit degli errori di misurazione. La relazione che intercorre tra affidabilit di un test ed errore di misurazione viene
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

espressa da un coefficiente di affidabilit che rappresenta un indice della relativa influenza dei punteggi veri e d'errore sui punteggi totali del test (punteggi osservati). In termini matematici il coefficiente d affidabilit (rxx) il rapporto tra la varianza del punteggio reale e la varianza totale dei punteggi del test. La correlazione Il grado di attendibilit di un test non indica altro che il livello di correlazione esistente tra due distribuzioni di punteggi ottenuti dagli stessi soggetti nello stesso test, somministrato loro in tempi diversi, o in risposta a due versioni equivalenti dello stesso test. Pertanto viene espresso sotto forma di un coefficiente di correlazione, designato dal simbolo r e calcolato con la seguente formula, detta prodotto-momento, di Pearson:

dove: r indica il coefficiente di correlazione calcolato con la formula prodotto-momento di Pearson; xy indica la sommatoria del prodotto degli scarti di ogni punteggio della variabile x dalla rispettiva media e degli scarti di ogni punteggio nella variabile y dalla propria media; indica la radice quadrata del prodotto delle sommatorie dei rispettivi scarti dalla media al quadrato. Una formula apparentemente pi complessa ma decisamente pi facile da applicare in quanto utilizza i punteggi grezzi la seguente: dove: N indica il numero dei soggetti o delle coppie di osservazioni; indica la sommatoria dei valori che la seguono; Xa indica il punteggio dei diversi soggetti nella variabile A; Xb, indica il punteggio dei diversi soggetti nella variabile B. Il concetto di correlazione ha una notevole importanza nello studio dei test. Infatti il calcolo del relativo coefficiente, esprimendo il livello di corrispondenza fra due variabili, permette di rilevare come alcune caratteristiche psicologiche (tratti, abilit, interessi, ecc.) siano connesse con altri comportamenti. Da un punto d vista tecnico il coefficiente di correlazione rileva e registra le variazioni concomitanti fra una variabile indipendente (X) e una dipendente (Y) ed indica il grado in cui la variabile X e Y sono fra di loro correlate. Il livello di correlazione tra due variabili mutevole. Il valore del coefficiente infatti pu variare da + 1 a-1 passando attraverso lo 0. Quando il suo valore si avvicina a + 1 sta ad indicare una correlazione positiva quasi perfetta (un coefficiente di correlazione di + 1 possibile solo a livello teorico); se si avvicina a-1 la correlazione quasi perfetta, ma invertita, cio negativa. Un coefficiente vicino allo 0 riflette l'assenza di correlazione tra i dati, come potrebbe avvenire solo per caso.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Altri coefficienti di correlazione Il rho di Spearman Tale coefficiente usato frequentemente quando la dimensione del campione piccola (in genere minore di trenta coppie di misure o di osservazioni), e specialmente quando le due serie di misure sono di tipo ordinale. Il valore del coefficiente rho si avvicina nella maggior parte dei casi a quello dell'r di Pearson, ed esistono speciali tavole predisposte per stabilire se un coefficiente rho statisticamente significativo.

Lr biseriale Un coefficiente di correlazione biseriale (denotato dal simbolo rb) appropriato quando le due variabili che devono essere correlate (X e Y) sono continue in natura, ma una delle due stata arbitrariamente dicotomizzata. Poich esso una approssimazione dell'r di Pearson, necessario rispettare i requisiti per l'uso di quest'ultimo. Va per accettato un ulteriore assunto, e cio che la distribuzione della variabile continua sia unimodale e simmetrica (anche se non necessariamente normale), mentre quella dei valori dicotomizzati deve essere normale. Se entrambi questi presupposti non vengono rispettati, 1'r biseriale sar senza significato e nel calcolo si potrebbero ottenere valori superiori a + 1 o inferiori a - l.

Correlazione punto-biseriale Un r punto-biseriale un coefficiente di correlazione che si utilizza quando una variabile continua e l'altra una vera, e non arbitraria, dicotomia. Esempi di variabili realmente dicotomiche sono le categorizzazioni come maschio-femmina, residente in citt o in campagna, alfabetizzati o non, ecc. Non sempre le categorie dicotomiche possono essere cos ben definite come queste. La regola appropriato se la dicotomia ragionevolmente discontinua. Un vantaggio dell'r punto biseriale rispetto all'r biseriale che pu essere impiegato senza la condizione che la distribuzione della variabile dicotomica sia normale.

Correlazione tetracorica Denotato dal simbolo rt, l'r tetracorico usato quando le due variabili da correlare sono state arbitrariamente ridotte ad una dicotomia. Due assunti per il suo impiego sono che le due variabili X e Y siano linearmente connesse e che ciascuna delle loro rispettive distribuzioni sia normale. Gli statistici aggiungono, inoltre, che un coefficiente tetracorico di correlazione dovrebbe essere usato, per garantirne l'accuratezza, solo con grandi campioni (trecento o pi soggetti). Coefficiente phi Un coefficiente phi di correlazione appropriato quando le variabili costituiscono vere dicotomie. Tale coefficiente ha una speciale applicazione nello studio del grado in cui
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

l'item di un test discrimina correttamente due gruppi di soggetti rispetto a ci che il test si propone di misurare.

Il coefficiente di correlazione come coefficiente di attendibilit Uno degli utilizzi possibili del coefficiente di correlazione quello di segnalare la coerenza dei punteggi ottenuti dai test psicologici. Queste considerazioni introducono cos un metodo per stabilire l'attendibilit di un test: somministrare lo stesso reattivo due volte al medesimo gruppo di soggetti e calcolare la correlazione tra i due insiemi di punteggi. Tale approccio, chiamato test-retest, molto usato per valutare l'attendibilit di un test, ma esistono molte altre procedure per calcolarla. Tutti i metodi sono raggruppabili in due categorie distinte: 1) metodi che richiedono due somministrazioni di un test; 2) metodi che si basano su una sola somministrazione. Anche se le procedure sono diverse, occorre tener presente che un filo comune le unisce tutte: l'attendibilit sempre un tentativo di stabilire con quanta probabilit i risultati di un test siano replicabili o si avvicinino all'accuratezza desiderata.

Metodi che richiedono 2 applicazioni La stima della affidabilit di un test ha come obiettivo di determinare quanta parte della variabilit dei punteggi dovuta a errori di misura e quanta esprime una varianza vera. Il modello del re-test o del test parallelo una strategia per raggiungere tale scopo che comporta una duplice somministrazione.

Affidabilit come stabilit dei punteggi nel tempo La procedura pi diretta per valutare l'affidabilit di un test consiste nel somministrare lo stesso strumento allo stesso gruppo di soggetti per due volte di seguito con un predeterminato intervallo di tempo. Questo tipo di affidabilit, che rileva soprattutto la dimensione della stabilit dei punteggi nel tempo, viene chiamata attendibilit test-retest. La durata dellintervallo non un problema irrilevante, anzi potrebbe costituire una fonte di varianza d'errore dei punteggi. Infatti se il tempo che intercorre fra la prima e la seconda somministrazione dello stesso test troppo breve, i soggetti potrebbero rispondere nella seconda occasione ricordando le risposte fornite in precedenza. Ci farebbe aumentare notevolmente il coefficiente di correlazione fra le due prove, ma in modo artificiale e Spurio. D'altra parte anche un intervallo di tempo troppo lungo tra le due somministrazioni potrebbe creare delle difficolt. Dal momento che le persone cambiano nel tempo (acquisiscono nuove conoscenze, abilit, ecc.), le modificazioni intervenute tra la prima e la seconda prova potrebbero influire sulle prestazioni della seconda, riducendo il grado del coefficiente di correlazione. Infatti, con l'aumentare dell'intervallo fra le due prove, diminuisce il coefficiente di correlazione.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Affidabilit attraverso forme parallele dello stesso test Questo consiste nella elaborazione di due versioni o forme alternative o parallele dello stesso test, che devono risultare il pi possibile equivalenti fra loro in termini di contenuto, modalit di risposta e caratteristiche statistiche. Il metodo delle forme parallele per la valutazione dell'attendibilit implica i seguenti passaggi: 1) somministrazione di una versione del test (per esempio forma A) a un gruppo di individui; 2) successivamente, somministrazione di una forma parallela dello stesso test (forma B) allo stesso gruppo di soggetti; 3) correlazione fra i punteggi ottenuti nella forma A con quelli della forma B. Il coefficiente di correlazione cos ottenuto usato come indice della attendibilit del test. Tale procedura offre diversi vantaggi rispetto al metodo del test-retest, non escluso quello di poter disporre di due misure ravvicinate nel tempo di uno stesso costrutto psicologico e di una valutazione in tempi rapidi del grado di affidabilit di un test. Questo metodo, per, implica un problema di campionamento degli item e quindi una sorgente addizionale di varianza d'errore rispetto al test-retest. Anche se le due forme hanno una difficolt media uguale, alcuni soggetti potrebbero trovare pi facile o pi difficile l'una o l'altra perch si trovano ad affrontare item che si suppone siano paralleli. Si deve aggiungere che, se le due forme non venissero somministrate consecutivamente ma ad una certa distanza di tempo fra loro, alla fonte di varianza d'errore dovuta alla non perfetta omogeneit dei due contenuti si aggiungerebbe una suppletiva sorgente di varianza legata al tempo. Inoltre, le forme parallele di un test sono molto costose, dato che raddoppiano i costi della sua pubblicazione e commercializzazione, oltre che aumentare le difficolt di tipo psicometrico per riuscire a produrre forme realmente parallele.

Metodi basati su una singola somministrazione Per ragioni pratiche ed economiche la affidabilit di un test pu essere calcolata anche con una singola somministrazione dello stesso. A tale scopo sono state elaborate diverse procedure. Una di queste consiste nel dividere in due parti gli item del test e nel correlarne i relativi punteggi (affidabilit split-half o per divisione a met del test). L'altra procedura consiste nel considerare ogni item del test come un test formato da un singolo item in modo che il test totale possa essere considerato un insieme di test paralleli anche se molto brevi. Ci permette di calcolare la correlazione fra i punteggi dei diversi item e pertanto la coerenza interna del test. In questo modo possibile controllare se tutti gli item di un test tendono a misurare lo stesso costrutto psicologico. Affidabilit split-half (o per divisione a met del test) Una stima dell'attendibilit con il metodo split-half si ottiene correlando i punteggi ottenuti da un gruppo di soggetti in due met di un singolo test, somministrato
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

un'unica volta. Questa procedura, infatti, viene usata quando si vuole evitare una doppia somministrazione dello stesso test per ragioni di tempo o di costi o quando una replicazione potrebbe generare effetti indesiderabili. Poich il test viene diviso in due met comparabili, risulta evidente che una simile attendibilit fornisce una misura della coerenza interna e riguarda il campionamento degli item. Il calcolo del coefficiente di affidabilit split-half generalmente prevede i tre seguenti passaggi: 1) divisione del test in due parti equivalenti; 2) calcolo del coefficiente r di Pearson fra i punteggi conseguiti dai soggetti nelle due parti; 3) correzione dell'affidabilit con la formula di SpearmanBrown [Spearman 1927]. La divisione del test in due parti equivalenti presenta delle difficolt. La semplice divisione in una prima e in una seconda parte non consigliabile; nel caso di test i cui item sono ordinati secondo livelli di difficolt crescenti, la prima parte risulterebbe pi facile e quindi non equivalente alla seconda. Inoltre, i punteggi nella seconda parte potrebbero essere alterati da effetti dovuti alla stanchezza e alla noia. Una modalit accettabile quella di dividere il test assegnando casualmente gli item all'una o all'altra. La pi utilizzata, per, quella di dividere il test in item pari e in item dispari (attendibilit pari-dispari). Successivamente si calcola il coefficiente di Pearson fra i punteggi ottenuti nelle due met cos predisposte. L'aumento o la riduzione del numero di item modifica il livello di affidabilit di un test e la formula generale per stimarne il nuovo coefficiente di fedelt la seguente: dove; il nuovo coefficiente di affidabilit (cio del test allungato o accorciato); il coefficiente di affidabilit del test originale calcolato con la formula di Pearson; n indica di quanto il test stato allungato o accorciato (cio il numero delle volte) e si ottiene dividendo il numero degli item del test allungato o accorciato per il numero degli item della versione originale. Poich con la procedura split-half come se si ottenesse la fedelt di met test, volendo stimare l'affidabilit del test intero sar necessario attribuire ad n, nella formula di Spearman-Brown, il valore di 2 in quanto come se il test venisse raddoppiato. Pertanto la formula da utilizzarsi la seguente:

dove: il coefficiente di affidabilit stimato dell'intero test; indica il coefficiente di correlazione fra i punteggi ottenuti negli item pari e negli item dispari del test. La formula generale di Spearman-Brown pu anche essere utilizzata per stabilire il numero di item necessari ad ottenere un nuovo, desiderato livello di affidabilit. Infatti da essa possibile derivarne algebricamente un'altra per conoscere n, cio di quante volte si deve allungare un test che ha un determinato coefficiente di affidabilit per ottenerne uno pi elevato:
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

dove: n indica il numero delle volte che il test originario deve essere allungato; il coefficiente di fedelt che si desidera ottenere; il coefficiente di fedelt del test originario. Va considerato che quando il livello di affidabilit di un test abbastanza alto, necessario un considerevole aumento della lunghezza del test per ottenere un modesto aumento nella affidabilit.

Altri metodi per la valutazione della coerenza interna Per coerenza interna (inter-item consistency) si intende il grado di correlazione fra tutti gli item di una scala. Essa corrisponde alla misura della affidabilit basata sulla coerenza delle risposte ai singoli item del test e rappresenta un indice della omogeneit degli item del test. Un test pu essere considerato omogeneo se gli item che lo compongono misurano un singolo tratto o fattore, eterogeneo se composto da item che misurano pi di un fattore, pertanto pi un test omogeneo e maggiore sar la sua coerenza interna. Anche se preferibile utilizzare test omogenei perch pi facilmente e chiaramente interpretabili nei loro risultati, questi sono insufficienti per misurare variabili psicologiche complesse come, per esempio, l'intelligenza o la personalit. Un modo per aggirare questa difficolt consiste nel somministrare una serie di test omogenei ognuno dei quali valuta aspetti diversi di una variabile eterogenea e complessa.

La formula di Kuder-Richardson Essi approntarono numerose formule a tale scopo ma quella pi usata nel campo psicometrico va sotto il nome di KR20. Applicata a test i cui item sono molto omogenei, la KR20 offre valutazioni molto simili a quelle ottenibili con lo split-half. Comunque essa pi adatta per valutare la coerenza interna di test formati da item dicotomici, soprattutto quando questi prevedono che le risposte possano essere valutate come giuste o sbagliate. Nel caso di test con item molto eterogenei, la KR20 d valutazioni dell'affidabilit inferiori rispetto a quelle ottenibili con lo split-half. La formula KR20 la seguente: dove: indica il coefficiente di affidabilit KR20 di Kuder-Richardson; K indica il numero degli item del test; indica la varianza dei punteggi dell'intero test; indica la sommatoria del prodotto, per ogni item del test, della proporzione dei soggetti che hanno dato risposte corrette (p) e di coloro che hanno dato risposte sbagliate (q).
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Uno sviluppo della KR20 rappresentato dalla KR21, che pu essere usata quando ci sono buoni motivi per credere che gli item di uno specifico test abbiano approssimativamente lo stesso grado di difficolt.

dove: il coefficiente di affidabilit KR21; K il numero degli item; la media dei p ogni item (proporzione dei soggetti chehanno dato risposta esatta all'item) la media dei q ogni item (proporzione dei soggetti che hanno dato risposta errata all'item) Questa formula pu essere semplificata, per facilitare i calcoli, nella seguente: dove: indica la media dei punteggi totali del test. Tale formula, rispetto alla precedente KR21, rappresenta una rilevante semplificazione, richiedendo solamente il calcolo della media e della varianza dei punteggi totali del test. Il coefficiente alpha La sua formula stata messa a punto da Cronbach nel 1951 e successivamente rielaborata da altri psicometristi. Il coefficiente alpha potrebbe essere considerato come la media di tutti i possibili coefficienti split-half corretti con la formula di Sperman-Brown. Mentre, come abbiamo detto, la KR20 adatta a test con item dicotomici, il coefficiente alpha al contrario pu essere usato in modo appropriato per test con item che prevedono risposte con pi di due alternative.

dove: indica il coefficiente di affidabilit; K indica il numero degli item; indica la sommatoria della varianza dei punteggi ottenuti in ogni item; indica la varianza dei punteggi totali. Come tutti i coefficienti di affidabilit, il coefficiente a pu assumere valori che vanno da .00 a + 1,00. Si pu quindi ritenere che il coefficiente alpha un indice del grado in cui un test misura un singolo fattore. I test eterogenei, cio che misurano pi di un tratto, produrranno invariabilmente coefficienti alpha bassi. I test omogenei e monofattoriali tenderanno ad avere coefficienti alpha elevati. Per questa ragione, tale coefficiente considerato un indice della coerenza interna di un test. Misure di affidabilit fra correttori Una fonte di varianza d'errore nella valutazione dei risultati in un test pu essere rappresentata da chi attribuisce i punteggi. Alcuni test riservano un elevato margine al giudizio dell'esaminatore per quanto
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

riguarda l'assegnazione dei punteggi. Molti test proiettivi rientrano in questa categoria, cos come i test di creativit. A questo punto colui che attribuisce i punteggi, cio il valutatore (scorer), potrebbe costituire una delle maggiori sorgenti di errore, che mette a rischio l'affidabilit dello strumento. Per questo risulta assolutamente necessario un rapporto di affidabilit tra scorers. Calcolare l'affidabilit tra scorers una procedura abbastanza semplice. Due (ma anche pi) correttori assegnano punteggi ad un campione di protocolli indipendentemente l'uno dall'altro e, successivamente, si correlano tali punteggi, accoppiandoli. Pi alto il coefficiente di correlazione ottenuto, minore la varianza d'errore legata ai criteri di attribuzione dei punteggi ed alla soggettivit dei valutatori. Un altro approccio per ottenere una stima dell'affidabilit costituito dall'uso del coefficiente Kappa. La statistica K stata inizialmente utilizzata per valutare la affidabilit del test quando i valutatori si servivano di strumenti di misura a livello di scala nominale. Tale statistica stata successivamente modificata da Fliess per un uso con pi valutator ed stata generalmente riconosciuta valida come misura della affidabilit fra valutatori. La formula la seguente: dove: indica il coefficiente di affidabilit; la proporzione di giudizi concordanti tra i giudici; la proporzione di giudizi casualmente concordanti.

Esempio di analisi delle fonti di varianza derrore in un test Il coefficiente di affidabilit di un test pu essere interpretato come percentuale di varianza dei punteggi dovuta a varie cause. Occorre per tener presente che il quadrato del coefficiente di correlazione che esprime la proporzione di varianza dei punteggi di un test. Pertanto la proporzione di varianza vera data dal quadrato della correlazione tra i punteggi nel test e i punteggi reali, cio scevri da errori casuali. Questa correlazione, definita indice di affidabilit, equivale alla radice quadrata del coefficiente di attendibilit del test. Elevando al quadrato tale indice si ottiene il coefficiente di attendibilit immediatamente interpretabile come percentuale di varianza vera.

Uso e interpretazione dei coefficienti di attendibilit Come si visto, ci sono fondamentalmente tre approcci per stimare l'attendibilit: la procedura test-retest, l'uso di forme parallele e la coerenza interna o fra item. I metodi da usare variano in funzione di diversi fattori, soprattutto dipendono dall'obiettivo del controllo dell'affidabilit e dalla natura del test.

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Obiettivo del coefficiente di affidabilit Se un test stato costruito per essere somministrato pi di una volta a distanza di tempo dovrebbe dimostrarsi stabile nel tempo; in tal caso appropriata la procedura test-retest per la verifica della sua attendibilit. Se invece esso stato progettato per una singola somministrazione, dovrebbe essere valutato il livello di coerenza interna. Il vantaggio di questa procedura costituito dalla sua praticit. Poich necessaria una singola somministrazione, possibile valutare l'attendibilit ogni volta che il test viene applicato. Per i test che si propongono di rilevare una sola dimensione psicologica (monofattoriali, vedi pi avanti l'analisi fattoriale), diventa utile e indispensabile il coefficiente alpha. Al contrario, per i test complessi dal punto di vista fattoriale, come le misurazioni generali dell'intelligenza, non si ricaverebbe molto dalle misurazioni relative alla coerenza interna del test nel suo complesso. Quindi, tale coefficiente non pu essere un indice della affidabilit appropriato per tutti i test, ma si applica solamente a quelle misurazioni che sono state sviluppate per poter rilevare una sola dimensione o un singolo fattore. Nel caso di test multifattoriali potrebbe per essere utilizzato per rilevare la coerenza interna degli item raggruppati nei singoli fattori o subtest. I metodi split-half funzionano bene per quegli strumenti che sono costruiti con item ordinati gerarchicamente secondo il loro livello di difficolt. Grazie al supporto del computer, il calcolo del coefficiente alpha diventa molto semplice e pu essere ricalcolato ogni volta che si usa il test in una nuova situazione o per una popolazione particolare. Va tenuto presente, per, che la coerenza interna non esprime necessariamente l'affidabilit di un test, ma che questa dipende, pi che dai punteggi stessi, da ci che si intende fare con essi.

Caratteristiche del test Oltre all'obiettivo e all'uso del coefficiente di attendibilit opportuno tenere in considerazione alcune caratteristiche specifiche del test quali: Omogeneit o eterogeneit degli item di un test. Se un test possiede item omogenei in quanto stato progettato per misurare un unico fattore o tratto o una singola abilit dovrebbe presentare un alto. coefficiente di coerenza interna. Nel caso contrario logico aspettarsi un minor livello di coerenza interna rispetto a una affidabilit test-retest che rappresenta una procedura pi adeguata. Caratteristiche psicologiche dinamiche o statiche. Esiste una relazione fra la stima della attendibilit di un test e le caratteristiche psicologiche misurate che possono essere pi o meno stabili nel tempo. Alcune caratteristiche sono in continuo cambiamento in relazione a variabili situazionali o ad esperienze cognitive e/o fisiologiche (per esempio la reattivit emotiva misurata dalla risposta elettrocutanea o l'ansia di stato, ecc.). Se si presume che la caratteristica psicologica possa variare per motivi situazionali in momenti diversi di assessment, allora la stabilit test-retest di scarso aiuto, mentre il miglior risultato circa la affidabilit di uno strumento si pu ottenere attraverso una misura della coerenza interna degli item. Al contrario, se'si pu presumere che una caratteristica sia relativamente stabile nel tempo (come l'inOPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

telligenza), l'affidabilit test-retest, e quella attraverso forme parallele, rappresentano i metodi pi adeguati. Gamma ristretta di soggetti. Il coefficiente di attendibilit, come si gi detto, indica con quanta coerenza un test colloca ogni individuo in relazione agli altri all'interno di un gruppo. Quando ci sono piccoli spostamenti dal test al retest o nella somministrazione di forme parallele il coefficiente di affidabilit alto e viceversa. Test di velocit. Un test di potenza, come stato detto in precedenza, pur prevedendo un tempo di somministrazione sufficiente per rispondere a tutti gli item, presenta tali difficolt che nessun soggetto possa ottenere il punteggio pieno. Al contrario, un test di velocit contiene generalmente item con un uniforme e relativamente basso livello di difficolt. Generalmente per il tempo concesso tale da permettere solo a pochi di completarlo. La procedura pi adatta per valutare l'affidabilit di un test di velocit dovrebbe basarsi sul test-retest, su forme parallele o sullo split-half in cui le due met del test vengano per somministrate in due momenti diversi. In tal caso necessaria una correzione del coefficiente di fedelt con la formula di Spearman-Brown. Lunghezza del test. Un altro fattore che ha influenza sulla fedelt del test rappresentato dalla sua lunghezza. A parit di altre condizioni, pi un test lungo e pi affidabile. Quando un test corto ci sono pi possibilit di errori casuali nelle risposte dei soggetti, con il risultato di aumentare o diminuire la stima del punteggio vero.

Test criteriali I test criteriali si distinguono da quelli normativi poich forniscono una indicazione del livello di prestazione di un soggetto rispetto ad un obiettivo o criterio, sia in campo educativo che in quello professionale. Gli item sono costruiti in modo tale da rilevare se un certo traguardo stato raggiunto oppure no.Il contenuto del test strutturato secondo livelli gerarchici di abilit e le risposte ai singoli item possono essere utilizzate per diagnosticare ambiti in cui il soggetto evidenzia delle carenze sulle quali eventualmente intervenire.Per quanto riguarda il calcolo della affidabilit di simili test non ci si pu avvalere delle procedure tradizionali poich queste sono basate sulla variabilit dei punteggi dei soggetti.Se i punteggi vengono utilizzati come obiettivi di apprendimento e ogni soggetto continua a esercitarsi fino a raggiungere il livello di abilit prestabilito, la variabilit nei punteggi dei soggetti sar praticamente nulla ed per questa ragione che le tecniche tradizionali di valutazione dell'affidabilit sono inadeguate. Un approccio che pu essere utilizzato quello derivato dalle ricerche di Lindeman e Merenda. La formula la seguente:

dove: il coefficiente di affidabilit di un test criteriale; n il numero dei soggetti che non raggiungono il criterio in entrambe le somministrazioni; b il numero di soggetti che raggiungono il criterio in entrambe; f il numero di soggetti che raggiungono il criterio solo nella prima;
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

s i soggetti che lo raggiungono solo nella seconda; v il valore pi basso fra quelli raggiunti da f e da s.

Interpretazione del coefficiente di affidabilit Diversi autori suggeriscono che il coefficiente dovrebbe essere almeno di .90 quando un test viene utilizzato per prendere decisioni riguardanti gli individui. Non esistono comunque risposte sicure e facili a una simile domanda. Guilford e Fruchter [1978] ritengono che, quando un test destinato alla misurazione delle differenze individuali di alcune caratteristiche, dovrebbe presentare una affidabilit non inferiore a .90, anche se molti test standardizzati con coefficienti di affidabilit inferiori, oscillanti intorno a .70, si sono dimostrati applicativamente molto utili. In alcune ricerche pubblicate sono stati utilizzati test con gradi di affidabilit ancora minori. In pratica un livello accettabile di affidabilit dipende dall'ammontare dell'errore di misurazione che si disposti a tollerare nell'applicazione di un determinato test. Affidabilit ed errore di misurazione sono concetti fra loro collegati, per cui se lo psicologo in grado di stabilire un livello accettabile di errore di misurazione allora anche possibile determinare il livello minimo di attendibilit richiesta per quella particolare applicazione di un test.

L'errore standard di misura Una modalit per intendere adeguatamente il coefficiente di affidabilit consiste nel tener presente la relazione fra quest'ultimo e l'errore standard di misura. Per errore standard di misura si intende la deviazione standard di una serie di punteggi che si otterrebbe sottoponendo pi volte un soggetto a uno stesso test (assumendo che non si verifichino effetti di apprendimento, di familiarit, ecc.). L'errore standard di misurazione pu essere calcolato, conoscendo l'affidabilit di un test, con la seguente formula: dove: indica l'errore standard di misura; DS indica la deviazione standard del test; indica il coefficiente di affidabilit del test. Vedi pag 74 e 75 In pratica l'errore standard di misura, che espresso in unit di punteggi in un test, il pi frequentemente usato per interpretare il punteggio ottenuto da un singolo individuo in un test piuttosto che per confrontare i punteggi ottenuti in test differenti, che in genere utilizzano unit di misura diverse. In questo caso il coefficiente di affidabilit costituisce usualmente la sola base soddisfacente per comparare test. A parit di altre condizioni, un test con pi alto coefficiente di affidabilit permette di formulare una pi sicura e coerente graduatoria degli individui all'interno del gruppo e quindi dovrebbe essere preferito. Lerrore standard della differenza tra i punteggi
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Per errore standard della differenza tra due punteggi si intende una misura statistica che permette di stabilire quanto grandi debbano essere le differenze fra due punteggi perch possano essere considerate statisticamente significative e non puramente casuali. L'errore standard della differenza fra due punteggi un procedimento statistico appropriato per sapere: 1) se esistono differenze fra i punteggi ottenuti dallo stesso soggetto in due test diversi; 2) se esistono differenze nei punteggi ottenuti nello stesso test da due soggetti diversi; 3) se esistono differenze nei punteggi ottenuti da due diversi soggetti in differenti test. La formula per calcolare l'errore standard delle differenze fra due punteggi la seguente: dove: l'errore standard della differenza fra due punteggi; il quadrato dell'errore standard di misura del primo test, corrispondente alla varianza d'errore; il quadrato dell'errore standard di misura del secondo test, equivalente alla varianza d'errore. Si assume che i due punteggi si riferiscano o siano stati convertiti in una stessa scala, cio che i due test abbiano la stessa media e la stessa deviazione standard in un campione normativo. Sostituendo i coefficienti di affidabilit all'errore standard di misura dei due diversi punteggi, la formula diventa:

dove: l'errore standard della differenza fra due punteggi; DS la deviazione standard; il coefficiente di affidabilit del primo test; il coefficiente di affidabilit del secondo test. L'errore standard della differenza fra due punteggi maggiore rispetto all'errore standard di misura dei singoli punteggi, perch il primo dipende dagli errori di entrambi i punteggi.

La generalizzazione dei punteggi di un test La teoria della generalizzabilit avanzata da Cronbach rappresenta un approccio alternativo alla valutazione della coerenza dei punteggi di un test. Nella teoria classica dell'attendibilit la domanda centrale era: Quanto errore casuale c' nelle misure?. Nella teoria della generalizzabilit il punto cruciale concerne la possibilit di generalizzare da un insieme di punteggi ad un altro gruppo di plausibili misure. La domanda centrale della teoria della generalizzabilit questa: Quali sono le condizioni nelle quali si pu generalizzare?; oppure: In quali condizioni ci si pu aspettare
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

risultati simili o differenti da quelli ottenuti?. La teoria della generalizzabilit affronta questo problema con la ricerca sistematica delle fonti di coerenza e di incoerenza dei punteggi. La teoria della generalizzabilit oggetto di svariate ricerche e tende ad essere applicata in diversi campi di indagine. Il maggior vantaggio di essa rispetto a quella classica forse pi concettuale che statistico: essa induce a pensare all'attendibilit come ad una caratteristica dell'uso dei punteggi del test piuttosto che ad una caratteristica dei punteggi in se stessi. Essa riconosce che si possono prendere spesso decisioni pi affidabili circa le prestazioni relative degli individui, piuttosto che nella valutazione del loro livello assoluto in un certo attributo. Un altro vantaggio di essa che permette di fornire risposte ad una variet di domande pratiche a cui la teoria classica non era in grado di rispondere. La teoria della generalizzabilit potrebbe essere utilizzata per stabilire quale combinazione di persone e di domande potrebbe fornire le valutazioni pi attendibili. Secondo Cronbach et al. [1972] la teoria classica dell'affidabilit (che, come abbiamo gi detto, divide i punteggi del test nel punteggio vero e in quello dovuto ad errore casuale) semplicemente un caso particolare della teoria della generalizzabilit. La differenza fra le due che l'approccio della generalizzabilit riconosce che l'errore non sempre casuale e che spesso utile per identificare fonti specifiche, sistematiche di incoerenza nella misurazione. La teoria della generalizzabilit identifica sia le fonti sistematiche sia quelle casuali di incoerenza che possono contribuire a generare errori. La teoria classica probabilmente pi utile in situazioni in cui test ben costruiti sono somministrati in modo altamente standardizzato. I metodi pi complessi collegati con la teoria della generalizzabilit sono pi utili quando le condizioni in cui si effettua la valutazione probabile che influenzino i punteggi del test o quando tali punteggi vengono usati per scopi diversi. Se i punteggi differiscono sistematicamente secondo quando, dove o come il test viene somministrato, queste differenze influenzano la generalizzabilit dei punteggi. Queste non sono tuttavia fonti casuali di errore e le teorie psicometriche che le trattano come tali portano a conclusioni errate. CAP 8: La validit Per validit di un test si intende il grado di precisione con cui un test misura ci che si propone di misurare. Coloro che sviluppano i test hanno la responsabilit di dimostrare che i nuovi strumenti rispondono agli scopi per cui sono stati costruiti. La validazione di un test un processo che comincia con la sua costruzione e continua quasi ininterrottamente. responsabilit di chi lo costruisce riportare nel manuale dati che dimostrino l'evidenza della validit basata sui punteggi ottenuti in una serie di situazioni diverse. In pi, pu essere utile che chi usa il test realizzi proprie verifiche (validazioni locali). Due dei principali problemi della misurazione psicologica effettuata attraverso i test consistono nel determinare se un test valuta effettivamente ci che si suppone che valuti, e se pu essere usato per prendere decisioni appropriate. Diverse forme di validit: 1) la validit di contenuto; 2) la validit di costrutto; 3) la validit in rapporto a un criterio.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Questi tre aspetti non sono tra loro reciprocamente esclusivi, anzi tutti concorrono nel determinare l'evidenza della validit dello strumento, a dare una immagine unificata della sua validit, anche se chi usa il test pu essere interessato a controllarne uno solo in funzione di uno specifico obiettivo. Le strategie di valutazione del contenuto e del costrutto servono a determinare se un test fornisce una valutazione precisa di uno specifico attributo o tratto, e definiscono la validit in termini di misurazione. Invece la validit rispetto ad un criterio definisce tale propriet in termini di decisioni: un test valido se pu essere usato per prendere delle decisioni accurate. Validit esteriore o di facciata Questa forma di validit concerne quanto convincenti e rilevanti appaiono le prove che il soggetto deve affrontare. Spesso i test sono costruiti senza tener presente questo aspetto importante. I risultati in termini di motivazione e quindi di qualit delle risposte dei soggetti possono cambiare notevolmente, quindi gli item non devono apparire assurdi. La validit di facciata di un ha un ruolo non secondario nell'influenzare il livello motivazionale di chi risponde a un reattivo, modificandone quindi la prestazione. Anche per chi applica il test una buona validit di facciata pu essere importante perch pu contribuire ad aumentare la sua fiducia nel test stesso. Validit di contenuto La validit di contenuto riguarda quanto le prove o gli item del test riflettono e rappresentano il comportamento che il test vorrebbe valutare. Si pu avere un'idea approssimativa del contenuto analizzando solamente gli item del test: se il contenuto di questi si riferisce a ci che si suppone che il test misuri, si pu avere una certa garanzia che il test presenti validit di contenuto. Oltre a questo requisito di rappresentativit, anche la chiarezza e la non equivocit concettuale della formulazione degli item pu contribuire alla validit complessiva del contenuto di un test. Gli item di un test costituiscono un campione tratto da una pi ampia popolazione di item potenziali, che definiscono ci che il ricercatore desidera realmente valutare. Se tale campione (gli item del test) rappresentativo della popolazione, allora il test presenta una soddisfacente validit di contenuto. Per campionare correttamente gli item da inserire in un test occorre definire il campo di contenuto. Quest'ultimo rappresenta la serie totale di comportamenti che potrebbero essere usati per valutare una specifica caratteristica psicologica o comportamentale. Sfortunatamente, per, alcuni campi di contenuto hanno un'estensione i cui confini sono difficili da determinare. Non esiste alcuna misura statistica della validit di contenuto. Per valutare questa forma di validit si ricorre al giudizio di giudici indipendenti, di persone esperte e competenti nell'area o nel problema studiato. Ci che di solito viene considerato come validit di contenuto l'opinione ponderata di giudici esperti. La quantificazione della validit di contenuto
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Lawshe ha proposto una formula semplice per quantificare il grado di consenso di un gruppo di esperti nel determinare la validit di contenuto di un test. Ogni giudice deve rispondere alla seguente domanda riferita a ciascun item. L'abilit o la conoscenza valutata dal seguente item, rispetto alla performance richiesta, : a) essenziale; b) utile, ma non essenziale; c) non necessaria. Viene poi conteggiato il numero di esperti che ritengono essenziale l'item. Si pu ritenere che ci sia un sufficiente grado di validit di contenuto quando pi del 50% dei giudici ritiene l'item essenziale. A partire da questo assunto, Lawshe ha sviluppato la seguente formula:

dove: VC= validit di contenuto; NE= numero dei giudici indicanti essenziale N=-numero totale dei giudici. SE: -Validit di contenuto negativa: 1'item ritenuto essenziale da meno della met degli esperti -Validit di contenuto zero: quando solo la met esatta degli esperti indica come essenziale 1'item -Validit di contenuto positiva: pi della met degli esperti, ma non tutti, giudica essenziale l'item In caso di valutazione positiva il valore del coefficiente di validit varia da .00 a .99. Lo stesso autore ha predisposto una tabella (vedi tab. 8.1) a partire dalla quale si pu risalire, a seconda del numero dei giudici, al grado minimo di concordanza statisticamente significativo (p =.05). Gli item che non raggiungono questo livello di significativit statistica, rispetto ai quali un certo grado di accordo avvenuto casualmente, vengono eliminati dal test. Martuza, Hambleton e Bausell hanno proposto altri metodi statistici per determinare la validit di contenuto di un test sulla base del giudizio di due esperti. Ogni esperto chiamato a valutare il contenuto dei singoli item con una scala a 4 livelli (1= non rilevante; 2 = poco rilevante; 3-- abbastanza rilevante; 4 = molto rilevante). Successivamente queste valutazioni vengono dicotomizzate in debole rilevanza (valutazione da 1 a 2), o in forte rilevanza (valutazione da 3 a 4). Per ciascuna voce, allora, la valutazione dei due giudici pu essere riportata in una tavola di concordanza 2 X 2. Nel caso in cui vengono impiegati pi di due giudici, questo stesso procedimento di calcolo pu essere completato con tutte le possibili combinazioni di coppie di giudici riportandone il coefficiente medio. Validit di costrutto La validit di costrutto, detta anche validit in rapporto ad una funzione, consiste in un giudizio sulla appropriatezza di deduzioni effettuate a partire dai punteggi di un test che misura una determinata variabile chiamata costrutto. Il costrutto una costruzione (struttura) scientifica, teorica, una categoria astratta, un'idea usata per descrivere o per spiegare un comportamento e per fare dei collegamenti logici. Esempi di costrutto possono essere l'Intelligenza, la personalit, la nevrosi, l'ansia, la motivazione, la creativit, ecc. Sono categorie non osservabili direttamente, chiamate
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

in causa per descrivere e interpretare i risultati nel test o le prestazioni in un criterio, cio in misure indipendenti dello stesso oggetto valutato dal test e con questo correlate. Per validit di costrutto si intende se il test strettamente connesso con la struttura teorica e concettuale delle funzioni da esso misurate. Questo tipo di validit viene controllato formulando una serie di ipotesi, basate sulla natura della variabile da valutare, riguardanti il comportamento che ci si aspetta in soggetti con alti o bassi punteggi nel test e sottoponendole a prove di verifica. Da tali ipotesi nasce, in via sperimentale, una teoria sulla natura del costrutto che il test dovrebbe poi misurare. I costrutti psicologici hanno due caratteristiche in comune: a) non esiste un singolo e sufficiente referente esterno al test che permetta di riconoscere come valida l'esistenza del costrutto; b) dalla teoria del costrutto si pu derivare una serie di supposizioni connesse tra loro. Esplicazione del costrutto A1 fine di stabilire se un test fornisce una buona misura di uno specifico costrutto, si deve tradurre il costrutto astratto (teorico) in termini di comportamenti concreti (esplicazione del costrutto). Questo processo si compone di tre fasi: 1) si identificano i comportamenti concreti che possono avere una relazione con il costrutto da misurare (comportamenti-costrutto); 2) si individuano altri costrutti che possono essere collegati con questo(costrutticostrutto); 3) si decide quali comportamenti hanno una relazione con ciascuno di questi costrutti supplementari e, sulla base della connessione tra i diversi costrutti, si determina se ciascun comportamento ha una relazione col costrutto che si intende misurare. Il risultato finale di questo processo di esplicazione una descrizione dettagliata delle relazioni tra una serie di costrutti e alcuni comportamenti particolari (questo insieme di relazioni si chiama sistema nomologico). Dato che i costrutti sono sempre astratti e teorici, impossibile offrire una descrizione concreta del termine aggressivit; il sistema nomologico rappresenta un modo alternativo di descriverli sistematicamente. Pi ampio il numero delle correlazioni previste, pi alto il livello correlazionale tra i risultati del test e le misure del comportamento, e pi solida e convincente sar la prova della validit di costrutto. La validit di costrutto vista come il concetto unificante di ogni evidenza di validit. Sono state utilizzate diverse procedure per ottenere evidenze che un test possiede validit di costrutto. I vari metodi permettono di rilevare se: a)il test omogeneo e misura un singolo costrutto; b) i punteggi nel test aumentano o diminuiscono in funzione dell'et dei soggetti o del trascorrere del tempo, come teoricamente previsto; c) i punteggi ottenuti in seguito ad alcuni eventi o al semplice passaggio del tempo differiscono da quelli del pre-test, come previsto in teoria; d) i punteggi nel test correlano con quelli di altri test, come presumibile teoricamente; e) punteggi ottenuti da gruppi distinti di soggetti variano come predetto dalla teoria.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

L'evidenza della omogeneit del test L'omogeneit di un test, detta anche coerenza interna, esprime il grado in cui un test misura un singolo concetto. Si pu aumentare 1'omogeneit di un test in vari modi. si possono correlare i punteggi medi di ogni subtest con quelli medi totali del test. Il subtest che non correla molto bene con il test intero potrebbe essere eliminato o rifatto, per evitare che questo non misuri effettivamente il costrutto definito. In alcuni manuali di test sono riportati i coefficienti di correlazione fra i punteggi dei subtest e del test intero come evidenza di omogeneit (correlazione test-subtest). Un modo per incrementare l'omogeneit di un test formato da item con risposte dicotomiche consiste nell'eliminare gli item che correlano scarsamente con i punteggi totali del test (correlazione item-totale). In questo modo verrebbe ad aumentare la probabilit che ogni item misuri lo stesso costrutto, contribuendo perci alla omogeneit complessiva del test. Poich a ogni risposta viene assegnato un punteggio numerico, si eliminano quegli item che non mostrano alti coefficienti di correlazione per ranghi di Spearman con i punteggi dell'intero test. L'omogeneit di un test importante perch assicura che tutti gli item tendano a misurare la stessa cosa, ma essa non sufficiente in quanto non informa su come il costrutto del test collegato ad altri. Cambiamenti con let Il grado di abilit o di competenza in un particolare costrutto esaminato dal test pu variare nel tempo; cio la natura del costrutto tale per cui lecito aspettarsi che cambi con l'et. Generalmente naturale aspettarsi che i punteggi aumentino con let. Ci sono alcuni costrutti che permettono pi agevolmente di altri di fare previsioni sui cambiamenti che ci si pu aspettare nel tempo. Altri possono essere meno stabili e pi influenzabili da eventi situazionali. Cambiamenti pre e post-test Anche i cambiamenti nei punteggi di un test in seguito ad una esperienza particolare possono essere considerati come una prova evidente della validit di costrutto dello stesso. Luso di gruppi distinti Questa procedura adottata soprattutto per la validazione di test destinati all'uso clinico o alla selezione. Essa si basa sull'assunto che, se il test una misura valida di un certo costrutto teorico, i punteggi ottenuti da due gruppi di persone, che si presume differiscano tra loro rispetto a questo costrutto, dovrebbero essere diversi in modo statisticamente significativo. Validit convergente Il costrutto di un test pu convergere con quello di altri test o di altre misure ideate per valutare lo stesso o un simile costrutto.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

La validit convergente viene spesso usata per la sua facilit di applicazione. Un nuovo test viene somministrato ad un gruppo di soggetti assieme ad un reattivo pi vecchio che funge da criterio in quanto valuta le stesse o simili caratteristiche. Tali correlazioni, per, dovrebbero essere alte, ma non troppo. Infatti, se fossero molto alte ma senza ulteriori vantaggi da parte del nuovo test rispetto a quello gi pubblicato e usato, il nuovo test sarebbe una specie di duplicato del precedente e di esso, probabilmente, non vi sarebbe stata alcuna necessit. Validit discriminante Il procedimento per la validazione discriminante di un test analogo a quello per il controllo della validit convergente, solo che in questo caso si dovrebbe ottenere un basso livello di correlazione tra i punteggi al test e quelli di misura di altre variabili con le quali teoricamente ci si aspetta che il test non correli. La matrice multitratto-multimetodo Campbell e Fiske [1959] hanno proposto una metodologia, che permette di controllare la validit di costrutto di un test tenendo presente anche l'influenza sui punteggi del tipo di test usato. La procedura, utilizzando pi metodi per misurare un certo numero di costrutti o tratti, d luogo ad una matrice di correlazioni, detta multitratto-multimetodo. Poich ogni tratto misurato attraverso vari metodi, possibile stabilire se questi offrono risultati comparabili e quindi se misurano effettivamente lo stesso costrutto. Questo approccio suggerisce che un buon test per misurare un determinato costrutto deve avere tre caratteristiche: a) i punteggi nel test dovrebbero essere coerenti con quelli ottenuti con altri metodi di misura dello stesso costrutto; b) le misure da esso fornite non dovrebbero correlare con altre che teoricamente ci si aspetta che non correlino con il costrutto misurato dal test; c) il metodo di misura utilizzato dovrebbe rivelare una ridotta presenza di biases. Analisi fattoriale Si tratta di tabelle dense di coefficienti di correlazione, organizzati in colonne che vengono comunemente dette fattori. Le righe invece corrispondono agli item del test. un procedimento matematico-statistico che, partendo dalle risposte date da un gruppo di soggetti ad una serie di item, permette di identificare delle caratteristiche psicologiche (fattori) che non emergono a prima vista e che presumibilmente spiegano o influenzano le risposte di un test. Si tratta essenzialmente di un metodo di sintesi dei dati per mezzo dei quale vengono analizzate matematicamente le correlazioni all'interno di un ampio insieme di punteggi, e che permette di individuare quali item si raggruppano insieme (e quindi compongono un fattore) e quali ne formano altri. Lo scopo di individuare il fattore o i fattori, cio i costrutti ipotetici sottostanti, che si presume siano la causa delle correlazioni osservate fra i punteggi. In questo modo possibile semplificare la descrizione di un comportamento rilevato dagli item di un test ricorrendo ad un numero ridotto di categorie: da una molteplicit iniziale di item a pochi fattori o tratti comuni.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

La procedura di calcolo richiesta dall'analisi fattoriale piuttosto complessa, ma molto utilizzata grazie alla diffusione dei personal computer che permettono di analizzare con facilit e rapidit molti dati tramite programmi statistici gi predisposti. Tali programmi forniscono anche gli autovalori, cio indici statistici che sono in grado di rappresentare la relativa importanza di ogni fattore, e che vengono utilizzati anche per decidere il numero di fattori da ritenersi come costitutivi di un test. I costruttori di test generalmente ne illustrano i risultati con tabelle in cui compaiono i fattori trovati, il cui insieme viene definito struttura fattoriale del test (le colonne). I coefficienti riportati dagli item relativi ad ogni fattore costituiscono loro pesi fattoriali; indicano anche il grado di saturazione (correlazione) dell'item nel fattore e vanno interpretati come il contributo di quell'item a quel particolare fattore. Gli analisti fattoriali usano particolari strategie (dette rotazioni) in modo di ottenere il pi possibile che gli item saturino molto un fattore e molto poco gli altri. Le rotazioni pi usate sono quella ortogonale, che viene impiegata quando si ritiene che i fattori che costituiscono il test siano fra loro indipendenti, e quella obliqua, se si ipotizza che i fattori, pur indipendenti, siano in qualche modo in relazione fra loro. Ogni fattore isolato corrisponde ad una delle caratteristiche valutate dal test e gli item che rilevano quella caratteristica saturano solo quel fattore e non altri. Recentemente si sta affermando una modalit pi raffinata di analisi fattoriale, detta confermatoria, che sembra adattarsi meglio allo scopo di validare gli strumenti psicometrici. Essa permette di confermare empiricamente la struttura teorica di un test, ossia il modello teorico elaborato a priori e che ha guidato la costruzione dei test (quanti e quali fattori, e formati da quali item) viene confrontato con la struttura emergente dai dati reali. Se le due soluzioni (quella teorica e quella empirica) sono simili, si pu sostenere la validit di costrutto del test. Critiche: Per prima cosa non raro riscontrare per lo stesso test differenti risultati di analisi fattoriali effettuate in gruppi di soggetti diversi. Inoltre, una volta che il computer ha identificato un fattore, non raro imbattersi in pareri non omogenei nel denominarlo, cio nel definire il costrutto sotteso a un determinato gruppo di item. Un altro aspetto critico di questa procedura di analisi l'interpretazione dei risultati: spesso non c accordo tra gli utilizzatori dellanalisi fattoriale. Gli stessi dati di partenza possono dare luogo a diverse soluzioni fattoriali e quindi fornire soddisfacenti supporti a interpretazioni diverse ma egualmente plausibili. L'analisi fattoriale utile soprattutto quando si deve confermare una teoria psicologica formulata a priori, mentre un metodo fragile se si vuole costruire una teoria a partire dai risultati ottenuti con una simile analisi. In sintesi, l'utilizzatore del test dovr controllare nel manuale: a) se l'analisi fattoriale conferma un modello psicologico descritto dal costruttore ed elaborato prima di costruire il test o se sia in qualche modo la procedura statistica che ha consentito di ricavare il costrutto teorico su cui si basa il test (perplessit metodologiche giustificate); b) se nelle tabelle dell'analisi fattoriale presentate gli item hanno coefficienti di correlazione elevati (>.35) solo in un fattore;
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

c) se ogni fattore saturato in modo rilevante solamente dagli item che descrivono quella caratteristica; d) se ad ogni fattore corrisponde una delle caratteristiche che il test vuole misurare. Validit relativa ad un criterio La validit relativa a un criterio quella caratteristica di un test che ci permette di capire quanto adeguatamente il risultato in esso pu essere usato per prevedere la prestazione futura di un soggetto in una particolare attivit o in un altro test (criterio). In questo contesto la variabile di primario interesse il risultato della misura chiamata criterio. Questo tipo di validit implica il valutare quanto i punteggi di un test corrispondano ai risultati ottenuti in altre prove e il connettere matematicamente in qualche modo queste due serie di misure. Tale grado di connessione viene calcolato con il coefficiente di correlazione chiamato r di Pearson e serve ad esprimere il livello di validit del test. In alcuni manuali si possono trovare coefficienti come quello a ranghi di Spearman. Il significato lo stesso, cambia la formula per il calcolo che viene adeguata al tipo di scala che stata usata. Quanto dovrebbe essere alto il coefficiente di validit per decidere che un test valido? Non ci sono regole per fissare un livello accettabile. Essenzialmente il coefficiente di validit di un test dovrebbe essere abbastanza alto da permettere di identificare e differenziare chi sottoposto al test rispetto ad un determinato attributo. Cosa si intende per criterio? In termini generali per criterio si pu intendere una norma, uno standard, un insieme di elementi su cui basare un giudizio o una decisione. Nel linguaggio dei test e specificamente nel contesto della validit, per criterio si intende una misura diretta, ma esterna e indipendente della stessa cosa che un test si propone di misurare, una misura effettuata con procedure diverse e che costituisce un termine di riferimento per il test. Non ci sono regole fisse per stabilire ci che pu fungere da criterio. La chiave per la scelta di un criterio determinata dall'obbiettivo che si vuole raggiungere attraverso una decisione. Caratteristiche di un criterio II livello di affidabilit del criterio e quello del test limitano la grandezza del coefficiente di validit secondo la seguente relazione teorica: Dove il coefficiente di validit (cio la correlazione fra il test e il criterio); indica l'affidabilit del test e l'affidabilit del criterio. In altre parole il coefficiente di validit pu essere uguale o minore della radice quadrata del prodotto fra coefficiente di affidabilit del test e quello del criterio. Un criterio appropriato se pertinente rispetto alla funzione che il test vuole misurare. Idealmente i dati del criterio non dovrebbero essere contaminati. La contaminazione si verifica quando la misura del criterio basata almeno in parte su misure di predizione. Validit predittiva:
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

La validit predittiva riguarda quella situazione in cui i punteggi di un test vengono rilevati in un certo tempo e correlati con le misure di un criterio disponibili successivamente. Come evidente, una validazione di tipo predittivo si svolge in due fasi: 1) si applica un test ad un gruppo di soggetti senza utilizzarne risultati per prendere delle decisioni; 2) trascorso un certo intervallo di tempo, si raccolgono misure della prestazione degli stessi soggetti e si correlano con i punteggi nel test. In questo modo si ottiene un coefficiente di validit predittiva, il cui livello esprime la maggiore o minore probabilit di predire le prestazioni future dei soggetti. Il vantaggio della validazione predittiva che essa fornisce una misura semplice e diretta della relazione fra i punteggi del test e la prestazione nel criterio per la popolazione generale. Per questa ragione si rende necessario che il test venga somministrato ad un gruppo di soggetti il pi possibile ampio e rappresentativo della popolazione. Poich ci comporta procedure costose e a volte impraticabili, nei manuali di alcuni test sono riportate correlazioni fra punteggi nel test e quelli nel criterio di gruppi preselezionati di soggetti (per esempio, lavoratori gi assunti) e ci riduce il grado di validit predittiva del test. Questo fatto potrebbe portare a decisioni scorrette, con conseguenze negative sia per i soggetti sia per chi le effettua. Validit concorrente Una alternativa pratica alla validazione predittiva consiste semplicemente nell'ottenere sia i punteggi di un test sia quelli di un criterio in una specifica, preselezionata popolazione, e calcolare la correlazione fra le due serie di dati. Il coefficiente di validit predittiva ottenuto in un campione casuale della popolazione rispetto alla quale si dovranno prendere delle decisioni, mentre quello di validit concorrente generalmente ottenuto in un gruppo preselezionato di soggetti che pu differire sistematicamente dalla popolazione generale. Generalmente tre sono le pi comuni e semplici modalit ritenute utili per stimare la validit di un test nel predire i punteggi in uno specifico criterio. La prima consiste nel somministrare il test ad individui gi selezionati da una popolazione di candidati e ottenere una misura del criterio contemporaneamente a quella del test. La correlazione fra le due serie di punteggi rappresenta una stima della validit. La seconda prevede la selezione di un gruppo di soggetti attraverso il test e, successivamente, a disfanza di un certo tempo la rilevazione di misure del criterio. Come ultima procedura possibile usare dati presenti negli archivi degli uffici del personale come misure del test e del criterio. La validit di tipo predittivo generalmente preferibile. Infatti la correlazione tra punteggi del test e del criterio in gruppi di soggetti selezionati e predefiniti teoricamente diversa da quella ottenuta su una popolazione. Alcuni fattori depongono a favore dell'uso della validazione concorrente. Innanzitutto tali studi sono facilmente realizzabili, cio non sono necessari campioni casuali di soggetti o il lasciar passare lunghi periodi di tempo per ottenere la misura del criterio. Inoltre alcuni studi hanno dimostrato che valori dei coefficienti di validit predttiva e concorrente non differiscono sostanzialmente fra loro. I disegni di ricerca basati sulle correlazioni fra i punteggi al test e le misure del criterio in un gruppo di soggetti altamente selezionato al fine di stimare la validit di un test da utilizzarsi nel prendere decisioni riguardanti la popolazione generale comportano un
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

certo numero di problemi statistici. Il pi rilevante di questi la restrizione della gamma dei punteggi che avviene quando i soggetti sono selezionati sulla base dei punteggi nel test (per esempio, scegliendo solo quelli che ottengono un alto punteggio). Tale restrizione della gamma pu avere un effetto rilevante sulla correlazione fra i punteggi del test e quelli del criterio, rendendola spuria e non affidabile. Una restrizione della gamma pu aversi anche nelle misure del criterio. La restrizione della gamma riduce la correlazione fra i punteggi del test e le misure del criterio. L'uso della validazione di tipo concorrente pu presentare anche dei problemi di tipo concettuale. Infatti lo scopo dei test nelle procedure di selezione specificamente quello di discriminare i soggetti che andranno incontro a probabili fallimenti. Una validazione di tipo concorrente solitamente fatta su gruppi di soggetti che in genere non danno scarse prestazioni. La validit concorrente utile per quei test che vengono usati per le certificazioni previste dalla legge e in ogni caso per i test clinici e diagnostici in quanto un test con dimostrata validit concorrente fornisce una scorciatoia per ottenere informazioni in tempi brevi. Validit e meta-analisi La meta analisi un metodo per combinare i risultati di molteplici ricerche svolti da autori diversi relativamente allo stesso argomento. Tale procedimento applicato ai test permette di stimare la media dei coefficienti di validit ottenuti da autori diversi sullo stesso test. Tale procedimento applicato ai test permette di stimare la media dei coefficienti di validit ottenuti da autori diversi sullo stesso test. Questo non si riduce a un semplice computo della media matematica dei dati emergenti dalle diverse ricerche ma necessita di correzioni per l'attenuazione e per la restrizione della gamma dei punteggi e inoltre i risultati di ogni studio devono essere ponderati in funzione della grandezza del campione di soggetti. Ovviamente per poter combinare i dati provenienti da studi diversi necessario che questi presentino una precisa, specifica e omogenea definizione del costrutto misurato dal test, e che utilizzino analoghe misure del criterio. Relazioni tra validit di costrutto e di criterio Ogni strategia di validazione di un test offre informazioni sulla validit di costrutto dello stesso. possibile dimostrare ci facendo riferimento al modello elaborato da Binning e Barrett per descrivere e analizzare processi di validazione. L'obiettivo specifico di uno studio di validazione concerne la relazione fra i punteggi nel test e nel criterio. In realt ci che interessa la relazione fra punteggi del tesi (predittore) e il costrutto del criterio. Infatti a uno psicologo non interessa prevedere i punteggi nella prestazione lavorativa quanto invece la reale prestazione nel lavoro. Il costrutto del test importante nella scelta di quale test usare come predittore. Primo, perch si ritiene che il costrutto del test e del criterio siano fra loro collegati. Secondo, il test predittore deve costituire una valida misura del costrutto. La combinazione di questi legami suggerisce che il test predittore sia collegato con i dati
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

di valutazione della performance che, a loro volta, forniscono la prova del legame tra i punteggi del test e il costrutto della prestazione lavorativa. Interpretazione del coefficiente di validit Ma la validit del test non l'unico fattore da considerare in queste situazioni, anche se essa pu rivelarsi uno strumento utilissimo per migliorare l'accuratezza delle decisioni. A volte disporre di un test molto valido pu comportare un incremento decisamente modesto nella qualit delle decisioni, mentre in altre situazioni anche un test con un basso coefficiente di validit pu contribuire a incrementare l'accuratezza delle scelte. L'effetto del test sulla qualit delle decisioni di uno psicologo, infatti, legato anche ad altri fattori che non necessariamente sono connessi con il coefficiente di validit in relazione al criterio. Test e decisioni Il test costituisce solo uno dei fattori che in una situazione di selezione possono incidere e determinare la qualit delle decisioni e quindi della prestazione professionale di uno psicologo. Altri due fattori vanno attentamente considerati: il rapporto di selezione e il livello di base. Con livello di base si intende la percentuale di soggetti che si ritiene potenzialmente possa raggiungere il successo; Il rapporto di selezione rappresenta il rapporto tra posti e candidati, esso indica quanto si deve essere selettivi nelle proprie decisioni. Incrociando le conseguenze con le previsioni del successo/insuccesso, si hanno 4 risultati possibili: -Uno dei possibili risultati sono veri positivi (VP): un candidato cui stato previsto un risultato brillante e che lo ha conseguito realmente. -Un altro possibile risultato sono veri negativi (VN), ossia coloro di cui era stata prevista l'inadeguatezza e che in effetti si sono dimostrati scadenti nelle prestazioni. I veri positivi e i veri negativi rappresentano le decisioni accurate e corrette e quindi il loro incremento costituisce l'obiettivo degli psicologi. -Altri possibili risultati possono essere costituiti dai falsi positivi (FP): quelle persone che erano state ipotizzate come candidati di successo e che invece hanno dimostrato delle prestazioni negative. -I falsi negativi (FN) sono quelle persone delle quali era stata preventivata una scarsa prestazione e che invece riescono a conseguire successi insperati. Un livello di base alto garantisce un grande numero di veri positivi. Sfortunatamente pu comportare anche un elevato numero di decisioni sbagliate, cio di falsi negativi. In genere il test molto efficace nel migliorare globalmente la qualit delle decisioni quando il livello di base attorno a .50, offrendo la possibilit di minimizzare gli errori e di fare delle scelte realmente accurate. Un rapporto di selezione alto (per esempio, .80) indica che ci sono poche persone da scartare. Nel caso di un rapporto di selezione molto basso, in cui necessario individuare e selezionare la crema del gruppo dei candidati, avvalersi di una buona strategia di selezione pu risultare molto utile. Infatti, se il rapporto si selezione sufficientemente basso, anche un test con un modesto coefficiente di validit pu contribuire significativamente a incrementare l'accuratezza della selezione.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Un test che abbia una validit teorica di .00 il livello di successo equivale a quello del livello di base a prescindere dal tasso di selezione. In altre parole un test senza validit equivale a fare una scelta casuale. E importante selezionare le persone che avranno successo, ma la qualit complessiva del processo decisionale dipende non solo dal numero di successi, ma anche dalla combinazione di tutte le altre possibili conseguenze della decisione. Quando la decisione presa in modo casuale i falsi positivi, negativi e i veri positivi e negativi possono essere facilmente desunti dal livello di base e dal tasso di selezione usando la se guente formula: P(VP) = LB* RS Con un livello di base di .60 e un rapporto di selezione di .50, i150% di tutte le decisioni casuali sar corretto (VN e VP) e il 50% sar sbagliato (FN e FP). Questi valori rappresentano la situazione di base con la quale confrontare le decisioni prese usando i test. L'interpretazione del coefficiente di validit di un test risulta pi complessa di quanto non si creda. Il significato ditale coefficiente non pu, infatti, essere pienamente compreso se non lo si contestualizza in una situazione precisa nella quale il test viene utilizzato. Un test anche con un coefficiente di validit di .70 risulter poco utile se il livello di base o il rapporto di selezione sono molto elevati. Invece uno con un coefficiente molto basso, anche di .10, potrebbe contribuire considerevolmente all'accuratezza delle decisioni se il rapporto di selezione decisamente basso. A volte, anche se raramente, pu succedere di trovare nei manuali delle tavole sui dati attesi, cio la rappresentazione grafica della relazione tra i punteggi del test e quelli del criterio. Tali tavole permettono di individuare delle classi di soggetti che, in funzione del punteggio al test, otterranno probabilmente anche una prestazione sufficiente nel criterio. Queste tavole costituiscono essenzialmente la visualizzazione della relazione tra i punteggi del test predittore, scritti lungo uno degli assi del diagramma e quelli del criterio, spesso dicotomizzati in prestazioni sufficienti e insufficienti oppure superiori e inferiori oppure accettati e respinti, e comunque riportati sull'altro asse della rappresentazione. Secondo Lawshe e Balma la costruzione di queste tavole avviene secondo i seguenti procedimenti: a) si individua nel criterio un punteggio (cut-off) in grado di distinguere due gruppi (prestazione sufficiente/insufficiente; successo/insuccesso, presenza/assenza di disturbi psichiatrici),in genere cercando che ogni gruppo comprenda il 50% dei soggetti; b) per ogni punteggio del predittore (test) si contano quanti soggetti cadono nei due gruppi; c) i punteggi del predittore vengono accorpati in cinque gruppi equivalenti per numero di soggetti; d) si determina la percentuale e il numero di individui col locati nel gruppo superiore e negli altri; e) si disegna la rappresentazione grafica.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

A volte, oltre a queste tavole, si trovano anche delle rappresentazioni cosiddette istituzionali dei diversi livelli di probabilit. I diagrammi istituzionali indicano quello che accadrebbe nel caso che l'organizzazione assumesse tutti i candidati che oltrepassano un certo punteggio. Affidabilit e validit di un test Raramente, anzi quasi mai i test sono perfettamente coerenti e affidabili. Questo limite delle misure psicologiche ha rilevanti implicazioni per la validit del test e quindi per la validit delle predizioni e delle decisioni basate sui punteggi in esso conseguiti. La mancanza di affidabilit pregiudica la validit delle inferenze tratte a partire dai risultati in un test. Se un test inaffidabile, cio se fornisce punteggi non coerenti, non pu nemmeno essere valido. D'altro canto un test affidabile non per questo necessariamente valido. La bassa affidabilit di un test riduce la potenziale validit di una misura psicologica con esso ottenuta. Di contro, se la sua affidabilit venisse incrementata dovrebbe aumentare anche la sua validit. Quanto aumento nella validit di un test ci si potrebbe aspettare se gli errori casuali di misura venissero ridotti, migliorando cos la sua attendibilit? Spearman part da una simile domanda per sviluppare la teoria del punteggio vero, ossia della attendibilit intesa come indipendenza dall'errore casuale. Egli affermava che gli errori di misura attenuano la correlazione tra due test X e Y e quindi la validit delle predizioni. Perci la correlazione tra misure inaffidabili di X e Y sarebbe pi bassa rispetto a quella che si otterrebbe se i punteggi fossero perfettamente coerenti. Partendo da queste considerazioni egli svilupp la correzione per attenuazione come metodo per stimare l'effettiva relazione tra X e Y data la correlazione tra due misure di esse non perfettamente affidabili. La correzione per attenuazione si calcola cos:

Dove: indica il coefficiente di validit corretto per attenuazione; indica il coefficiente di attendibilit del test X; indica il coefficiente di attendibilit del test Y indica il coefficiente di validit del test X sebbene teoricamente giustificata tale procedura stata criticata sul piano pratico in quanto quasi sempre sovrastima l'effettiva correlazione tra X e Y. Inoltre, piuttosto di stimare la correlazione che si otterrebbe usando misure perfettamente attendibili, cio totalmente esenti da errori di misura (cosa che non si verifica mai), spesso pi utile calcolare l'incremento nel grado di correlazione fra i due test se l'affidabilit di uno di essi o di entrambi viene migliorata. Formula che permette di valutare l'effetto dell'incremento dell'affidabilit di uno o di tutti e due i test sulla loro correlazione.

indica il coefficiente di validit corretto in base al nuovo coefficiente di attendibilit del test X e/o del test Y; indica il coefficiente di validit del test X;
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

indica il nuovo coefficiente di attendibilit del test X; indica il nuovo coefficiente di attendibilit del test Y; indica il precedente coefficiente di attendibilit del test X; indica il precedente coefficiente di attendibilit del test Y. Se entrambi i test fossero resi perfettamente affidabili, i loro nuovi coefficienti di affidabilit sarebbero uguali a 1 e questa formula diverrebbe matematicamente identica alla prima. L'aspetto pi utile di questa seconda che essa permette di stimare l'effetto sia dell'innalzamento sia dell'abbassamento del coefficiente di affidabilit sulla correlazione fra due test. Equit ebias di un test Il termine bias riferito ai test sta ad indicare la presenza, all'interno del test, di un fattore che impedisce una misurazione accurata ed imparziale. In altre parole il bias in un test esiste se la procedura di testing non equa per un gruppo di individui che possono essere definiti per qualche specifica caratteristica. Sono state identificate tre categorie di bias del test: il bias dell'item, il bias intrinseco al test e uno estrinseco. Nella prima situazione il bias esiste all'interno dei singoli item di cui si compone il test Le forme linguistiche di bias del1'item sono le pi comuni (per esempio, l'uso della doppia negazione nella formulazione dell'item). Tale forma di bias facile da identificare e da eliminare nella fase di costruzione di urn test, ma spesso non viene controllata come si dovrebbe. La procedura pi facile e consueta una item analysis che permette di rilevare il grado differenziale di facilit o di difficolt dell'item per diversi gruppi di soggetti. Esiste anche una forma di bias intrinseco al test quando questo mostra differenze statisticamente significative fra i punteggi medi di due gruppi di soggetti dovute proprio alle caratteristiche del test e non a differenze tra i gruppi nel tratto o nella funzione che viene misurata. Ci pu dipendere dal fatto che il test ha differente affidabilit per i due diversi gruppi, o da differenze di gruppo nella validit del test (per esempio, lo stesso tratto viene misurato in proporzioni diverse nei due gruppi, oppure il test pu misurare un tratto addizionale in un gruppo). Il bias intrinseco al test pu anche essere dovuto ad un bias presente nel criterio rispetto al quale il potere predittivo del test viene validato. Il contenuto differenziale e la validit predittiva sono le principali fonti del bias intrinseco al test. Perci un test che stato costruito in base alle caratteristiche di persone di successo presenti in un gruppo particolare non pu essere altrettanto valido se applicato ad un gruppo di soggetti normali. Le pi rilevanti fonti di bias sono esterne al test stesso.Un bias estrinseco al test quando decisioni non eque vengono prese applicando correttamente un test che non biassato. Questo pu avvenire quando due gruppi differenti di soggetti ottengono punteggi diversi in un test dovuti proprio alle differenze attualmente presenti nei due gruppi, ma che non rappresentano l'oggetto di valutazione del test. Pertanto l'uso di tale test, anche se esso non biassato, pu portare ad una selezione sproporzionata di soggetti di un gruppo a spese degli altri. CAP 9: Il paradosso delle tecniche proiettive
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Tali metodi di indagine della personalit continuano a destare interesse dal punto di vista teorico e della ricerca e rientrano tuttora tra le procedure psicodiagnostiche preferite dagli psicologi in campo clinico. La popolarit di queste tecniche contrasta con la constatazione che, dal punto di vista dei tradizionali criteri psicometrici, questi reattivi non presentano quelle caratteristiche qualitative tipiche di un test vero e proprio. inoltre da sottolineare che alcune di queste sono state modificate nel tempo proprio per ovviare alle carenze psicometriche. Origini e caratteristiche delle tecniche proiettive possibile indicare come data di nascita di questi il 1910, anno nel quale Jung introdusse la tecnica della libera associazione di parole. Ma le date fondamentali per tali tecniche furono il 1921, anno di pubblicazione dello psicodiagnostico di Rorschach, e il 1935, anno nel quale venne pubblicato il Thematic Apperception Test. Nel decennio successivo venne prodotto un grande numero di reattivi derivati da questi due e vennero elaborate le tecniche espressive, basate cio sul disegno o sul gioco. Citiamo i pi noti: il Test di completamento dei disegni di Wartegg [1939]; le Favole di Duess [1942]; il Test di Frustrazione di Rosenzweig [1945]; il Test dell'albero di Koch [1949]; il Disegno della Figura Umana di Machover. Il primo sforzo concettuale di definizione e di fondazione teorica delle tecniche proiettive rinvenibile in un famoso articolo di Frank [1939], nel quale stata coniata l'espressione metodi proiettivi, e che ben esprime lo spirito di ribellione contro l'approccio normativo nello studio della personalit. Le tecniche proiettive vennero viste come la procedura elettiva per focalizzarsi sull'individuo da una prospettiva puramente clinica, esaminando il modo unico in cui ciascuno proietta su di uno stimolo la sua visione della vita, i suoi significati, i suoi vissuti ed i suoi sentimenti. Dopo l'entusiasmo degli anni '40 ed il boom della loro produzione, nei decenni successivi si assistito al progressivo aumento di un atteggiamento fortemente critico; a partire dagli anni '80, si registrata una ripresa dell'interesse verso questi strumenti che sono stati in gran parte modificati in modo da offrire maggiori garanzie. Il termine tecniche proiettive raggruppa un grande numero di procedure di indagine della personalit che si servono come stimolo di materiali di natura ambigua (ossia tali da prestarsi a differenti decodificazioni), dei quali si richiede ai soggetti di fornire liberamente la loro personale interpretazione. Sono costituite da prove non strutturate, alle quali esiste una gamma pressoch illimitata di risposte; si tratta quindi di procedure di indagine indirette e dissimulate, in modo tale che il rischio di contraffazione delle risposte risulti notevolmente diminuito. Le risposte ottenute vengono interpretate sulla base di quella che viene definita l'ipotesi proiettiva, la quale assume che il modo in cui un soggetto percepisce uno stimolo determinato dalla sua personalit globale. La principale caratteristica che uno stimolo deve possedere per far affiorare gli aspetti inconsci e profondi della personalit l'ambiguit. Infatti, secondo i modelli psicoanalitici e gestaltici, si assume che lo stimolo ambiguo accresca l'influsso delle variabili intrapsichiche nei processi percettivoproiettivi. Dal momento che la percezione la risultante di fattori strutturali (legati cio alla natura degli stimoli) e di fattori funzionali (che derivano dai bisogni, dalle strutture cognitive, dagli stati d'animo, dalle esperienze passate, dagli individui)
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

la riduzione dell'influsso dello stimolo aumenterebbe quello della personalit del percettore. Inoltre tale ambiguit, unitamente alla fluidit della consegna, favorirebbe la comparsa di un fenomeno regressivo, ossia una situazione in cui si allentano i processi secondari (che si riferiscono fondamentalmente al pensiero logico e razionale), mentre vengono messi in azione i processi primari (relativi al pensiero irrazionale, dominato dalle emozioni e strettamente legato al mondo pulsionale del soggetto). Entrerebbero quindi in gioco le dinamiche emotive e affettive e verrebbe escluso il livello superiore della coscienza.

Una classificazione Utilizzando un criterio analogo a quello proposto da Lindzey [1959], ossia il tipo di compito richiesto al soggetto, si possono suddividere i proiettivi nelle seguenti categorie: 1) associazioni con macchie d'inchiostro o con parole. Questa categoria include il noto psicodiagnostico di Rorschach [1921], il Test delle macchie di inchiostro di Holtzman [1961], cos come i Test di associazione verbale. 2) Costruzione di storie o sequenze. Le tecniche costruttive includono il TAT e i numerosi test che da questo derivano, come il Children Apperception Test [Bellak 1986] il Picture Projective Test [Sharkey e Ritzler 1985], o ad esso affini quali l'Object Relations Technique [Phillipson 1955], il Test di Blacky [Blum 1950] e l'Hand Test . 3) Completamento di frasi o storie. Sono rappresentate in larga parte da test di completamento di frasi, quali il Rotter Incomplete Sentences Blank di Rotter [Rotter e Rafferty 1950]. In questa categoria rientra anche il Rosenzweig Picture Frustration Study [Rosenzweig 1978], nel quale viene richiesto ai soggetti di completare dei fumetti che ritraggono situazioni frustranti. 4) Ordinamento/selezione di figure o scelte verbali, come il test di Szondi [Szondi 1947]. 5) Espressione tramite il disegno, il gioco o la drammatizzazione. Rientrano in questa categoria le tecniche grafiche, come il Disegno della Figura Umana [Machover 1949], l'House-TreePerson Test [Buck 1948], il Test dell'Albero [Koch 1949], le tecniche di gioco e lo psicodramma di Moreno [1946].

Il test di Rorschach Origini Hermann Rorschach (1884-1922) era uno psichiatra svizzero, figlio di un pittore e pittore egli stesso, il cui interesse per la psicanalisi era accompagnato da un altrettanto vivo interesse per l'arte ed il disegno. Fra gli elementi che hanno probabilmente influenzato Rorschach nell'elaborazione del famoso reattivo vanno citati gli esperimenti sulle associazioni verbali del suo contemporaneo C.G. Jung (finalizzati a far emergere materiale inconscio tramite parolestimolo), nonch la conoscenza di una tecnica, chiamata clecsografia, che utilizzava macchie di colore come stimolo per le associazioni mentali. La introdusse nellospedale psichiatrico di di Herisau, dove lavorava. Visti gli interesOPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

santi risultati ottenuti s dedic a trasformare tale tecnica ricreativo-terapeutica in un test, basando, anche se in modo piuttosto informale, l'interpretazione delle risposte su di un criterio empirico. Descrizione Il Rorschach composto da 10 cartoncini bianchi sui quali sono stampate delle macchie di inchiostro bilateralmente simmetriche. Cinque sono in bianco e nero; in due appare anche un colore rosso vivo; le rimanenti tre sono policrome. La somministrazione del test avviene in due fasi. Nella fase dell'associazione libera l'esaminatore presenta la prima tavola e chiede: Cosa potrebbe essere?. L'atteggiamento dell'esaminatore deve essere non direttivo, lasciando libero l'esaminato di dare quante risposte vuole e facendogli capire che non esistono risposte giuste o sbagliate. La fase successiva dedicata all'inchiesta: l'esaminatore chiede al soggetto di chiarire la specifica zona della macchia cui ciascuna risposta riferita e di specificare quali caratteristiche di essa (per esempio la forma, o il colore) hanno giocato un ruolo nella determinazione della risposta. L'esaminatore sar allora in grado di passare alla fase della siglatura, ossia all'attribuzione di simboli valutativi alle risposte ottenute. Nonostante stante siano stati elaborati differenti sistemi di interpretazione dei protocolli, le categorie fondamentali per la codifica restano sostanzialmente le seguenti: a) Localizzazione. Ogni risposta viene classificata in relazione all'area della tavola che viene interpretata. La distinzione fondamentale tra interpretazioni globali (G), ossia riferite all'intera macchia, e risposte di dettaglio (D, Dd, Dbi, ecc.), riferite ad una sola parte di questa. A loro volta quest'ultime sono distinte in base alla grandezza dello stesso, alla frequenza di interpretazione, o al riferimento a zone bianche della tavola. b) Determinanti. Si rileva quale dei seguenti fattori ha determinato la risposta: la forma, valutata anche nella sua qualit, cio buona (F+) o cattiva (F-), il movimento (M), il colore (C) o il chiaroscuro (Cho). c) Contenuto. Viene indicata la classe alla quale la risposta appartiene. Per esempio animali (A) o parti del loro corpo (Ad), esseri umani (U) o parti del loro corpo (Ud), oggetti inanimati (Ogg), piante (Pt), nuvole, sangue, fuoco, ecc. d) Frequenza. Le risposte vengono valutate, in base alla loro frequenza statistica, come banali (Ban), o, viceversa, come originali (Org). Una volta siglate le risposte, viene annotata la frequenza dei vari tipi di sigla, le percentuali relative alle varie categorie (per esempio F% la percentuale delle risposte determinate dal fattore forma sul totale delle risposte) e si calcolano alcuni rapporti tra le frequenze (per esempio, il tipo di risonanza intima, che il rapporto tra le risposte di movimento umano e quelle colore). Le modalit di risposta, i temi ricorrenti, le frequenze e i loro rapporti, i tempi di reazione, i fenomeni di shock (particolari reazioni di stupore e disagio), i rifiuti di interpretare alcune tavole, sono tutti elementi che vengono utilizzati per delineare il profilo globale dell'individuo. Sia nella fase di siglatura che in quella di interpretazione possibile avvalersi dell'ausilio di dettagliate tabelle di riferimento. stata inoltre proposta una interpretazione computerizzata dello strumento, mediante il Rorschach Interpretation Assistance Program.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Analisi critica Risulta molto difficile giungere a delle valutazioni conclusive sull'attendibilit, la validit e l'utilit clinica del Rorschach. In epoche e in contesti differenti esso stato utilizzato per la formulazione di diagnosi psichiatriche, per ottenere un indice dei processi primari del pensiero, per predire il suicidio, per delineare strutture di personalit complesse, per stimare la prognosi di una psicoterapia, ecc. Molti studi hanno messo in luce come la qualit e la quantit delle risposte date dai soggetti cambino in base alle caratteristiche dell'esaminatore. I risultati hanno rilevato come esaminatori ritenuti molto ansiosi stimolavano la produzione di un numero pi elevato di risposte, pi risposte riferite a spazi bianchi, pi risposte determinate dal colore; mentre somministratori ritenuti ostili suscitavano pi risposte chiaroscuro, pi risposte a contenuto animale e meno a contenuto umano. Harris e Masling rilevarono che la quantit delle risposte al Rorschach variava in base alla diversit o meno di sesso tra esaminatore ed esaminato. Il problema dell'influenza dell'esaminatore, che d'altronde comune a tutte le situazioni in cui si applicano test individuali, risulta di fondamentale importanza anche nella somministrazione del Rorschach, rendendo quindi necessaria una particolare attenzione a circoscrivere l'influenza di tale variabile e a tenerne conto nella fase di interpretazione. La contraffazione delle risposte L'indagine tramite queste condotta sia di tipo indiretto e dissimulato e che, per tale motivo, esse risultino poco suscettibili di falsificazione volontaria. Tuttavia, se consideriamo quanto affermato da Schachtel [1996], ossia che le risposte al Rorschach sono pesantemente influenzate da processi cognitivi consci, possibile ipotizzare che i soggetti siano in grado, qualora lo ritengano opportuno, di contraffarle volontariamente. L'insieme di tali ricerche dimostra come i soggetti abbiano la capacit di selezionare le risposte in base a personali criteri di scelta e finiscano per esporre quelle meno censurabili socialmente; il Rorschach non pu essere ritenuto esente dalla possibilit di contraffazione delle risposte e ci va tenuto in debito conto nelle sue applicazioni. L'attendibilit Attendibilit dell'esaminatore. Per quanto riguarda questo tipo di attendibilit necessario fare una distinzione tra a) concordanza dei correttori nella siglatura (codificazione delle risposte) effettuata tramite lo stesso sistema di scoring, e b) concordanza tra i correttori nell'interpretazione dei protocolli. Per quanto riguarda la concordanza dei siglatori, gli studi condotti su correttori ben addestrati hanno in genere ottenuto buoni coefficienti di correlazione. importante tenere presente la possibilit che le caratteristiche di personalit dell'esaminatore vadano ad inficiare l'attendibilit del test, in special modo quando le procedure di scoring siano meno oggettive di quella ideata da Exner.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Stabilit nel tempo: il test-retest. Alcuni autori ritengono che la misura dell'attendibilit attraverso il test-retest non sia indicata per il Rorschach in quanto le risposte alle -tavole sono il risultato di molti fattori (bisogni, conflitti, interessi) operanti nell'individuo al momento della somministrazione: Questi, variando anche velocemente nel tempo, possono fortemente influenzare le risposte e quindi la loro interpretazione. Inoltre sia gli Standards for Educational and Psychological Testing [APA 1992] che Anastasi [1993] sottolineano come l'attendibilit test-retest condotta con la stessa forma del test non sia generalmente il metodo pi appropriato per la verifica dell'attendibilit nei test psicologici per il possibile ruolo giocato dalla memoria. Il Rorschach pone questo problema in misura ancora maggiore degli altri test psicologici proprio per l'alto grado di salienza dei percetti delle tavole. Per una corretta misurazione della coerenza nel tempo sarebbe necessario avere a disposizione una forma parallela del test, che non esiste per il Rorschach. Coerenza interna. Sia lo split-half sia la correlazione tra gli item sono stati tradizionalmente ritenuti un metodo inapplicabile al Rorschach per l'impossibilit di considerare equivalenti gli stimoli proposti nelle diverse tavole. Ciascuna tavola pu essere infatti considerata uno stimolo unico e quindi non comparabile con le altre. La validit La validit del Rorschach, indipendentemente dal metodo di interpretazione utilizzato, sempre stata al centro di accese controversie. I teorici hanno sempre sostenuto che i dati sperimentali, a partire dai fondamentali studi condotti negli anni '50, non supportano l'ampio utilizzo che viene fatto di questo test, mentre i clinici replicano che il test rappresenta una ricca sorgente di preziosi dati. In un recente articolo Frank passa in rassegna la letteratura scientifica circa le relazioni tra affettivit e risposte colore al Rorschach, citando in particolare due articoli: uno studio che replica i precedenti su umore e preferenze di colori; e un altro che replica quelli sugli effetti della cecit al colore e risposte alle carte cromatiche. Le conclusioni che egli trae dall'analisi di tali studi sono le seguenti: mentre le persone attribuiscono senza ombra di dubbio connotazioni affettive al colore, l'ipotesi che questo possa riflettere stili di risposta emotivi non viene suffragata dai dati. Pertanto le risposte colore non possono essere interpretate come espressione delle vicissitudini emozionali dei soggetti. Un altro indice per la valutazione dei protocolli, cio il numero totale delle risposte, siglato con R, stato duramente criticato fin dagli anni '50. La produttivit delle risposte pu infatti variare grandemente da soggetto a soggetto a seconda dell'et, del livello di istruzione, del livello mentale, ecc., per cui risulta ingannevole considerare come norma il numero assoluto di risposte nelle varie categorie. L'utilizzazione di punteggi percentuali in alternativa al numero di risposte per categoria non permette inoltre di risolvere totalmente il problema. Un'altra delle fondamentali critiche alla validit del Rorschach riguarda l sua incapacit di differenziare efficacemente tra diversi gruppi clinici. Tale limite diventa tanto pi preoccupante quando esso venga utilizzato a fini diagnostici Per quanto riguarda 1'Exner Rorschach sono stati rilevati risultati pi incoraggianti. Tale sistema avrebbe dimostrato di possedere una maggiore accuratezza di previsione
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Una rassegna di studi sulla deludente validit del Rorschach pu essere trovata nel testo di Zskin e Faust. Particolarmente ampio l'insieme dei dati concernenti la povert predittiva dello strumento quando esso venga utilizzato in et evolutiva La dimostrazione della validit ed attendibilit del Rorschach inteso come tecnica psicometrica viene considerata un traguardo impossibile da sostenitori del Rorschach come Aronow, Reznikoff e Moreland [1995]. Essi, inoltre, accusano l'approccio percettuale-nomotetico di studiosi come Exner di snaturare e di impoverire tale strumento, che risulta invece estremamente utile e potente quando venga utilizzato secondo un approccio di tipo contenutistico-idiografico. La tecnica delle macchie di inchiostro di Holtzman Basata sulle stesse premesse teoriche del Rorschach, l'Holtzman Inkblot Technique stata costruita per ovviare alle carenze psicometriche del primo. L'HIT consiste di due serie parallele di 45 tavole-stimolo ciascuna, alle quali pu essere data una sola risposta, seguita immediatamente da una breve inchiesta condotta con domande standard. Nell'attribuzione dei punteggi viene fatto riferimento a 22 variabili, scelte tra quelle la cui validit stata meglio accertata dalle ricerche effettuate nella fase di elaborazione del test. Per ogni variabile viene data una siglatura minuziosa, che consente un elevato grado di accordo tra i correttori. La maggior parte delle variabili riceve inoltre una valutazione per l'intensit su una scala numerica da 2 a 5 punti, l'assegnazione dei quali avviene in base a precise indicazioni e ad esempi contenuti nel manuale. Tale strumento pu essere applicato sia individualmente sia collettivamente. Ne esiste inoltre una versione ridotta ed stato elaborato un programma computerizzato per lo scoring e l'interpretazione dei protocolli. Analisi critica La superiorit psicometrica del test, basata su una scrupolosa procedura di standardizzazione, rende probabilmente questa tecnica il miglior strumento proiettivo oggi disponibile. L'HIT ha dimostrato, inoltre, di possedere utilit clinica nella diagnosi della schizofrenia, dei disturbi del carattere, della depressione e degli abusi di droghe. continua tuttavia a risentire del problema dell'effetto dell'esaminatore sull'interpretazione dei punteggi pu giocare un ruolo importante anche nella stesura del profilo finale dell'individuo. Il test di appercezione tematica E stato cos denominato ponendo l'accento sul ruolo giocato, nell'interpretazione di materiali ambigui, dalla appercezione, intesa come frutto delle passate esperienze percettive, piuttosto che su quello dei semplici processi proiettivi. Era stato inizialmente ideato come strumento clinico (come tecnica per l'elicitazione di materiale di fantasia in pazienti in analisi), ma venne successivamente usato anche in psicologia sociale e del lavoro, e per l'elaborazione di teorie della personalit. Il materiale del test costituito da 30 tavole in bianco e nero pi, una tavola bianca. La maggior parte delle figure rappresenta in modo realistico una o pi persone in situazioni differenti, impegnate in attivit ambigue. Alcune tavole possono essere utilizzate con qualsiasi tipo di soggetto, mente altre sono specificamente riservate a
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

soggetti maschi adulti (M)', ,altre a femmine adulte (F), o ad adolescenti, maschi (B) o femmine (G). Secondo le indicazioni degli autori a ciascun soggetto dovrebbero venire presentate 20 tavole, in due somministrazioni distinte, altri suggeriscono invece di somministrare 15 tavole in una sola seduta. La somministrazione, nel metodo standard, individuale: l'esaminatore chiede al soggetto di costruire una storia che descriva la tavola, spiegando ci che i personaggi fanno, cosa pensano o provano, che cosa hanno fatto in passato o cosa ha provocato la situazione raffigurata, cosa potr accadere in futuro, quale sar la conclusione. Come per il Rorschach, deve essere minuziosamente registrato tutto ci che il soggetto dice, i tempi di latenza prima della risposta, il comportamento verbale e non verbale dell'esaminato. Esistono numerosi sistemi di interpretazione dei dati ottenuti al TAT, ma tutti sono basati, in modo pi o meno marcato, sulla teoria della personalit elaborata da Henry Murray. In particolare, il sistema di interpretazione utilizza i concetti cardine di tale teoria: quello di bisogno e quello di pressione. I bisogni organizzano la percezione, il pensiero e l'azione ed orientano il comportamento in direzione della propria soddisfazione e possono venire distinti in primari (fame, sete, desiderio sessuale, ecc.) e secondari (bisogni di autonomia, di dominanza, di affiliazione, ecc.); la pressione si riferisce invece all'influenza che pu avere sulle persone l'ambiente circostante, nella sua componente oggettiva, reale (Pressione alfa) o soggettiva e percepita (Pressione beta). L'interpretazione del TAT pu essere condotta in base a considerazioni di tipo formale, oppure focalizzandosi sul contenuto. L'analisi formale rileva il modo in cui il soggetto costruisce o presenta le risposte, mentre l'analisi del contenuto coglie ci che il soggetto cerca di esprimere. Aspetti formali considerati nell'interpretazione delle tavole sono: la facilit di parola, il grado di concretezza o astrattezza (considerate indicative del funzionamento del pensiero), la fluidit del linguaggio (messa in relazione con aspetti dell'intelligenza, con l'estrazione sociale, con il livello di sviluppo), la quantit di parole, utilizzate nelle descrizioni (indici dell'energia o delle risorse interne), la coerenza di pensiero (integrit e controllo del pensiero). Murray ha elaborato una lista di 36 bisogni, sia primari sia secondari, che sono valutati dall'esaminatore su una scala da i a 5 a seconda dell'intensit e della centralit della loro espressione. I bisogni e le pressioni formano il tema della storia, in cui il protagonista pu fallire o avere successo, pu avere reazioni positive o negative, pu reagire con pi o meno ottimismo e cos via. Da tali considerazioni quantitative e qualitative deriver l'interpretazione dell'esaminatore,. nella quale viene lasciato un ampio margine all'intuizione ed al suo libero ipotizzare. Attendibilit Per quanto riguarda la concordanza tra siglatori (inter-scorer reliability), da segnalare che sono stati messi a punto metodi (scale di valutazione) che consentono di ottenere buoni livelli di oggettivit Per quanto riguarda le tradizionali procedure per il controllo dell'attendibilit, quali il test-retest, lo split-half e le forme parallele, nessuna di queste risulta applicabile al
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

TAT a causa della natura stessa del compito e della suscettibilit delle risposte a diversi fattori. stato, per esempio, dimostrato che fattori situazionali (quali le caratteristiche dell'esaminatore, le esperienze precedenti la somministrazione del test, il modo in cui le istruzioni vengono fornite, il ruolo dei rinforzi, ecc.), cos come particolari stati di bisogno interni (la fame, la sete, il sonno), possano giocare un ruolo molto importante nel determinare le risposte al test.Infine il TAT si dimostrato fortemente suscettibile alla contraffazione. Validit Una considerazione critica importante si riferisce al fatto che il materiale stimolo risulta culturalmente determinato e quindi sorpassato; esso inoltre stato costruito e validato in riferimento ad una popolazione maschile, giovanile, di classe media, rendendo discutibile l'adeguatezza di questa serie di stimoli per soggetti diversamente caratterizzati. Alcuni autori hanno inoltre notato che le figure del TAT determinavano un forte influsso negativo sulla costruzione delle storie. Le tavole del TAT presentano toni scuri ed ombreggiati, e molte delle scene ritraggono persone in situazioni piuttosto lugubri. Non sorprendente, allora, che le risposte proiettive al TAT siano fortemente incanalate verso storie negative e melanconiche. Al fine di superare simili inconvenienti, Sharkey e Ritzler hanno ideato una nuova tecnica, il Picture Projective Test, che utilizza fotografie tratte da un catalogo del museo di arte moderna di New York. Tale materiale stimolo favorirebbe la produzione d storie nelle quali assumono un ruolo pi importante gli aspetti sani e adattivi della personalit. Questa tecnica ha dimostrato inoltre di fornire migliori garanzie psicometriche e maggiore utilit clinica nella diagnosi differenziale rispetto al TAT. La validit del TAT in relazione a criteri diagnostici o comportamentali stata oggetto di numerose verifiche, con risultati cos disparati da indurre a conclusioni nettamente opposte sulla validit del test. Per quanto riguarda la validit diagnostica differenziale, i controlli risultano piuttosto inconcludenti. Volendo effettuare una sintesi della letteratura sulla validit di questo strumento, utile considerare la sua duplice utilizzazione: nella ricerca e nelle applicazioni psicosociali da una parte, e nella clinica dall'altra. I dati positivi circa la sua validit si riferiscono prevalentemente al suo uso per elaborazioni teoriche, mentre stata evidenziata la sua inefficienza nelle applicazioni in campo clinicodiagnostico. Il Draw a Person Test L'uso del disegno e della pittura hanno una lunga tradizione nella psicologia clinica, che da sempre li ha integrati al colloquio per facilitare al soggetto esaminato l'espressione di contenuti emotivamente difficili, per diminuire l'ansia, per rendere pi produttivo l'approccio con il terapeuta. La letteratura psicologica degli ultimi trent'anni per concorde nel documentarne l'insuccesso. Il disegno della figura umana venne inizialmente impiegato da Goodenough come strumento per la valutazione dell'intelligenza, ma fu successivamente trasformato da psicologi orientati in senso psicodinamico in un proiettivo per la valutazione della personalit. Fu Karen Machover ad elaborare la tecnica nota come Draw a Person Test (DAP), o Test della Figura Umana. Da una rilevazione riportata da Piotrowskj, Sherry e
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Keller [1985], il DAP risulta essere la quinta tecnica pi frequentemente utilizzata dagli psicologi clinici negli Stati Uniti, addirittura pi del Rorschach e del TAT. Il reattivo viene somministrato fornendo al soggetto un foglio bianco, una matita ed una gomma e chiedendogli di disegnare una figura umana; quando il soggetto ha eseguito il compito, gli si fornisce un secondo foglio con la consegna di rappresentare una persona di sesso opposto a quella raffigurata precedentemente. Durante l'esecuzione del compito vengono annotati i commenti ed il comportamento non verbale dell'esaminato, nonch l'ordine in cui vengono disegnate le figure e le varie parti del corpo. Alla fine viene in genere effettuata un'inchiesta sul materiale prodotto tramite domande quali: Raccontami una storia su questa persona; Parlami di questo ragazzo/ragazza, uomo/donna; Cosa sta facendo questa persona?; Come si sente in questo momento?. Le risposte a queste domande sono utilizzate nella formulazione di ipotesi e di interpretazioni circa il funzionamento della personalit del soggetto. Nella fase di interpretazione si considerano caratteristiche di tipo formale quali: la quantit di tempo impiegata per la realizzazione dei disegni, la posizione delle figure sul foglio, le dimensioni e le proporzioni tra le varie parti della figura, la pressione esercitata dalla matita sul foglio, la simmetria, la qualit delle linee, l'ombreggiatura, la presenza di cancellature, l'espressione del viso, l'abbigliamento, le omissioni di parti del corpo, la quantit e la distribuzione dei dettagli, l'aspetto generale. Tali indici permettono di formulare ipotesi interpretativo diagnostiche secondo una metodologia di tipo clinico-intuitivo, sulla base di presupposti teorici di natura psicodinamica. Analisi critica Il DAP rientra fra le tecniche proiettive che hanno dimostrato di possedere le pi scarse caratteristiche di standardizzazione e di validit. Attendibilit L'attendibilit dell'esaminatore i coefficienti di correlazione tra correttori esperti variano da .33 a .80 a seconda dell'ampiezza con cui sono stati definiti i criteri di codifica e di valutazione adottati. La stabilit al retest stata criticata sia dal punto di vista statistico che da quello psicanalitico. Validit La validit della diagnosi risulta poco soddisfacente. Anche l'ipotesi che un disegno buono nel suo complesso sia indicativo di normalit posta in dubbio dalle difficolt di tenere sotto controllo l'influsso del diverso livello di abilit artistica dei soggetti. stato provato che l'abilit artistica dei soggetti rappresenta una fonte rilevante di varianza sulla qualit dei disegni. Il presupposto fondamentale secondo il quale il disegno pu esprimere direttamente caratteristiche di personalit deve quindi essere ridimensionato, visto l'importante ruolo giocato da fattori culturali e situazionali. Sembrerebbe quindi che i costrutti teorici tenuti maggiormente in considerazione nell'interpretazione dei disegni siano piuttosto alcuni stereotipi condivisi nella nostra cultura. Alcuni ricercatori, pur applicando un sistema di scoring pi oggettivo recentemente pubblicato, affermano che la verifica della validit concorrente di tale strumento, che pure risulta essere il migliore tra le tecniche espressive, non supporta la sua utilizzazione per la valutazione dell'intelligenza.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Cap 10: Test e culture diverse Il bias culturale Dalle molteplici indagini transculturali effettuate emerge che le prestazioni nei vari test possono essere condizionate da bias culturali, ossia da errori costanti, sistematici, non casuali conseguenti alla diversit fra la cultura di provenienza del soggetto testato e la cultura di cui il reattivo stesso espressione. Dalla letteratura risulta che il bias culturale nei test d'intelligenza si manifesta sia nel confronto fra soggetti di culture diverse sia fra membri di una minoranza culturale verso i componenti della cultura dominante. opportuno ricordare che per minoranza culturale intendiamo un gruppo di soggetti con una determinata subcultura, accettando la definizione di subcultura data da LviStrauss come frammento di una cultura che, dal punto di vista della ricerca in atto, presenta rilevanti discontinuit nei confronti della rimanente parte di detta cultura, per quanto riguarda l'accesso ai pi importanti strumenti di amplificazione di quest'ultima. Per strumento di amplificazione si intende una configurazione tecnologica, materiale o intellettuale, che permetta all'individuo il controllo delle risorse, del prestigio e del rispetto all'interno del suo gruppo. Boncori ritiene che il bias culturale di minoranze nei test d'intelligenza possa manifestarsi in quattro contesti distinti: 1) con soggetti appartenenti a un gruppo allofono o alloglotta, ossia con persone che, avendo imparato a parlare una lingua o un dialetto diversi dall'italiano, apprendono quest'ultimo come seconda lingua (ad esempio, immigrati, oppure abitanti del sud Tirolo); 2) con gli appartenenti a strati sociali in cui non vi familiarit con la lingua scritta e con l'attivit grafica; 3) con persone non abituate a eseguire prove come i test d'intelligenza, in cui necessario fornire la migliore prestazione nel minor tempo; 4) con individui che hanno un atteggiamento negativo verso la figura sociale del professionista che somministra i test. Origine del bias culturale Che ci sia un bias culturale nei test prevedibile, in quanto con il termine cultura solitamente si fa riferimento all'insieme delle conoscenze, delle modalit di comunicazione, delle tradizioni e delle norme etiche, religiose e sociali, sviluppate e tramandate negli anni all'interno di una determinata societ quindi, il comportamento di una qualsiasi persona assai influenzato dall'ambiente culturale in cui cresciuta. E poich il test una misura oggettiva di un campione di comportamento, le prestazioni nei vari reattivi saranno necessariamente condizionate dalla diversit fra la cultura del soggetto e la cultura del test, diversit manifestabile sia a livello macroculturale (confronto fra soggetti di cultura diversa: somministrare un test statunitense ad un africano) sia a livello subculturale (paragone fra membri di una minoranza culturale rispetto ai componenti della cultura dominante: somministrarlo ad un indiano d'America). Prime proposte di attenuazione del bias culturale
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

All'inizio del secolo, negli Stati Uniti, sono stati creati svariati reattivi per valutare le abilit sia di immigrati sia di gruppi culturali isolati. Verso gli anni '50-60, il problema si fece pi impellente in seguito alla necessit di valorizzare al meglio le capacit delle popolazioni dei paesi in via di sviluppo: si avvert l'esigenza di test per valutare le abilit scolastiche cos da rendere pi efficiente la programmazione didattica, ma anche di prove per selezionare il personale pi idoneo alle varie richieste delle nascenti industrie. Contemporaneamente, negli Stati Uniti divenne palese il bisogno di valutare in modo pi adeguato e giusto le performance delle minoranze culturali. Si cerc allora di far fronte al problema costruendo test culture free, test liberi da influenze culturali; reattivi costituiti solamente da prove non verbali. Alla base di questo una nuova concezione del comportamento: non viene pi considerato il frutto dell'interazione dei fattori genetici con quelli culturali, come in anni pi recenti, bens manifestazione del corredo cromosomico spennellata nella superficie esterna dall'azione dell'ambiente. Un modo per superare tale patina fu quello di togliere nei test le prove verbali, utilizzando quindi solo quelle non verbali, di performance. Ben presto comunque i ricercatori si resero conto che anche i test culturc free non erano indipendenti dal bias culturale: sperimentalmente, infatti, fu rilevato che in reattivi d'intelligenza le minoranze avevano prestazioni inferiori a quelle del gruppo normativo, non solo nelle prove verbali ma anche in quelle non verbali. In seguito, si cerc di risolvere il problema della valutazione transculturale dell'intelligenza ideando test culture fair (chiamati anche culture-common o transculturali), ossia reattivi culturalmente equi, giusti ed imparziali. Test non pi costituiti da prove supposte libere da influenze, ma da prove comuni alle culture e subculture diverse. Nel costruirli, cio, si cercarono quegli item che riflettessero le esperienze, le conoscenze e le abilit comuni alle differenti culture e subculture, e che motivassero alla loro esecuzione individui di varie tradizioni. In generale essi erano costituiti da prove non verbali accompagnate da consegne orali, semplici e facilmente comprensibili. Esempi: Le Matrici Progressive sono costituite da una serie di figure private di una parte; il compito consiste nell'individuare tra sei o otto alternative la parte mancante. Il Goodenough Drazu-a-Man Test, chiamato anche disegno dell'ometto , consiste nel disegnare, nel miglior modo possible, un uomo, una donna e se stessi; in base a considerazioni quantitative e qualitative viene attribuito un punteggio numerico all'elaborato. Il test di Cattell costituito da prove di seriazione (data una serie di immagini scegliere fra varie alternative quella che-completa la sequenza), di classificazione (ndicare l'unica figura che non concorda con le altre), di completamento di matrici (scegliere la parte mancante di una matrice), di condizione (ossia, data una serie di figure complesse scegliere l'unica in cui, disegnando un punto, si verificano le medesime condizioni di una figura campione). Anche i test culture-fair per, non hanno superato l'esame del bias culturale. Infatti, stato sperimentalmente rilevato che nel Culture Fair intelligence Test i punteggi medi di individui con cultura diversa da quella americana sono significativamente inferiori alle norme americane.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Vari autori sostengono che la pecca principale dei culture fair consiste nell'utilizzare solamente prove non verbali; essi, infatti, ritengono che le prove di performance possano essere pi culturalizzate di quelle verbali e comunque pi complesse da tradurre e da adattare a culture diverse. Opinioni attuali La comunit scientifica internazionale unanime nel sostenere che sia molto complesso realizzare non solo test culturefree, ma anche culture fair; infatti nessun reattivo, sia d'intelligenza sia di personalit, pu essere applicato universalmente e rendere giustizia a tutte le tradizioni, poich qualsiasi test, inevitabilmente, tende ad agevolare le persone provenienti dalla cultura in cui esso stato costruito. Del resto, poich il comportamento manifestazione della cultura d'origine, se si eliminassero nel test tutti gli elementi di differenziazione culturale diminuirebbe la sua validit. Sviluppi recenti 3 approcci al problema della valutazione dellintelligenza di soggetti appartenenti a culture diverse: Test culture-specific Secondo un primo approccio, la modalit pi adeguata consiste nell'utilizzare test culture specific, ossia reattivi costruiti nell'ambito di una determinata cultura, validati esclusivamente con criteri locali ed utilizzabili solo per i soggetti con tale background. Un es. il Black Intelligence Test of Cultural Homogeneity (BITCH): molti autori lo hanno criticato perch, diversamente dalle scale Wechsler e Binet, esso formato esclusivamente da prove di informazione, di prodotto, mentre un'adeguata misura dell'intelligenza presuppone anche item riguardanti i processi di elaborazione dell'informazione. Di conseguenza, esso ha una bassa validit, ossia non consente un'effettiva stima dell'intelligenza, ed in particolare non fornisce le informazioni necessarie per prevedere le prestazioni che i neri statunitensi avranno nell'ambito scolastico e professionale. Test di distanza e di deprivazione culturale Un secondo approccio alla valutazione dell'intelligenza di persone di cultura o subcultura diverse consiste nell'adottare reattivi sviluppati nell'ambito di un determinato ambiente per esaminare le abilit di soggetti di diversa tradizione culturale. Gli obiettivi di tale metodo consistono principalmente nell'individuare la distanza culturale fra i due gruppi, oppure il grado di deprivazione culturale di un soggetto rispetto alla cultura di cui il test espressione, in modo da poter ottenere dati indispensabili per programmare adeguati interventi di recupero. Misure psicofisiologiche dell'intelligenza Un terzo approccio consiste nel realizzare misure fisiologiche dell'intelligenza. Vari autori, infatti, dopo aver ottenuto correlazioni statisticamente significative tra le misure tradizionali dell'intelligenza e quelle biologiche, ritengono che queste ultime siano la soluzione definitiva al problema del bias culturale.
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

lecito adattare un test a tradizioni culturali diverse? Ci si potrebbe chiedere, in modo radicale, se e quanto sia legittimo e corretto adeguare un reattivo, d'intelligenza o di personalit, elaborato nell'ambito di una determinata cultura, alle tradizioni, spesso molto diverse, di altri contesti culturali. Per rispondere a questa domanda necessario comprendere se la diversit di prestazione fra soggetti di differente cultura sia dovuta alla diversit nella natura stessa del costrutto indagato (i due gruppi hanno un'intelligenza o una personalit costituita da funzioni di base dissimili), oppure ad una sua diversa specializzazione (i due gruppi hanno le medesime funzioni, ma queste si manifestano in modo differente). Ebbene, a noi sembra pi sostenibile la seconda ipotesi, ossia che membri di differenti gruppi culturali hanno le stesse funzioni di base, ma a causa dell'influenza dell'ambiente presentano particolari specializzazioni e quindi prestazioni diverse. L'ereditariet stabilisce una sorta di limite alle possibili abilit, mentre l'ambiente, con le sue richieste, incoraggia determinate competenze e performance. Pertanto, se vero che membri di culture o subculture diverse, pur avendo diverse specializzazioni, hanno le medesime funzioni di base dell'intelligenza come dei processi emotivo-affettivi, lecito e possibile cercare di adattare un test, nato in una specifica cultura, al contesto culturale di un altro gruppo sociale. Cultura del test e cultura dei soggetti Le differenze fra la cultura del test e la cultura o subcultura dei soggetti si manifestano sia a livello del contenuto del test sia a quello dell'atteggiamento verso il test. Differenze nel contenuto del test Per quanto riguarda il primo aspetto, le diversit variano lungo un continuum. Da un lato vi sono divergenze superficiali, passeggere ed eliminabili, pertanto con opportune modifiche al reattivo i soggetti possono avere prestazioni paragonabili a quelle del gruppo di standardizzazione; dall'altro lato, invece, vi sono divari pi profondi, relativi alla specializzazione delle funzioni di base. Nel primo caso vi sono divergenze nella familiarit con gli stimoli proposti dal test. In questi casi per rendere giustizia ai soggetti con cultura diversa, per adattare il test alle loro caratteristiche sufficiente utilizzare la lingua parlata dal gruppo e item dal contenuto conforme alla loro cultura. Al lato opposto del continuum, invece, vi sono differenze pi profonde relative, ad esempio, alle abilit mnestiche o alle capacit di compiere ragionamenti. Qualora si voglia adattare un test a popolazioni che, rispetto al gruppo di standardizzazione originario, abbiano differenze di tale portata, bisogner apportarvi modifiche rilevanti, mutare la modalit di presentazione dei vari item, sostituirli con altri maggiormente sensibili ai processi psichici di tali popolazioni. Differenze nell'atteggiamento verso il reattivo Per quanto riguarda invece il secondo tipo di diversit fra la cultura o subcultura dei soggetti e la cultura del test, ossia il livello degli atteggiamenti verso il reattivo, le divergenze possono essere di vario genere:pu esserci meno motivazione, i soggetti possono essere meno abituati a quel tipo di prove, poco interessati. Per rimediare in alcuni casi baster eliminare limiti di tempo oppure fare precedere la somministrazione vera e propria da un training sia con la situazione di prova sia con
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

l'esaminatore; in altri casi invece l'adattamento richieder modifiche pi sostanziali e profonde, quali ad esempio utilizzare stimoli meno simili alle prove scolastiche. Considerazioni conclusive Aspetti da verificare per capire se realizzato un buon adattamento: Innanzitutto conveniente accertarsi che la teoria di riferimento, il costrutto teorico della versione modificata sia il medesimo di quella originaria. Inoltre fondamentale che il reattivo adattato sia stato standardizzato su un campione di soggetti rappresentativo della popolazione cui destinato, ossia che si siano ricavate adeguate norme specifiche per il nuovo gruppo culturale. Le propriet metriche(attendibilit, validit ed errore standard di misura) ricalcolate sul campione non devono essere peggiori di quelle del test originale. Infine, il reattivo non dovrebbe contrastare troppo con l'esperienza culturale del contesto, per rispettare il pi possibile la tradizione della popolazione considerata. Ossia, opportuno controllare che sia stata ridotta la distanza fra la cultura del test e quella del gruppo considerato, distanza manifestabile sia a livello del contenuto sia a livello dell'atteggiamento verso il reattivo. Cap 11: Guida pratica per la scelta di un test L'analisi del manuale Il costrutto La valutazione della qualit di un test richiede, attraverso l'analisi del contenuto del manuale tecnico che lo accompagna, una riflessione innanzitutto sul significato e sulla rilevanza del costrutto che esso si prefigge di misurare e, successivamente, sul significato dei punteggi che rappresentano la misura di quel costrutto. Ci sta a significare che il punteggio in se stesso non il costrutto, ma ne costituisce un'approssimazione o, pi precisamente, un'approssimazione del grado in cui quel costrutto caratterizza la persona cui si riferisce quel punteggio. In altre parole, valutare un test significa porsi due domande: a) Che cosa significa il costrutto? b) Quanto il punteggio del test riesce davvero a misurarlo Il primo passo nella valutazione di un reattivo psicologico, perci, quello di aver il pi possibile chiaro il costrutto cui si interessati e il modo in cui esso si manifesta in persone e in situazioni diverse; dopo di ci, occorre verificare se la propria definizione e la propria concettualizzazione dello stesso sono assimilabili a quella di chi ha sviluppato lo strumento che si intende applicare. Sono da prendere in considerazione due tipi di definizione del costrutto: quelle esplicitamente fornite nel manuale, e quelle implicite. Le definizioni implicite sono generalmente ricavabili dal tipo di item scelti dall'autore per misurare il costrutto, dai nomi dati alle subscale e dal tipo di considerazioni portate a sostegno del fatto che i punteggi sono realmente misura del costrutto. Occorre quindi verificare che le definizioni esplicite e implicite siano congruenti fra di loro, con la propria idea del costrutto e con l'uso che si intende fare dei punteggi ottenuti. Le caratteristiche psicometriche
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Il secondo aspetto da prendere in considerazione nella valutazione di un test quello che riguarda le sue caratteristiche psicometriche. Ci significa andare alla ricerca nel manuale di quegli elementi che garantiscono che esso indubbiamente misuri quel costrutto. Si deve verificare: -L'attendibilit: il grado di ripetibilit dei punteggi ottenuti con un test. Essa necessaria ma non sufficiente; necessaria perch dei punteggi incoerenti non hanno significato, non sono interpretabili, ma insufficiente perch uno strumento pu misurare qualcosa in modo costante e stabile, ma portare comunque a risultati senza senso. Non tutte le diverse procedure di calcolo dell'attendibilit sono equivalenti e intercambiabili. importante, quindi, considerare i coefficienti di attendibilit riportati dal manuale, con quali tipi di procedure sono stati calcolati e su quali gruppi di soggetti. Pi alti sono i coefficienti di attendibilit, maggiori sono la coerenza e la stabilit fra i punteggi ottenuti in situazioni diverse, minore l'errore standard di misura, cio la proporzione di varanza d'errore sulla varianza totale dei punteggi. I migliori manuali forniscono stime dell'attendibilit per differenti gruppi o popolazioni. -La validit: validare un test un processo di ricerca che consiste essenzialmente nel formulare delle ipotesi relative al significato dei punteggi e nel valutarne la plausibilit. Chi utilizza il test dovrebbe porsi le stesse domande che dovrebbero aver guidato il.processo di validazione di un test. Esse si riferiscono essenzialmente ai seguenti aspetti: 1) alla capacit degli item del test di rappresentare adeguatamente il costrutto e di soddisfare tutti gli elementi che lo costituiscono (validit di contentito). 2) alla possibilit di utilizzare il punteggio ottenuto nel test come elemento predittivo di un certo comportamento (validit predittiva). 3) alla relazione del punteggio con quelli ottenuti in altri strumenti che misurano lo stesso costrutto (validit concorrente e/o di costrutto). 4) alla relazione del punteggio in questione con quelli ottenuti con altri strumenti che misurano costrutti diversi (validit discriminante). 5) al significato e alla correlazione dei punteggi ottenuti in subscale diverse dello stesso test. Campione normativo Spesso il punteggio individuale in un test non interpretabile senza il confronto con quelli ottenuti da altre persone nello stesso test. Prima di fare affidamento sulle inferenze che si possono trarre da questo confronto, bisogna comunque individuare le caratteristiche del gruppo normativo. Con queste si intende: 1) La metodologia di selezione del campione 2) L'ampiezza del campione 3) L'attualit della selezione del campione e delle norme del test Gli item Il modo di interpretare un punteggio dipende anche dalla natura degli item del test. In generale ci sono tre criteri minimali per la valutazione dell'adeguatezza di un item: 1) il vocabolario utilizzato e il contenuto dell'item dovrebbero essere privi di bias nei confronti di qualsiasi gruppo; 2) l'item dovrebbe essere ad una sola dimensione, ossia riferirsi a un solo concetto o a un solo comportamento;
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

3) la formulazione di ogni item dovrebbe rappresentare il costrutto che viene misurato. Altri aspetti da considerare 1) i riferimenti teorici e metodologici del test: ossia il dibattito scientifico-teorico sul suo costrutto, sull'ambito principale di applicazione e sulla specificit dello strumento rispetto ad altri che intendono misurare la stessa caratteristica; 2) una descrizione dettagliata delle varie parti del test; 3) i destinatari del test: cio per quali persone stato costruito (ad esempio, i limiti d'et, il livello d'istruzione, ecc.); 4) obiettivi del test e suoi possibili usi: il manuale dovrebbe contenere una chiara definizione degli scopi del test, informazioni sul motivo che ha spinto gli autori a svilupparlo, e dovrebbe anche fornire prove convincenti sull'appropriatezza degli usi che di esso si possono fare; 5) possibili utilizzi impropri del test: ossia informazioni relative all'eventualit e alle conseguenze di un utilizzo non adeguato; 6) qualificazioni necessarie alla sua applicazione: il manuale dovrebbe specificare, se necessario, il tipo di formazione o di qualifica richieste al fine di utilizzare in modo appropriato lo strumento; 7) sviluppo del test e dei suoi item: l'utilizzatore ha il diritto di conoscere in modo dettagliato le ricerche, le procedure e le modalit seguite nello sviluppo del test e nella scelta degli item che lo compongono; 8) istruzioni per la sonamitaistrazione: ossia dettagliate informazioni sulla modalit d'uso dello strumento; 9) istruzioni per lo scoring: ossia precise indicazioni sulle procedure di attribuzione e di calcolo dei punteggi; 10) dati sui livelli e sul tipo di attendibilit, nonch sul gruppo rispetto al quale stata calcolata; 11) dati sulla validit: il manuale deve riportare prove convincenti del fatto che lo strumento possiede un soddisfacente grado di validit. responsabilit di chi lo utilizza valutare i dati presentati e considerarli in funzione dell'uso che ne vorr fare; 12) descrizione dettagliata del campione normativo: cio del gruppo sul quale lo strumento stato standardizzato, delle norme statistiche e delle tavole che permettano di trasformare direttamente i punteggi grezzi in punteggi standardizzati; 13) suggerimenti per una corretta interpretazione dei punteggi ottenuti nel test; 14) profili: se lo strumento composto da pi subscale o da una batteria di test, il manuale dovrebbe contenere la descrizione di alcuni profili caratteristici o tipici; 15) ricerche: dovrebbero essere riportate alcune ricerche che confermano le propriet dello strumento e le sue possibili applicazioni. Questioni pratiche nel processo di testing Un altro aspetto da prendere in considerazione nella valutazione di un test include: a) il modo in cui il test somministrato; b) come i punteggi vengono calcolati (lo scoring); c) il costo dell'utilizzo dello strumento. La somministrazione Le istruzioni relative alla somministrazione dovrebbero comprendere ogni accorgimento necessario ad assicurare l'interpretabilit dei punteggi. Esse dovrebbero: - specificare il tempo massimo necessario alla applicazione dello strumento;
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

- fornire indicazioni precise relative alla gestione degli item omessi; - dare suggerimenti pratici su come rispondere alle domande degli esaminati; - specificare la gamma d'et raccomandata per la somministrazione del test; - precisare il livello minimo indispensabile nell'abilit di lettura; - sottolineare l'importanza, se necessario, di una formazione specifica o di qualificazioni speciali da parte di chi usa il test. Lo scoring I principali metodi di calcolo dei punteggi sono quelli basati sul modello cumulativo, sul modello di categorizzazione e sul modello ipsativo. Secondo il modello cumulativo, pi alto il punteggio di una persona ad un test e maggiormente il costrutto misurato presente in essa. Il modello di categorizzazione, invece, prevede che, in base ai punteggi ottenuti, una persona sia inserita in una classe o categoria, con lo scopo della descrizione o della predizione. Infine, quando si usa il modello ipsativo per calcolare un punteggio, l'interesse quello di verificare se la prestazione dell'individuo si diversificata in maniera significativa rispetto a certe variabili. I costi Il costo monetario di un test dovrebbe essere valutato attentamente in relazione a tutte le considerazioni sin qui fatte sulla sua qualit: il basso prezzo potrebbe infatti riflettere la scarsa accuratezza con cui stato sviluppato, anche se non necessariamente un prezzo molto alto sta ad indicare che si tratta di uno strumento di qualit. Oltre al costo monetario devono essere presi in considerazione i costi sociali del test: ci particolarmente evidente nel caso in cui esso sia utilizzato per effettuare selezioni in contesti lavorativi ed educativi o per effettuare diagnosi in ambito clinico. Uso responsabile del test L'Associazione degli Psicologi Americani (APA) ha ripubblicato nel 1990, aggiornandoli, gli Ethical Standards formalizzando dei principi etici e deontologici per 1'utilizzo dei test. Pu essere interessante prendere in considerazione alcuni dei pi importanti principi, suddividendoli in aree: una relativa alle competenze necessarie all'applicazione di un reattivo psicologico; una che riguarda la necessit di una formazione continua al suo utilizzo; e una che attiene, infine, all'importanza della relazione psicologo-esaminato. Competenza Tale requisito si basa sui seguenti elementi: a) una conoscenza teorico-metodologica dello strumento: a chi lo utilizza si richiede sia una conoscenza dei presupposti teorici cui esso fa riferimento sia la piena padronanza delle operazioni di somministrazione e di scoring; b) la selezione dello strumento appropriato in relazione allo scopo e ai destinatari della misurazione: c) l'integrazione di dati convergenti provenienti da diversi test
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

Formazione a) formazione all'utilizzo degli strumenti b) aggiornamento continuo: molti degli strumenti vanno periodicamente incontro a delle revisioni che rendono necessario un aggiornamento sulle caratteristiche psicometriche e sulle metodiche applicative, a garanzia di un loro utilizzo attuale c) confronto fra utilizzatori dello stesso strumento d) sensibilit per le minoranze e i ceti svantaggiati dal punto di vista socioculturale: E responsabilit dell'autore di un test, nella fase di sviluppo, e dell'utilizzatore, nella fase di somministrazione e di interpretazione dei risultati, operare nella piena consapevolezza del significato, del valore e dei limiti che quello strumento pu avere per un certo tipo di utenza. Relazione psicologo-esaminatore a) creazione e mantenimento di un setting adeguato: l'utilizzatore responsabile consapevole dell'influenza delle variabili ambientali e relazionali sulla prestazione da parte di coloro cui viene somministrato il test. b) Rispetto della privacy c) Restituzione: passaggio di informazioni circa i risultati tra psicologo e utente Fonti di informazione sui test Lutilizzatore dovrebbe avere o acquisire una certa familiarit con alcune pubblicazioni specialistiche. Una delle fonti di informazioni pi completa e autorevole costituita dalla serie dei Mental Measurement Yearbooks, che contengono rassegne storico-critiche e notizie relative alla maggior parte, dei test pubblicati in tutto il mondo e in commercio. Ogni nuovo volume della serie contiene le informazioni relative agli ultimi test pubblicati ed anche rassegne aggiornate di quelli pi importanti gi analizzati nei volumi precedenti. Un'altra importante fonte di informazioni sui test Tests Critiques che fornisce una descrizione dei test e ne discute in maniera critica applicazioni pratiche e particolarit tecniche. Infine, Goldman e Mitchell pubblicano periodicamente dei volumi nei quali si possono trovare descrizioni e riferimenti bibliografici completi per la maggior parte dei test pubblicati in lingua inglese ma non ancora disponibili sul mercato. Altre notizie utili sui test possono essere reperite in riviste internazionali specializzate che contengono sia sintesi di ricerche effettuate sull'attendibilit e sulla validit di vari strumenti, sia delle revisioni teorico-critiche. In Italia da molti anni opera una casa editrice (le Organizzazioni Speciali di Firenze), specializzata nella pubblicazione e nella distribuzione dei reattivi psicologici disponibili in versione italiana. Inoltre questa pubblica il Bollettino di Psicologia Applicata, nel quale trovano ampio spazio studi sull'adattamento e sulla standardizzazione di nuovi strumenti testistici, nonch recensioni e rassegne sui pi recenti sviluppi della psicometria. Considerazioni conclusive Nel valutare la qualit di un test le domande pi rilevanti da porsi riguardano: 1) Il costrutto 2) L'obiettivo della misurazione (interpretativo, descrittivo o decisionale) 3) I destinatari
OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006

4) La documentazione (esiste una documentazione completa ed esauriente che fornisca garanzie che lo strumento in questione effettivamente misuri il costrutto) 5) L'attendibilit 6) La validit 7) Il campione normativo (se il manuale del test, o altre fonti autorevoli, riportano informazioni esaurienti sul campione normativo) 8) La somministrazione 9) Lo scoring (se chiara e operativamente ben definita la modalit di calcolo dei punteggi) 10) I costi monetari e sociali dell'utilizzo del test 11) L'uso responsabile di un test (principi etici)

OPsonline.it la principale web community italiana per studenti e professionisti della Psicologia Appunti desame, tesi di laurea, articoli, forum di discussione, eventi, annunci di lavoro, esame di stato, ecc E-mail: info@opsonline.it Web: http://www.opsonline.it Gestito da Obiettivo Psicologia srl, via Castel Colonna 34, 00179, Roma - p.iva: 07584501006