Sei sulla pagina 1di 16

Capitolo 2

Misurazione e scale attitudinali

2.1 Il problema della misurazione nelle ricerche di mer-


cato
La ricerca di mercato richiede una o piu misurazioni funzionali alloggetto di studio, come
ad esempio la probabilita di acquisto di un prodotto di nuova concezione, se un individ-
uo preferisca una marca piuttosto che unaltra, la modalita preferita di un determinato
attributo, come il colore di un autoveicolo, etc.
Per misurazione si intende il processo mediante il quale si assegnano valori numeri-
ci (punteggi) alle caratteristiche, proprieta o attributi di oggetti, eventi, stati o individui,
secondo regole predefinite. E utile distinguere diversi livelli o scale di misurazione a sec-
onda delle proprieta che soddisfano e dellinsieme delle trasformazioni ammissibili: per
queste ultime si intende qualsiasi trasformazione dei valori numerici che lascia inalterato
il significato della scala originaria.

Scala nominale Le unita sono classificate in funzione dellappartenenza ad una parti-


colare classe o modalita (principio di identita). Si pensi alla classificazione di un
campione di consumatori in ragione del motivo per il quale e stata accordata la pref-
erenza ad un determinato esercizio commerciale (vicinanza, promozioni, spaziosita,
etc.).

Scala ordinale Oltre al principio di identita vale il principio di ordinamento, per cui, date
due misurazioni, x e y, si puo affermare x < y ovvero x = y ovvero x > y. Si
possono elencare gli oggetti secondo un certo ordine, ma non e possibile valutare la
differenza di intensita con cui il carattere o attributo e presente nellunita. Tutte le
trasformazioni monotoniche sono ammissibili, in quanto preservano lordinamento.
La scala ordinale risulta importante per le ricerche di mercato, in cui buona parte
delle misurazioni cadono in questa categoria.

12
Scala ad intervallo Oltre alle caratteristiche delle scale precedenti, le differenze sono
comparabili, ovvero a distanze numeriche uguali sulla scala corrispondono distanze
eguali con riferimento al carattere considerato: tra 1 e 3 passa la stessa differenza
che esiste tra 15 e 17. Pertanto, e lecito confrontare lintensita del fenomeno in
unita diverse. Tuttavia, non esiste una origine naturale e lunita di misurazione
e arbitraria ed e ammissibile la classe delle trasformazioni lineari del tipo y =
a + bx (un esempio classico riguarda la misurazione delle temperature, che puo
essere effettuata mediante i gradi Celsius e Farenheit; per la conversione si utilizza
la relazione C = (5F 160)/9). Un ulteriore esempio e rappresentato dal tempo t
di un evento, la cui origine viene fissata a partire da un tempo t0 arbitrario.
Date due misurazioni effettuate sugli individui i e j mediante la medesima scala
ad intervallo, contrassegnate rispettivamente da yi e yj ha senso operare i confronti
yi yj e yj yi , al fine di misurare la differenza di intensita.
Scala di rapporti A differenza della scala precedente, esiste unorigine naturale (zero
assoluto) che denota lassenza del carattere. Esempi di misurazioni su questa scala
sono le vendite, i costi di una impresa, la quota di mercato. La scala prende il nome
dal fatto che, date due misurazioni effettuate sugli individui i e j, contrassegnate
rispettivamente da yi e yj , oltre alle differenze yi yj , ha senso calcolare i rapporti
yj /yi o viceversa. I valori numerici sulla scala riflettono non solamente il possesso
della caratteristica, lordine e le differenze nellordine di grandezza, ma anche la
dimensione assoluta. La classe delle trasformazioni ammissibili e del tipo y = cx
(si pensi alla conversione di una grandezza economica in altra valuta).
Si osservi che lordine di presentazio delle scale riflette il fatto che il contenuto infor-
mativo delle scale e crescente, nel senso che nel passaggio alla successiva si aggiunge una
proprieta non posseduta dalla scala precedente.
I metodi di sintesi ed analisi validi per una particolare scala non sono sempre es-
tendibili alle scale con minore contenuto informativo. Ad esempio, con riferimento al
calcolo di un indicatore di sintesi della distribuzione dei valori di una misurazione, e im-
mediato riconoscere che la mediana sia ammissibile per la scala ordinale e successive, la
media per la scala ad intervallo e di rapporti, un numero indice solo per quella di rapport;
mentre la moda e definita per tutte le scale.
Questo argomento non deve indurre a tentare di utilizzare sempre la scala di rapporti:
solitamente esiste un livello ottimale di misurazione a seconda del fenomeno sottostante,
tale per cui la scala naturale per un carattere come il sesso e quella nominale. E con-
sentito, tuttavia, declassare il livello di misurazione, ad esempio passando da una scala di
rapporti ad una ordinale suddividendo in classi un fenomeno come le vendite.
Una classificazione piu rozza distingue le misurazioni qualitative (nominali e ordi-
nali) da quelle quantitative (ad intervallo e di rapporti). Le prime sono anche dette cat-
egoriche, dal momento che le modalita di manifestazione sono raggruppate in categorie
mutualmente esclusive ed esaustive, sconnesse (sesso) o ordinate (titolo di studio).

13
Un ulteriore classificazione e opera la distinzione tra misurazioni continue, il cui codo-
minio e rappresentato dallinsieme dei numeri reali e quelle discrete. Ad esempio, il
numero di esami sostenuti rappresenta una misurazione su scala di rapporti quantitativa e
discreta.

2.2 La misurazione delle attitudini


La misurazione puo riguardare elementi fattuali (es. consumo di latte nel mese di gen-
naio) e elementi non fattuali, come le attitudini (es. fedelta alla marca) e le opinioni.
Nella prima fattispecie esiste un valore vero sottostante linformazione richiesta che puo,
almeno in linea di principio, essere determinato da fonti esterne alternative alla rispos-
ta dellintervistato. Come importante conseguenza si ha che misurazioni possono essere
validate. Nel secondo caso questo non avviene. Un ulteriore elemento di differenziazione
e ravvisabile nei fattori che condizionano la risposta e lerrore di misura (si veda [6]): nel
primo caso la definizione, comprensione, memoria, desiderabilita sociale; nel secondo la
formulazione del quesito, la presenza di alternative bilanciate, lordine di presentazione
dei quesiti e delle alternative, etc. Una categoria intermedia riguarda il giudizio personale
su fatti concreti (es. come giudica lo stato delleconomia?).
Il rilievo della misura delle attitudini sta nel fatto che si ritiene che queste condizionino
il comportamento degli utenti/consumatori, per cui ha rilievo per la funzione di marketing
conoscere i fattori che presiedono alla loro formazione.

2.2.1 Costruzione delle scale attitudinali


Una scala attitudinale costituisce un caso particolare di misurazione e puo essere costruita
mediante tecniche diverse. Lidea fondamentale che accomuna queste tecniche e che le
attitudini possano essere rappresentate in uno spazio unidimensionale (ad es. lungo una
retta): i rispondenti possono essere ordinati in funzione dellintensita della loro attitudine
lungo un continuo.
E questione assai dibattuta se le misurazioni cui danno origine siano ad intervallo o
semplicemente ordinali. Una rilevante distinzione e tra le scale attitudinali semplici, o a
quesito singolo, e le scale attitudinali complesse, o a quesiti multipli. Spesso, la com-
prensione dei fattori che presiedono alla formazione delle attitudini richiede limpiego
di quesiti multipli (es. percezione e valutazione dei servizi offerti da un istituto di cred-
ito). E stato mostrato che i quesiti diretti sono non affidabili, dimostrando scarsa sta-
bilita temporale; i quesiti multipli aumentano laffidabilita della scala, poiche possono
essere viste come misure ripetute del dominio di misurazione; sono inoltre imprecisi
poiche restringono il livello di misurazione a quello nominale e tendono a categorizzare
i rispondenti in due gruppi senza cogliere le sfumature allinterno; infine, lattitudine o

14
il fenomeno da misurare presenta sfumature che non possono essere colte con un quesito
singolo.

2.3 Scale attitudinali semplici o di valutazione (rating scales)


Le scale semplici realizzano una misurazione diretta dellattitudine o delle sue compo-
nenti attraverso un quesito singolo: il rispondente e chiamato ad indicare la sua posizione
lungo una scala di misurazione delle attitudini prestabilita.
I possibili campi di applicazione vanno dalla misurazione dellattitudine o preferenza
generale verso un oggetto, prodotto, marca etc, allintensita con cui un oggetto possiede
un determinato attributo, allatteggiamento individuale verso un attributo (es. gusto), fino
allimportanza assegnata ad un particolare attributo (es. contenuto di caffeina).
La caratteristica fondamentale va ravvisata nella circostanza che il soggetto che ef-
fettua la valutazione colloca loggetto valutato in un punto lungo un continuo o in una
delle categorie ordinate in successione; un valore numerico e assegnato al punto o alla
categoria.
Solitamente si opera una distinzione tra scale non comparative e scale comparative, a
seconda della natura assoluta o relativa della valutazione.

Noncomparative rating scales (scale di valutazione non comparativa) Al rispon-


dente viene richiesto di valutare un oggetto (prodotto) senza far riferimento ad uno stan-
dard prefissato o ad oggetti concorrenti; conosciute anche come scale monadiche poiche
solo un prodotto o marca e valutato. Il loro principale impiego e nella fase di test della
concezione di un prodotto nuovo. Ad esempio, si puo condurre unintervista personale
di un numero prefissato di individui presso un centro commerciale; ciascun intervistato
prova il prodotto e dichiara una delle seguenti alternative: 1. Sicuramente acquistero 2.
Probabilmente acquistero 3 Forse acquistero 4. Forse non acquistero. 5. Probabilmente
non acquistero 6. Sicuramente non acquistero. La percentuale di risposte che rientrano
nelle valutazioni piu favorevoli (prime due) fornisce il top box score.
A seconda delle modalita di presentazione distinguiamo:

Scale grafiche di valutazione non comparativa: (scale di valutazione continue) al


rispondente viene richiesto di fornire la sua valutazione apponendo un segno su una
linea che si estende da un estremo allaltro dellattitudine:
E soddisfatto dei servizi offerti dalla banca x?

Molto Per niente

Scale categoriche di valutazione non comparativa: il rispondente puo scegliere


tra un limitato numero di opzioni ordinate a seconda della loro posizione sulla

15
scala. Costituisce lo strumento di misura delle attitudini piu largamente utilizza-
to. Non esiste una formula che sia univocamente migliore delle altre. Le opzioni
- categorie - possono essere descritte verbalmente o possono essere numeriche (es.
scala percentuale). Il numero delle categorie dipende dalla natura dellattitudine
misurata.
E soddisfatto dei servizi offerti dalla banca x?

Molto Abbastanza Poco Per niente


soddisfatto soddisfatto soddisfatto soddisfatto

Una decisione importante riguarda luso di opzioni bilanciate (scale simmetriche) o non
bilanciate (scale asimmetriche); le prime implicano un identico numero di opzioni fa-
vorevoli e sfavorevoli; in questo caso ha rilievo se un numero pari o dispari di opzioni
viene scelto. Nel secondo caso la modalita centrale e neutrale. Lesperienza dimostra
che linclusione della modalita neutrale incide sui risultati. Se ci si attende che una parte
del campione non abbia alcuna valutazione da esprimere si dovrebbe porre una opzione
esterna alla scala del tipo: nessuna opinione, non so.
E soddisfatto dei servizi offerti dalla banca x?
Molto Abbastanza Poco Per niente Non
soddisfatto soddisfatto soddisfatto soddisfatto so

Comparative rating scales (scale di valutazione comparative) Nel caso precedente la


valutazione individuale non fa riferimento ad uno standard comune. Una scala comparati-
va viene utilizzata nei casi in cui si desidera un comune riferimento per tutti i rispondenti
(ad esempio una o piu marche concorrenti).
Misure binarie di preferenza e discriminazione. Sono comunemente impiegate nel
campo della misurazione della capacita del consumatore di saper discriminare tra
diverse versioni dello stesso prodotto o tra marche e della preferenza tra versioni
alternative del prodotto da introdurre sul mercato.
Nella Paired comparison al rispondente vengono presentati due oggetti (marche,
prodotti, attributi) alla volta tra cui deve selezionarne uno in base ad un criterio
prestabilito (similarita o preferenza). Tale tecnica e generalmente limitata ad un
attributo e poche marche, poiche per n marche, sono richiesti n(n 1)/2 confronti.
La misurazione puo essere effettuata su una scala nominale (la marca A e simile
alla/migliore della marca B ovvero mediante una scala ordinale o ad intervallo:

Simile Diversa
Migliore Peggiore

16
Nel primo caso si ottiene una graduatoria tra le marche contando il numero delle
volte in cui viene preferita (ad esempio, se nei 6 confronti binari concernenti quattro
marche - A, B, C, D - si ha che esse vengono preferite rispettivamente 2,3,0,1 volte,
allora si ottiene la scala attitudinale di tipo ordinale B>A>D>C).
Una variante, Double-Paired comparison, mira a misurare sia la capacita di discrim-
inare che la preferenza. Il confronto riguarda 4 oggetti che consistono in due cam-
pioni identici delloggetto A e delloggetto B. Lindividuo ripete la comparazione a
coppia due volte e si considera la consistenza dei risultati.
Nella Triangle Discrimination and Triangle Preference al rispondente vengono
forniti due esemplari di un prodotto e un solo esemplare dellaltro; nella prima
deve identificare lesemplare unico per poi rispondere ad una domanda sulla pref-
erenza. Nella seconda deve ordinare i tre esemplari: coloro che hanno capacita
discriminatoria collocheranno lesemplare unico al primo o al terzo posto.

Misure ordinali di valutazione (Rank Order Rating Scales). Al rispondente viene


richiesto di ordinare un insieme di oggetti in base ad un criterio prestabilito o con
riferimento ad un oggetto che funge da standard. E essenziale che nellinsieme
delle alternative siano contemplate tutte le marche o tutte le versioni del prodotto
rilevanti. Il metodo e ampiamente utilizzato per confronti tra marche e attributi del
prodotto, risultando meno time-consuming del confronto binario e consentendo un
confronto piu realistico; di semplice gestione, ha il difetto di produrre soltanto dati
ordinali e consente solo un limitato numero di analisi.
Il confronto puo essere semplificato richiedendo di effettuare un ordinamento a piu
stadi, tale che ad esempio, il primo ordinamento consiste nellallocazione degli
oggetti ad un numero limitato di gruppi mutualmente esclusivi caratterizzati da
diversi livelli di similarita o preferenza. Successivamente si ordinano gli oggetti
allinterno dei gruppi.

La scala a somma costante: il rispondente deve distribuire una somma costante (100)
tra diverse marche o diversi attributi del prodotto in modo tale da riflettere la pref-
erenza relativa per ciascun oggetto, limportanza di un attributo o il grado con cui
un attributo e presente in un determinato prodotto. I valori individuali sono poi
sommati per produrre una scala di rapporti.

Qui di seguito sono elencate 5 caratteristiche di una calzatura da passeg-


gio. Le viene ora richiesto di distribuire 100 punti tra le caratteristiche
considerate in relazione alla loro importanza. Quando avra terminato si
assicuri che la somma dei punti attribuiti sia esattamente pari a 100 (se
ritiene che una caratteristica sia del tutto irrilevante assegni punteggio
0):

17
Comoda da indossare
Conveniente
Alla moda
Di marca prestigiosa
Conveniente
100

2.4 Scale attitudinali complesse


Lo sviluppo di una scala attitudinale segue un processo che comporta piu stadi. I principali
possono essere di seguito sintetizzati:

Definizione del costrutto



Costruzione - disegno della scala

Test pilota

Somministrazione del questionario e item analysis

Validazione della scala

Il primo stadio concerne la definizione coerente delloggetto della misurazione (fedelta


alla marca, soddisfazione; nel secondo si rende operativa la misurazione mediante lin-
dividuazione di una batteria di quesiti (item) legati al dominio di misurazione. Questi
vengono testati su un campione pilota al fine di verificarne in via preliminare la consis-
tenza interna e la validita; cio consentira di evitare ridondanze e di eliminare i quesiti am-
bigui. Segue la fase della somministrazione del questionario al campione e dello spoglio
dei risultati, i quali vengono poi sintetizzati in una scala attitudinale. Nella fase finale si
valida la scala, nel senso che se ne valuta la capacita di misurare il costrutto per la quale
e stata costruita.
Qui di seguito illustriamo alcune delle tecniche disponibili per il disegno della scala.
Queste differiscono prevalentemente per la formulazione dei quesiti nel secondo stadio.
Approcci alternativi (scalogramma di Guttman, scale fattoriali) sono descritti in [7], cap.
6.

2.4.1 Scala di Thurstone o equintervallata


La costruzione della scala attitudinale passa attraverso le seguenti fasi: a) Si colleziona
un numero m di statement o quesiti sufficientemente elevato, nei confronti dei quali lin-
tervistato dovra manifestare il proprio assenso o dissenso. b) viene reclutato un numero

18
elevato di giudici, ai quali si chiede di ordinare in 11 gruppi i quesiti in ragione del-
la loro connotazione (positiva o negativa) nei confronti del dominio di indagine. c) Per
ciascun quesito si calcola il valore mediano ed il campo di variazione. Ad esempio, con
riferimento alli-esimo statement, se i giudici sono 100:
Score 1 2 3 4 5 6 7 8 9 10 11 Tot
Frequenze 0 0 0 0 4 11 25 35 20 5 0 100
il punteggio mediano risulta pari a 8 ed il campo di variazione e 5. d) Sono eliminati i que-
siti che presentano dispersione piu elevata, e che pertanto sono piu ambigui e si seleziona
un numero ridotto (20-30) di quesiti in modo da coprire lintero spazio di misurazione
delle attitudini. e) I quesiti scelti sono sottoposti al campione di individui f) Il valore del-
la scala attitudinale per il rispondente viene ottenuto considerando il punteggio mediano
realizzato sulle affermazioni con le quali egli e daccordo.
La scala di Thurstone presenta i seguenti punti critici: (i) individui che presentano
pattern di risposta diversi possono avere lo stesso punteggio attitudinale; questo punto
e peraltro comune a tutte le scale attitudinali complesse e consegue dalla monodimen-
sionalita della misurazione attitudinale. (ii) Il metodo non consente di cogliere lintensita
delle preferenze, essendo basato sul semplice accordo/disaccordo con determinate affer-
mazioni. Cio motiva il ricorso alla formulazione degli item su una scala ad intervallo,
effettuato nella scala di Likert e del differenziale semantico. (iii) La tecnica e costosa
e time-consuming. (iv) I risultati sono condizionati dalloperato dei giudici, che non
necessariamente riflettono la popolazione di riferimento.

2.4.2 Scala di Likert (summated ratings)


La scala di Likert differisce dalla precedente per la modalita di presentazione dei que-
siti. Il rispondente indica il suo grado di accordo o disaccordo rispetto ad una serie di
affermazioni:

Concordo Concordo Non concordo Dissento Dissento


pienamente ne dissento fortemente

Le categorie di risposta sono multiple e cio consente di aumentare la precisione con


qui cogliamo le differenze attitudinali. A ciascuna categoria di risposta viene assegnato
un punteggio es. {1, 2, 3, 4, 5} o {2, 1, 0, 1, 2}. Si noti che la scala non possiede
unorigine naturale e qualunque trasformazione lineare y = a + bx della medesima risulta
ammissibile, vale a dire non altera la natura della misurazione. Il punteggio totalizzato
da un individuo fornisce il valore numerico dellattitudine sulla scala prescelta. Per gli
statement che hanno una connotazione negativa si richiede il rovesciamento della scala
dei punteggi attribuiti a quelli con connotazione positiva.

19
2.4.3 Scala del differenziale semantico
Si caratterizza per limpiego di aggettivi bipolari:
Gradevole Sgradevole
Caro Economico
Veloce Lento

Gradevole 1 2 3 4 5 6 7 Sgradevole
Inutile 1 2 3 4 5 6 7 Utile

Il numero di modalita presentate e solitamente dispari e la modalita centrale e neutrale. Il


problema fondamentale di questa scala sta nel fatto che non e sempre possibile trovare una
coppia di aggettivi che siano in completa opposizione dal punto di vista semantico. Ai fini
della misurazione attitudinale in senso stretto, si assegna a ciascun quesito un punteggio
tra 1 e 7 o da -3 a +3; come nel caso precedente lorigine dellintervallo e arbitraria.
Una versione semplificata e la scala di Stapel. Non e bipolare, ma le frasi descrittive e
gli aggettivi sono presentati separatamente; inoltre i punti sulla scala sono identificati da
numeri e il numero di posizioni lungo la scala e pari (manca la modalita neutrale). Risulta
di piu facile gestione in alcuni tipi di intervista, ed in particolare in quella telefonica.

Es.: Lorario di apertura e

Soddisfacente
-3 -2 -1 1 2 3

2.4.4 Analisi aggregata e del profilo


Il set informativo completo di una misurazione attitudinale puo essere organizzato come
evidenziato nella tabella 2.1.
Le analisi consentite sono

Analisi aggregata: i punteggi individuali sono sommati per ottenere un punteggio


individuale complessivo, yh. , che costituisce la misura dellattitudine per lindivid-
uo h; i dati individuali o per gruppi di individui sono poi confrontati.

Analisi del profilo: viene calcolato il punteggio totale, medio o mediano assegnato
dai rispondenti o da un particolare gruppo a ciascuno degli item: nel primo caso si
ottiene y.i , ed il profilo e identificato nellultima riga della tabella 2.1. Lanalisi del
profilo viene utilizzata per identificare i punti deboli e forti delloggetto o costrutto
che viene misurato.

20
2.5 Analisi dellaccuratezza di una misurazione attitudi-
nale
Una misurazione, implicando una regola mediante la quale si procede allassegnazione di
un numero agli oggetti, presenta necessariamente un carattere convenzionale.
Nel caso della misurazione di elementi fattuali una misurazione y puo essere scissa
nelle seguenti componenti: 1. Valore vero della caratteristica (Y ) 2. Errore di misurazione
e. Con riferimento al secondo si opera la distinzione tra errore sistematico (bias) ed errore
casuale. Pertanto, y = Y + e.
Lerrore di misurazione riflette: a) le caratteristiche strutturali delloggetto o dellin-
dividuo rispondente che conseguono dalla sua sensibilita e livello di istruzione; b) la
situazione transitoria del rispondente, dipendente dallo stato emotivo, di fatica, bisogno
etc.; c) il contesto della misurazione; d) il metodo di raccolta dei dati (nel caso delle inter-
viste personali si parla di effetto dellintervistatore); e) gli strumenti di raccolta dei dati:
il questionario puo contenere quesiti ambigui o irrilevanti; f) errori di risposta; g) errori
nellinterpretazione, codifica, tabulazione e analisi dei dati.
Nel caso della misura delle attitudini, si opera una distinzione che presenta molte
analogie con la precedente, anche se non e possibile parlare di valore vero. Laccuratezza
viene cos a presentare due aspetti logicamente distinti: la validita e laffidabilita.

Affidabilita (reliability) Rappresenta la trasposizione nel contesto attitudinale della nozione


di errore casuale: lidea e che una scala a quesiti multipli effettua misurazioni ripetute del-
lo stesso dominio e pertanto le diverse misurazioni dovrebbero rivelarsi sufficientemente
stabili. Laffidabilita presenta due aspetti: la consistenza temporale (test-retest reliability),
per cui la scala deve tendere a produrre lo stesso risultato in due misurazioni successive;
inoltre, deve avere consistenza al suo interno (internal consistency reliability), in cio che
i quesiti multipli, che mirano a misurare lo stesso costrutto, siano fortemente interrelati.

Tabella 2.1: Scale attitudinali complesse: analisi aggregata e del profilo


Item
Unita 1 2 i k Totale
1 y11 y12 y1i y1k y1.
2 y21 y22 y2i y2k y2.
.. .. .. . .. ..
. . . .. . .
h yh1 yh2 yhi yhk yh.
.. .. .. .. .. ..
. .
. . . .
n yn1 yn2 yni ynk yn.
Totale y.1 y.2 y.i y.k
P P
yh. = ki=1 yhi , y.i = nh=1 yhi

21
Validita (validity) Indica la capacita della scala di misurare il costrutto per la quale e
stata costruita e rappresenta la trasposizione della nozione di bias al contesto attitudinale.
Se la scala e affidabile, sicuramente misura qualcosa; non e detto, tuttavia, che misuri il
costrutto desiderato. La validita risulta estremamente difficile da valutare e da quantificare
dal punto di vista empirico, dal momento che il costrutto comporta spesso un elevato
grado di astrazione.

2.5.1 Metodi per la valutazione dellaffidabilita


1. Test-Retest. Al fine di verificare la consistenza temporale della scala, la misurazione
attitudinale viene ripetuta utilizzando la stessa tecnica di rilevazione in condizioni
equivalenti, per quanto possibile, e si giudica il grado di rispondenza. Sorgono tut-
tavia alcuni problemi: alcune grandezze possono essere misurate soltanto una volta
(es. reazione ad uno slogan pubblicitario); la prima misurazione ha modificato la
caratteristica da misurare (lattitudine e cambiata) e produce un effetto di trasci-
namento sulla misurazione finale; fattori estranei possono essere intervenuti (es.
nuova marca non provata prima).
2. Modelli alternati di rilevazione. La consistenza interna della scala viene valutata
effettuando la stessa misurazione mediante due strumenti o modelli di rilevazione
equivalenti o il piu possibile simili. Questa tecnica e soggetta ad alcune ovvie
limitazioni, concernenti il costo e il tempo necessario per ottenere e confrontare
le due rilevazioni; il problema piu rilevante sta tuttavia nella difficolta di ottenere
lequivalenza sostanziale tra i modelli alternati.
3. Item Analysis. Laffidabilita (consistenza interna) viene stimata mediante la corre-
lazione esistente tra i quesiti. Questa analisi e nota in letteratura come item analysis
e mira a selezionare quei quesiti che presentano correlazione piu elevata con i ri-
manenti. In sede di test pilota la valutazione dellaffidabilita e affidata ai giudici
(scorer), che assegnano separatamente punteggi numerici ai quesiti; la correlazione
tra i punteggi viene poi utilizzata per selezionare i quesiti. In sede di validazione
della scala, due opzioni sono disponibili:
(a) Split-half reliability: i quesiti sono divisi in due gruppi di uguale numerosita
con assegnazione casuale o sistematica (pari/dispari) ed i punteggi totalizzati
dai rispondenti sono correlati. Il limite principale di questa operazione sta
nellarbitrarieta della divisione in gruppi, per cui difficilmente la correlazione
misura la consistenza interna della scala.
(b) Coefficiente di reliability: una misura sintetica della consistenza interna della
scala e fornita dal cosiddetto coefficiente alpha di Croenbach:
" Pk #
2
k i=1 i
= 1 , (2.1)
k1 t2

22
dove k rappresenta il numero degli item; i2 la varianza dei punteggi relativi
allitem i, t2 la varianza dei punteggi totali (il punteggio totale per ciascun
individuo e la somma dei punteggi realizzati sui singoli item). In particolare,
n n
1X 1X
i2 = (yhi y.i )2 , t2 = (yh. y.. )2 ,
n h=1 n h=1
P P
con y.i = h yhi /n e y.. = h yh. /n.
Il coefficiente tende a 1 al crescere della consistenza interna; come regola em-
pirica dovrebbe risultare almeno pari a .7. Si puo fare unanalisi di sensibilita
eliminando un item alla volta e registrando la variazione del coefficiente. Sotto
opportune ipotesi si mostra che
k

1 + (k 1)

dove rappresenta la media aritmetica dei coefficienti di correlazione tra gli


item.

2.5.2 Validita
La valutazione della validita di una misurazione e solitamente piu complicata ed implica
i seguenti aspetti:

1. Content validity - validita di contenuto. Grado di adeguatezza con cui la mis-


urazione cattura il dominio di definizione della grandezza. Si supponga ad es-
empio di voler valutare il grado di conoscenza del vocabolario della lingua ital-
iana posseduto dalla popolazione: se ci limitassimo a chiedere il significato di
parole quali Ossimoro, chiasmo, enallage, climax, la scala (ad es. percentuale di
popolazione che conosce ciascuno dei termini) misurerebbe il grado di conoscenza
delle figure retoriche (filologia), un sottoinsieme molto specialistico dei termini del
vocabolario.

2. Concurrent validity (concomitanza con altre variabili o costrutti): misura in cui il


risultato della misurazione di una variabile per un individuo puo essere utilizzato per
predire una diversa misurazione di una grandezza collegata per lo stesso individuo.
Puo essere sottoposta a verifica rilevando caratteristiche che hanno una relazione
con la scala di interesse e calcolando la correlazione.

3. Predictive validity: la misurazione corrente e quelle passate consentono di predire


il comportamento dellindividuo nel futuro. Ad esempio, il test di ingresso per il
diploma o per un corso universitario ha capacita predittiva circa il il voto finale?

23
Appendice 1: formula alternativa per il calcolo del
coefficiente di reliability
Si parta dalla considerazione della varianza dei punteggi totali individuali, t2 ; questa
puo essere riscritta:
k
X k X
X k
t2 = i2 + ij ,
i=1 i=1 j6=i

dove P
ij = n1 nh=1 (yhi y.i )(yhi y.i )
= ij i j
e ij = ij /(i j ) rappresenta il coefficiente di correlazione lineare tra i punteggi asseg-
nati agli item i e j.
Sostituendo nellespressione (2.1) e assumendo i2 = j2 = 2 , vale a dire che lo
varianza degli item sia costante, che appare plausibile se nella fase di verifica preliminare
della scala attitudinale sono stati eliminati i quesiti piu ambigui, caratterizzati da maggiore
dispersione, P
k
k i2
= k1
1 i=1
t2
P P
k
i ij i j
= P i Pj6=P
k1 2 + i
j6=i ij i j
i 2 iP P
k iP P

j6=i ij
= k1 k 2 + 2
h ii j6=i ij
k k(k1)
= k1 k+k(k1)
k
= 1+(k1)

dove si e posto P P
i ij
j6=i
= ,
k(k 1)
che rappresenta la media dei k(k 1) coefficienti di correlazione tra gli item.

24
Appendice 2: Reliability e analisi del profilo per il data set
kasi-tv
Qui di seguito viene riportato il set di comandi in R per la misurazione dellaffidabilita
mediante il coefficiente e per lanalisi aggregata e del profilo con riferimento ad un data
set contenente le valutazioni di 50 telespettatori di un conduttore di telegiornale in base
a 19 quesiti organizzati secondo la tecnica del differenziale semantico (cfr. esercizio 1
dellappendice B).
> kasi <- read.table("kasi-tv.dat", header=T)
> revscore <- c(1,2,4,6,8,9,11,14,15,17)

> kasi[,revscore] <- 8-as.matrix(kasi[,revscore])


> totscore <- apply(kasi,1,sum)
> summary(totscore)
Min. 1st Qu. Median Mean 3rd Qu. Max.
56.00 77.25 87.50 87.54 96.00 118.00
>
> profilo <- apply(kasi,2,mean)
> profilo
a b c d e f g h i j k l m n o p
5.22 4.82 4.84 4.76 3.10 4.86 4.14 5.52 5.74 5.00 4.12 4.62 3.80 5.18 5.24 4.54
q r s
3.12 4.20 4.72

> hist(totscore, 15, main= "Attitudine",


freq=FALSE, ylab = "", xlim=c(19,19*7),ylim=c(0,.05))
> lines(density(totscore),col="blue")
> lines(density(totscore,kernel="epanechnikov",bw=3),col="red")
> boxplot(totscore, main="Boxplot attitudine", col="green")
> boxplot(kasi,main="Boxplot item",col = "lightgray",cex=0.012)
> barplot(profilo,names.arg=names(kasi),ylim=c(1,7),space=2,main="An. del profilo
> abline(h=3.5)

> ckasi <- cor(kasi)

> s2t <- var(totscore)


> s2k <- diag(var(kasi))
> k <- ncol(kasi)

> alpha <- (k/(k-1))*(1-sum(s2k)/s2t)


> alpha
[1] 0.8832967
>

25
> rho.medio <- (k2/(k*(k-1))*(mean(ckasi)-1/k))
> alpha2 <- k*rho.medio/(1+(k-1)*rho.medio)
> alpha2
[1] 0.8829284

Convenendo di assegnare valori da 1 (connotazione negativa) a 7 (connotazione posi-


tiva), i punteggi originari relativi agli item presentati con connotazione positiva a sinistra
debbono essere rovesciati (cfr. revscore e la riassegnazione successiva dei punteggi).
La figura 2.1 presenta la distribuzione dei valori attitudinali per i 50 rispondenti e lanalisi
del profilo, mettendo in luce una relativa debolezza con riferimento agli item e e q, sug-
gerendo quali aspetti andrebbero migliorati. Il giudizio complessivo sul giornalista puo
essere considerato molto soddisfacente. I valori del coefficiente di reliability, , calcolato
nelle due versioni, sono pari a 0.88, ed attestano che la misurazione e affidabile.

26
Figura 2.1: Analisi aggregata e del profilo per il data set kasi-tv.dat.

Attitudine Boxplot attitudine

100 120
0.04
0.02

80
60
0.00

20 40 60 80 120

totscore

Boxplot item An. del profilo


7

2 3 4 5 6
5
3
1

a d g j l o r a d g i k n q

27

Potrebbero piacerti anche