Sei sulla pagina 1di 21

Disegni di ricerca in

psicologia clinica
Psicologia Clinica
Università degli Studi di Palermo
20 pag.

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
DISEGNI DI RICERCA IN PSICOLOGIA CLINICA.
Metodi quantitativi, qualitativi e misti.

PREMESSA. REQUISITI FONDAMENTALI DI OGNI DISEGNO DI RICERCA.


“Il disegno di ricerca rappresenta il programma di rilevazione, misurazione e analisi dei dati”.
Ciascun disegno di ricerca contempla alcuni vincoli di carattere metodologico, ai quali il ricercatore
deve attenersi, a garanzia della correttezza del suo lavoro e dell’attendibilità delle sue conclusioni.
L’oggettività
Il termine “oggettività”, possiede un significato forte e uno debole:
- forte: vuol dire che l’oggettività inerisce (è strettamente unito) all’oggetto;
- debole: vuol dire che l’oggettività è indipendente dal soggetto, travalica i limiti dell’individualità e
acquista valore non più per quella sola persona, bensì per molte o per tutte.
L’intersoggettività, è un requisito più debole dell’oggettività ed è una caratteristica necessaria ma
non sufficiente di quest’ultima. Tuttavia, un’intersoggettività correttamente costruita all’interno
della conoscenza scientifica può istituire anche l’oggettività in senso forte, arrivando a coincidere
con essa.
Nell’epistemologia contemporanea, quando si parla di oggettività, si fa generalmente riferimento
al significato “debole” di questo concetto, ossia lo si traduce in termini di intersoggettività, cioè di
un sapere condiviso da un certo numero di studiosi e acquisito secondo una metodica “pubblica”.
Si parla anche di ispezionabilità di un lavoro di ricerca ed è utile ricordare che il requisito della
ispezionabilità riguarda in modo specifico anche la relazione che esiste fra esperienza pratica e
costruzione teorica: fra i dati e la loro generalizzazione in una determinata teoria esplicativa. Il
legame fra esperienza pratica e costruzione teorica deve infatti essere garantito attraverso
l'assunzione di una rete di nessi logici totalmente esplicita e ispezionabile, la quale consente in
ogni momento di ridiscendere, percorrendo un cammino magari lungo e complesso ma sempre
oggettivo, fino a qualche proposizione immediatamente ispezionabile grazie ai criteri di
protocollarità ammessi.
L’oggettualità.
Il presupposto sul quale si basa questo concetto è quello dell’intrinseca solidarietà di oggetto e
metodo. Che questa solidarietà sia assolutamente necessaria deriva dal presupposto dell’esistenza
di un indissolubile intreccio originario tra momento descrittivo e momento normativo del sapere.
In altri termini, così come il metodo non precede l’oggetto, altrettanto l’oggetto non precede il
metodo: la scelta dei predicati specifici e del linguaggio stesso con il quale si può parlare
dell’oggetto coincide con la scelta dei criteri di protocollarità, che sono appunto di natura
metodologica. Il concetto di “oggettualità” rimanda al fatto che la conoscenza scientifica è sempre
conoscenza a proposito di oggetti precisamente ritagliati dal campo di osservazione. La concezione
della “cosa come fascio di oggetti” e il concetto di accordo intersoggettivo sui criteri di
protocollarità e sui predicati specifici conferiscono alla scienza un carattere di spiccata contingenza
e relatività. La contingenza e la relatività sono fisiologiche a proposito dei punti di partenza del
lavoro scientifico, ma sono patologiche a proposito di tutto quanto viene dopo. In altri termini, una
volta raggiunta una convenzione esplicita sui criteri di protocollarità che ritagliano gli oggetti della
scienza, tutto ciò che si fa successivamente deve essere conseguente: ogni lavoro scientifico che
per confusioni, imprecisioni, superficialità rispetto ai criteri di protocollarità che definiscono
l’oggetto e il metodo non consente a chiunque di verificare i risultati rifacendo le stesse
operazioni, non dice nulla di apprezzabile.
Tipologie della ricerca.

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
Nei manuali di metodologia si distinguono le ricerche di tipo quantitativo da quelle di tipo
qualitativo e, fra le prime, i disegni estensivi da quelli intensivi. Il disegno è estensivo e definito
fondamentalmente come quell'approccio nel quale la variazione nel fenomeno sotto studio e
analizzata come accade da soggetto a soggetto ho da paziente a paziente e nel quale le ipotesi
sono verificate rispetto ai gruppi di pazienti. Il punto essenziale del disegno e estensivo e che la
verifica delle ipotesi è fatta attraverso i pazienti: questo è in contrasto con il disegno intensivo, nel
quale le ipotesi sono verificate entro i pazienti.

PRIMA PARTE. LA RICERCA DI TIPO QUANTITATIVO


PRIMO CAPITOLO. IL DISEGNO INTENSIVO.
Si tratta del disegno di uso più frequente in psichiatria e in psicologia clinica ed è spesso chiamato
anche disegno between-groups, perché lei differenti condizioni sono somministrate a gruppi
separati. I disegni estensivi devono rispettare alcuni vincoli:- la quantità e la qualità campionaria - il
controllo degli errori (di I e II tipo) e dei fattori di disturbo- l’appropriatezza dei gruppi di controllo-
la significatività dei dati.Questo tipo di disegno di ricerca è utilizzato sia nella ricerca medica che in
quella psicosociale.
La quantità campionaria.
L’utilità generale delle tecniche di campionamento si basa sul presupposto che sia possibile fornire
informazioni su una popolazione sulla base dell’analisi di un numero limitato di individui. Il
problema fondamentale è che il numero degli individui in questione non può essere realmente
molto limitato, perché la percentuale di eventi osservati in un campione costituisce una stima solo
approssimativa della cosiddetta percentuale vera degli stessi eventi ottenibile teoricamente nella
popolazione. Un buon campione di ricerca deve quindi rappresentare in maniera adeguata la
variabilità dei dati presente in una popolazione. L’impiego di campioni piccoli pone anche altri
problemi, ad esempio, con un campione piccolo, è estremamente improbabile ottenere un
risultato statisticamente significativo, qual è necessario per confutare l’ipotesi nulla: questa,
perciò, deve essere accettata come vera. Ma allora quanto deve essere grande un campione?
L’ampiezza campionaria dipende dalla natura e dagli obiettivi della ricerca. Si deve dire con
chiarezza che 10-20 soggetti sono un numero assolutamente insufficiente per ricerche estensive in
campo clinico: Chassan suggerisce uno standard che si aggira intorno alle 50 unità e,
effettivamente, questo è il livello minimo accettabile. Chassan, ha indicato in 20-25 pazienti per
trattamento “il minimo assoluto per una ragionevole possibilità di scoprire effetti differenti di un
farmaco”, non mancando tuttavia di ricordare che molti metodologi “insistono su un minimo di 50-
100 pazienti”. In genere, gli individui sono portati a considerare qualunque campione proposto da
un lavoro di ricerca come altamente rappresentativo della popolazione da cui è stato estratto,
indipendentemente dalla sua numerosità. Non viene tenuta in adeguata considerazione, quindi, la
taglia campionaria e, dato ancora più interessante, sia i ricercatori che i lettori di quest’ultimi, se
non vengono adeguatamente formati e, per così dire, avvertiti del pericolo, condividono
spontaneamente questi errori di ragionamento presenti nella popolazione non specialistica;
l’attenzione alla taglia campionaria, sia nella costruzione dei campioni che nella valutazione dei
risultati ottenuti, passa così in secondo piano. Il cosiddetto “esperimento dell’ospedale” è un buon
esempio di quanto stiamo dicendo:- Una città ha due ospedali, uno grande, nel quale nascono in
media 45 bambini al giorno e uno piccolo, con una media di 15 nascite giornaliere. Postulato che:
a. Il 50% dei neonati nella popolazione è di sesso maschile; b. La percentuale del sesso dei neonati
varia giornalmente; c. Nell’ultimo anno in ambedue gli ospedali è stato computato il numero dei
giorni in cui più del 60% dei neonati era di sesso maschile, si chiede In quale ospedale si è
verificato il numero più alto di giorni di questo tipo? Le risposte, sono state, in genere: “Nei due
ospedali vi è stato lo stesso numero di giorni con un sovrappiù di neonati maschi”. La risposta

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
corretta, invece, è: “L’ospedale piccolo”, perché nei campioni piccoli è più probabile la deviazione
delle leggi della popolazione. L'esperienza ha confermato che lo svolgimento di una ricerca di tipo
estensivo in un ambiente clinico presenta numerose difficoltà, in particolare, il reclutamento del
campione dei soggetti dello studio permane un processo difficoltoso e dai tempi lunghi. Scopo
principale di una soddisfacente ampiezza campionaria è quello di garantire che i risultati ottenuti
in un campione o gruppo di soggetti possano essere generalizzati a tutti gli altri soggetti che
costituiscono quella popolazione di riferimento: si tratta di uno dei principi di fondo della logica
della conoscenza scientifica, che ai giorni nostri si caratterizza per il suo tratto probabilistico. In
altri termini, non possiamo avere la certezza assoluta che il risultato ottenuto in gruppo
selezionato di soggetti sia identico a quello che si otterrebbe nella popolazione di riferimento, ma
possiamo stimare che questo avvenga con una determinata probabilità (ad esempi, nel 95% dei
casi). Minore è l’ampiezza dei gruppi che vengono confrontati, minore è la probabilità di
identificare se esistano o meno differenze tra i gruppi.
La qualità campionaria.
Come scrive Kline: “gli errori di campionamento sono uno dei problemi fondamentali delle
ricerche sul comportamento”. In altri termini, l’attenzione alla numerosità dei soggetti inclusi nel
campione è una misura necessaria ma non sufficiente nel costruire quest’ultimo. Un campione
adeguato dal punto di vista quantitativo può ugualmente essere scarsamente rappresentativo, se
non sono stati rispettati alcuni vincoli che riguardano: La scelta dei soggetti in rapporto al loro
ambiente di provenienza (il rapporto fra campione e popolazione);- La scelta delle variabili.
Brunswick (1955), ha proposto il concetto di “rappresentatività ecologica”, ovvero l’habitat
naturale-culturale di un individuo o di un gruppo. Ne discende, che i risultati di ogni indagine
campionaria sono rappresentativi esclusivamente della popolazione da cui è stato est ratto il
campione. Non è possibile estendere i risultati di una ricerca fatta su di una generica popolazione a
un’altra popolazione. La rappresentatività ecologica riduce considerevolmente il valore che viene
solitamente attribuito alle procedure di randomizzazione. La scelta casuale dei soggetti è senz’altro
utile a limitare i bias che, nella costruzione di un campione, possono far sì che quest’ultimo non sia
rappresentativo della popolazione, in quanto sbilanciato in uno o più parametri, ma questo
“benefico effetto” si produce solo se il campione rispetta il vincolo della rappresentatività
ecologica, che, quindi, costituisce lo step precedente alla scelta casuale, nelle tecniche di
campionamento. Il fatto che un campione sia “randomized” non garantisce affatto, di per sé, la
generalizzabilità dei risultati. È necessario fare un breve accenno alla teoria della validità, nella
quale si differenziano la:-Validità interna : una ricerca è “intern valide” se è possibile ricondurre
causalmente alla variazione della variabile indipendente una determinata variazione della variabile
dipendente. Per questo, è necessario mantenere sotto controllo tutti i cosiddetti “fattori di
disturbo di tipo I”, ossia le influenze che, durante lo svolgimento della ricerca, potrebbero rendere
dubbia questa connessione causale. -Validità esterna: una ricerca è “extern valide” se i suoi
risultati sono generalizzabili, ossia non sono riconducibili soltanto alle specifiche circostanze in cui
la ricerca è stata condotta. Anche nel caso della validità esterna esistono fattori di disturbo (di II
tipo), che rendono i risultati della ricerca generalizzabili solo per una determinata classe di
situazioni, ossia quella di cui è nota la condizione specifica di disturbo. La validità interna richiede
un controllo completo dei fattori di I tipo e la condizione ottimale, di conseguenza è quella
dell’isolamento, come accade in un setting sperimentale di laboratorio; in questo modo, tuttavia,
si inficia, in misura più o meno cospicua, la rappresentatività delle condizioni e, quindi, la validità
esterna. D’altra parte, in una situazione più rappresentativa, quale può essere quella di uno studio
naturalistico, il controllo dei fattori di disturbo di I tipo è senz’altro meno accurato e meno
soddisfacente. Secondo la teoria della validità, tuttavia, se manca il requisito della validità interna,
perde significato il criterio della rappresentatività. È importante ricordare, però, che la condizione

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
indispensabile al controllo dei fattori di disturbo di II tipo è costituita dall’impiego di campioni
rappresentativi. Affinché le variabili siano rappresentative è necessario che lo siano i campioni e
viceversa. In altri termini, la rappresentatività delle variabili è un aspetto del problema più ampio
della validità esterna e, quindi, della generalizzabilità. Kerlinger (1973) ha scritto: “Quando
parliamo di ansia, a quale genere di ansia ci riferiamo? Tutti i tipi di ansia sono uguali?”. Una
risposta metodologica soddisfacente è rappresentata dalle procedure di operazionalizzazione, che
rimandano al concetto di “definizione d’uso”. Possiamo riferirci all’operazionalizzazione, come a
un sistema di controllo adeguato ad accertare che ciò che ha fatto è fatto bene. Il sistema di
controllo prevede che:- Siano indicate le condizioni di impiego dei costrutti, degli strumenti, delle
misure ecc. - Siano definiti, nel modo più dettagliato possibile, i fini di tale impiego: a quale scopo,
in quali condizioni, per capire che cosa, per rilevare quali caratteristiche, ecc.- Siano indicati
eventuali vincoli all’impiego dei costrutti, degli strumenti, delle misure, ecc . - Siano stabilite le
regole procedurali per la creazione di eventuali indici sintetici che traducano i costrutti o parti di
essi, nonché i risultati ottenuti attraverso l’impiego degli strumenti o l’applicazione delle misure;
le regole che devono essere seguite nel caso in cui si vogliano apportare modifiche al sistema di
controllo, oppure modificare ciò che è stato stabilito ai punti precedenti. Per semplificare, è
doveroso che tutti i termini e i costrutti che possono presentarsi a usi molteplici siano
operazionalizzati, ossia accuratamente definiti in ragione dell’impiego che ne viene fatto di volta in
volta. Un disegno di ricerca merita attenzione innanzitutto se è idealmente possibile riprodurlo,
ossia se tutta la rete di concetti teorici e di operazioni empiriche è totalmente esplicita e non sono
presenti concetti ambigui, definizioni imprecise, strumenti introvabili, elaborazioni mal descritte.
Il problema dei gruppi di controllo.
Un gruppo di controllo può essere definito come “un gruppo di soggetti selezionati in modo che
siano paragonabili ai soggetti del gruppo (dei gruppi) sperimentali, tranne che per il fatto che,
diversamente da questi ultimi, non sono esposti al trattamento, oggetto della ricerca”. L’impiego
di gruppi di controllo all’interno di un disegno between-groups (disegno estensivo) risponde allo
scopo di fornire un controllo generale relativamente a diversi tipi di bias, di artefatti e di ipotesi
alternative di spiegazione che potrebbero inficiare la validità di una ricerca. È possibile indicare
quali sono i più diffusi tipi di gruppo di controllo: il più semplice è costituito da un gruppo, gruppo
di controllo no trattamento, nel quale i soggetti assegnati in modo casuale, semplicemente non
ricevono di trattamento al quale sono sottoposti i soggetti del gruppo sperimentale. Una variante
si può ottenere impiegando come membri del gruppo di controllo i pazienti in lista d’attesa ,
waiting-list control Group per essere sottoposti al trattamento al quale già sono sottoposti i
soggetti del gruppo sperimentale: quando questi ultimi hanno terminato il trattamento, si trattano
i soggetti in lista d'attesa e in diversi momenti successivi, si valutano i cambiamenti intervenuti
prima, durante e dopo il trattamento. Il gruppo di controllo no Contact allo scopo di valutare gli
effetti della partecipazione un programma di trattamento anche dal semplice contatto con
quest'ultimo: gli individui scelti per questo gruppo di controllo non sanno neppure di essere inclusi
in uno specifico disegno di ricerca; l'assessment del loro comportamento deve essere effettuato
come se fossero in causa altri elementi e altri propositi. Il placebo control group È inserito in
disegni che si propongono di verificare se gli effetti di un trattamento sono dovuti semplicemente
alle sue componenti non specifiche, i cosiddetti fattori terapeutici comuni non specifici: al gruppo
di controllo vengono forniti tutti gli elementi che costituiscono la struttura formale del trattamento
ma non i suoi ingredienti peculiari. Lo yoked control group questo è usato per mantenere sotto
controllo le variazioni across groups che possono verificarsi durante il corso dell'esperimento: lo
yoking è effettuato accoppiando i soggetti del gruppo di controllo con i soggetti del gruppo
sperimentale e usando le informazioni ottenute con i soggetti sperimentali. Lo scopo è quello di
uniformare across groups nelle variabili estranee, cosicché sia possibile valutare senza distorsioni

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
la variabile oggetto di studio. I gruppi di controllo ad assegnazione non randomizzato , patched-up
group ,sono caratterizzata dalla deliberata scelta dei soggetti, nei quasi esperimenti, un gruppo ad
assegnazione non randomizzata può essere usato per controllare elementi che minacciano la
validità interna, quali la storia o l'evoluzione dei soggetti. Il gruppo, causa del metodo di selezione
adottato, controlla questi elementi in modo imperfetto ma rinforza comunque la plausibilità delle
conclusioni che possono essere dedotte dalla ricerca: questi gruppi forniscono spesso utilizzati i
comparativi. Ovviamente, fra i vari tipi di gruppo di controllo disponili, è opportuno scegliere
quello più adatto in ragione di ciascun particolare lavoro di ricerca. In genere, sono tre i criteri che
ispirano la scelta:1. L’oggetto di studio specifico2. I dati ottenuti da ricerche precedenti3. I vincoli
imposti dalla situazione (compresi gli obblighi di carattere etico). La considerazione più rilevante è
relativa al fatto che, in molte delle situazioni di cui si occupa la psicologia clinica, non ricorrono le
condizioni che consentono un uso efficace di questo strumento. Dietro queste difficoltà fanno
capolino le differenze fra la ricerca sull’efficacia dei farmaci e la ricerca sull’efficacia delle
psicoterapie. È importante incoraggiare le ricerche sulle indicazioni e le controindicazioni ai diversi
trattamenti, in rapporto alle differenti condizioni cliniche, ossia la molteplicità delle patologie di
volta in volta presa in considerazione, nonché alle difficoltà della cura.
La condizione placebo nella ricerca in psicologia clinica.
Per tenere sotto controllo le aspettative di guarigione di un paziente che riceve un farmaco, la
condizione placebo rappresenta rilevanti vantaggi da un punto di vista metodologico: se il gruppo
di pazienti che riceve il farmaco mostra miglioramenti significativamente maggiori dei pazienti che
hanno ricevuto il placebo, il ricercatore può concludere che il farmaco è efficace. La ricerca ha
anche dimostrato che la risposta del paziente alla condizione placebo, nel caso di una
sperimentazione di psicofarmaci con pazienti psichiatrici, è generalmente elevata e, in alcuni casi,
quasi equiparabile a quella dei pazienti che assumono il farmaco. Il gruppo di controllo a
trattamento non specifico può aiutare il ricercatore a valutare se un trattamento risulta efficace e
quando è messo a confronto con un altro trattamento dal quale sono attesi risultati inferiori. La
condizione placebo, nei trattamenti psicologici, deve però essere credibile agli occhi del paziente
che la riceve: non può quindi essere costituita semplicemente da un breve dialogo con un
professionista, ma deve rappresentare una procedura di intervento con una propria struttura
formale. Inoltre, è molto difficile realizzare una effettiva condizione di controllo mediante placebo
nelle ricerche in psicologia clinica, dato che in una terapia psicologica, a differenza di quanto
avviene in medicina, non tutti gli attori (terapeuta, paziente, ricercatore) possono essere tenuti “in
cieco” circa il trattamento che il paziente sta ricevendo.
Il gruppo Treatment-As-Usual (TAU) come condizione di controllo .
Nella ricerca sull’efficacia degli interventi psicologici, ha trovato sempre maggiore diffusione il
gruppo Treatment-As-Usual, quale condizione di controllo, accanto ai classici disegni che
includevano pazienti in lista d’attesa, l’assenza di trattamento o una condizione placebo. Il TAU, in
genere, si riferisce al trattamento di cura routinario o usuale all’interno di un determinato Servizio
clinico. Oggi, la maggior parte dei trials in psicologia clinica utilizza la condizione TAU come
controllo o confronto. Tipicamente, il trial si svolge in un setting clinico dove i pazienti svolgono
routinariamente alcune attività terapeutico/riabilitative. Questa strategia di ricerca risulta più
affidabile rispetto ai disegni che utilizzano come gruppo di controllo la semplice condizione di
assenza di trattamento o di lista di attesa, quanto meno perché supera in gran parte le questioni di
carattere etico (non vi sono pazienti che rimangono senza terapia). Inoltre, è probabile che
diminuisca la percentuale dei casi di drop-out che si verificano quando in un trial clinico i soggetti
assegnati alla condizione di non trattamento scelgono di non proseguire con la sperimentazione.
Infine, la condizione TAU consente di rispondere a una domanda fondamentale negli studi
sull’efficacia, ovvero: “Esiste un reale beneficio, in termini di outcome, nell’utilizzo di una nuova

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
tipologia di trattamento rispetto a ciò che viene usualmente proposto nel servizio?”. Ovviamente,
la condizione TAU presenta anche importanti limiti, ad esempio, esiste un’ampia evidenza relativa
all’influenza che le aspettative dei pazienti esercitano sull’outcome del trattamento. Quando le
aspettative dei pazienti sono elevate sia nei confronti della nuova terapia che viene sperimentata,
sia nei confronti del TAU, è molto probabile che le differenze relative all’outcome delle due
condizioni siano molto limitate. In molti studi la condizione TAU include un'ampia varietà di
interventi forniti ai pazienti spesso non ben definiti e codificati il che pone il problema non e
secondario della possibile replicabilità dello studio. Nella condizione TAU spesso esiste un'ampia
variabilità intra e Inter terapeuta. In sintesi, ampia variabilità della condizione e mancanza di
specificità rappresentano al momento i maggiori punti di debolezza del TAU come condizione di
controllo nella ricerca clinica sulle psicoterapie e gli interventi psicologici.
Significatività statistica e significatività clinica.
Lo scopo del test di significatività statistica è quello di limitare il rischio che si attribuiscano
all’impatto causale di un trattamento, ad esempio, effetti dovuti invece a fattori meramente
casuali. Più nel dettaglio, significa semplicemente limitare il rischio di errori di tipo I, ossia gli errori
nei quali si può incorrere quando si conclude che una differenza è reale mentre invece è un
prodotto del caso. Il test di significatività statistica non contrasta, invece, la possibilità di compiere
errori di tipo II (attribuire al caso una differenza reale), e non bisogna dimenticare che i due tipi di
errore variano in misura inversa. A livello generale, Kirk (2003) sostiene che il progresso scientifico
rischia di essere compromesso se i ricercatori continuano a focalizzarsi esclusivamente sulla
strategia decisionale di accettazione/rigetto dell’ipotesi nulla e sull’imperativo di raggiungere la
significatività statistica. L’ipotesi nulla prevede generalmente che l’effetto delle variabili
indipendenti su quella dipendente non sia diverso da quello che ci si potrebbe attendere sulla base
del caso. Rifiutare l’ipotesi nulla per l’ipotesi alternativa significa accettare che l’effetto della
variabile indipendente sulla dipendente sia reale e non dovuto al caso. Il criterio per assumere
questa decisione sulla “significatività” dell’effetto è di natura probabilistica, ed è dato dal livello di
probabilità (ad esempio, p<0,05 o 0,001) scelto dal ricercatore per determinare il margine di
errore nella decisione. Il tema della replicabilità è sicuramente fondamentale nella ricerca in
psicologia clinica, in quanto i risultati di uno studio raramente possono considerarsi definitivi e
necessitano sempre di evidenze ulteriori per essere confermati. Soltanto la replicazione può
garantire che i risultati riportati da un singolo studio siano veritieri e non, invece, falsi positivi. Per
questo motivo diversi metodologi ritengono inevitabile uno spostamento di focus
nell'interpretazione dei risultati della ricerca: è necessario basarsi non tanto sulla tradizionale
significatività statistica, bensì sulla stima dell’Effect size (ES), e dell’intervallo di confidenza (CI).
Nei disegni di ricerca sperimentali o quasi-sperimentali, in cui si confrontano due diversi gruppi di
soggetti (ad esempio, gruppo sperimentale/di trattamento e gruppo di controllo), il più diffuso
indice di ES consiste nella differenza standardizzata delle medie tra i gruppi (indice di Cohen) con
la formula: d= (M1 –M2) /Sin cui M1-M2 è la differenza tra le medie dei due gruppi e S è la
deviazione standard composita dei due gruppi. L’indice d rappresenta una specie di punteggio z
(ossia una misura standardizzata) di valutazione dell’effetto dei trattamenti. Effect size (ES): in
statistica l’effect size (o dimensione dell’effetto) è una misura della forza della relazione tra due
variabili. Usato nel metodo statistico della meta-analisi l’effect size è un indice che misura la
grandezza e l’ampiezza di un evento. Molte ricerche recenti preferiscono riportare anche il valore
dell’intervallo di confidenza, accanto alla stima dell’ES. Il CI (intervallo di confidenza) fornisce un
range di valori che riflettono la probabilità che la differenza riscontrata in una popolazione (ad
esempio, tra due gruppi di trattamento) rientri in un range definito. Questo range è basato su una
stima campionaria (come tutti i test statistici) e viene comunemente espresso nei valori del 95% o
99% (che corrispondono ai criteri statistici di alpha 0,05 e 0,01).Va notato, comunque, che né le

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
statistiche relative all’ES né i test di significatività consentono di ottenere informazioni sulla varietà
di risposte dei pazienti al trattamento. Se da un lato è importante sapere se un trattamento
funziona mediante mediamente bene con una tipologia di pazienti, è altrettanto importante, per il
clinico, avere informazioni sul cambiamento di uno specifico paziente. Per questo motivo, negli
ultimi 20-25 anni, i clinici e i ricercatori che si sono dedicati alle ricerche sull’efficacia degli
interventi psicologici hanno ripetutamente messo in discussione in quale misura la significatività
statistica di un cambiamento possa essere considerata alla stregua di una significatività clinica. In
altri termini, è emersa la preoccupazione che l’esclusiva focalizzazione sulla significatività statistica
rischi di far trascurare l’importanza della significatività clinica, che, come scrivono Kendall, Norton-
Ford (1982): si riferisce alla significatività della grandezza del cambiamento, al fatto di rimediare al
problema che si è presentato, fino al punto che esso non è più un problema. Miglioramenti
statisticamente significativi non sono equivalenti a guarigioni e la significatività statistica è una
strategia valutativa addizionale e non alternativa”. Tutto ciò significa che possono essere
statisticamente significative differenze irrilevanti sul piano clinico, oppure fra entità mal definite, o
in presenza di difetti del campionamento (quantitativi e qualitativi) ecc … Quindi, la significatività
statistica di una differenza è solo uno dei parametri da controllare per accettare come valide le
conclusioni degli autori. È fondamentale questa cautela, perché il test di significatività, come tutti i
riti (e i rituali), possiede un cospicuo potere suggestivo e di attrazione indebita. Come scrive Cohen
(1992):“E’ importante l’interpretazione che accompag na i risultati che superano la barriera dello
0.5 e conseguono lo stato di grazia della significatività statistica. Tutti sanno che questo significa
solo che l’effetto non è nullo e nient’altro. Orbene, quante volte interpretiamo questo risultato,
almeno implicitamente, come la prova che l’effetto è significativo, nel senso di importante,
consistente. Se un risultato è altamente significativo, ad esempio p<0,001, la tentazione di
effettuare questa interpretazione scorretta è quasi irresistibile”. Ad esempio: se un gruppo di
pazienti riporta un miglioramento (valutato attraverso una scala sui sintomi ansiosi o depressivi) in
seguito a un trattamento, e questo miglioramento risulta statisticamente significativo, può
comunque rimanere aperta la questione clinica sulla misura in cui questo miglioramento,
“certificato” dalla validità statistica, sia anche rilevante e significativo per il paziente. Il
miglioramento del punteggio in una scala sui sintomi depressivi è indicativo di un miglioramento
del paziente nelle sue attività quotidiane, relazioni interpersonali, attività lavorative,
comportamenti o pensieri? In altri termini: il miglioramento valutato dalla scala si traduce in un
benessere più generale su vari aspetti rilevanti per la vita del paziente? È anche importante tenere
presente che in ogni ricerca sull’efficacia di un intervento psicologico avremo pazienti che
presentano miglioramenti sostanziali in seguito al trattamento, ma anche pazienti che non
migliorano o addirittura riportano un peggioramento complessivo. Il miglioramento medio di un
gruppo di pazienti in seguito a un intervento psicologico non vuol dire che ogni specifico paziente
abbia riportato un beneficio sostanziale dalla terapia. Ritorna, cioè, il problema dell’integrazione,
nella ricerca clinica, di un approccio nomotetico e di un approccio idiografico. Per superare questi
limiti, valutati attraverso il test di significatività statistica, si è diffusa negli ultimi decennila
metodologia della significatività clinica, quale metodo per analizzare il livello di cambiamento
individuale del paziente.
IL Clinically Significant Change (CSC) e il Reliable Change Index (RCI).
Dai primi anni 90 sono state messe a punto metodologie intese ad analizzare la significatività
clinica del cambiamento. Si tratta di metodi utilizzabili anche in studi condotti con pochi pazienti,
in cui la potenza statistica necessaria per determinare differenze statistiche tra pre-trattamento e
post-trattamento può essere insufficiente. Il metodo più utilizzato nella ricerca per valutare la
significatività clinica del cambiamento fa riferimento a due criteri:1. Il cambiamento deve essere
attendibile: ossia, la variazione intercorsa tra pre-trattamento e post-trattamento non deve essere

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
influenzata da errori di misurazione. 2. L’esito da prendere in considerazione è il passaggio del
paziente da una popolazione disfunzionale (clinica) a una funzionale (non clinica) a seguito del
trattamento. Reliable Change Index (RCI) stabilisce se il cambiamento (outcome) di un paziente
tra pre-trattamento e post-trattamento (valutato con il metodo test/re-test) è statisticamente
attendibile (ad esempio, se la differenza nei punteggi può essere attribuita al cambiamento reale e
non a errori di misurazione). Il calcolo del RCI, in base al metodo Jacobson e Truax (1991), si basa
sulla formula: In cui X1, è il punteggio pre-test, X2, il punteggio post-test e Sdiff, è l’errore standard
della differenza tra i punteggi dei due test, calcolato in base alla formula: SE è l’errore standard di
misura, calcolato in base alla formula In cui S1 è la deviazione standard del gruppo normativo o del
gruppo pre-trattamento, mentre rxx, è l’attendibilità test-retest. Il secondo criterio per la
valutazione del CSC è la stima di un punteggio cut-off dello strumento di misura, che stabilisca una
soglia di passaggio dai punteggi caratteristici della popolazione non clinica (funzionale). In altri
termini, il clinico e/o il ricercatore che vogliono misurare la significatività clinica del cambiamento
riscontrato in un paziente al termine del trattamento devono avvalersi di strumenti di assessment
validati, che prevedono un punteggio-soglia capace di discriminare tra popolazione clinica e non
clinica. Nei casi in cui non si disponga di un punteggio di cut-off per lo strumento che si sta
utilizzando, si può seguire il criterio di considerare il punteggio superiore o inferiore di una
deviazione standard dalla media ottenuta da un campione normativo non clinico, quale indicatore
di un livello di funzionamento psicologico non clinicamente significativo. L’utilità di questo metodo
e il suo conseguente ampio utilizzo in letteratura sono legati al fatto che, in base ai criteri descritti,
ogni paziente, al termine del trattamento, potrà essere classificato come:- Guarito (passa entrambi
i criteri)- Migliorato (passa solo il criterio RCI)- Non cambiato (non passa il criterio RCI)- Peggiorato
(passa il criterio RCI nella direzione inversa). Il metodo di Jacobson e Truax, per quanto diffuso, è
stato criticato dal punto di vista statistico, perché i tassi di cambiamento clinicamente significativo
riportati nei singoli dubbi in modo cospicuo dalle specifiche misure di outcome e dai metodi di
calcolo utilizzati.
Disegni estensivi (between-groups) specifici
I differenti disegni per una ricerca between-groups sono: A. Disegno pre-test/post-test (before-
after) : si costituiscono almeno due gruppi di soggetti con assegnazione casuale. Un gruppo è
sottoposto a osservazione (o misurazione) prima e dopo la somministrazione di un trattamento o il
verificarsi di un evento determinato. Lo stesso si fa con l’altro gruppo, che, però, non riceve alcun
trattamento ed è al riparo dall’evento oggetto di ricerca (gruppo di controllo). Campbell e Stanley
(1963), rappresentano questo disegno così: R O1 X O2R O3 O4(R significa che i soggetti sono stati
assegnati per randomizzazione, O significa osservazione o misurazione; X la manipolazione
sperimentale o il trattamento. I simboli sono presentati in ordine temporale, cosicché O1 X O2
significa che la prima osservazione o pre-test è stata seguita da un intervento, al quale ha fatto
seguito una seconda osservazione post-test.) B. Disegno solo post-test (after-test): anche in
questo caso sono necessari almeno due gruppi, trattati come segue: R X O1R O2
Disegno Solomon a quattro gruppi : si tratta di una combinazione dei due disegni precedenti. Si
utilizza in situazioni che richiedono valutazioni pre-trattamento e post-trattamento, nelle quali è
però necessario valutare anche gli effetti del pre-test sull’outcome: R O1 X O2R 03 O4R X
O5R O6 . D. Disegni fattoriali : permettono l’investigazione simultanea di due o più variabili
(fattori) in un singolo esperimento. Nella forma più semplice, due variabili (ad esempio,
l’esperienza de terapeuta e il tipo di trattamento), considerate ciascuna a due livelli differenti
(terapeuta esperto e inesperto; trattamento A contro trattamento B), danno origine a questo
disegno 2x2, nel quale quattro gruppi rappresentano le combinazioni possibili fra i due livelli dei
due fattori.
Disegni quasi-sperimentali.

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
I quasi-sperimentali sono “un perfezionamento degli studi di osservazione naturalistica, ossia le
cosiddette ricerche sul campo, nei quali, i cambiamenti della variabile indipendente occorrono in
nature e non sono determinati dalla manipolazione dello sperimentatore ma che, tuttavia,
rispettano, per quanto è possibile nelle circostanze specifiche, i principi del controllo scientifico”.
In ambito clinico, questa ricerca osservazionale nasce dall’esigenza di studiare in modo scientifico
dei soggetti le cui caratteristiche rilevanti ai fini dello studio non possono essere manipolate (o
soltanto in rare occasioni). È possibile, mettere a punto numerosi disegni quasi-sperimentali
between-groups, i più comuni fra i quali si possono considerare paralleli ai disegni sperimentali
pre-test/post-test o solo post-test. La differenza è data dal fatto che il gruppo di controllo non è
dimostrabilmente equivalente al gruppo sperimentale, in quanto ci si trova, in genere, di fronte a
gruppi già formati e non costituiti per randomizzazione. Per questo motivo, Campbell, Stanley
(1963), hanno definito questi disegni anche “non equivalenti control groups”. Le due forme più
semplici sono :
Non R O1 X O2
non R O3 O4
non R X O1
non R O2
Studi caso-controllo.
Appartengono a questa tipologia di disegno di ricerca anche gli studi caso-controllo,
originariamente utilizzati nelle ricerche epidemiologiche e di salute pubblica. Negli studi case-
control, il ricercatore indaga le caratteristiche di interesse, (ad esempio, la sintomatologia
borderline) formando gruppi di individui che variano relativamente a quella caratteristica (ad
esempio, pazienti con sintomatologia borderline conclamata vs sintomatologia borderline sotto-
soglia, oppure semplicemente pazienti borderline vs pazienti non clinici, per evidenziare le
differenze tra i gruppi). Questi disegni si strutturano in maniera differente in base alla scansione
temporale della ricerca. Nei disegni case-control trasversali (cross-sectional), i soggetti vengono
valutati in base alle caratteristiche presenti (nel “qui e ora”), per esaminare i fattori associati a una
particolare caratteristica di interesse clinico in uno specifico momento temporale. Ad esempio: si
può valutare se il livello di cura parentale da parte delle madri che hanno avuto un figlio con
tecniche di fecondazione assistita è diverso da quello delle madri che hanno generato un figlio
naturalmente, senza ausili medici. Oppure se adolescenti con una percezione della propria
immagine corporea negativa riportino relazioni sociali più soddisfacenti rispetto agli adolescenti
con un’immagine corporea positiva. In altri termini, il ricercatore “si accontenta” di valutare un
fenomeno di interesse in uno specifico momento, senza avere informazioni su che cosa può averlo
influenzato nel passato o come evolverà negli anni futuri. Nei disegni case-control retrospettivi,
invece, l’obiettivo è l’individuazione di condizioni antecedenti all’insorgere della condizione
oggetto dello studio e che possono essere associate con quest’ultima. Ad esempio : questi disegni
possono essere utilizzati per indagare il possibile ruolo dell’allattamento materno al seno nel
disturbo da deficit dell’attenzione e iperattività (ADHD), con l’intento di identificare il legame tra
potenziali fattori causali o di rischio (antecedenti) e la successiva condizione patologica. Mimouni-
Bloch, Kachevanskaya, Mimouni et al. (2013) hanno confrontato un gruppo di bambini di età
compresa tra 8 e 12 anni con una diagnosi di ADHD e un gruppo costituito dai loro fratelli/sorelle
che non avevano sviluppato il disturbo. Ai genitori furono somministrati strumenti che valutavano
le pratiche di allattamento dei figli in momenti diversi (1 mese dopo la nascita, 3 mesi dopo, ecc
…).Questi disegni sono definiti retrospettivi in quanto si chiede, in questo caso, ai genitori, di
ricordare eventi o comportamenti che hanno avuto luogo molti anni prima e i risultati vanno
sempre interpretati con molta cautela. Sappiamo, infatti, che il rischio di un ricordo selettivo o
semplicemente inaccurato può essere molto elevato. Di conseguenza, in questi disegni di ricerca

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
possono essere utili dati retrospettivi di archivio, che risultano meno soggetti a bias (ad esempio, i
dati sull’allattamento registrati nell’archivio del pediatra di famiglia; oppure le cartelle cliniche
relative a uno specifico periodo). È importante sottolineare che i disegni retrospettivi case-control
non consentono di stabilire specifiche relazioni di causalità tra le variabili oggetto di studio (ad
esempio, tra l’allattamento al seno e la probabilità di sviluppare ADHD), ma soltanto di identificare
legami associativi: quindi, non consentono di escludere una relazione inversa tra le variabili. I punti
di forza di questi disegni, sono l’elevata efficienza in termini di costi e risorse, che risultano molto
minori rispetto ai disegni di ricerca longitudinali, in genere molto più dispendiosi; inoltre, i disegni
retrospettivi non comportano la perdita di soggetti nel corso del tempo, problema invece centrale
nei disegni longitudinali, in cui i partecipanti alla ricerca devono essere seguiti per molti anni.
Studi di coorte di tipo longitudinale.
Questi disegni di ricerca rappresentano un’alternativa a quelli case-control. In questi disegni, un
gruppo di soggetti viene seguito prospetticamente nel corso del tempo. Il termine “coorte” si
riferisce al fatto che i soggetti condividono una determinata caratteristica. Ad esempio: possiamo
predisporre una ricerca per valutare se gli psicoterapeuti che si sono diplomati nel 2017 sono in
grado di gestire con successo rotture e riparazioni dell’alleanza terapeutica con i propri pazienti;
oppure, se soggetti giovani adulti in sovrappeso e con uno stile di vita sedentario sono a rischio di
sviluppare un binge eating disorder. Il disegno di ricerca longitudinale consente di seguire queste
coorti nel corso del tempo (ad esempio, 1 anno, 2 anni o 10 anni), per stabilire delle relazioni tra
condizione antecedente (negli esempi, a) l’inizio dell’attività psicoterapeutica; b) l’essere in
sovrappeso) ed esito (rispettivamente: a) la gestione dell’alleanza terapeutica; b) la sintomatologia
binge eating).Caratteristica distintiva di questi disegni è che la condizione di esito non si sia ancora
presentata (ad esempio, la sintomatologia binge eating), a differenza degli studi case-control, in
cui i gruppi inclusi nella ricerca vengono selezionati in base a una condizione già presente (ad
esempio, soggetti depressi vs non depressi), senza la possibilità di analizzare che cosa ha
determinato la condizione clinica precedentemente alla sua manifestazione. Negli studi di coorte
di tipo longitudinale, invece, si ha una misurazione dell’esito in più momenti (T1, T2 … ), a partire
da un assessment di baseline che costituisce il T0. Negli studi di coorte con un singolo gruppo, il
ricercatore seleziona la coorte di interesse (ad esempio, un campione di bambini vittime di
violenza domestica all’età di 8 anni) e segue questi soggetti in un arco temporale (ad esempio, 5
anni) per identificare chi svilupperà una determinata sintomatologia (ad esempio, ansia o
depressione). L’arco temporale in cui seguire i partecipanti varia in base agli obiettivi specifici dello
studio e alle concrete possibilità di portare a termine quest’ultimo. È infatti chiaro che seguire una
coorte di soggetti per 10 o 20 anni può fornire importantissime informazioni sull’evoluzione di un
fenomeno clinico, ma si tratta comunque di un disegno molto difficile da realizzare. Negli studi di
coorte multi-gruppo il ricercatore identifica due gruppi di soggetti e li segue nel corso del tempo
per esaminare l’esito di interesse. Mentre nel disegno di ricerca case-control un gruppo viene
selezionato per l’esito di interesse e confrontato con un gruppo che non presenta questa
caratteristica (ad esempio, soggetti depressi vs non depressi), nello studio longitudinale di coorte, i
due gruppi non devono ancora presentare l’esito, ma variare in base a una condizione di interesse
o fattore di rischio (ad esempio, bambini soggetti a violenza domestica vs bambini non soggetti a
violenza domestica). Seguendo i soggetti dei due gruppi nel corso del tempo è possibile osservare
se i bambini che sono stati oggetto di violenza domestica sono maggiormente a rischio di
sviluppare un determinato disturbo/esito (es. ansia), nei 5 anni successivi. La valutazione
longitudinale è sicuramente il maggior punto di forza di questi studi, capaci di fornire informazioni
che gli studi case-control non sono in grado di garantire. In genere, i soggetti che sono disposti ad
essere seguiti in uno studio per diversi anni sono i più motivati, e di conseguenza i risultati
possono essere influenzati da questo fattore. Pertanto, in questi disegni la possibilità di analizzare

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
le relazioni tra diverse variabili e il rapporto di influenza tra esse consente di mette a punto
modelli rappresentazionali che sono di aiuto nella descrizione e comprensione di un fenomeno
clinico.
Sensibilità e specificità.
In psicologia clinica, l’obiettivo del ricercatore è spesso l’identificazione di variabili specifiche che
consentono di classificare i soggetti in base a una determinata caratteristica. Ad esempio, quali
variabili (fattori di rischio e/o di protezione) consentono di prevedere quali soggetti hanno un’alta
probabilità di sviluppare un disturbo; oppure quali variabili consentono di identificare bambini a
rischio di marginalizzazione nella classe scolastica. A tal fine, due costrutti sono diventati
particolarmente rilevanti nella ricerca clinica, per misurare il livello di accuratezza di una
classificazione diagnostica:-Sensibilità (Sensitivity) : la percentuale dei soggetti che mostrano o
mostreranno una particolare caratteristica, correttamente identificati come tali (Veri Positivi). Ad
esempio, in una fase di assessment psicologico precedente all’inizio di un intervento terapeutico, è
possibile tentare di individuare i pazienti che hanno un’elevata probabilità di sviluppare una
relazione terapeutica negativa. Oppure, in una valutazione testologica, i soggetti che, in base alla
scarsa capacità di regolare le proprie emozioni, svilupperanno un binge eating disorder, o un altro
disturbo legato a disregolazione emotiva. – specificità( specificity): la percentuale di soggetti che
non presentano o presenteranno una particolare caratteristica, correttamente identificati come
tali, veri negativi. Questi costrutti pongono una questione rilevante, in termini concettuali, per la
psicologia clinica, relativa alla possibilità di identificare dei soggetti come positivi o negativi per un
disturbo in base a un test o screening diagnostico. I concetti di specificità e sensibilità inducono a
riflettere sul rischio di possibili classificazioni errate, insito nell'utilizzo di qualunque strumento di
screening diagnostico: clinico può essere indotto a identificare dei falsi positivi, prevede che un
soggetto abbia o avrà un disturbo nella realtà il soggetto non ha ne avrà in futuro, oppure dei falsi
negativi, prevede che un soggetto non abbia o non avrò un disturbo virgola che invece il soggetto
ha o avrà in futuro. E chiaro che le diagnosi predittive sia quelle positive che quelle negative sono
clinicamente più utili infatti, il clinico, vuole sapere qual è la probabilità che un soggetto sviluppa
una determinata condizione patologica se risulta positivo al test piuttosto che sapere se il soggetto
è risultato positivo quando è ormai noto che a quella condizione. Tutti gli strumenti di assessment
che prevendono un punteggio soglia cut off, presentano un rischio di errata classificazione.
Disegni quasi-sperimentali e RCT.
In sintesi, possiamo affermare che nella ricerca clinica, i disegni quasi sperimentali sono molto
diffusi vista la difficoltà di creare condizioni di ricerca sperimentali che prevedono la
randomizzazione dei soggetti condizioni differenti come negli RCT. i risultati prodotti dalla
letteratura quasi sperimentale sono stati significativi e di forte impatto nella comunità
professionale e scientifica, design importanza crescente dell’evidence based practice, li ha
ridimensionati in modo cospicuo. Nelle linee guida sanitarie di diversi paesi, infatti, l'evidenza di un
intervento di una strategia di assessment supportata soltanto da quasi esperimenti e cosiddetta
debole e provvisoria, ed è generalmente richiesta la presenza di un RCT per garantire una evidenza
ufficiale. Questa logica quindi suggerisce una sorta di gerarchia di valore, sostenendo l'importanza
dei quasi esperimenti in quale momento euristico iniziale di una ricerca virgola che deve poi essere
sostanziata dall'impiego di una metodologia RCT.

SECONDO CAPITOLO. IL DISEGNO INTENSIVO.


Secondo Peck, per quanto riguarda il modello intensivo: ricerca non è sinonimo di grande numero
di soggetti. Di solito i disegni intensivi sono impiegati in lavori di ricerca di impostazione

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
behaviorista anche se virgola in realtà virgola in quest'ultimi 60 anni è comparso di nuovo in
letteratura proposito delle rationale dei disegni intensivi, dimostrando il valore euristico di questi
modelli nell'indagine su tutti i problemi della psicologia clinica e delle sue diverse scuole. I disegni
small N possono essere suddivisi in due grandi gruppi: i disegni single-case propriamente detti,
e i disegni a baseline multipla.

Disegni sperimentali single-case.


Questi disegni non comportano una procedura standard, bensì una collezione di situazioni
sperimentali diverse intesa dimostrare una relazione sistematica tra un intervento clinico e un
certo cambiamento successivo all' intervento stesso. La stessa TASK FORCE ON PROMOTION AND
DISSEMINATION OF PSYCHOLOGICAL PROCEDURES, afferma che I single-case sono importanti
disegni di ricerca complementari agli RCT e possono essere considerati vedi esperimenti, nella
misura in cui consentono di stabilire relazioni causali tra le variabili e di controllare le minacce alla
validità dell'esperimento stesso. La ricerca single case si focalizza su pochi soggetti che vengono
seguiti ripetutamente nel corso del tempo, mentre la ricerca estensiva between groups include
molti soggetti che vengono valutate in v. I disegni single case hanno queste caratteristiche in
comune: misurazioni continue molto frequenti, i problemi dei pazienti sono valutati in numerose
occasioni prima, durante e dopo l'intervento; l'informazione raccolta da una baseline estensiva o
da un periodo di intervento, si ottengono almeno due misure e preferibilmente molte di più; una
volta che è stata osservata una baseline stabile, si introduce l'intervento e i suoi effetti sono
misurati in almeno quattro occasioni; l'intervento è sospeso per un breve periodo e viene misurato
l' outcome, l'intervento e poi istituito di nuovo e se ne osservano ancora gli effetti. La fase nella
quale non è applicato l'intervento è chiamata fase A, fase di baseline; quella nella quale è
applicato l'intervento è chiamata fase; come suggerito da Kazdin la fase di baseline assessment ha
sia una funzione descrittiva che una predittiva: la funzione descrittiva si esplicita nella raccolta dei
dati relativi al soggetto, prima che inizi il trattamento; La funzione predittiva, invece, si esplicita
nella previsione di ciò che accadrebbe al soggetto se non ne si sottoponesse al trattamento ed è
esercitata tramite una proiezione della continuazione nel futuro del comportamento osservato
nella baseline. Al fine di prevedere in quale modo uno specifico comportamento possa variare nel
futuro importante che i dati raccolti durante la fase di baseline siano stabili con una ridotta
variabilità: la linea di trend e è un grafico che rappresenta la direzione dei dati raccolti nei diversi
momenti di assessment; Il trend e può essere lineare oppure curvilineo: i punti ottenuti dalla
misurazione tendono a crescere o accelerare o diminuire o decelerare in modo uniforme, oppure
sono espressi da una linea piatta senza cambiamenti evidenti. Per valutare l'efficacia di un
intervento nei disegni singole case, il trend della baseline dovrebbe essere piatto o peggiorativo,
cioè con un incremento dei sintomi prima dell'inizio dell'intervento virgola in questo modo, se
nella fase di intervento, fase B, il comportamento sintomatico mostra un trend di riduzione lineare
e possibile concludere che questo effetto è dovuto al trattamento punto a livello generale, minore
e la variabilità dei dati nella fase di baseline, maggiore è la possibilità di trarre conclusioni fondate
sull'efficacia di un intervento. È essenziale utilizzare strumenti di misura delle condizioni cliniche di
un soggetto che siano validi, attendibili e sensibili al cambiamento; Può risultare riduttiva una
ricerca estensiva che valuti soltanto il pre trattamento e il post trattamento, confidando che due
sole misurazioni possono essere affidabili, stante la pari abilità implicita in ogni fenomeno di
interesse clinico single case virgola in base all' alternanza prevista fra le due fasi A e B del disegno
sperimentale, sono possibili alcune diverse combinazioni: DISEGNO A B: si tratta del disegno più
semplice ma anche meno produttivo, consiste nel confronto della baseline con nella fase di
intervento. Viene omesso lo step quattro dell' elenco, e di conseguenza questo disegno può essere
raccomandato soltanto se vi sono pressanti ragioni per le quali non è possibile introdurre una fase

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
di sospensione dal trattamento. DISEGNO B A B: il trattamento in corso viene interrotto o
modificato e poi ristabilito come in precedenza virgola non si possono raccogliere informazioni
sistematiche sulla baseline, vi è soltanto un'interruzione del trattamento, questo disegno non può
essere giudicato molto produttivo ai fini della ricerca ma può essere utilmente impiegato nei
confronti di trattamenti già in fase molto avanzata. DISEGNO A B A B: questo disegno prevede un'
accurata registrazione della baseline, una fase di intervento, una fase di sospensione e una
seconda fase di intervento e consente di ottenere risultati relativamente inequivocabili circa la
relazione causale tra intervento e outcome. VARIAZIONI ED ESTENSIONI DEL DISEGNO A B:
seguendo la logica di questi disegni si possono mettere appunto altri disegni differenti che
presuppongano tutti l' alternanza tra fasi A e fasi B, ed è possibile introdurre anche una fase C, che
riguarda soprattutto il secondo tipo di intervento, e strutturare così disegni del tipo A B A C o del
tipo A BC B BC ecc. È importante considerare che in questi disegni di ricerca si ipotizza che gli
effetti dell'intervento cioè sino nel momento in cui viene sospeso il trattamento: in altri termini,
che i benefici ottenuti nella fase B si riducano velocemente per ricomparire poi nel momento in cui
la fase B di intervento viene nuovamente sviluppata appunto e ovvio rilevare che negli interventi
psicologici, si ipotizza invece che le caratteristiche positive dell9outcome al termine del
trattamento non ne reggevano immediatamente ma possano persistere anche a intervento
ultimato o sospeso. Questi disegni quindi possono essere indicati quando viene valutato come out
come un comportamento che può variare facilmente da presente ad assente, ma non risultano
utile, per misurare il livello di consapevolezza delle proprie emozioni in un soggetto con i disgregò
l'azione motiva, ma possono essere indicati per outcomes più comportamentali, quali la presenza
o assenza di problemi alimentari.
Disegni a baseline multipla.
I disegni a baseline multipla sono di tre tipi: attraverso (across) i soggetti; Attraverso i problemi;
Attraverso i settings. Il primo prevede l'indagine su almeno quattro pazienti che abbiano lo stesso
problema clinico: viene effettuata una misurazione estensiva della baseline per tutti i pazienti, si
applica poi il trattamento a un paziente, mentre si continua a raccogliere i dati su tutti gli altri.
Dopo un certo periodo si applica il trattamento al secondo paziente e così via; se il trattamento
introduce cambiamenti attesi o altri cambiamenti, questi dovrebbero verificarsi solo dopo la sua
applicazione non è precedentemente; una controindicazione può essere rappresentato dal
periodo di dilazione imposto ad alcuni pazienti prima di essere efficacemente trattati. Nel disegno
attraverso di problemi, per ciascun paziente si individuano alcuni problemi di stima collegati fra
loro sui quali si interviene in sequenza: la misurazione della baseline effettuata per tutti i problemi
e continua dopo ogni intervento, così l'evidenza che l'intervento produce il cambiamento atteso è
fornita dal fatto che quest'ultimo si verifichi solo dopo che è stato trattato uno specifico problema.
Infine, nel disegno trovarsi i settings, il trattamento è applicato a un singolo soggetto per un
singolo problema in modo sequenziale attraverso settings diversi. il vantaggio principale di questi
disegni single case risiede nella possibilità di indagare trattamenti innovativi prima di strutturare
complessi RCT oppure virgola di valutare casi generalmente esclusi da questi ultimi testando
l'efficacia degli interventi con questi pazienti.
Altri disegni small N.
Le possibili variazioni dei disegni small N sono numerose: Disegni a criterio variabile e disegni a
trattamento periodico. i primi vengono impiegati in situazioni nelle quali l' outcome può essere
quantificato in modo preciso, da stabilire dei target definiti per ogni fase del trattamento: i criteri
sull'efficacia del trattamento non sono stabiliti una volta per tutte ma variano da seduta a seduta.
Se i cambiamenti nel paziente si declinano secondo la sequenza prevista il trattamento si giudica
efficace; I secondi rispondono alle esigenze di ricerca suscitate dalla trattamenti nei quali è difficile
stabilire quando una particolare fase del trattamento può considerarsi conclusa, si misurano

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
frequentemente le modificazioni del problema personale si tengono periodicamente delle sedute
di terapia; L'intervento viene giudicato efficace se si verificano degli incrementi dei miglioramenti
attesi, immediatamente dopo le sedute o cicli di esse.

Difficoltà e limiti del disegno intensivo.


Anche se i disegni small N consentono di evitare alcuni dei problemi posti dai disegni between
groups, essi non sono tuttavia esenti da limiti e difficoltà. I problemi posti dai disegni A B sono due
e si riferiscono alla possibile grande variabilità dei dati raccolti relativi alla baseline e alla
generalizzabilità dei risultati ottenuti attraverso questo impianto sperimentale. Il ricercatore
dovrebbe effettuare misurazioni ripetute della baseline finché e sicuro che l'insieme dei dati
raccolti e stabile e definito, per questo motivo nelle situazioni cliniche può essere impossibile
seguire in modo soddisfacente questa procedura e quindi risultare difficile stabilire con chiarezza
qual è la relazione fra l'intervento il suo outcome. per limitare queste difficoltà possono essere
seguite alcune procedure quali ad esempio l'analisi sistematica dei fattori correlati alla variabilità
della misurazione della baseline, oppure si possono implementare i dati relativi ad essa con altre
informazioni raccolte dall' ambiente o da alcuni testimonials e così via. Quanto alla
generalizzabilità è questo uno dei tradizionali punti deboli dei disegni single case: la maggiore
obiezione che sorge nel valutare la ricerca singole case e che i risultati possono non essere
generalizzabili ad altre persone che non siano il soggetto originario. Se si considerano i dati ricavati
con disegno intensivo sul singolo paziente come funzione di tutte le sue caratteristiche rilevanti,
allora la popolazione statistica con la quale il singolo caso si identifica può teoricamente essere
definita nei termini di queste caratteristiche ovviamente basate su somiglianze piuttosto che su
identità complete. Ma il vero problema consiste nel fatto che ci sono ampi difficoltà per definire le
dimensioni che possano dettare la generalizzabilità dei risultati. Alcuni ricercatori usano i disegni
single case enfatizzando l'esigenza di cercare interventi che producano cambiamenti vistosi di
performance, quindi questi debbono essere probabilmente più generalizzabili fra gli individui di
quanto lo siano effetti che soddisfano il relativamente più debole criterio di significatività
statistica. Mi sono però altre difficoltà come ad esempio relative, alla reversibilità degli effetti
dell'intervento in quanto, alcuni effetti possono non essere reversibili; La durata degli effetti degli
intervento perché alcuni possono durare molto a lungo dopo l'interruzione degli intervento stesso;
La possibilità di effettuare comparazioni trattamenti globali e conclusi infatti, i disegni A B stabilire
raffronti fra l' outcome di trattamenti diversi; ho problemi di opportunità relative all' interruzione
dei trattamenti, questi disegni non richiedono gruppi di controllo e consentono di superare i
problemi relativi all'impiego di questa strategia sperimentale e può essere inopportuno
interrompere un trattamento in corso al fine di instaurare la fase A prevista dal disegno
sperimentale. Per quanto riguarda i disegni baseline multipla, un problema specifico si pone
quando si verifica un fenomeno di generalizzazione cioè quando si produce il cambiamento atteso
non soltanto nelle situazioni alle quali è stato applicato l'intervento ma anche nelle altre e prima
dell'intervento stesso. Potrebbe essere utile introdurre una componente addizionale del disegno
come una fase di sospensione dell'intervento.

L’analisi statistica nel disegno intensivo.


Un altro argomento di discussione e relativo all'impiego o meno dell'analisi statistica nel contesto
della ricerca single case: molti si opponevano all' analisi statistica argomentando che se gli effetti
sperimentali sono così microscopici la dimostrazione della loro evidenza richiedono analisi
statistica, quindi è improbabile che essi abbiano una rilevanza sufficiente per poter essere
considerati utili nella pratica clinica punto si proponeva, allora virgola che il disegno intensivo si
concentrasse esclusivamente sulla ricerca di effetti sperimentali in macroscopici, inoltre i dati che

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
si ottengono attraverso i disegni sperimentali small N sono spesso talmente complessi e ambigui
che la semplice analisi di essi attraverso l'ispezione visiva può condurre a errori di interpretazione.
Così, molte considerazioni suggeriscono l'utilità dei test e statistici per la ricerca single case. Vi
sono strumenti statistici che possono essere appropriati per i disegni small N partendo dal
presupposto che la logica del disegno single- case si basa sull'intero andamento e fluttuazione dei
dati, così che teste statistici che ignorassero l'andamento per lavorarle solo su singoli punti
estrapolati da esso, tradirebbero la logica di questo modello di ricerca: questi strumenti statistici
ad esempio possono essere le analisi delle serie temporali, ( la time series analysis) che determina
la significatività dei cambiamenti nel livello e nel trend e può essere utile quando i dati della
baseline non sono stabili. Negli ultimi anni i ricercatori stanno mettendo appunto altri strumenti di
analisi statistica per implementare i lavori che descrivono in modo puntuale affidabile l'impiego di
statistiche valide ed efficaci nell'analisi del cambiamento di un paziente singolo o di piccoli gruppi
di pazienti in seguito a un trattamento.

TERZO CAPITOLO. LA QUESTIONE DELLA MISURA NELLA RICERCA QUANTITATIVA.


L’impiego dei test psicodiagnostici nella ricerca quantitativa.
Nei disegni di ricerca di tipo quantitativo il lavoro di raccolta dei dati è svolto mediante l'impiego di
teste psicodiagnostici che misurano sintomi, comportamenti, reazioni e vissuti dai soggetti
coinvolti nella ricerca ma anche dei clinici e dei ricercatori. Bornstein ha proposto una
classificazione di questi strumenti: self-attribution, stimulus-attribution test, performance-based
test, constructive test, observational test, informant-report. L'impiego dei testi psicologici
risponde a tre esigenze particolari: la prima è quella di comprendere qualcosa del comportamento
umano normale e patologico andando al di là della conoscenza consapevole posseduta dal
soggetto che ne produce il comportamento stesso; fondamentale è il tema dell'interpretazione EI
test deputati allo svolgimento di questo compito sono soprattutto i test proiettivi, stimulus-
attribution, nelle loro varie versioni, ma rispondono al medesimo scopo anche i diversi punteggi
prodotti dalla somministrazione di un test oggettivo, self-attribution, soprattutto se organizzati in
cluster cioè sottoscale che rimescolano le risposte del soggetto ed evidenziano in questo modo
particolare i sintomi, comportamenti, tratti di personalità. La seconda è quella di usare strumenti
più rapidi ed economici rispetto al tradizionale colloquio clinico che resta lapis angularjs su cui
poggia tutto l'edificio dell'interazione della conoscenza fra psicologo e soggetto, ma che richiede
anche la disponibilità di risorse che nella storia della psicologia clinica, ha ripetutamente indotto a
seguire strade più brevi per formulare una diagnosi e l'indicazione a un trattamento. La terza è
relativa al problema del bias del clinico cioè della tendenza che quest'ultimo può avere a
distorcere in modo più o meno sistematico le proprie valutazioni, per motivi che sfuggono a lui
stesso e che possono a volte essere talmente congenti da inquinare anche la semplice raccolta dei
dati grezzi. Per svolgere il proprio compito ogni test deve possedere alcuni requisiti specifici che
garantiscano l'affidabilità dei risultati forniti o anche la credibilità delle informazioni acquisite
naturalmente, questo vale anche per i test psicodiagnostici a proposito dei quali, si deve
purtroppo, riconoscere che i loro costruttori ed utilizzatori hanno troppo spesso attribuito ai dati
raccolti caratteristiche di certezza che erano invece ben lungi dall'essere dimostrate.
La verifica di affidabilità dei test psicodiagnostici.
Innanzitutto il test che si vuole utilizzare deve essere valido e attendibile: nel primo caso, abbiamo
le prove che il test è capace di misurare effettivamente la caratteristica le caratteristiche che
dichiara di misurare, nel secondo caso, invece che è la misura ottenuta dal test è stabile e
costante. Se le garanzie non sono adeguate il test non deve essere somministrato, oppure le
informazioni che esso consente di ottenere devono essere considerate alla stregua di ogni altre
informazioni sul paziente, che sia biased per qualsivoglia motivo virgola e quindi si deve concedere

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
a essa una credibilità assai modesta e che comunque deve essere sottoposta a verifica in quanto in
questo caso, il test fallisce i suoi scopi. In secondo luogo deve essere verificata la cosiddetta
standardizzazione , taratura del test, cioè il procedimento attraverso il quale si stabiliscono i dati
normativi, i valori attesi, che consentono di mettere in relazione ogni soggetto con la popolazione
alla quale appartiene, mediante il risultato ottenuto. Per definire questo sistema di riferimento si
possono utilizzare diverse strategie: prescindendo da popolazioni bersaglio Virgo i dati normativi
possono essere derivati da campioni di non pazienti, campioni non clinici, oppure da campioni
rappresentativi della popolazione generale virgola che conducono una certa percentuale di
soggetti patologici com'è inevitabile che accada se non si effettua nessuno screening. le norme
ricavate attraverso gli impiego delle due strategie possono essere anche molto distanti fra loro,
una prima regola che andrebbe osservata nella scelta di un test, è quella di accertare come sono
stati costruiti i campioni normativi e vengono precisati anche criteri di inclusione ed esclusione dei
soggetti. Un altro problema rilevante riguarda la taglia campionaria: è opportuno che il campione
non si è sbilanciato da disomogeneità, prevalenza incontrollate che riguardino il genere, il sesso,
l'età e così via.
I nontest factors.
Possiamo definire i nontest factors come variabili intervenienti nel comportamento del paziente di
fronte al test, la cui influenza è direttamente proporzionale alla gravità del quadro psicopatologico,
ma anche alla struttura di personalità e qualità della collaborazione virgola e che possono inficiare
le potenzialità valutative dal test senza cessare tuttavia di essere preziosi elementi di conoscenza
del paziente, se gli si prende in considerazione e li si analizza anziché considerarli semplicemente
un disturbo. L'impiego del test sia nell'attività clinica che in quella di ricerca indica un' attenzione e
specifiche ai nontest factor che deve trovare una sistematizzazione attraverso criteri condivisi ha
certamente empiricamente e fondati. Lang propone un sommario elenco di non test factors: la
qualità della relazione e l'effetto che la psicopatologia del paziente esercita su chi somministra
valuta i test; Il livello di alleanza e di motivazione del soggetto e il modo in cui reagisce alle
difficoltà poste dal materiale stimolo; i possibili errori di somministrazione. Una regola di carattere
generale per ridurre al minimo la distorsione dei dati suggerisce di trattare i soggetti coinvolti nella
ricerca nello stesso modo in cui un clinico esperto tratta i propri pazienti, quando vengono
sottoposti a un esame testologico: informazioni adeguate sullo scopo della somministrazione del
test e sullo svolgimento della prova; verifica della disponibilità non solo formale del testando a
fare la fatica implicita nell'esecuzione del compito; Attenzione al giusto momento nel quale il test
può essere somministrato virgolo sia lontano da condizioni di emergenza nel gruppo dei casi, o di
fretta nel gruppo di controllo. Infine, un disegno di ricerca che tenga a bada la parzialità delle
informazioni fornite da un test attraversa somministrazione anche di altri reattivi virgola in
funzione di verifica; Non tutte queste cautele devono o possono essere osservate ogni volta ma
l'elenco serve a ricordare che i test sono sostanzialmente strumenti deboli che esprimono il loro
potenziale conoscitivo solo se vengono scrupolosamente rispettate alcune condizioni del loro
utilizzato.
L’esigenza di una tassonomia.
Appare sempre più evidente il bisogno di pervenire anche per i test psicodiagnostici a una sorta di
what Works for whom, che possiamo implementare aggiungendo all' esigenza di individuare quale
teste funziona meglio per quale tipo di soggetti, anche l'indicazione di quale teste è più coerente
con il disegno di ricerca viene utilizzato. Il concetto di oggettualità viene identificato quindi come
uno degli assi portanti di ogni attività di ricerca in quanto, la congruenza fra oggetto e metodo
deve essere infatti anche congruenza fra oggetto e strumenti di indagine, nonché fra oggetto e
procedure di elaborazione dei dati ma non solo statistica. E’ empiricamente importante esplorare
le condizioni alle quali un testo esprime al meglio il proprio potenziale e euristico: può essere utile

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
un elenco di indicazioni e controindicazioni ai vari test che consente di valutare il maggior numero
possibile delle variabili che incrementano o decrementano l'affidabilità di ciascuno strumento.
Dovrebbe discendere da qui anche il set di informazioni sul quale fondare la scelta dei testi da
utilizzare a seconda dei diversi disegni di ricerca.
Il progetto COSMIN.
Negli ultimi anni, la comunità scientifica ha compiuto notevoli passi in avanti per produrre
protocolli standard al fine di migliorare la qualità delle misure legate alla valutazione della salute e
o patologia e i criteri di scelta di quelle migliori o più indicate in un determinato contesto. In
particolare una specifica attenzione agli strumenti di self report è stata data dal gruppo di lavoro
del Cosmin che si propone l'obiettivo di fornire indicazioni operative per la selezione di strumenti
di misura evidence based. In psicologia clinica, come in psichiatria, l'utilizzo di svariate misure per
l' assessment di uno stesso costrutto, così come le caratteristiche psicometriche degli strumenti,
non hanno spesso consentito una sufficiente confrontabilità tra risultati ottenuti in studi diversi,
impedendo di raggiungere conclusioni condivise nella comunità scientifica e professionale in varie
aree di ricerca e di intervento punto a questo scopo il gruppo di lavoro delle Cosmin, costituito da
un panel di 43 esperti nell'ambito della psicologia, epidemiologia, statistica e clinica medica, ha
messo appunto uno checklist per valutare la qualità metodologica negli studi sulle caratteristiche
di uno strumento di misura. L'obiettivo del lavoro era quello di raggiungere un adeguato livello di
consenso tra esperti su quali proprietà di misura debbano essere valutate negli strumenti di self
report di outcome e come debbano essere definite; Indicare standard condivisi per condurre
ricerche metodologicamente corrette sulle caratteristiche di misura di uno strumento. Nella
tassonomia del Cosmin checklist sono inclusi tre domini di qualità: attendibilità, validità e
responsività, ovvero la capacità dello strumento di rilevare il cambiamento del soggetto nel
costrutto misurato nel corso del tempo. A sua volta ogni dominio include diverse proprietà
psicometrica da valutare: all'interno dell' attendibilità di troviamo la consistenza interna, l'
attendibilità nelle sue diverse forme e l'errore di misura; nel dominio della validità sono inclusi la
validità di contenuto virgola di costrutto e di criterio. Vengono valutati anche alcuni criteri di
inclusione fondamentali ovvero la validità cross-culturale. Per quanto riguarda la responsabilità, le
domande alle quali rispondere sono ad esempio se il campione utilizzato è adeguato per misurare
il cambiamento o se sono stati considerati almeno due misurazioni effettuate con lo strumento.
Misurare?
Costruzione ottima, validazione, taratura e aggiornamento sono le condizioni ideali della fattibilità
di un test e le garanzie della sua credibilità. L'inclusione di un teste psicodiagnostiche non disegno
di ricerca implica che il ricercatore accerti che lo strumento scelto sia il prodotto del rispetto di
questa sequenza operativa: se poi è egli stesso a costruire un test, da impiegare nelle proprie
attività di misurazione, deve fornire a chi leggerà i risultati del suo lavoro tutti i dati indispensabili a
prestare fiducia agli strumenti utilizzati per conseguirli. E' stato Galton a sostenere per primo che
la misurazione in psicologia virgola che non può fare riferimento né a 1 0 ne ha una sua unità
propria, può fare ricorso soltanto a confronti basati sulla distribuzione statistica delle misurazioni
punto per questo motivo, le misurazioni delle quali facciamo uso nell'attività di ricerca in
psicologia clinica devono essere affidabili virgola in tutti i sensi. Il lavoro necessario per costruire il
corpus e di garanzie che conferiscono reale utilità pratica un testo psicologico partecipa di quella
interminabilità e incompletezza che è il contrassegno della psicologia, implicito da sempre ed
esplicito sostanzialmente da Freud in avanti. Le preoccupazioni metodologiche indicano un
percorso che si snoda fra certezze parziali ma difendibili, Irap e tutti i confronti basati sulla
distribuzione statistica delle misurazioni, come sosteneva Galton, sono almeno fino a ora, il
compromesso possibile fra la difficoltà a conseguire conoscenze incontrovertibili e l' afasia.

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
QUARTO CAPITOLO. L’APPROCCIO QUANTITATIVO NELLA RICERCA SUGLI ESITI DELLE
PSICOTERAPIE E DEGLI INTERVENTI PSICOLOGICI.
L'utilizzo del disegno estensivo ha trovato nei randomized controlled trials,RCT studi randomizzati
controllati, il Gold standard della ricerca volta a indagare l'efficacia di una psicoterapia o di un
intervento psicologico e a compilare un elenco di quelli che si possono definire empirically
supported treatments, EST terapie validate empiricamente.
GLI RCT.
La ricerca con gli RCT confronta l'effetto di condizioni differenti su un outcomes, variabili
indipendenti su variabile dipendente. Negli esperimenti between groups il confronto avviene
attraverso due diversi gruppi di soggetti esposti alle differenti condizioni, manipolazione
sperimentale: se si deve stabilire se un determinato intervento psicologico è efficace nel
trattamento di uno specifico disturbo, lo studio RCT aiuta a rispondere alla seguente domanda
possiamo essere sicuri che il miglioramento riscontrato dai pazienti sia dovuto al trattamento
ricevuto? per rispondere a questa domanda, il disegno di ricerca stabilisce che si estragga un
campione di soggetti virgola di numerosità adeguata, dalla popolazione di riferimento cioè quella
dei pazienti affetti dallo specifico disturbo oggetto dello studio; i pazienti selezionati vengano
assegnati in modo causale quindi randomizzato, a una delle due condizioni sia sperimentale che di
controllo quindi, pazienti in trattamento versus pazienti non in trattamento; i pazienti del gruppo
sperimentale ricevono il trattamento mentre i pazienti del gruppo di controllo non lo ricevono; al
termine del trattamento si verifichi se i pazienti che hanno ricevuto il trattamento presentano un
miglioramento dell' outcome significativamente maggiore dei pazienti nella condizione di
controllo. Il principale punto di forza di questa metodologia, per il quale viene utilizzata anche
negli studi di efficacia degli interventi psicologici virgola e la sua elevata validità interno in quanto
tramite l'utilizzo di un gruppo di controllo non sottoposto alla manipolazione sperimentale, si
possono tenere sotto controllo le principali minacce al valore dell'esperimento. Al contempo la
randomizzazione dei pazienti, l'uso di campioni di pazienti omogenei, la standardizzazione e
manualizzazione dei trattamenti di, oltre che la durata standard delle terapie riduce la
generalizzabilità dei risultati, poiché nelle normali condizioni di esercizio della pratica clinica non è
frequente che tutte queste condizioni si verifichino e soprattutto si verifichino insieme.
GLI EMPIRICALLY SUPPORTED TREATMENTS(EST).
Gli EST possono essere definiti come interventi per i quali sono disponibili prove, ricavate da studi
sperimentali virgola che ne dimostrano la capacità di apportare miglioramenti alla condizione
patologica del paziente distinguendo gli interventi terapeutici utili da quelli inutili o addirittura
dannosi, compresa l'induzione di possibile effetti iatrogeni, in altri termini lo scopo è differenziare
il più possibile le terapie che funzionano da quelle che non funzionano. Sul piano della conduzione
delle ricerche, la metodologia che ha costantemente dominato il panorama degli EST è costituita
dai randomized controlled trials.
Limitare i rischi di bias negli RCT.
Nonostante gli RCT rappresentino oggi il Gold standard per la valutazione di un intervento clinico,
esiste la consapevolezza che diverse fonti di bias possono minarne la validità interna: varie reviews
sistematica hanno messo in risalto che la maggior parte dei trials per la valutazione dell'efficacia
dei trattamenti psicoterapeutici e degli interventi psicologici soffrono di un rischio di bias da
moderato a elevato. E quindi interessante osservare che negli ultimi anni la diffusione degli RCT
nella ricerca in psicologia clinica sia aumentata parallelamente all'evidenza di problemi
metodologici sostanziali dovuti all'applicazione di questi disegni: ad esempio Tarquinio, Kivits e
Minary si chiedono se gli RCT siano davvero la metodologia appropriata quando si valuta l'efficacia
di interventi complessi, quali quelli che si occupano di modificare il benessere psicologico di un
individuo punto gli autori propongono una maggiore attenzione ai problemi di validità esterna

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
degli RCT cioè si chiedono se i risultati di un RCTv possono essere generalizzabili ai pazienti della
normale routine clinica quotidiano in altri termini, è il problema della distanza tra efficacy e
effectiveness o dal confronto fra significatività statistica e significatività clinica favorendo
l'inserimento di valutazioni sul processo del trattamento. I strumenti pesce valutare il rischio di
bias negli RCT ad esempio sono il Cochrane-risk-of-bias, oppure il sistema GRADE, per valutare la
qualità degli RCT e degli studi osservazionali . e auspicabile che l'adozione estensiva di questi
strumenti consente, nei prossimi anni virgola di superare molti dei limiti metodologici degli RCT
finora sottovalutati o quantomeno di misurare in maniera precisa il rischio rappresentato da
indebite generalizzazioni dei loro risultati.
RCT ED EST.
Le critiche di ordine metodologico rivolte agli RGT si sovrappongono alle critiche rivolte agli EST
che sono considerati empiricamente validi proprio in forza di studi di tipo RCT. La zona di
overlapping riguarda la più frequente constatazione che l'efficacia dei trattamenti psicoterapeutici
provata dagli studi sperimentali non è sempre immediatamente traducibile in efficacia clinica
verificabile nella pratica terapeutica quotidiana: non tutti i trattamenti che dovrebbero funzionare
in base alle prove della ricerca empirica funzionano poi effettivamente infatti gli psicoterapeuti
segnalano costantemente una percentuale rilevante di non responders, ma l'impianto
metodologico dell'approccio evidence based non è mai sembrato capace di affrontare questo
problema in termini clinicamente utili. L' approccio evidence based alle psicoterapie impartisce un
difetto di fondo cioè si occupa dei trattamenti che funzionano e non ne struttura uno specifico
interesse di ricerca sui casi nei quali questi trattamenti non si dimostrano efficaci: possiamo dire
che il non-responders appartengono ai cosiddetti outliers, ossia ai casi anomali, lontani dalla
media e che quindi gli RCT fondati sostanzialmente su quest'ultima, forniscono in modo esemplare
le misure della tendenza centrale, ma non sono in grado di rilevare convenientemente le
caratteristiche dei soggetti le cui peculiarità sono irriducibili a quelle della maggioranza. E questo il
gap fra efficacy ed effectiveness e in questo gap si rende evidente una sorta di tradimento del
fondamento della clinica nasce virgole si sviluppa proprio a partire dal quesito pressante posto dal
malfunzionamento di qualcosa che invece dovrebbe funzionare punto le critiche rivolte alla
pretesa di considerare la metodologia degli EST come il Gold standard delle ricerche sull'efficacia
dei trattamenti hanno poi un altro consistente fondamento epistemologico cioè il concetto di
oggettualità . In trattamenti psicoterapeutici che non sono riconducibili a questo paradigma non
ne possono riconoscere nella metodologia degli RCT il Gold standard delle verifiche di efficacia e
quindi propongono altri disegni di ricerca che ritengono più congrui con i propri scopi terapeutici e
il processo che si propone di conseguirli. Mi sono quattro assegni metodologici dell' approccio
degli EST: primo assunto: i processi psicologici sono altamente malleabili, appartiene all'
esperienza di ogni psicoterapeuta che hai gran parte delle vulnerabilità psicologiche e resistente al
cambiamento, anche secondo non lessico differente, pressoché tutti noi andamenti
psicoterapeutici concordano nella descrizione di questa evidenza rilevata nella pratica clinica
quotidiana ma anche supportata dai risultati della ricerca empirica; secondo assunto: la maggior
parte delle pazienti ha solo un problema principale o può essere trattata come se lo avesse virgola
di nuovo, l'esperienza clinica dimostra che la maggior parte dei pazienti che chiede aiuto
psicologico presenta commorbilità, negare quest'ultima è forse una conseguenza dei limiti impliciti
nei sistemi nosografico descrittivi di tipo categoriale che potrebbero forse essere costretti
corroborando la base empirica delle etichette psicopatologiche. Terzo assunto: i sintomi psicologici
possono essere trattati a prescindere dalla personalità di chi li presenta, ovvero un disturbo può
essere trattato indipendentemente dalla personalità sottostante, l'argomento è quello della
purezza dei campioni dei trials sperimentali punto la rigidità dei criteri di inclusione ed esclusione
consente di costruire campioni relativamente omogenei, ma penalizza il trasferimento dei risultati

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)
dalle laboratorio alla clinica e ne diminuisce la generalizzabilità perché l'indipendenza tra sintomi
struttura psicologica è contraddetta dall'esperienza e dalle evidenze degli studi psicopatologici
virgola che dimostrano l'elevata compresenza di diverse organizzazioni di personalità sottese alla
medesima sintomatologia. Quarto assunto: gli RCT sono il Gold standard per valutare l'efficacia
terapeutica, la randomizzazione, l'assegnazione casuale dei pazienti del gruppo in trattamento il
gruppo di controllo, lo stesso utilizzo dei gruppi di controllo, il riferimento a trattamenti
manualizzati, la frequenza esclusione di pazienti con i prognosi favorevoli sollevano
costantemente la questione se tale metodologia sia sufficientemente rappresentativa della realtà
clinica. In particolare il disegno di ricerca presupposto dagli RCT è difficilmente applicabile alla
psicoterapia a lungo termine, che può durare diversi anni, infine un'altro aspetto discutibile è la
focalizzazione degli RCT sui sintomi ai comportamenti disfunzionali anziché sulla globalità del
funzionamento individuale.
Quindi, i trattamenti che potrebbero essere studiati con disegni fondati sugli RCT sono quelli
brevi, con un carattere prescrittivo e direttivo, facilmente manualizzabili e che utilizzano solo
numero ristretto di interventi distinti.
Infine è ormai evidente che li ricerca sull'efficacia delle psicoterapie che non si focalizzano
esclusivamente sulla remissione sintomatica, prendono in considerazione una modifica delle
modalità relazionali, del funzionamento sociale e del benessere complessivo della persona e non
possono appiattirsi sulla metodologia degli RC ti quindi, gli studi sull’effectiveness dei trattamenti
nei contesti di cura reali devono integrare le conclusioni degli RCT al fine di garantire la validità
esterna.

Document shared on www.docsity.com


Downloaded by: napo-napo-1 (erasedata232@gmail.com)

Potrebbero piacerti anche