psicologia clinica Psicologia Clinica Università degli Studi di Palermo 20 pag.
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) DISEGNI DI RICERCA IN PSICOLOGIA CLINICA. Metodi quantitativi, qualitativi e misti.
PREMESSA. REQUISITI FONDAMENTALI DI OGNI DISEGNO DI RICERCA.
“Il disegno di ricerca rappresenta il programma di rilevazione, misurazione e analisi dei dati”. Ciascun disegno di ricerca contempla alcuni vincoli di carattere metodologico, ai quali il ricercatore deve attenersi, a garanzia della correttezza del suo lavoro e dell’attendibilità delle sue conclusioni. L’oggettività Il termine “oggettività”, possiede un significato forte e uno debole: - forte: vuol dire che l’oggettività inerisce (è strettamente unito) all’oggetto; - debole: vuol dire che l’oggettività è indipendente dal soggetto, travalica i limiti dell’individualità e acquista valore non più per quella sola persona, bensì per molte o per tutte. L’intersoggettività, è un requisito più debole dell’oggettività ed è una caratteristica necessaria ma non sufficiente di quest’ultima. Tuttavia, un’intersoggettività correttamente costruita all’interno della conoscenza scientifica può istituire anche l’oggettività in senso forte, arrivando a coincidere con essa. Nell’epistemologia contemporanea, quando si parla di oggettività, si fa generalmente riferimento al significato “debole” di questo concetto, ossia lo si traduce in termini di intersoggettività, cioè di un sapere condiviso da un certo numero di studiosi e acquisito secondo una metodica “pubblica”. Si parla anche di ispezionabilità di un lavoro di ricerca ed è utile ricordare che il requisito della ispezionabilità riguarda in modo specifico anche la relazione che esiste fra esperienza pratica e costruzione teorica: fra i dati e la loro generalizzazione in una determinata teoria esplicativa. Il legame fra esperienza pratica e costruzione teorica deve infatti essere garantito attraverso l'assunzione di una rete di nessi logici totalmente esplicita e ispezionabile, la quale consente in ogni momento di ridiscendere, percorrendo un cammino magari lungo e complesso ma sempre oggettivo, fino a qualche proposizione immediatamente ispezionabile grazie ai criteri di protocollarità ammessi. L’oggettualità. Il presupposto sul quale si basa questo concetto è quello dell’intrinseca solidarietà di oggetto e metodo. Che questa solidarietà sia assolutamente necessaria deriva dal presupposto dell’esistenza di un indissolubile intreccio originario tra momento descrittivo e momento normativo del sapere. In altri termini, così come il metodo non precede l’oggetto, altrettanto l’oggetto non precede il metodo: la scelta dei predicati specifici e del linguaggio stesso con il quale si può parlare dell’oggetto coincide con la scelta dei criteri di protocollarità, che sono appunto di natura metodologica. Il concetto di “oggettualità” rimanda al fatto che la conoscenza scientifica è sempre conoscenza a proposito di oggetti precisamente ritagliati dal campo di osservazione. La concezione della “cosa come fascio di oggetti” e il concetto di accordo intersoggettivo sui criteri di protocollarità e sui predicati specifici conferiscono alla scienza un carattere di spiccata contingenza e relatività. La contingenza e la relatività sono fisiologiche a proposito dei punti di partenza del lavoro scientifico, ma sono patologiche a proposito di tutto quanto viene dopo. In altri termini, una volta raggiunta una convenzione esplicita sui criteri di protocollarità che ritagliano gli oggetti della scienza, tutto ciò che si fa successivamente deve essere conseguente: ogni lavoro scientifico che per confusioni, imprecisioni, superficialità rispetto ai criteri di protocollarità che definiscono l’oggetto e il metodo non consente a chiunque di verificare i risultati rifacendo le stesse operazioni, non dice nulla di apprezzabile. Tipologie della ricerca.
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) Nei manuali di metodologia si distinguono le ricerche di tipo quantitativo da quelle di tipo qualitativo e, fra le prime, i disegni estensivi da quelli intensivi. Il disegno è estensivo e definito fondamentalmente come quell'approccio nel quale la variazione nel fenomeno sotto studio e analizzata come accade da soggetto a soggetto ho da paziente a paziente e nel quale le ipotesi sono verificate rispetto ai gruppi di pazienti. Il punto essenziale del disegno e estensivo e che la verifica delle ipotesi è fatta attraverso i pazienti: questo è in contrasto con il disegno intensivo, nel quale le ipotesi sono verificate entro i pazienti.
PRIMA PARTE. LA RICERCA DI TIPO QUANTITATIVO
PRIMO CAPITOLO. IL DISEGNO INTENSIVO. Si tratta del disegno di uso più frequente in psichiatria e in psicologia clinica ed è spesso chiamato anche disegno between-groups, perché lei differenti condizioni sono somministrate a gruppi separati. I disegni estensivi devono rispettare alcuni vincoli:- la quantità e la qualità campionaria - il controllo degli errori (di I e II tipo) e dei fattori di disturbo- l’appropriatezza dei gruppi di controllo- la significatività dei dati.Questo tipo di disegno di ricerca è utilizzato sia nella ricerca medica che in quella psicosociale. La quantità campionaria. L’utilità generale delle tecniche di campionamento si basa sul presupposto che sia possibile fornire informazioni su una popolazione sulla base dell’analisi di un numero limitato di individui. Il problema fondamentale è che il numero degli individui in questione non può essere realmente molto limitato, perché la percentuale di eventi osservati in un campione costituisce una stima solo approssimativa della cosiddetta percentuale vera degli stessi eventi ottenibile teoricamente nella popolazione. Un buon campione di ricerca deve quindi rappresentare in maniera adeguata la variabilità dei dati presente in una popolazione. L’impiego di campioni piccoli pone anche altri problemi, ad esempio, con un campione piccolo, è estremamente improbabile ottenere un risultato statisticamente significativo, qual è necessario per confutare l’ipotesi nulla: questa, perciò, deve essere accettata come vera. Ma allora quanto deve essere grande un campione? L’ampiezza campionaria dipende dalla natura e dagli obiettivi della ricerca. Si deve dire con chiarezza che 10-20 soggetti sono un numero assolutamente insufficiente per ricerche estensive in campo clinico: Chassan suggerisce uno standard che si aggira intorno alle 50 unità e, effettivamente, questo è il livello minimo accettabile. Chassan, ha indicato in 20-25 pazienti per trattamento “il minimo assoluto per una ragionevole possibilità di scoprire effetti differenti di un farmaco”, non mancando tuttavia di ricordare che molti metodologi “insistono su un minimo di 50- 100 pazienti”. In genere, gli individui sono portati a considerare qualunque campione proposto da un lavoro di ricerca come altamente rappresentativo della popolazione da cui è stato estratto, indipendentemente dalla sua numerosità. Non viene tenuta in adeguata considerazione, quindi, la taglia campionaria e, dato ancora più interessante, sia i ricercatori che i lettori di quest’ultimi, se non vengono adeguatamente formati e, per così dire, avvertiti del pericolo, condividono spontaneamente questi errori di ragionamento presenti nella popolazione non specialistica; l’attenzione alla taglia campionaria, sia nella costruzione dei campioni che nella valutazione dei risultati ottenuti, passa così in secondo piano. Il cosiddetto “esperimento dell’ospedale” è un buon esempio di quanto stiamo dicendo:- Una città ha due ospedali, uno grande, nel quale nascono in media 45 bambini al giorno e uno piccolo, con una media di 15 nascite giornaliere. Postulato che: a. Il 50% dei neonati nella popolazione è di sesso maschile; b. La percentuale del sesso dei neonati varia giornalmente; c. Nell’ultimo anno in ambedue gli ospedali è stato computato il numero dei giorni in cui più del 60% dei neonati era di sesso maschile, si chiede In quale ospedale si è verificato il numero più alto di giorni di questo tipo? Le risposte, sono state, in genere: “Nei due ospedali vi è stato lo stesso numero di giorni con un sovrappiù di neonati maschi”. La risposta
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) corretta, invece, è: “L’ospedale piccolo”, perché nei campioni piccoli è più probabile la deviazione delle leggi della popolazione. L'esperienza ha confermato che lo svolgimento di una ricerca di tipo estensivo in un ambiente clinico presenta numerose difficoltà, in particolare, il reclutamento del campione dei soggetti dello studio permane un processo difficoltoso e dai tempi lunghi. Scopo principale di una soddisfacente ampiezza campionaria è quello di garantire che i risultati ottenuti in un campione o gruppo di soggetti possano essere generalizzati a tutti gli altri soggetti che costituiscono quella popolazione di riferimento: si tratta di uno dei principi di fondo della logica della conoscenza scientifica, che ai giorni nostri si caratterizza per il suo tratto probabilistico. In altri termini, non possiamo avere la certezza assoluta che il risultato ottenuto in gruppo selezionato di soggetti sia identico a quello che si otterrebbe nella popolazione di riferimento, ma possiamo stimare che questo avvenga con una determinata probabilità (ad esempi, nel 95% dei casi). Minore è l’ampiezza dei gruppi che vengono confrontati, minore è la probabilità di identificare se esistano o meno differenze tra i gruppi. La qualità campionaria. Come scrive Kline: “gli errori di campionamento sono uno dei problemi fondamentali delle ricerche sul comportamento”. In altri termini, l’attenzione alla numerosità dei soggetti inclusi nel campione è una misura necessaria ma non sufficiente nel costruire quest’ultimo. Un campione adeguato dal punto di vista quantitativo può ugualmente essere scarsamente rappresentativo, se non sono stati rispettati alcuni vincoli che riguardano: La scelta dei soggetti in rapporto al loro ambiente di provenienza (il rapporto fra campione e popolazione);- La scelta delle variabili. Brunswick (1955), ha proposto il concetto di “rappresentatività ecologica”, ovvero l’habitat naturale-culturale di un individuo o di un gruppo. Ne discende, che i risultati di ogni indagine campionaria sono rappresentativi esclusivamente della popolazione da cui è stato est ratto il campione. Non è possibile estendere i risultati di una ricerca fatta su di una generica popolazione a un’altra popolazione. La rappresentatività ecologica riduce considerevolmente il valore che viene solitamente attribuito alle procedure di randomizzazione. La scelta casuale dei soggetti è senz’altro utile a limitare i bias che, nella costruzione di un campione, possono far sì che quest’ultimo non sia rappresentativo della popolazione, in quanto sbilanciato in uno o più parametri, ma questo “benefico effetto” si produce solo se il campione rispetta il vincolo della rappresentatività ecologica, che, quindi, costituisce lo step precedente alla scelta casuale, nelle tecniche di campionamento. Il fatto che un campione sia “randomized” non garantisce affatto, di per sé, la generalizzabilità dei risultati. È necessario fare un breve accenno alla teoria della validità, nella quale si differenziano la:-Validità interna : una ricerca è “intern valide” se è possibile ricondurre causalmente alla variazione della variabile indipendente una determinata variazione della variabile dipendente. Per questo, è necessario mantenere sotto controllo tutti i cosiddetti “fattori di disturbo di tipo I”, ossia le influenze che, durante lo svolgimento della ricerca, potrebbero rendere dubbia questa connessione causale. -Validità esterna: una ricerca è “extern valide” se i suoi risultati sono generalizzabili, ossia non sono riconducibili soltanto alle specifiche circostanze in cui la ricerca è stata condotta. Anche nel caso della validità esterna esistono fattori di disturbo (di II tipo), che rendono i risultati della ricerca generalizzabili solo per una determinata classe di situazioni, ossia quella di cui è nota la condizione specifica di disturbo. La validità interna richiede un controllo completo dei fattori di I tipo e la condizione ottimale, di conseguenza è quella dell’isolamento, come accade in un setting sperimentale di laboratorio; in questo modo, tuttavia, si inficia, in misura più o meno cospicua, la rappresentatività delle condizioni e, quindi, la validità esterna. D’altra parte, in una situazione più rappresentativa, quale può essere quella di uno studio naturalistico, il controllo dei fattori di disturbo di I tipo è senz’altro meno accurato e meno soddisfacente. Secondo la teoria della validità, tuttavia, se manca il requisito della validità interna, perde significato il criterio della rappresentatività. È importante ricordare, però, che la condizione
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) indispensabile al controllo dei fattori di disturbo di II tipo è costituita dall’impiego di campioni rappresentativi. Affinché le variabili siano rappresentative è necessario che lo siano i campioni e viceversa. In altri termini, la rappresentatività delle variabili è un aspetto del problema più ampio della validità esterna e, quindi, della generalizzabilità. Kerlinger (1973) ha scritto: “Quando parliamo di ansia, a quale genere di ansia ci riferiamo? Tutti i tipi di ansia sono uguali?”. Una risposta metodologica soddisfacente è rappresentata dalle procedure di operazionalizzazione, che rimandano al concetto di “definizione d’uso”. Possiamo riferirci all’operazionalizzazione, come a un sistema di controllo adeguato ad accertare che ciò che ha fatto è fatto bene. Il sistema di controllo prevede che:- Siano indicate le condizioni di impiego dei costrutti, degli strumenti, delle misure ecc. - Siano definiti, nel modo più dettagliato possibile, i fini di tale impiego: a quale scopo, in quali condizioni, per capire che cosa, per rilevare quali caratteristiche, ecc.- Siano indicati eventuali vincoli all’impiego dei costrutti, degli strumenti, delle misure, ecc . - Siano stabilite le regole procedurali per la creazione di eventuali indici sintetici che traducano i costrutti o parti di essi, nonché i risultati ottenuti attraverso l’impiego degli strumenti o l’applicazione delle misure; le regole che devono essere seguite nel caso in cui si vogliano apportare modifiche al sistema di controllo, oppure modificare ciò che è stato stabilito ai punti precedenti. Per semplificare, è doveroso che tutti i termini e i costrutti che possono presentarsi a usi molteplici siano operazionalizzati, ossia accuratamente definiti in ragione dell’impiego che ne viene fatto di volta in volta. Un disegno di ricerca merita attenzione innanzitutto se è idealmente possibile riprodurlo, ossia se tutta la rete di concetti teorici e di operazioni empiriche è totalmente esplicita e non sono presenti concetti ambigui, definizioni imprecise, strumenti introvabili, elaborazioni mal descritte. Il problema dei gruppi di controllo. Un gruppo di controllo può essere definito come “un gruppo di soggetti selezionati in modo che siano paragonabili ai soggetti del gruppo (dei gruppi) sperimentali, tranne che per il fatto che, diversamente da questi ultimi, non sono esposti al trattamento, oggetto della ricerca”. L’impiego di gruppi di controllo all’interno di un disegno between-groups (disegno estensivo) risponde allo scopo di fornire un controllo generale relativamente a diversi tipi di bias, di artefatti e di ipotesi alternative di spiegazione che potrebbero inficiare la validità di una ricerca. È possibile indicare quali sono i più diffusi tipi di gruppo di controllo: il più semplice è costituito da un gruppo, gruppo di controllo no trattamento, nel quale i soggetti assegnati in modo casuale, semplicemente non ricevono di trattamento al quale sono sottoposti i soggetti del gruppo sperimentale. Una variante si può ottenere impiegando come membri del gruppo di controllo i pazienti in lista d’attesa , waiting-list control Group per essere sottoposti al trattamento al quale già sono sottoposti i soggetti del gruppo sperimentale: quando questi ultimi hanno terminato il trattamento, si trattano i soggetti in lista d'attesa e in diversi momenti successivi, si valutano i cambiamenti intervenuti prima, durante e dopo il trattamento. Il gruppo di controllo no Contact allo scopo di valutare gli effetti della partecipazione un programma di trattamento anche dal semplice contatto con quest'ultimo: gli individui scelti per questo gruppo di controllo non sanno neppure di essere inclusi in uno specifico disegno di ricerca; l'assessment del loro comportamento deve essere effettuato come se fossero in causa altri elementi e altri propositi. Il placebo control group È inserito in disegni che si propongono di verificare se gli effetti di un trattamento sono dovuti semplicemente alle sue componenti non specifiche, i cosiddetti fattori terapeutici comuni non specifici: al gruppo di controllo vengono forniti tutti gli elementi che costituiscono la struttura formale del trattamento ma non i suoi ingredienti peculiari. Lo yoked control group questo è usato per mantenere sotto controllo le variazioni across groups che possono verificarsi durante il corso dell'esperimento: lo yoking è effettuato accoppiando i soggetti del gruppo di controllo con i soggetti del gruppo sperimentale e usando le informazioni ottenute con i soggetti sperimentali. Lo scopo è quello di uniformare across groups nelle variabili estranee, cosicché sia possibile valutare senza distorsioni
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) la variabile oggetto di studio. I gruppi di controllo ad assegnazione non randomizzato , patched-up group ,sono caratterizzata dalla deliberata scelta dei soggetti, nei quasi esperimenti, un gruppo ad assegnazione non randomizzata può essere usato per controllare elementi che minacciano la validità interna, quali la storia o l'evoluzione dei soggetti. Il gruppo, causa del metodo di selezione adottato, controlla questi elementi in modo imperfetto ma rinforza comunque la plausibilità delle conclusioni che possono essere dedotte dalla ricerca: questi gruppi forniscono spesso utilizzati i comparativi. Ovviamente, fra i vari tipi di gruppo di controllo disponili, è opportuno scegliere quello più adatto in ragione di ciascun particolare lavoro di ricerca. In genere, sono tre i criteri che ispirano la scelta:1. L’oggetto di studio specifico2. I dati ottenuti da ricerche precedenti3. I vincoli imposti dalla situazione (compresi gli obblighi di carattere etico). La considerazione più rilevante è relativa al fatto che, in molte delle situazioni di cui si occupa la psicologia clinica, non ricorrono le condizioni che consentono un uso efficace di questo strumento. Dietro queste difficoltà fanno capolino le differenze fra la ricerca sull’efficacia dei farmaci e la ricerca sull’efficacia delle psicoterapie. È importante incoraggiare le ricerche sulle indicazioni e le controindicazioni ai diversi trattamenti, in rapporto alle differenti condizioni cliniche, ossia la molteplicità delle patologie di volta in volta presa in considerazione, nonché alle difficoltà della cura. La condizione placebo nella ricerca in psicologia clinica. Per tenere sotto controllo le aspettative di guarigione di un paziente che riceve un farmaco, la condizione placebo rappresenta rilevanti vantaggi da un punto di vista metodologico: se il gruppo di pazienti che riceve il farmaco mostra miglioramenti significativamente maggiori dei pazienti che hanno ricevuto il placebo, il ricercatore può concludere che il farmaco è efficace. La ricerca ha anche dimostrato che la risposta del paziente alla condizione placebo, nel caso di una sperimentazione di psicofarmaci con pazienti psichiatrici, è generalmente elevata e, in alcuni casi, quasi equiparabile a quella dei pazienti che assumono il farmaco. Il gruppo di controllo a trattamento non specifico può aiutare il ricercatore a valutare se un trattamento risulta efficace e quando è messo a confronto con un altro trattamento dal quale sono attesi risultati inferiori. La condizione placebo, nei trattamenti psicologici, deve però essere credibile agli occhi del paziente che la riceve: non può quindi essere costituita semplicemente da un breve dialogo con un professionista, ma deve rappresentare una procedura di intervento con una propria struttura formale. Inoltre, è molto difficile realizzare una effettiva condizione di controllo mediante placebo nelle ricerche in psicologia clinica, dato che in una terapia psicologica, a differenza di quanto avviene in medicina, non tutti gli attori (terapeuta, paziente, ricercatore) possono essere tenuti “in cieco” circa il trattamento che il paziente sta ricevendo. Il gruppo Treatment-As-Usual (TAU) come condizione di controllo . Nella ricerca sull’efficacia degli interventi psicologici, ha trovato sempre maggiore diffusione il gruppo Treatment-As-Usual, quale condizione di controllo, accanto ai classici disegni che includevano pazienti in lista d’attesa, l’assenza di trattamento o una condizione placebo. Il TAU, in genere, si riferisce al trattamento di cura routinario o usuale all’interno di un determinato Servizio clinico. Oggi, la maggior parte dei trials in psicologia clinica utilizza la condizione TAU come controllo o confronto. Tipicamente, il trial si svolge in un setting clinico dove i pazienti svolgono routinariamente alcune attività terapeutico/riabilitative. Questa strategia di ricerca risulta più affidabile rispetto ai disegni che utilizzano come gruppo di controllo la semplice condizione di assenza di trattamento o di lista di attesa, quanto meno perché supera in gran parte le questioni di carattere etico (non vi sono pazienti che rimangono senza terapia). Inoltre, è probabile che diminuisca la percentuale dei casi di drop-out che si verificano quando in un trial clinico i soggetti assegnati alla condizione di non trattamento scelgono di non proseguire con la sperimentazione. Infine, la condizione TAU consente di rispondere a una domanda fondamentale negli studi sull’efficacia, ovvero: “Esiste un reale beneficio, in termini di outcome, nell’utilizzo di una nuova
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) tipologia di trattamento rispetto a ciò che viene usualmente proposto nel servizio?”. Ovviamente, la condizione TAU presenta anche importanti limiti, ad esempio, esiste un’ampia evidenza relativa all’influenza che le aspettative dei pazienti esercitano sull’outcome del trattamento. Quando le aspettative dei pazienti sono elevate sia nei confronti della nuova terapia che viene sperimentata, sia nei confronti del TAU, è molto probabile che le differenze relative all’outcome delle due condizioni siano molto limitate. In molti studi la condizione TAU include un'ampia varietà di interventi forniti ai pazienti spesso non ben definiti e codificati il che pone il problema non e secondario della possibile replicabilità dello studio. Nella condizione TAU spesso esiste un'ampia variabilità intra e Inter terapeuta. In sintesi, ampia variabilità della condizione e mancanza di specificità rappresentano al momento i maggiori punti di debolezza del TAU come condizione di controllo nella ricerca clinica sulle psicoterapie e gli interventi psicologici. Significatività statistica e significatività clinica. Lo scopo del test di significatività statistica è quello di limitare il rischio che si attribuiscano all’impatto causale di un trattamento, ad esempio, effetti dovuti invece a fattori meramente casuali. Più nel dettaglio, significa semplicemente limitare il rischio di errori di tipo I, ossia gli errori nei quali si può incorrere quando si conclude che una differenza è reale mentre invece è un prodotto del caso. Il test di significatività statistica non contrasta, invece, la possibilità di compiere errori di tipo II (attribuire al caso una differenza reale), e non bisogna dimenticare che i due tipi di errore variano in misura inversa. A livello generale, Kirk (2003) sostiene che il progresso scientifico rischia di essere compromesso se i ricercatori continuano a focalizzarsi esclusivamente sulla strategia decisionale di accettazione/rigetto dell’ipotesi nulla e sull’imperativo di raggiungere la significatività statistica. L’ipotesi nulla prevede generalmente che l’effetto delle variabili indipendenti su quella dipendente non sia diverso da quello che ci si potrebbe attendere sulla base del caso. Rifiutare l’ipotesi nulla per l’ipotesi alternativa significa accettare che l’effetto della variabile indipendente sulla dipendente sia reale e non dovuto al caso. Il criterio per assumere questa decisione sulla “significatività” dell’effetto è di natura probabilistica, ed è dato dal livello di probabilità (ad esempio, p<0,05 o 0,001) scelto dal ricercatore per determinare il margine di errore nella decisione. Il tema della replicabilità è sicuramente fondamentale nella ricerca in psicologia clinica, in quanto i risultati di uno studio raramente possono considerarsi definitivi e necessitano sempre di evidenze ulteriori per essere confermati. Soltanto la replicazione può garantire che i risultati riportati da un singolo studio siano veritieri e non, invece, falsi positivi. Per questo motivo diversi metodologi ritengono inevitabile uno spostamento di focus nell'interpretazione dei risultati della ricerca: è necessario basarsi non tanto sulla tradizionale significatività statistica, bensì sulla stima dell’Effect size (ES), e dell’intervallo di confidenza (CI). Nei disegni di ricerca sperimentali o quasi-sperimentali, in cui si confrontano due diversi gruppi di soggetti (ad esempio, gruppo sperimentale/di trattamento e gruppo di controllo), il più diffuso indice di ES consiste nella differenza standardizzata delle medie tra i gruppi (indice di Cohen) con la formula: d= (M1 –M2) /Sin cui M1-M2 è la differenza tra le medie dei due gruppi e S è la deviazione standard composita dei due gruppi. L’indice d rappresenta una specie di punteggio z (ossia una misura standardizzata) di valutazione dell’effetto dei trattamenti. Effect size (ES): in statistica l’effect size (o dimensione dell’effetto) è una misura della forza della relazione tra due variabili. Usato nel metodo statistico della meta-analisi l’effect size è un indice che misura la grandezza e l’ampiezza di un evento. Molte ricerche recenti preferiscono riportare anche il valore dell’intervallo di confidenza, accanto alla stima dell’ES. Il CI (intervallo di confidenza) fornisce un range di valori che riflettono la probabilità che la differenza riscontrata in una popolazione (ad esempio, tra due gruppi di trattamento) rientri in un range definito. Questo range è basato su una stima campionaria (come tutti i test statistici) e viene comunemente espresso nei valori del 95% o 99% (che corrispondono ai criteri statistici di alpha 0,05 e 0,01).Va notato, comunque, che né le
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) statistiche relative all’ES né i test di significatività consentono di ottenere informazioni sulla varietà di risposte dei pazienti al trattamento. Se da un lato è importante sapere se un trattamento funziona mediante mediamente bene con una tipologia di pazienti, è altrettanto importante, per il clinico, avere informazioni sul cambiamento di uno specifico paziente. Per questo motivo, negli ultimi 20-25 anni, i clinici e i ricercatori che si sono dedicati alle ricerche sull’efficacia degli interventi psicologici hanno ripetutamente messo in discussione in quale misura la significatività statistica di un cambiamento possa essere considerata alla stregua di una significatività clinica. In altri termini, è emersa la preoccupazione che l’esclusiva focalizzazione sulla significatività statistica rischi di far trascurare l’importanza della significatività clinica, che, come scrivono Kendall, Norton- Ford (1982): si riferisce alla significatività della grandezza del cambiamento, al fatto di rimediare al problema che si è presentato, fino al punto che esso non è più un problema. Miglioramenti statisticamente significativi non sono equivalenti a guarigioni e la significatività statistica è una strategia valutativa addizionale e non alternativa”. Tutto ciò significa che possono essere statisticamente significative differenze irrilevanti sul piano clinico, oppure fra entità mal definite, o in presenza di difetti del campionamento (quantitativi e qualitativi) ecc … Quindi, la significatività statistica di una differenza è solo uno dei parametri da controllare per accettare come valide le conclusioni degli autori. È fondamentale questa cautela, perché il test di significatività, come tutti i riti (e i rituali), possiede un cospicuo potere suggestivo e di attrazione indebita. Come scrive Cohen (1992):“E’ importante l’interpretazione che accompag na i risultati che superano la barriera dello 0.5 e conseguono lo stato di grazia della significatività statistica. Tutti sanno che questo significa solo che l’effetto non è nullo e nient’altro. Orbene, quante volte interpretiamo questo risultato, almeno implicitamente, come la prova che l’effetto è significativo, nel senso di importante, consistente. Se un risultato è altamente significativo, ad esempio p<0,001, la tentazione di effettuare questa interpretazione scorretta è quasi irresistibile”. Ad esempio: se un gruppo di pazienti riporta un miglioramento (valutato attraverso una scala sui sintomi ansiosi o depressivi) in seguito a un trattamento, e questo miglioramento risulta statisticamente significativo, può comunque rimanere aperta la questione clinica sulla misura in cui questo miglioramento, “certificato” dalla validità statistica, sia anche rilevante e significativo per il paziente. Il miglioramento del punteggio in una scala sui sintomi depressivi è indicativo di un miglioramento del paziente nelle sue attività quotidiane, relazioni interpersonali, attività lavorative, comportamenti o pensieri? In altri termini: il miglioramento valutato dalla scala si traduce in un benessere più generale su vari aspetti rilevanti per la vita del paziente? È anche importante tenere presente che in ogni ricerca sull’efficacia di un intervento psicologico avremo pazienti che presentano miglioramenti sostanziali in seguito al trattamento, ma anche pazienti che non migliorano o addirittura riportano un peggioramento complessivo. Il miglioramento medio di un gruppo di pazienti in seguito a un intervento psicologico non vuol dire che ogni specifico paziente abbia riportato un beneficio sostanziale dalla terapia. Ritorna, cioè, il problema dell’integrazione, nella ricerca clinica, di un approccio nomotetico e di un approccio idiografico. Per superare questi limiti, valutati attraverso il test di significatività statistica, si è diffusa negli ultimi decennila metodologia della significatività clinica, quale metodo per analizzare il livello di cambiamento individuale del paziente. IL Clinically Significant Change (CSC) e il Reliable Change Index (RCI). Dai primi anni 90 sono state messe a punto metodologie intese ad analizzare la significatività clinica del cambiamento. Si tratta di metodi utilizzabili anche in studi condotti con pochi pazienti, in cui la potenza statistica necessaria per determinare differenze statistiche tra pre-trattamento e post-trattamento può essere insufficiente. Il metodo più utilizzato nella ricerca per valutare la significatività clinica del cambiamento fa riferimento a due criteri:1. Il cambiamento deve essere attendibile: ossia, la variazione intercorsa tra pre-trattamento e post-trattamento non deve essere
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) influenzata da errori di misurazione. 2. L’esito da prendere in considerazione è il passaggio del paziente da una popolazione disfunzionale (clinica) a una funzionale (non clinica) a seguito del trattamento. Reliable Change Index (RCI) stabilisce se il cambiamento (outcome) di un paziente tra pre-trattamento e post-trattamento (valutato con il metodo test/re-test) è statisticamente attendibile (ad esempio, se la differenza nei punteggi può essere attribuita al cambiamento reale e non a errori di misurazione). Il calcolo del RCI, in base al metodo Jacobson e Truax (1991), si basa sulla formula: In cui X1, è il punteggio pre-test, X2, il punteggio post-test e Sdiff, è l’errore standard della differenza tra i punteggi dei due test, calcolato in base alla formula: SE è l’errore standard di misura, calcolato in base alla formula In cui S1 è la deviazione standard del gruppo normativo o del gruppo pre-trattamento, mentre rxx, è l’attendibilità test-retest. Il secondo criterio per la valutazione del CSC è la stima di un punteggio cut-off dello strumento di misura, che stabilisca una soglia di passaggio dai punteggi caratteristici della popolazione non clinica (funzionale). In altri termini, il clinico e/o il ricercatore che vogliono misurare la significatività clinica del cambiamento riscontrato in un paziente al termine del trattamento devono avvalersi di strumenti di assessment validati, che prevedono un punteggio-soglia capace di discriminare tra popolazione clinica e non clinica. Nei casi in cui non si disponga di un punteggio di cut-off per lo strumento che si sta utilizzando, si può seguire il criterio di considerare il punteggio superiore o inferiore di una deviazione standard dalla media ottenuta da un campione normativo non clinico, quale indicatore di un livello di funzionamento psicologico non clinicamente significativo. L’utilità di questo metodo e il suo conseguente ampio utilizzo in letteratura sono legati al fatto che, in base ai criteri descritti, ogni paziente, al termine del trattamento, potrà essere classificato come:- Guarito (passa entrambi i criteri)- Migliorato (passa solo il criterio RCI)- Non cambiato (non passa il criterio RCI)- Peggiorato (passa il criterio RCI nella direzione inversa). Il metodo di Jacobson e Truax, per quanto diffuso, è stato criticato dal punto di vista statistico, perché i tassi di cambiamento clinicamente significativo riportati nei singoli dubbi in modo cospicuo dalle specifiche misure di outcome e dai metodi di calcolo utilizzati. Disegni estensivi (between-groups) specifici I differenti disegni per una ricerca between-groups sono: A. Disegno pre-test/post-test (before- after) : si costituiscono almeno due gruppi di soggetti con assegnazione casuale. Un gruppo è sottoposto a osservazione (o misurazione) prima e dopo la somministrazione di un trattamento o il verificarsi di un evento determinato. Lo stesso si fa con l’altro gruppo, che, però, non riceve alcun trattamento ed è al riparo dall’evento oggetto di ricerca (gruppo di controllo). Campbell e Stanley (1963), rappresentano questo disegno così: R O1 X O2R O3 O4(R significa che i soggetti sono stati assegnati per randomizzazione, O significa osservazione o misurazione; X la manipolazione sperimentale o il trattamento. I simboli sono presentati in ordine temporale, cosicché O1 X O2 significa che la prima osservazione o pre-test è stata seguita da un intervento, al quale ha fatto seguito una seconda osservazione post-test.) B. Disegno solo post-test (after-test): anche in questo caso sono necessari almeno due gruppi, trattati come segue: R X O1R O2 Disegno Solomon a quattro gruppi : si tratta di una combinazione dei due disegni precedenti. Si utilizza in situazioni che richiedono valutazioni pre-trattamento e post-trattamento, nelle quali è però necessario valutare anche gli effetti del pre-test sull’outcome: R O1 X O2R 03 O4R X O5R O6 . D. Disegni fattoriali : permettono l’investigazione simultanea di due o più variabili (fattori) in un singolo esperimento. Nella forma più semplice, due variabili (ad esempio, l’esperienza de terapeuta e il tipo di trattamento), considerate ciascuna a due livelli differenti (terapeuta esperto e inesperto; trattamento A contro trattamento B), danno origine a questo disegno 2x2, nel quale quattro gruppi rappresentano le combinazioni possibili fra i due livelli dei due fattori. Disegni quasi-sperimentali.
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) I quasi-sperimentali sono “un perfezionamento degli studi di osservazione naturalistica, ossia le cosiddette ricerche sul campo, nei quali, i cambiamenti della variabile indipendente occorrono in nature e non sono determinati dalla manipolazione dello sperimentatore ma che, tuttavia, rispettano, per quanto è possibile nelle circostanze specifiche, i principi del controllo scientifico”. In ambito clinico, questa ricerca osservazionale nasce dall’esigenza di studiare in modo scientifico dei soggetti le cui caratteristiche rilevanti ai fini dello studio non possono essere manipolate (o soltanto in rare occasioni). È possibile, mettere a punto numerosi disegni quasi-sperimentali between-groups, i più comuni fra i quali si possono considerare paralleli ai disegni sperimentali pre-test/post-test o solo post-test. La differenza è data dal fatto che il gruppo di controllo non è dimostrabilmente equivalente al gruppo sperimentale, in quanto ci si trova, in genere, di fronte a gruppi già formati e non costituiti per randomizzazione. Per questo motivo, Campbell, Stanley (1963), hanno definito questi disegni anche “non equivalenti control groups”. Le due forme più semplici sono : Non R O1 X O2 non R O3 O4 non R X O1 non R O2 Studi caso-controllo. Appartengono a questa tipologia di disegno di ricerca anche gli studi caso-controllo, originariamente utilizzati nelle ricerche epidemiologiche e di salute pubblica. Negli studi case- control, il ricercatore indaga le caratteristiche di interesse, (ad esempio, la sintomatologia borderline) formando gruppi di individui che variano relativamente a quella caratteristica (ad esempio, pazienti con sintomatologia borderline conclamata vs sintomatologia borderline sotto- soglia, oppure semplicemente pazienti borderline vs pazienti non clinici, per evidenziare le differenze tra i gruppi). Questi disegni si strutturano in maniera differente in base alla scansione temporale della ricerca. Nei disegni case-control trasversali (cross-sectional), i soggetti vengono valutati in base alle caratteristiche presenti (nel “qui e ora”), per esaminare i fattori associati a una particolare caratteristica di interesse clinico in uno specifico momento temporale. Ad esempio: si può valutare se il livello di cura parentale da parte delle madri che hanno avuto un figlio con tecniche di fecondazione assistita è diverso da quello delle madri che hanno generato un figlio naturalmente, senza ausili medici. Oppure se adolescenti con una percezione della propria immagine corporea negativa riportino relazioni sociali più soddisfacenti rispetto agli adolescenti con un’immagine corporea positiva. In altri termini, il ricercatore “si accontenta” di valutare un fenomeno di interesse in uno specifico momento, senza avere informazioni su che cosa può averlo influenzato nel passato o come evolverà negli anni futuri. Nei disegni case-control retrospettivi, invece, l’obiettivo è l’individuazione di condizioni antecedenti all’insorgere della condizione oggetto dello studio e che possono essere associate con quest’ultima. Ad esempio : questi disegni possono essere utilizzati per indagare il possibile ruolo dell’allattamento materno al seno nel disturbo da deficit dell’attenzione e iperattività (ADHD), con l’intento di identificare il legame tra potenziali fattori causali o di rischio (antecedenti) e la successiva condizione patologica. Mimouni- Bloch, Kachevanskaya, Mimouni et al. (2013) hanno confrontato un gruppo di bambini di età compresa tra 8 e 12 anni con una diagnosi di ADHD e un gruppo costituito dai loro fratelli/sorelle che non avevano sviluppato il disturbo. Ai genitori furono somministrati strumenti che valutavano le pratiche di allattamento dei figli in momenti diversi (1 mese dopo la nascita, 3 mesi dopo, ecc …).Questi disegni sono definiti retrospettivi in quanto si chiede, in questo caso, ai genitori, di ricordare eventi o comportamenti che hanno avuto luogo molti anni prima e i risultati vanno sempre interpretati con molta cautela. Sappiamo, infatti, che il rischio di un ricordo selettivo o semplicemente inaccurato può essere molto elevato. Di conseguenza, in questi disegni di ricerca
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) possono essere utili dati retrospettivi di archivio, che risultano meno soggetti a bias (ad esempio, i dati sull’allattamento registrati nell’archivio del pediatra di famiglia; oppure le cartelle cliniche relative a uno specifico periodo). È importante sottolineare che i disegni retrospettivi case-control non consentono di stabilire specifiche relazioni di causalità tra le variabili oggetto di studio (ad esempio, tra l’allattamento al seno e la probabilità di sviluppare ADHD), ma soltanto di identificare legami associativi: quindi, non consentono di escludere una relazione inversa tra le variabili. I punti di forza di questi disegni, sono l’elevata efficienza in termini di costi e risorse, che risultano molto minori rispetto ai disegni di ricerca longitudinali, in genere molto più dispendiosi; inoltre, i disegni retrospettivi non comportano la perdita di soggetti nel corso del tempo, problema invece centrale nei disegni longitudinali, in cui i partecipanti alla ricerca devono essere seguiti per molti anni. Studi di coorte di tipo longitudinale. Questi disegni di ricerca rappresentano un’alternativa a quelli case-control. In questi disegni, un gruppo di soggetti viene seguito prospetticamente nel corso del tempo. Il termine “coorte” si riferisce al fatto che i soggetti condividono una determinata caratteristica. Ad esempio: possiamo predisporre una ricerca per valutare se gli psicoterapeuti che si sono diplomati nel 2017 sono in grado di gestire con successo rotture e riparazioni dell’alleanza terapeutica con i propri pazienti; oppure, se soggetti giovani adulti in sovrappeso e con uno stile di vita sedentario sono a rischio di sviluppare un binge eating disorder. Il disegno di ricerca longitudinale consente di seguire queste coorti nel corso del tempo (ad esempio, 1 anno, 2 anni o 10 anni), per stabilire delle relazioni tra condizione antecedente (negli esempi, a) l’inizio dell’attività psicoterapeutica; b) l’essere in sovrappeso) ed esito (rispettivamente: a) la gestione dell’alleanza terapeutica; b) la sintomatologia binge eating).Caratteristica distintiva di questi disegni è che la condizione di esito non si sia ancora presentata (ad esempio, la sintomatologia binge eating), a differenza degli studi case-control, in cui i gruppi inclusi nella ricerca vengono selezionati in base a una condizione già presente (ad esempio, soggetti depressi vs non depressi), senza la possibilità di analizzare che cosa ha determinato la condizione clinica precedentemente alla sua manifestazione. Negli studi di coorte di tipo longitudinale, invece, si ha una misurazione dell’esito in più momenti (T1, T2 … ), a partire da un assessment di baseline che costituisce il T0. Negli studi di coorte con un singolo gruppo, il ricercatore seleziona la coorte di interesse (ad esempio, un campione di bambini vittime di violenza domestica all’età di 8 anni) e segue questi soggetti in un arco temporale (ad esempio, 5 anni) per identificare chi svilupperà una determinata sintomatologia (ad esempio, ansia o depressione). L’arco temporale in cui seguire i partecipanti varia in base agli obiettivi specifici dello studio e alle concrete possibilità di portare a termine quest’ultimo. È infatti chiaro che seguire una coorte di soggetti per 10 o 20 anni può fornire importantissime informazioni sull’evoluzione di un fenomeno clinico, ma si tratta comunque di un disegno molto difficile da realizzare. Negli studi di coorte multi-gruppo il ricercatore identifica due gruppi di soggetti e li segue nel corso del tempo per esaminare l’esito di interesse. Mentre nel disegno di ricerca case-control un gruppo viene selezionato per l’esito di interesse e confrontato con un gruppo che non presenta questa caratteristica (ad esempio, soggetti depressi vs non depressi), nello studio longitudinale di coorte, i due gruppi non devono ancora presentare l’esito, ma variare in base a una condizione di interesse o fattore di rischio (ad esempio, bambini soggetti a violenza domestica vs bambini non soggetti a violenza domestica). Seguendo i soggetti dei due gruppi nel corso del tempo è possibile osservare se i bambini che sono stati oggetto di violenza domestica sono maggiormente a rischio di sviluppare un determinato disturbo/esito (es. ansia), nei 5 anni successivi. La valutazione longitudinale è sicuramente il maggior punto di forza di questi studi, capaci di fornire informazioni che gli studi case-control non sono in grado di garantire. In genere, i soggetti che sono disposti ad essere seguiti in uno studio per diversi anni sono i più motivati, e di conseguenza i risultati possono essere influenzati da questo fattore. Pertanto, in questi disegni la possibilità di analizzare
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) le relazioni tra diverse variabili e il rapporto di influenza tra esse consente di mette a punto modelli rappresentazionali che sono di aiuto nella descrizione e comprensione di un fenomeno clinico. Sensibilità e specificità. In psicologia clinica, l’obiettivo del ricercatore è spesso l’identificazione di variabili specifiche che consentono di classificare i soggetti in base a una determinata caratteristica. Ad esempio, quali variabili (fattori di rischio e/o di protezione) consentono di prevedere quali soggetti hanno un’alta probabilità di sviluppare un disturbo; oppure quali variabili consentono di identificare bambini a rischio di marginalizzazione nella classe scolastica. A tal fine, due costrutti sono diventati particolarmente rilevanti nella ricerca clinica, per misurare il livello di accuratezza di una classificazione diagnostica:-Sensibilità (Sensitivity) : la percentuale dei soggetti che mostrano o mostreranno una particolare caratteristica, correttamente identificati come tali (Veri Positivi). Ad esempio, in una fase di assessment psicologico precedente all’inizio di un intervento terapeutico, è possibile tentare di individuare i pazienti che hanno un’elevata probabilità di sviluppare una relazione terapeutica negativa. Oppure, in una valutazione testologica, i soggetti che, in base alla scarsa capacità di regolare le proprie emozioni, svilupperanno un binge eating disorder, o un altro disturbo legato a disregolazione emotiva. – specificità( specificity): la percentuale di soggetti che non presentano o presenteranno una particolare caratteristica, correttamente identificati come tali, veri negativi. Questi costrutti pongono una questione rilevante, in termini concettuali, per la psicologia clinica, relativa alla possibilità di identificare dei soggetti come positivi o negativi per un disturbo in base a un test o screening diagnostico. I concetti di specificità e sensibilità inducono a riflettere sul rischio di possibili classificazioni errate, insito nell'utilizzo di qualunque strumento di screening diagnostico: clinico può essere indotto a identificare dei falsi positivi, prevede che un soggetto abbia o avrà un disturbo nella realtà il soggetto non ha ne avrà in futuro, oppure dei falsi negativi, prevede che un soggetto non abbia o non avrò un disturbo virgola che invece il soggetto ha o avrà in futuro. E chiaro che le diagnosi predittive sia quelle positive che quelle negative sono clinicamente più utili infatti, il clinico, vuole sapere qual è la probabilità che un soggetto sviluppa una determinata condizione patologica se risulta positivo al test piuttosto che sapere se il soggetto è risultato positivo quando è ormai noto che a quella condizione. Tutti gli strumenti di assessment che prevendono un punteggio soglia cut off, presentano un rischio di errata classificazione. Disegni quasi-sperimentali e RCT. In sintesi, possiamo affermare che nella ricerca clinica, i disegni quasi sperimentali sono molto diffusi vista la difficoltà di creare condizioni di ricerca sperimentali che prevedono la randomizzazione dei soggetti condizioni differenti come negli RCT. i risultati prodotti dalla letteratura quasi sperimentale sono stati significativi e di forte impatto nella comunità professionale e scientifica, design importanza crescente dell’evidence based practice, li ha ridimensionati in modo cospicuo. Nelle linee guida sanitarie di diversi paesi, infatti, l'evidenza di un intervento di una strategia di assessment supportata soltanto da quasi esperimenti e cosiddetta debole e provvisoria, ed è generalmente richiesta la presenza di un RCT per garantire una evidenza ufficiale. Questa logica quindi suggerisce una sorta di gerarchia di valore, sostenendo l'importanza dei quasi esperimenti in quale momento euristico iniziale di una ricerca virgola che deve poi essere sostanziata dall'impiego di una metodologia RCT.
SECONDO CAPITOLO. IL DISEGNO INTENSIVO.
Secondo Peck, per quanto riguarda il modello intensivo: ricerca non è sinonimo di grande numero di soggetti. Di solito i disegni intensivi sono impiegati in lavori di ricerca di impostazione
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) behaviorista anche se virgola in realtà virgola in quest'ultimi 60 anni è comparso di nuovo in letteratura proposito delle rationale dei disegni intensivi, dimostrando il valore euristico di questi modelli nell'indagine su tutti i problemi della psicologia clinica e delle sue diverse scuole. I disegni small N possono essere suddivisi in due grandi gruppi: i disegni single-case propriamente detti, e i disegni a baseline multipla.
Disegni sperimentali single-case.
Questi disegni non comportano una procedura standard, bensì una collezione di situazioni sperimentali diverse intesa dimostrare una relazione sistematica tra un intervento clinico e un certo cambiamento successivo all' intervento stesso. La stessa TASK FORCE ON PROMOTION AND DISSEMINATION OF PSYCHOLOGICAL PROCEDURES, afferma che I single-case sono importanti disegni di ricerca complementari agli RCT e possono essere considerati vedi esperimenti, nella misura in cui consentono di stabilire relazioni causali tra le variabili e di controllare le minacce alla validità dell'esperimento stesso. La ricerca single case si focalizza su pochi soggetti che vengono seguiti ripetutamente nel corso del tempo, mentre la ricerca estensiva between groups include molti soggetti che vengono valutate in v. I disegni single case hanno queste caratteristiche in comune: misurazioni continue molto frequenti, i problemi dei pazienti sono valutati in numerose occasioni prima, durante e dopo l'intervento; l'informazione raccolta da una baseline estensiva o da un periodo di intervento, si ottengono almeno due misure e preferibilmente molte di più; una volta che è stata osservata una baseline stabile, si introduce l'intervento e i suoi effetti sono misurati in almeno quattro occasioni; l'intervento è sospeso per un breve periodo e viene misurato l' outcome, l'intervento e poi istituito di nuovo e se ne osservano ancora gli effetti. La fase nella quale non è applicato l'intervento è chiamata fase A, fase di baseline; quella nella quale è applicato l'intervento è chiamata fase; come suggerito da Kazdin la fase di baseline assessment ha sia una funzione descrittiva che una predittiva: la funzione descrittiva si esplicita nella raccolta dei dati relativi al soggetto, prima che inizi il trattamento; La funzione predittiva, invece, si esplicita nella previsione di ciò che accadrebbe al soggetto se non ne si sottoponesse al trattamento ed è esercitata tramite una proiezione della continuazione nel futuro del comportamento osservato nella baseline. Al fine di prevedere in quale modo uno specifico comportamento possa variare nel futuro importante che i dati raccolti durante la fase di baseline siano stabili con una ridotta variabilità: la linea di trend e è un grafico che rappresenta la direzione dei dati raccolti nei diversi momenti di assessment; Il trend e può essere lineare oppure curvilineo: i punti ottenuti dalla misurazione tendono a crescere o accelerare o diminuire o decelerare in modo uniforme, oppure sono espressi da una linea piatta senza cambiamenti evidenti. Per valutare l'efficacia di un intervento nei disegni singole case, il trend della baseline dovrebbe essere piatto o peggiorativo, cioè con un incremento dei sintomi prima dell'inizio dell'intervento virgola in questo modo, se nella fase di intervento, fase B, il comportamento sintomatico mostra un trend di riduzione lineare e possibile concludere che questo effetto è dovuto al trattamento punto a livello generale, minore e la variabilità dei dati nella fase di baseline, maggiore è la possibilità di trarre conclusioni fondate sull'efficacia di un intervento. È essenziale utilizzare strumenti di misura delle condizioni cliniche di un soggetto che siano validi, attendibili e sensibili al cambiamento; Può risultare riduttiva una ricerca estensiva che valuti soltanto il pre trattamento e il post trattamento, confidando che due sole misurazioni possono essere affidabili, stante la pari abilità implicita in ogni fenomeno di interesse clinico single case virgola in base all' alternanza prevista fra le due fasi A e B del disegno sperimentale, sono possibili alcune diverse combinazioni: DISEGNO A B: si tratta del disegno più semplice ma anche meno produttivo, consiste nel confronto della baseline con nella fase di intervento. Viene omesso lo step quattro dell' elenco, e di conseguenza questo disegno può essere raccomandato soltanto se vi sono pressanti ragioni per le quali non è possibile introdurre una fase
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) di sospensione dal trattamento. DISEGNO B A B: il trattamento in corso viene interrotto o modificato e poi ristabilito come in precedenza virgola non si possono raccogliere informazioni sistematiche sulla baseline, vi è soltanto un'interruzione del trattamento, questo disegno non può essere giudicato molto produttivo ai fini della ricerca ma può essere utilmente impiegato nei confronti di trattamenti già in fase molto avanzata. DISEGNO A B A B: questo disegno prevede un' accurata registrazione della baseline, una fase di intervento, una fase di sospensione e una seconda fase di intervento e consente di ottenere risultati relativamente inequivocabili circa la relazione causale tra intervento e outcome. VARIAZIONI ED ESTENSIONI DEL DISEGNO A B: seguendo la logica di questi disegni si possono mettere appunto altri disegni differenti che presuppongano tutti l' alternanza tra fasi A e fasi B, ed è possibile introdurre anche una fase C, che riguarda soprattutto il secondo tipo di intervento, e strutturare così disegni del tipo A B A C o del tipo A BC B BC ecc. È importante considerare che in questi disegni di ricerca si ipotizza che gli effetti dell'intervento cioè sino nel momento in cui viene sospeso il trattamento: in altri termini, che i benefici ottenuti nella fase B si riducano velocemente per ricomparire poi nel momento in cui la fase B di intervento viene nuovamente sviluppata appunto e ovvio rilevare che negli interventi psicologici, si ipotizza invece che le caratteristiche positive dell9outcome al termine del trattamento non ne reggevano immediatamente ma possano persistere anche a intervento ultimato o sospeso. Questi disegni quindi possono essere indicati quando viene valutato come out come un comportamento che può variare facilmente da presente ad assente, ma non risultano utile, per misurare il livello di consapevolezza delle proprie emozioni in un soggetto con i disgregò l'azione motiva, ma possono essere indicati per outcomes più comportamentali, quali la presenza o assenza di problemi alimentari. Disegni a baseline multipla. I disegni a baseline multipla sono di tre tipi: attraverso (across) i soggetti; Attraverso i problemi; Attraverso i settings. Il primo prevede l'indagine su almeno quattro pazienti che abbiano lo stesso problema clinico: viene effettuata una misurazione estensiva della baseline per tutti i pazienti, si applica poi il trattamento a un paziente, mentre si continua a raccogliere i dati su tutti gli altri. Dopo un certo periodo si applica il trattamento al secondo paziente e così via; se il trattamento introduce cambiamenti attesi o altri cambiamenti, questi dovrebbero verificarsi solo dopo la sua applicazione non è precedentemente; una controindicazione può essere rappresentato dal periodo di dilazione imposto ad alcuni pazienti prima di essere efficacemente trattati. Nel disegno attraverso di problemi, per ciascun paziente si individuano alcuni problemi di stima collegati fra loro sui quali si interviene in sequenza: la misurazione della baseline effettuata per tutti i problemi e continua dopo ogni intervento, così l'evidenza che l'intervento produce il cambiamento atteso è fornita dal fatto che quest'ultimo si verifichi solo dopo che è stato trattato uno specifico problema. Infine, nel disegno trovarsi i settings, il trattamento è applicato a un singolo soggetto per un singolo problema in modo sequenziale attraverso settings diversi. il vantaggio principale di questi disegni single case risiede nella possibilità di indagare trattamenti innovativi prima di strutturare complessi RCT oppure virgola di valutare casi generalmente esclusi da questi ultimi testando l'efficacia degli interventi con questi pazienti. Altri disegni small N. Le possibili variazioni dei disegni small N sono numerose: Disegni a criterio variabile e disegni a trattamento periodico. i primi vengono impiegati in situazioni nelle quali l' outcome può essere quantificato in modo preciso, da stabilire dei target definiti per ogni fase del trattamento: i criteri sull'efficacia del trattamento non sono stabiliti una volta per tutte ma variano da seduta a seduta. Se i cambiamenti nel paziente si declinano secondo la sequenza prevista il trattamento si giudica efficace; I secondi rispondono alle esigenze di ricerca suscitate dalla trattamenti nei quali è difficile stabilire quando una particolare fase del trattamento può considerarsi conclusa, si misurano
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) frequentemente le modificazioni del problema personale si tengono periodicamente delle sedute di terapia; L'intervento viene giudicato efficace se si verificano degli incrementi dei miglioramenti attesi, immediatamente dopo le sedute o cicli di esse.
Difficoltà e limiti del disegno intensivo.
Anche se i disegni small N consentono di evitare alcuni dei problemi posti dai disegni between groups, essi non sono tuttavia esenti da limiti e difficoltà. I problemi posti dai disegni A B sono due e si riferiscono alla possibile grande variabilità dei dati raccolti relativi alla baseline e alla generalizzabilità dei risultati ottenuti attraverso questo impianto sperimentale. Il ricercatore dovrebbe effettuare misurazioni ripetute della baseline finché e sicuro che l'insieme dei dati raccolti e stabile e definito, per questo motivo nelle situazioni cliniche può essere impossibile seguire in modo soddisfacente questa procedura e quindi risultare difficile stabilire con chiarezza qual è la relazione fra l'intervento il suo outcome. per limitare queste difficoltà possono essere seguite alcune procedure quali ad esempio l'analisi sistematica dei fattori correlati alla variabilità della misurazione della baseline, oppure si possono implementare i dati relativi ad essa con altre informazioni raccolte dall' ambiente o da alcuni testimonials e così via. Quanto alla generalizzabilità è questo uno dei tradizionali punti deboli dei disegni single case: la maggiore obiezione che sorge nel valutare la ricerca singole case e che i risultati possono non essere generalizzabili ad altre persone che non siano il soggetto originario. Se si considerano i dati ricavati con disegno intensivo sul singolo paziente come funzione di tutte le sue caratteristiche rilevanti, allora la popolazione statistica con la quale il singolo caso si identifica può teoricamente essere definita nei termini di queste caratteristiche ovviamente basate su somiglianze piuttosto che su identità complete. Ma il vero problema consiste nel fatto che ci sono ampi difficoltà per definire le dimensioni che possano dettare la generalizzabilità dei risultati. Alcuni ricercatori usano i disegni single case enfatizzando l'esigenza di cercare interventi che producano cambiamenti vistosi di performance, quindi questi debbono essere probabilmente più generalizzabili fra gli individui di quanto lo siano effetti che soddisfano il relativamente più debole criterio di significatività statistica. Mi sono però altre difficoltà come ad esempio relative, alla reversibilità degli effetti dell'intervento in quanto, alcuni effetti possono non essere reversibili; La durata degli effetti degli intervento perché alcuni possono durare molto a lungo dopo l'interruzione degli intervento stesso; La possibilità di effettuare comparazioni trattamenti globali e conclusi infatti, i disegni A B stabilire raffronti fra l' outcome di trattamenti diversi; ho problemi di opportunità relative all' interruzione dei trattamenti, questi disegni non richiedono gruppi di controllo e consentono di superare i problemi relativi all'impiego di questa strategia sperimentale e può essere inopportuno interrompere un trattamento in corso al fine di instaurare la fase A prevista dal disegno sperimentale. Per quanto riguarda i disegni baseline multipla, un problema specifico si pone quando si verifica un fenomeno di generalizzazione cioè quando si produce il cambiamento atteso non soltanto nelle situazioni alle quali è stato applicato l'intervento ma anche nelle altre e prima dell'intervento stesso. Potrebbe essere utile introdurre una componente addizionale del disegno come una fase di sospensione dell'intervento.
L’analisi statistica nel disegno intensivo.
Un altro argomento di discussione e relativo all'impiego o meno dell'analisi statistica nel contesto della ricerca single case: molti si opponevano all' analisi statistica argomentando che se gli effetti sperimentali sono così microscopici la dimostrazione della loro evidenza richiedono analisi statistica, quindi è improbabile che essi abbiano una rilevanza sufficiente per poter essere considerati utili nella pratica clinica punto si proponeva, allora virgola che il disegno intensivo si concentrasse esclusivamente sulla ricerca di effetti sperimentali in macroscopici, inoltre i dati che
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) si ottengono attraverso i disegni sperimentali small N sono spesso talmente complessi e ambigui che la semplice analisi di essi attraverso l'ispezione visiva può condurre a errori di interpretazione. Così, molte considerazioni suggeriscono l'utilità dei test e statistici per la ricerca single case. Vi sono strumenti statistici che possono essere appropriati per i disegni small N partendo dal presupposto che la logica del disegno single- case si basa sull'intero andamento e fluttuazione dei dati, così che teste statistici che ignorassero l'andamento per lavorarle solo su singoli punti estrapolati da esso, tradirebbero la logica di questo modello di ricerca: questi strumenti statistici ad esempio possono essere le analisi delle serie temporali, ( la time series analysis) che determina la significatività dei cambiamenti nel livello e nel trend e può essere utile quando i dati della baseline non sono stabili. Negli ultimi anni i ricercatori stanno mettendo appunto altri strumenti di analisi statistica per implementare i lavori che descrivono in modo puntuale affidabile l'impiego di statistiche valide ed efficaci nell'analisi del cambiamento di un paziente singolo o di piccoli gruppi di pazienti in seguito a un trattamento.
TERZO CAPITOLO. LA QUESTIONE DELLA MISURA NELLA RICERCA QUANTITATIVA.
L’impiego dei test psicodiagnostici nella ricerca quantitativa. Nei disegni di ricerca di tipo quantitativo il lavoro di raccolta dei dati è svolto mediante l'impiego di teste psicodiagnostici che misurano sintomi, comportamenti, reazioni e vissuti dai soggetti coinvolti nella ricerca ma anche dei clinici e dei ricercatori. Bornstein ha proposto una classificazione di questi strumenti: self-attribution, stimulus-attribution test, performance-based test, constructive test, observational test, informant-report. L'impiego dei testi psicologici risponde a tre esigenze particolari: la prima è quella di comprendere qualcosa del comportamento umano normale e patologico andando al di là della conoscenza consapevole posseduta dal soggetto che ne produce il comportamento stesso; fondamentale è il tema dell'interpretazione EI test deputati allo svolgimento di questo compito sono soprattutto i test proiettivi, stimulus- attribution, nelle loro varie versioni, ma rispondono al medesimo scopo anche i diversi punteggi prodotti dalla somministrazione di un test oggettivo, self-attribution, soprattutto se organizzati in cluster cioè sottoscale che rimescolano le risposte del soggetto ed evidenziano in questo modo particolare i sintomi, comportamenti, tratti di personalità. La seconda è quella di usare strumenti più rapidi ed economici rispetto al tradizionale colloquio clinico che resta lapis angularjs su cui poggia tutto l'edificio dell'interazione della conoscenza fra psicologo e soggetto, ma che richiede anche la disponibilità di risorse che nella storia della psicologia clinica, ha ripetutamente indotto a seguire strade più brevi per formulare una diagnosi e l'indicazione a un trattamento. La terza è relativa al problema del bias del clinico cioè della tendenza che quest'ultimo può avere a distorcere in modo più o meno sistematico le proprie valutazioni, per motivi che sfuggono a lui stesso e che possono a volte essere talmente congenti da inquinare anche la semplice raccolta dei dati grezzi. Per svolgere il proprio compito ogni test deve possedere alcuni requisiti specifici che garantiscano l'affidabilità dei risultati forniti o anche la credibilità delle informazioni acquisite naturalmente, questo vale anche per i test psicodiagnostici a proposito dei quali, si deve purtroppo, riconoscere che i loro costruttori ed utilizzatori hanno troppo spesso attribuito ai dati raccolti caratteristiche di certezza che erano invece ben lungi dall'essere dimostrate. La verifica di affidabilità dei test psicodiagnostici. Innanzitutto il test che si vuole utilizzare deve essere valido e attendibile: nel primo caso, abbiamo le prove che il test è capace di misurare effettivamente la caratteristica le caratteristiche che dichiara di misurare, nel secondo caso, invece che è la misura ottenuta dal test è stabile e costante. Se le garanzie non sono adeguate il test non deve essere somministrato, oppure le informazioni che esso consente di ottenere devono essere considerate alla stregua di ogni altre informazioni sul paziente, che sia biased per qualsivoglia motivo virgola e quindi si deve concedere
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) a essa una credibilità assai modesta e che comunque deve essere sottoposta a verifica in quanto in questo caso, il test fallisce i suoi scopi. In secondo luogo deve essere verificata la cosiddetta standardizzazione , taratura del test, cioè il procedimento attraverso il quale si stabiliscono i dati normativi, i valori attesi, che consentono di mettere in relazione ogni soggetto con la popolazione alla quale appartiene, mediante il risultato ottenuto. Per definire questo sistema di riferimento si possono utilizzare diverse strategie: prescindendo da popolazioni bersaglio Virgo i dati normativi possono essere derivati da campioni di non pazienti, campioni non clinici, oppure da campioni rappresentativi della popolazione generale virgola che conducono una certa percentuale di soggetti patologici com'è inevitabile che accada se non si effettua nessuno screening. le norme ricavate attraverso gli impiego delle due strategie possono essere anche molto distanti fra loro, una prima regola che andrebbe osservata nella scelta di un test, è quella di accertare come sono stati costruiti i campioni normativi e vengono precisati anche criteri di inclusione ed esclusione dei soggetti. Un altro problema rilevante riguarda la taglia campionaria: è opportuno che il campione non si è sbilanciato da disomogeneità, prevalenza incontrollate che riguardino il genere, il sesso, l'età e così via. I nontest factors. Possiamo definire i nontest factors come variabili intervenienti nel comportamento del paziente di fronte al test, la cui influenza è direttamente proporzionale alla gravità del quadro psicopatologico, ma anche alla struttura di personalità e qualità della collaborazione virgola e che possono inficiare le potenzialità valutative dal test senza cessare tuttavia di essere preziosi elementi di conoscenza del paziente, se gli si prende in considerazione e li si analizza anziché considerarli semplicemente un disturbo. L'impiego del test sia nell'attività clinica che in quella di ricerca indica un' attenzione e specifiche ai nontest factor che deve trovare una sistematizzazione attraverso criteri condivisi ha certamente empiricamente e fondati. Lang propone un sommario elenco di non test factors: la qualità della relazione e l'effetto che la psicopatologia del paziente esercita su chi somministra valuta i test; Il livello di alleanza e di motivazione del soggetto e il modo in cui reagisce alle difficoltà poste dal materiale stimolo; i possibili errori di somministrazione. Una regola di carattere generale per ridurre al minimo la distorsione dei dati suggerisce di trattare i soggetti coinvolti nella ricerca nello stesso modo in cui un clinico esperto tratta i propri pazienti, quando vengono sottoposti a un esame testologico: informazioni adeguate sullo scopo della somministrazione del test e sullo svolgimento della prova; verifica della disponibilità non solo formale del testando a fare la fatica implicita nell'esecuzione del compito; Attenzione al giusto momento nel quale il test può essere somministrato virgolo sia lontano da condizioni di emergenza nel gruppo dei casi, o di fretta nel gruppo di controllo. Infine, un disegno di ricerca che tenga a bada la parzialità delle informazioni fornite da un test attraversa somministrazione anche di altri reattivi virgola in funzione di verifica; Non tutte queste cautele devono o possono essere osservate ogni volta ma l'elenco serve a ricordare che i test sono sostanzialmente strumenti deboli che esprimono il loro potenziale conoscitivo solo se vengono scrupolosamente rispettate alcune condizioni del loro utilizzato. L’esigenza di una tassonomia. Appare sempre più evidente il bisogno di pervenire anche per i test psicodiagnostici a una sorta di what Works for whom, che possiamo implementare aggiungendo all' esigenza di individuare quale teste funziona meglio per quale tipo di soggetti, anche l'indicazione di quale teste è più coerente con il disegno di ricerca viene utilizzato. Il concetto di oggettualità viene identificato quindi come uno degli assi portanti di ogni attività di ricerca in quanto, la congruenza fra oggetto e metodo deve essere infatti anche congruenza fra oggetto e strumenti di indagine, nonché fra oggetto e procedure di elaborazione dei dati ma non solo statistica. E’ empiricamente importante esplorare le condizioni alle quali un testo esprime al meglio il proprio potenziale e euristico: può essere utile
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) un elenco di indicazioni e controindicazioni ai vari test che consente di valutare il maggior numero possibile delle variabili che incrementano o decrementano l'affidabilità di ciascuno strumento. Dovrebbe discendere da qui anche il set di informazioni sul quale fondare la scelta dei testi da utilizzare a seconda dei diversi disegni di ricerca. Il progetto COSMIN. Negli ultimi anni, la comunità scientifica ha compiuto notevoli passi in avanti per produrre protocolli standard al fine di migliorare la qualità delle misure legate alla valutazione della salute e o patologia e i criteri di scelta di quelle migliori o più indicate in un determinato contesto. In particolare una specifica attenzione agli strumenti di self report è stata data dal gruppo di lavoro del Cosmin che si propone l'obiettivo di fornire indicazioni operative per la selezione di strumenti di misura evidence based. In psicologia clinica, come in psichiatria, l'utilizzo di svariate misure per l' assessment di uno stesso costrutto, così come le caratteristiche psicometriche degli strumenti, non hanno spesso consentito una sufficiente confrontabilità tra risultati ottenuti in studi diversi, impedendo di raggiungere conclusioni condivise nella comunità scientifica e professionale in varie aree di ricerca e di intervento punto a questo scopo il gruppo di lavoro delle Cosmin, costituito da un panel di 43 esperti nell'ambito della psicologia, epidemiologia, statistica e clinica medica, ha messo appunto uno checklist per valutare la qualità metodologica negli studi sulle caratteristiche di uno strumento di misura. L'obiettivo del lavoro era quello di raggiungere un adeguato livello di consenso tra esperti su quali proprietà di misura debbano essere valutate negli strumenti di self report di outcome e come debbano essere definite; Indicare standard condivisi per condurre ricerche metodologicamente corrette sulle caratteristiche di misura di uno strumento. Nella tassonomia del Cosmin checklist sono inclusi tre domini di qualità: attendibilità, validità e responsività, ovvero la capacità dello strumento di rilevare il cambiamento del soggetto nel costrutto misurato nel corso del tempo. A sua volta ogni dominio include diverse proprietà psicometrica da valutare: all'interno dell' attendibilità di troviamo la consistenza interna, l' attendibilità nelle sue diverse forme e l'errore di misura; nel dominio della validità sono inclusi la validità di contenuto virgola di costrutto e di criterio. Vengono valutati anche alcuni criteri di inclusione fondamentali ovvero la validità cross-culturale. Per quanto riguarda la responsabilità, le domande alle quali rispondere sono ad esempio se il campione utilizzato è adeguato per misurare il cambiamento o se sono stati considerati almeno due misurazioni effettuate con lo strumento. Misurare? Costruzione ottima, validazione, taratura e aggiornamento sono le condizioni ideali della fattibilità di un test e le garanzie della sua credibilità. L'inclusione di un teste psicodiagnostiche non disegno di ricerca implica che il ricercatore accerti che lo strumento scelto sia il prodotto del rispetto di questa sequenza operativa: se poi è egli stesso a costruire un test, da impiegare nelle proprie attività di misurazione, deve fornire a chi leggerà i risultati del suo lavoro tutti i dati indispensabili a prestare fiducia agli strumenti utilizzati per conseguirli. E' stato Galton a sostenere per primo che la misurazione in psicologia virgola che non può fare riferimento né a 1 0 ne ha una sua unità propria, può fare ricorso soltanto a confronti basati sulla distribuzione statistica delle misurazioni punto per questo motivo, le misurazioni delle quali facciamo uso nell'attività di ricerca in psicologia clinica devono essere affidabili virgola in tutti i sensi. Il lavoro necessario per costruire il corpus e di garanzie che conferiscono reale utilità pratica un testo psicologico partecipa di quella interminabilità e incompletezza che è il contrassegno della psicologia, implicito da sempre ed esplicito sostanzialmente da Freud in avanti. Le preoccupazioni metodologiche indicano un percorso che si snoda fra certezze parziali ma difendibili, Irap e tutti i confronti basati sulla distribuzione statistica delle misurazioni, come sosteneva Galton, sono almeno fino a ora, il compromesso possibile fra la difficoltà a conseguire conoscenze incontrovertibili e l' afasia.
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) QUARTO CAPITOLO. L’APPROCCIO QUANTITATIVO NELLA RICERCA SUGLI ESITI DELLE PSICOTERAPIE E DEGLI INTERVENTI PSICOLOGICI. L'utilizzo del disegno estensivo ha trovato nei randomized controlled trials,RCT studi randomizzati controllati, il Gold standard della ricerca volta a indagare l'efficacia di una psicoterapia o di un intervento psicologico e a compilare un elenco di quelli che si possono definire empirically supported treatments, EST terapie validate empiricamente. GLI RCT. La ricerca con gli RCT confronta l'effetto di condizioni differenti su un outcomes, variabili indipendenti su variabile dipendente. Negli esperimenti between groups il confronto avviene attraverso due diversi gruppi di soggetti esposti alle differenti condizioni, manipolazione sperimentale: se si deve stabilire se un determinato intervento psicologico è efficace nel trattamento di uno specifico disturbo, lo studio RCT aiuta a rispondere alla seguente domanda possiamo essere sicuri che il miglioramento riscontrato dai pazienti sia dovuto al trattamento ricevuto? per rispondere a questa domanda, il disegno di ricerca stabilisce che si estragga un campione di soggetti virgola di numerosità adeguata, dalla popolazione di riferimento cioè quella dei pazienti affetti dallo specifico disturbo oggetto dello studio; i pazienti selezionati vengano assegnati in modo causale quindi randomizzato, a una delle due condizioni sia sperimentale che di controllo quindi, pazienti in trattamento versus pazienti non in trattamento; i pazienti del gruppo sperimentale ricevono il trattamento mentre i pazienti del gruppo di controllo non lo ricevono; al termine del trattamento si verifichi se i pazienti che hanno ricevuto il trattamento presentano un miglioramento dell' outcome significativamente maggiore dei pazienti nella condizione di controllo. Il principale punto di forza di questa metodologia, per il quale viene utilizzata anche negli studi di efficacia degli interventi psicologici virgola e la sua elevata validità interno in quanto tramite l'utilizzo di un gruppo di controllo non sottoposto alla manipolazione sperimentale, si possono tenere sotto controllo le principali minacce al valore dell'esperimento. Al contempo la randomizzazione dei pazienti, l'uso di campioni di pazienti omogenei, la standardizzazione e manualizzazione dei trattamenti di, oltre che la durata standard delle terapie riduce la generalizzabilità dei risultati, poiché nelle normali condizioni di esercizio della pratica clinica non è frequente che tutte queste condizioni si verifichino e soprattutto si verifichino insieme. GLI EMPIRICALLY SUPPORTED TREATMENTS(EST). Gli EST possono essere definiti come interventi per i quali sono disponibili prove, ricavate da studi sperimentali virgola che ne dimostrano la capacità di apportare miglioramenti alla condizione patologica del paziente distinguendo gli interventi terapeutici utili da quelli inutili o addirittura dannosi, compresa l'induzione di possibile effetti iatrogeni, in altri termini lo scopo è differenziare il più possibile le terapie che funzionano da quelle che non funzionano. Sul piano della conduzione delle ricerche, la metodologia che ha costantemente dominato il panorama degli EST è costituita dai randomized controlled trials. Limitare i rischi di bias negli RCT. Nonostante gli RCT rappresentino oggi il Gold standard per la valutazione di un intervento clinico, esiste la consapevolezza che diverse fonti di bias possono minarne la validità interna: varie reviews sistematica hanno messo in risalto che la maggior parte dei trials per la valutazione dell'efficacia dei trattamenti psicoterapeutici e degli interventi psicologici soffrono di un rischio di bias da moderato a elevato. E quindi interessante osservare che negli ultimi anni la diffusione degli RCT nella ricerca in psicologia clinica sia aumentata parallelamente all'evidenza di problemi metodologici sostanziali dovuti all'applicazione di questi disegni: ad esempio Tarquinio, Kivits e Minary si chiedono se gli RCT siano davvero la metodologia appropriata quando si valuta l'efficacia di interventi complessi, quali quelli che si occupano di modificare il benessere psicologico di un individuo punto gli autori propongono una maggiore attenzione ai problemi di validità esterna
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) degli RCT cioè si chiedono se i risultati di un RCTv possono essere generalizzabili ai pazienti della normale routine clinica quotidiano in altri termini, è il problema della distanza tra efficacy e effectiveness o dal confronto fra significatività statistica e significatività clinica favorendo l'inserimento di valutazioni sul processo del trattamento. I strumenti pesce valutare il rischio di bias negli RCT ad esempio sono il Cochrane-risk-of-bias, oppure il sistema GRADE, per valutare la qualità degli RCT e degli studi osservazionali . e auspicabile che l'adozione estensiva di questi strumenti consente, nei prossimi anni virgola di superare molti dei limiti metodologici degli RCT finora sottovalutati o quantomeno di misurare in maniera precisa il rischio rappresentato da indebite generalizzazioni dei loro risultati. RCT ED EST. Le critiche di ordine metodologico rivolte agli RGT si sovrappongono alle critiche rivolte agli EST che sono considerati empiricamente validi proprio in forza di studi di tipo RCT. La zona di overlapping riguarda la più frequente constatazione che l'efficacia dei trattamenti psicoterapeutici provata dagli studi sperimentali non è sempre immediatamente traducibile in efficacia clinica verificabile nella pratica terapeutica quotidiana: non tutti i trattamenti che dovrebbero funzionare in base alle prove della ricerca empirica funzionano poi effettivamente infatti gli psicoterapeuti segnalano costantemente una percentuale rilevante di non responders, ma l'impianto metodologico dell'approccio evidence based non è mai sembrato capace di affrontare questo problema in termini clinicamente utili. L' approccio evidence based alle psicoterapie impartisce un difetto di fondo cioè si occupa dei trattamenti che funzionano e non ne struttura uno specifico interesse di ricerca sui casi nei quali questi trattamenti non si dimostrano efficaci: possiamo dire che il non-responders appartengono ai cosiddetti outliers, ossia ai casi anomali, lontani dalla media e che quindi gli RCT fondati sostanzialmente su quest'ultima, forniscono in modo esemplare le misure della tendenza centrale, ma non sono in grado di rilevare convenientemente le caratteristiche dei soggetti le cui peculiarità sono irriducibili a quelle della maggioranza. E questo il gap fra efficacy ed effectiveness e in questo gap si rende evidente una sorta di tradimento del fondamento della clinica nasce virgole si sviluppa proprio a partire dal quesito pressante posto dal malfunzionamento di qualcosa che invece dovrebbe funzionare punto le critiche rivolte alla pretesa di considerare la metodologia degli EST come il Gold standard delle ricerche sull'efficacia dei trattamenti hanno poi un altro consistente fondamento epistemologico cioè il concetto di oggettualità . In trattamenti psicoterapeutici che non sono riconducibili a questo paradigma non ne possono riconoscere nella metodologia degli RCT il Gold standard delle verifiche di efficacia e quindi propongono altri disegni di ricerca che ritengono più congrui con i propri scopi terapeutici e il processo che si propone di conseguirli. Mi sono quattro assegni metodologici dell' approccio degli EST: primo assunto: i processi psicologici sono altamente malleabili, appartiene all' esperienza di ogni psicoterapeuta che hai gran parte delle vulnerabilità psicologiche e resistente al cambiamento, anche secondo non lessico differente, pressoché tutti noi andamenti psicoterapeutici concordano nella descrizione di questa evidenza rilevata nella pratica clinica quotidiana ma anche supportata dai risultati della ricerca empirica; secondo assunto: la maggior parte delle pazienti ha solo un problema principale o può essere trattata come se lo avesse virgola di nuovo, l'esperienza clinica dimostra che la maggior parte dei pazienti che chiede aiuto psicologico presenta commorbilità, negare quest'ultima è forse una conseguenza dei limiti impliciti nei sistemi nosografico descrittivi di tipo categoriale che potrebbero forse essere costretti corroborando la base empirica delle etichette psicopatologiche. Terzo assunto: i sintomi psicologici possono essere trattati a prescindere dalla personalità di chi li presenta, ovvero un disturbo può essere trattato indipendentemente dalla personalità sottostante, l'argomento è quello della purezza dei campioni dei trials sperimentali punto la rigidità dei criteri di inclusione ed esclusione consente di costruire campioni relativamente omogenei, ma penalizza il trasferimento dei risultati
Document shared on www.docsity.com
Downloaded by: napo-napo-1 (erasedata232@gmail.com) dalle laboratorio alla clinica e ne diminuisce la generalizzabilità perché l'indipendenza tra sintomi struttura psicologica è contraddetta dall'esperienza e dalle evidenze degli studi psicopatologici virgola che dimostrano l'elevata compresenza di diverse organizzazioni di personalità sottese alla medesima sintomatologia. Quarto assunto: gli RCT sono il Gold standard per valutare l'efficacia terapeutica, la randomizzazione, l'assegnazione casuale dei pazienti del gruppo in trattamento il gruppo di controllo, lo stesso utilizzo dei gruppi di controllo, il riferimento a trattamenti manualizzati, la frequenza esclusione di pazienti con i prognosi favorevoli sollevano costantemente la questione se tale metodologia sia sufficientemente rappresentativa della realtà clinica. In particolare il disegno di ricerca presupposto dagli RCT è difficilmente applicabile alla psicoterapia a lungo termine, che può durare diversi anni, infine un'altro aspetto discutibile è la focalizzazione degli RCT sui sintomi ai comportamenti disfunzionali anziché sulla globalità del funzionamento individuale. Quindi, i trattamenti che potrebbero essere studiati con disegni fondati sugli RCT sono quelli brevi, con un carattere prescrittivo e direttivo, facilmente manualizzabili e che utilizzano solo numero ristretto di interventi distinti. Infine è ormai evidente che li ricerca sull'efficacia delle psicoterapie che non si focalizzano esclusivamente sulla remissione sintomatica, prendono in considerazione una modifica delle modalità relazionali, del funzionamento sociale e del benessere complessivo della persona e non possono appiattirsi sulla metodologia degli RC ti quindi, gli studi sull’effectiveness dei trattamenti nei contesti di cura reali devono integrare le conclusioni degli RCT al fine di garantire la validità esterna.