Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
© Copyright 2021.
Società Editrice Esculapio s.r.l.
Via Terracini, 30 – 40131 Bologna
www.editrice-esculapio.com – info@editrice-esculapio.it
Le fotocopie per uso personale (cioè privato e individuale, con esclusione quindi di strumen-
ti di uso collettivo) possono essere effettuate, nei limiti del 15% di ciascun volume, dietro
pagamento alla S.I.A.E del compenso previsto dall’art. 68, commi 4 e 5, della legge 22 aprile
1941 n. 633. Tali fotocopie possono essere effettuate negli esercizi commerciali convenzionati
S.I.A.E. o con altre modalità indicate da S.I.A.E. Per le riproduzioni ad uso non personale
(ad esempio: professionale, economico o commerciale, strumenti di studio collettivi, come
dispense e simili) l’editore potrà concedere a pagamento l’autorizzazione a riprodurre un
numero di pagine non superiore al 15% delle pagine del volume.
CLEARedi - Centro Licenze e Autorizzazioni per le Riproduzioni Editoriali Corso di Porta
Romana, n. 108 - 20122 Milano
e-mail: autorizzazioni@clearedi.org - sito: http://www.clearedi.org.
Prefazione......................................................................................................................... iii
Questo libro ha origine da una domanda: della riflessione filosofica sul metodo
sperimentale, cosa può servire e cosa può interessare a uno studente di medicina,
o a un medico o ricercatore che vuole ampliare la propria prospettiva? La mia ri-
sposta, ovviamente parziale e limitata dalle mie competenze, è che possa servire e
interessare uno sguardo dall’esterno sui concetti e le assunzioni che costituiscono
il metodo sperimentale, anche e soprattutto perché oggi è costituito da metodo-
logie complesse e codificate alle quali si viene addestrati, prima di comprender-
le. Lo scienziato tipicamente non si interroga sulle proprie procedure mentre fa il
suo lavoro: non potrebbe fare altrimenti. Come ha scritto lo storico e filosofo della
scienza Thomas Kuhn:
[i]l fatto che gli scienziati di solito non si chiedono, o non discutono, cosa renda legit-
timo un particolare problema o una particolare soluzione ci induce a supporre che,
almeno intuitivamente, essi conoscano la risposta. Ma può anche semplicemente in-
dicare che né la domanda né la risposta sono considerate rilevanti per la loro ricerca*.
Tuttavia, ha senso che chi comincia a studiare medicina applichi questo sguardo
dall’esterno, prima di immergersi nella pratica, sguardo che potrà poi riprendere
in futuro, e chi già lavora ogni tanto cambi il focus facendo uno zooming out dalla
propria prospettiva. Per interesse personale, per completezza di visione, ma anche
e soprattutto per evitare errori che vengono dall’essere in grado di seguire una
regola in uso tra i propri pari, senza sapere esattamente qual è, a che cosa serve e
perché è valida.
Lo sguardo dall’esterno che qui si adotta sui concetti in uso nella pratica spe-
rimentale in medicina è quello della filosofia della medicina contemporanea, un
ambito disciplinare che ha senza dubbio origini antiche, ma che come insieme di
metodi e di domande condivise non ha più di cinquant’anni. La ricerca in filosofia
della medicina procede per analisi e chiarificazione concettuale a diretto contatto
con la ricerca empirica delle scienze biomediche**.
A livello pratico questo libro consiste nel mettere insieme due ambiti disciplinari:
la filosofia della medicina e la metodologia degli studi sperimentali. Nel mettere in-
sieme qui c’è un notevole lavoro di semplificazione e di astrazione dal dettaglio. Ri-
spetto ai libri di introduzione alla filosofia della scienza e di filosofia della medicina,
si è ridotta al minimo la discussione delle risposte alle domande che interessano ai
filosofi, e quasi sempre mi sono limitata a segnalare “qui c’è una domanda”. Inoltre,
ho selezionato solo le domande pertinenti al metodo scientifico – non, ad esempio,
altre questioni altrettanto centrali, come i concetti di malattia e salute, o quello del-
le classificazioni. Rispetto ai manuali di metodologia, si astrae dal dettaglio e dalla
parte matematico-statistica e ci si sofferma sul capire perché il canone metodologico
prevede certi studi e non altri, quali sono i vantaggi e i limiti di ciascuno in termini
di giustificazione della conoscenza prodotta (epistemologia) e dove finiscono i fatti
e cominciano le assunzioni. Quindi alla fine il meglio che posso augurarmi è di ave-
re scritto un’introduzione alla metodologia degli studi clinici leggibile da filosofi e
un’introduzione ad alcuni temi di filosofia della scienza leggibile da medici.
Il contenuto di questo piccolo libro riflette in parte il mio percorso di studi:
dall’analisi filosofica sono passata ai problemi metodologici e concettuali applicati
alla psicologia sperimentale, poi alla psichiatria, poi a vari ambiti della medicina,
sviluppando poi nuovamente un interesse per le questioni metodologiche genera-
li. In questo percorso c’è la costante della filosofia come un metodo di chiarifica-
zione, più che come una disciplina con un insieme fisso di domande, o tantomeno
** Una visione d’insieme completa ma sintetica dei temi della filosofia della medicina con-
temporanea si trova in Reiss, J. and Ankeny, R. (2016) Philosophy of Medicine. The Stanford
Encyclopedia of Philosophy (Summer 2016 Edition), Edward N. Zalta (ed.), URL = <https://
plato.stanford.edu/archives/sum2016/entries/medicine/>.
Ringrazio di cuore alcuni preziosi lettori, che con diverse competenze mi hanno
sostenuto nella scrittura: in ordine sparso Elena Manfredi, Rossella Hakim, Fran-
cesco Bianchini e soprattutto Stefano Fanti, senza il quale questo progetto non ci
sarebbe mai stato. Senza con questo dargli alcuna colpa, e libero anche gli altri
dalla responsabilità di eventuali errori nel mio libro. Mi auguro infine che questo
piccolo libro-ponte possa portare qualche studente o medico verso la filosofia della
scienza, e in generale possa contribuire al dialogo tra le due discipline. Quindici
anni di insegnamento di filosofia a studenti non filosofi mi hanno insegnato che
per dialogare bisogna prima capirsi, e per capirsi bisogna lavorare sulla semplicità
e sulla chiarezza dello stile, e questa è stata la mia regola metodologica qui.
La grafologia ha una tradizione che si intreccia con quella della psicologia spe-
rimentale. Ecco come è stata caratterizzata e difesa dallo psicologo francese Théod-
ule Ribot nel 1998:
Ritengo che la grafologia sia basata sul principio indisputabile secondo il quale sono
i nostri movimenti a mostrare i nostri stati interni: il carattere, le emozioni e il pen-
siero. La personalità si esprime non solo attraverso le parole, ma anche mediante gli
atti motori, e quelli delle mani sono i più rilevanti […] Se è vero che [la grafia] riflette
nostri stati d’animo passeggeri, è vero anche che dietro questi cambiamenti apparenti
rimane un sostrato stabile. Uno dei meriti della psicologia contemporanea è l’aver
mostrato chiaramente ciò che prima non veniva considerato, ovvero l’importanza e
il significato dei movimenti, e la grafologia costituisce un capitolo nella psicologia
del movimento. Se i grafologi delle diverse scuole siano riusciti o no a determinare
il carattere delle grafie è un’altra questione, sulla quale si possono avere dubbi; ma
non è fosse vero che qualsiasi teoria, quando è applicata alla pratica, può sbagliare?1.
La grafologia ha avuto una breve carriera nella misurazione dell’intelligenza
e dello sviluppo cognitivo dei bambini. Oggi analisi grafologiche vengono oggi
usate nella selezione del personale a supporto di altri test, soprattutto in Europa e
in particolar modo in Francia. Diversi studi negli anni hanno confrontato l’analisi
grafologica con altri test di personalità oggi validati in psicologia e hanno mostrato
che i risultati sono discordanti e il livello di accordo tra diversi grafologi è basso2.
In generale, la grafologia è considerata una pseudoscienza3. Altri studi recenti, tut-
tavia, propongono l’esame della grafia per identificare stati di depressione o stress,
sia negli adulti che nei bambini4. Comunque, i grafologi tendono a non proporsi
per lavori di diagnosi di condizioni o di sintomi patologici. In generale il grafologo
professionista tende a presentare la sua competenza come non riducibile a regole
esplicite, ma piuttosto basata su intuizione ed esperienza.
Un’altra storia di scienza dibattuta. La memoria dell’acqua è un’espressione
suggestiva che ha ispirato titoli di canzoni, opere d’arte e film. L’ipotesi che ha
lo stesso nome è stata pubblicata sulla prestigiosa rivista Nature nel giugno del
1988 a firma di un gruppo composto da biochimici e immunologi. Questo è l’ab-
stract:
Quando i basofili polimorfo-nucleari umani, un tipo di leucociti con anticorpi del
tipo dell’immunoglobina E(IgE) sulla superficie, vengono esposti ad anticorpi anti
IgE, rilasciano istamina dai loro granuli intracellulari e cambiano le loro proprietà di
staining. Questo può essere dimostrato a diluizioni di anti IgE che vanno da 1x10 2 a
1x1010,20,30. Oltre questa soglia ci sono altri picchi di degranulazione dal 40 al 60%
dei basofili, nonostante l’assenza misurata di anti IgE alle più alte diluizioni. Dato
che le diluizioni devono essere accompagnate da una vigorosa agitazione perché gli
effetti vengano osservati, la trasmissione dell’informazione biologica potrebbe essere
correlata alla organizzazione molecolare dell’acqua5.
L’articolo era seguito da una nota di riserva da parte del comitato editoriale:
i lettori di questo articolo potrebbero condividere l’incredulità dei tanti referees che
hanno commentato precedenti versioni durante gli ultimi mesi. L’essenza del risulta-
to è che una soluzione di acqua e di un anticorpo mantiene la sua capacità di evocare
una risposta biologica anche quando viene diluito fino al punto che la possibilità di
trovarne una singola molecola in qualsiasi campione diventa trascurabile: non esiste
una base fisica per tale attività. Con la gentile collaborazione del professor Bienveni-
ste, la rivista Nature ha quindi organizzato una replica dell’esperimento da parte di
studiosi indipendenti, e un report di questa indagine apparirà presto.
I tentativi di replica sono falliti, Nature ha pubblicato il report, e ad oggi resta
vero che non esiste una base fisica per l’ipotesi della memoria dell’acqua. Tutta-
via, negli anni successivi e per tutta la propria vita, uno degli autori, il professor
Bienveniste menzionato nella nota di riserva, ha continuato a fare divulgazione e
campagna di persuasione per la propria ipotesi (ma non ricerca). La questione ha
un’indubbia rilevanza pratica ed economica dato che la memoria dell’acqua, se
accreditata come ipotesi scientifica, legittimerebbe l’efficacia dei preparati omeo-
patici, che sono appunto sostanze molto diluite.
possiedono. Questo ci permetterebbe di capire meglio che cosa non va nella grafo-
logia e nell’ipotesi della memoria dell’acqua.
Per cercare una definizione passiamo dal livello immediatamente successivo
rispetto al riflettere tra sé e sé, ovvero, consultare una fonte accessibile e popolare,
Wikipedia, per avere una prima direzione d’indagine. Ecco la definizione di scien-
za, in inglese7:
La scienza è un’impresa sistematica che costruisce e organizza conoscenza nella for-
ma di spiegazioni testabili sull’universo8.
In pochi minuti possiamo trovare una fonte plausibilmente più autorevole sul
web9, o almeno una seconda fonte, e incontriamo una caratterizzazione simile, pro-
posta dalla American Physical Society:
La scienza è l’impresa sistematica che raccoglie conoscenza sul mondo e la organizza
e condensa in leggi testabili e teorie. Il successo e credibilità della scienza si fondano
sull’impegno degli scienziati a: esporre le loro idee e risultati al test e alla replica
indipendente da parte di altri scienziati, il che richiede lo scambio aperto e completo
di dati, procedure e materiali e l’abbandono o modifica di conclusioni accettate se
si trovano davanti a evidenze sperimentali più complete o affidabili. L’aderenza a
questi principi fornisce un meccanismo di auto-correzione che è a fondamento della
credibilità della scienza10
Supponiamo ora che la nostra ricerca di una definizione di scienza abbia risor-
se così limitate da doversi fermare esattamente qui, con la citazione da Wikipedia
e quella della American Physical Society – probabilmente non abbiamo convinto i
finanziatori del nostro grant che si tratta di un problema importante, oppure non
abbiamo mai seguito un corso di filosofia, nel quale avremmo imparato che si
può cercare la definizione di un concetto senza censire tutti i modi in cui è stato
definito in un arco di tempo11. Abbiamo già comunque molti elementi rilevanti
per rispondere a “che cos’è la scienza”, anche se – ma già c’era il sospetto nel
furbo lettore – non arriveremo facilmente a una definizione al riparo da contro-
esempi.
1.3 SISTEMATICITÀ
In generale la conoscenza sistematica di un certo dominio include principi di
classificazione che si applicano a tutti i suoi oggetti, e regole logiche o di metodo
che si applicano a tutti i suoi contenuti. Le scienze contemporanee sono sistemati-
che in questo senso. La botanica, ad esempio, comprende principi di classificazione
degli organismi vegetali e una struttura gerarchica delle classificazioni e categorie
tassonomiche, in parte basata su considerazioni evolutive. Posso immaginare di
essere in grado di riconoscere e nominare tutte le specie arboree della mia regione,
e magari di sapere con una certa affidabilità che terreno prediligono. Nondimeno
non avrei una conoscenza scientifica degli alberi, mancandomi la capacità di collo-
carli nei diversi ranghi gerarchici della classificazione. La sistematicità distingue la
conoscenza scientifica dalla conoscenza del senso comune, che può essere nondi-
meno utile in diversi contesti pratici12.
Idealmente, i principi di classificazione devono essere applicabili all’intero do-
minio (ad esempio tutti i corpi celesti, tutti gli organismi animali, tutte le malattie
della pelle, e così via) e formare categorie sulla base di somiglianze reali, o almeno
pragmaticamente utili. Qui, ad esempio, lo scrittore argentino J.L. Borges illustra un
bizzarro sistema di classificazione attribuendolo a una fittizia enciclopedia cinese:
Nelle sue remote pagine è scritto che gli animali si dividono in:
(a) appartenenti all’Imperatore, (b) imbalsamati, (c) ammaestrati, (d) lattonzoli, (e)
sirene, (f) favolosi, (g) cani randagi, (h) inclusi in questa classificazione, (i) che s’a-
gitano come pazzi, (j) innumerevoli, (k) disegnati con un pennello finissimo di pelo
di cammello, (l) eccetera, (m) che hanno rotto il vaso, (n) che da lontano sembrano
mosche13.
Potremmo soffermarci a considerare che cosa non va nella fittizia enciclopedia
cinese (a prima vista usa diversi criteri di classificazione, alcuni sono dipendenti
dal punto di vista dell’osservatore, altri no, alcuni sono meta-criteri, e così via). Il
punto, tuttavia, era soltanto mostrare che un sistema di classificazione non vale
l’altro: ne segue che ogni scienza ha il problema di validare la propria sistemati-
cità. Non notiamo questo problema quando riflettiamo ad esempio sulla chimica:
la tavola periodica degli elementi, introdotta da Dmitri I. Mendeleev nel 1869,
che ordina gli elementi in base a numero atomico e valenza, è accettata dalla
comunità scientifica nei suoi principi fondamentali, anche a fronte di qualche
1.4 LEGGI
Secondo la definizione della American Physical Society, una scienza organizza il
sapere relativo a un dato dominio in leggi. Che cos’è una legge? Richard Feynman,
noto fisico e divulgatore, ha usato questa poetica espressione per introdurre il con-
cetto: “Ci sono poi ritmi e pattern tra i fenomeni della natura, che non sono visibili
agli occhi, ma solo agli occhi dell’analisi; e sono questi ritmi e pattern che chiamia-
mo leggi fisiche”19. Proprio la fisica ci fornisce esempi familiari e non controversi
di legge scientifica, come la Legge di gravitazione universale enunciata da Isaac
Newton nel 1687: due corpi puntiformi o sferici di massa m1 e m2 posti a distanza r
si attraggono con una forza F che agisce lungo la retta congiungente i corpi e che ha
modulo F = G m1 m2 / r2. Un altro esempio poco controverso è la legge di Lavoisier
in chimica: in un sistema chiuso, in una reazione chimica la massa dei reagenti è
esattamente uguale alla massa dei prodotti. Una teoria è un insieme strutturato di
leggi, generalizzazioni o modelli (vedremo più avanti di che cosa si tratta) in grado
di spiegare diversi fenomeni in un certo dominio, ad esempio la teoria cinetica dei
gas, la teoria dell’evoluzione, la teoria della tettonica delle placche20.
I concetti di legge, teoria e spiegazione sono connessi. Cerchiamo quindi prima
di tutto raggiungere una caratterizzazione più precisa del concetto di legge, indi-
viduando condizioni per la loro definizione. Una legge è innanzitutto una propo-
sizione universale21 (può essere espressa utilizzando il quantificatore “tutti”), che
esprime una relazione regolare tra grandezze (ad esempio forza, massa e distan-
za) e che si applica senza restrizioni di tempo e di luogo22. Le leggi delle scienze
empiriche - a differenza delle leggi della geometria e dell’aritmetica, e delle leggi
dello Stato che regolano la vita civile - sono di solito ottenute almeno in parte per
induzione, che è il tipo di inferenza che ci permette di generalizzare a partire dai
casi osservati. Descrivendo il metodo scientifico nelle prossime pagine vedremo
operativamente come un’ipotesi, che esprime una relazione tra grandezze, può
1.5 TEORIE
La seconda caratterizzazione del concetto di scienza da cui siamo partiti, quella
dell’American Physical Association, contiene il termine “teoria”. Non a caso, per-
ché la fisica ci fornisce ancora una volta - come nel caso di “legge” - diversi esempi
paradigmatici: la teoria della meccanica classica, la teoria della relatività generale,
la teoria dell’elettromagnetismo. Una teoria scientifica è un insieme strutturato di
generalizzazioni o leggi (soprattutto, queste ultime, nel campo della fisica) che per-
mette di spiegare molti fenomeni all’interno di un dominio, e di prevederne altri.
Fuori dalla fisica, esempi di teorie sono la tettonica delle placche (geologia), la teo-
ria dell’evoluzione in biologia, o la teoria chemiosmotica in biochimica.
C’è da notare qui una differenza tra l’uso comune del termine “teoria”: quan-
do dico ad esempio che “ho una mia teoria” sul perché le mie phalaenopsis stanno
perdendo le foglie, faccio riferimento a una congettura incerta, per cui ancora non
ho evidenza – “è solo una teoria”, si dice normalmente. Diversamente, una teo-
ria scientifica, per essere tale, deve essere accettata dalla comunità degli esperti di
perché conforme agli standard vigenti di giustificazione da parte dell’evidenza. Se
usiamo questo criterio, allora sono teorie scientifiche anche la teoria del flogisto
(nella chimica del XVIII secolo), la teoria tolemaica in astronomia (prima di Nicolò
Copernico), la teoria miasmatica delle malattie (in medicina fino al XIX secolo).
Secondo la teoria del flogisto, la combustione e l’ossidazione dei metalli avven-
gono per la perdita di una sostanza aerea loro componente. La teoria di Tolomeo
assegna alla Terra la posizione centrale rispetto al Sole e ai pianeti del sistema so-
lare. Secondo la teoria miasmatica, le malattie contagiose si propagano attraverso
i cattivi odori generati dalla terra o dal corpo umano28. Oggi le riteniamo false29
e sono state soppiantate da altre teorie in grado di spiegare gli stessi fenomeni, e
altri in aggiunta, ma per secoli sono state accettate perché conformi agli standard
anche prevederlo sulla base delle stesse leggi - con un certo grado di probabilità,
nel caso delle leggi statistiche. Uno dei limiti di questo tipo di spiegazione ci è
già noto dal §1.3: non tutte le discipline hanno a disposizione leggi universali o
addirittura deterministiche come la meccanica newtoniana. Tuttavia, anche nel-
le scienze biomediche abbiamo correlazioni legiformi, sempre di natura statistica
come nell’esempio semplificato della penicillina, che usiamo per spiegare perché,
ad esempio, un certo tipo di intervento è più efficace di un altro in un dato caso. I
randomized controlled trials (RCT), che esamineremo da vari punti di vista nel corso
di questo libro, hanno proprio l’obiettivo di testare sperimentalmente questo tipo
di correlazioni legiformi di tipo causale, mentre diversi studi osservazionali in epi-
demiologia possono confermare associazioni (e il dibattito sulla natura causale di
queste associazioni è aperto, come vedremo nel §3.6 e §4.7).
Il secondo limite del considerare le leggi come caratteristiche della scienza è che
a volte la generalizzazione di copertura non è quello che stiamo cercando con la
nostra domanda iniziale. Immaginiamo che io sia partita con il chiedermi “perché
le mie phalaenopsis perdono le foglie?” e abbia avuto l’informazione che “se una
phalaenopsis riceve più di 500 cc di acqua al giorno, dopo tre giorni perde le foglie”.
In questa situazione posso controllare il fenomeno smettendo di dare tanta acqua
alle mie piante (ammesso che siano ancora vive) e altresì prevedere che altre piante
a cui darò troppa acqua a parità di condizioni perderanno le foglie. In parte, è un
risultato assai importante. Tuttavia, potrei volere ancora sapere perché è così: qual
è il meccanismo mediante il quale le phalaenopsis perdono le foglie quando vengo-
no innaffiate troppo.
Siamo così a un altro tipo di spiegazione, centrale nelle scienze biomediche di
base: quello tramite meccanismi. Spiegare un fenomeno tramite un meccanismo
consiste nell’individuare le parti (entità) e le relazioni (attività) che lo producono o
lo costituiscono, con un certo ordine e organizzazione spaziale. L’infezione da Sars-
CoV-2, il virus responsabile della pandemia da Covid-19 che ha colpito il mondo
nel 2020, è stata spiegata individuando vari meccanismi, tra cui quello mediante il
quale il virus entra nella cellula umana per poi riuscire a replicare il proprio patri-
monio genetico. Semplificando, le entità rilevanti sono le parti della cellula umana
e di quella del virus (recettori, endosomi, enzimi, membrane, punte), mentre le at-
tività sono diversi processi di natura enzimatica che intercorrono tra queste parti37.
Il meccanismo spiega il fenomeno perché mostra come quegli specifici processi,
applicati in un certo ordine e con continuità a quelle specifiche entità, costituiscono
il fenomeno in questione, cioè l’entrata del virus. Quasi sempre una rappresenta-
zione grafica e talvolta una simulazione dinamica del meccanismo sono parte della
spiegazione. La conoscenza del meccanismo di entrata del virus nella cellula è poi
la base per trovare altri meccanismi che la blocchino, ad esempio inibendo o con-
trastando una delle attività individuate: oltre alla spiegazione, un meccanismo si
presta quindi agli gli scopi di controllo e di previsione.
Che grado di dettaglio deve avere un meccanismo per fornire la spiegazione
di un fenomeno? Questa non è una domanda semplice e la risposta dipende dal
contesto. La mia esposizione dell’esempio qui sopra mostra un livello di dettaglio
non sufficiente: “diversi processi di natura enzimatica” è troppo vago, occorre spe-
cificare quali; lo studio pubblicato a cui ho fatto riferimento in nota contiene invece
questa specificazione. Lo scopo della spiegazione è rilevante, ma anche la disponi-
bilità di conoscenze pregresse nel dominio. Nel caso del virus Sars-CoV-2 e della
cellula umana, possiamo dire di conoscere buona parte delle entità e le attività
rilevanti - il virus è stato precedentemente isolato, esaminato e anche sequenziato
dal punto di vista genetico – e ci si aspetta quindi che il meccanismo esplicativo sia
dettagliato.
Un’altra questione da porre, leggermente diversa, è a quale “livello di realtà”
deve essere compreso nel meccanismo esplicativo. Il gergo filosofico non deve spa-
ventare, qui: ad esempio, organi, tessuti, molecole e geni sono livelli diversi. Il
nostro esempio dalla virologia è un meccanismo biochimico, a livello intracellu-
lare. Ma possiamo pensare a meccanismi con entità e azioni a livelli macroscopici
e, nello stesso tempo, più astratti: in psicologia, ad esempio, fenomeni comples-
si come la comprensione del linguaggio metaforico o la risoluzione di problemi
aritmetici possono essere spiegati mediante meccanismi che indicano, come parti,
le funzioni cognitive coinvolte e i processi. La possibilità di avere meccanismi di
livello inferiore (ad esempio a livello neurale) che spiegano ciascuna funzione co-
gnitiva e processo renderanno poi la spiegazione più completa: in questo caso la
spiegazione del fenomeno (in questo caso di una capacità: la comprensione del
linguaggio metaforico) sarà costituita da meccanismi “innestati”. La definizione di
meccanismo, la questione del dettaglio e del livello di realtà sono oggi tra i temi più
studiati dai filosofi della scienza38.
Un’ultima questione da tenere presente riguardo alla spiegazione tramite mec-
canismi è che un meccanismo, per quanto dettagliato, è sempre un modello della
realtà, ottenuto per astrazione (rappresentazione di ciò che è comune a casi simili)
e idealizzazione (eliminazione delle proprietà che non sono necessarie a caratteriz-
zare il nostro oggetto). Questo indipendentemente dal dettaglio e dai livelli che la
esempio, per il moto di un pianeta, la causa finale era raggiungere il suo “luogo
naturale” – e le scienze moderne, a partire da Galileo Galilei, hanno inizialmente
reagito prendendo le distanze in modo netto da questo paradigma.
Infine, dietro la diffidenza verso il concetto di causa come caratteristica della
scienza c’è la difficoltà dei filosofi di arrivare a un’analisi del concetto. Ecco un elen-
co semplificato di analisi filosofiche del concetto di causa, che sono state proposte
e discusse:
A causa B quando eventi di tipo A sono invariabilmente seguiti da eventi di
tipo B (questa è l’idea tradizionalmente associata al filosofo empirista inglese Da-
vid Hume43); quando il verificarsi di A aumenta la probabilità che si verifichi B;
quando una modificazione di A produce una modificazione di B; quando esiste un
processo continuo di modifica da A a B; quando se non si verificasse A, allora non
si verificherebbe neanche B; quando esiste un meccanismo in cui A è input e B è
output. Questo elenco va poi complicato e suddiviso considerando due dimensioni
filosoficamente fondamentali del dibattito sulla causalità: la relazione di causa si
dà tra eventi singoli oppure tra tipi di eventi? È deterministica oppure probabili-
stica?44
Se ci pensiamo un attimo, ognuna delle proposte definizioni della relazione di
causalità elencate sopra appare inizialmente plausibile – cioè sembra una buona
regola per i giudizi causali. Tuttavia, il dibattito filosofico mostra che ciascuna poi
si espone a controesempi, oppure è di applicabilità limitata. Come uscire dall’im-
passe? ci si può rassegnare che non esista una definizione esplicita del concetto
di causa – come vedremo nel §3.6, nella valutazione dei risultati degli studi epi-
demiologici e clinici, ma anche nella ricerca di base, si usano criteri per distin-
guere la causalità dalla semplice associazione. Un esempio rapido per cogliere la
differenza tra criteri e definizioni. Io so distinguere gli oggetti d’argento quando
li vedo: uso una serie di criteri che comprendono il colore, la malleabilità e la ten-
denza a ossidarsi, cioè – per quanto ne so - a formare una patina scura che non si
lava facilmente. Per intenderci, saprei separare le posate del servizio buono della
nonna da quelle in lega di alluminio che ho comprato di recente, anche se avessero
esattamente lo stesso design. Nondimeno, non so cosa sia l’argento non conosco il
suo numero atomico e quindi non potrei davvero distinguerlo da qualunque altro
materiale. Ho quindi dei criteri, ma non una definizione, oppure si può dire che ho
la mia concezione dell’argento, ma non afferro completamente il concetto. Pragma-
ticamente, è meglio di niente. Filosoficamente e scientificamente, non proprio, ma
l’importante è aver chiara la differenza.
Oltre al ripiego sui criteri per la causalità, un’altra via d’uscita al problema di
trovare la definizione del concetto è adottare il pluralismo: la tesi che ci siano in
realtà diversi concetti di causa. Questa idea di pluralismo potrebbe essere adatta
alla medicina, in cui sembra ragionevole dire, ad esempio, che il virus HIV causa
l’AIDS perché conosciamo il meccanismo (patogenesi) dell’infezione da HIV, e che
fumare causa il tumore al polmone perché ci sono evidenze convergenti da diversi
studi che attestano una correlazione, nonché una buona conoscenza del meccani-
smo rilevante.
Abbiamo detto che anche i metodologi sono cauti nel parlare di cause, e che ri-
prenderemo questo aspetto parlando degli studi clinici nel §3.6 e poi nel §4.7. Qui
ricordiamo che nei manuali di metodologia della ricerca “causale” sembra essere
diventato un termine che indica che tutti i possibili standard di eccellenza per una
certa correlazione tra variabili sono stati superati: una sorta di medaglia di eccel-
lenza metodologica, che non si raggiunge quasi mai. Ecco come un testo molto
usato si esprime su questo:
Comunque, le ipotesi spesso non vengono presentate in questa forma [causale] per-
ché il supporto per una relazione causa-effetto richiede non solo la plausibilità biolo-
gica e un forte risultato statistico, ma anche un appropriato e rigoroso disegno spe-
rimentale. Se lo sperimentatore ritiene che le variabili siano correlate ma preferisce
non speculare sull’influenza di una variabile sull’altra, l’ipotesi può essere formulate
in termini di associazione, senza riferimento esplicito ala causalità. Ad esempio: il
beneficio chirurgico è in relazione con la gravità preoperatoria dell’ischemia; la tolle-
ranza all’esercizio fisico è correlata con l’età cronologica; il consumo di bibite a basso
importo calorico è correlata con il peso corporeo45.
Si potrebbe obiettare, da un lato, che “speculare sull’influenza di una variabile
sull’altra” è proprio quello che lo sperimentatore dovrebbe fare (chi altri?); d’altra
parte la prudenza e la consapevolezza della possibilità dei propri errori (sia nel
disegno sperimentale che nell’esecuzione) sembrano virtù auspicabili.
Ritornando al nostro punto, per chiudere l’intermezzo: le cause non sono
scomparse dalla ricerca scientifica né tantomeno dalla riflessione filosofica. Però
la ricerca delle cause non può essere oggi quello che contraddistingue le scienze
come tali, perché i modelli di spiegazione causale all’interno di ciascuna sono
sia diversi che controversi: dire che la scienza cerca o scopre le cause non dice
di fatto ancora nulla, pone solo una domanda aperta su quale sia il metodo e il
concetto in uso.
1.9 CREDIBILITÀ
L’intermezzo sulle cause non deve farci perdere la strada. Stiamo arrivando alla
fine del nostro esame qualitativo di due caratterizzazioni di scienza per capire che
cosa sia. Resta da considerare un aspetto che può apparire più sociologico e con-
tingente che autenticamente definitorio, ovvero la credibilità, che troviamo nella
citazione dalla American Physical Association, riportiamola qui:
il successo e credibilità della scienza si fondano sull’impegno degli scienziati a:
esporre le loro idee e risultati al test e alla replica indipendente da parte di altri
scienziati, il che richiede lo scambio aperto e completo di dati, procedure e materiali
e l’abbandono o modifica di conclusioni accettate se si trovano davanti a evidenze
sperimentali più complete o affidabili.
Abbiamo già parlato del successo della scienza nel prevedere e controllare i
fenomeni: abbiamo detto che una delle spiegazioni migliori è che le teorie scien-
tifiche siano almeno in parte vere, che costituiscano conoscenza autentica. La cre-
dibilità viene dal successo della scienza nel cambiare il mondo e migliorare le no-
stre vite, ma non solo. Proviamo a riflettere con un esempio. Nel 2010, durante il
Campionato mondiale di calcio, un polpo gigante che viveva al Sea Life Centre di
Oberhausen, in Germania, divenne famoso perché prevedeva chi avrebbe vinto gli
incontri. Si chiamava Paul. Per chiedergli un verdetto gli venivano presentate due
scatole aperte contenenti il cibo, ciascuna con la bandiera di una delle squadre che
avrebbero giocato. La scatola da cui Paul mangiava prima decretava la squadra
vincitrice. Il verdetto di Paul risultò corretto per sette su sette partite giocate dalla
Germania, e in totale per 12 su 14 previsioni, diventando una star dei media. Morì
alla fine dell’estate46. Immaginiamo ora che Paul abbia continuato per molti anni,
confermando il suo tasso di successo predittivo (calcolato su tutte le sue perfor-
mances all’85.7%), o addirittura che sia ancora vivo e consultato da club calcistici e
scommettitori di tutto il mondo. Immaginiamo anche che non ci siano trucchi nel
modo in cui le previsioni vengono fatte e riportate. L’accuratezza delle previsioni
di Paul sarebbe maggiore di quella di molti modelli, matematici e non, corrente-
mente in uso in varie discipline scientifiche. Garantendo quindi con l’immagina-
zione tutte le circostanze favorevoli a questo caso, diremmo che Paul è credibile nel
prevedere i risultati? E se no, perché?
Il problema è che la procedura di previsione di Paul non è accessibile ad altri:
non abbiamo accesso ai dati di cui dispone, alle modalità di ragionamento, e altri
individui interessati alla stessa domanda di ricerca (ad esempio: chi vincerà oggi
tra Germania e Olanda?) non possono ripetere e riprodurre, o più tecnicamente
“replicare”, la sua procedura e i risultati. Di fatto non esiste, in questo caso, una
procedura né dati. Per questo il polpo indovino non è credibile come sarebbe uno
scienziato, anche se sapesse prevedere meglio di uno scienziato - e anche se fosse
umano.
Possiamo quindi dire che il metodo scientifico non ha solo un carattere logi-
co-procedurale, in quanto procedimento istanziato in diverse procedure specifi-
che, ma anche un aspetto sociologico, in quanto essenzialmente intersoggettivo.
In altre parole, nessun procedimento per ottenere conoscenza è scientifico se non
è condivisibile nella comunità scientifica, e i modi di questa condivisibilità sono
vari e articolati e comprendono diversi piani: l’esplicitazione dei dati e dei metodi,
del tipo di analisi, la valutazione dei risultati da parte dei pari, la pubblicazione e
diffusione, ma anche l’etica del singolo scienziato. Confrontiamo un noto manuale
di biochimica su questo punto:
Gli scienziati sono individui che applicano rigorosamente il metodo scientifico per
comprendere il mondo naturale. Per essere uno scienziato non basta avere una laurea
magistrale in una disciplina scientifica, né la mancanza di una laurea può impedire
a qualcuno di realizzare un contributo scientificamente importante. Uno scienziato
deve essere disposto a mettere in discussione qualsiasi idea quando nuovi risultati lo
richiedono. Le idee che uno scienziato accetta devono essere basate su osservazioni
misurabili e riproducibili che lo scienziato deve riportare con completa onestà47.
Si noti che questo punto squalifica definitivamente il polpo Paul, sul quale ave-
vamo pochi dubbi, ma anche casi molto più plausibili inizialmente. Uno di questi
è Luigi Di Bella, il medico modenese che nel 1998 diventò famoso per un metodo
di cura dei tumori, che somministrava ai suoi pazienti da anni dichiarando no-
tevoli risultati di efficacia. Il trattamento, una volta analizzato, risultò basato su
ingredienti variabili (somatostatina, melatonina, ocreotide, bromocriptina e uno
sciroppo contenente vitamine e acido retinoico) e le prove di efficacia fallirono. Il
problema rispetto alla pretesa di scientificità non è tanto il fallimento delle prove
di efficacia, ma il fatto che il medico rifiutò fino all’obbligo di legge di rendere pub-
blici i suoi dati e il lavoro sperimentale sui suoi preparati, e soprattutto decise di
applicarli senza il controllo intersoggettivo della comunità scientifica48.
todo, ma contigua per oggetto di studio, alle scienze naturali: si applica alle scienze
naturali e ai loro prodotti. Notiamo che spesso gli scienziati stessi fanno filosofia
in questo senso, a volte consapevolmente, altre volte no (parafrasando la citazione
del manuale di biochimica, non ci vuole e non basta una laurea in filosofia per fare
il filosofo, occorre occuparsi di certe questioni con certi metodi).
Rintracciare le radici storiche della riflessione filosofica sulla scienza è proibi-
tivo: ricordiamo solo che Aristotele, Leibniz e Descartes erano scienziati nell’uso
contemporaneo del termine e David Hume, Francis Bacon e John Stuart Mill erano
metodologi. Una delle tradizioni di filosofia della scienza più influente oggi è an-
glo-americana e ha le sue radici all’inizio del XX secolo nel Circolo di Vienna e nel
Circolo di Berlino, formati da scienziati e filosofi (soprattutto fisici e matematici)
che si trovarono a discutere sui fondamenti delle scienze, a fronte dei progressi e
cambiamenti eclatanti che in quegli anni accadevano in quelle discipline, soprat-
tutto la matematica e la fisica49. Oltre a fornire diverse importanti risposte che sono
discusse ancora oggi, questi filosofi, noti anche come neopositivisti o empiristi lo-
gici, hanno fissato un’agenda di domande di ricerca attorno alle quali si è formata
la nuova disciplina. Alcune includono quelle da cui siamo partiti qui: che cosa
sono leggi, teorie, spiegazioni e come si distingue la scienza dalla pseudoscienza (il
cosiddetto “problema della discriminazione”). La concezione del rapporto tra filo-
sofia e scienza dei neopositivisti è ben espressa da queste parole di Rudolf Carnap,
una delle figure più influenti del gruppo:
Anche se l’attività dello scienziato empirico e quella del filosofo della scienza devono
sempre essere mantenute distinte, in pratica i due campi di attività si sovrappongo-
no e si mescolano. Un fisico viene portato costantemente dalla stessa ricerca a porsi
questioni metodologiche. Che tipi di concetti devo usare? Quali regole governano
questi concetti? E con quali metodi logici essi vanno definiti? Come posso collegare
i concetti in enunciati e questi ultimi in un sistema logicamente connesso, ossia in
una teoria? A domande di questo tipo egli deve rispondere come filosofo della scienza:
evidentemente non possono ricevere risposta sulla base di procedure empiriche50.
I filosofi dei circoli di Vienna e Berlino avevano un progetto di unificazione di
tutte le discipline scientifiche fondato su tre pilastri. Il primo era il metodo condivi-
so, per cui lavorarono alla chiarificazione dei modelli di spiegazione, dei tipi di ra-
gionamento scientifico e dei procedimenti di controllo e conferma delle teorie. Gli
altri due pilastri del progetto erano il linguaggio chiaro e non ambiguo, dove tutti
gli enunciati fossero o passibili di verifica empirica (come “il questa stanza ci sono
ora 19°C”) oppure veri per convenzione (come “i gradi centigradi servono per mi-
surare la temperatura”), e la riducibilità di tutte le discipline alla fisica, ritenuta
più fondamentale per spiegare la natura della realtà. Oggi l’unificazione di tutte le
scienze probabilmente non è più un obiettivo; neanche il riduzionismo fisicalista se
la cava tanto bene, nelle sue varie forme. Resta invece plausibile sostenere che non
abbiamo molto altro per distinguere la scienza dalla non scienza, se non l’appello
al metodo – o ai metodi, come si preferisce dire oggi, pur riconoscendo che hanno
un’architettura logica comune. Ne parleremo nel prossimo capitolo.
La filosofia della scienza contemporanea si riconosce in questioni che si sono svi-
luppate in un secolo dal nucleo neopositivista. Ad esempio, si discute ancora di con-
ferma e della sua alternativa, la falsificazione (questa è un’idea di Karl Popper, un
filosofo molto vicino ma anche molto critico del Neopositivismo – anche di lui parle-
remo nel cap. 2). Ma si sono arricchite anche con altri approcci, come quello storico di
Thomas Kuhn, che abbiamo già menzionato, e con il riconoscimento di dimensioni
normative e valoriali della ricerca, che erano assenti dall’orizzonte dei neopositivisti.
Ecco la caratterizzazione della disciplina da un recente testo di riferimento:
Qual è lo scopo e quali sono gli scopi della scienza e qual è il suo metodo o quali
sono i suoi metodi? Più generalmente: che cos’è la scienza e come si differenzia dalla
non scienza e dalla pseudoscienza? Che cos’è una teoria scientifica e come le teorie
scientifiche stanno in relazione con (e quindi rappresentano) il mondo? Come fanno
i termini teorici ad avere significato e come si connettono con l’osservazione? Qual
è la struttura e il contenuto di concetti come causa, spiegazione, conferma, teoria,
esperimento, modello, riduzione e probabilità? Quali regole, se ce ne sono, governano
il cambiamento delle teorie? Qual è la funzione dell’esperimento? Che ruolo hanno i
valori (sia epistemici che pragmatici) nelle decisioni scientifiche e qual è il loro rap-
porto con i fattori sociali, culturali e di genere? 51
Inoltre, la filosofia della scienza generale oggi coesiste con le filosofie delle
scienze particolari (filosofia della medicina, fisica, biologia, economia, matematica,
statistica, psicologia - ma anche a un livello di specializzazione maggiore: filosofia
della psichiatria, farmacologia, epidemiologia, fisica quantistica, biologia moleco-
lare). Ciascuna di queste discipline applica alla scienza di riferimento le doman-
de dell’agenda comune della filosofia della scienza, e in più discute problemi che
sorgono all’interno di un tipo di ricerca particolare. Ad esempio, la filosofia della
medicina si interroga sui concetti di salute e malattia, causalità, spiegazione mec-
canicistica e ruolo dei modelli nella sperimentazione, eccetera.
Occorre precisare che le domande e le risposte dei filosofi della scienza sono
da intendere in senso normativo, non descrittivo. Ciò vale a dire che per studiare,
ad esempio, il ruolo dei modelli il filosofo non organizza uno studio sperimen-
tale per capire come vengono usati dai biologi, dai geologi o dagli epidemiologi
– che potrebbe essere una meta-analisi sugli studi pubblicati, ma anche una ri-
cerca qualitativa in cui si chiede agli scienziati quali sono le loro metodologie di
ricerca: questi sono i compiti della sociologia e della psicologia della scienza. La
filosofia può avvalersi di questi dati, ma l’interesse è capire nel caso specifico che
caratteristiche devono o dovrebbero avere i modelli per fornire conoscenza sulla
realtà. Per fare un altro esempio, un filosofo della medicina non si chiederà (solo)
come è usato il concetto di malattia dai medici, oppure nel linguaggio comune: la
sua indagine sarà volta a chiarire che dato un certo concetto di malattia, allora ne
seguono per necessità certe classificazioni o spiegazioni, e così via. Questo tipo
di indagine non è empirica, ma si avvale di un procedimento di argomentazione
logica a partire da dati empirici.
Dato che questo non è un libro di filosofia della medicina, ma un’introduzio-
ne al metodo sperimentale in medicina dal punto di vista della filosofia, l’illu-
strazione delle questioni e delle caratteristiche della filosofia della scienza deve
necessariamente fermarsi qui. Parleremo di valori nella ricerca, di metodo, di
causalità e di meccanismi più avanti nei prossimi capitoli, rimandando per il
resto ad altri testi52.
NOTE DI CHIUSURA
1 Ribot, T. (1898). Correspondance [Correspondence]. Revue Encyclopédique, 8(232), 151,
citato in Nicolas, S., Andrieu, B., Sanitioso, R., Vincent, R. & Murray, D. (2015). Alfred Binet
and Crépieux-Jamin: Can intelligence be measured scientifically by graphology?. L’Année
psychologique, vol. 115(1), 3-52.
2 Si veda ad esempio Dazzi, C., & Pedrabissi, L. (2009). Graphology and personality:
an empirical study on validity of handwriting analysis. Psychological reports, 105(3_suppl),
1255-1268.
3 Una trattazione ampia e divulgativa dello statuto della grafologia come scienza è
Beyerstein, B. L., & Beyerstein, D. F. (1992). The write stuff: Evaluations of graphology, the study
of handwriting analysis. Buffalo: Prometheus Books.
4 Ad esempio Brewer, J. F. (1999). Graphology. Complementary Therapies in Nursing and
Midwifery, 5(1), 6-14.
Giannini, M., Pellegrini, P., Gori, A., & Loscalzo, Y. (2019). Is graphology useful in assessing
major depression?. Psychological reports, 122(2), 398-410
5 Davenas, E., Beauvais, F., Amara, J., Oberbaum, M., Robinzon, B., Miadonnai, A., ... &
Sainte-Laudy, J. (1988). Human basophil degranulation triggered by very dilute antiserum
against IgE. Nature, 333(6176), 816-818.
6 Tralascio qui la differenza tra concetti e termini linguistici.
7 Wikipedia contributors. (2020, November 23). Science. In Wikipedia, The Free Encyclope-
dia. Retrieved 09:45, November 26, 2020, from https://en.wikipedia.org/w/index.php?title=-
Science&oldid=990161801
8 Le traduzioni dalle citazioni in inglese sono mie nel caso non si faccia riferimento all’e-
dizione italiana.
9 Questo passaggio, dalla considerazione personale di quanto so su un argomento, al
cercare il riscontro dalla conoscenza altrui (che sia Wikipedia o i propri pari), per poi sele-
zionare le fonti esperte, è razionale ed esemplifica, pur con le dovute differenze, una piccola
parte del metodo di cui parleremo in queste pagine.
10 The Council of The American Physical Society 11/15/98, accesso 26/11/2020 a https://
www.aps.org/publications/apsnews/199906/popa.cfm
11 Per un riferimento sul metodo dell’analisi concettuale nella filosofia contemporanea si
veda Beaney, M. (2018) Analysis. The Stanford Encyclopedia of Philosophy (Summer 2018 Edi-
tion), Edward N. Zalta (ed.), URL = <https://plato.stanford.edu/archives/sum2018/entries/
analysis/>.
12 Un filosofo della scienza ha recentemente proposto la sistematicità come criterio cen-
trale della sistematicità Hoyningen-Huene, P. (2013). Systematicity: The nature of science.
Oxford University Press. Nel testo ho omesso la differenza tra scienza e conoscenza scien-
tifica.
13 Jorge Luis Borges (1984) L’idioma analitico di John Wilkins. In Altre inquisizioni, Tutte
le opere. Volume I. Milano: Mondadori. 1984, 1004-1005. La raccolta è stata originariamente
pubblicata nel 1952.
14 Lemonick, S. (2019) The periodic table is an icon. But chemists still can’t agree on how
to arrange it. Chemical & Engineering News. 97
15 Nella letteratura molto vasta su questo tema rimando in italiano a Lalumera, E. (2019)
Il problema della classificazione dei disturbi mentali. Cap. 4 in R. Guerini e M. Marraffa (a
cura di) (2019) Psicopatologia e scienze cognitive. Roma: Carocci
16 Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi.
17 Nelle scienze sociali (psicologia, sociologia, economia, psicologia, eccetera), ma anche
in alcune aree della medicina, la ricerca è anche qualitativa, come diremo in seguito.
18 Galilei, G. Il Saggiatore, Milano, Feltrinelli 1992 (ed. or. 1623), 171.
19 Feynman, R. (1964) Messenger Lectures: The character of Physical Law. Cambridge,
MIT Press.
20 La filosofia della scienza iniziata con il Neopositivismo si può definire come teoria
delle teorie scientifiche, come vedremo brevemente nel §1.9
21 Per proposizione intendo un contenuto che può essere vero o falso e può essere espres-
so in varie lingue o formati, ad esempio “due più due è uguale a quattro”, “2+2=4” e “two
plus two equals four” esprimono la stessa proposizione vera. Caratterizzare le leggi in ter-
mini di proposizioni non è ovvio, si può alternativamente caratterizzare la legge come la re-
lazione stessa sussistente tra le variabili. La citazione da Feynman allude a questa opzione.
Per il nostro discorso, tuttavia, che è introduttivo e non filosofico specialistico, questa scelta
non ha effetti rilevanti.
22 Possiamo dire che questo criterio di universalità non sia soddisfatto da nessuna di
quelle che chiamiamo “leggi” nelle scienze empiriche, ad esempio la legge di gravitazione
universale nella formulazione di Newton non vale per corpi che si muovono a velocità
superiori a quella della luce e potenziali gravitazionali molto grandi, per cui si usa la Rela-
tività Generale. Tuttavia, le leggi fisiche si approssimano all’universalità.
23 Le leggi di una teoria scientifica, come gli assiomi in matematica e geometria, sono
premesse per la derivazione dei teoremi, ma diversamente dagli assiomi, esse derivano
dall’esperienza. Per una esposizione sintetica dell’importanza dei Principia per il metodo
scientifico rimando a Castellani, E., Morganti, M. (2019) La filosofia della scienza. Bologna,
il Mulino, cap. 3.
24 Per un’introduzione accurata in italiano rimando al cap. 4 di Laudisa, F. e Datteri, E.
(2012) La natura e i suoi modelli. Bologna: Archetipolibri.
25 Un’analisi dello statuto di questa legge da parte di un filosofo della scienza è Lorenza-
no P. (2014) What is the status of the Hardy-Weinberg law within population genetics? In:
Galavotti M.C., Nemeth E., Stadler F. (eds) European philosophy of science—philosophy of
science in Europe and the Viennese Heritage, Vienna Circle Institute Yearbook 17. Springer,
Dordrecht, pp 159–172
26 Roeckelein, J. E. (1998). Dictionary of theories, laws, and concepts in psychology. Green-
wood Publishing Group; Teigen, K. H. (2002). One hundred years of laws in psycholo-
gy. The American journal of psychology, 115(1), 103; Roediger, III, H. L. (2008). Relativity of
remembering: Why the laws of memory vanished. Annu. Rev. Psychol., 59, 225-254.
27 Per un’introduzione più completa al problema delle leggi, che adotta questo punto di
vista – non c’è una differenza filosoficamente rilevante tra leggi con moltissime condizioni
ceteris paribus e la legge di gravitazione universale - si veda Laudisa, F. e Datteri, E. La natura
e i suoi modelli. Un’introduzione alla filosofia della scienza. Bologna: Archetipolibri, cap. 4.
28 Lettrici e lettori curiosi possono facilmente trovare buone fonti di divulgazione storica su
queste teorie, per cui non appesantisco le note di questo testo con riferimenti bibliografici.
29 Semplificando al massimo, da un punto di vista realista si può parlare di verità o falsità
di una teoria, in quanto rappresentazione del mondo. Da un punto di vista antirealista si
parla invece di utilità o inadeguatezza di una teoria come strumento per spiegare e preve-
dere. Realismo e antirealismo sono due posizioni in filosofia della scienza, si veda Okasha,
S. (2012) Il Primo libro di filosofia della scienza. Torino: Einaudi.
30 Ne parliamo più avanti, § 1.10.
31 Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi, 24-25.
32 ...I believe there exists, & I feel within me, an instinct for the truth, or knowledge or dis-
covery, of something of the same nature as the instinct of virtue, & that our having such an
instinct is reason enough for scientific researches without any practical results ever ensuing
from them. Charles Darwin The Correspondence of Charles Darwin, Vol. 4. (1847-50)
33 Chi è curioso può consultare Russo, L. (2003). Flussi e riflussi: indagine sull'origine di una
teoria scientifica. Milano: Feltrinelli Editore.
34 Tutte le spiegazioni sono previsioni? Secondo l’idea neopositivista della spiegazione
scientifica proposto da Carl Gustav Hempel e Paul Oppenheim, la risposta è affermativa.
Come si è detto, tuttavia, esiste un importante dibattito sul tema, sviluppatosi proprio in
reazione alla proposta neopositivista. Per un’introduzione in italiano rimando al cap. 5 di
Galavotti, M.C.e Campaner, R. (2017) Filosofia della scienza. Milano: Egea
35 Per una trattazione filosofica estesa si veda Psillos, S. (1999) Scientific Realism: How
Science Tracks Truth, London: Routledge, cap. 4. Un’introduzione in italiano si trova in Oka-
sha, S. (2006). Il primo libro di filosofia della scienza. Torino: Einaudi, cap. 4.
36 Oltre al riferimento in nota 32 rimando a Woodward, James (2019) Scientific Explana-
tion. The Stanford Encyclopedia of Philosophy (Winter 2019 Edition), Edward N. Zalta (ed.),
URL = <https://plato.stanford.edu/archives/win2019/entries/scientific-explanation/>.
37 Si veda ad esempio Shang, J., Wan, Y., Luo, C., Ye, G., Geng, Q., Auerbach, A., & Li, F.
(2020). Cell entry mechanisms of SARS-CoV-2. Proceedings of the National Academy of Scienc-
es, 117(21), 11727-11734.
38 Nella letteratura molto vasta segnalo Bechtel, W., & Abrahamsen, A. (2005). Expla-
nation: A mechanist alternative. Studies in History and Philosophy of Science Part C: Studies
in History and Philosophy of Biological and Biomedical Sciences, 36(2), 421-441, Campaner, R.
(2011). Understanding mechanisms in the health sciences. Theoretical medicine and bioeth-
ics, 32(1), 5-17, e Illari, P. M., & Williamson, J. (2012). What is a mechanism? Thinking about
mechanisms across the sciences. European Journal for Philosophy of Science, 2(1), 119-135. Il
saggio di Catherine Elgin argomenta che i modelli sono falsità che la scienza usa per spie-
gare, prevedere, controllare e che tuttavia giustificano la pretesa di conoscenza: Elgin, C. Z.
(2017). True enough. Boston: MIT Press.
39 Un’introduzione in italiano al ruolo dei modelli nella teorizzazione scientifica è il cap.
7 di Laudisa, F. e Datteri. E. (2012) La natura e i suoi modelli. Bologna, Archetipolibri. In
inglese: Wilde, M.; and Williamson, J. 2016. Models in medicine. In Routledge Companion
to Philosophy of Medicine, ed. by M. Solomon, J. Simon and H. Kincaid, 271–84. Routledge:
New York and London.
40 Per avere un’idea di che cosa sia un modello matematico in biologia, Allman, E. S., Al-
lman, E. S., & Rhodes, J. A. (2004). Mathematical models in biology: an introduction. Cambridge
University Press.
41 Si veda ad esempio Jewell, N. P., Lewnard, J. A., & Jewell, B. L. (2020). Predictive math-
ematical models of the COVID-19 pandemic: Underlying principles and value of projec-
tions. Jama, 323(19), 1893-1894
42 Russell, B. (1913). On the Notion of Cause. Proceedings of the Aristotelian Society, 13:
1–26.
43 Hume, D. (2000) (1748) An enquiry concerning human understanding: A critical edition.
Oxford: Oxford University Press.
44 In italiano un’introduzione breve e accurata è Laudisa F. (2012). Causalità. APhEx 5.
On-line: http://www.aphex.it/index.php?Temi=557D030122027403210E057677 73
45 Supino, P. G. (2012). The Research Hypothesis: Role and Construction. In Principles of
Research Methodology (pp. 31-53). Springer, New York, NY.
46 Wikipedia contributors. (2020, November 10). Paul the Octopus. In Wikipedia, The Free
Encyclopedia. Retrieved 16:17, December 13, 2020, from https://en.wikipedia.org/w/index.
php?title=Paul_the_Octopus&oldid=987926383
47 Nelson, D. L., & Cox, M. M. (2017). Lehninger Principles of Biochemistry 7th edition.
London, MacMillan, ii.
48 Traversa, G., Maggini, M., Menniti‐Ippolito, F., Bruzzi, P., Chiarotti, F., Greco, D., ...
& Italian Study Group for the Di Bella Multitherapy Trials. (1999). The unconventional Di
Bella cancer treatment: A reflection on the Italian experience. Cancer, 86(10), 1903-1911.
49 Per un’esposizione del Neopositivismo rimando ai volumi introduttivi in italiano fino-
ra citati: Galavotti, M.C. e Campaner, R. (2017) Filosofia della scienza. Milano: Egea; Lau-
è una descrizione semplificata del metodo scientifico come processo logico, che
possiamo trovare in diversi manuali universitari e pagine divulgative:
− Osservazione
− Ipotesi
− Previsione
− Controllo
− Valutazione
sono le fasi logiche del processo, che sono collegate da varie attività di ragiona-
mento:
− dall’osservazione all’ipotesi
− dall’ipotesi alle previsioni
− dalle previsioni al controllo
− dal controllo alla valutazione dei risultati.
Sappiamo dalle ricostruzioni storiche tradizionali che questa idealizzazione del
metodo nasce con la cosiddetta rivoluzione scientifica del XVII secolo, con Galileo
Galilei (Dialogo sopra i due massimi sistemi del mondo, 1632), Francis Bacon (Novum
Organum, 1620) e Isaac Newton (Principia mathematica philosophiae naturalis, 1687).
Ci sono frasi di questi autori che vale la pena citare, perché ci aiutano a ricordare
aspetti rilevanti. Da Galileo Galilei:
Sì come a voler che i calcoli tornino sopra i zuccheri, le sete e le lane, bisogna che il
computista faccia le sue tare di casse, involgi ed altre bagaglie, così quando il filosofo
geometra vuol riconoscere in concreto gli effetti dimostrati in astratto, bisogna che
difalchi gli impedimenti della materia; che se ciò saprà fare, io vi assicuro che le cose
si riscontreranno non meno aggiustatamente che i computi aritmetici1.
Sostituiamo “scienziato” a “filosofo geometra” e troviamo qui un elemento fon-
damentale del metodo scientifico, l’esperimento, che non è osservazione di tutte le
caratteristiche di un fenomeno, ma comporta una selezione degli aspetti rilevanti
al fine del controllo e della misura: in questo senso il ricercatore “bisogna che di-
falchi gli impedimenti della materia”. È importante ricordare che anche gli antichi
osservavano la natura, e anzi la scienza di Aristotele è molto più vicina al senso
comune della nostra – cosa c’è di più ovvio del fatto che il sole sorge e tramonta,
cioè si muove nel cielo durante la giornata? Non l’osservazione, ma l’esperimento
(o l’osservazione di aspetti selezionati nel caso l’esperimento non sia possibile) è la
novità del metodo della scienza moderna che qui sottolinea Galileo2.
E non può fare ricerca biomedica senza una conoscenza almeno pratica di una
parte delle metodologie e procedure che gli scienziati oggi usano.
Dal capitolo precedente abbiamo imparato anche, però, che ai filosofi della
scienza spetta il lavoro di astrarre i concetti fondamentali che sono impliciti nei pa-
radigmi, per guardarli più da vicino, chiarirli e valutarli nel loro ruolo di produrre
conoscenza. Facciamo quindi questo esercizio con la nostra descrizione del metodo
scientifico come processo logico, considerando dal punto di vista filosofico le atti-
vità che abbiamo menzionato in apertura: dall’osservazione all’ipotesi, dall’ipotesi
alle previsioni, dalle previsioni al controllo e alla valutazione dei risultati. Queste
attività fanno capo a diversi tipi di ragionamento logico: l’induzione, l’abduzione e
la deduzione. L’avvertenza, già introdotta, è che in concreto queste diverse attività
che lo scienziato compie facendo ricerca si troveranno all’interno di un contesto
più ampio in cui metodologie, tecnologie e pratiche sono rilevanti per la costruzio-
ne della conoscenza, tanto quanto la struttura logica del metodo. Ci occuperemo
delle metodologie per la ricerca biomedica nei prossimi due capitoli, riconside-
rando tutte le attività e le fasi non più dal punto di vista astratto e concettuale, ma
pratico e procedurale.
pagina del giornale è vera comprando un’altra copia dello stesso giornale. Dunque,
in base a cosa l’induzione ci porta conoscenza a partire dall’osservazione? In base
a nulla, potremmo concludere letteralmente.
La morale negativa dell’intermezzo filosofico è che l’induzione rappresenta un
problema – il famoso problema di Hume - se vogliamo giustificare su basi logiche
e razionali la nostra conoscenza a partire dall’osservazione, cioè se vogliamo porci
una domanda di principio. Possiamo però decidere di non affrontare la domanda
di principio, in quanto scienziati, e lavorare su quella metodologica: come possiamo
rafforzare il supporto induttivo che le osservazioni forniscono alle nostre ipotesi?
Quali procedimenti logico-matematici ci consentono di chiarire l’effettivo supporto
induttivo che le ipotesi ricevono dall’osservazione? Vedremo nei prossimi capitoli
le linee generali di alcuni protocolli per studi sperimentali, che appunto rispondono
alla domanda metodologica. Prima di questo vale la pena ricordare i metodi della
logica induttiva di John Stuart Mill, enunciati nel suo Sistema di logica (prima edizio-
ne 1843), che ritroviamo ancora oggi alla base dei protocolli sperimentali.
Per inciso, Mill è un campione filosofico dell’induttivismo: ritiene che il ragio-
namento induttivo a partire dall’esperienza sia sostanzialmente la base della vita
razionale umana:
Poichè la massima parte della nostra conoscenza, sia delle verità generali che dei fatti
particolari, è incontestabilmente materia di inferenza si può ricondurre all’autorità
della logica non solo quasi tutta la scienza, ma anche la condotta umana. Fu detto
che il trarre inferenze è la massima occupazione della vita. Ognuno ha bisogno ogni
giorno, ogni ora ed ogni istante di accertare fatti che non ha osservato direttamente,
non per uno scopo generico di accrescere il proprio patrimonio di conoscenze, ma
perchè quei fatti hanno importanza per i suoi interessi o le sue occupazioni. Compito
del magistrato, del comandante militare, del navigatore, del fisico, dell’agricoltore,
è semplicemente un giudizio sull’evidenza ed un’azione conforme. Tutti hanno da
accertare determinati fatti, per potere in seguito applicare determinate regole, o da
loro stessi escogitate, o prescritte da altri per loro guida; assolvono bene o male i
doveri delle loro diverse mansioni, secondo che fanno questo bene o male. È la sola
occupazione in cui la mente non cessi mai d’essere occupata, ed è argomento della
conoscenza in generale, non della logica8.
I metodi di Mill hanno lo scopo di guidare i ragionamenti induttivi, in parti-
colare in quelli in cui la conclusione è di tipo causale. Questo è il metodo della
concordanza:
Se due o più casi del fenomeno che stiamo indagando hanno una circostanza in co-
mune, la sola circostanza per la quale tutti i casi concordano è la causa (o l’effetto)
del fenomeno dato9.
Facciamo un esempio semplice: osservo negli anni che tutte le mie ventotto
piante di phalaenopsis, quelle sulla scrivania e quelle sulla credenza, quelle al sole
al mattino e quelle al sole al pomeriggio, quelle con il vaso di plastica e quelle con
il vaso di porcellana, quelle comprate al mercato e quelle prese nel vivaio, hanno
perso le foglie dopo una settimana dal mio acquisto. L’unico aspetto che avevano
in comune è che sono sempre io ad innaffiarle, sempre allo stesso modo. Probabil-
mente, dunque, perdono le foglie a causa del modo in cui le innaffio.
Il metodo della differenza è così enunciato:
Se un caso in cui il fenomeno che stiamo indagando accade e un caso in cui non
accade hanno tutte le circostanze in comune eccettuata una e quest’una si presenta
soltanto nel primo caso, quella sola circostanza in cui i due casi differiscono è l’effet-
to, o la causa, o una parte indispensabile della causa del fenomeno.
Ad esempio: ho mangiato bene al ristorante Yoshi in 27 occasioni da ottobre
scorso ad agosto. Ordino sempre esattamente lo stesso menu. Da dopo l’estate però
non è più così: le ultime sei volte ho mangiato male. In settembre Yoshi ha cambia-
to cuoco. La causa è quella.
È facile notare, inventando controesempi (che lascio a chi legge), che i metodi
di Mill sono fallibili: non sono regole logiche, cioè non possono garantire conclu-
sioni vere neanche se partiamo da premesse vere. Tuttavia, ci possono aiutare a
ragionare meglio e a disegnare studi che per la loro struttura daranno un buon
supporto induttivo alla conclusione che troveremo. Di fatto molti studi di labora-
torio utilizzano il metodo della differenza: si effettua, su un campione noto, una
serie di interventi uno alla volta, e si osserva quale fa la differenza, ovvero produce
il fenomeno che si sta indagando. Ma il protocollo della sperimentazione, la tecno-
logia e la statistica, non solo il disegno, contribuiscono al supporto induttivo. Ne
parleremo più avanti.
Un filosofo della scienza che non approverebbe questi sforzi e ha preso invece
molto sul serio la morale negativa sulla giustificazione dell’induzione è Karl Pop-
per. Nel saggio Congetture e confutazioni Popper sostiene che
[l]’induzione, cioè l’inferenza fondata su numerose osservazioni, è un mito. Non è
né un fatto psicologico, né un fatto della vita quotidiana, e nemmeno una procedura
nessuna si è mai verificata fino a circa sei anni fa, quando il numero di emorragie
postoperatorie è diventato allarmante13.
L’aumento di frequenza, continua Craven, è dovuto all’abitudine diffusa
di masticare gomme di aspirina a scopi analgesici. C’è un’ultima osservazione
nell’articolo che Craven porta a sostegno della propria ipotesi sul potere antico-
agulante e quindi antitrombotico dell’aspirina: nella sua pratica ha osservato che
gli uomini sono poco disposti in generale ad assumere aspirina, che ritengono es-
sere una medicina per donne, fatta per alleviare i tipici dolori femminili e quindi
poco adatta alla virile resistenza al dolore. Craven associa questa osservazione al
fatto che gli uomini rispetto alle donne hanno un rischio molto più alto di soffrire
di infarto cardiaco.
Negli anni successivi il chirurgo continua il suo lavoro di raccolta di dati, che
includono anche un piccolo studio osservativo su se stesso: ingerisce per cinque
giorni 12 tavolette di aspirina al giorno, notando poi un sanguinamento spontaneo
e profuso dal naso. Nell’ultimo lavoro che pubblica meno di un anno prima di
morire, Craven riporta di avere osservato circa 8000 pazienti a cui aveva prescritto
l’assunzione giornaliera di aspirina e che solo 9 di questi sono morti di aneurisma
aortico o trombosi coronarica. Egli è consapevole che quella che sta formulando è
solo un’ipotesi tratta dall’osservazione, scrive infatti:
va detto che l’efficacia di qualsiasi tipo di trattamento profilattico è difficile da provare
e ciò si applica specialmente a una procedura che è destinata alla prevenzione. Le os-
servazioni di soggetti sani non possono mai essere fatte sotto condizioni strettamente
scientifiche e i dati che risultano sono solo limitatamente adatti alla valutazione sta-
tistica. Questi risultati possono dunque semplicemente avere il valore di impressioni
preliminari e saranno sostanziate o rifiutate da ricerca clinica successiva. Ammet-
tendo dunque il campo della profilassi generale della trombosi coronarica eccede dei
limiti del presente studio, queste osservazioni preliminari possono essere di impor-
tanza pratica nella misura in cui la somministrazione di aspirina sia sicura in tutti
i soggetti e durante tutto il periodo di trattamento; le osservazioni fin qui riportate
non sono in opposizione rispetto alle tendenze riportate dalla ricerca clinica e speri-
mentale; risulti ben chiaro che i risultati a cui sono arrivato non sono stati ottenuti
sotto condizioni strettamente scientifiche14.
Craven fu brillante e prudente, ma sfortunato a non vedere il lieto fine, per-
ché morì (proprio di infarto!) prima che iniziassero i test clinici rilevanti. La storia
La ricostruzione del ragionamento abduttivo fin qui fatta dovrebbe bastarvi per
sospettare che la conclusione di un’inferenza alla spiegazione migliore è un salto nel
buio: benché basata sull’evidenza contenuta nelle premesse, non è garantita dalla
verità di queste, né dai vincoli di selezione. A sostegno di questo punto ricordiamo
anche che l’abduzione, come l’induzione, è sensibile all’introduzione di nuova infor-
mazione nelle premesse. Avete scartato come implausibile la condanna per omicidio
come spiegazione del fatto che la prof. Montagnoni non si è presentata a lezione?
Non eravate al corrente delle indagini della polizia sull’omicidio di Alberto Bastia, di
cui nell’esempio sopra. E aggiungo ora che Edelweiss Montagnoni è l’identità di co-
pertura di Erica Montone, figura chiave del mercato dell’eroina proveniente dall’Af-
ghanistan, che si sta facendo largo in Italia sterminando la concorrenza. Questo ren-
de di nuovo probabile la spiegazione della condanna per omicidio. Altre volte le
nuove informazioni permettono invece di scartare definitivamente una tra le possibi-
li spiegazioni, anche se rispettava i vincoli del paradigma, aiutandoci nella selezione.
Vediamo questa dinamica con un’altra vicenda tratta dalla storia della medicina.
caso, cioè che non ci sia con nessuna spiegazione del cluster, e che ogni paziente
abbia una storia diversa (l’ipotesi nulla), invece nel report vengono messe in cam-
po due ipotesi di natura associativo-causale:
a) un aspetto dello stile di vita omosessuale causa la sindrome
b) una malattia a trasmissione sessuale, tra quelle già note, causa la sindrome
Passa il tempo e si aggiunge evidenza, ovvero premesse per il ragionamento
abduttivo. Il mese successivo esce un altro report: 26 decessi per sarcoma di Ka-
posi, un raro tumore della pelle più frequente negli ultrasettantenni delle regioni
mediterranee, ma qui i soggetti sono nuovamente giovani omosessuali americani,
e tutti presentano anche polmonite pneumococcica. Si ipotizza dunque esplicita-
mente una sindrome, inizialmente chiamata GRIDS (Gay Related Immune Deficiency
Syndrome), e si propongono nuove ipotesi per spiegare l’immunodeficienza:
c) una partita di poppers contaminata (una droga ricreativa composta da al-
chil-nitriti)
d) consumo eccessivo di droghe, anche non contaminate
e) accumulo di malattie a trasmissione sessuale, che sovraccaricherebbero il si-
stema immunitario
f) batterio sconosciuto
g) virus sconosciuto
La prima ipotesi, quella dei poppers, risulta facile da eliminare, perché i casi
analoghi di morte continuano in altri luoghi e vengono compiute analisi tossicolo-
giche. Le ipotesi legate allo stile di vita, d) ed e) sembrano in questa fase dare conto
di tutta l’evidenza, mentre f) e g) sono di nicchia e vengono avanzate perché, in
quel periodo, c’è ricerca su batteri e virus come precursori dei tumori, ma risultano
più speculative. Nel 1982 arriva però l’evidenza sufficiente a eliminare le ipotesi
legate allo stile di vita: la sindrome viene riscontrata in diversi emofiliaci (uomini e
donne) e persone che hanno ricevuto sangue trasfuso, tra cui un bambino di venti
mesi: i comportamenti sessuali a rischio, l’omosessualità e l’uso di droghe non pos-
sono più essere cause dirette della sindrome e resta la spiegazione infettivologica.
I batteri, tuttavia, non possono resistere alla procedura di filtrazione che si usa per
trasferire il sangue agli emofiliaci, dunque l’ipotesi dell’infezione batterica risulta
più debole, perché non può spiegare l’evidenza relativa alla sindrome in quel grup-
po di pazienti.
Inizia quindi quella che potremmo chiamare la seconda fase della ricerca: il
ragionamento con l’apporto di nuova evidenza ha portato a selezionare l’ipotesi
dell’infezione virale come causa della sindrome (che a questo punto viene chiama-
ta AIDS, Acquired Immune Deficiency Syndrome, togliendo il riferimento discrimina-
torio all’omosessualità), ma occorre renderla precisa identificando il virus. Questa
fase è resa difficile dal fatto che i soggetti sviluppano i sintomi anni dopo l’infe-
zione, e nel frattempo vengono colpiti ogni tipo di infezione: da funghi, batteri e
altri virus “opportunisti”. Dopo vari tentativi che coinvolgono candidati patogeni
poi scartati, viene isolato nel 1983 in Francia un particolare virus in un paziente
con lifoadenopatia, già riconosciuta come uno stato precursore dell’AIDS, ma nella
quale i patogeni opportunisti sono meno numerosi. In pochi mesi il virus, poi chia-
mato HIV, viene riscontrato mediante un test del sangue appositamente sviluppa-
to in molti altri malati di AIDS, umani ma anche primati, e nel 1984 è riconosciuto
dal consenso della comunità scientifica come causa della sindrome17.
Riassumendo: questa ricostruzione della ricerca collettiva che ha portato a sta-
bilizzare la cosiddetta teoria virale dell’AIDS ha la forma, soprattutto nella sua pri-
ma fase, di un ragionamento abduttivo, in cui si cerca una generalizzazione causale
che renda conto di una serie di fatti epidemiologici (cluster di pazienti con le stesse
patologie rare) e clinici (sintomi, decorso). Nella prima fase le ipotesi non vengono
controllate sperimentalmente, ma la disponibilità di altra evidenza epidemiologica
(gli emofiliaci, i trasfusi e i bambini) permette di eliminarle, col tempo, quasi tutte.
La “migliore” ipotesi in questo caso viene anche sostanziata dall’identificazione
dell’agente patogeno e del meccanismo di infezione – che è la “causa” per eccellen-
za, anche se solo necessaria, e non anche sufficiente, per la malattia. Questa rico-
struzione della scoperta dell’HIV come causa dell’AIDS mostra quindi le caratteri-
stiche dell’abduzione che abbiamo illustrato: si tratta di un’inferenza speculativa,
in cui diverse conclusioni possono coesistere a parità di premesse, considerazioni
dettate dal paradigma di ricerca vigente suggeriscono quali siano più plausibili,
e nuova evidenza può far cambiare il grado di supporto di ciascuna rispetto alla
conclusione fino all’eliminazione di molte ipotesi concorrenti.
Tra poco, con la storia di Ignaz Semmelweis e la febbre puerperale, vedremo un
caso in cui le ipotesi ideate per abduzione vengono invece sottoposte a controllo
sperimentale (o semi-sperimentale) e così eliminate tutte, tranne una: un caso di
brillante scoperta del colpevole, come in una detective story. Ma occorre prima
introdurre la deduzione.
Abbiamo ora tutto ciò che occorre per identificare un secondo ruolo della de-
duzione nel nostro schema semplificato del metodo scientifico: dal controllo alla
valutazione dei risultati. Consideriamo un’ipotesi o teoria T e una sua conseguen-
za deduttiva, che chiamiamo p: se è vera T, allora possiamo prevedere che p si
verificherà, in simboli:
T-->p
Supponiamo ora di concepire un esperimento o piano di osservazione per con-
trollare p. Il risultato dell’esperimento è che p effettivamente si verifica, ho quindi:
Prima premessa: (T-->p)
Seconda premessa: p
Ad esempio, dalla nostra ipotesi che tutti i fagioli del barattolo di ceramica sono
bianchi, abbiamo previsto che il prossimo che osserveremo sarà bianco, per con-
trollare abbiamo estratto un fagiolo, l’abbiamo osservato ed è effettivamente bian-
co.
Che cosa possiamo concludere? In questo caso, dal punto di vista deduttivo,
nulla, e in particolare non possiamo concludere che T è vera. Se guardiamo lo
schema della regola modus ponens riportata sopra, vediamo infatti che la forma
dell’inferenza non è questa. “Se T allora p, e p, dunque T” non esemplifica la regola
del modus ponens, che sarebbe invece “Se T allora p, e T, dunque P”. E nemmeno
del modus tollens. Cosa significa? Non sorprendentemente, che trovare una con-
ferma dell’ipotesi non basta a stabilire con certezza deduttiva che l’ipotesi è vera,
ma fornisce solo una ragione induttiva in più per tenerla in piedi fino al prossimo
esperimento: il controllo, se positivo, mostra dal punto di vista logico solo che non
abbiamo verificato che T sia falsa.
Supponiamo ora invece che, sempre partendo da T--> p, abbiamo effettuato la
nostra osservazione o esperimento di controllo, riscontrando che non si è verificato
quello che la teoria prevedeva. Abbiamo cioè
Prima premessa: T--> p
Seconda premessa: -p
Che cosa possiamo concludere? Se riguardiamo le regole formali per la dedu-
zione, vediamo che questa volta ce n’è una che fa al caso nostro: da queste due
premesse possiamo applicare il modus tollens, e concludere -T, compiendo un’in-
ferenza valida. Abbiamo così falsificato la nostra ipotesi e abbiamo tratto una con-
clusione certa e necessariamente vera, se lo sono le premesse.
Abbiamo dunque individuato il secondo ruolo della deduzione nel metodo
scientifico, nel controllo delle ipotesi tramite falsificazione. Come ha notato Pop-
per, la falsificazione e la conferma sono asimmetriche: se controllo la mia ipotesi
trovando che una delle sue conseguenze (già individuate per deduzione) non si
verifica, posso concludere deduttivamente, dal punto di vista logico, che l’ipotesi
è falsa, con tutta la certezza che mi dà la regola formale del modus tollens. Diversa-
mente, se controllo la mia ipotesi trovando che una delle sue conseguenze dedut-
tive si verifica, non posso concludere deduttivamente nulla. Ho solo accumulato
altro supporto induttivo e l’ipotesi rimane in circolazione, per essere sottoposta ad
altri controlli e confrontata con altra evidenza che può venire alla luce. L’asimme-
tria si vede nei numeri: un solo fagiolo nero falsifica l’ipotesi che tutti i fagioli del
barattolo sono bianchi, mentre cinquanta estrazioni di fagioli bianchi non permet-
tono nessuna conclusione certa.
Popper ha sostenuto che il metodo scientifico non sia altro che questo: inventare
un’ipotesi (congettura), dedurre previsioni da sottoporre a tentativi di falsificazio-
ne (confutazioni), e ancora dedurre da questo che l’ipotesi è falsa, se così è, quindi
ricominciare, cercando sempre di concepire “esperimenti cruciali”, cioè controlli
delle conseguenze di un’ipotesi che possano, per così dire, inchiodare la realtà a
un sì o a un no. Possiamo quindi capire perché Popper era convinto che, tutto som-
mato, l’induzione non sia così importante per il metodo scientifico, come abbiamo
ricordato nel capitolo precedente18.
In realtà, come ormai abbiamo imparato, una questione può essere concettual-
mente chiara e al contempo illuminare solo un aspetto della questione generale.
In questo senso, l’asimmetria della falsificazione rispetto alla verifica, per quanto
evidente, è come il problema dell’induzione di Hume: ci segnala un problema e ci
invita alla cautela rispetto alla conferma induttiva, ma va inserita in un contesto
più ampio, in cui talvolta, di fatto, sono più rilevanti altri aspetti. Prima di compli-
care le cose in questo senso – il Capitolo 3 e il capitolo 4 mostrano come si fa oggi
ad affrontare il problema della conferma induttiva con la metodologia della ricerca
– vediamo il terzo ruolo della deduzione nelle fasi successive all’esperimento. Que-
sta forma di ragionamento è stata chiamata “deduzione di Holmes”, in omaggio al
celebre investigatore Sherlock Holmes, protagonista delle storie di Arthur Conan
Doyle, che diceva “elimina l’impossibile e quello che resta, per quanto improbabi-
le, deve essere la verità”19. Ecco come funziona.
a seconda del giorno di ammissione. Le due cliniche servono anche per l’istruzione
dei giovani medici e ostetriche: per la divisione vigente all’epoca tra allievi maschi
e femmine, i medici fanno pratica solo nella prima clinica e le ostetriche solo nel-
la seconda. A quei tempi la febbre puerperale è uno dei maggiori rischi associati
al parto. Si tratta di una malattia quasi sempre mortale che si sviluppa nelle sei
settimane successive al parto. Quando Semmelweis comincia il suo lavoro come
assistente, la mortalità per febbre puerperale è del 9.92% dei ricoveri per la prima
clinica e del 3,88% per la seconda (i dati si riferiscono ai cinque anni precedenti).
Nei suoi diari, poi confluiti in un voluminoso trattato20, Semmelweis scrive di voler
capire il perché di questa differenza.
La prima ipotesi che considera è suggerita dal paradigma medico dominante
all’epoca: viene tratta della teoria del miasma, secondo cui le malattie sono causata
dall’aria maleodorante originata da acqua putrida e sostanze marce. La teoria ha in
effetti un buon successo anche predittivo in quegli anni: migliorando le condizioni
igieniche dei corsi d’acqua e degli scarichi nelle strade, negli edifici e in particolare
negli ospedali, si riducono i focolai di malattia. Semmelweis ragiona dunque così:
se la febbre puerperale ha origine miasmatica, allora un tasso di mortalità superio-
re nella prima clinica sarà dovuto a una peggiore atmosfera (odore, pulizia). Pro-
cede dunque al controllo osservativo, ma ispezionando con cura i locali delle due
cliniche, non nota alcuna differenza. La prima ipotesi è quindi falsificata.
La seconda ipotesi è simile alla prima: il sovraffollamento delle pazienti ri-
coverate causa la differenza in mortalità. Siamo sempre nell’ambito della teoria
miasmatica: secondo il paradigma dominante dell’epoca anche il sovraffollamento
contribuisce a rendere malsana l’aria e quindi a favorire le malattie. Anche qui
Semmelweis controlla tramite osservazione e scopre invece che negli ultimi anni la
prima clinica è meno affollata della seconda, perché si è sparsa la voce delle tante
morti, e le pazienti cercano di non farsi ricoverare lì, se possono. Dunque, dopo
breve controllo, un’altra falsificazione.
Una terza ipotesi, diremo psicosomatica, viene presentata da una commissione
istituita dall’ospedale per spiegare la questione: le maniere rudi degli studenti stra-
nieri che trattano le pazienti nella prima clinica sono responsabili della differenza
nei casi di febbre puerperale, perché provocano umiliazione e disagio alle donne
ricoverate e le predispongono così alla malattia. A quell’epoca Vienna è il centro
dell’impero ed è meta di immigrazione da molti paesi vicini e lontani. La commis-
sione stessa provvede a controllare l’ipotesi intervenendo sulla situazione, ovvero
riducendo drasticamente il numero dei non austriaci presenti nella prima clinica.
malattia e morte nella prima clinica diminuiranno. Più tardi Semmelweis nota che
non solo i cadaveri, ma anche i tumori e altre condizioni dei pazienti possono con-
taminare le mani dei medici. Non senza qualche difficoltà data dal doversi imporre
nonostante la propria posizione accademica bassa, l’assistente ungherese imple-
menta quindi, dal maggio 1847, la pratica dell’igiene delle mani nella prima clinica
- ma anche nella seconda, con quello che possiamo comprendere intuitivamente
come un errore dal punto di vista sperimentale, ma non dal punto di vista etico.
I risultati sono eclatanti. Nel 1848 la mortalità per febbre puerperale nella prima
clinica è dell’1,27% e nella seconda dell 1,3%.
La storia di Semmelweis mostra molti aspetti del metodo sui quali ci siamo sof-
fermati finora: l’ideazione di ipotesi a partire da un problema, la deduzione delle
previsioni, la funzione del controllo osservativo-sperimentale e la falsificazione,
la deduzione holmesiana che permette di concludere deduttivamente che resta in
piedi un’ipotesi sola, per quanto assurda, e infine il ruolo del paradigma, cioè delle
teorie e dei metodi condivisi in un certo periodo storico, nella formazione e sele-
zione delle ipotesi esplicative.
Questa però non è una storia a lieto fine per il suo protagonista. Semmelweis è
l’autore di un trattato troppo lungo, in cui critica aspramente i colleghi più anziani
e rispettati, non è particolarmente socievole o simpatico, è sostenitore di un’ipotesi
che non si accorda con la teoria del paradigma dominante, che è quella miasmatica,
è alla fine uno che ha trovato che i medici, sia pure senza volerlo, sono causa indi-
retta di malattia e morte, ed è inoltre ungherese, figlio di un droghiere, e quanto a
carriera universitaria, non particolarmente precoce. Per tutte queste ragioni viene
respinto al concorso per la cattedra, poi ritenta e finalmente riesce, ma si sente umi-
liato e poco considerato all’Ospedale Generale d Vienna. Torna quindi a Budapest,
dove muore a 47 anni, alcolizzato e probabilmente affetto da Alzheimer precoce.
Un piccolo libro dello scrittore francese Louis-Ferdinand Céline, del 1975, sottoli-
nea questo aspetto di Semmelweis come eroe incompreso e maledetto22.
NOTE DI CHIUSURA
1 Galilei, G (1970). Discorso sopra i massimi sistemi. Torino: Einaudi, 252, citato in Lau-
disa, F. e Datteri, E. (2012).
2 Su questa interpretazione della rivoluzione scientifica rimando di nuovo a Laudisa, F.
e Datteri, E. (2012), cap. 1.
3 Newton, I. (1997) Opere, a cura di Alberto Pala, vol. 1, Principi matematici della filoso-
fia naturale, Torino, UTET, 801-802
4 Bacone, F. (1975) [1620] Scritti filosofici. Torino: UTET, 607-608, citato in Castellani, E. e
Morganti, M. (2019) La filosofia della scienza. Bologna: il Mulino, 54.
5 Un quadro sintetico del problema del metodo, breve storia e dibattito attuale in inglese
si trova in Andersen, H. and Hepburn, B. (2020) Scientific Method. The Stanford Encyclopedia
of Philosophy (Winter 2020 Edition), Edward N. Zalta (ed.), URL = <https://plato.stanford.
edu/archives/win2020/entries/scientific-method/>. Per un’introduzione filosofica in italiano
rimando ai capitoli 1-4 di Ladyman, J. (2014) Filosofia della scienza. Roma: Carocci.
6 Per induzione, abduzione e deduzione rimando a Coliva. A. e Lalumera, E. Pensare.
Leggi ed errori del ragionamento. Roma: Carocci 2006.
7 Questa versione della storia del tacchino è in Chalmers, A. (1982) What is this thing Cal-
led Science. Milton Kynes: Open University Press, 14
8 Mill, J. S. (1869). A System of Logic, Ratiocinative and Inductive: Being a Connected View
of the Princilples of Evidence and the Methods of Scientific Investigation. London: Harper and
brothers, I, 6.
9 Mill, J. S. (1869). A System of Logic, Ratiocinative and Inductive: Being a Connected View
of the Princilples of Evidence and the Methods of Scientific Investigation. London: Harper and
brothers, III, VIII, p. 539.
10 Popper, K. R (1972) [1953]. Congetture e confutazioni: lo sviluppo della conoscenza scientifi-
ca. Bologna: il Mulino.
11 Popper, K. R. (1989) Logica della ricerca e società aperta, Antologia a cura di D. Antiseri.
Brescia: La Scuola. 36-37
12 Questa ricostruzione è tratta da Miner, J., & Hoffhines, A. (2007). The discovery of aspi-
rin's antithrombotic effects. Texas Heart Institute Journal, 34(2), 179-186.
13 Craven, L. L. (1950). Coronary thrombosis can be prevented. Journal of insurance medici-
ne 5(4), 47.
14 Craven, L. L. (1953). Experiences with aspirin (acetylsalicylic acid) in the nonspecific
prophylaxis of coronary thrombosis. Mississippi Valley Medical Journal 75: 38–44.
15 Questa ricostruzione si basa su Connor, S. and Kingman, S. (1989). The Search for the
Virus. Harmondsworth: Penguin Books.
16 Centers for Disease Control and Prevention (1981) Morbidity and Mortality Weekly Re-
port June 5, 30 (21), 1-3.
17 Gallo, R. C., & Montagnier, L. (2003). The discovery of HIV as the cause of AIDS. New
England Journal of Medicine, 349(24), 2283-2285.
18 Popper, K. R. (1970) [1964]. Logica della scoperta scientifica. Torino: Einaudi.
19 Questa caratterizzazione viene da Bird, A. (2010). Eliminative abduction: examples
from medicine. Studies in History and Philosophy of Science Part A, 41(4), 345-352.
20 Semmelweis, I. P. (1861). Die aetiologie, der begriff und die prophylaxis des kindbett-
fiebers. Wien: Hartleben. Ci sono molte ricostruzioni della storia di Semmelweis e la febbre
puerperale. Come campione del metodo scientifico è stato descritto dal neopositivista Hem-
pel in Hempel, C. G. (1965) Philosophy of natural science. Prentice Hall: Englewood Cliffs.
Per una lettura in termini di paradigmi, Gillies, D. (2005). Hempelian and Kuhnian appro-
aches in the philosophy of medicine: the Semmelweis case. Studies in history and philosophy
of science part C: Studies in history and philosophy of biological and biomedical sciences, 36(1),
159-181.
21 Le citazioni di Semmelweis in italiano sono tratte dalle pagg. 38-41 di Antiseri, D.,
Scandellari, C., & Federspil, G. (2003). Epistemologia, clinica medica e la questione delle
medicine eretiche. Cosenza: Rubbettino Editore.
22 Céline, L. F. (2020). Il dottor Semmelweis. Torino: Adelphi Edizioni.
23 Ne parleremo nel Capitolo 3 e nel Capitolo 4.
24 Kuhn, T.S. (1980) Logica della scoperta o psicologia della ricerca? In Giorello, G. (a cura
di) Critica e crescita della conoscenza. Milano: Feltrinelli, p. 83.
25 L’analogia è di Boem, F. (2020) Scientific Protocols as Recipes. Humana Mente 13 (38),
281-299
26 Ad esempio Boden, M. A. (2004) The Creative Mind: Myths and Mechanisms. London:
Routledge
Procedure di
misura
Procedure di
Teorica Sviluppo di metodi imaging
Sviluppo e
Studi su animali valutazione di test
Di base
Studi su cellule
Applicata
Sequenziamento ed
editing genetico
Biochimica
Fase I
Fase II
Sperimentale Trial farmacologico
Fase III
Studio di terapia
Fase IV
Primaria Clinica Studio prognostico
Report di
singolo caso
Report di singolo
Descrittiva caso
Studio ecologico
Epidemiologica Studio di
caso-controllo
Studio di coorte
Osservazionale
Studio trasversale
esempio intendo la qualità della vita in senso abbastanza ampio, allora un difetto
estetico al setto nasale è un problema di salute. Ma se intendo anche la questione
dell’aspettativa di vita in modo abbastanza ampio, allora la povertà è un problema
di salute. Come decidere? Apparentemente i concetti di salute, qualità di vita e
normalità mettono in gioco i valori (quello che giudichiamo buono e desiderabile)
di una società, non solo i fenomeni relativi al corpo umano. Dobbiamo qui necessa-
riamente passare oltre – ma lascio un segnale di allerta per un problema filosofico
aperto, e ne riparleremo in parte nel §4.83.
Primaria o secondaria. La ricerca primaria produce nuova conoscenza (racco-
glie dati, formula o testa ipotesi), mentre la ricerca secondaria elabora o valuta i
risultati della ricerca primaria. A questa categoria appartengono le linee guida e
i lavori di review e meta-analisi. Lungi dall’essere poco rilevanti, nell’ambito del
paradigma dell’Evidence-Based Medicine (EBM), che approfondiremo nel §4.6, le
meta-analisi di sono considerate oggi il migliore tipo di evidenza per le decisioni
cliniche e di salute pubblica, e le linee guida hanno un ruolo chiave per connettere
la ricerca con la pratica clinica (oltre ad avere valore medico legale).
Applicata o di base. Passiamo alle macro-categorie del livello successivo nel
grafico di Figura 1. La ricerca applicata (qui indicata come epidemiologica o clini-
ca) è diretta a fornire soluzioni a problemi che riguardano direttamente la salute
delle persone e delle popolazioni (ad esempio: la dieta può influenzare il rischio di
melanoma?). La ricerca di base o di laboratorio si pone invece domande che mira-
no a costruire modelli e teorie che spiegano i fenomeni, indipendentemente dalla
soluzione di problemi pratici (ad esempio: come funziona un certo processo nello
sviluppo cardiovascolare della Drosophila?). Comprende esperimenti su animali,
cellule, studi biochimici e le loro modellizzazioni matematiche, ma anche studi
per sviluppare metodiche sperimentali e di misurazione. Contingentemente – ma
è importante ricordarlo - tra la ricerca di base e quella applicata nelle discipline
biomediche ci sono differenze di tempo e di risorse. Di solito la ricerca applicata,
soprattutto clinica, ha tempi definiti tra la domanda e la risposta, quindi tra l’inizio
di un progetto e la pubblicazione, e può beneficiare di maggiori finanziamenti e
risorse. La ricerca di base può non dare risultati pubblicabili per anni e general-
mente è meno finanziata, ma dal punto di vista della costruzione della conoscenza
è indispensabile alla ricerca applicata. Ci sono casi eclatanti in questo senso. La
domanda di ricerca di base di Marie e Pierre Curie, “che cosa sono i raggi emanati
dall’uranio e sono prodotti anche da altri elementi?” (fisico-chimica, ma rilevante
per la medicina, a posteriori) ha portato alla scoperta del polonio e del radio, e
all’applicazione della radioattività a campi pratici diversi che vanno dalla diagnosi
e cura delle malattie alla costruzione di armi4.
Traslazionale. In realtà di solito i casi sono meno eclatanti di quello di Ma-
rie e Pierre Curie e si ritiene necessario favorire il rapporto tra ricerca di base ed
applicata e, all’interno della ricerca applicata, tra studi clinici ed epidemiologici,
adottando approcci detti traslazionali. L’idea è quella di impostare la ricerca di
base con concetti e domande che la rendano più facilmente applicabile alla clinica,
e la ricerca clinica con concetti e domande che ne accrescano l’impatto sulla salute
pubblica, favorendo poi il feedback tra i livelli. Un esempio di ricerca traslazionale
dal laboratorio alla clinica: studi in ingegneria dei materiali sullo sviluppo di mi-
crosfere in grado di veicolare piccole quantità di un farmaco contro il glaucoma,
che possono essere iniettate una tantum e quindi evitare gli svantaggi legati a una
somministrazione frequente5. Inoltre, tutta la ricerca preclinica dei trial farmaco-
logici, di cui parleremo nel §4.5, è ricerca traslazionale. Per semplicità le ricerche
di medicina traslazionale non sono rappresentate nel grafico della Figura 1, ma
occorre tenerle presente perché sono oggi molto favorite dalle agenzie istituzionali
che finanziano la ricerca.
Clinica o epidemiologica. Il nostro grafico di Figura 1 distingue, all’interno
della ricerca applicata, quella clinica da quella epidemiologica. Le definizioni dei
due ambiti possono chiarire il senso della distinzione. L’epidemiologia si occupa
di problemi che riguardano la distribuzione (frequenza, pattern) e le determinanti
(cause, fattori di rischio) di condizioni pertinenti alla salute (non solo malattie)
in una popolazione. Domande di ricerca, ad esempio, possono essere: qual è la
variazione stagionale dell’influenza in Italia? Com’è cambiata tra il 1970 e il 2020
negli Stati Uniti la relazione tra tasso di mortalità infantile ed etnia della madre?
L’oggetto di studio è la comunità e gli individui sono considerati collettivamente6.
La ricerca clinica strettamente intesa si pone domande sui modi per migliorare le
condizioni pertinenti alla salute degli individui (farmaci, terapie non farmacolo-
giche, interventi chirurgici, diagnosi, interventi di prevenzione). Tuttavia, come
si accennato, i due ambiti si sovrappongono in parte. Uno studio per testare gli
effetti dell’aspirina per la prevenzione dell’infarto cardiaco – ricordiamo la storia
del dottor Craven nel capitolo 2 – è di epidemiologia clinica. Vedremo che dal pun-
to di vista del disegno sperimentale, i tipi di studi principali nella ricerca clinica e
nella ricerca epidemiologica sono gli stessi. La ricerca clinica è anche contigua alla
ricerca di base: gli studi che nel grafico sono indicati come trial farmacologici di
Fase I sono studi di laboratorio su animali o tessuti, quindi condividono le stesse
potesi sia significativa con p <0.05 oppure p<0.01, che indicano rispettivamente che
l’ipotesi riscontrato potrebbe essere dovuto al caso meno di 1 volta su 20, e meno
di 1 volta su 100. Le ipotesi di associazione tra variabili negli studi osservativi sono
poi in termini di grandezze quali il rischio relativo e l’odds ratio, mentre le misure di
impatto negli studi sperimentali sono il rischio differenziale e la frazione di rischio
attribuibile. Questi valori ci danno la misura dell’effetto di una variabile sull’altra.
Come si è detto all’inizio del capitolo, le misure adatte a ciascun disegno sperimen-
tale, così come le analisi, sono codificate, e solo in parte dipendono da una scelta
del ricercatore.
In uno studio quantitativo, infine, anche la numerosità del campione su cui si
effettua lo studio è determinabile con metodologie statistiche, altrettanto vincolate
dal disegno sperimentale. In termini molto generali, se pensiamo che la popolazio-
ne su cui stiamo effettuando l’indagine sia molto variabile e vogliamo risultati mol-
to precisi, dovremo aumentare la numerosità del nostro campione. La precisione
del risultato è data da un valore importante quando si legge e si valuta uno studio,
l’intervallo di confidenza, che indica l’intervallo di valori entro i quali stimiamo
che si collochi il valore della popolazione. Un intervallo più piccolo indica maggior
precisione.
Non ci occuperemo di statistica in questo libro, ma faremo riferimento a queste
nozioni nei prossimi capitoli solo nella misura in cui servono per capire meglio la
differenza fra i tipi di studi8.
In uno studio qualitativo si raccolgono invece informazioni sul contesto in cui
il fenomeno avviene, oppure sui significati e le esperienze delle persone coinvolte,
mediante ad esempio interviste, analisi di testi oppure osservazione sul campo.
Gli aspetti rilevanti non sono necessariamente operazionalizzati in modo da essere
misurabili, il campione può avere una numerosità non vincolata da regole mate-
matiche e non si compie un’analisi statistica, ma un’interpretazione dei risultati da
parte del ricercatore, in base a una teoria di sfondo che orienta le interpretazioni
(etnografia, fenomenologia, semiotica o altro). Gli studi qualitativi nella ricerca cli-
nica ed epidemiologica vengono usati per formare ipotesi, ad esempio per capire
perché i pazienti non fanno riabilitazione dopo un intervento ortopedico, oppu-
re come avviene, in un reparto ospedaliero, l’accordo sulle procedure da seguire
quando non si seguono le linee guida. Hanno impiego anche come complemento
alla ricerca quantitativa, è il caso delle ricerche di medicina narrativa o di psichia-
tria fenomenologica. Spesso questi studi non sono condotti da medici, ma da psico-
logi, antropologi o altre figure professionali, e costituiscono una piccola parte degli
Libro Lalumera.indb 72
Intervento?
Gruppo di Gruppo di
controllo? confronto?
Trial sì no Trial
controllato controllato non Studio Case report
randomizzato randomizzato trasversale
Direzione?
Esposizione ← Esito
Studio
caso-controllo
Medicina e metodo sperimentale. Un’introduzione filosofica
16/02/2021 11:26:53
Capitolo terzo - Gli studi osservazionali 73
no misurare (possono essere uno o più). Si seguono o, come si dice spesso, si “sor-
vegliano” entrambi i gruppi per un tempo prestabilito, detto follow-up, registran-
do alla fine la percentuale o il numero di esiti per ciascun gruppo. Se è maggiore
nel gruppo degli esposti, l’ipotesi che l’esposizione sia associata all’esito può essere
confermata (o più prudentemente, non falsificata).
Alcune nozioni tecniche serviranno a capire meglio10. La misura di associazione
che si usa di solito in uno studio analitico prospettico è il rischio relativo, definito
come rapporto tra rischi assoluti. Il rischio assoluto, o incidenza, è il rapporto tra
esiti e numero degli esposti, mentre la prevalenza è il rapporto tra i casi e la popola-
zione in generale. Se il rischio relativo della nostra coorte è maggiore di quello del
gruppo di controllo, allora l’associazione tra esito ed esposizione ha buone chance
di essere confermata. Dal punto di vista statistico occorre anche considerare l’in-
tervallo di confidenza. Questa misura ci dà una risposta matematica alla domanda
intuitiva “quanto è rappresentativo il nostro campione rispetto alla popolazione
generale?”– domanda basilare da porre ogni volta che studiamo un fenomeno non
in tutta la popolazione ma usando un campione, ovvero sempre, quando ragionia-
mo in modo induttivo. Qui, tuttavia, non ritorneremo più sulla questione dell’in-
tervallo di confidenza, perché è comune a tutte le inferenze induttive, e il nostro
interesse è qui vedere le differenze tra i tipi di studi.
Esempio. Torniamo allo studio di coorte prospettico. Ci sono studi con questo
disegno che durano per decenni e hanno dato un contributo molto rilevante alla
conoscenza medica. Un esempio famoso – pilastro della storia dell’epidemiologia -
è il British Male Doctors Study, ideato da Richard Doll e da Austin Bradford Hill, due
tra i padri dell’epidemiologia, e iniziato nel 1951 e terminato nel 2001. Lo studio
si situa in un contesto storico in cui il consumo di sigarette è diventato diffusissi-
mo, soprattutto tra gli uomini. Nel 1940 in Gran Bretagna il tumore al polmone è
la prima causa di morte, ma i rischi del fumo sono ancora sottovalutati. Vengono
effettuati alcuni studi di caso-controllo in Europa e Nord America su malati di
tumore al polmone (li vedremo tra poco) e il fumo di sigaretta comincia a essere
indicato come un possibile fattore di rischio. Doll e il suo gruppo decidono quindi
di intraprendere questo lungo studio di coorte sui medici britannici, inviando un
questionario sul consumo di sigarette a tutti i medici inglesi registrati all’albo: di
59600, 34494 vengono restituiti completi, successivamente però le donne vengono
escluse perché il campione è troppo poco numeroso. Altri questionari vengono
inviati nel 1957, 1966, 1971, 1978, 1991, 1998 e 2001 per registrare i cambiamenti di
abitudine rispetto al fumo, e da quello del 1978 in poi si chiede ai medici anche di
analitico, è fondamentale quindi che il gruppo di confronto sia il più possibile si-
mile al gruppo degli esposti: idealmente i due gruppi dovrebbero differire solo per
l’esposizione. Questa regola metodologica di base era già tra i metodi per miglio-
rare le inferenze induttive sistematizzati da John Stuart Mill attorno al 1860, come
abbiamo visto nel §2.2.
Facciamo un esempio. Se la nostra ipotesi è che il fumo in gravidanza sia asso-
ciato con il parto pretermine, potremmo considerare come coorte le donne parte-
cipanti ai corsi pre-parto organizzati dall’ospedale in cui lavoriamo, dividerle in
fumatrici e non fumatrici, e osservarle per sei mesi fino al parto: se sono avvenuti
più parti pretermine nel gruppo delle fumatrici, l’ipotesi riceve sostegno. In ter-
mini epidemiologici, il fumo in gravidanza aumenta il rischio relativo di parto
prematuro, che è appunto il rapporto tra i valori di incidenza della coorte e del
controllo. Ma supponiamo ora che il gruppo delle fumatrici abbia anche un’altra
caratteristica che lo distingue dall’altro gruppo, cioè il consumo abituale di alcol.
Questa variabile è un confondimento perché sappiamo essere associata all’espo-
sizione, il fumo (ci sono studi che mostrano che le due abitudini sono correlate) e
può esserlo anche all’esito, cioè il parto pretermine.
Come si può evitare questo tipo di confondimento, nel disegno sperimentale?
Una possibile strategia è il matching (corrispondenza) tra gruppo di controllo e
gruppo degli esposti: in questo caso assicurandosi, prima di costituire i gruppi, che
anche tra le donne non esposte ci siano consumatrici abituali di alcol. In uno studio
con una coorte relativamente piccola, questo è fattibile. Molto meno nel caso dei
grandi studi di follow-up, come quello dei British Doctors. Qui viene in aiuto la sta-
tistica: esiste la possibilità di eliminare o ridurre l’effetto del confondimento dopo
avere già raccolto di dati, nella fase di analisi.
Un punto filosofico sui confondimenti, prima di passare ai bias. Per ogni tipo
di studio esistono metodi per minimizzarli, non esistono però regole per trovarli.
Nell’esempio: come facciamo a sapere che il consumo di alcol è un possibile con-
fondimento nel caso dell’associazione tra fumo e parto prematuro? Non c’è altro
modo se non basarsi sulla propria conoscenza scientifica del problema (come ve-
dremo nel §4.7). La randomizzazione, che vedremo nel Capitolo 4, è un tentativo
di evitare anche i confondimenti che non ci aspettiamo.
Il bias si può caratterizzare come un errore sistematico nello studio. Un errore
sistematico, intuitivamente, è quello che compio se uso una bilancia che pesa sem-
pre un chilo in più: rende le mie misurazioni consistenti ma scorrette, e replicabili
da me, ma non da altri con una bilancia diversa. Qui assumiamo che i bias siano
involontari da parte del ricercatore - se non lo sono si parla di frode. Ogni disegno
sperimentale ha bias tipici per come è strutturato. Esistono diversi modi di cata-
logare i bias: in un importante lavoro del 1979 David Sackett, uno dei promotori
della Evidence-Based Medicine, ne ha individuati 35 e ha proposto l’istituzione di un
elenco a disposizione di tutti che venga aggiornato al bisogno15.
Tutte le fasi e i soggetti coinvolti in uno studio sono potenziali fonti di bias: lo
sperimentatore, i dati, gli strumenti e i soggetti. Possiamo dire che capire quale bias e
quale confondimento vada considerato è un processo di tipo abduttivo che fa parte
della logica del metodo scientifico – ma come sappiamo, non ci sono regole per com-
piere buone abduzioni. In pratica, c’è consenso su alcuni bias principali o tipici per
tipo di studio. Il primo è il bias di auto-selezione: se il reclutamento dei soggetti è
volontario, può darsi che chi partecipa abbia caratteristiche sistematicamente diver-
se da quelle di chi invece decide di non partecipare. Immaginiamo ad esempio che in
uno studio osservazionale in cui una delle variabili da misurare è l’altezza degli ado-
lescenti, i ragazzini più preoccupati di essere troppo bassi rispetto alla loro età non
vogliano partecipare, creando così un gruppo di soggetti osservati non rappresenta-
tivo della popolazione. Il bias di selezione di dà invece quando i ricercatori scelgono
un gruppo di esposti che ha caratteristiche che possono influire sull’esito, ad esem-
pio sono pazienti troppo gravi, o individui troppo sani, eccetera. Infine, negli studi
osservazionali il ricercatore non determina l’assegnazione dei soggetti al gruppo di
esposizione o al gruppo di controllo (se c’è), ma si limita a osservare la relazione
tra esposizione ed esito. Il ricercatore sa quindi, di ogni soggetto se è esposto o non
esposto, e questo può influenzare sistematicamente il modo in cui lo “osserva”, cioè
raccoglie i dati, ad esempio involontariamente favorendo l’ipotesi da testare, e que-
sto vale anche per chi si occupa dell’analisi statistica. Anche il soggetto sa di essere
monitorato e quindi si possono verificare bias di performance – pensiamo a un grup-
po di soggetti studiati per gli effetti dell’esercizio fisico sulla riduzione dell’indice di
massa corporea, che decidono di fare tre volte di più dell’allenamento assegnato per
soddisfare le aspettative dei ricercatori. Questi sono bias di non-blinding: possono
esserci appunto quando l’assegnazione all’esposizione non è nascosta a nessuno, e
questo è tipico degli studi osservazionali. Vedremo ancora il blinding nel §4.2.
Lo specifico disegno sperimentale di ciascuno, poi, può esporsi a bias partico-
lari. Vediamo quelli dello studio di coorte prospettico, senza pretendere di fornire
una lista esaustiva16.
Bias di incidenza-prevalenza. Gli studi di coorte possono durare molto tempo.
Per provare a testare alcune ipotesi, come l’associazione tra fattori di rischio e mor-
talità per tumore, ma anche esempio per AIDS, i cui i sintomi appaiono molto dopo
l’infezione, il follow-up deve essere necessariamente lungo. Se lo studio di Doll si
fosse fermato alla prima valutazione degli esiti, nel 1964, i risultati non sarebbero
stati così rilevanti. Il disegno di uno studio di questo tipo non permette in alcun
modo di accorciare i tempi, perché la durata del follow up è essenziale. Con la du-
rata del follow-up aumenta la possibilità di perdere soggetti durante il periodo di
sorveglianza. Perdere soggetti può alterare l’equilibrio tra il gruppo degli esposti
e quello di confronto, quindi la misura dell’incidenza e della prevalenza dell’esito.
Può capitare così di non confermare l’associazione tra esposizione ed esito perché
il gruppo di controllo è diventato troppo piccolo rispetto all’altro, o viceversa di
confermarla perché abbiamo perso troppi soggetti esposti, ed entrambe sarebbero
conclusioni sbagliate. Ricordiamo che il rischio relativo, che misura l’associazione
tra esposizione ed esito, è un rapporto tra rischi assoluti o incidenze, e il rischio
assoluto è inversamente proporzionale alla numerosità del gruppo.
Da questo deriva l’opportunità di disporre di una coorte in cui possiamo pre-
vedere di perdere pochi elementi. Nell’esempio dei British Doctors, i medici sono
una buona coorte perché si presume saranno collaborativi e interessati al progetto
e continueranno a fornire le informazioni richieste. Inoltre, chi muore durante lo
studio non è un soggetto perso, perché la mortalità è uno degli esiti monitorati.
Un caso particolare della perdita di soggetti è il cambio di stato di un soggetto, da
esposto o non esposto o viceversa. Anche per questo è necessario aggiornare i dati
di esposizione dei soggetti durante il follow-up, se è molto lungo: i non ammalati si
sono ammalati? I non fumatori sono diventati fumatori? Se questo non viene fatto,
e ci sono cambiamenti di stato, di nuovo si altera il rapporto tra i gruppi.
Bias di classificazione. Abbiamo già ricordato che uno studio analitico deve
avere un gruppo di confronto che idealmente differisce dal gruppo degli esposti
solo per l’esposizione. Il problema è che talvolta i non esposti vengono classificati
come esposti, o viceversa. Ad esempio, in uno studio sull’effetto della lavorazione
di nichel sul tumore al polmone, potremmo sbagliare nel classificare come non
esposti gli addetti alla logistica della fabbrica, mentre in realtà sono esposti come
gli addetti alla lavorazione, e quindi inserirli nel gruppo di controllo. In questo
caso è probabile che il rischio relativo dei due gruppi risulterà minore e l’ipotesi di
associazione non riceverà supporto.
Un problema che invece non è tipico dello studio di coorte prospettico è quello
della qualità dei dati: l’assenza di tale bias di informazione diventa un punto di
forza per questo tipo di studio.
può essere usato come dato sulla popolazione in generale. Non bisogna confonde-
re l’odds ratio con il rischio relativo nel comunicare o leggere i risultati di uno stu-
dio, perché il primo risulta sempre più alto del secondo. Si è dimostrato comunque
che il valore di odds ratio approssima quello di rischio relativo quando i numeri
sono piccoli17.
Esempio. Illustriamo in breve uno studio epidemiologico semi-fittizio che mo-
stra in modo evidente il disegno sperimentale del caso-controllo18.
Tra il 25 e il 27 febbraio del 2004 si registrano sei casi di salmonella (HAV) nella
piccola città di Marshfield nel Massachusetts. Nel 2003 non c’era stato nessun caso
e nel 2002 uno solo: si tratta quindi di un fatto insolito. Vengono quindi cercati altri
casi e se ne trovano 19 disposti a partecipare allo studio. I ricercatori li intervistano
e i risultati qualitativi suggeriscono di testare un’ipotesi di esposizione a cibo conta-
minato in alcuni ristoranti della città. Si procede quindi a progettare uno studio di
caso-controllo: al 19 casi di malati vengono associati 38 controlli sani corrispondenti
per età, genere e quartiere di residenza e si procede a verificare le possibili esposizioni
di cibo contaminato al ristorante nei due mesi precedenti. I dati mostrano che 10
dei casi e 9 dei controlli hanno mangiato da Papà Gino: l’odds ratio è di 1.1, troppo
basso per essere significativo. Invece, 18 tra i casi e 7 tra i controlli hanno mangiato
da Ron’s Grill: qui l’odds ratio è molto alto, 75. Dunque, i casi di salmonellosi han-
no un’alta probabilità di avere mangiato da Ron’s Grill. La conclusione può essere
utilizzata per impostare un altro studio che verifichi che c’è una fonte di infezione
da HAV nel ristorante, ad esempio un semplice test diagnostico a tutti gli impiegati.
CONFONDIMENTI E BIAS
Il confondimento è un problema per gli studi di caso-controllo come per quel-
li di coorte prospettica. C’è sempre, in altri termini, la possibilità che i risultati
nascondano l’effetto di una variabile spuria – in questo caso, un’esposizione che
non avevamo considerato. Torniamo all’esempio del gruppo di casi di neonati con
enterocolite. Nel testare l’associazione con l’allattamento artificiale un possibile
confondimento può essere l’età gestazionale. È più probabile che i bambini nati
prematuramente siano allattati artificialmente, ma il fattore potrebbe essere di per
sé un rischio per l’enterocolite. Per eliminare un confondimento come questo oc-
corre selezionare appropriatamente i controlli in modo che corrispondano ai casi
rispetto al possibile fattore confondente, con diverse tecniche di matching che sono
dettagliate nei testi di metodologia e biostatistica19. Come abbiamo già notato, oc-
corre qui però già sapere o sospettare che cosa possa costituire un confondimento
per eliminarlo tramite matching.
La ragione per cui gli studi di caso-controllo sono tendenzialmente meno vali-
di di quelli prospettici è la presenza di alcuni bias strutturali. Vediamo solo i due
principali.
Bias di informazione. I dati in uno studio di caso-controllo sono storici: ven-
gono dal passato dei casi e dei controlli. Non sempre si hanno a disposizione le
stesse operazionalizzazioni delle esposizioni che si vanno a indagare per i casi
e i controlli, ad esempio per i neonati ricoverati potremmo avere registrazioni
accurate delle modalità di nutrizione, mentre per i controlli, se non sono ricove-
rati, solo le risposte a un questionario rivolto alle madri. In generale i ricercatori
hanno meno possibilità di assicurare la qualità dei dati che vengono dal passato
o si riferiscono a eventi passati ricordati dai soggetti. Qui si potrebbe notare un
ulteriore bias di ricordo (recall): è frequente che i casi ricordino meglio o diversa-
mente dai controlli la loro storia rispetto alle esposizioni. Intuitivamente: se ho
mal di schiena è più facile per me riportare alla mente se ho sollevato pesi o se
ho cambiato sedia da lavoro, rispetto a chi non ha alcun fastidio. Naturalmente
la presenza o assenza di questi bias dipende anche dal modo in cui lo studio pia-
nifica di ottenere i dati: i questionari sollevano sempre difficoltà, anche se sono
molto economici e pratici.
Bias di selezione. Si ha, come abbiamo visto nel §3.3, quando si sceglie il grup-
po di controllo tra soggetti che sono già più o meno esposti al fattore di rischio. Un
esempio semplice quanto poco plausibile: nell’indagine sull’epidemia da salmo-
nellosi, scegliere i controlli tra i lavoratori dei ristoranti della città avrebbe falsato i
risultati: essendo sani, l’associazione non sarebbe stata trovata. Consideriamo que-
sto caso, più realistico:
si vuole condurre uno studio caso-controllo per studiare l’associazione fra infezione
da Chlamydia trachomatis e malattia infiammatoria pelvica (PID). Negli ambulatori
specializzati in malattie sessualmente trasmesse vengono individuati 50 casi di don-
ne con sintomi di PID. I controlli vengono selezionati fra le donne che afferiscono
agli ambulatori per lo screening periodico con Pap test. In questo caso è probabile
che la stima dell’associazione sia distorta, dal momento che i controlli sono selezio-
nati in un gruppo a minor rischio di esposizione. Le donne che si sottopongono allo
screening, infatti, appartengono generalmente a strati medio-alti della popolazione e
hanno meno frequentemente infezioni sessualmente trasmesse e, quindi, un rischio
inferiore di infezione da Chlamydia rispetto alle donne seguite nei centri delle malat-
tie sessualmente trasmesse.20
un gruppo di controllo, in questo caso il disegno sarà analitico – per questo, nel
grafico di Fig. 2 gli studi trasversali sono presenti in entrambe le categorie.
Dal punto di vista pratico, può accadere che si decida di intraprendere uno stu-
dio trasversale all’interno di una coorte già in uso per uno studio di follow-up – ad
esempio nella coorte dei British Male Doctors potremmo voler monitorare trasver-
salmente l’indice di massa corporea e il consumo di alcol e ottenere come risultato
la prevalenza del sovrappeso e l’ipotesi di una possibile associazione tra sovrappe-
so e consumo di alcol.
Già nel XIX si era noto che moltissimi dei pazienti con tumore ai testicoli erano
spazzacamini, e nel 1920 si era arrivati a stimare che l’incidenza della mortalità
per questo tumore tra gli spazzacamini fosse 200 volte più alta che in tutte le al-
tre categorie occupazionali. Possibile interpretare un’associazione così forte come
compatibile con il caso (ipotesi nulla) o come prodotta da una causa comune? Il se-
condo esempio è quello della mortalità per tumore al polmone tra i fumatori, anche
questa già attestata attorno al 1965 come notevolmente più alta rispetto alla popo-
lazione. Ipotizzare un’altra causa, ragiona Hill, significa cercarla in una condizione
così intimamente legata al fumo di sigaretta e alla quantità di sigarette che dovrebbe
essere individuabile facilmente. Se non la troviamo o non la riusciamo a inferire
razionalmente, credo che siamo autorizzati a rifiutare la vaga obiezione del critico in
poltrona “non lo puoi provare, quella condizione ci potrebbe essere”23.
Abbiamo visto nel §3.1 che, nell’approccio dominante, l’analisi statistica ci re-
stituisce il valore di significatività, il p-value, che si riferisce a quanto è probabile
che l’associazione testata sia casuale, partendo dai nostri dati. Nei due esempi la
significatività sarebbe così evidente da darci buone ragioni per eliminare l’ipotesi
nulla, cioè che non ci sia relazione tra essere uno spazzacamino e morire di tumore
ai testicoli, o tra fumare molto e morire di tumore al polmone. Tuttavia, resta da
notare che forza dell’associazione da sola non ci dice nulla sulla direzione dell’as-
sociazione, e le relazioni causali non sono simmetriche: se A è causa di B, B non è
causa di A. Ma il problema non si pone, direbbe Hill, perché la direzione è ovvia:
l’ipotesi che il tumore ai testicoli faccia diventare spazzacamini è ridicola. Tutta-
via – l’abbiamo già osservato - questo “ridicolo” viene dalla nostra conoscenza del
mondo biologico, non dalle basi di evidenza che lo studio presenta (dalla nostra
base induttiva), e in altri casi potrebbe non bastare.
2. Consistenza. Se un’ipotesi di associazione tra un’esposizione e un esito è
confermata da più studi, realizzati da diversi ricercatori in tempi e luoghi diver-
si, abbiamo una ragione in più per credere che si possa trattare di una relazione
causale. Questo secondo criterio di Hill coincide con il concetto contemporaneo di
replicabilità di un risultato. Ci sono diversi modi di caratterizzare precisamente la
replicabilità, ma per gli scopi di questo punto della nostra discussione è sufficiente
l’idea principale: un risultato replicato è un risultato migliore, perché cambiare
osservatori, soggetti nel campione e setting di osservazione contribuisce a ridurre i
bias di cui abbiamo parlato (di misurazione, di selezione, dell’osservatore). Inoltre,
con più studi per la stessa ipotesi si accrescono le dimensioni del campione rispet-
to alla popolazione di riferimento, e con questo potenzialmente la significatività:
diventa meno probabile che sia vera l’ipotesi nulla. Tuttavia, la consistenza del
risultato non elimina i possibili confondimenti, cioè che l’associazione sia dovuta
a un’altra condizione, non testata dallo studio: non cambiando la struttura logica
dell’esperimento, non cambia nemmeno la possibilità di incorrere in errori logici.
Anche per questo vedremo, nel capitolo 4, che gli studi osservativi vengono ritenu-
ti in generale meno adeguati a supportare risultati causali rispetto agli esperimenti
randomizzati.
3. Specificità. Se l’associazione tra E e H riguarda un esito o un’esposizione che
sono rari, particolari, o molto circoscritti – ad esempio, lavorare un certo metallo
con una certa tecnica, oppure usare un certo tipo di elmetto da bicicletta – abbiamo
un indizio in più per mettere da parte l’ipotesi nulla, secondo Hill. Questo crite-
rio in realtà non è particolarmente difendibile – dopotutto bias e confondimenti
sono indipendenti da quanto rara sia per noi una certa caratteristica del mondo,
ma dipendono dalle proprietà logiche dello studio. Si può tuttavia notare che con
esposizioni ed esiti precisamente specificati, aumenta la possibilità di soddisfare il
criterio di Consistenza, cioè che il risultato venga ottenuto anche da altri.
4. Ordine temporale. Si tratta di un criterio necessario per una relazione causa-
le: le cause devono precedere temporalmente gli effetti. Se ad esempio uno studio
osservazionale trasversale mostra una forte associazione tra consumo di droghe
ricreative e disoccupazione tra i giovani, non possiamo concludere che le droghe
causino la disoccupazione, né che lo stato di disoccupazione causi l’aumento di
consumo, perché non sappiamo se l’esposizione preceda temporalmente l’esito.
Anche nella ricerca di base non è sempre facile stabilire le relazioni temporali tra
i vari fattori e livelli che si misurano, e l’applicazione di questo criterio non è im-
mediata. Tuttavia, nel caso di studi sugli effetti di farmaci o situazioni di rischio,
che l’esposizione preceda l’effetto è una ragione in più per credere che non si tratti
di un’associazione spuria. Ecco cosa scriveva Ronald Fisher – figura storica della
statistica – a proposito dell’associazione tra fumo di sigarette e tumore al polmone,
interpretata in senso causale24:
La curiosa associazione con il cancro al polmone trovata in relazione all’abitudine
al fumo non porta facilmente la mente di alcuni di noi alla facile conclusione che i
prodotti della combustione, raggiungendo la superficie del bronco inducano, sep-
arriva alla stessa conclusione. Questo criterio è quello epistemicamente più forte:
ci dà la ragione migliore per credere che una certa associazione sia di natura cau-
sale. Tuttavia, questo dipende dalle proprietà epistemiche degli studi sperimentali
(in particolare, di quelli randomizzati e controllati), come vedremo nel Capitolo 4.
Non è quindi un criterio per valutare gli studi osservativi.
Concludendo: Distinguere con certezza le ipotesi di associazione da quelle
causali è molto difficile. Le varie misure di associazione, come rischio relativo e
odds-ratio, non ci forniscono alcuna guida, perché sono appunto misure di asso-
ciazione, non di causalità – sarebbe come chiedersi quale misura del peso dell’oro
(chilogrammo o libbra) ci informa del suo prezzo. I criteri di Hill sono un gruppo
misto di ragioni più o meno buone per rafforzare la credenza che l’ipotesi tro-
vata tramite uno studio osservazionale sia causale. Dei criteri di Hill nessuno è
necessario e congiuntamente non sono sufficienti. Il gruppo è misto perché Forza,
Gradiente biologico, Specificità e Ordine temporale fanno riferimento all’evidenza
fornita dallo studio stesso, mentre Consistenza, Analogia, Esperimento, Coerenza
e Plausibilità ci portano a considerare evidenza al di fuori, in altri studi e nella
conoscenza di sfondo. Dal punto di vista epistemico i criteri non sono in grado di
eliminare in modo sistematico la possibilità dell’ipotesi nulla, né che l’associazione
che stiamo valutando sia spuria perché c’è una causa comune o un confondimen-
to. Sono euristiche di riconoscimento molto fallibili, come nell’esempio del §1.8 i
miei criteri per riconoscere l’argento. Tuttavia, mentre i teorici dell’epidemiologia,
filosofi e non, ne hanno chiari i limiti, i criteri di Hill, per la loro comoda forma a
checklist, sono ancora molto usati nei manuali per gli studenti e ad essi è assegnata
la funzione impropria di distinguere le “vere cause” dalle “mere associazioni”28.
L’articolo originale di Hill del 1965 resta un classico di grande chiarezza esposi-
tiva e del tutto lucido rispetto agli aspetti epistemici finora considerati. Si conclude
con un understatement, che introduce un ulteriore tema di discussione, eccolo:
Chi sa, si chiede il poeta Robert Browning, che il mondo non finisca domani? Vero,
ma sulla base dell’evidenza disponibile molti di noi pendolari si preparano a prendere
domattina il treno delle 8.3029.
Il tema è quello del rapporto tra le ragioni per credere e le ragioni per agire.
Sebbene io non possa giustificare razionalmente la mia convinzione che domani
il mondo esisterà ancora (ricordate il tacchino e il giorno di Natale), ho sufficienti
ragioni per agire come se questa ipotesi fosse vera. Analogamente, le ragioni per
credere che una certa ipotesi di associazione attestano un nesso di causalità pos-
sono essere insufficienti, ma potremmo avere ragioni pratiche sufficienti per agire
sulla base di quell’ipotesi di associazione. Le ragioni per agire possono compren-
dere anche considerazioni etiche e pratiche: il rischio per le persone, il tempo a
disposizione, i doveri morali, eccetera, dunque il bilancio con l’evidenza puramen-
te fattuale va costruito con attenzione. Riflettiamo su questo esempio, uno studio
condotto all’inizio del XX secolo proprio da Hill e riportato da Doll in un articolo
del 200130, interessante per le conclusioni concettuali che l’autore ne trae. Si tratta
di uno studio di coorte retrospettivo commissionato da una raffineria di nichel sul-
le cause di morte tra gli operai. La coorte storica è formata da circa 1000 lavoratori
e pensionati identificati dai registri della compagnia e viene seguita per 10 anni
dal 1929 al 1938, confrontando gli esiti con i dati di mortalità della popolazione
britannica. Lo studio identifica 16 su 1000 morti di cancro ai polmoni contro 1 su
1000 dei dati nazionali, 11 di tumore al naso contro meno di 1 su 1000 e 67 contro 72
su 1000 morti per altre cause. Lo studio non viene pubblicato, ma Bradford Hill lo
illustra nel suo testo di epidemiologia del 1966, sottolineando un dato importante.
Nel 1923, spiega Hill, sono stati introdotti alcuni cambiamenti nella lavorazione
del nichel, indipendentemente dalla valutazione del rischio rispetto alle morti di
tumore. Da quel momento nella coorte non è stato osservato più nessun aumento
di rischio relativo di mortalità per tumore al polmone o al naso: in altre parole,
l’eccesso di malattie mortalità in entrambe le condizioni è solo una caratteristica
degli operai che hanno lavorato in raffineria solo nei primi 23 anni del secolo. Lo
studio cioè porta evidenza a un’ipotesi di associazione tra la lavorazione del nichel
nella modalità anteriore al 1923 e le morti per cancro ai polmoni e al naso. È vero,
continua Hill,
che ad ora [siamo nel 1966] non è stato identificato nessun agente causale per questi
neoplasmi e nessuna sperimentazione su animali ha dato alcun indizio o supporto
a questa evidenza puramente statistica, ma dobbiamo sicuramente fare attenzione a
questo fenomeno, che molto chiaramente rende inutile l’asserzione secondo la quale,
se l’evidenza è solo statistica non possiamo accettarla per intraprendere azioni.
Per tutte le cautele già espresse sulla validità degli studi di coorte retrospettivi,
lo studio di Hill sui registri della fabbrica di nichel non è una buona ragione per
credere che la causa delle morti sia l’esposizione al nichel a cui gli operai della fab-
brica erano soggetti prima del 1923. Tuttavia, il suo autore sottolinea che si tratta di
una buona ragione per agire – in questo caso, plausibilmente, facendo sì che quella
modalità di lavorazione non sia più implementata, secondo un principio di cautela.
Si tratta di dare un valore pratico a un risultato scientifico anche dopo avere con-
statato che il suo valore epistemico non sufficiente per garantire piena conoscenza,
e dopo aver valutato le altre ragioni etiche e pratiche che emergono dal contesto.
Non è lo scienziato a doversi occupare delle ragioni per agire: si tratta di un com-
pito che va gestito nel rapporto tra la scienza e le istituzioni, in particolare quelle
che si occupano di politica sanitaria. Questo tema ci riporta anche a sottolineare il
ruolo di tutti i disegni sperimentali, a patto che siano ben compresi nei loro limiti,
indipendentemente dalla loro possibilità di confermare associazioni causali31.
LIMITI E BIAS
Il limite principale di uno studio ecologico viene dal suo disegno descrittivo
ed è quindi comune agli altri studi di questo tipo: senza un gruppo di control-
lo, se suggerisce un’ipotesi non può allo stesso tempo servire per confermarla. Il
principale bias specifico di questo tipo di studio ecologico è invece la cosiddetta
fallacia ecologica. Si tratta di inferire direttamente le proprietà di un individuo
dalle proprietà di una popolazione36. Non dobbiamo qui confondere la fallacia eco-
logica con il problema della rappresentatività del campione: in tutti gli studi in cui
utilizziamo un campione (che sia una coorte o un gruppo di casi) ci si può sempre
chiedere quanto le proprietà del campione in termini di esposizioni ed esiti siano
rappresentativi di tutta la popolazione. Ma qui c’è un problema ulteriore perché gli
esiti e le esposizioni sono già proprietà collettive di una popolazione. È stato notato
che a livello di popolazione qualsiasi malattia associata alla ricchezza o allo stile di
vita occidentale può essere correlata con le vendite di televisori o con il tempo o la
qualità della connessione a internet, ma non ha senso trasferire questa associazione
a livello individuale37.
toriti da donne che hanno assunto questo farmaco in gravidanza? Hurstville, New
South Wales, W. G.McBride
Questa lettera di un ginecologo australiano riuscì a portare all’attenzione di altri
studiosi gli effetti teratogenici (cioè come causa di malattia) del Talidomide, che
non erano noti né ipotizzati, anche perché all’epoca si tendeva a ritenere che la
mancanza di effetti collaterali nella madre fosse evidenza di sicurezza anche per
il feto. Dopo poco tempo il farmaco fu ritirato dal commercio e soprattutto comin-
ciarono gli studi di farmacovigilanza. Oggi non viene più prescritto alle donne in
gravidanza, ma la molecola ha trovato impieghi in oncologia e immunologia41.
Uno studio di caso in generale può servire a mettere in luce un aspetto di una
patologia che non è ancora stato studiato, che sia medico o non medico. Vediamo
questo esempio del 2020, durante la pandemia da Covid-19, pubblicato sul British
Medical Journal, di cui si riporta il riassunto che precede l’articolo:
Un operatore sanitario maschio, di 37 anni e precedentemente in buona salute, si è
presentato con confusione, sintomi psicotici e un tentativo di suicidio nel contesto di
una ricevuta diagnosi di Covid-19. Dopo trattamenti chirurgici e il ricovero in tera-
pia intensiva, ha avuto un buon recupero in termini di salute sia fisica che mentale.
Una serie di fattori ha contribuito alla sua presentazione, tra i quali l’infezione da
Sars-CoV-2, grave insonnia, stress correlato all’occupazione sanitaria, e il peculiare
tipo di stress associato alla pandemia da Covid-19. Questo caso mostra la necessità
di caratterizzare più approfonditamente le conseguenze psichiatriche del Covid-19
nei contesti di comunità, e dovrebbe ricordare ai medici clinici l’attenzione ai sintomi
psichiatrici in comorbidità durante la valutazione dei pazienti con nuove diagnosi
di Covid-19.
Infine, un’altra funzione dello studio di caso, che non ha vincoli sulla quantità
e il tipo di dettagli forniti e sullo stile della descrizione, è quello di fare da comple-
mento alla ricerca medica quantitativa con informazioni qualitative. Può contenere
ad esempio, oltre alla descrizione oggettiva (dal punto di vista del clinico) dei sin-
tomi di una condizione, anche il resoconto delle esperienze soggettive del paziente
dal punto di vista fenomenologico, oppure la sua storia raccontata in prima per-
sona. Qui la ricerca da quantitativa si fa qualitativa: non ci sono misurazioni delle
variabili ma interpretazioni dei fenomeni secondo una cornice concettuale data.
Alcuni studi di caso in psichiatria fenomenologica possono avere questa forma e
funzione. Leggiamo questo abstract42:
NOTE DI CHIUSURA
1 Rimando a Romeijn, J. (2017) Philosophy of Statistics. The Stanford Encyclopedia of Phi-
losophy (Spring 2017 Edition), Edward N. Zalta (ed.), URL = <https://plato.stanford.edu/
archives/spr2017/entries/statistics/>.
2 Lo schema è adattato dalla Figura 1 in Röhrig, B., Du Prel, J. B., Wachtlin, D., & Blettner,
M. (2009). Types of study in medical research: part 3 of a series on evaluation of scientific
publications. Deutsches Arzteblatt International, 106(15), 262.
3 In italiano rimando a Amoretti, M. C. (2015) Filosofia e Medicina. Roma: Carocci
4 Langevin-Joliot, H. (1998). Radium, Marie Curie and Modern Science. Radiation Resear-
ch, S3-S8.
5 Lavik, E., Kuehn, M. H., & Kwon, Y. H. (2011). Novel drug delivery systems for glau-
coma. Eye, 25(5), 578-586. Altri esempi si trovano in Eupati (2020) Traslational medicine,
https://toolbox.eupati.eu/resources/translational-medicine/, accesso del 31 dicembre 2020.
6 U.S. Department of Health and Human Services Centers for Disease Control and Pre-
vention (CDC) (2012) Principles of Epidemiology in Public Health Practice. Atlanta: CDC
7 Clancy, C. M., & Eisenberg, J. M. (1998). Outcomes research: Measuring the end results
of health care. Science, 282(5387), 245.
8 Per un’introduzione alla statistica nella ricerca medica in italiano si può fare riferimen-
to a Daniel, W. (1996) Biostatistica. Napoli: EdiSes.
9 La figura è adattata da Grimes, D. A., & Schulz, K. F. (2002). An overview of clinical
research: the lay of the land. Lancet, 359(9300), 57-61. Per la versione italiana Cartabellotta,
N. (2010) Pillole di metodologia della ricerca. Gimbe News 3, 2, 15-16.
10 Un riferimento molto sintetico e semplice per i concetti metodologici di base è Grimes,
D. A., & Schulz, K. F. (2002). An overview of clinical research: the lay of the land. The Lan-
cet, 359(9300), 57-61.
11 Doll, R., Peto, R., Boreham, J., & Sutherland, I. (2004). Mortality in relation to smoking:
50 years’ observations on male British doctors. British Medical Journal, 328(7455), 1519. Uno
dei primi articoli pubblicati sullo studio è Doll, R., & Hill, A. B. (1964). Mortality in rela-
tion to smoking: ten years’ observations of British doctors. British medical journal, 1(5395),
1399.
12 Laupacis A, Wells G, Richardson S, et al. Users guides to the medical literature. V. How
to use an article about prognosis. JAMA 1994; 272:234–237
13 Lo standard per gli studi diagnostici è tuttavia il disegno trasversale. La complessità
dello studio diagnostico merita approfondimento a parte, si veda ad esempio Rutjes AW,
Reitsma JB, Vandenbroucke JP, Glas AS, Bossuyt P.(2005) Case-control and two-gate desi-
gns in diagnostic accuracy studies. Clinical Chemistry 51:1335-41
14 Esiste un dibattito in corso sui vantaggi e gli svantaggi dell’approccio statistico in ter-
mini di probabilità dell’ipotesi nulla e sulla corretta interpretazione del p-value. Per un ap-
proccio critico si veda ad esempio Goodman, S. (2008). A Dirty Dozen: Twelve P-Value
Misconceptions. In Seminars in Hematology (Vol. 3, No. 45, pp. 135-140).
15 Sackett, D. L. (1979). Bias in analytic research. Journal of chronic diseases, 32(1-2), 51.
16 Per una trattazione più approfondita rimando al cap. 4 di Supino, P. G., & Borer, J.
S. (Eds.). (2012). Principles of research methodology: A guide for clinical investigators. Springer
Science & Business Media.
17 Schmidt, C. O., & Kohlmann, T. (2008). When to use the odds ratio or the relative
risk?. International journal of public health, 53(3), 165.
18 Tratto da LaMorte, W. (2016) Outbreak investigations. Boston: Boston University Scho-
ol of Public Health
19 Si veda ad es. Schlesselman J. (1982) Case-control studies. New York: Oxford Universi-
ty Press.
20 SaPeRiDoc. Centro per la salute perinatale e riproduttiva (2010) Bologna: Servizio Sani-
tario dell’Emilia- Romagna, https://www.saperidoc.it/flex/cm/pages/ServeBLOB.php/L/IT/
IDPagina/586
21 Imai, K., & Nakachi, K. (1995). Cross sectional study of effects of drinking green tea on
cardiovascular and liver diseases. British Medical Journal, 310 (6981), 693-696.
22 Sackett, D. L., & Haynes, R. B. (2002). The architecture of diagnostic research. British
Medical Journal, 324(7336), 539-541.
23 Hill, S. B. (1965). The Environment and Disease: Association or Causation?. Proceedings
of the Royal Society of Medicine, 58, 295-300, p. 296.
24 Fisher, R. A. (1958). Cancer and smoking. Nature, 182(4635), 596-596.
25 Hill, S. B. (1965). The Environment and Disease: Association or Causation?. Proceedings
of the Royal Society of Medicine, 58, 295-300, p. 298.
26 Ibid.
27 Marshall B. and Warren R. (1984). Unidentified Curved Bacilli in the Stomach of Pa-
tients with Gastritis and Peptic Ulceration. Lancet. 2 (8626/8627):1437-41. Per la storia della
scoperta e della sua difficile accettazione Thagard P. (1998). Ulcers and Bacteria I: Discovery
and Acceptance. Studies in History and Philosophy of Science. Part C: Studies in History and
Philosophy of Biology and Biomedical Sciences. 29:107-36.
28 Per una valutazione filosofica si veda Bird, A. (2011). The epistemological function of
Hill's criteria. Preventive Medicine, 53(4-5), 242-245. Per una discussione da parte di epide-
miologi, Lucas, R. M., & McMichael, A. J. (2005). Association or causation: evaluating links
between environment and disease. Bulletin of the World Health Organization, 83, 792-795.
29 Hill, S. B. (1965). The Environment and Disease: Association or Causation?. Proceedings
of the Royal Society of Medicine, 58, 295-300, p. 300.
30 Doll, R. (2001). Cohort studies: history of the method II. Retrospective cohort stu-
dies. Sozial-und Präventivmedizin, 46(3), 152-160.
31 Per il concetto di causalità in epidemiologia rimando a tutti i lavori del filosofo Alexan-
der Broadbent, ad esempio Broadbent, A. (2009). Causation and models of disease in epide-
miology. Studies in History and Philosophy of Science Part C: Studies in History and Philosophy
of Biological and Biomedical Sciences, 40(4), 302-311.
32 Si veda ad esempio Doll R, Payne P, Waterhouse J (1966) eds. Cancer incidence in five
continents, vol. I. Geneva: Union Internationale Contre le Cancer.
33 Su questa specifica domanda si veda Anon (1995). Abortion: one Romania is enough.
Lancet 1995; 345: 137–38.
34 Alter, D. A., Naylor, C. D., Austin, P., & Tu, J. V. (1999). Effects of socioeconomic status
on access to invasive cardiac procedures and on mortality after acute myocardial infar-
ction. New England Journal of Medicine, 341(18), 1359-1367.
35 Tu, J. V., & Ko, D. T. (2008). Ecological studies and cardiovascular outcomes resear-
ch. Circulation, 118(24), 2588-2593.
36 Grimes, D. A., & Schulz, K. F. (2002). Descriptive studies: what they can and cannot
do. The Lancet, 359(9301), 145-149.
37 Pearce, N. (2000). The ecological fallacy strikes back. Journal of Epidemiology and
Community Health, 54(5), 326.
38 Venes, D. (2009) Taber’s Cyclopedic Medical Dictionary. 21st edition. Philadelphia:
F.A. Davis Company
39 Si veda Nissen, T., & Wynn, R. (2014). The clinical case report: a review of its merits and
limitations. BMC research notes, 7(1), 264.
40 McBride, W. G. (1961) Thalidomide and Congenital Abnormalities. Letter to the Editor.
The Lancet 2 (December 16, 1961): 1358.
41 La vicenda completa è riassunta in Melchert, M., & List, A. (2007). The thalidomide
saga. The international journal of biochemistry & cell biology, 39(7-8), 1489-1499.
42 Bramley, N., & Eatough, V. (2005). The experience of living with Parkinson’s disease:
An interpretative phenomenological analysis case study. Psychology & Health, 20(2), 223-
235.
Dopo una breve riflessione sulla scelta tra osservare o sperimentare, il capitolo de-
scrive la struttura dei Randomized-controlled trial (RCT), con particolare attenzione
alla randomizzazione e al blinding, che aumentano la validità interna. Dopo aver de-
scritto vari disegni di RCT, i trial farmacologici e successivamente gli studi pre-spe-
rimentali e quasi-sperimentali, mettiamo a fuoco la questione degli RCT come gold
standard per la ricerca biomedica. Viene poi introdotta la gerarchia delle evidenze
per le questioni cliniche proposta dal movimento EBM (Evidence-based medicine),
considerando alcune critiche filosofiche. Discutendo della validità interna degli RCT
si introducono alla fine alcune questioni sui valori nella ricerca.
so medico scienziato della Francia di fine Ottocento, autore di una celebre introdu-
zione al metodo sperimentale in medicina (secondo molti storici, la prima), scrive-
va che nell’esperimento rispetto all’osservazione il ricercatore è attivo – anche poi
se deve tornare passivo per controllare gli effetti della sua modifica1. Molti o quasi
tutti gli studi di laboratorio e preclinici sono sperimentali (o quasi-sperimentali o
pre-sperimentali, secondo la distinzione che faremo nel corso di questo capitolo),
mentre in epidemiologia e clinica, come abbiamo visto, ci sono diversi tipi di studi
osservazionali.
Va detto subito che, dal punto di vista della validità interna di uno studio, la
semplice caratteristica di misurare l’effetto di un intervento anziché di un’esposi-
zione, in vista di un outcome, non fa differenza: non si tratta di un tratto strutturale
che aumenta la validità di per sé. La validità interna, lo ricordiamo, ha a che fare
con quanto il risultato che otteniamo da uno studio sia dovuto all’effetto dei fattori
che stimo esaminando e non ad altri. Come abbiamo visto, il gruppo di confronto
o controllo fa invece una differenza rispetto alla validità, e ancora di più l’assegna-
zione casuale dei soggetti all’intervento, cioè la randomizzazione di cui parleremo
tra poco. La questione, infatti, è sempre quanti confondimenti e bias sono tipici di,
o invece evitabili da, un certo tipo di studio. Vedremo che l’RCT, nelle sue varianti,
è in grado di evitarne molti e in generale di più rispetto agli altri tipi di studi che
abbiamo fin qui considerato.
Un RCT testa l’ipotesi che un intervento abbia un effetto rispetto ad un outcome
monitorando due o più gruppi (controllo), dei quali solo uno riceve l’intervento in
oggetto, e ai quali i soggetti sono assegnati in modo casuale. Viene impiegato per
domande di ricerca cliniche sull’efficacia di un nuovo farmaco (i trial clinici), e in
generale in tutti i campi della ricerca biomedica, dalla preclinica e di base in vivo
e in vitro (cioè sugli animali o in provetta), alla valutazione della qualità in sanità
e delle politiche di prevenzione per la salute pubblica. Nel Capitolo 3 ci è servito
come termine di paragone per evidenziare i limiti degli studi osservazionali, anche
di quelli con gruppo di controllo. Come vedremo nel §4.5 nel paradigma dell’EBM
l’RCT clinico è considerato in grado di fornire un’evidenza migliore di qualsiasi
studio osservazionale rispetto a questioni cliniche, e costituisce il paradigma di ec-
cellenza per la ricerca primaria, assieme alle meta-analisi per la ricerca secondaria.
Inoltre, secondo diversi metodologi – ma non tutti i filosofi sono d’accordo (lo ve-
dremo nel §4.6) - un’ipotesi confermata da un RCT costituisce conoscenza causale
in medicina: certamente si tratta di conoscenza fallibile, ma l’idea è che se un trial
randomizzato conclude che c’è un effetto dell’intervento studiato I sull’outcome O,
allora si tende a concludere che I è una delle cause di O (cambiamo qui la nostra
notazione schematica rispetto agli studi osservazionali, abbandonando esposizio-
ne E ed esito H, perché nel campo degli studi sperimentali si parla più frequente-
mente di Intervento e di Outcome).
Dunque, è sempre meglio optare per un RCT in fase di scelta del disegno speri-
mentale? Certamente no. Innanzitutto, come abbiamo già visto, una fase inelimina-
bile del metodo sperimentale è quella di formulare ipotesi. In questa fase sono più
adatti gli studi osservazionali e descrittivi, in cui, metaforicamente, non si restringe
troppo il campo di esplorazione. Con un’immagine: se qualcuno mi dice di cercare
nella sua cucina le chiavi dell’auto che ha dimenticato, non è opportuno che io mi
metta subito a verificare se sono nel ripiano dei biscotti svuotandolo completamente,
ma è meglio capire prima quanti e quali sono le superfici e i mobili da considerare.
Così come non possiamo nemmeno dire che sia sempre meglio optare per uno stu-
dio sperimentale, anziché per uno osservazionale. La scelta del tipo di studio va fatta
pesando ragioni epistemiche (che tipo di domanda di ricerca ci stiamo ponendo, che
tipo di evidenza può fornire lo studio in virtù della sua struttura), ma anche ragioni
pratiche (in sintesi: tempo, denaro, strutture), nonché vincoli etici (è giusto che questi
soggetti ricevano questo intervento, o vengano osservati in questo modo?), che non
abbiamo considerato2. In altre parole, la qualità dell’evidenza che uno studio può
dare rispetto a un’ipotesi, in virtù della sua struttura, è la caratteristica epistemica
che abbiamo analizzato principalmente fin qui, ed è fondamentale dal punto di vista
della conoscenza, ma le caratteristiche pratiche e quelle etiche della ricerca fanno al-
trettanto parte della scienza come attività situata nel mondo reale, e soprattutto delle
scienze biomediche, che si occupano dei viventi. In sintesi, dunque, un RCT non è
sempre la scelta migliore, perché non sempre è quello che davvero vogliamo, o pos-
siamo fare. Lo è però quando intendiamo testare un’ipotesi, tipicamente sull’efficacia
di un intervento, come vedremo nel caso dei trial farmacologici nel §4.5, e ci sono le
condizioni etiche e pratiche per condurlo e portarlo a termine.
analitico, che prevede un’analisi statistica, occorre determinare prima dello studio
quale I e quale o quali O vogliamo controllare e per quanto tempo. Per testare
l’ipotesi che l’intervento I produce O, si sceglie un campione di numerosità ade-
guata dalla popolazione di riferimento: questo è un problema in parte statistico
(quanti soggetti), in parte vincolato da ciò che si sa sul tipo di intervento e sulla
popolazione (quali soggetti). In un RCT clinico, la popolazione è tipicamente quel-
la dei pazienti affetti dalla patologia al cui trattamento l’intervento è destinato, e
il campione è formato da volontari. Dal campione si selezionano gli arruolabili,
ovvero si eliminano i soggetti che hanno qualche caratteristica incompatibile con il
trattamento, per vari tipi di ragioni (tipicamente: i troppo anziani o troppo giovani,
quelli che hanno diverse patologie, quelli che già assumono un farmaco potenzial-
mente influente sull’outcome). Si effettua quindi una misurazione iniziale, cioè si
registrano le principali caratteristiche di entrata (baseline o basale) di tutti i soggetti
arruolabili, ad esempio genere, età, stato socioeconomico, fattori prognostici, se-
guendo le linee guida apposite3. A questo punto si assegna ciascun soggetto a un
gruppo, detto braccio, dello studio (ce ne possono essere più di due, ma procedia-
mo con due, qui, per semplicità) in modo casuale (random) e possibilmente in modo
che tutti, ricercatori compresi, siano ciechi (blind) rispetto a quali soggetti vengano
assegnati a quale braccio. A seconda del braccio a cui viene assegnato, ogni sog-
getto riceve l’intervento I, oppure una condizione di controllo non-I. In uno studio
clinico non-I è di solito l’intervento standard già in uso, più raramente un place-
bo, cioè una sostanza considerata innocua rispetto all’outcome, ma in generale la
condizione non-I può essere anche equivalente al non ricevere alcun intervento. A
questo punto i due bracci vengono seguiti per il tempo prestabilito e al termine si
compie l’osservazione finale: vengono misurati gli outcome per il braccio I e per il
braccio non-I. Di solito si utilizza non una misura di associazione, ma una misura
di efficacia, che è il rischio assoluto, che dice quanto l’incidenza dell’outcome di-
penda dall’intervento. Si calcola facendo la differenza tra il rischio dell’outcome nei
controlli e nei trattati.
La randomizzazione è la caratteristica strutturale rilevante di un RCT, che ne
determina le proprietà epistemiche, cioè quanto – nel nostro vocabolario filosofico
– possa costituire una buona ragione per credere nell’effetto di I su O e, come ab-
biamo già detto, contribuisce essenzialmente al posto alto che questo tipo di studi
ha nella gerarchia della qualità delle evidenze. In generale, la randomizzazione in
un RCT è infatti ritenuta la migliore difesa rispetto ai confondimenti4. Si tratta di
un’assegnazione casuale: ricevere l’intervento I oppure non-I non è deciso in base
essere infiniti. Se però abbiamo una procedura che dà a ciascun F, noto o ignoto, la
probabilità del 50% di trovarsi in un gruppo o nell’altro, allora il problema è risol-
to. La randomizzazione è questa procedura. Può essere condotta anche dopo aver
suddiviso i soggetti in blocchi (piccoli gruppi eterogenei da 10 o 20 soggetti) o in
strati, cioè insiemi definiti da una caratteristica rilevante come possibile confondi-
mento, ad esempio gravità della patologia o età5.
Apriamo una parentesi prima di proseguire con le altre caratteristiche dell’RCT.
Qualche lettore particolarmente attento può aver notato un particolare inquietan-
te: se lanciamo una moneta, la probabilità che venga testa (o croce) è sì del 50%,
ma solo per una serie infinita di lanci. Non c’è niente di strano, dal punto di vista
matematico, se lancio una moneta e viene testa per sei lanci su sette - pensare che
sia strano fa perdere milioni ai giocatori d’azzardo. Dunque, anche in un RCT la
probabilità che i potenziali confondimenti si distribuiscano ordinatamente al 50%
nei due bracci dello studio si dà solo per infinite assegnazioni. Ma noi non avremo
mai infinite assegnazioni, cioè infiniti soggetti in un trial, quindi c’è la possibilità
che per caso si verifichi l’analogo di sei lanci testa su sette, qualche rara volta.
È un problema? Sì e no. Per i filosofi lo è nella misura in cui non possiamo più
dire che un RCT sia completamente al riparo dai confondimenti, e quindi che ab-
biamo una via puramente logica e metodologica alla validità interna. Questo in
parte intacca la superiorità assoluta degli RCT rispetto agli altri disegni sperimen-
tali6. Per i metodologi invece non lo è, perché possiamo sempre dire che la rando-
mizzazione metta al riparo dai confondimenti salvo rari casi: rari, per intenderci,
come quelli in cui apparentemente vinco sempre giocando testa. Quindi rimane
intatta la superiorità relativa rispetto agli altri disegni sperimentali. Torneremo su
queste valutazioni comparative parlando del paradigma EBM nel §4.6.
Occorre ora completare la caratterizzazione della struttura degli RCT con la
questione del blinding. Questa procedura serve a ridurre una serie di possibili
bias, che abbiamo già visto nel §3.3. Se lo sperimentatore sa quali soggetti sono
assegnati al braccio I, potrebbe riservare ad essi, inconsciamente, un’attenzione
particolare, quindi ad esempio favorendo alla fine un outcome positivo se questo
era nell’ipotesi (bias dello sperimentatore). Se il soggetto sa se sta ricevendo E
oppure il trattamento standard, un placebo o nessuno, può mettere in gioco azio-
ni o emozioni che alterano l’effetto di I su O (bias di aspettativa e di performan-
ce). Se chi analizza i dati sa se sta lavorando con il braccio I con non-I, potrebbe
avere aspettative che alterano il suo giudizio o rendono più probabili gli errori
sistematici a favore o a sfavore della significatività dell’effetto (nuovamente un
bias dello sperimentatore). Ci possono essere dunque vari livelli di blinding, tutti
opzionali e dipendenti dallo scopo e dalle condizioni dell’esperimento. Se un
RCT in triplo cieco è idealmente auspicabile, nella pratica spesso uno o più blin-
ding sono impossibili: ad esempio quando E è una procedura chirurgica e non-E
un trattamento farmacologico, ovviamente il soggetto non può non rendersi con-
to della differenza, e anche chi amministra il trattamento – ma in questo caso
almeno l’analisi potrà essere cieca. Come per i bias che abbiamo visto per gli studi
osservazionali, qui vale la considerazione che non tutti possono essere eliminati
strutturalmente, ma la struttura deve essere la migliore per eliminarli, e diversi
aggiustamenti statistici sono possibili post hoc.
Vediamo un esempio semplice, un piccolo studio pubblicato sul British Medical
Journal nel 20007.
Esempio
Obiettivo: determinare se l’uso di un inalatore orale di nicotina può risultare in
una riduzione a lungo termine del fumo e se l’uso concomitante di sostituitivi della
nicotina sia sicuro.
Disegno. Trial randomizzato, doppio cieco e controllato con placebo. Trial di 4 mesi
e follow-up di due anni.
Setting. Due reparti di malattie polmonari in ospedali universitari della Svizzera.
Partecipanti. 400 volontari sani, reclutati tramite annunci sui quotidiani, desiderosi
di ridurre il fumo ma non in grado o non disposti a smettere immediatamente.
Intervento. Inalatore attivo o con placebo, al bisogno fino a un massimo di 18 mesi,
con incoraggiamento ai partecipanti di smettere di fumare il più possibile.
Principali misure di outcome. Numero di sigarette fumate al giorno dalla sesta set-
timana al termine. Decremento misurato con il monossido di carbonio emesso a cia-
scun tempo confrontato con la misurazione di partenza.
Risultati. Dopo 4 mesi, una sostanziale riduzione del fumo è stata raggiunta da 52
(26%) partecipanti nel gruppo attivo e 18 (9%) nel gruppo placebo (p<0.001; test di
Fisher). Le cifre corrispondenti dopo due anni sono 19 (9,5%) e 6 (3,0%) (P=0,012).
Conclusione. I soggetti che hanno inalato nicotina hanno efficacemente e senza rischi
ridotto il fumo nell’arco di 24 mesi. La riduzione con o senza sostitutivo della nicoti-
na può essere un primo passo fattibile verso lo smettere di fumare per chi non riesce
o non vuole smettere di colpo.
In questo esempio, all’inizio del trial gli sperimentatori hanno effettuato un’os-
servazione iniziale che comportava la misurazione di tutti questi parametri: con-
centrazioni di monossido di carbonio nel respiro, frequenza del fumo, funzionalità
respiratoria, pressione sanguigna, polso, peso, variabili ematologiche, concentra-
zioni di lipidi nel sangue e fibrinogeni e qualità di vita. L’osservazione è stata ripe-
tuta a 4 mesi (la fine del trial), e a 12 e a 24 mesi (la fine del follow-up).
molto rilevante di prodotti di secrezione, che possono agire sia individualmente che in
sinergia. Dunque, dato il numero enorme di potenziali variabili sperimentali, l’analisi
della transizione dei macrofagi da M1 a M2 mediata dalle MSC è stata razionalizzata
in uno studio fattoriale frazionario per identificare gli effetti dei fattori singoli o com-
binati. Le colture di macrofagi sono state esposte a 13 dei più rilevanti fattori immu-
nomodulatori delle MSC ai loro livelli di secrezione biologica. Mentre per esplorare
ciascuno di questi fattori e le loro combinazioni richiederebbe 8192 pozzetti per ogni
singola replica biologica, il frazionamento di 1/64 del disegno sperimentale fattoriale è
in grado di ridurre il disegno a soli 128 pozzetti senza perdere nessuna informazione
relativa agli effetti dei fattori singoli e delle loro combinazioni a due.
L’estratto da questo studio di ricerca di base è utile a mostrare le potenzialità
del disegno fattoriale. Quando la domanda di ricerca è sia sugli effetti di vari fattori
che sulle loro interazioni, le ipotesi da testare aumentano in maniera combinato-
ria e con queste, per ragioni statistiche, aumenta la numerosità del campione che
ci occorre. Lo studio fattoriale è in grado di ovviare a questo problema. Nel caso
specifico è anche frazionario, cioè non tutte le combinazioni possibili di fattori e
combinazioni vengono analizzate.
Crossover. Mentre in tutti i disegni sperimentali che abbiamo considerato finora
gli interventi vengono effettuati in parallelo, in un RCT crossover si varia la struttura
temporale: gli interventi vengono somministrati in sequenza allo stesso soggetto.
Una struttura semplice è quella in cui i partecipanti sono randomizzati inizialmen-
te all’intervento E o all’intervento I e poi “passano dall’altra parte” (cross-over), cioè
ricevono la E se avevano provato I e I se avevano ricevuto E. Prima del passaggio
è necessario un periodo di wash-out, che serve a smaltire gli effetti del primo tratta-
mento. Il vantaggio immediato di questo tipo di studio è che ogni partecipante di-
venta il proprio controllo, eliminando quindi i il problema della variabilità biologi-
ca del campione (che non è un bias, non essendo un errore sistematico, ma casuale).
Ne segue anche che numero di soggetti da reclutare sarà relativamente più piccolo
rispetto ad altri disegni. Nel caso di una terapia diretta agli umani, il partecipante
potrà anche al termine esprimere preferenze sui trattamenti che ha ricevuto, dato
che li prova tutti. In ambiti di ricerca come la neurologia e la psichiatria gli RCT a
disegno crossover sono molto utilizzati, proprio per queste ragioni.
Come esempio leggiamo l’abstract di uno studio sull’effetto di una molecola
usata comunemente per il trattamento dei disturbi depressivi sulle cosiddette vam-
pate della menopausa, pubblicato su Menopause nel 200613:
Disegno. Trial doppio cieco, controllato con placebo, di tipo crossover, condotto in
un setting urbano negli Stati Uniti sud-occidentali. Sono state reclutate in tutto
102 donne tra i 40 e i 65 anni di con vampate e non in terapia ormonale. Dopo una
settimana di raccolta di dati di baseline sulle vampate, le partecipanti sono state
randomizzate a ricevere un placebo oppure il farmaco attivo (sertralina 50 mg) per 4
settimane. Questo intervento è stato seguito da un washout di 1 settimana e poi dal
passaggio al trattamento opposto per altre 4 settimane. Il numero e la gravità delle
vampate sono stati misurati.
Risultati. 102 donne sono state arruolate nello studio. Cinque hanno abbandonato
prima di fornire i dati di baseline. Delle 97 rimanenti, 52 sono state randomizzate
al farmaco attivo prima e 45 al placebo prima. Dieci hanno abbandonato lo studio
prima di completare le 10 settimane, lasciando 46 nel braccio con il farmaco prima e
41 nel braccio con il placebo prima. Al basale, il numero medio di vampate riportato
era di 45,6 per settimana, con un range di 2 a 148. Durante la fase dello studio con
la sertralina, le volontarie hanno avuto una riduzione di un quinto delle vampate
(p=0,002). La gravità delle vampate non è stata significativamente differente, ma
il punteggio complessivo (numero x gravità media) è migliorato significativamente
durante la fase con la sertralina.
In sintesi, i diversi tipi di disegno sperimentale che variano sul modello del
RCT sono adatti a diverse domande di ricerca e anche in parte a diverse condizioni
pratiche, come la disponibilità dei soggetti. La scelta dell’uno o dell’altro dipende
anche dalla previsione dei possibili confondimenti e bias che possono interessare
lo studio della relazione tra interventi ed esiti. Come abbiamo ricordato, non c’è un
procedimento algoritmico per prevedere quali possano essere: ci si basa sugli studi
precedenti, sulla propria conoscenza della biologia del sistema e, per abduzione, si
procede alla scelta dei modi per minimizzarli.
Abbiamo visto che la principale ragione per ritenere che gli RCT siano il gold
standard per la conferma di un’ipotesi è di tipo logico: la procedura di randomizza-
zione permette di minimizzare i confondimenti, distribuendo in modo idealmen-
te uniforme le caratteristiche dei soggetti nel gruppo di intervento e in quello di
controllo – idealmente come è ideale che la probabilità dei risultati Testa e Croce
lanciando una moneta sia la stessa. La seconda ragione è metodologica e pratica:
con il blinding un RCT si mette al riparo da diversi bias, gli errori sistematici che
potrebbero venire da aspettative, desideri e intenzioni che a livello non cosciente
potrebbero modificare il comportamento dei ricercatori e dei soggetti23.
Ci sono molti esempi che mostrano come i risultati di precedenti studi osserva-
zionali siano stati smentiti da successivi RCT, di solito nel senso che effetti notevoli
rilevati dagli studi osservazionali vengono sgonfiati nei successivi trial randomiz-
zati. Vediamone due, tratti da un editoriale pubblicato sul British Medical Journal
che sostiene observational studies propose, RCT dispose (gli studi osservazionali pro-
pongono, gli RCT dispongono)24. Il primo riguarda gli effetti della terapia ormona-
le sostituitiva per le donne in menopausa. Nel 1991 viene condotta una meta-ana-
lisi (una selezione degli studi pubblicati, con aggregazione statistica dei risultati)
di studi epidemiologici, da cui risulta che la terapia ormonale sostitutiva dimezza
il rischio relativo di malattia cardiovascolare. Il primo grande trial randomizzato
terminato nel 2002, tuttavia, non rileva nessun effetto, e trial successivi mostrano
una riduzione molto piccola in termini di odds ratio (0.96 del gruppo di intervento
contro 1.30 del controllo)25. Anche per il beneficio del betacarotene sull’incidenza
di tumore al polmone le cose non vanno diversamente. Nel 1990 una review con-
clude che assumere integratori di questa molecola ha un effetto protettivo, ma nel
1994 un grande trial randomizzato pubblicato sul New England Journal of Medicine
mostra addirittura il contrario: un aumento del 18% di rischio relativo di tumore ai
polmoni tra i consumatori di integratori26.
Un caso più recente e controverso è quello dell’Idrossiclorochina come tratta-
mento per i pazienti ricoverati con sindrome respiratoria acuta da Covid-19. Si
tratta di un vecchio farmaco in uso per la cura della malaria, dei reumatismi, delle
infiammazioni articolari e del lupus (una malattia autoimmune). All’inizio della
pandemia, nel marzo 2020, vengono pubblicati alcuni studi di serie di casi che mo-
strano un miglioramento di prognosi nei pazienti ricoverati con sindrome respira-
toria acuta da Covid-19 trattati con idrossiclorochina. Ci sono anche evidenze dalla
ricerca di base di come la molecola possa limitare l’entrata del virus nella cellula
umana, e anche ridurre le citochine prodotte durante lo sviluppo della sindrome
È nostro dovere nei confronti dei pazienti minimizzare l’applicazione di terapie inu-
tile e dannose basando i nostri interventi, ogni volta che è possible, sui risultati di
RCT appropriati30.
Vedremo tra poco che la tesi del gold standard è stata in parte rimodulata. La par-
te negativa della prima regola dell’EBM invece dequalifica alcuni tipi di evidenza,
ed è rimasta invariata nel tempo. Consideriamone le componenti.
L’intuizione e l’esperienza non sistematica sono le competenze del singolo clini-
co, maturate con l’esperienza e lo studio, assieme a quella capacità di dare giudizi
veloci che varia da soggetto a soggetto e che è tipica di chiunque svolga da tempo
una certa professione, e sia quindi esperto. Il razionale fisiopatologico è il mecca-
nismo in base al quale un trattamento o un test funzionano: spiega “come”, non
dimostra “che”. La regola storica dell’EMB ci dice che queste due componenti non
bastano: deve documentarsi su quanto sia stato pubblicato recentemente e agire su
questa base.
La prima regola storica dell’EBM non deve sembrarci ovvia. Oggi ci sono data-
base degli articoli pubblicati e soprattutto linee guida e protocolli continuamente
aggiornati, che digeriscono la mole di ricerca pubblicata e la adattano alle questioni
cliniche, ma questo non era ovvio quando l’EBM ha iniziato la sua storia. La clini-
ca non era scientifica, anche se la ricerca medica lo era da molto tempo. Che non
sia ovvia lo mostra anche la mole di discussioni che ha suscitato e ancora suscita,
in parte, nella comunità medica, a fronte del suo indubbio successo come pratica
metodologica.
Un’immediata critica che è stata rivolta alle prime formulazioni dell’EBM ri-
guarda il ruolo della clinical expertise come base di conoscenza e decisione. Ma
quindi essere un medico o infermiere esperto e intuitivo non serve a nulla, nel
paradigma EBM? La medicina non è forse un’arte di cura? Un secondo aspetto pro-
blematico è il ruolo del paziente, che nella prima formulazione dell’EBM è ridotto
a caso di applicazione di una conoscenza generale, quindi privato delle sue carat-
teristiche individuali. A fronte delle istanze di chi ha sottolineato l’importanza del
giudizio clinico e della singolarità della situazione del paziente, la regola dell’EBM
si è modificata nei decenni, e l’ultima versione è questa31:
l’EBM richiede l’integrazione della migliore evidenza scientifica con la nostra com-
petenza professionale [clinical expertise] e con i valori e le circostanze unici del no-
stro paziente. Con migliore evidenza scientifica intendiamo quella che proviene dalle
scienze mediche di base, ma specialmente dalla ricerca clinica orientata al paziente
sull’accuratezza e precisione dei test diagnostici (esame clinico incluso), sul potere
dei marker prognostici e sull’efficacia e sicurezza delle strategie terapeutiche, riabi-
litative e preventive. Con competenza professionale intendiamo la capacità di utiliz-
zare le nostre capacità cliniche e l’esperienza del passato per identificare rapidamente
lo stato di salute specifico di ciascun paziente e la sua diagnosi, e i rischi e i benefici
individuali di possibili trattamenti/esposizioni/test diagnostici rispetto ai suoi valori
e aspettative. Inoltre, la competenza professionale è necessaria per integrare l’evi-
denza con i valori e le circostanze del paziente. Con valori del paziente intendiamo
le preferenze, preoccupazioni e aspettative individuali che ogni paziente porta con
sé nell’incontro clinico e che, per servire ai suoi scopi, devono essere integrate in
decisioni cliniche condivise; con circostanze del paziente intendiamo lo stato clinico
individuale e il setting.
In sostanza, la competenza professionale del clinico ha un ruolo di euristica
rispetto alle possibilità di diagnosi o intervento – che andrà però confermata dall’e-
videnza – e un altro ruolo nell’adattare le conoscenze generali, tratte dall’evidenza,
al contesto particolare: la cosiddetta estrapolazione. Quanto al paziente, l’EBM ri-
conosce il ruolo della sua autonomia, cioè l’insieme di ragioni e valori che ne fanno
un soggetto umano, nella decisione clinica, e anche delle circostanze in cui si trova
(quale tipo di struttura sanitaria o più generalmente scenario in termini di risorse e
tempo): da caso a cui la conoscenza generale viene applicata ciecamente, dovrebbe
diventare quindi un caso a cui la conoscenza generale viene adattata.
In filosofia della medicina e tra i metodologi si discute se sia sufficiente attri-
buire solo questo ruolo alla competenza professionale del clinico, e se l’importo
epistemico del professionista possa essere differente a seconda delle sotto-discipli-
ne – ad esempio pensiamo allo psichiatra che deve decidere se fare interrompere
al suo paziente il trattamento farmacologico antidepressivo, o al chirurgo che deve
scegliere una tecnica o un’altra: si può sostenere che l’esperienza e le capacità per-
sonali in questi casi siano gran parte di ciò su cui di fatto si basa l’azione, e il pro-
blema di queste discussioni è se sia giusto che resti così, o se è opportuno andare
nella direzione del paradigma EBM32.
Quanto alla singolarità del paziente come rilevante alla decisione clinica, le di-
mensioni di discussione, sia metodologiche (come fare) che filosofiche (in base a
quali principi) sono due. Da una parte c’è la dimensione etica, in cui ad esempio ci
si può interrogare sullo spazio possibile a auspicabile dell’autonomia del paziente
nell’EBM33. Dall’altra c’è la dimensione epistemica, in cui ci si interroga sulla pos-
Prognosi
Grado di raccomandazione
da A. Su questa ultima tesi c’è molto consenso in filosofia della medicina40. Dun-
que, l’evidenza del meccanismo che produce B a partire da A è importante quanto
l’evidenza dell’associazione tra A e B per stabilire che A causa B. Dato che la gerar-
chia dell’evidenza per testare un’ipotesi e quella per orientare le decisioni cliniche
coincidono, questo significa in particolare che la gerarchia dell’evidenza dell’EBM
per orientare le decisioni cliniche è sbagliata e che il ruolo della conoscenza dei
meccanismi o razionale fisiopatologico deve essere rivalutato.
La conclusione appena enunciata è oggi la critica standard dei filosofi all’EBM.
Un modo troppo rapido per bloccarla, e quindi difendere l’EBM, è il seguente: non
è vero che testare un’ipotesi e rispondere ad un quesito clinico necessitano dello
stesso tipo di evidenza – lo vedremo nel §4.8 trattando della validità esterna degli
RCT, una questione rilevante per le decisioni cliniche ma non per la conferma delle
ipotesi. Tuttavia, lasciamo qui questa confutazione sbrigativa e vediamo una rispo-
sta più articolata.
La risposta è fornita da Jeremy Howick e parte dal notare che per ogni effetto
di un intervento A su un esito B, ci sono molti meccanismi coinvolti, oppure molte
parti e livelli di un unico grande meccanismo, di cui spesso non immaginiamo
nemmeno esattamente i confini41. La critica standard funzionerebbe se potessimo
conoscere tutti i meccanismi coinvolti, ma dato che nella grande maggioranza dei
casi questo non è possibile, la critica standard non funziona, e la gerarchia EBM
resta motivata. Howick fa un esempio. Il meccanismo di funzionamento dei farma-
ci antiaritmici suggeriva che potessero ridurre la mortalità nei pazienti colpiti da
infarto. Nel 1987 è iniziato un grande trial multicentrico randomizzato a 4 bracci
(CAST, Cardiac Arrythmia Suppression Trial), che ha coinvolto 1455 pazienti, per te-
stare i possibili benefici di tre di queste molecole rispetto al placebo. Nel 1989, tut-
tavia, due bracci sono stati chiusi per eccessiva mortalità nel gruppo di intervento.
Il risultato – di incremento di mortalità – è stato confermato da studi successivi42
Il problema, argumenta Howick, è che i meccanismi coinvolti nell’effetto della
molecola sull’esito mortale sono più numerosi di più di quelli che spiegano l’effetto
della molecola sul controllo dell’aritmia, e molti di questi erano e sono imprevedi-
bili e sconosciuti. Se l’evidenza del razionale fisiopatologico non equivale alla co-
noscenza di tutti i meccanismi coinvolti – come è in molti casi, data la complessità
del corpo umano e delle sue interazioni con l’ambiente - allora abbiamo una buona
ragione per ritenere che non si tratti di evidenza sufficiente e nemmeno necessaria
per confermare l’interpretazione causale di un effetto, o per prendere una decisio-
ne clinica.
per l’analisi statistica occorre partire da una base di conoscenza biologica, dato
che per individuare la potenza statistica necessaria (e quindi la numerosità del
campione) occorre stimare prima la grandezza dell’effetto che si presume di tro-
vare – e questa stima, ovvimente, non è basata sul vuoto. Questo non è un ruolo
del razionale fisiopatologico come diretta evidenza, ma è comunque un ruolo nella
produzione di evidenza44.
Un’altra funzione importante di questo tipo di conoscenza è nell’applicazione
dei risultati di un RCT o di uno studio osservativo al singolo paziente, o caso, che
ci si trova ad affrontare: nel cosiddetto problema dell’estrapolazione45. Questo è
particolarmente rilevante nel caso di pazienti cronici con comorbilità – situazione
che si presenta sempre più frequentemente in società in cui l’aspettativa di vita si
allunga. Molti RCT testano l’efficacia di un trattamento solo, o al massimo ne valu-
tano l’interazione con altri due. Come si può decidere se somministrare un nuovo
farmaco a un paziente che è già sottoposto ad altre tre terapie? Può darsi che l’evi-
denza di alta qualità sulle interazioni non ci sia, quindi l’unica strategia razionale
è basarsi sull’ipotesi di possibili meccanismi di interazione – quindi su evidenza di
tipo fisiopatologico. Dunque, sapere che una certa conoscenza generale si può ap-
plicare o non applicare è spesso mediato dalla conoscenza patofisiologica generale,
e anche dalle ipotesi particolari sul singolo paziente.46.
Questo stesso punto è stato sollevato a livello di principio, non solo di fatto, dal-
la filosofa della scienza Nancy Cartwright47. L’RCT ci informa dell’effetto medio
sul campione, ma questa sarà sempre una misura differente da quella dell’effetto
singolo sul caso particolare. L’analogia tra il caso particolare e la media del campio-
ne non basta: secondo Cartwright il ragionamento con cui si applica la conoscen-
za generale ottenuta con un RCT al paziente singolo (ad esempio: che l’aspirina
riduce la percezione del mal di testa) non è giustificata se non con ragioni di tipo
causale (su come l’aspirina riduce il mal di testa), che dobbiamo mettere a sistema
con quello che sappiamo della condizione del paziente singolo: con la conoscenza
cioè dei meccanismi patofisiologici. Questa proposta, e altre di questo tipo, sono
di nuovo passibili della critica di Howick: e come facciamo a conoscere tutti i mec-
canismi rilevanti, dato che di solito sono innumerevoli? La discussione quindi è
aperta. Senza volere entrare nel merito, abbiamo qui evidenziato un altro possibile
ruolo dei meccanismi, non come evidenze per la decisione clinica, ma come vinco-
lo alla selezione delle evidenze per la decisione clinica.
Efficacy: Una misura del beneficio che risulta da un intervento per un certo proble-
ma di salute nelle condizioni ideale di uno studio sperimentale48.
La effectiveness è connessa con la validità esterna e, al pari di questa, dipende da
diverse condizioni49. Vediamo le principali.
La scelta del campione. La numerosità del campione per un RCT è un proble-
ma statistico, mentre la scelta dei volontari e i criteri di arruolabilità sono un pro-
blema scientifico e pratico. Pratico perché può essere difficile trovare i volontari
e avere il loro consenso, soprattutto alla randomizzazione dei trattamenti – cioè
rispetto alla possibilità di non ricevere il nuovo farmaco, ma il placebo o il tratta-
mento standard. Alcuni tipi di persone sono più disposte a partecipare, e questo,
come abbiamo già notato nel Capitolo 3, può dare bias di selezione. Ma il proble-
ma è anche scientifico, perché, al netto delle questioni pratiche, occorre stimare
che le differenze tra il campione e la popolazione a cui l’intervento è destinato
Fonte dei dati e selezione degli studi. Il database MEDLINE è stato consultato
per RCT pubblicati tra il 1994 e il 2006 su riviste mediche ad alto impact factor. Di
4827 articoli ne sono stati selezionati 283 con una tecnica seriale.
Conclusioni. Gli RCT pubblicati sulle maggiori riviste mediche spesso non ripor-
tano i criteri di arruolabilità in modo chiaro. Donne, bambini, anziani e persone con
comuni patologie sono inoltre frequentemente esclusi. I trial multicentrici e quelli
che riguardano farmaci hanno più frequentemente questi criteri di esclusione, che
possono impattare negativamente sulla generalizzabilità dei risultati. I nostri risul-
tati sottolineano la necessità di un’attenta considerazione e di una chiara indicazione
e giustificazione dei criteri di esclusione nei trial clinici.
NOTE DI CHIUSURA
1 Bernard, C. (1865). Introduction à l'étude de la médecine expérimentale par m. Claude
Bernard. Paris: Baillière.
2 Una trattazione sintetica e completa in inglese si trova in Wendler, D. The Ethics of
Clinical Research. The Stanford Encyclopedia of Philosophy (Winter 2017 Edition), Edward N.
Zalta (ed.), online https://plato.stanford.edu/archives/win2017/entries/clinical-research/,
accesso del 2 dicembre 2020.
3 Per uno studio clinico sono le CONSORT. Si veda Begg, C., Cho, M., Eastwood, S., Hor-
ton, R., Moher, D., Olkin, I., ... & Stroup, D. F. (1996). Improving the quality of reporting of
randomized controlled trials: the CONSORT statement. Jama, 276(8), 637-639.
4 Un’esposizione rapida e chiara delle fasi di un RCT si trova in Kendall, J. (2003). De-
signing a research project: randomised controlled trials and their principles. Emergency med-
icine journal: EMJ, 20(2), 164.
5 Le linee guida CONSORT per il report dei trial contengono tutte queste informazioni e
definizioni espresse in modo molto chiaro: Schulz, K. F., Altman, D. G., Moher, D., & Con-
sort Group. (2010). CONSORT 2010 statement: updated guidelines for reporting parallel
group randomised trials. Trials, 11(1), 32.
6 Il filosofo che ha sollevato questo punto critico è John Worrall, si veda ad esempio
Worrall, J. (2007). Why there's no cause to randomize. The British Journal for the Philosophy of
Science, 58(3), 451-488.
7 Bolliger, C. T., Zellweger, J. P., Danielsson, T., van Biljon, X., Robidou, A., Westin, Å.,
... & Säwe, U. (2000). Smoking reduction with oral nicotine inhalers: double blind, ran-
domised clinical trial of efficacy and safety. Bmj, 321(7257), 329-333.
8 Una guida utile è Supino, P. G. (2012). Fundamental issues in evaluating the impact of
interventions: Sources and control of bias. In Principles of Research Methodology (pp. 79-110).
Springer, New York, NY. Per la caratterizzazione dei tipi di RCT il riferimento è Higgins
JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Cochrane Hand-
book for Systematic Reviews of Interventions version 6.1 (updated September 2020). Cochrane,
2020. Available from www.training.cochrane.org/handbook.
9 Si veda ad esempio Glenn, B. A., Bastani, R., & Maxwell, A. E. (2013). The perils of
ignoring design effects in experimental studies: lessons from a mammography screening
trial. Psychology & health, 28(5), 593-602.
10 You, W. C., Brown, L. M., Zhang, L., Li, J. Y., Jin, M. L., Chang, Y. S., ... & Gail, M. H.
(2006). Randomized double-blind factorial trial of three treatments to reduce the prevalence
of precancerous gastric lesions. Journal of the National Cancer Institute, 98(14), 974-983.
11 Si veda Catalogue of Biases Collaboration, Spencer EA, Heneghan C. (2018) Compli-
ance bias. In: Catalogue Of Biases, www.catalogueofbiases.org/biases/compliancebias, ac-
cesso del 30 novembre 2020.
12 Barminko, J. A., Nativ, N. I., Schloss, R., & Yarmush, M. L. (2014). Fractional factorial
design to investigate stromal cell regulation of macrophage plasticity. Biotechnology and bio-
engineering, 111(11), 2239-2251.
13 Gordon, P. R., Kerwin, J. P., Boesen, K. G., & Senf, J. (2006). Sertraline to treat hot flash-
es: a randomized controlled, double-blind, crossover trial in a general population. Meno-
pause, 13(4), 568-575.
14 Si veda anche Shadish, W. R., & Heinsman, D. T. Experiments Versus Quasi-Experi-
ments: Do They Yield the Same Answer? Meta-Analysis of Drug Abuse Prevention Programs,
147.
15 Eliopoulos, G. M., Harris, A. D., Bradham, D. D., Baumgarten, M., Zuckerman, I. H.,
Fink, J. C., & Perencevich, E. N. (2004). The use and interpretation of quasi-experimental
studies in infectious diseases. Clinical infectious diseases, 38(11), 1586-1591.
16 Annweiler, C., Hanotte, B., de l’Eprevier, C. G., Sabatier, J. M., Lafaie, L., & Célarier,
T. (2020). Vitamin D and survival in COVID-19 patients: A quasi-experimental study. The
Journal of steroid biochemistry and molecular biology, 204, 105771.
17 Sul sito web dell’AIFA si trovano descritte le fasi dei trial, https://www.aifa.gov.it/web/
guest/sperimentazione-clinica-dei-farmaci, accesso del 6 gennaio 2021.
18 Shader, R. I. (2018). Safety Versus Tolerability. Clinical therapeutics, 40(5), 672-673.
19 Lexchin, J., Bero, L. A., Djulbegovic, B., & Clark, O. (2003). Pharmaceutical industry
sponsorship and research outcome and quality: systematic review. Bmj, 326(7400), 1167-
1170 e Catalogue of Bias Collaboration, Holman B, Bero L, & Mintzes B. (2019) Industry
Sponsorship bias. Catalogue Of Bias 2019: https://catalogofbias.org/biases/industry-spon-
sorship-bias/, accesso del 2 gennaio 2021.
20 Blaskiewicz, R. (2013). The Big Pharma conspiracy theory. Medical Writing, 22(4), 259-
261.
21 Si veda ad esempio Osimani, B. (2013). Until RCT proven? On the asymmetry of evidence
requirements for risk assessment. Journal of evaluation in clinical practice, 19(3), 454-462.
22 Ho adattato qui la definizione di quality of evidence for systematic reviews fornita dalle
linee guida GRADE, traducendo confidence con avere buone ragioni. Le traduzioni letterali
di confidence, come certezza, potrebbero infatti suggerire un elemento soggettivo che non
deve essere incluso. Si veda Schünemann H, Brożek J, Guyatt G, Oxman A, editors (2013)
GRADE handbook for grading quality of evidence and strength of recommendations. Up-
dated October 2013. The GRADE Working Group, disponibile a https://gdt.gradepro.org/
app/handbook/handbook.html#h.9rdbelsnu4iy, accesso del 20 novembre 2020.
23 Ovviamente i bias di non-blinding (dello sperimentatore e dei soggetti) non sono un
rischio per gli studi descrittivi, che non hanno gruppo di controllo, ma questo non significa
che questi possano fornire un’evidenza migliore per un’ipotesi da testare: hanno il proble-
ma centrale dei confondimenti. Questo punto fondamentale è sfuggito completamente a
Borgerson, K. (2009). Valuing evidence: bias and the evidence hierarchy of evidence-based
medicine. Perspectives in biology and medicine, 52(2), 218-233.
24 Smith, G. D., & Ebrahim, S. (2002). Data dredging, bias, or confounding: They can all
get you into the BMJ and the Friday papers. BMJ: British Medical Journal, 325(7378), 1437.
25 La meta-analisi è Stampfer M., Colditz G. (1991) Estrogen replacement therapy and
coronary heart disease: a quantitative assessment of the epidemiologic evidence. Preventive
Medicine 1991; 20:47-63. I risultati degli RCT sono in Beral V, Banks E, Reeves G. (2002)
Evidence from randomised trials on the longterm effects of hormone replacement therapy.
Lancet 2002; 360:942-4
26 La review è Willett W. (1990) Vitamin A and lung cancer. Nutrition Reviews 1990;
48:201-11, mentre il trial è Alpha-Tocopherol, Beta Carotene Cancer Prevention Study
Group (1994). The effect of vitamin E and beta carotene on the incidence of lung cancer and
other cancers in male smokers. New England Journal of Medicine 330:1029-35.
27 Kim, A. H., Sparks, J. A., Liew, J. W., Putman, M. S., Berenbaum, F., Duarte-García,
A., ... & Grainger, R. A Rush to Judgment? Rapid Reporting and Dissemination of Results
and Its Consequences Regarding the Use of Hydroxychloroquine for COVID-19. Annals of
Internal Medicine. Lo studio ORCHID è Self, W. H., Semler, M. W., Leither, L. M., Casey, J.
D., Angus, D. C., Brower, R. G., ... & Brown, S. M. (2020). Effect of hydroxychloroquine on
clinical status at 14 days in hospitalized patients with COVID-19: a randomized clinical
trial. JAMA, 324(21), 2165-2176. Si veda anche RECOVERY Collaborative Group. (2020).
Effect of hydroxychloroquine in hospitalized patients with Covid-19. New England Journal
of Medicine, 383(21), 2030-2040.
28 Howick, J. (2016) The Philosophy of Evidence-based Medicine. Oxford: Oxford Univer-
sity Press. Kindle edition, p. 53.
29 Uno degli articoli storici per l’EBM è Sackett, D. L., Rosenberg, W. M., Gray, J. M.,
Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine: what it is and what it
isn't. BMJ: British Medical Journal, 312(7023), 71. Si veda anche Howick, J. (2016) The Philoso-
phy of Evidence-based Medicine. Oxford: Oxford University Press per una breve ricostruz-
ione storica del movimento.
30 Sackett, D. L., et al. 1991. Clinical epidemiology: A basic science for clinical medicine,
2nd ed. Toronto: Little, Brown.
31 Straus, S. E., Glasziou, P., Richardson, W. S., Haynes, R. B., Pattani, R., & Veroniki, A.
A. (2005). How to practice and teach EBM. Evidence-Based Medicine. Third edition. New York:
Elsevier, 13-29.
32 In filosofia della psichiatria il ruolo epistemico del giudizio clinico è discusso in Thorn-
ton, T. (2007). Essential philosophy of psychiatry. Oxford: Oxford University Press. Per la dis-
cussione in chirurgia si veda ad esempio Black, N. (1999). Evidence-based surgery: a pass-
ing fad?. World journal of surgery, 23(8), 789-793.
33 Per la filosofia rimando a Bluhm, R. (2009). Evidence-based medicine and patient au-
tonomy. IJFAB: International Journal of Feminist Approaches to Bioethics, 2(2), 134-151 e nella
letteratura medica Rogers, W. A. (2002). Evidence‐based medicine in practice: limiting or
facilitating patient choice?. Health Expectations, 5(2), 95-103.
34 Si vedano ad esempio Goldberger, J. J., & Buxton, A. E. (2013). Personalized medicine
vs guideline-based medicine. Jama, 309(24), 2559-2560 e Senn, S. (2018). Statistical pitfalls of
personalized medicine. Natur, 563(7733), 619-621.
35 Una panoramica con opinioni si trova in Upshur, R. (2005). Looking for rules in a
world of exceptions: reflections on evidence-based practice. Perspectives in biology and medi-
cine, 48(4), 477-489.
36 Secondo Howick (vedi nota 22) la filosofia dell’evidenza dell’EBM non è cambiata in
modo rilevante, perché la conoscenza dei meccanismi e il giudizio degli esperti è sempre al
livello più basso. Tuttavia, la posizione degli studi osservazionali rispetto agli RCT è sicur-
amente diversa.
37 Oxford Centre for Evidence-Based Medicine (2009) Levels of Evidence (March 2009). Di-
sponibile a https://www.cebm.ox.ac.uk/resources/levels-of-evidence/oxford-centre-for-evi-
dence-based-medicine-levels-of-evidence-march-2009, accesso del 25 novembre 2020. Per
il sistema GRADE si veda Guyatt, G., Oxman, A. D., Akl, E. A., Kunz, R., Vist, G., Brozek,
J., ... & Schünemann, H. J. (2011). GRADE guidelines: 1. Introduction—GRADE evidence
profiles and summary of findings tables. Journal of clinical epidemiology, 64(4), 383-394.
38 Cardoso, F., Kyriakides, S., Ohno, S., Penault-Llorca, F., Poortmans, P., Rubio, I. T., ...
& Senkus, E. (2019). Early breast cancer: ESMO Clinical Practice Guidelines for diagnosis,
treatment and follow-up. Annals of Oncology, 30(8), 1194-1220.
39 Contro le gerarchie di evidenza e sulla dissoluzione delle gerarchie con GRADE, si
veda Stegenga, J. (2014). Down with the hierarchies. Topoi, 33(2), 313-322.
40 Il riferimento classico è Russo, F., & Williamson, J. (2007). Interpreting causality in the
health sciences. International studies in the philosophy of science, 21(2), 157-170.
41 Howick, J.( 2016) The Philosophy of Evidence-based Medicine. Oxford: Wiley. Edizione
del Kindle, pp. 124-128. Si veda anche Broadbent, A. (2011) Inferring causation in epidemi-
ology: mechanisms, black boxes, and contrasts. In Illari, Russo and Williamson (eds.) Cau-
sality in the Sciences, OUP, Oxford, 2011, 45-69.
42 La fonte è Yap, Y. G., & Camm, A. J. (1999). Lessons from antiarrhythmic trials involv-
ing class III antiarrhythmic drugs. The American journal of cardiology, 84(9), 83-89.
43 Schünemann, H., Hill, S., Guyatt, G., Akl, E. A., & Ahmed, F. (2011). The GRADE
approach and Bradford Hill’s criteria for causation. Journal of Epidemiology & Community
Health, 65(5), 392-395.
44 Si veda ad esempio La Caze, A. (2011). The role of basic science in evidence-based med-
icine. Biology & Philosophy, 26(1), 81-98.
Alter, D. A., Naylor, C. D., Austin, P., & Tu, J. V. (1999). Effects of socioeconomic status
on access to invasive cardiac procedures and on mortality after acute myocardial infarction.
New England Journal of Medicine, 341(18), 1359-1367.
Amoretti, M. C. (2015). Filosofia e medicina. Roma, Carocci
Andersen, H. and Hepburn, B. (2020) Scientific Method. The Stanford Encyclopedia of Phi-
losophy (Winter 2020 Edition), Edward N. Zalta (ed.), https://plato.stanford.edu/archives/
win2020/entries/scientific-method/, accesso 12 gennaio 2021
Andersen, H. and Hepburn, B. (2020) Scientific Method. The Stanford Encyclopedia of Phi-
losophy (Winter 2020 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/ar-
chives/win2020/entries/scientific-method/
Annweiler, C., Hanotte, B., de l’Eprevier, C. G., Sabatier, J. M., Lafaie, L., & Célarier,
T. (2020). Vitamin D and survival in COVID-19 patients: A quasi-experimental study. The
Journal of steroid biochemistry and molecular biology, 204, 105771.
Anon (1995). Abortion: one Romania is enough. Lancet 1995; 345: 137–38.
Antiseri, D., Scandellari, C., & Federspil, G. (2003). Epistemologia, clinica medica e la
questione delle medicine eretiche. Cosenza: Rubbettino Editore.
Bacone, F. (1975) [1620] Scritti filosofici. Torino: UTET
Barminko, J. A., Nativ, N. I., Schloss, R., & Yarmush, M. L. (2014). Fractional factorial
design to investigate stromal cell regulation of macrophage plasticity. Biotechnology and bio-
engineering, 111(11), 2239-2251
Beaney, M. (2018) Analysis. The Stanford Encyclopedia of Philosophy (Summer 2018 Edi-
tion), Edward N. Zalta (ed.), https://plato.stanford.edu/archives/sum2018/entries/analysis/,
accesso del 28 novembre 2020.
Begg, C., Cho, M., Eastwood, S., Horton, R., Moher, D., Olkin, I., ... & Stroup, D. F.
(1996). Improving the quality of reporting of randomized controlled trials: the CONSORT
statement. Jama, 276(8), 637-639.
Beral V, Banks E, Reeves G. (2002) Evidence from randomised trials on the longterm
effects of hormone replacement therapy. Lancet 2002; 360:942-4.
Bernard, C. (1865). Introduction à l’étude de la médecine expérimentale par m. Claude
Bernard. Paris: Baillière.
Beyerstein, B. L., & Beyerstein, D. F. (1992). The write stuff: Evaluations of graphology, the
study of handwriting analysis. Buffalo: Prometheus Books.
Bird, A. (2010). Eliminative abduction: examples from medicine. Studies in History and
Philosophy of Science Part A, 41(4), 345-352.
Bird, A. (2011). The epistemological function of Hill’s criteria. Preventive Medicine, 53(4-
5), 242-245.
Black, N. (1999). Evidence-based surgery: a passing fad?. World journal of surgery, 23(8),
789-793.
Blaskiewicz, R. (2013). The Big Pharma conspiracy theory. Medical Writing, 22(4), 259-
261.
Bluhm, R. (2009). Evidence-based medicine and patient autonomy. IJFAB: International
Journal of Feminist Approaches to Bioethics, 2(2), 134-151.
Boden, M. A. (2004) The Creative Mind: Myths and Mechanisms. London: Routledge
Boem, F. (2020) Scientific Protocols as Recipes. Humana Mente 13 (38), 281-299
Bolliger, C. T., Zellweger, J. P., Danielsson, T., van Biljon, X., Robidou, A., Westin, Å., ...
& Säwe, U. (2000). Smoking reduction with oral nicotine inhalers: double blind, randomi-
sed clinical trial of efficacy and safety. Bmj, 321(7257), 329-333.
Boniolo, G., Dalla Chiara, M. L., Giorello, G., Sinigaglia, C., & Tagliagambe, S. (2002).
Filosofia della scienza. Milano: Raffaello Cortina.
Borgerson, K. (2009). Valuing evidence: bias and the evidence hierarchy of evidence-ba-
sed medicine. Perspectives in biology and medicine, 52(2), 218-233.
Borges, J.L. (1984) L’idioma analitico di John Wilkins. In Altre inquisizioni, Tutte le opere.
Volume I. Milano: Mondadori. 1984
Bramley, N., & Eatough, V. (2005). The experience of living with Parkinson’s disease: An
interpretative phenomenological analysis case study. Psychology & Health, 20(2), 223-235.
Brewer, J. F. (1999). Graphology. Complementary Therapies in Nursing and Midwifery, 5(1), 6-14.
Broadbent, A. (2009). Causation and models of disease in epidemiology. Studies in Hi-
story and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biome-
dical Sciences, 40(4), 302-311
Campaner, R. (2005). Spiegazioni e cause in medicina: un’indagine epistemologica. Gedit edi-
zioni.
Doll R, Payne P, Waterhouse J (1966) eds. Cancer incidence in five continents, vol. I.
Geneva: Union Internationale Contre le Cancer.
Doll, R. (2001). Cohort studies: history of the method II. Retrospective cohort studies.
Sozial-und Präventivmedizin, 46(3), 152-160.
Doll, R., & Hill, A. B. (1964). Mortality in relation to smoking: ten years’ observations of
British doctors. British medical journal, 1(5395), 1399.
Doll, R., Peto, R., Boreham, J., & Sutherland, I. (2004). Mortality in relation to smoking:
50 years’ observations on male British doctors. British Medical Journal, 328(7455), 1519
Elgin, C. Z. (2017). True enough. Boston: MIT Press.
Eliopoulos, G. M., Harris, A. D., Bradham, D. D., Baumgarten, M., Zuckerman, I. H.,
Fink, J. C., & Perencevich, E. N. (2004). The use and interpretation of quasi-experimental
studies in infectious diseases. Clinical infectious diseases, 38(11), 1586-1591.
Feynman, R. (1964) Messenger Lectures: The character of Physical Law. Cambridge,
MIT Press.
Fisher, R. A. (1958). Cancer and smoking. Nature, 182(4635), 596-596.
Ford, I., & Norrie, J. (2016). Pragmatic trials. New England journal of medicine, 375(5), 454-
463.
Galavotti, M.C.e Campaner, R. (2017) Filosofia della scienza. Milano: Egea
Galilei, G (1970). Discorso sopra i massimi sistemi. Torino: Einaudi
Galilei, G. Il Saggiatore, Milano, Feltrinelli 1992 (ed. or. 1623)
Gallo, R. C., & Montagnier, L. (2003). The discovery of HIV as the cause of AIDS. New
England Journal of Medicine, 349(24), 2283-2285.
Gerber, D. E., Pruitt, S. L., & Halm, E. A. (2015). Should criteria for inclusion in cancer
clinical trials be expanded? Journal of comparative effectiveness research, 4(4), 289-291.
Giannini, M., Pellegrini, P., Gori, A., & Loscalzo, Y. (2019). Is graphology useful in asses-
sing major depression?. Psychological reports, 122(2), 398-410
Gillies, D. (2005). Hempelian and Kuhnian approaches in the philosophy of medicine:
the Semmelweis case. Studies in history and philosophy of science part C: Studies in history and
philosophy of biological and biomedical sciences, 36(1), 159-181.
Glenn, B. A., Bastani, R., & Maxwell, A. E. (2013). The perils of ignoring design effects
in experimental studies: lessons from a mammography screening trial. Psychology & health,
28(5), 593-602. You, W. C., Brown, L. M., Zhang, L., Li, J. Y., Jin, M. L., Chang, Y. S., ... & Gail,
M. H. (2006). Randomized double-blind factorial trial of three treatments to reduce the pre-
valence of precancerous gastric lesions. Journal of the National Cancer Institute, 98(14), 974-983.
Goldberger, J. J., & Buxton, A. E. (2013). Personalized medicine vs guideline-based me-
dicine. Jama, 309(24), 2559-2560
Goodman, S. (2008). A Dirty Dozen: Twelve P-Value Misconceptions. In Seminars in He-
matology (Vol. 3, No. 45, pp. 135-140).
Gordon, P. R., Kerwin, J. P., Boesen, K. G., & Senf, J. (2006). Sertraline to treat hot flashes:
a randomized controlled, double-blind, crossover trial in a general population. Menopause,
13(4), 568-575.
Grimes, D. A., & Schulz, K. F. (2002). An overview of clinical research: the lay of the land.
Lancet, 359(9300), 57-61
Grimes, D. A., & Schulz, K. F. (2002). Descriptive studies: what they can and cannot do.
The Lancet, 359(9301), 145-149.
Guyatt, G., Oxman, A. D., Akl, E. A., Kunz, R., Vist, G., Brozek, J., ... & Schünemann, H. J.
(2011). GRADE guidelines: 1. Introduction—GRADE evidence profiles and summary of fin-
dings tables. Journal of clinical epidemiology, 64(4), 383-394.
Hempel, C. G. (1965) Philosophy of natural science. Prentice Hall: Englewood Cliffs.
Higgins J., Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Co-
chrane Handbook for Systematic Reviews of Interventions version 6.1 (updated September 2020).
Cochrane, 2020, www.training.cochrane.org/handbook, accesso del 2 gennaio 2021.
Hill, S. B. (1965). The Environment and Disease: Association or Causation?. Proceedings
of the Royal Society of Medicine, 58, 295-300, p. 296.
Howick, J. (2016) The Philosophy of Evidence-based Medicine. Oxford: Oxford Univer-
sity Press.
Hoyningen-Huene, P. (2013). Systematicity: The nature of science. Oxford University Press.
Hwang, T. J., & Gyawali, B. (2019). Association between progression‐free survival and
patients’ quality of life in cancer clinical trials. International journal of cancer, 144(7), 1746-1751
Illari, P. M., & Williamson, J. (2012). What is a mechanism? Thinking about mechanisms
across the sciences. European Journal for Philosophy of Science, 2(1), 119-135
Imai, K., & Nakachi, K. (1995). Cross sectional study of effects of drinking green tea on
cardiovascular and liver diseases. British Medical Journal, 310 (6981), 693-696.
Jorge Luis Borges (1984) L’idioma analitico di John Wilkins. In Altre inquisizioni, Tutte le
opere. Volume I. Milano: Mondadori. 1984
Kendall, J. (2003). Designing a research project: randomised controlled trials and their
principles. Emergency medicine journal: EMJ, 20(2), 164.
Kersting, C., Kneer, M., & Barzel, A. (2020). Patient-relevant outcomes: what are we
talking about? A scoping review to improve conceptual clarity. BMC health services research,
20(1), 1-16
Kim, A. H., Sparks, J. A., Liew, J. W., Putman, M. S., Berenbaum, F., Duarte-García, A., ...
& Grainger, R. A Rush to Judgment? Rapid Reporting and Dissemination of Results and Its
Consequences Regarding the Use of Hydroxychloroquine for COVID-19. Annals of Internal
Medicine.
Kim, C., & Prasad, V. (2015). Cancer drugs approved on the basis of a surrogate end
point and subsequent overall survival: an analysis of 5 years of US Food and Drug Admini-
stration approvals. JAMA internal medicine, 175(12), 1992-1994.
Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi (ed. or.
1962)
Kuhn, T.S. (1980) Logica della scoperta o psicologia della ricerca? In Giorello, G. (a cura
di) Critica e crescita della conoscenza. Milano: Feltrinelli
La Caze A. (2017) The randomized controlled trial: internal and external validity. In:
Solomon M, Simon J and Kincaid H (eds). The Routledge Companion to Philosophy of Me-
dicine. London: Routledge, 200–203.
La Caze, A. (2011). The role of basic science in evidence-based medicine. Biology & Phi-
losophy, 26(1), 81-98.
Lalumera, E. (2019) Il problema della classificazione dei disturbi mentali. Cap. 4 in R.
Guerini e M. Marraffa (a cura di) (2019) Psicopatologia e scienze cognitive. Roma: Carocci
LaMorte, W. (2016) Outbreak investigations. Boston: Boston University School of Public
Health
Langevin-Joliot, H. (1998). Radium, Marie Curie and Modern Science. Radiation Research,
S3-S8.
Last, J. M. (2001) A Dictionary of Epidemiology. Fourth Edition. Oxford University
Press, disponibili sul sito del Centre for Evidence-based medicine, https://www.cebm.ox.ac.
uk/resources/ebm-tools/glossary, accesso del 6 dicembre 2020.
Laudisa F. (2012). Causalità. APhEx 5. On-line: http://www.aphex.it/index.php?Temi=-
557D030122027403210E057677 73
Laudisa, F. e Datteri, E. (2012) La natura e i suoi modelli. Bologna: Archetipolibri.
Laupacis A, Wells G, Richardson S, et al. Users guides to the medical literature. V. How
to use an article about prognosis. JAMA 1994; 272:234–237
Lavik, E., Kuehn, M. H., & Kwon, Y. H. (2011). Novel drug delivery systems for glauco-
ma. Eye, 25(5), 578-586.
Lexchin, J., Bero, L. A., Djulbegovic, B., & Clark, O. (2003). Pharmaceutical industry
sponsorship and research outcome and quality: systematic review. Bmj, 326(7400), 1167-
1170
Lorenzano P. (2014) What is the status of the Hardy-Weinberg law within population
genetics? In: Galavotti M.C., Nemeth E., Stadler F. (eds) European philosophy of science—
philosophy of science in Europe and the Viennese Heritage, Vienna Circle Institute Yearbo-
ok 17. Springer, Dordrecht, pp 159–172
Lucas, R. M., & McMichael, A. J. (2005). Association or causation: evaluating links betwe-
en environment and disease. Bulletin of the World Health Organization, 83, 792-795.
Marshall B. and Warren R. (1984). Unidentified Curved Bacilli in the Stomach of Patients
with Gastritis and Peptic Ulceration. Lancet. 2 (8626/8627):1437-41
McBride, W. G. (1961) Thalidomide and Congenital Abnormalities. Letter to the Editor.
The Lancet 2 (December 16, 1961): 1358
Melchert, M., & List, A. (2007). The thalidomide saga. The international journal of bioche-
mistry & cell biology, 39(7-8), 1489-1499.
Mill, J. S. (1869). A System of Logic, Ratiocinative and Inductive: Being a Connected View of the
Princilples of Evidence and the Methods of Scientific Investigation. London: Harper and brothers
Miner, J., & Hoffhines, A. (2007). The discovery of aspirin’s antithrombotic effects. Texas
Heart Institute Journal, 34(2), 179-186.
Muldoon, M. F., Barger, S. D., Flory, J. D., & Manuck, S. B. (1998). What are quality of life
measurements measuring?. BMJ, 316(7130), 542.
Nelson, D. L., & Cox, M. M. (2017). Lehninger Principles of Biochemistry 7th edition.
London, MacMillan, ii. Traversa, G., Maggini, M., Menniti‐Ippolito, F., Bruzzi, P., Chiarot-
ti, F., Greco, D., ... & Italian Study Group for the Di Bella Multitherapy Trials. (1999). The
unconventional Di Bella cancer treatment: A reflection on the Italian experience. Cancer,
86(10), 1903-1911.
Newton, I. (1997) Opere, a cura di Pala, A. vol. 1, Principi matematici della filosofia na-
turale, Torino, UTET
Nissen, T., & Wynn, R. (2014). The clinical case report: a review of its merits and limita-
tions. BMC research notes, 7(1), 264.
Okasha, S. (2012) Il Primo libro di filosofia della scienza. Torino: Einaudi.
Osimani, B. (2013). Until RCT proven? On the asymmetry of evidence requirements for
risk assessment. Journal of evaluation in clinical practice, 19(3), 454-462.
Oxford Centre for Evidence-Based Medicine (2009) Levels of Evidence (March 2009). Di-
sponibile a https://www.cebm.ox.ac.uk/resources/levels-of-evidence/oxford-centre-for-evi-
dence-based-medicine-levels-of-evidence-march-2009, accesso del 25 novembre 2020
Pagnini, A. (2010). Filosofia della medicina. Epistemologia, ontologia, etica, diritto.
Roma: Carocci.
Pearce, N. (2000). The ecological fallacy strikes back. Journal of Epidemiology and Commu-
nity Health, 54(5), 326
Popper, K. R (1972) [1953]. Congetture e confutazioni: lo sviluppo della conoscenza scientifica.
Bologna: il Mulino.
Popper, K. R. (1970) [1964]. Logica della scoperta scientifica. Torino: Einaudi.
Popper, K. R. (1989) Logica della ricerca e società aperta, Antologia a cura di D. Antiseri.
Brescia: La Scuola. 36-37
Psillos, S. (1999) Scientific Realism: How Science Tracks Truth, London: Routledge
RECOVERY Collaborative Group. (2020). Effect of hydroxychloroquine in hospitalized
patients with Covid-19. New England Journal of Medicine, 383(21), 2030-2040.
Ribot, T. (1898). Correspondance. Revue Encyclopédique, 8(232), 151, citato in Nicolas, S., An-
drieu, B., Sanitioso, R., Vincent, R. & Murray, D. (2015). Alfred Binet and Crépieux-Jamin: Can
intelligence be measured scientifically by graphology?. L’Année psychologique, vol. 115(1), 3-52.
Semmelweis, I. P. (1861). Die aetiologie, der begriff und die prophylaxis des kindbettfie-
bers. Wien: Hartleben.
Senn, S. (2018). Statistical pitfalls of personalized medicine. Nature, 563(7733), 619-621.
Shader, R. I. (2018). Safety Versus Tolerability. Clinical therapeutics, 40(5), 672-673.
Shadish, W. R., & Heinsman, D. T. Experiments Versus Quasi-Experiments: Do They
Yield the Same Answer? Meta-Analysis of Drug Abuse Prevention Programs, 147.
Shang, J., Wan, Y., Luo, C., Ye, G., Geng, Q., Auerbach, A., & Li, F. (2020). Cell entry
mechanisms of SARS-CoV-2. Proceedings of the National Academy of Sciences, 117(21), 11727-
11734. Bechtel, W., & Abrahamsen, A. (2005). Explanation: A mechanist alternative. Studies
in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and
Biomedical Sciences, 36(2), 421-441
Smith, G. D., & Ebrahim, S. (2002). Data dredging, bias, or confounding: They can all get
you into the BMJ and the Friday papers. BMJ: British Medical Journal, 325(7378), 1437.
Stampfer M., Colditz G. (1991) Estrogen replacement therapy and coronary heart disease:
a quantitative assessment of the epidemiologic evidence. Preventive Medicine 1991; 20:47-63
Steel, D. (2007). Across the boundaries: Extrapolation in biology and social science. Oxford
University Press.
Stegenga, J. (2014). Down with the hierarchies. Topoi, 33(2), 313-322.
Straus, S. E., Glasziou, P., Richardson, W. S., Haynes, R. B., Pattani, R., & Veroniki, A. A.
(2005). How to practice and teach EBM. Evidence-Based Medicine. Third edition. New York:
Elsevier, 13-29.
Supino, P. G. (2012). The Research Hypothesis: Role and Construction. In Principles of
Research Methodology (pp. 31-53). Springer, New York, NY.
Thagard P. (1998). Ulcers and Bacteria I: Discovery and Acceptance. Studies in History
and Philosophy of Science. Part C: Studies in History and Philosophy of Biology and Biomedical
Sciences. 29:107-36.
Thornton, T. (2007). Essential philosophy of psychiatry. Oxford: Oxford University Press.
Tu, J. V., & Ko, D. T. (2008). Ecological studies and cardiovascular outcomes research.
Circulation, 118(24), 2588-2593.
U.S. Department of Health and Human Services Centers for Disease Control and Pre-
vention (CDC) (2012) Principles of Epidemiology in Public Health Practice. Atlanta: CDC
Upshur, R. (2005). Looking for rules in a world of exceptions: reflections on evidence-ba-
sed practice. Perspectives in biology and medicine, 48(4), 477-489.
Van Spall, H. G., Toren, A., Kiss, A., & Fowler, R. A. (2007). Eligibility criteria of ran-
domized controlled trials published in high-impact general medical journals: a systematic
sampling review. Jama, 297(11), 1233-1240.
Venes, D. (2009) Taber’s Cyclopedic Medical Dictionary. 21st edition. Philadelphia: F.A.
Davis Company