Elisabetta Lalumera - Medicina e Metodo Sperimentale

Che cos’è il metodo scientifico, che distingue le
scienze dagli altri saperi? E che cos’è il metodo

scientifico nella ricerca in medicina oggi? Questo
ELISABETTA LALUMERA
libro è un’introduzione alla metodologia della ri-
cerca clinica e insieme un’introduzione ad alcuni
ELISABETTA LALUMERA - MEDICINA E METODO SPERIMENTALE. UN’INTRODUZIONE FILOSOFICA

temi del dibattito contemporaneo in filosofia del-
la medicina. Con un linguaggio molto semplice,
senza formule statistiche né gergo filosofico e con MEDICINA E METODO SPERIMENTALE
esempi tratti dalla letteratura medica, il volume
traccia un percorso dai fondamenti del metodo
fino alla metodologia contemporanea e alla gerar- UN’INTRODUZIONE FILOSOFICA
chia delle evidenze della Evidence-based medicine.
Vengono illustrati i vari tipi di studi, osservazio-
nali e sperimentali chiedendosi, per ciascuno: che
tipo di ragioni fornisce? Quali sono i suoi limiti e
potenzialità epistemiche, cioè rispetto alla ricerca
della verità?
Elisabetta Lalumera (PhD in

filosofia, 2001) si occupa di
filosofia della medicina. Ha
studiato nelle università di
Bologna, Piemonte Orienta-
le, Londra e Aberdeen, e ha
insegnato Filosofia del linguaggio e della scienza
Feedback
all’Università di Milano-Bicocca dal 2006. Oggi
svolge attività di insegnamento e ricerca presso il
978-88-9385-250-0 dipartimento di Scienze per la Qualità della Vita
dell’Università di Bologna. Ha pubblicato sulle
principali riviste di filosofia della medicina inter-
nazionali e ha svolto attività di consulenza per
istituzioni sanitarie e ospedaliere. Tra i suoi libri:
Euro 18,00
Philosophy of Advanced Medical Imaging (a cura di,
con S. Fanti, Springer), Cosa sono i concetti (Later-
za) Pensare. Leggi ed errori del ragionamento (con
A. Coliva, Carocci). Fa parte del consiglio direttivo
del centro interateneo PhilHeaD-Research Center in
www.editrice-esculapio.it
Philosophy of Health and Disease.
CopertinaSceltaLalumera.indd 1 16/02/2021 10:56:37

ELISABETTA LALUMERA
MEDICINA E METODO SPERIMENTALE

UN’INTRODUZIONE FILOSOFICA
Libro Lalumera.indb 1 16/02/2021 11:26:51

ISBN 978-88-9385-250-0
© Copyright 2021.
Società Editrice Esculapio s.r.l.
Via Terracini, 30 – 40131 Bologna
www.editrice-esculapio.com – info@editrice-esculapio.it
Layout copertina: Laura Brugnoli

Impaginazione: Laura Brugnoli
Stampato da: Legodigit – Lavis (TN)
Printed in Italy
Le fotocopie per uso personale (cioè privato e individuale, con esclusione quindi di strumen-
ti di uso collettivo) possono essere effettuate, nei limiti del 15% di ciascun volume, dietro
pagamento alla S.I.A.E del compenso previsto dall’art. 68, commi 4 e 5, della legge 22 aprile
1941 n. 633. Tali fotocopie possono essere effettuate negli esercizi commerciali convenzionati
S.I.A.E. o con altre modalità indicate da S.I.A.E. Per le riproduzioni ad uso non personale
(ad esempio: professionale, economico o commerciale, strumenti di studio collettivi, come
dispense e simili) l’editore potrà concedere a pagamento l’autorizzazione a riprodurre un
numero di pagine non superiore al 15% delle pagine del volume.
CLEARedi - Centro Licenze e Autorizzazioni per le Riproduzioni Editoriali Corso di Porta
Romana, n. 108 - 20122 Milano
e-mail: autorizzazioni@clearedi.org - sito: http://www.clearedi.org.

INDICE
Prefazione......................................................................................................................... iii
Capitolo primo: Che cos’è la scienza............................................................................. 1

1.1 Due casi: la grafologia e la memoria dell’acqua................................................. 1
1.2 Che cos’è la scienza................................................................................................. 3
1.3 Sistematicità............................................................................................................. 5
1.4 Leggi ........................................................................................................................ 7
1.5 Teorie...................................................................................................................... 10
1.6 Gli scopi della scienza.......................................................................................... 12
1.7 Tipi di spiegazioni scientifiche........................................................................... 14
1.8 Un intermezzo: e le cause?.................................................................................. 18
1.9 Credibilità.............................................................................................................. 21
1.10 Filosofia della scienza........................................................................................ 23
Capitolo secondo: Il metodo sperimentale................................................................ 33

2.1 Il metodo, semplificato........................................................................................ 33
2.2 Dall’osservazione all’ipotesi per induzione...................................................... 37
2.3 Un’ipotesi per induzione: Craven e l’aspirina.................................................. 43
2.4 Dall’osservazione all’ipotesi per abduzione..................................................... 45
2.5 Un’ipotesi per abduzione: AIDS e HIV............................................................. 47
2.6 Dall’ipotesi alle previsioni e dalle previsioni al controllo: deduzione......... 50
2.7 Una deduzione holmesiana: il caso di Ignaz Semmelweis ............................ 53
2.8 La medicina come scienza normale................................................................... 56

iv Medicina e metodo sperimentale. Un’introduzione filosofica
Capitolo terzo: Gli studi osservazionali..................................................................... 63

3.1 Classificazione della ricerca ............................................................................... 63
3.2 Studio di coorte prospettico................................................................................ 71
3.3. Validità interna, confondimenti e bias.............................................................. 75
3.4 Studi caso-controllo ............................................................................................. 82
3.5 Studi trasversali.................................................................................................... 85
3.6 Secondo intermezzo sulle cause: i criteri di Hill.............................................. 88
3.7 Studi ecologici....................................................................................................... 95
3.8 Case studies e serie di casi..................................................................................... 98
Capitolo quarto: Gli studi sperimentali................................................................... 105

4.1 Osservare o sperimentare?................................................................................ 105
4.2 Studi controllati randomizzati (RCT).............................................................. 107
4.3 Alcuni tipi di RCT............................................................................................... 112
4.4 Studi quasi sperimentali e pre-sperimentali................................................... 117
4.5 Trial farmacologici.............................................................................................. 119
4.6 RCT come gold standard...................................................................................... 121
4.7 EBM: gerarchia dell’evidenza per le domande cliniche................................ 124
4.8 Terzo intermezzo sulle cause: e i meccanismi?.............................................. 131
4.9 Altre dimensioni per valutare gli RCT............................................................ 135
Riferimenti bibliografici.............................................................................................. 145

PREFAZIONE
Questo libro ha origine da una domanda: della riflessione filosofica sul metodo
sperimentale, cosa può servire e cosa può interessare a uno studente di medicina,
o a un medico o ricercatore che vuole ampliare la propria prospettiva? La mia ri-
sposta, ovviamente parziale e limitata dalle mie competenze, è che possa servire e
interessare uno sguardo dall’esterno sui concetti e le assunzioni che costituiscono
il metodo sperimentale, anche e soprattutto perché oggi è costituito da metodo-
logie complesse e codificate alle quali si viene addestrati, prima di comprender-
le. Lo scienziato tipicamente non si interroga sulle proprie procedure mentre fa il
suo lavoro: non potrebbe fare altrimenti. Come ha scritto lo storico e filosofo della
scienza Thomas Kuhn:
[i]l fatto che gli scienziati di solito non si chiedono, o non discutono, cosa renda legit-
timo un particolare problema o una particolare soluzione ci induce a supporre che,
almeno intuitivamente, essi conoscano la risposta. Ma può anche semplicemente in-
dicare che né la domanda né la risposta sono considerate rilevanti per la loro ricerca*.
Tuttavia, ha senso che chi comincia a studiare medicina applichi questo sguardo
dall’esterno, prima di immergersi nella pratica, sguardo che potrà poi riprendere
in futuro, e chi già lavora ogni tanto cambi il focus facendo uno zooming out dalla
propria prospettiva. Per interesse personale, per completezza di visione, ma anche
* Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi, 68

vi Medicina e metodo sperimentale. Un’introduzione filosofica
e soprattutto per evitare errori che vengono dall’essere in grado di seguire una
regola in uso tra i propri pari, senza sapere esattamente qual è, a che cosa serve e
perché è valida.
Lo sguardo dall’esterno che qui si adotta sui concetti in uso nella pratica spe-
rimentale in medicina è quello della filosofia della medicina contemporanea, un
ambito disciplinare che ha senza dubbio origini antiche, ma che come insieme di
metodi e di domande condivise non ha più di cinquant’anni. La ricerca in filosofia
della medicina procede per analisi e chiarificazione concettuale a diretto contatto
con la ricerca empirica delle scienze biomediche**.
A livello pratico questo libro consiste nel mettere insieme due ambiti disciplinari:
la filosofia della medicina e la metodologia degli studi sperimentali. Nel mettere in-
sieme qui c’è un notevole lavoro di semplificazione e di astrazione dal dettaglio. Ri-
spetto ai libri di introduzione alla filosofia della scienza e di filosofia della medicina,
si è ridotta al minimo la discussione delle risposte alle domande che interessano ai
filosofi, e quasi sempre mi sono limitata a segnalare “qui c’è una domanda”. Inoltre,
ho selezionato solo le domande pertinenti al metodo scientifico – non, ad esempio,
altre questioni altrettanto centrali, come i concetti di malattia e salute, o quello del-
le classificazioni. Rispetto ai manuali di metodologia, si astrae dal dettaglio e dalla
parte matematico-statistica e ci si sofferma sul capire perché il canone metodologico
prevede certi studi e non altri, quali sono i vantaggi e i limiti di ciascuno in termini
di giustificazione della conoscenza prodotta (epistemologia) e dove finiscono i fatti
e cominciano le assunzioni. Quindi alla fine il meglio che posso augurarmi è di ave-
re scritto un’introduzione alla metodologia degli studi clinici leggibile da filosofi e
un’introduzione ad alcuni temi di filosofia della scienza leggibile da medici.
Il contenuto di questo piccolo libro riflette in parte il mio percorso di studi:
dall’analisi filosofica sono passata ai problemi metodologici e concettuali applicati
alla psicologia sperimentale, poi alla psichiatria, poi a vari ambiti della medicina,
sviluppando poi nuovamente un interesse per le questioni metodologiche genera-
li. In questo percorso c’è la costante della filosofia come un metodo di chiarifica-
zione, più che come una disciplina con un insieme fisso di domande, o tantomeno
** Una visione d’insieme completa ma sintetica dei temi della filosofia della medicina con-
temporanea si trova in Reiss, J. and Ankeny, R. (2016) Philosophy of Medicine. The Stanford
Encyclopedia of Philosophy (Summer 2016 Edition), Edward N. Zalta (ed.), URL = <https://
plato.stanford.edu/archives/sum2016/entries/medicine/>.

Prefazione vii
di risposte. Incidentalmente, questo ruolo della filosofia non è modesto, perché è

praticamente ubiquo.
Restano da indicare le principali omissioni del testo: non parlo di statistica se
non quanto è strettamente necessario, e senza usare formule; non tratto della storia
della medicina se non fornendo qualche esempio; la ricerca di base ha meno spazio
rispetto a quella clinica ed epidemiologica; infine, l’etica della ricerca non è trattata.
Costruire un ponte tra due discipline, filosofia e metodologia della ricerca clinica,
mi è parso un progetto già ingegneristicamente complicato, e ho pensato che trop-
pi ponti avrebbero generato un effetto da quadro di Escher.
Il volume è così strutturato. Il primo capitolo parte dalla domanda “cos’è la scien-
za?” e introduce molte delle nozioni fondamentali di filosofia della scienza, com-
presa la caratterizzazione della stessa disciplina. La risposta alla domanda riman-
da al metodo, che è tematizzato nel secondo capitolo nella sua architettura logica
fondamentale: problema, osservazione, ipotesi, esperimento e controllo. Sempre nel
secondo capitolo vengono introdotti i tre modi del ragionamento scientifico: dedu-
zione, induzione e abduzione, esemplificati da tre episodi di storia della scienza. Nei
capitoli 3 e 4 si passa dal metodo astratto alla metodologia della ricerca: si può dire
che dal problema filosofico (a detta di molti insolubile) della giustificazione delle in-
ferenze induttive siamo passati al problema pratico di porre vincoli che permettano
di compiere inferenze induttive “migliori”. Il resto del libro analizza i tipi di disegno
sperimentale sulla base di questa domanda: che tipo di ragioni fornisce rispetto alla
conferma di un’ipotesi? Nel Capitolo 3 traccio una mappa dei tipi di ricerca nelle
discipline biomediche e comincio l’analisi dei tipi di studi da quelli osservazionali,
riportando esempi da articoli pubblicati. Infine, discuto la questione filosofica del
rapporto tra causalità e associazione in epidemiologia. Il Capitolo 4 è dedicato agli
studi sperimentali, con i randomized controlled trials in primo piano. Il percorso porta
alla discussione della gerarchia dell’evidenza della Evidence-based Medicine e quindi
ad alcune questioni dibattute dai filosofi della medicina oggi (su cui non posso non
avere un’opinione), e si conclude sottolineando l’opportunità di integrare la valu-
tazione dell’evidenza nella ricerca con considerazioni sulla rilevanza della ricerca
rispetto a nozioni valoriali, come la qualità della vita e la salute del paziente.
In tutti i capitoli, per segnalare a lettrici e lettori dove si può allargare la cono-
scenza di ciò di cui parlo ho scelto di usare il più primitivo degli ipertesti, ovvero
la nota nel testo: chi è interessato ad approfondire o a controllare le mie fonti può
vedere le note al termine di ogni capitolo. Credo che questo possa essere un ragio-
nevole compromesso tra la leggibilità e la completezza delle informazioni.

viii Medicina e metodo sperimentale. Un’introduzione filosofica
Ringrazio di cuore alcuni preziosi lettori, che con diverse competenze mi hanno
sostenuto nella scrittura: in ordine sparso Elena Manfredi, Rossella Hakim, Fran-
cesco Bianchini e soprattutto Stefano Fanti, senza il quale questo progetto non ci
sarebbe mai stato. Senza con questo dargli alcuna colpa, e libero anche gli altri
dalla responsabilità di eventuali errori nel mio libro. Mi auguro infine che questo
piccolo libro-ponte possa portare qualche studente o medico verso la filosofia della
scienza, e in generale possa contribuire al dialogo tra le due discipline. Quindici
anni di insegnamento di filosofia a studenti non filosofi mi hanno insegnato che
per dialogare bisogna prima capirsi, e per capirsi bisogna lavorare sulla semplicità
e sulla chiarezza dello stile, e questa è stata la mia regola metodologica qui.
Bologna, 2 gennaio 2021

CHE COS’È LA SCIENZA
CAPITOLO PRIMO
PIANO DEL CAPITOLO

Il capitolo parte da due esempi controversi: la grafologia è una scienza? L’ipotesi del-
la memoria dell’acqua è scientifica? Da questi passa alla domanda “che cos’è la scien-
za?” e mette fuoco alcune caratteristiche che possono contribuire a una risposta, an-
che se non a una definizione al riparo da controesempi: sistematicità, utilizzo di leggi
e teorie, carattere esplicativo e predittivo e, infine, credibilità e metodo. Nel percorso
vengono introdotte le nozioni di modello e meccanismo e di causalità. Il capitolo si
conclude spiegando brevemente che cos’è la filosofia della scienza, la disciplina che
si occupa di queste domande riguardo alla scienza, con procedimenti non empirici.
1.1 DUE CASI: LA GRAFOLOGIA E LA MEMORIA DELL’ACQUA

La grafologia è una scienza? I grafologi individuano le caratteristiche della per-
sonalità di un soggetto a partire dall’analisi della sua scrittura con carta e penna:
la grafia. Esistono diverse metodologie, ma in generale gli aspetti considerati com-
prendono il modo in cui la grafia occupa lo spazio della pagina (distanza tra le
righe, margini), la direzione e l’inclinazione, la pressione sulla carta, la velocità, la
lunghezza degli occhielli di alcune lettere come “l” e “g” e la distanza tra le lette-
re. Da un’analisi generalmente di tipo olistico – cioè considerandoli tutte insieme
come un tutto – il grafologo trae conclusioni su tratti della personalità dell’indi-
viduo, ad esempio ansia, desiderio di indipendenza, edonismo ed estroversione.

2 Medicina e metodo sperimentale. Un’introduzione filosofica
La grafologia ha una tradizione che si intreccia con quella della psicologia spe-
rimentale. Ecco come è stata caratterizzata e difesa dallo psicologo francese Théod-
ule Ribot nel 1998:
Ritengo che la grafologia sia basata sul principio indisputabile secondo il quale sono
i nostri movimenti a mostrare i nostri stati interni: il carattere, le emozioni e il pen-
siero. La personalità si esprime non solo attraverso le parole, ma anche mediante gli
atti motori, e quelli delle mani sono i più rilevanti […] Se è vero che [la grafia] riflette
nostri stati d’animo passeggeri, è vero anche che dietro questi cambiamenti apparenti
rimane un sostrato stabile. Uno dei meriti della psicologia contemporanea è l’aver
mostrato chiaramente ciò che prima non veniva considerato, ovvero l’importanza e
il significato dei movimenti, e la grafologia costituisce un capitolo nella psicologia
del movimento. Se i grafologi delle diverse scuole siano riusciti o no a determinare
il carattere delle grafie è un’altra questione, sulla quale si possono avere dubbi; ma
non è fosse vero che qualsiasi teoria, quando è applicata alla pratica, può sbagliare?1.
La grafologia ha avuto una breve carriera nella misurazione dell’intelligenza
e dello sviluppo cognitivo dei bambini. Oggi analisi grafologiche vengono oggi
usate nella selezione del personale a supporto di altri test, soprattutto in Europa e
in particolar modo in Francia. Diversi studi negli anni hanno confrontato l’analisi
grafologica con altri test di personalità oggi validati in psicologia e hanno mostrato
che i risultati sono discordanti e il livello di accordo tra diversi grafologi è basso2.
In generale, la grafologia è considerata una pseudoscienza3. Altri studi recenti, tut-
tavia, propongono l’esame della grafia per identificare stati di depressione o stress,
sia negli adulti che nei bambini4. Comunque, i grafologi tendono a non proporsi
per lavori di diagnosi di condizioni o di sintomi patologici. In generale il grafologo
professionista tende a presentare la sua competenza come non riducibile a regole
esplicite, ma piuttosto basata su intuizione ed esperienza.
Un’altra storia di scienza dibattuta. La memoria dell’acqua è un’espressione
suggestiva che ha ispirato titoli di canzoni, opere d’arte e film. L’ipotesi che ha
lo stesso nome è stata pubblicata sulla prestigiosa rivista Nature nel giugno del
1988 a firma di un gruppo composto da biochimici e immunologi. Questo è l’ab-
stract:
Quando i basofili polimorfo-nucleari umani, un tipo di leucociti con anticorpi del
tipo dell’immunoglobina E(IgE) sulla superficie, vengono esposti ad anticorpi anti
IgE, rilasciano istamina dai loro granuli intracellulari e cambiano le loro proprietà di

Capitolo primo - Che cos’è la scienza 3
staining. Questo può essere dimostrato a diluizioni di anti IgE che vanno da 1x10 2 a
1x1010,20,30. Oltre questa soglia ci sono altri picchi di degranulazione dal 40 al 60%
dei basofili, nonostante l’assenza misurata di anti IgE alle più alte diluizioni. Dato
che le diluizioni devono essere accompagnate da una vigorosa agitazione perché gli
effetti vengano osservati, la trasmissione dell’informazione biologica potrebbe essere
correlata alla organizzazione molecolare dell’acqua5.
L’articolo era seguito da una nota di riserva da parte del comitato editoriale:
i lettori di questo articolo potrebbero condividere l’incredulità dei tanti referees che
hanno commentato precedenti versioni durante gli ultimi mesi. L’essenza del risulta-
to è che una soluzione di acqua e di un anticorpo mantiene la sua capacità di evocare
una risposta biologica anche quando viene diluito fino al punto che la possibilità di
trovarne una singola molecola in qualsiasi campione diventa trascurabile: non esiste
una base fisica per tale attività. Con la gentile collaborazione del professor Bienveni-
ste, la rivista Nature ha quindi organizzato una replica dell’esperimento da parte di
studiosi indipendenti, e un report di questa indagine apparirà presto.
I tentativi di replica sono falliti, Nature ha pubblicato il report, e ad oggi resta
vero che non esiste una base fisica per l’ipotesi della memoria dell’acqua. Tutta-
via, negli anni successivi e per tutta la propria vita, uno degli autori, il professor
Bienveniste menzionato nella nota di riserva, ha continuato a fare divulgazione e
campagna di persuasione per la propria ipotesi (ma non ricerca). La questione ha
un’indubbia rilevanza pratica ed economica dato che la memoria dell’acqua, se
accreditata come ipotesi scientifica, legittimerebbe l’efficacia dei preparati omeo-
patici, che sono appunto sostanze molto diluite.
1.2 CHE COS’È LA SCIENZA

Tutti sappiamo che cos’è la scienza, ma è difficile trovarne una definizione. La
definizione di un concetto esprime le condizioni necessarie e sufficienti per la sua
applicazione. Ad esempio, figura piana con quattro lati e quattro angoli uguali è
una definizione di quadrato, perché tutti e soli i quadrati hanno queste caratteristi-
che6. Una buona definizione di scienza dovrebbe mostrare ciò che tutte le discipli-
ne che chiamiamo scienze hanno in comune - ad esempio la biologia molecolare e
la fisica teorica, l’astronomia e la psichiatria - e al contempo, ciò che solo le scienze

possiedono. Questo ci permetterebbe di capire meglio che cosa non va nella grafo-
logia e nell’ipotesi della memoria dell’acqua.
Per cercare una definizione passiamo dal livello immediatamente successivo
rispetto al riflettere tra sé e sé, ovvero, consultare una fonte accessibile e popolare,
Wikipedia, per avere una prima direzione d’indagine. Ecco la definizione di scien-
za, in inglese7:
La scienza è un’impresa sistematica che costruisce e organizza conoscenza nella for-
ma di spiegazioni testabili sull’universo8.
In pochi minuti possiamo trovare una fonte plausibilmente più autorevole sul
web9, o almeno una seconda fonte, e incontriamo una caratterizzazione simile, pro-
posta dalla American Physical Society:
La scienza è l’impresa sistematica che raccoglie conoscenza sul mondo e la organizza
e condensa in leggi testabili e teorie. Il successo e credibilità della scienza si fondano
sull’impegno degli scienziati a: esporre le loro idee e risultati al test e alla replica
indipendente da parte di altri scienziati, il che richiede lo scambio aperto e completo
di dati, procedure e materiali e l’abbandono o modifica di conclusioni accettate se
si trovano davanti a evidenze sperimentali più complete o affidabili. L’aderenza a
questi principi fornisce un meccanismo di auto-correzione che è a fondamento della
credibilità della scienza10
Supponiamo ora che la nostra ricerca di una definizione di scienza abbia risor-
se così limitate da doversi fermare esattamente qui, con la citazione da Wikipedia
e quella della American Physical Society – probabilmente non abbiamo convinto i
finanziatori del nostro grant che si tratta di un problema importante, oppure non
abbiamo mai seguito un corso di filosofia, nel quale avremmo imparato che si
può cercare la definizione di un concetto senza censire tutti i modi in cui è stato
definito in un arco di tempo11. Abbiamo già comunque molti elementi rilevanti
per rispondere a “che cos’è la scienza”, anche se – ma già c’era il sospetto nel
furbo lettore – non arriveremo facilmente a una definizione al riparo da contro-
esempi.

1.3 SISTEMATICITÀ
In generale la conoscenza sistematica di un certo dominio include principi di
classificazione che si applicano a tutti i suoi oggetti, e regole logiche o di metodo
che si applicano a tutti i suoi contenuti. Le scienze contemporanee sono sistemati-
che in questo senso. La botanica, ad esempio, comprende principi di classificazione
degli organismi vegetali e una struttura gerarchica delle classificazioni e categorie
tassonomiche, in parte basata su considerazioni evolutive. Posso immaginare di
essere in grado di riconoscere e nominare tutte le specie arboree della mia regione,
e magari di sapere con una certa affidabilità che terreno prediligono. Nondimeno
non avrei una conoscenza scientifica degli alberi, mancandomi la capacità di collo-
carli nei diversi ranghi gerarchici della classificazione. La sistematicità distingue la
conoscenza scientifica dalla conoscenza del senso comune, che può essere nondi-
meno utile in diversi contesti pratici12.
Idealmente, i principi di classificazione devono essere applicabili all’intero do-
minio (ad esempio tutti i corpi celesti, tutti gli organismi animali, tutte le malattie
della pelle, e così via) e formare categorie sulla base di somiglianze reali, o almeno
pragmaticamente utili. Qui, ad esempio, lo scrittore argentino J.L. Borges illustra un
bizzarro sistema di classificazione attribuendolo a una fittizia enciclopedia cinese:
Nelle sue remote pagine è scritto che gli animali si dividono in:
(a) appartenenti all’Imperatore, (b) imbalsamati, (c) ammaestrati, (d) lattonzoli, (e)
sirene, (f) favolosi, (g) cani randagi, (h) inclusi in questa classificazione, (i) che s’a-
gitano come pazzi, (j) innumerevoli, (k) disegnati con un pennello finissimo di pelo
di cammello, (l) eccetera, (m) che hanno rotto il vaso, (n) che da lontano sembrano
mosche13.
Potremmo soffermarci a considerare che cosa non va nella fittizia enciclopedia
cinese (a prima vista usa diversi criteri di classificazione, alcuni sono dipendenti
dal punto di vista dell’osservatore, altri no, alcuni sono meta-criteri, e così via). Il
punto, tuttavia, era soltanto mostrare che un sistema di classificazione non vale
l’altro: ne segue che ogni scienza ha il problema di validare la propria sistemati-
cità. Non notiamo questo problema quando riflettiamo ad esempio sulla chimica:
la tavola periodica degli elementi, introdotta da Dmitri I. Mendeleev nel 1869,
che ordina gli elementi in base a numero atomico e valenza, è accettata dalla
comunità scientifica nei suoi principi fondamentali, anche a fronte di qualche

dibattito interno14. Analogamente la medicina oggi utilizza molte classificazioni,

da quella generale pubblicata dall’Organizzazione Mondiale della sanità (WHO
International Classification of Diseases, ICD-11), a quelle più specifiche riguardanti,
ad esempio, i tumori: queste vengono periodicamente aggiornate e modificate,
ma da tempo non sono discusse o sfidate per quanto riguarda i principi fon-
damentali. Diversamente, la psichiatria (o meglio la disciplina che studia i di-
sturbi mentali, comprendente anche la psicologia clinica) sta ancora lavorando
alla validazione della propria classificazione, ovvero la nosologia: si discute oggi
vivacemente di quali siano i principi in base ai quali una certa condizione vada
inclusa, oppure esclusa, dai disturbi mentali – se debbano includere la sofferenza
e il danno recato all’individuo, la presenza di uno stato disfunzionale dei sistemi
cognitivi e affettivi, eccetera15. Secondo lo storico e filosofo della scienza Thomas
Kuhn, ci sono scienze “mature”, come la chimica o la medicina, che differiscono
da quelle “pre-paradigmatiche” perché smettono di interrogarsi sui propri meto-
di e principi di classificazione: li applicano per la soluzione di problemi, ma non
li mettono in discussione16.
Fin qui abbiamo parlato della classificazione come fondamento della sistemati-
cità delle scienze. Anche la possibilità di applicare uno stesso metodo per formare
e organizzare la conoscenza rende una disciplina sistematica. Il metodo scientifico,
di cui parleremo estesamente nelle prossime pagine, è un’idealizzazione che an-
cora ci è utile per vedere che cosa le scienze hanno in comune. Ogni disciplina poi
codifica il metodo scientifico in un canone di metodologie adatte al proprio domi-
nio di indagine: pur avendo in comune l’architettura logica del metodo scientifico,
i tipi di studi sperimentali della fisica teorica saranno differenti da quelli, poniamo,
della geriatria, per disegno e tecnologia necessarie.
Qui aggiungiamo brevemente che la matematica e in particolare la statistica
forniscono oggi a diverse discipline – non a tutte17 – regole e metodologie siste-
matiche, ovvero applicabili a tutto il loro dominio. Nelle narrazioni di storia della
scienza Galileo Galilei è talvolta indicato come colui che per primo sostenne che
questo grandissimo libro che continuamente ci sta aperto innanzi a gli occhi (io dico
l’universo), [ma] non si può intendere se prima non s’impara a intender la lingua e
conoscer i caratteri, ne’quali è scritto. Egli è scritto in lingua matematica, e i caratteri
son triangoli, cerchi, ed altre figure geometriche, senza i quali mezzi è impossibile
a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un
oscuro laberinto18.

Se ciò che esiste, secondo Galileo, è rappresentabile in caratteri matematici, al-

lora possiamo sistematicamente applicare metodi quantitativi allo studio di tutte
le cose. In questo libro vedremo diversi esempi di ricerca quantitativa in medicina:
ad esempio, per stabilire che un certo farmaco è più efficace di un altro rispetto a
una certa condizione patologica, a partire dal Capitolo 3.
1.4 LEGGI
Secondo la definizione della American Physical Society, una scienza organizza il
sapere relativo a un dato dominio in leggi. Che cos’è una legge? Richard Feynman,
noto fisico e divulgatore, ha usato questa poetica espressione per introdurre il con-
cetto: “Ci sono poi ritmi e pattern tra i fenomeni della natura, che non sono visibili
agli occhi, ma solo agli occhi dell’analisi; e sono questi ritmi e pattern che chiamia-
mo leggi fisiche”19. Proprio la fisica ci fornisce esempi familiari e non controversi
di legge scientifica, come la Legge di gravitazione universale enunciata da Isaac
Newton nel 1687: due corpi puntiformi o sferici di massa m1 e m2 posti a distanza r
si attraggono con una forza F che agisce lungo la retta congiungente i corpi e che ha
modulo F = G m1 m2 / r2. Un altro esempio poco controverso è la legge di Lavoisier
in chimica: in un sistema chiuso, in una reazione chimica la massa dei reagenti è
esattamente uguale alla massa dei prodotti. Una teoria è un insieme strutturato di
leggi, generalizzazioni o modelli (vedremo più avanti di che cosa si tratta) in grado
di spiegare diversi fenomeni in un certo dominio, ad esempio la teoria cinetica dei
gas, la teoria dell’evoluzione, la teoria della tettonica delle placche20.
I concetti di legge, teoria e spiegazione sono connessi. Cerchiamo quindi prima
di tutto raggiungere una caratterizzazione più precisa del concetto di legge, indi-
viduando condizioni per la loro definizione. Una legge è innanzitutto una propo-
sizione universale21 (può essere espressa utilizzando il quantificatore “tutti”), che
esprime una relazione regolare tra grandezze (ad esempio forza, massa e distan-
za) e che si applica senza restrizioni di tempo e di luogo22. Le leggi delle scienze
empiriche - a differenza delle leggi della geometria e dell’aritmetica, e delle leggi
dello Stato che regolano la vita civile - sono di solito ottenute almeno in parte per
induzione, che è il tipo di inferenza che ci permette di generalizzare a partire dai
casi osservati. Descrivendo il metodo scientifico nelle prossime pagine vedremo
operativamente come un’ipotesi, che esprime una relazione tra grandezze, può

diventare una legge o una generalizzazione legiforme quando raggiunge un certo

grado di conferma e predittività.
Per essere una legge, dicevamo, una proposizione universale che esprime una
relazione regolare tra grandezze deve anche avere portata esplicativa rispetto ai
fenomeni di cui la teoria si occupa: deve poterne spiegare molti e possibilmente
prevederne di nuovi. Dalla legge di gravitazione universale possiamo, ad esempio,
derivare per deduzione (integrando altre premesse) la posizione che avrà domani
il pianeta Venere rispetto alla Terra. Di fatto, la fisica newtoniana nei Principia è
concepita sul modello della geometria euclidea, in cui le leggi svolgono il compito
logico degli assiomi23: sono di portata generale e da esse possono derivare, come
teoremi, spiegazioni di fenomeni particolari. La portata esplicativa delle leggi le
distingue dalle generalizzazioni universali vere, ma che non spiegano quasi nulla,
ad esempio “Tutte le sfere d’oro sulla Terra hanno un diametro inferiore a 10 metri.
Il requisito della portata esplicativa delle leggi rimanda al fatto che la spiegazione
sia uno degli obiettivi di una scienza: ne riparleremo tra poco. Anche la deduzione
sarà brevemente trattata nelle prossime pagine.
L’esempio delle sfere d’oro mette poi in luce un altro aspetto delle leggi di na-
tura. Non è vero che non ci potrebbe essere una sfera d’oro con diametro di 10
metri”: che non ci sia è contingente rispetto alla quantità d’oro che gli esseri umani
hanno reperito finora, nonché ai loro interessi. Diversamente, non solo non c’è, ma
non ci potrebbe essere una reazione chimica in un sistema chiuso in cui la massa
dei reagenti non sia uguale alla massa dei prodotti. Con una terminologia filosofica
più precisa diremo che una legge scientifica, a differenza di un semplice enuncia-
to universale vero, supporta un condizionale controfattuale (se ci fosse…allora acca-
drebbe...).
In filosofia della scienza esiste un dibattito articolato e complesso sulla defini-
zione delle leggi scientifiche, che prende in esame tutte le condizioni necessarie
che ho finora menzionato, nonché i loro rapporti reciproci: universalità, portata
esplicativa, supporto del controfattuale24. Non si riesce però a mostrare che le con-
dizioni necessarie finora menzionate siano anche congiuntamente sufficienti, cioè
bastino a definire che cos’è una legge in modo che non ci siano controesempi. Di
fatto, comunque, i manuali delle diverse discipline scientifiche tendono a utilizzare
criteri operativi per distinguere le leggi. L’idea è questa: se anche non riusciamo a
definire con precisione cosa sia una legge, possiamo fornire criteri per riconoscerne
una. Notate che molto spesso, nella vita, ce la caviamo assai bene con i criteri ope-
rativi: possiamo essere in difficoltà a definire ad esempio “veicolo” o “cibo”, ma

siamo piuttosto bravi a riconoscerne uno quando lo vediamo. Un criterio operativo

di legge, dunque, a differenza di una definizione, non mira a fornire condizioni
necessarie e congiuntamente sufficienti (al riparo da controesempi), ma solo istru-
zioni per l’uso chiare ed esplicite che tutti possono adottare in un certo contesto e
per un preciso scopo. Oltre alle condizioni necessarie che abbiamo menzionato,
tra i criteri operativi per distinguere una legge ci sono la priorità (in ambito spe-
rimentale, le leggi hanno la precedenza sulle osservazioni: in caso di conflitto, si
è portati a rivedere le osservazioni piuttosto che la legge) e il formato: una legge,
diversamente da una teoria, ha una formulazione breve e relativamente semplice,
preferibilmente in termini quantitativi.
Tuttavia, se anche trovassimo una caratterizzazione ottimale di legge scientifica
– oppure ci accontentassimo di trovare una lista di esempi indiscutibili, o dei cri-
teri operativi – resterebbe aperta un’altra domanda: davvero tutte le scienze fanno
uso di leggi? E le leggi nelle varie scienze sono abbastanza simili tra loro? Questo
è molto controverso. In biologia, ad esempio, le cosiddette “leggi” sono vere solo
se valgono le cosiddette condizioni di contorno, o ceteris paribus, per cui il criterio
di universalità, che ci sembrava plausibile per la gravitazione universale o per la
conservazione della materia, ci appare poco applicabile. Ad esempio, la legge di
Hardy-Weinberg, espressa da un’equazione, afferma che se un gene ha solo due
alleli, dopo la seconda generazione la frequenza dei due alleli non cambia da una
generazione alla successiva, raggiungendo così uno stato di equilibrio rispetto a
quel gene. Diverse condizioni devono però essere soddisfatte - tra cui popolazione
molto numerosa, migrazione trascurabile, nessuna mutazione – per cui è estrema-
mente raro che l’equilibrio si raggiunga. Questo non toglie che sia uno standard da
cui chi si occupa di genetica delle popolazioni può ricavare generalizzazioni più
complesse25.
Ancora differente è la situazione in psicologia e in medicina. In psicologia spe-
rimentale si cita nei manuali la Legge psicofisica di Weber-Fechner - secondo cui
la percezione di uno stimolo è proporzionale al logaritmo dello stimolo e a una
costante – ma non ci sono leggi della memoria o della categorizzazione: la ricerca
scopre “effetti” (variazioni significative di una variabile rispetto a un’altra, ma di li-
mitata portata esplicativa) e ricostruisce meccanismi per spiegare il comportamen-
to umano26. Se poi abbiamo tempo per una ricerca su PsychLit o, in campo medico,
su PubMed, vedremo che negli articoli di ricerca pubblicati negli ultimi anni la
parola “legge” compare praticamente solo nell’accezione giuridica. Correlazioni,
meccanismi e nessi (link) sono invece concetti molto usati.

Dunque, la psicologia e la medicina non sono scienze, mentre la fisica e la chi-

mica sì? Se ipotizziamo che la risposta sia no, potremmo dire che le leggi sono
diverse, da disciplina a disciplina: si differenziano da quante condizioni di contor-
no necessitano per essere vere, e dal fatto di essere deterministiche o statistiche27.
L’alternativa è abbandonare l’uso del concetto di legge per definire la scienza: pro-
viamo con “teorie”, “spiegazioni” e “ipotesi testabili”.
1.5 TEORIE
La seconda caratterizzazione del concetto di scienza da cui siamo partiti, quella
dell’American Physical Association, contiene il termine “teoria”. Non a caso, per-
ché la fisica ci fornisce ancora una volta - come nel caso di “legge” - diversi esempi
paradigmatici: la teoria della meccanica classica, la teoria della relatività generale,
la teoria dell’elettromagnetismo. Una teoria scientifica è un insieme strutturato di
generalizzazioni o leggi (soprattutto, queste ultime, nel campo della fisica) che per-
mette di spiegare molti fenomeni all’interno di un dominio, e di prevederne altri.
Fuori dalla fisica, esempi di teorie sono la tettonica delle placche (geologia), la teo-
ria dell’evoluzione in biologia, o la teoria chemiosmotica in biochimica.
C’è da notare qui una differenza tra l’uso comune del termine “teoria”: quan-
do dico ad esempio che “ho una mia teoria” sul perché le mie phalaenopsis stanno
perdendo le foglie, faccio riferimento a una congettura incerta, per cui ancora non
ho evidenza – “è solo una teoria”, si dice normalmente. Diversamente, una teo-
ria scientifica, per essere tale, deve essere accettata dalla comunità degli esperti di
perché conforme agli standard vigenti di giustificazione da parte dell’evidenza. Se
usiamo questo criterio, allora sono teorie scientifiche anche la teoria del flogisto
(nella chimica del XVIII secolo), la teoria tolemaica in astronomia (prima di Nicolò
Copernico), la teoria miasmatica delle malattie (in medicina fino al XIX secolo).
Secondo la teoria del flogisto, la combustione e l’ossidazione dei metalli avven-
gono per la perdita di una sostanza aerea loro componente. La teoria di Tolomeo
assegna alla Terra la posizione centrale rispetto al Sole e ai pianeti del sistema so-
lare. Secondo la teoria miasmatica, le malattie contagiose si propagano attraverso
i cattivi odori generati dalla terra o dal corpo umano28. Oggi le riteniamo false29
e sono state soppiantate da altre teorie in grado di spiegare gli stessi fenomeni, e
altri in aggiunta, ma per secoli sono state accettate perché conformi agli standard

metodologici dell’epoca, all’evidenza disponibile e perché apparivano in grado di

dare risposta a diverse domande. Con il cambiamento degli standard di giustifica-
zione (metodi, calcoli, tecnologie), con l’accumulo di nuova evidenza e soprattutto
di domande non risolte le teorie scientifiche possono essere abbandonate oppure
in parte inglobate in altre teorie con più potere esplicativo (questo è il caso della
meccanica newtoniana, inglobata nella teoria della relatività).
Introduciamo qui accenno al processo di passaggio da una teoria a un’altra.
Secondo la visione standard, elaborata in modo esplicito dai filosofi neopositivisti
all’inizio del XX secolo,30 la scienza procede accumulando conoscenza sugli stessi
oggetti e fenomeni nel tempo, e le teorie successive integrano le precedenti, almeno
in parte. Le teorie sono sempre migliori delle precedenti (progresso) e si applicano
sempre agli stessi fenomeni (stabilità); le metodologie di ricerca evolvono anche
all’interno di una stessa disciplina, ma lo schema logico del metodo scientifico ri-
mane immutato (unità).
Questa visione standard è stata criticata da diversi filosofi, storici e sociologi
della scienza in a partire dal 1960 circa, mettendo in discussione che il cambia-
mento della scienza nel tempo sia un processo cumulativo, ovvero che preserva
generalizzazioni, concetti o metodi e ne aggiunge altri o apporta piccole correzioni
a quelli già in uso, oppure si possa almeno talvolta considerare “rivoluzionario”,
perché tutti o quasi tutti i concetti e i metodi vengono sostituiti con altri. Nella sto-
ria della scienza si parla spesso di “rivoluzione” per il passaggio dalla fisica aristo-
telica alla nuova fisica, che a partire dall’eliocentrismo di Copernico si sviluppa con
Galileo Galilei e poi si sistematizza con Newton. Per fare un altro esempio meno
ovvio, la teoria contemporanea sulle infezioni virali è un incremento e migliora-
mento rispetto alla teoria miasmatica, o è una rivoluzione, che ha cambiato tutte le
regole del gioco? Thomas Kuhn, che abbiamo già citato e che ritroveremo ancora
nelle prossime pagine. Kuhn ha introdotto il termine “paradigma” per indicare i
concetti, le domande di ricerca, i metodi, gli stili di ragionamento, le tecnologie e i
problemi di una disciplina in un certo periodo storico. Secondo Kuhn, da un para-
digma a quello successivo si passa con un salto, ovvero senza continuità:
Ogni rivoluzione scientifica ha trasformato la immaginazione scientifica in un modo
che dovremo descrivere in ultima istanza come una trasformazione del mondo entro
il quale veniva fatto il lavoro scientifico. Simili cambiamenti, assieme alle contro-
versie che quasi sempre li accompagnano, sono le caratteristiche che definiscono le
rivoluzioni scientifiche31.

Perché questa digressione sulle rivoluzioni, parlando di scienza, di teorie e di me-

todo? Perché se ha ragione Kuhn, abbiamo scienze (al plurale), teorie in uso oggi che
sono incommensurabili (cioè intraducibili) rispetto a quelle del passato, una plura-
lità di metodi anziché un metodo unico, e la dinamica di evoluzione delle discipline
avviene per ragioni che non sono solo epistemiche (basate sull’evidenza) ma anche
sociali, economiche, culturali eccetera. Si tratta di un’idea comune in sociologia della
scienza, ma che scompare alla vista di chi fa lo scienziato e studia sui manuali delle
varie discipline. Un manuale universitario, infatti (ad esempio quello di fisica o di
biochimica) presenta le teorie attuali come risposte a domande che erano già state
formulate in passato, ma che non avevano ricevuto risposta adeguata, oppure come
miglioramento delle teorie passate, e non enfatizza la discontinuità. Qui citiamo la
posizione di Kuhn, senza ulteriormente farne uso. Si può applicare utilmente il con-
cetto di paradigma per descrivere gli aspetti costanti e le assunzioni non discusse
della ricerca scientifica, senza adottare la tesi di Kuhn del cambiamento rivoluzio-
nario e della incommensurabilità, e così procederemo in varie parti di questo libro.
1.6 GLI SCOPI DELLA SCIENZA

Torniamo alle due definizioni di scienza da cui siamo partiti e consideriamo
gli altri elementi concettuali che ci forniscono: nella prima troviamo spiegazione
e previsione. Abbiamo già caratterizzato una teoria scientifica come una struttura
logicamente articolata di conoscenze su un certo dominio che è in grado di spiega-
re molti fenomeni di quel dominio, ed eventualmente di prevederne altri. Spiegare
è il primo obiettivo della scienza. Una spiegazione risponde alla domanda “per-
ché?” relativa a un certo fenomeno, generale o particolare: perché la mia pianta
phalaenopsis ha perso diverse foglie? Perché la mortalità da Covid-19 è stata più
alta in Lombardia che nelle altre regioni d’Italia in marzo 2020? Perché nascono
renne albine? Perché c’è stata un’eclissi totale di Sole visibile in Italia il 15 febbraio
del 1961? Alcune di queste domande vengono dalla pura curiosità intellettuale che
caratterizza l’essere umano. Con le parole di Charles Darwin:
...credo che esista, e lo sento dentro di me, un istinto per la verità, o la conoscenza, o
la scoperta, che è quasi della stessa natura dell’istinto della virtù, e credo che il fatto
che abbiamo questo istinto sia ragione sufficiente a giustificare le ricerche scientifiche
da cui nessun risultato pratico sarà mai derivato32.

Altri obiettivi dell’impresa scientifica sono quello di prevedere i fenomeni

(quando ci sarà la prossima eclissi di Sole, qual è il rischio di valanghe domani?)
e di controllarli (come posso fare sì che le mie phalaenopsis non perdano le foglie?
Come possiamo migliorare la sopravvivenza di chi ha un certo tipo di tumore?).
Come vedremo nel capitolo 2, analizzando i vari tipi di disegno sperimentale, la
previsione e il controllo dei fenomeni che riguardano il corpo umano e la salute
pubblica sono gli scopi espliciti della ricerca applicata in medicina, che oltre a voler
spiegare le malattie e le cure, mira a prevederne e controllarne gli esiti.
Spiegazione, previsione e controllo sono legati, ma non identici. Si può voler
spiegare senza scopo di controllo dei fenomeni, e questo caratterizza la ricerca di
base. Anche le discipline che rispondono solo all’ “istinto della verità” di cui par-
lava Darwin, tuttavia, forniscono spiegazioni e non soltanto descrizioni o classifi-
cazioni. Una completa collezione delle farfalle d’Italia, sistematicamente ordinata,
sarà solo una parte della conoscenza entomologica rilevante (la sistematicità che
abbiamo visto prima è criterio necessario, ma non sufficiente). D’altra parte, per
quanto controintuitivo, è possibile prevedere e controllare senza spiegare. Posso
essere in grado di fermare la caduta precoce delle foglie della mia phalaenopsis di-
minuendo le innaffiature, senza tuttavia sapere perché questo funziona. E gli an-
tichi erano in grado di prevedere con buona approssimazione le maree anche pri-
ma che il fenomeno venisse ricondotto alla teoria della gravitazione di Newton33.
Potremmo dire che in entrambi casi si tratta di conoscenza pratica prescientifica:
spiegare e, sulla base di questo, prevedere e controllare i fenomeni, è tipico della
scienza moderna e contemporanea34.
Si può dire che proprio per la sua capacità di spiegazione, previsione e modifica
degli eventi che riguardano la nostra vita come individui e come specie, la scienza
ha guadagnato il prestigio e la credibilità di cui gode oggi tra le attività umane, so-
prattutto a partire dal XX secolo. La tecnologia dei trasporti, dell’informazione, la
farmacologia, la produzione e conservazione degli alimenti sono tutti esempi tangi-
bili della capacità della scienza di prevedere e controllare la realtà. Questo aspetto,
che appare ovvio a prima vista, costituisce in realtà una risposta ragionevole alla
domanda “come possiamo sapere che le nostre teorie scientifiche sono almeno in
parte vere? Come possiamo sapere che non sono tutte destinate ad essere comple-
tamente accantonate, come la teoria del flogisto o quella dei miasmi?”. La risposta
viene chiamata dai filosofi “argomento niente miracoli”: semplicemente, supporre
che le teorie scientifiche siano almeno in parte vere è la migliore spiegazione del
loro successo nella previsione e nel controllo35. Un’altra ragione, non filosofica o

di principio, ma etico-sociale, della credibilità e del prestigio della scienza risiede

invece nel metodo e nell’etica della ricerca, a cui ci indirizza la caratterizzazione
dell’American Physical Association: ne parleremo tra poco (§ 1.7) e poi diffusamente
nel capitolo 4 di questo libro.
1.7 TIPI DI SPIEGAZIONI SCIENTIFICHE

Fermiamoci brevemente a ragionare sulla spiegazione scientifica. Questa do-
manda, intesa in senso normativo (quali sono i criteri che una spiegazione scientifi-
ca deve soddisfare?), è tra le più dibattute in filosofia della scienza, e le ramificazio-
ni del dibattito vanno oltre gli scopi introduttivi di queste pagine36. Possiamo però
affrontare brevemente la domanda in senso descrittivo: quali sono di fatto i tipi di
spiegazione che si usano nella pratica scientifica?
Un primo tipo di spiegazione è quello tramite leggi o generalizzazioni. Una
legge spiega quando “copre” un certo fenomeno, ovvero è una premessa da cui
il fenomeno in questione (o più precisamente la sua descrizione) si può derivare
deduttivamente, con l’aggiunta di altre premesse che specificano le circostanze in
cui il fenomeno si colloca. Abbiamo accennato a questo tipo di spiegazione parlan-
do del Principia di Newton; riprenderemo parte del discorso approfondendo la
deduzione nel §2.7. Supponiamo ad esempio di partire dalla domanda “perché la
paziente EM è guarita dall’infezione da streptococco?”. Sappiamo che c’è una cor-
relazione o legge statistica secondo la quale la probabilità di guarire dall’infezione
da streptococco, dopo l’assunzione di penicillina, è alta (un valore che qui omet-
tiamo), e che EM ha assunto penicillina (in quantità sufficiente, con un valore che
qui omettiamo). Il fatto che EM sia guarita deriva da queste premesse: il fenomeno
è spiegato perché coperto dalla correlazione tra assunzione di penicillina e guari-
gione. Questo caso, semplificato in linguaggio colloquiale, esemplifica il modello
di spiegazione tramite leggi – qui abbiamo usato una di quelle che i neopositivisti
chiamavano leggi statistiche, perché contiene una probabilità. Esempi di spiega-
zione tramite leggi sono facilmente riscontrabili in fisica o in astronomia: le leggi
della fisica classica e della chimica dei materiali coprono, e quindi spiegano, perché
un bicchiere di cristallo si rompe se cade sul pavimento da un’altezza di due metri,
perché oggi la Luna si trova in una certa posizione rispetto al Sole, perché l’oro è
malleabile, e così via. Se possiamo spiegare un fenomeno tramite leggi, potevamo

anche prevederlo sulla base delle stesse leggi - con un certo grado di probabilità,
nel caso delle leggi statistiche. Uno dei limiti di questo tipo di spiegazione ci è
già noto dal §1.3: non tutte le discipline hanno a disposizione leggi universali o
addirittura deterministiche come la meccanica newtoniana. Tuttavia, anche nel-
le scienze biomediche abbiamo correlazioni legiformi, sempre di natura statistica
come nell’esempio semplificato della penicillina, che usiamo per spiegare perché,
ad esempio, un certo tipo di intervento è più efficace di un altro in un dato caso. I
randomized controlled trials (RCT), che esamineremo da vari punti di vista nel corso
di questo libro, hanno proprio l’obiettivo di testare sperimentalmente questo tipo
di correlazioni legiformi di tipo causale, mentre diversi studi osservazionali in epi-
demiologia possono confermare associazioni (e il dibattito sulla natura causale di
queste associazioni è aperto, come vedremo nel §3.6 e §4.7).
Il secondo limite del considerare le leggi come caratteristiche della scienza è che
a volte la generalizzazione di copertura non è quello che stiamo cercando con la
nostra domanda iniziale. Immaginiamo che io sia partita con il chiedermi “perché
le mie phalaenopsis perdono le foglie?” e abbia avuto l’informazione che “se una
phalaenopsis riceve più di 500 cc di acqua al giorno, dopo tre giorni perde le foglie”.
In questa situazione posso controllare il fenomeno smettendo di dare tanta acqua
alle mie piante (ammesso che siano ancora vive) e altresì prevedere che altre piante
a cui darò troppa acqua a parità di condizioni perderanno le foglie. In parte, è un
risultato assai importante. Tuttavia, potrei volere ancora sapere perché è così: qual
è il meccanismo mediante il quale le phalaenopsis perdono le foglie quando vengo-
no innaffiate troppo.
Siamo così a un altro tipo di spiegazione, centrale nelle scienze biomediche di
base: quello tramite meccanismi. Spiegare un fenomeno tramite un meccanismo
consiste nell’individuare le parti (entità) e le relazioni (attività) che lo producono o
lo costituiscono, con un certo ordine e organizzazione spaziale. L’infezione da Sars-
CoV-2, il virus responsabile della pandemia da Covid-19 che ha colpito il mondo
nel 2020, è stata spiegata individuando vari meccanismi, tra cui quello mediante il
quale il virus entra nella cellula umana per poi riuscire a replicare il proprio patri-
monio genetico. Semplificando, le entità rilevanti sono le parti della cellula umana
e di quella del virus (recettori, endosomi, enzimi, membrane, punte), mentre le at-
tività sono diversi processi di natura enzimatica che intercorrono tra queste parti37.
Il meccanismo spiega il fenomeno perché mostra come quegli specifici processi,
applicati in un certo ordine e con continuità a quelle specifiche entità, costituiscono
il fenomeno in questione, cioè l’entrata del virus. Quasi sempre una rappresenta-

zione grafica e talvolta una simulazione dinamica del meccanismo sono parte della
spiegazione. La conoscenza del meccanismo di entrata del virus nella cellula è poi
la base per trovare altri meccanismi che la blocchino, ad esempio inibendo o con-
trastando una delle attività individuate: oltre alla spiegazione, un meccanismo si
presta quindi agli gli scopi di controllo e di previsione.
Che grado di dettaglio deve avere un meccanismo per fornire la spiegazione
di un fenomeno? Questa non è una domanda semplice e la risposta dipende dal
contesto. La mia esposizione dell’esempio qui sopra mostra un livello di dettaglio
non sufficiente: “diversi processi di natura enzimatica” è troppo vago, occorre spe-
cificare quali; lo studio pubblicato a cui ho fatto riferimento in nota contiene invece
questa specificazione. Lo scopo della spiegazione è rilevante, ma anche la disponi-
bilità di conoscenze pregresse nel dominio. Nel caso del virus Sars-CoV-2 e della
cellula umana, possiamo dire di conoscere buona parte delle entità e le attività
rilevanti - il virus è stato precedentemente isolato, esaminato e anche sequenziato
dal punto di vista genetico – e ci si aspetta quindi che il meccanismo esplicativo sia
dettagliato.
Un’altra questione da porre, leggermente diversa, è a quale “livello di realtà”
deve essere compreso nel meccanismo esplicativo. Il gergo filosofico non deve spa-
ventare, qui: ad esempio, organi, tessuti, molecole e geni sono livelli diversi. Il
nostro esempio dalla virologia è un meccanismo biochimico, a livello intracellu-
lare. Ma possiamo pensare a meccanismi con entità e azioni a livelli macroscopici
e, nello stesso tempo, più astratti: in psicologia, ad esempio, fenomeni comples-
si come la comprensione del linguaggio metaforico o la risoluzione di problemi
aritmetici possono essere spiegati mediante meccanismi che indicano, come parti,
le funzioni cognitive coinvolte e i processi. La possibilità di avere meccanismi di
livello inferiore (ad esempio a livello neurale) che spiegano ciascuna funzione co-
gnitiva e processo renderanno poi la spiegazione più completa: in questo caso la
spiegazione del fenomeno (in questo caso di una capacità: la comprensione del
linguaggio metaforico) sarà costituita da meccanismi “innestati”. La definizione di
meccanismo, la questione del dettaglio e del livello di realtà sono oggi tra i temi più
studiati dai filosofi della scienza38.
Un’ultima questione da tenere presente riguardo alla spiegazione tramite mec-
canismi è che un meccanismo, per quanto dettagliato, è sempre un modello della
realtà, ottenuto per astrazione (rappresentazione di ciò che è comune a casi simili)
e idealizzazione (eliminazione delle proprietà che non sono necessarie a caratteriz-
zare il nostro oggetto). Questo indipendentemente dal dettaglio e dai livelli che la

spiegazione contiene. Tornando al primo esempio, il virus e la cellula ospite sono

senza dubbio più complesse (hanno più parti e svolgono più attività) di quello che
appare nella nostra spiegazione dell’entrata del virus nella cellula: solo quelle che
costituiscono il fenomeno in questione andranno a far parte del meccanismo espli-
cativo, non tutte. Questo giustifica il fatto, tra l’altro, che per studiare diversi mec-
canismi fisiologici o patologici del corpo umano si fa uso di organismi e cellule di
altre specie animali, a volte filogeneticamente molto lontane da noi, come i topi, ma
anche i pesci zebra39. L’estrapolazione (trasferimento, inferenza) di conclusioni dal
modello animale o sintetico al target umano deve rispondere a precisi requisiti me-
todologici e statistici, che fanno parte delle tecniche in uso nella ricerca preclinica.
Parlando di idealizzazione e astrazione arriviamo a un terzo tipo di spiegazione
scientifica che può essere utile distinguere dalle precedenti: la spiegazione tramite
modelli matematici. In un modello matematico un fenomeno complesso, ad esem-
pio il comportamento d’acquisto dei clienti in un supermercato, la diffusione di un
virus in una popolazione, la velocità di svuotamento di una diga, o un processo
molecolare40, viene rappresentato matematicamente, per poi formulare ipotesi for-
malizzabili che, se testate, permettono di applicarsi in un numero potenzialmente
illimitato di casi in virtù del loro carattere astratto. A differenza dell’esempio di
meccanismo che abbiamo discusso sopra, che era un modello qualitativo del feno-
meno di entrata del virus nella cellula, le “parti” del modello qui sono grandezze
a cui vengono attribuiti valori numerici, e le “attività” sono equazioni; l’output è
quasi sempre una previsione che ci interessa ottenere.
Il problema del dettaglio e del livello si pone anche per i modelli matemati-
ci come per i meccanismi: la loro varietà logico-matematica e strutturale dipende
sempre dal fenomeno che occorre spiegare, ma non è totalmente vincolata da que-
sto. Un modello con troppi dettagli può essere eccessivamente legato alla situazio-
ne contingente, e quindi poco predittivo. Un modello con meno parametri rischia il
problema opposto, cioè quello di omettere una variabile che farebbe una differen-
za. Nel 2020 la pandemia da Covid-19 ha reso tristemente popolare la spiegazione
e previsione della diffusione del virus tramite modelli epidemiologici matematici,
e scienziati e non scienziati hanno discusso, anche in sedi pubbliche, quale modello
fosse più adeguato, perché a partire da modellizzazioni diverse (con quanti e quali
parametri, con che tipo di equazioni), e anche a partire da diversi tipi di dati, si
ottengono previsioni differenti41.

1.8 UN INTERMEZZO: E LE CAUSE?

Abbiamo detto che la scienza ha lo scopo di spiegare, prevedere e controllare i fe-
nomeni. Non di scoprirne le cause? Normalmente diciamo ad esempio che la ricerca
medica nel 1984 ha stabilito che il virus HIV è la causa dell’AIDS. E che fumare siga-
rette causa il tumore al polmone, o che la mancanza di esercizio fisico causa aumento
di peso. Più modestamente, so che la troppa acqua causa la perdita delle foglie delle
mie orchidee da appartamento, e in campo fisico, che il fulmine causa il tuono.
La nozione di causa è per noi familiare, ma viene maneggiata con estrema cau-
tela sia dai filosofi che dai metodologi. Per cominciare con i primi, ecco cosa ne
pensava Bertrand Russell, famoso logico e filosofo inglese (al quale, in mancanza
di un premio appropriato per la filosofia, venne assegnato il premio Nobel per la
letteratura nel 1950):
La parola “causa” è legata tanto inestricabilmente a idee equivoche da rendere auspi-
cabile la sua totale espulsione dal vocabolario filosofico [...]. La legge di causalità...
è il relitto di un’età tramontata, e sopravvive, come la monarchia, soltanto perché si
suppone erroneamente che non rechi alcun danno.42
Le cause (scusate!) di questo atteggiamento di Russell, e di buona parte dei filo-
sofi della scienza circa fino al 1960, sono varie e articolate. C’è l’intuizione dell’am-
biguità linguistica e concettuale del discorso causale nel parlare quotidiano, che
possiamo verificare facilmente. La troppa acqua rispetto alla caduta delle foglie
della mia pianta è una causa nel senso di condizione sufficiente, ma non necessa-
ria: fa sì che la pianta perda le foglie, ma la pianta potrebbe perdere le foglie per
effetto di altre condizioni, ad esempio un’infezione fungina. Il fulmine, invece, è
causa del tuono nel senso che è sia necessario che sufficiente per il tuono, che non
ci sarebbe senza fulmine, e avviene sempre quando c’è il fulmine. Diversamente, la
mancanza di esercizio fisico rispetto all’aumento di peso non è condizione neces-
saria né sufficiente: si può aumentare di peso anche facendo molto esercizio fisico,
se si mangia eccessivamente, e si può dimagrire o restare dello stesso peso anche
senza attività fisica, diminuendo l’apporto calorico. In questo stesso senso il fumo
“causa” il tumore del polmone. In questi casi diremo che siamo in presenza di fat-
tori di rischio che aumentano la probabilità di una certa condizione. Ci sono quindi
diversi significati dietro l’uso ordinario della parola “causa”.
C’è poi una ragione di tipo storico: la scienza prima della rivoluzione scienti-
fica del XVII faceva uso della nozione di causa finale introdotta da Aristotele - ad

esempio, per il moto di un pianeta, la causa finale era raggiungere il suo “luogo
naturale” – e le scienze moderne, a partire da Galileo Galilei, hanno inizialmente
reagito prendendo le distanze in modo netto da questo paradigma.
Infine, dietro la diffidenza verso il concetto di causa come caratteristica della
scienza c’è la difficoltà dei filosofi di arrivare a un’analisi del concetto. Ecco un elen-
co semplificato di analisi filosofiche del concetto di causa, che sono state proposte
e discusse:
A causa B quando eventi di tipo A sono invariabilmente seguiti da eventi di
tipo B (questa è l’idea tradizionalmente associata al filosofo empirista inglese Da-
vid Hume43); quando il verificarsi di A aumenta la probabilità che si verifichi B;
quando una modificazione di A produce una modificazione di B; quando esiste un
processo continuo di modifica da A a B; quando se non si verificasse A, allora non
si verificherebbe neanche B; quando esiste un meccanismo in cui A è input e B è
output. Questo elenco va poi complicato e suddiviso considerando due dimensioni
filosoficamente fondamentali del dibattito sulla causalità: la relazione di causa si
dà tra eventi singoli oppure tra tipi di eventi? È deterministica oppure probabili-
stica?44
Se ci pensiamo un attimo, ognuna delle proposte definizioni della relazione di
causalità elencate sopra appare inizialmente plausibile – cioè sembra una buona
regola per i giudizi causali. Tuttavia, il dibattito filosofico mostra che ciascuna poi
si espone a controesempi, oppure è di applicabilità limitata. Come uscire dall’im-
passe? ci si può rassegnare che non esista una definizione esplicita del concetto
di causa – come vedremo nel §3.6, nella valutazione dei risultati degli studi epi-
demiologici e clinici, ma anche nella ricerca di base, si usano criteri per distin-
guere la causalità dalla semplice associazione. Un esempio rapido per cogliere la
differenza tra criteri e definizioni. Io so distinguere gli oggetti d’argento quando
li vedo: uso una serie di criteri che comprendono il colore, la malleabilità e la ten-
denza a ossidarsi, cioè – per quanto ne so - a formare una patina scura che non si
lava facilmente. Per intenderci, saprei separare le posate del servizio buono della
nonna da quelle in lega di alluminio che ho comprato di recente, anche se avessero
esattamente lo stesso design. Nondimeno, non so cosa sia l’argento non conosco il
suo numero atomico e quindi non potrei davvero distinguerlo da qualunque altro
materiale. Ho quindi dei criteri, ma non una definizione, oppure si può dire che ho
la mia concezione dell’argento, ma non afferro completamente il concetto. Pragma-
ticamente, è meglio di niente. Filosoficamente e scientificamente, non proprio, ma
l’importante è aver chiara la differenza.

Oltre al ripiego sui criteri per la causalità, un’altra via d’uscita al problema di
trovare la definizione del concetto è adottare il pluralismo: la tesi che ci siano in
realtà diversi concetti di causa. Questa idea di pluralismo potrebbe essere adatta
alla medicina, in cui sembra ragionevole dire, ad esempio, che il virus HIV causa
l’AIDS perché conosciamo il meccanismo (patogenesi) dell’infezione da HIV, e che
fumare causa il tumore al polmone perché ci sono evidenze convergenti da diversi
studi che attestano una correlazione, nonché una buona conoscenza del meccani-
smo rilevante.
Abbiamo detto che anche i metodologi sono cauti nel parlare di cause, e che ri-
prenderemo questo aspetto parlando degli studi clinici nel §3.6 e poi nel §4.7. Qui
ricordiamo che nei manuali di metodologia della ricerca “causale” sembra essere
diventato un termine che indica che tutti i possibili standard di eccellenza per una
certa correlazione tra variabili sono stati superati: una sorta di medaglia di eccel-
lenza metodologica, che non si raggiunge quasi mai. Ecco come un testo molto
usato si esprime su questo:
Comunque, le ipotesi spesso non vengono presentate in questa forma [causale] per-
ché il supporto per una relazione causa-effetto richiede non solo la plausibilità biolo-
gica e un forte risultato statistico, ma anche un appropriato e rigoroso disegno spe-
rimentale. Se lo sperimentatore ritiene che le variabili siano correlate ma preferisce
non speculare sull’influenza di una variabile sull’altra, l’ipotesi può essere formulate
in termini di associazione, senza riferimento esplicito ala causalità. Ad esempio: il
beneficio chirurgico è in relazione con la gravità preoperatoria dell’ischemia; la tolle-
ranza all’esercizio fisico è correlata con l’età cronologica; il consumo di bibite a basso
importo calorico è correlata con il peso corporeo45.
Si potrebbe obiettare, da un lato, che “speculare sull’influenza di una variabile
sull’altra” è proprio quello che lo sperimentatore dovrebbe fare (chi altri?); d’altra
parte la prudenza e la consapevolezza della possibilità dei propri errori (sia nel
disegno sperimentale che nell’esecuzione) sembrano virtù auspicabili.
Ritornando al nostro punto, per chiudere l’intermezzo: le cause non sono
scomparse dalla ricerca scientifica né tantomeno dalla riflessione filosofica. Però
la ricerca delle cause non può essere oggi quello che contraddistingue le scienze
come tali, perché i modelli di spiegazione causale all’interno di ciascuna sono
sia diversi che controversi: dire che la scienza cerca o scopre le cause non dice
di fatto ancora nulla, pone solo una domanda aperta su quale sia il metodo e il
concetto in uso.

1.9 CREDIBILITÀ
L’intermezzo sulle cause non deve farci perdere la strada. Stiamo arrivando alla
fine del nostro esame qualitativo di due caratterizzazioni di scienza per capire che
cosa sia. Resta da considerare un aspetto che può apparire più sociologico e con-
tingente che autenticamente definitorio, ovvero la credibilità, che troviamo nella
citazione dalla American Physical Association, riportiamola qui:
il successo e credibilità della scienza si fondano sull’impegno degli scienziati a:
esporre le loro idee e risultati al test e alla replica indipendente da parte di altri
scienziati, il che richiede lo scambio aperto e completo di dati, procedure e materiali
e l’abbandono o modifica di conclusioni accettate se si trovano davanti a evidenze
sperimentali più complete o affidabili.
Abbiamo già parlato del successo della scienza nel prevedere e controllare i
fenomeni: abbiamo detto che una delle spiegazioni migliori è che le teorie scien-
tifiche siano almeno in parte vere, che costituiscano conoscenza autentica. La cre-
dibilità viene dal successo della scienza nel cambiare il mondo e migliorare le no-
stre vite, ma non solo. Proviamo a riflettere con un esempio. Nel 2010, durante il
Campionato mondiale di calcio, un polpo gigante che viveva al Sea Life Centre di
Oberhausen, in Germania, divenne famoso perché prevedeva chi avrebbe vinto gli
incontri. Si chiamava Paul. Per chiedergli un verdetto gli venivano presentate due
scatole aperte contenenti il cibo, ciascuna con la bandiera di una delle squadre che
avrebbero giocato. La scatola da cui Paul mangiava prima decretava la squadra
vincitrice. Il verdetto di Paul risultò corretto per sette su sette partite giocate dalla
Germania, e in totale per 12 su 14 previsioni, diventando una star dei media. Morì
alla fine dell’estate46. Immaginiamo ora che Paul abbia continuato per molti anni,
confermando il suo tasso di successo predittivo (calcolato su tutte le sue perfor-
mances all’85.7%), o addirittura che sia ancora vivo e consultato da club calcistici e
scommettitori di tutto il mondo. Immaginiamo anche che non ci siano trucchi nel
modo in cui le previsioni vengono fatte e riportate. L’accuratezza delle previsioni
di Paul sarebbe maggiore di quella di molti modelli, matematici e non, corrente-
mente in uso in varie discipline scientifiche. Garantendo quindi con l’immagina-
zione tutte le circostanze favorevoli a questo caso, diremmo che Paul è credibile nel
prevedere i risultati? E se no, perché?
Il problema è che la procedura di previsione di Paul non è accessibile ad altri:
non abbiamo accesso ai dati di cui dispone, alle modalità di ragionamento, e altri

individui interessati alla stessa domanda di ricerca (ad esempio: chi vincerà oggi
tra Germania e Olanda?) non possono ripetere e riprodurre, o più tecnicamente
“replicare”, la sua procedura e i risultati. Di fatto non esiste, in questo caso, una
procedura né dati. Per questo il polpo indovino non è credibile come sarebbe uno
scienziato, anche se sapesse prevedere meglio di uno scienziato - e anche se fosse
umano.
Possiamo quindi dire che il metodo scientifico non ha solo un carattere logi-
co-procedurale, in quanto procedimento istanziato in diverse procedure specifi-
che, ma anche un aspetto sociologico, in quanto essenzialmente intersoggettivo.
In altre parole, nessun procedimento per ottenere conoscenza è scientifico se non
è condivisibile nella comunità scientifica, e i modi di questa condivisibilità sono
vari e articolati e comprendono diversi piani: l’esplicitazione dei dati e dei metodi,
del tipo di analisi, la valutazione dei risultati da parte dei pari, la pubblicazione e
diffusione, ma anche l’etica del singolo scienziato. Confrontiamo un noto manuale
di biochimica su questo punto:
Gli scienziati sono individui che applicano rigorosamente il metodo scientifico per
comprendere il mondo naturale. Per essere uno scienziato non basta avere una laurea
magistrale in una disciplina scientifica, né la mancanza di una laurea può impedire
a qualcuno di realizzare un contributo scientificamente importante. Uno scienziato
deve essere disposto a mettere in discussione qualsiasi idea quando nuovi risultati lo
richiedono. Le idee che uno scienziato accetta devono essere basate su osservazioni
misurabili e riproducibili che lo scienziato deve riportare con completa onestà47.
Si noti che questo punto squalifica definitivamente il polpo Paul, sul quale ave-
vamo pochi dubbi, ma anche casi molto più plausibili inizialmente. Uno di questi
è Luigi Di Bella, il medico modenese che nel 1998 diventò famoso per un metodo
di cura dei tumori, che somministrava ai suoi pazienti da anni dichiarando no-
tevoli risultati di efficacia. Il trattamento, una volta analizzato, risultò basato su
ingredienti variabili (somatostatina, melatonina, ocreotide, bromocriptina e uno
sciroppo contenente vitamine e acido retinoico) e le prove di efficacia fallirono. Il
problema rispetto alla pretesa di scientificità non è tanto il fallimento delle prove
di efficacia, ma il fatto che il medico rifiutò fino all’obbligo di legge di rendere pub-
blici i suoi dati e il lavoro sperimentale sui suoi preparati, e soprattutto decise di
applicarli senza il controllo intersoggettivo della comunità scientifica48.

1.10 FILOSOFIA DELLA SCIENZA

Ricapitolando: a partire da una domanda di senso comune, “che cos’è la scien-
za?”, abbiamo trovato diversi concetti che ci sembrano almeno prerequisiti, se non
ingredienti per una definizione: sistematicità, capacità di spiegare e prevedere, or-
ganizzazione in generalizzazioni legiformi e teorie, intersoggettività, credibilità,
metodo. Abbiamo anche aperto una serie di altre domande, tra loro connesse: ci
siamo chiesti cosa sono le leggi, le teorie, il cambiamento di teoria, le spiegazio-
ni (e quindi i modelli e i meccanismi), la credibilità e l’intersoggettività. Queste
sono domande concettuali, ovvero domande la cui risposta non si ricava da uno
studio sperimentale. Anticipando il contenuto delle prossime pagine, quelle sul
metodo, pensiamo infatti a che tipo di studio sperimentale si potrebbe concepire,
ad esempio, riguardo ai meccanismi. Si potrebbe fare una ricerca su un database di
pubblicazioni, come PubMed in medicina, per vedere quanti e quali studi vertono
su meccanismi, e come ciascuno definisce implicitamente un meccanismo. Faccia-
mo la previsione – azzardata, ma plausibile – che non si trovi un’unica nozione in
uso. Lo studio dovrebbe allora continuare chiedendosi quale nozione tra le tante
trovate è adeguata a uno scopo, o migliore, o più chiara, o se è corretto accettarle
tutte in un’ottica di pluralismo. Adeguato, migliore, chiaro e corretto sono nozioni
normative, non descrittive: fanno riferimento ai nostri valori, a come dobbiamo
giudicare i fatti in base a principi. Le questioni normative non hanno una risposta
quantitativa: banalmente, con un’intuizione assai povera, uccidere un innocente
per divertimento sarebbe sbagliato anche se un sondaggio dicesse che la maggior
parte dei nostri concittadini lo farebbe. Con le domande che coinvolgono nozioni
normative siamo già al di fuori di ciò che uno studio sperimentale può conclude-
re: si apre uno spazio per la filosofia. Per fare qualche esempio reale tratto dalla
medicina: che cos’è un disturbo mentale? (per decidere il principio di inclusione
nella nosologia psichiatrica); che cos’è l’overdiagnosi? (per regolare l’utilizzo delle
procedure diagnostiche); che cos’è la fragilità? (per capire se e come diversi modelli
esplicativi dell’invecchiamento in cui è presente questa componente si possono
integrare tra loro).
Non tutte le questioni di filosofia della scienza sono normative e non tutti i filo-
sofi si riconoscerebbero in quanto ho appena detto; tuttavia, lo scopo qui era mo-
strare che esistono questioni che possono sorgere all’interno di uno studio scientifi-
co sperimentale della natura, ma che non sono di per sé scientifico sperimentali. La
filosofia della scienza si occupa di queste domande, ed è quindi differente per me-

todo, ma contigua per oggetto di studio, alle scienze naturali: si applica alle scienze
naturali e ai loro prodotti. Notiamo che spesso gli scienziati stessi fanno filosofia
in questo senso, a volte consapevolmente, altre volte no (parafrasando la citazione
del manuale di biochimica, non ci vuole e non basta una laurea in filosofia per fare
il filosofo, occorre occuparsi di certe questioni con certi metodi).
Rintracciare le radici storiche della riflessione filosofica sulla scienza è proibi-
tivo: ricordiamo solo che Aristotele, Leibniz e Descartes erano scienziati nell’uso
contemporaneo del termine e David Hume, Francis Bacon e John Stuart Mill erano
metodologi. Una delle tradizioni di filosofia della scienza più influente oggi è an-
glo-americana e ha le sue radici all’inizio del XX secolo nel Circolo di Vienna e nel
Circolo di Berlino, formati da scienziati e filosofi (soprattutto fisici e matematici)
che si trovarono a discutere sui fondamenti delle scienze, a fronte dei progressi e
cambiamenti eclatanti che in quegli anni accadevano in quelle discipline, soprat-
tutto la matematica e la fisica49. Oltre a fornire diverse importanti risposte che sono
discusse ancora oggi, questi filosofi, noti anche come neopositivisti o empiristi lo-
gici, hanno fissato un’agenda di domande di ricerca attorno alle quali si è formata
la nuova disciplina. Alcune includono quelle da cui siamo partiti qui: che cosa
sono leggi, teorie, spiegazioni e come si distingue la scienza dalla pseudoscienza (il
cosiddetto “problema della discriminazione”). La concezione del rapporto tra filo-
sofia e scienza dei neopositivisti è ben espressa da queste parole di Rudolf Carnap,
una delle figure più influenti del gruppo:
Anche se l’attività dello scienziato empirico e quella del filosofo della scienza devono
sempre essere mantenute distinte, in pratica i due campi di attività si sovrappongo-
no e si mescolano. Un fisico viene portato costantemente dalla stessa ricerca a porsi
questioni metodologiche. Che tipi di concetti devo usare? Quali regole governano
questi concetti? E con quali metodi logici essi vanno definiti? Come posso collegare
i concetti in enunciati e questi ultimi in un sistema logicamente connesso, ossia in
una teoria? A domande di questo tipo egli deve rispondere come filosofo della scienza:
evidentemente non possono ricevere risposta sulla base di procedure empiriche50.
I filosofi dei circoli di Vienna e Berlino avevano un progetto di unificazione di
tutte le discipline scientifiche fondato su tre pilastri. Il primo era il metodo condivi-
so, per cui lavorarono alla chiarificazione dei modelli di spiegazione, dei tipi di ra-
gionamento scientifico e dei procedimenti di controllo e conferma delle teorie. Gli
altri due pilastri del progetto erano il linguaggio chiaro e non ambiguo, dove tutti
gli enunciati fossero o passibili di verifica empirica (come “il questa stanza ci sono

ora 19°C”) oppure veri per convenzione (come “i gradi centigradi servono per mi-
surare la temperatura”), e la riducibilità di tutte le discipline alla fisica, ritenuta
più fondamentale per spiegare la natura della realtà. Oggi l’unificazione di tutte le
scienze probabilmente non è più un obiettivo; neanche il riduzionismo fisicalista se
la cava tanto bene, nelle sue varie forme. Resta invece plausibile sostenere che non
abbiamo molto altro per distinguere la scienza dalla non scienza, se non l’appello
al metodo – o ai metodi, come si preferisce dire oggi, pur riconoscendo che hanno
un’architettura logica comune. Ne parleremo nel prossimo capitolo.
La filosofia della scienza contemporanea si riconosce in questioni che si sono svi-
luppate in un secolo dal nucleo neopositivista. Ad esempio, si discute ancora di con-
ferma e della sua alternativa, la falsificazione (questa è un’idea di Karl Popper, un
filosofo molto vicino ma anche molto critico del Neopositivismo – anche di lui parle-
remo nel cap. 2). Ma si sono arricchite anche con altri approcci, come quello storico di
Thomas Kuhn, che abbiamo già menzionato, e con il riconoscimento di dimensioni
normative e valoriali della ricerca, che erano assenti dall’orizzonte dei neopositivisti.
Ecco la caratterizzazione della disciplina da un recente testo di riferimento:
Qual è lo scopo e quali sono gli scopi della scienza e qual è il suo metodo o quali
sono i suoi metodi? Più generalmente: che cos’è la scienza e come si differenzia dalla
non scienza e dalla pseudoscienza? Che cos’è una teoria scientifica e come le teorie
scientifiche stanno in relazione con (e quindi rappresentano) il mondo? Come fanno
i termini teorici ad avere significato e come si connettono con l’osservazione? Qual
è la struttura e il contenuto di concetti come causa, spiegazione, conferma, teoria,
esperimento, modello, riduzione e probabilità? Quali regole, se ce ne sono, governano
il cambiamento delle teorie? Qual è la funzione dell’esperimento? Che ruolo hanno i
valori (sia epistemici che pragmatici) nelle decisioni scientifiche e qual è il loro rap-
porto con i fattori sociali, culturali e di genere? 51
Inoltre, la filosofia della scienza generale oggi coesiste con le filosofie delle
scienze particolari (filosofia della medicina, fisica, biologia, economia, matematica,
statistica, psicologia - ma anche a un livello di specializzazione maggiore: filosofia
della psichiatria, farmacologia, epidemiologia, fisica quantistica, biologia moleco-
lare). Ciascuna di queste discipline applica alla scienza di riferimento le doman-
de dell’agenda comune della filosofia della scienza, e in più discute problemi che
sorgono all’interno di un tipo di ricerca particolare. Ad esempio, la filosofia della
medicina si interroga sui concetti di salute e malattia, causalità, spiegazione mec-
canicistica e ruolo dei modelli nella sperimentazione, eccetera.

Occorre precisare che le domande e le risposte dei filosofi della scienza sono
da intendere in senso normativo, non descrittivo. Ciò vale a dire che per studiare,
ad esempio, il ruolo dei modelli il filosofo non organizza uno studio sperimen-
tale per capire come vengono usati dai biologi, dai geologi o dagli epidemiologi
– che potrebbe essere una meta-analisi sugli studi pubblicati, ma anche una ri-
cerca qualitativa in cui si chiede agli scienziati quali sono le loro metodologie di
ricerca: questi sono i compiti della sociologia e della psicologia della scienza. La
filosofia può avvalersi di questi dati, ma l’interesse è capire nel caso specifico che
caratteristiche devono o dovrebbero avere i modelli per fornire conoscenza sulla
realtà. Per fare un altro esempio, un filosofo della medicina non si chiederà (solo)
come è usato il concetto di malattia dai medici, oppure nel linguaggio comune: la
sua indagine sarà volta a chiarire che dato un certo concetto di malattia, allora ne
seguono per necessità certe classificazioni o spiegazioni, e così via. Questo tipo
di indagine non è empirica, ma si avvale di un procedimento di argomentazione
logica a partire da dati empirici.
Dato che questo non è un libro di filosofia della medicina, ma un’introduzio-
ne al metodo sperimentale in medicina dal punto di vista della filosofia, l’illu-
strazione delle questioni e delle caratteristiche della filosofia della scienza deve
necessariamente fermarsi qui. Parleremo di valori nella ricerca, di metodo, di
causalità e di meccanismi più avanti nei prossimi capitoli, rimandando per il
resto ad altri testi52.
RIASSUNTO DEL CAPITOLO

Sistematicità, organizzazione del sapere in teorie, leggi o generalizzazioni, ma so-
prattutto capacità esplicativa e predittiva, e credibilità basata sull’applicazione di
metodologie intersoggettive sono le caratteristiche della scienza. La filosofia della
scienza è la disciplina che si occupa di queste caratteristiche: studia con metodi non
empirici i metodi e i concetti della scienza in generale e delle discipline particolari.
I due casi in apertura, la grafologia e la memoria dell’acqua, sono differenti: la gra-
fologia è una teoria che trova la sua applicazione in un metodo di valutazione della
personalità (un tipo di test), mentre la memoria dell’acqua non è una teoria, ma un’i-
potesi chimico-fisica di portata esplicativa relativamente limitata – anche se, come
abbiamo notato, di portata economica notevole. In comune hanno però almeno due
aspetti: la non replicabilità dei risultati positivi che sembrano o sembravano ottenere,

e la mancanza di una spiegazione mediante leggi, meccanismi o modelli delle previ-

sioni che da esse derivano. Anche senza una definizione di scienza, capiamo perché
non si qualificano oggi come teorie o ipotesi scientifiche.

NOTE DI CHIUSURA
1 Ribot, T. (1898). Correspondance [Correspondence]. Revue Encyclopédique, 8(232), 151,
citato in Nicolas, S., Andrieu, B., Sanitioso, R., Vincent, R. & Murray, D. (2015). Alfred Binet
and Crépieux-Jamin: Can intelligence be measured scientifically by graphology?. L’Année
psychologique, vol. 115(1), 3-52.
2 Si veda ad esempio Dazzi, C., & Pedrabissi, L. (2009). Graphology and personality:
an empirical study on validity of handwriting analysis. Psychological reports, 105(3_suppl),
1255-1268.
3 Una trattazione ampia e divulgativa dello statuto della grafologia come scienza è
Beyerstein, B. L., & Beyerstein, D. F. (1992). The write stuff: Evaluations of graphology, the study
of handwriting analysis. Buffalo: Prometheus Books.
4 Ad esempio Brewer, J. F. (1999). Graphology. Complementary Therapies in Nursing and
Midwifery, 5(1), 6-14.
Giannini, M., Pellegrini, P., Gori, A., & Loscalzo, Y. (2019). Is graphology useful in assessing
major depression?. Psychological reports, 122(2), 398-410
5 Davenas, E., Beauvais, F., Amara, J., Oberbaum, M., Robinzon, B., Miadonnai, A., ... &
Sainte-Laudy, J. (1988). Human basophil degranulation triggered by very dilute antiserum
against IgE. Nature, 333(6176), 816-818.
6 Tralascio qui la differenza tra concetti e termini linguistici.
7 Wikipedia contributors. (2020, November 23). Science. In Wikipedia, The Free Encyclope-
dia. Retrieved 09:45, November 26, 2020, from https://en.wikipedia.org/w/index.php?title=-
Science&oldid=990161801
8 Le traduzioni dalle citazioni in inglese sono mie nel caso non si faccia riferimento all’e-
dizione italiana.
9 Questo passaggio, dalla considerazione personale di quanto so su un argomento, al
cercare il riscontro dalla conoscenza altrui (che sia Wikipedia o i propri pari), per poi sele-
zionare le fonti esperte, è razionale ed esemplifica, pur con le dovute differenze, una piccola
parte del metodo di cui parleremo in queste pagine.
10 The Council of The American Physical Society 11/15/98, accesso 26/11/2020 a https://
www.aps.org/publications/apsnews/199906/popa.cfm
11 Per un riferimento sul metodo dell’analisi concettuale nella filosofia contemporanea si
veda Beaney, M. (2018) Analysis. The Stanford Encyclopedia of Philosophy (Summer 2018 Edi-
tion), Edward N. Zalta (ed.), URL = <https://plato.stanford.edu/archives/sum2018/entries/
analysis/>.
12 Un filosofo della scienza ha recentemente proposto la sistematicità come criterio cen-
trale della sistematicità Hoyningen-Huene, P. (2013). Systematicity: The nature of science.
Oxford University Press. Nel testo ho omesso la differenza tra scienza e conoscenza scien-
tifica.

13 Jorge Luis Borges (1984) L’idioma analitico di John Wilkins. In Altre inquisizioni, Tutte
le opere. Volume I. Milano: Mondadori. 1984, 1004-1005. La raccolta è stata originariamente
pubblicata nel 1952.
14 Lemonick, S. (2019) The periodic table is an icon. But chemists still can’t agree on how
to arrange it. Chemical & Engineering News. 97
15 Nella letteratura molto vasta su questo tema rimando in italiano a Lalumera, E. (2019)
Il problema della classificazione dei disturbi mentali. Cap. 4 in R. Guerini e M. Marraffa (a
cura di) (2019) Psicopatologia e scienze cognitive. Roma: Carocci
16 Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi.
17 Nelle scienze sociali (psicologia, sociologia, economia, psicologia, eccetera), ma anche
in alcune aree della medicina, la ricerca è anche qualitativa, come diremo in seguito.
18 Galilei, G. Il Saggiatore, Milano, Feltrinelli 1992 (ed. or. 1623), 171.
19 Feynman, R. (1964) Messenger Lectures: The character of Physical Law. Cambridge,
MIT Press.
20 La filosofia della scienza iniziata con il Neopositivismo si può definire come teoria
delle teorie scientifiche, come vedremo brevemente nel §1.9
21 Per proposizione intendo un contenuto che può essere vero o falso e può essere espres-
so in varie lingue o formati, ad esempio “due più due è uguale a quattro”, “2+2=4” e “two
plus two equals four” esprimono la stessa proposizione vera. Caratterizzare le leggi in ter-
mini di proposizioni non è ovvio, si può alternativamente caratterizzare la legge come la re-
lazione stessa sussistente tra le variabili. La citazione da Feynman allude a questa opzione.
Per il nostro discorso, tuttavia, che è introduttivo e non filosofico specialistico, questa scelta
non ha effetti rilevanti.
22 Possiamo dire che questo criterio di universalità non sia soddisfatto da nessuna di
quelle che chiamiamo “leggi” nelle scienze empiriche, ad esempio la legge di gravitazione
universale nella formulazione di Newton non vale per corpi che si muovono a velocità
superiori a quella della luce e potenziali gravitazionali molto grandi, per cui si usa la Rela-
tività Generale. Tuttavia, le leggi fisiche si approssimano all’universalità.
23 Le leggi di una teoria scientifica, come gli assiomi in matematica e geometria, sono
premesse per la derivazione dei teoremi, ma diversamente dagli assiomi, esse derivano
dall’esperienza. Per una esposizione sintetica dell’importanza dei Principia per il metodo
scientifico rimando a Castellani, E., Morganti, M. (2019) La filosofia della scienza. Bologna,
il Mulino, cap. 3.
24 Per un’introduzione accurata in italiano rimando al cap. 4 di Laudisa, F. e Datteri, E.
(2012) La natura e i suoi modelli. Bologna: Archetipolibri.
25 Un’analisi dello statuto di questa legge da parte di un filosofo della scienza è Lorenza-
no P. (2014) What is the status of the Hardy-Weinberg law within population genetics? In:
Galavotti M.C., Nemeth E., Stadler F. (eds) European philosophy of science—philosophy of

science in Europe and the Viennese Heritage, Vienna Circle Institute Yearbook 17. Springer,
Dordrecht, pp 159–172
26 Roeckelein, J. E. (1998). Dictionary of theories, laws, and concepts in psychology. Green-
wood Publishing Group; Teigen, K. H. (2002). One hundred years of laws in psycholo-
gy. The American journal of psychology, 115(1), 103; Roediger, III, H. L. (2008). Relativity of
remembering: Why the laws of memory vanished. Annu. Rev. Psychol., 59, 225-254.
27 Per un’introduzione più completa al problema delle leggi, che adotta questo punto di
vista – non c’è una differenza filosoficamente rilevante tra leggi con moltissime condizioni
ceteris paribus e la legge di gravitazione universale - si veda Laudisa, F. e Datteri, E. La natura
e i suoi modelli. Un’introduzione alla filosofia della scienza. Bologna: Archetipolibri, cap. 4.
28 Lettrici e lettori curiosi possono facilmente trovare buone fonti di divulgazione storica su
queste teorie, per cui non appesantisco le note di questo testo con riferimenti bibliografici.
29 Semplificando al massimo, da un punto di vista realista si può parlare di verità o falsità
di una teoria, in quanto rappresentazione del mondo. Da un punto di vista antirealista si
parla invece di utilità o inadeguatezza di una teoria come strumento per spiegare e preve-
dere. Realismo e antirealismo sono due posizioni in filosofia della scienza, si veda Okasha,
S. (2012) Il Primo libro di filosofia della scienza. Torino: Einaudi.
30 Ne parliamo più avanti, § 1.10.
31 Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi, 24-25.
32 ...I believe there exists, & I feel within me, an instinct for the truth, or knowledge or dis-
covery, of something of the same nature as the instinct of virtue, & that our having such an
instinct is reason enough for scientific researches without any practical results ever ensuing
from them. Charles Darwin The Correspondence of Charles Darwin, Vol. 4. (1847-50)
33 Chi è curioso può consultare Russo, L. (2003). Flussi e riflussi: indagine sull'origine di una
teoria scientifica. Milano: Feltrinelli Editore.
34 Tutte le spiegazioni sono previsioni? Secondo l’idea neopositivista della spiegazione
scientifica proposto da Carl Gustav Hempel e Paul Oppenheim, la risposta è affermativa.
Come si è detto, tuttavia, esiste un importante dibattito sul tema, sviluppatosi proprio in
reazione alla proposta neopositivista. Per un’introduzione in italiano rimando al cap. 5 di
Galavotti, M.C.e Campaner, R. (2017) Filosofia della scienza. Milano: Egea
35 Per una trattazione filosofica estesa si veda Psillos, S. (1999) Scientific Realism: How
Science Tracks Truth, London: Routledge, cap. 4. Un’introduzione in italiano si trova in Oka-
sha, S. (2006). Il primo libro di filosofia della scienza. Torino: Einaudi, cap. 4.
36 Oltre al riferimento in nota 32 rimando a Woodward, James (2019) Scientific Explana-
tion. The Stanford Encyclopedia of Philosophy (Winter 2019 Edition), Edward N. Zalta (ed.),
URL = <https://plato.stanford.edu/archives/win2019/entries/scientific-explanation/>.
37 Si veda ad esempio Shang, J., Wan, Y., Luo, C., Ye, G., Geng, Q., Auerbach, A., & Li, F.
(2020). Cell entry mechanisms of SARS-CoV-2. Proceedings of the National Academy of Scienc-
es, 117(21), 11727-11734.

38 Nella letteratura molto vasta segnalo Bechtel, W., & Abrahamsen, A. (2005). Expla-
nation: A mechanist alternative. Studies in History and Philosophy of Science Part C: Studies
in History and Philosophy of Biological and Biomedical Sciences, 36(2), 421-441, Campaner, R.
(2011). Understanding mechanisms in the health sciences. Theoretical medicine and bioeth-
ics, 32(1), 5-17, e Illari, P. M., & Williamson, J. (2012). What is a mechanism? Thinking about
mechanisms across the sciences. European Journal for Philosophy of Science, 2(1), 119-135. Il
saggio di Catherine Elgin argomenta che i modelli sono falsità che la scienza usa per spie-
gare, prevedere, controllare e che tuttavia giustificano la pretesa di conoscenza: Elgin, C. Z.
(2017). True enough. Boston: MIT Press.
39 Un’introduzione in italiano al ruolo dei modelli nella teorizzazione scientifica è il cap.
7 di Laudisa, F. e Datteri. E. (2012) La natura e i suoi modelli. Bologna, Archetipolibri. In
inglese: Wilde, M.; and Williamson, J. 2016. Models in medicine. In Routledge Companion
to Philosophy of Medicine, ed. by M. Solomon, J. Simon and H. Kincaid, 271–84. Routledge:
New York and London.
40 Per avere un’idea di che cosa sia un modello matematico in biologia, Allman, E. S., Al-
lman, E. S., & Rhodes, J. A. (2004). Mathematical models in biology: an introduction. Cambridge
University Press.
41 Si veda ad esempio Jewell, N. P., Lewnard, J. A., & Jewell, B. L. (2020). Predictive math-
ematical models of the COVID-19 pandemic: Underlying principles and value of projec-
tions. Jama, 323(19), 1893-1894
42 Russell, B. (1913). On the Notion of Cause. Proceedings of the Aristotelian Society, 13:
1–26.
43 Hume, D. (2000) (1748) An enquiry concerning human understanding: A critical edition.
Oxford: Oxford University Press.
44 In italiano un’introduzione breve e accurata è Laudisa F. (2012). Causalità. APhEx 5.
On-line: http://www.aphex.it/index.php?Temi=557D030122027403210E057677 73
45 Supino, P. G. (2012). The Research Hypothesis: Role and Construction. In Principles of
Research Methodology (pp. 31-53). Springer, New York, NY.
46 Wikipedia contributors. (2020, November 10). Paul the Octopus. In Wikipedia, The Free
Encyclopedia. Retrieved 16:17, December 13, 2020, from https://en.wikipedia.org/w/index.
php?title=Paul_the_Octopus&oldid=987926383
47 Nelson, D. L., & Cox, M. M. (2017). Lehninger Principles of Biochemistry 7th edition.
London, MacMillan, ii.
48 Traversa, G., Maggini, M., Menniti‐Ippolito, F., Bruzzi, P., Chiarotti, F., Greco, D., ...
& Italian Study Group for the Di Bella Multitherapy Trials. (1999). The unconventional Di
Bella cancer treatment: A reflection on the Italian experience. Cancer, 86(10), 1903-1911.
49 Per un’esposizione del Neopositivismo rimando ai volumi introduttivi in italiano fino-
ra citati: Galavotti, M.C. e Campaner, R. (2017) Filosofia della scienza. Milano: Egea; Lau-

disa, F. e Datteri, E. (2012) La natura e i suoi modelli. Bologna: Archetipolibri; Okasha, S.

(2006). Il primo libro di filosofia della scienza. Torino: Einaudi; e anche all’antologia Bonio-
lo, G., Dalla Chiara, M. L., Giorello, G., Sinigaglia, C., & Tagliagambe, S. (2002). Filosofia
della scienza. Milano: Raffaello Cortina.
50 Carnap, R. (1971). I fondamenti filosofici della fisica. Milano: Il Saggiatore, p. 9.
51 Curd, M., & Psillos, S. (Eds.). (2013). The Routledge companion to philosophy of science.
London: Routledge, xxiii.
52 Per quanto riguarda la filosofia della medicina in italiano mi limito a segnalare questi
riferimenti, che contengono anche bibliografia per approfondire: Amoretti, M. C. (2015). Fi-
losofia e medicina. Roma, Carocci; Campaner, R. (2005). Spiegazioni e cause in medicina: un'in-
dagine epistemologica. Gedit edizioni; Pagnini, A. (2010). Filosofia della medicina. Epistemolo-
gia, ontologia, etica, diritto. Roma: Carocci.

IL METODO SPERIMENTALE
CAPITOLO SECONDO
PIANO DEL CAPITOLO

Abbiamo visto che non è facile definire la scienza, ma tutte le varie discipline scien-
tifiche si riconoscono nel seguire un metodo intersoggettivo. Partiamo qui con una
descrizione semplificata del metodo scientifico dall’osservazione alla stabilizzazione
dell’ipotesi, con l’avvertenza che si tratta di uno schema idealizzato e che le pratiche
metodologiche sono più complicate. A varie fasi del metodo corrispondono vari tipi
di ragionamento o inferenza: l’induzione, l’abduzione e la deduzione. Ciascuno ha
limiti e poteri dal punto di vista della produzione di conoscenza. Tre vicende tratte
dalla storia della medicina ci permettono di vedere il metodo applicato e la differenza
tra induzione, abduzione e deduzione. Consideriamo infine come il metodo in forma
astratta sia oggi codificato in medicina in metodologie e pratiche sperimentali.
2.1 IL METODO, SEMPLIFICATO

A partire da un problema posto dall’osservazione dei fenomeni e dalla cono-
scenza pregressa, lo scienziato si pone una domanda di ricerca e in base a questa
formula un’ipotesi, da cui trae conseguenze o previsioni, che sottopone a controllo
mediante un esperimento o l’osservazione. Se le previsioni si verificano, conclude
che i risultati danno supporto all’ipotesi, altrimenti riparte dalla domanda. Questa

è una descrizione semplificata del metodo scientifico come processo logico, che
possiamo trovare in diversi manuali universitari e pagine divulgative:
− Osservazione
− Ipotesi
− Previsione
− Controllo
− Valutazione
sono le fasi logiche del processo, che sono collegate da varie attività di ragiona-
mento:
− dall’osservazione all’ipotesi
− dall’ipotesi alle previsioni
− dalle previsioni al controllo
− dal controllo alla valutazione dei risultati.
Sappiamo dalle ricostruzioni storiche tradizionali che questa idealizzazione del
metodo nasce con la cosiddetta rivoluzione scientifica del XVII secolo, con Galileo
Galilei (Dialogo sopra i due massimi sistemi del mondo, 1632), Francis Bacon (Novum
Organum, 1620) e Isaac Newton (Principia mathematica philosophiae naturalis, 1687).
Ci sono frasi di questi autori che vale la pena citare, perché ci aiutano a ricordare
aspetti rilevanti. Da Galileo Galilei:
Sì come a voler che i calcoli tornino sopra i zuccheri, le sete e le lane, bisogna che il
computista faccia le sue tare di casse, involgi ed altre bagaglie, così quando il filosofo
geometra vuol riconoscere in concreto gli effetti dimostrati in astratto, bisogna che
difalchi gli impedimenti della materia; che se ciò saprà fare, io vi assicuro che le cose
si riscontreranno non meno aggiustatamente che i computi aritmetici1.
Sostituiamo “scienziato” a “filosofo geometra” e troviamo qui un elemento fon-
damentale del metodo scientifico, l’esperimento, che non è osservazione di tutte le
caratteristiche di un fenomeno, ma comporta una selezione degli aspetti rilevanti
al fine del controllo e della misura: in questo senso il ricercatore “bisogna che di-
falchi gli impedimenti della materia”. È importante ricordare che anche gli antichi
osservavano la natura, e anzi la scienza di Aristotele è molto più vicina al senso
comune della nostra – cosa c’è di più ovvio del fatto che il sole sorge e tramonta,
cioè si muove nel cielo durante la giornata? Non l’osservazione, ma l’esperimento
(o l’osservazione di aspetti selezionati nel caso l’esperimento non sia possibile) è la
novità del metodo della scienza moderna che qui sottolinea Galileo2.

Capitolo secondo - Il metodo sperimentale 35
Qui invece troviamo la famosa frase “hypotheses non fingo” di Newton:

[...] In verità non sono ancora riuscito a dedurre dai fenomeni la ragione di queste
proprietà della gravità, e non invento ipotesi. Qualunque cosa, infatti, non deducibi-
le dai fenomeni va chiamata ipotesi; e nella filosofia sperimentale non trovano posto
le ipotesi sia metafisiche, sia fisiche, sia delle qualità occulte, sia meccaniche3.
Facendo attenzione al fatto che il “dedurre dai fenomeni” si chiama oggi indu-
zione, l’idea qui è la seguente: riguardo alla forza di gravità, ci si può sicuramente
chiedere “perché esiste?” ovvero “per quale ragione i corpi sono attratti secondo
questa forza?”. Newton osserva però che a questa domanda non è possibile formu-
lare un tentativo di risposta che parta dai fenomeni, e che sia controllabile tramite
osservazione o esperimento: dunque la domanda, per quanto sembri lecita, non si
può porre dal punto di vista scientifico. La causa ultima, la natura essenziale delle
cose, l’ordine dell’universo sarebbero ipotesi “finte”, cioè provenienti dalla specu-
lazione, ma non ammesse dalla scienza (qui “filosofia sperimentale”). L’ideazione
di un’ipotesi è sempre quindi vincolata alla nostra possibilità di controllarla.
Un terzo e ultimo tema ci viene suggerito da Francis Bacon, che non era uno
scienziato come Galileo e Newton, bensì un filosofo e che si occupò, nel Novum Or-
ganum, di rivedere le prescrizioni metodologiche di Aristotele (raccolte, appunto,
nei libri dell’Organum):
Coloro che trattarono la scienza furono o empirici o dogmatici. Gli empirici, come
le formiche, accumulano e consumano. I razionalisti, come i ragni, ricavano da sé
medesimi la loro tela. La via di mezzo è quella delle api, che ricavano la materia
prima dai fiori dei giardini e dei campi, e la trasformano e digeriscono in virtù della
loro propria capacità […]. Così la nostra speranza è riposta nell’unione sempre più
stretta e più santa delle due facoltà, quella sperimentale e quella razionale, unione
che non si è finora realizzata4.
Il tema è quello del rapporto tra base empirica (osservazione) e parte teorica
(ragionamenti e ipotesi) nella spiegazione scientifica. Si tratta di un difficile equi-
librio che interessa tutte le fasi della ricerca. Quanti dati devo raccogliere prima di
formulare un’ipotesi, o prima di valutare che l’ipotesi è confermata? Quanto posso
ragionare a partire da quello che già so prima dell’esperimento, e quando posso
speculare a partire dai risultati che ottengo? Queste sono domande di principio,
e anche se imparare una metodologia significa spesso adottare implicitamente un
certo tipo di risposta, restano sempre aperte, nel 1600 come oggi.

Un’altra caratteristica del metodo scientifico sperimentale, che abbiamo già in

parte considerato nel capitolo 1, è l’architettura logica del metodo: è ciò che acco-
muna le discipline scientifiche e permette di distinguere la scienza dagli altri modi
in cui gli esseri umani cercano di spiegare la realtà, come la filosofia o la religione.
La centralità del metodo ha percorso la storia e la filosofia della scienza più o meno
dal 1600 fino alla metà del XX secolo. Per i Neopositivisti, di cui abbiamo già par-
lato, era la base per unificare tutti i saperi.
Tuttavia, i Neopositivisti lavoravano alla chiarificazione del metodo scienti-
fico in astratto, come prodotto astorico della razionalità umana. Oggi si tende a
dire, sia in filosofia che in scienza, che il metodo scientifico astratto non esiste5.
Questa affermazione dovrebbe risultare poco sorprendente e anzi banale, perché
in generale siamo poco disposti a concedere che gli oggetti astratti esistono (i
numeri primi, l’idea di democrazia, il tipico millennial, e così via). L’affermazio-
ne serve però a portare l’attenzione sul fatto che le discipline scientifiche hanno
oggi diverse metodologie, procedure e pratiche per passare da un problema al
controllo dell’ipotesi formulata e all’analisi dei risultati, e comprendono i disegni
sperimentali e i protocolli, le tecniche di analisi dei dati, le modalità di comunica-
zione e disseminazione dei risultati, nonché le norme di etica della ricerca. I filo-
sofi della scienza della seconda parte del XX secolo, assieme ai sociologi, ci hanno
mostrato che questi insiemi di metodologie, procedure e pratiche (paradigmi,
repertori, stili) non sono aggiunte irrilevanti all’architettura logica del metodo,
ma costituiscono la scienza, perché sono essenziali al modo in cui si giustificare
la conoscenza scientifica: cambiano le ragioni per cui possiamo dire che sia cono-
scenza. Ad esempio, oggi le nostre ragioni per credere che un farmaco sia effica-
ce sono codificate in un processo che coinvolge diverse fasi di sperimentazione,
dal laboratorio all’essere umano, e che comprende anche il passaggio legislativo
da parte di agenzie di controllo: niente se non questo conta come base per dire
di “sapere” che il farmaco funziona. Anche la tecnologia è parte integrante del
metodo in questo senso: perché fornisce nuovi tipi di ragioni. Con un esempio
veloce dalla storia della medicina: quando attorno al 1920 si diffonde in Europa
l’uso delle radiografie a raggi X, si introduce non solo uno strumento per localiz-
zare velocemente e accuratamente proiettili o fratture, ma anche un nuovo modo
di fornire ragioni per la diagnosi o per la spiegazione delle patologie, cioè attra-
verso la lettura dell’immagine. Da queste considerazioni segue – rischiando di
rovinare il romanticismo – che oggi uno di noi non può fare ricerca in astrofisica
da solo annotando sul proprio quaderno le osservazioni dal telescopio di casa.

E non può fare ricerca biomedica senza una conoscenza almeno pratica di una
parte delle metodologie e procedure che gli scienziati oggi usano.
Dal capitolo precedente abbiamo imparato anche, però, che ai filosofi della
scienza spetta il lavoro di astrarre i concetti fondamentali che sono impliciti nei pa-
radigmi, per guardarli più da vicino, chiarirli e valutarli nel loro ruolo di produrre
conoscenza. Facciamo quindi questo esercizio con la nostra descrizione del metodo
scientifico come processo logico, considerando dal punto di vista filosofico le atti-
vità che abbiamo menzionato in apertura: dall’osservazione all’ipotesi, dall’ipotesi
alle previsioni, dalle previsioni al controllo e alla valutazione dei risultati. Queste
attività fanno capo a diversi tipi di ragionamento logico: l’induzione, l’abduzione e
la deduzione. L’avvertenza, già introdotta, è che in concreto queste diverse attività
che lo scienziato compie facendo ricerca si troveranno all’interno di un contesto
più ampio in cui metodologie, tecnologie e pratiche sono rilevanti per la costruzio-
ne della conoscenza, tanto quanto la struttura logica del metodo. Ci occuperemo
delle metodologie per la ricerca biomedica nei prossimi due capitoli, riconside-
rando tutte le attività e le fasi non più dal punto di vista astratto e concettuale, ma
pratico e procedurale.
2.2 DALL’OSSERVAZIONE ALL’IPOTESI PER INDUZIONE

I Neopositivisti e anche Karl Popper ritenevano che non fosse compito dei filo-
sofi né dei metodologi occuparsi di come nascono le ipotesi nella mente dei ricerca-
tori: l’idea può arrivare per caso, in sogno, con un qualsiasi procedimento. I filosofi
e i metodologi devono piuttosto occuparsi di come l’ipotesi viene giustificata (per
usare un termine filosofico) o controllata (per usare un termine metodologico). In
effetti, come vedremo nei capitoli successivi, la metodologia della ricerca si occupa
dettagliatamente del disegno sperimentale, che fa parte dell’attività di controllo
dell’ipotesi, e molto meno della prima fase, quella dell’ideazione, che non ha pro-
cedure codificate. È utile tuttavia capire che tipo di ragionamenti usiamo anche in
questa fase, quali sono i loro limiti e la loro portata conoscitiva. Parleremo quindi
dell’induzione e poi dell’abduzione come tipiche inferenze che si compiono per
formulare un’ipotesi6.
Chiamiamo inferenza un insieme di enunciati (frasi) di cui le prime, dette pre-
messe, forniscono ragioni a supporto dell’ultima, detta conclusione. Il ragiona-

mento è il tipo di processo psicologico che noi compiamo nell’effettuare i passaggi

di un’inferenza. Spesso i due termini “inferenza” e “ragionamento” si usano inter-
cambiabilmente, ma vale la pena essere precisi.
Esempi di inferenza induttiva sono i seguenti:
La prima volta che ho mangiato da Yoshi il sushi era molto buono. La seconda volta
che ho mangiato da Yoshi il sushi era molto buono. La terza volta che ho mangiato da
Yoshi il sushi era molto buono. Dunque, il sushi è molto buono da Yoshi.
Abbiamo svuotato più di metà del barattolo di ceramica e trovato solo fagioli bianchi.
Tutti i fagioli del barattolo di ceramica sono bianchi.
Gli studenti di Medicina e Chirurgia preferiscono i test a risposta multipla: lo mo-
stra uno studio condotto su un campione di iscritti ai vari anni del corso in due
atenei italiani.
Il 78% dei pazienti trattati con il farmaco XYZ hanno mostrato remissione dei sinto-
mi della patologia P entro sette giorni. Il farmaco XYZ causa remissione dei sintomi
della patologia P.
La paziente EM ha febbre, tosse e dolori muscolari. 16 su 30 ricoverati in questo
piano sono malati di influenza. Probabilmente EM ha l’influenza.
Nel primo caso la struttura dell’inferenza, con premesse e conclusioni, è esplici-
ta, mentre nel terzo la conclusione è presentata prima della premessa. Nel quarto
caso la generalizzazione è di tipo causale. In tutti e tre gli esempi, comunque, pre-
messe riguardanti un campione limitato di casi testati forniscono ragioni per con-
cludere qualcosa a proposito di casi non testati (fagioli non visti, prossima cena,
studenti fuori dal campione, paziente non ancora visitata): questa è la caratteristica
dell’induzione. In particolare, l’inferenza causale – di cui abbiamo visto pericoli e
tranelli già nel §1.8 - è un’induzione. L’induzione è quindi un’inferenza ampliativa
della conoscenza: da una base finita di fenomeni osservati, si può derivare una con-
clusione che riguarda un numero infinito di casi: una generalizzazione, un’ipotesi,
una legge. Questo ci consente di formulare previsioni su base induttiva: andiamo
da Yoshi domani, si mangerà bene.
Tuttavia, nell’induzione la verità delle premesse non garantisce la verità della
conclusione: come si dice in logica, non si tratta di un’inferenza valida. Le premes-
se forniscono ragioni più o meno buone a sostegno della conclusione: il supporto
induttivo ammette gradi, e nuove premesse, con nuova informazione, possono au-
mentare o diminuire il supporto induttivo o la probabilità della conclusione rispet-

to alle premesse (la probabilità è la nozione matematica che ci permette di rendere

più precisa l’idea di supporto induttivo). Potrei ad esempio venire a sapere che
il ristorante giapponese Yoshi ha cambiato cuoco: questa informazione riduce il
supporto induttivo delle altre premesse alla mia previsione che si mangerà bene.
È importante ripetere, comunque, che qualunque sia il supporto induttivo delle
premesse rispetto alla conclusione, questa non sarà mai garantita logicamente dal-
la verità delle premesse. A Bertrand Russell si deve la storiella del tacchino, che ci
porta ad aprire un intermezzo filosofico (chiedendo scusa ai vegetariani):
Questo tacchino scoprì, il primo giorno che si trovava alla fattoria, che veniva nutrito
alle 9 di mattina. Tuttavia, essendo un buon induttivista, non saltò alle conclusioni.
Aspettò di avere raccolto un gran numero di osservazioni del fatto che veniva nu-
trito alle 9 di mattina, osservazioni compiute in varie circostanze, di mercoledì e di
giovedì, in giornate calde e giornate fredde, piovose e non piovose. Ogni giorno egli
aggiungeva un altro enunciato osservativo alla sua lista. Alla fine, la sua coscien-
za induttivista fu soddisfatta e compì l’inferenza induttiva concludendo “Io vengo
sempre nutrito alle 9 di mattina”. Ahimè, tale conclusione si rivelò chiaramente
falsa quando la Vigilia di Natale, invece di essere nutrito, gli venne tagliata la gola.
Un’inferenza induttiva con premesse vere ha portato a una conclusione falsa7.
Qual è l’errore del tacchino? Dal punto di vista della procedura, nessuno. Ci
pare di capire che abbia utilizzato tutte le informazioni in suo possesso e orga-
nizzato al meglio le sue osservazioni in varie condizioni. Al tacchino manca però
un’informazione fondamentale, che non può avere: che un evento straordinario
metterà fine alla serie delle sue mattine. La sua conclusione si fonda sull’assunzio-
ne che le cose continuino ad andare come sono sempre andate, ovvero, come ha
osservato il filosofo David Hume, sull’ “uniformità della natura”. Ma quale giusti-
ficazione abbiamo (induttivisti e tacchini) per pensare che le cose andranno come
sono sempre andate, ovvero che le nostre esperienze siano rappresentative di un
numero infinito di casi? Dal punto di vista logico, nessuna. Più in dettaglio: è vero
che abbiamo imparato che le cose tendono tutto sommato ad andare come sono
sempre andate (il pane ci nutre sempre e l’acqua ci disseta sempre, i pesi cadono
verso terra e le malattie non cambiano sintomi). Tuttavia, l’abbiamo imparato per
induzione a partire dalla nostra esperienza. Se cerchiamo di giustificare l’induzio-
ne con l’uniformità della natura, ci rendiamo conto che l’uniformità della natura
è essa stessa una conclusione induttiva, dunque abbiamo una giustificazione cir-
colare, che non funziona: è come se cercassimo di appurare se la notizia in prima

pagina del giornale è vera comprando un’altra copia dello stesso giornale. Dunque,
in base a cosa l’induzione ci porta conoscenza a partire dall’osservazione? In base
a nulla, potremmo concludere letteralmente.
La morale negativa dell’intermezzo filosofico è che l’induzione rappresenta un
problema – il famoso problema di Hume - se vogliamo giustificare su basi logiche
e razionali la nostra conoscenza a partire dall’osservazione, cioè se vogliamo porci
una domanda di principio. Possiamo però decidere di non affrontare la domanda
di principio, in quanto scienziati, e lavorare su quella metodologica: come possiamo
rafforzare il supporto induttivo che le osservazioni forniscono alle nostre ipotesi?
Quali procedimenti logico-matematici ci consentono di chiarire l’effettivo supporto
induttivo che le ipotesi ricevono dall’osservazione? Vedremo nei prossimi capitoli
le linee generali di alcuni protocolli per studi sperimentali, che appunto rispondono
alla domanda metodologica. Prima di questo vale la pena ricordare i metodi della
logica induttiva di John Stuart Mill, enunciati nel suo Sistema di logica (prima edizio-
ne 1843), che ritroviamo ancora oggi alla base dei protocolli sperimentali.
Per inciso, Mill è un campione filosofico dell’induttivismo: ritiene che il ragio-
namento induttivo a partire dall’esperienza sia sostanzialmente la base della vita
razionale umana:
Poichè la massima parte della nostra conoscenza, sia delle verità generali che dei fatti
particolari, è incontestabilmente materia di inferenza si può ricondurre all’autorità
della logica non solo quasi tutta la scienza, ma anche la condotta umana. Fu detto
che il trarre inferenze è la massima occupazione della vita. Ognuno ha bisogno ogni
giorno, ogni ora ed ogni istante di accertare fatti che non ha osservato direttamente,
non per uno scopo generico di accrescere il proprio patrimonio di conoscenze, ma
perchè quei fatti hanno importanza per i suoi interessi o le sue occupazioni. Compito
del magistrato, del comandante militare, del navigatore, del fisico, dell’agricoltore,
è semplicemente un giudizio sull’evidenza ed un’azione conforme. Tutti hanno da
accertare determinati fatti, per potere in seguito applicare determinate regole, o da
loro stessi escogitate, o prescritte da altri per loro guida; assolvono bene o male i
doveri delle loro diverse mansioni, secondo che fanno questo bene o male. È la sola
occupazione in cui la mente non cessi mai d’essere occupata, ed è argomento della
conoscenza in generale, non della logica8.
I metodi di Mill hanno lo scopo di guidare i ragionamenti induttivi, in parti-
colare in quelli in cui la conclusione è di tipo causale. Questo è il metodo della
concordanza:

Se due o più casi del fenomeno che stiamo indagando hanno una circostanza in co-
mune, la sola circostanza per la quale tutti i casi concordano è la causa (o l’effetto)
del fenomeno dato9.
Facciamo un esempio semplice: osservo negli anni che tutte le mie ventotto
piante di phalaenopsis, quelle sulla scrivania e quelle sulla credenza, quelle al sole
al mattino e quelle al sole al pomeriggio, quelle con il vaso di plastica e quelle con
il vaso di porcellana, quelle comprate al mercato e quelle prese nel vivaio, hanno
perso le foglie dopo una settimana dal mio acquisto. L’unico aspetto che avevano
in comune è che sono sempre io ad innaffiarle, sempre allo stesso modo. Probabil-
mente, dunque, perdono le foglie a causa del modo in cui le innaffio.
Il metodo della differenza è così enunciato:
Se un caso in cui il fenomeno che stiamo indagando accade e un caso in cui non
accade hanno tutte le circostanze in comune eccettuata una e quest’una si presenta
soltanto nel primo caso, quella sola circostanza in cui i due casi differiscono è l’effet-
to, o la causa, o una parte indispensabile della causa del fenomeno.
Ad esempio: ho mangiato bene al ristorante Yoshi in 27 occasioni da ottobre
scorso ad agosto. Ordino sempre esattamente lo stesso menu. Da dopo l’estate però
non è più così: le ultime sei volte ho mangiato male. In settembre Yoshi ha cambia-
to cuoco. La causa è quella.
È facile notare, inventando controesempi (che lascio a chi legge), che i metodi
di Mill sono fallibili: non sono regole logiche, cioè non possono garantire conclu-
sioni vere neanche se partiamo da premesse vere. Tuttavia, ci possono aiutare a
ragionare meglio e a disegnare studi che per la loro struttura daranno un buon
supporto induttivo alla conclusione che troveremo. Di fatto molti studi di labora-
torio utilizzano il metodo della differenza: si effettua, su un campione noto, una
serie di interventi uno alla volta, e si osserva quale fa la differenza, ovvero produce
il fenomeno che si sta indagando. Ma il protocollo della sperimentazione, la tecno-
logia e la statistica, non solo il disegno, contribuiscono al supporto induttivo. Ne
parleremo più avanti.
Un filosofo della scienza che non approverebbe questi sforzi e ha preso invece
molto sul serio la morale negativa sulla giustificazione dell’induzione è Karl Pop-
per. Nel saggio Congetture e confutazioni Popper sostiene che
[l]’induzione, cioè l’inferenza fondata su numerose osservazioni, è un mito. Non è
né un fatto psicologico, né un fatto della vita quotidiana, e nemmeno una procedura

scientifica (…) Il procedimento effettivo della scienza consiste nell’operare attraverso

congetture, nel saltare alle conclusioni spesso dopo una sola osservazione (…). Le os-
servazioni e gli esperimenti reiterati fungono, nella scienza, da controlli delle nostre
congetture (…) costituiscono cioè dei tentativi di falsificazione10.
Popper crede che l’induzione sia un mito perché è convinto che l’osservazione
pura non esista, e che quindi le ipotesi scaturiscano come risposte a problemi che
sorgono confrontando ciò che già sappiamo con i fenomeni.
Ora, questo fatto – il fatto cioè che l’osservazione non può precedere tutti i problemi
– si può illustrare con un semplice esperimento, che io desidero eseguire, col vostro
permesso, prendendo voi stessi come cavie. Il mio esperimento consiste nel chiedervi
di osservare, qui ed ora. Spero che voi tutti stiate cooperando, ed osserviate! Ma temo
che qualcuno di voi, invece di osservare, provi il forte impulso a chiedermi: “Che cosa
vuoi che osservi?”. Se questa è la vostra risposta, allora il mio esperimento è riusci-
to. Infatti, quello che sto tentando di mettere in chiaro è che, allo scopo di osservare,
dobbiamo avere in mente una questione ben definita, che possiamo essere in grado di
decidere mediante l’osservazione. Charles Darwin lo sapeva, quando scrisse: “Com’è
strano che nessuno veda che ogni osservazione non può non essere pro o contro qual-
che teoria...”. Come ho detto prima, non posso sperare di convincervi della verità del-
la mia tesi, secondo cui l’osservazione viene dopo l’aspettazione o l’ipotesi. Ma spero
di essere stato capace di mostrarvi che può esistere un’alternativa alla venerabile
dottrina secondo cui la conoscenza – e specialmente la conoscenza scientifica – parte
dall’osservazione11.
L’altra ragione per cui Popper ridimensione drasticamente il ruolo dell’induzio-
ne nel metodo scientifico riguarda il controllo delle ipotesi, ed è l’asimmetria tra
conferma induttiva e falsificazione: dal punto di vista logico occorrono infinite os-
servazioni per stabilire con certezza che una legge è vera (cioè è impossibile), men-
tre basta un controesempio per stabilire con certezza logica che è falsa. Vedremo
meglio l’asimmetria logica di conferma e falsificazione parlando della deduzione
nel § 2.5.
Ma torniamo al nostro tema, che è ancora l’attività di generazione di nuove ipo-
tesi: chi ha ragione, Popper o gli induttivisti? Non c’è motivo per non rispondere
che hanno ragione tutti e due: le ipotesi vengono generate sia per induzione che
con altri tipi di ragionamento. Uno dei meriti di Popper in questo contesto è quello
di averci allertato sul fatto che l’immagine dello scienziato che scopre le leggi del-

la natura generalizzando dalle proprie osservazioni è fuorviante, perché è troppo

semplice. L’induzione è solo uno dei modi in cui si possono generare ipotesi che,
comunque generate, vanno sottoposte a controllo, e in generale la fase del metodo
che parte dalle osservazioni all’ipotesi è la meno adatta ad essere descritta come un
procedimento logico. Come vedremo nei prossimi capitoli, nella pratica della ricer-
ca contemporanea gli studi esplorativi o descrittivi sono dedicati a questo obiettivo
e sono di fatto meno regimentati da linee guida.
2.3 UN’IPOTESI PER INDUZIONE: CRAVEN E L’ASPIRINA

Vediamo un caso dalla storia recente della medicina in cui il ruolo dell’induzio-
ne a partire da un numero limitato di osservazioni appare determinante. L’aspirina
o acido acetilsalicilico contribuisce a prevenire l’infarto del miocardio perché ha
effetto anticoagulante: questa ipotesi è stata provata con studi randomizzati quasi
cinquant’anni dopo che il farmaco nella sua versione attuale era già in commercio
come antidolorifico. Uno sconosciuto dottor Lawrence Craven, chirurgo che si oc-
cupava soprattutto di rimozione di tonsille e adenoidi all’ospedale di Glendale, in
California, la formulò per primo nel 1948. A partire dall’osservazione di casi nella
propria pratica clinica e chirurgica, ragionò per induzione sul nesso causale tra
assunzione di aspirina e aumento di emorragie, da un lato, e diminuzione delle
morti da infarto, dall’altro, e continuò per tutta la vita a proporre la propria ipotesi
a riviste mediche perché venisse sottoposta a controllo sperimentale. Lo leggiamo
nei suoi scritti, pubblicati e in larga parte ignorati dai contemporanei12.
Nel primo articolo, del 1950, Craven espone i casi di diversi pazienti che gli ave-
vano segnalato che dopo un intervento di tonsillectomia o dopo l’estrazione di un
dente avevano assunto aspirina per lenire il dolore e sanguinato abbondantemen-
te. Inoltre, riporta di aver prescritto un’aspirina giornaliera a 400 dei suoi assistiti a
partire 1948 e che nessuno di questi è morto di infarto del miocardio nei due anni
successivi. In un secondo articolo, sempre del 1950, Craven ragiona come segue:
per 36 anni il mio lavoro di chirurgo è stato principalmente quello di rimuovere
tonsille e adenoidi. Dei centinaia di casi che ho affrontato, solo 5 di queste operazioni
sono state effettuate in ospedale: gli interventi si svolgevano di solito in ambulatorio
la mattina e praticamente tutti i pazienti venivano dimessi e potevano tornare a casa
nel tardo pomeriggio, senza nessun problema di possibili emorragie. Praticamente

nessuna si è mai verificata fino a circa sei anni fa, quando il numero di emorragie
postoperatorie è diventato allarmante13.
L’aumento di frequenza, continua Craven, è dovuto all’abitudine diffusa
di masticare gomme di aspirina a scopi analgesici. C’è un’ultima osservazione
nell’articolo che Craven porta a sostegno della propria ipotesi sul potere antico-
agulante e quindi antitrombotico dell’aspirina: nella sua pratica ha osservato che
gli uomini sono poco disposti in generale ad assumere aspirina, che ritengono es-
sere una medicina per donne, fatta per alleviare i tipici dolori femminili e quindi
poco adatta alla virile resistenza al dolore. Craven associa questa osservazione al
fatto che gli uomini rispetto alle donne hanno un rischio molto più alto di soffrire
di infarto cardiaco.
Negli anni successivi il chirurgo continua il suo lavoro di raccolta di dati, che
includono anche un piccolo studio osservativo su se stesso: ingerisce per cinque
giorni 12 tavolette di aspirina al giorno, notando poi un sanguinamento spontaneo
e profuso dal naso. Nell’ultimo lavoro che pubblica meno di un anno prima di
morire, Craven riporta di avere osservato circa 8000 pazienti a cui aveva prescritto
l’assunzione giornaliera di aspirina e che solo 9 di questi sono morti di aneurisma
aortico o trombosi coronarica. Egli è consapevole che quella che sta formulando è
solo un’ipotesi tratta dall’osservazione, scrive infatti:
va detto che l’efficacia di qualsiasi tipo di trattamento profilattico è difficile da provare
e ciò si applica specialmente a una procedura che è destinata alla prevenzione. Le os-
servazioni di soggetti sani non possono mai essere fatte sotto condizioni strettamente
scientifiche e i dati che risultano sono solo limitatamente adatti alla valutazione sta-
tistica. Questi risultati possono dunque semplicemente avere il valore di impressioni
preliminari e saranno sostanziate o rifiutate da ricerca clinica successiva. Ammet-
tendo dunque il campo della profilassi generale della trombosi coronarica eccede dei
limiti del presente studio, queste osservazioni preliminari possono essere di impor-
tanza pratica nella misura in cui la somministrazione di aspirina sia sicura in tutti
i soggetti e durante tutto il periodo di trattamento; le osservazioni fin qui riportate
non sono in opposizione rispetto alle tendenze riportate dalla ricerca clinica e speri-
mentale; risulti ben chiaro che i risultati a cui sono arrivato non sono stati ottenuti
sotto condizioni strettamente scientifiche14.
Craven fu brillante e prudente, ma sfortunato a non vedere il lieto fine, per-
ché morì (proprio di infarto!) prima che iniziassero i test clinici rilevanti. La storia

di questo chirurgo delle tonsille mostra la formazione di un’ipotesi di successo

ideata a partire da una domanda (quali interventi possono prevenire l’infarto del
miocardio?) e dall’osservazione di alcuni fatti sull’assunzione di aspirina, tramite
ragionamento induttivo. La sua ricerca potrebbe essere catalogato oggi come un
tipo di studio descrittivo per serie di casi, di cui parleremo più avanti (§3.8). La
competenza di Craven nei fondamenti del metodo scientifico lo resero in grado di
capire che con la formulazione dell’ipotesi su base induttiva il lavoro era solo all’i-
nizio: occorreva il controllo sperimentale. Il controllo fa parte delle procedure che
possono aumentare o diminuire il supporto induttivo a favore un’ipotesi.
2.4 DALL’OSSERVAZIONE ALL’IPOTESI PER ABDUZIONE

L’abduzione, o inferenza alla spiegazione migliore, è un altro tipo di inferenza
che ci permette di formulare ipotesi. Come l’induzione, l’abduzione è ampliativa
della nostra conoscenza, ma non è logicamente valida, cioè la verità delle premesse
non implica necessariamente la verità della conclusione. Vediamo qualche esempio:
Questi fagioli sparsi nell’armadietto sono bianchi. Tutti i fagioli del barattolo di cera-
mica sono bianchi. Dunque, questi fagioli vengono dal barattolo di ceramica.
La paziente Edelweiss Montagnoni presenta i sintomi R e S. Tutti i soggetti con la
patologia P presentano sintomi R e S. Dunque, Edelweiss Montagnoni ha P.
Edelweiss Montagnoni è alta più di 1,80 ed è in grado di sollevare pesi superiori a
60 kg. Chiunque abbia ucciso Alberto Bastia e nascosto il suo corpo nel ripiano più
alto della biblioteca universitaria, è alto e robusto. Edelweiss Montagnoni ha ucciso
Alberto Bastia.
L’aspirina rende le emorragie più frequenti. Gli anticoagulanti rendono le emorragie
più frequenti. Dunque, l’aspirina è un anticoagulante.
Come vediamo dal secondo e dal terzo esempio, l’abduzione è tipica della dia-
gnosi in medicina clinica e dell’indagine nei casi di crimine: in entrambi gli ambiti
si cerca, in un certo senso, il colpevole. L’esempio dei fagioli mostra invece chia-
ramente la differenza tra l’abduzione e l’induzione: conclusione dell’inferenza in-
duttiva è (semplificando al massimo) una generalizzazione, nell’abduzione invece
assumiamo una generalizzazione tra le premesse e concludiamo che quella il caso
che abbiamo di fronte ricede sotto quella generalizzazione.

Il ragionamento abduttivo per trovare un’ipotesi esplicativa avviene per stadi.

All’inizio si prendono in considerazione tutte le spiegazioni logicamente possibili,
e anche il fatto che non ci sia alcuna spiegazione (quella che si chiama l’ipotesi
nulla – ma non vale quando spieghiamo eventi singoli, perché qualcuno deve pure
avere ucciso il povero Bastia, e almeno una patologia è responsabile dei sintomi di
Montagnoni). Il ricercatore successivamente filtra ed elimina quelle implausibili.
Come fa? Se il tacchino induttivista di Russell deve assumere l’uniformità della
natura per credere che sarà nutrito anche domani alle 9 di mattina, chi compie
un’abduzione deve poggiare la propria conclusione su molte conoscenze di sfondo
per selezionare la spiegazione migliore. Pensiamo a un caso come questo:
Edelweiss Montagnoni ha comunicato che non può fare lezione oggi. Le persone
condannate in appello per omicidio volontario non possono fare lezione. Dunque,
Edelweiss Montagnoni è stata condannata in appello per omicidio volontario.
Immaginiamo che Edelweiss Montagnoni sia una docente universitaria di cui
non sapete quasi nulla, se non quel poco che avete letto sul sito istituzionale e quel-
lo che vi ha raccontato di sé a lezione. Alla luce di questo, la condanna per omicidio
non sembra essere la migliore spiegazione del perché sarà assente, per quanto sia
una conclusione possibile date le premesse. Inoltre, tra quello che sappiamo sulle
persone in generale c’è, ad esempio, che è più probabile che uno prenda l’influenza
o che perda il treno, piuttosto che venga condannato per omicidio. Assumendo
quindi la nostra conoscenza pregressa di Edelweiss Montagnoni e delle persone
in generale, possiamo ragionevolmente scartare tale conclusione. Uno dei criteri
per eliminare le spiegazioni implausibili tra quelle logicamente possibili è quindi
innanzitutto la coerenza con le proprie conoscenze pregresse. Nel caso della ricerca
scientifica, ricordando la nozione di paradigma a cui abbiamo fatto riferimento va-
rie volte, citando Kuhn, è il paradigma della disciplina – il consenso degli esperti,
ciò che si sa, i concetti in uso, i metodi - che fornisce vincoli di plausibilità alle ipo-
tesi esplicative che scegliamo, fornendo modelli esemplari di spiegazioni (a volte
questi vincoli prevengono le grandi scoperte, ma per lo più sono ragionevoli).
Una volta eliminate quelle implausibili, il ragionamento abduttivo deve identi-
ficare la migliore spiegazione. Qui “migliore” indica una serie di valori epistemici
(caratteristiche positive per quanto riguarda la costruzione della conoscenza): possi-
bilità di dare conto di gran parte dell’evidenza contenuta nelle premesse, semplicità,
essere in grado potenzialmente di spiegare anche altri fenomeni. Alla luce di queste
valutazioni si identifica finalmente una spiegazione possibile come la migliore.

La ricostruzione del ragionamento abduttivo fin qui fatta dovrebbe bastarvi per
sospettare che la conclusione di un’inferenza alla spiegazione migliore è un salto nel
buio: benché basata sull’evidenza contenuta nelle premesse, non è garantita dalla
verità di queste, né dai vincoli di selezione. A sostegno di questo punto ricordiamo
anche che l’abduzione, come l’induzione, è sensibile all’introduzione di nuova infor-
mazione nelle premesse. Avete scartato come implausibile la condanna per omicidio
come spiegazione del fatto che la prof. Montagnoni non si è presentata a lezione?
Non eravate al corrente delle indagini della polizia sull’omicidio di Alberto Bastia, di
cui nell’esempio sopra. E aggiungo ora che Edelweiss Montagnoni è l’identità di co-
pertura di Erica Montone, figura chiave del mercato dell’eroina proveniente dall’Af-
ghanistan, che si sta facendo largo in Italia sterminando la concorrenza. Questo ren-
de di nuovo probabile la spiegazione della condanna per omicidio. Altre volte le
nuove informazioni permettono invece di scartare definitivamente una tra le possibi-
li spiegazioni, anche se rispettava i vincoli del paradigma, aiutandoci nella selezione.
Vediamo questa dinamica con un’altra vicenda tratta dalla storia della medicina.
2.5 UN’IPOTESI PER ABDUZIONE: AIDS E HIV

La storia della scoperta del virus HIV come causa dell’AIDS si può raccontare
come un lungo e accidentato percorso di ragionamento per inferenza alla spiega-
zione migliore15. Tutto inizia nel 1981, quando viene pubblicato dai Centres for Di-
sease Control degli Stati Uniti un report che riguarda 5 casi di morte da polmonite
pneumococcica in California. Si tratta di uomini giovani, con nessuna patologia
pregressa, omosessuali sessualmente attivi. Al momento del decesso presentano
anche infezioni da candida e citomegalovirus, quindi la polmonite si presenta as-
sieme a questi altre infezioni come una sindrome. Il problema è che la polmonite
di questo tipo, si legge nel report, di solito colpisce soggetti gravemente immuno-
soppressi a seguito di interventi, ma qui non c’è evidenza di una causa comune di
immunosoppressione. Gli estensori del report concludono:
il fatto che questi pazienti siano tutti omosessuali suggerisce un’associazione tra la
polmonite pneumococcica in questa popolazione e alcuni aspetti dello stile di vita
omosessuale, oppure una malattia acquisita attraverso il contatto sessuale16.
C’è quindi un fatto da spiegare: un cluster di polmonite pneumococcica in una
popolazione in cui questa malattia è rarissima. Si potrebbe ancora pensare a un

caso, cioè che non ci sia con nessuna spiegazione del cluster, e che ogni paziente
abbia una storia diversa (l’ipotesi nulla), invece nel report vengono messe in cam-
po due ipotesi di natura associativo-causale:
a) un aspetto dello stile di vita omosessuale causa la sindrome
b) una malattia a trasmissione sessuale, tra quelle già note, causa la sindrome
Passa il tempo e si aggiunge evidenza, ovvero premesse per il ragionamento
abduttivo. Il mese successivo esce un altro report: 26 decessi per sarcoma di Ka-
posi, un raro tumore della pelle più frequente negli ultrasettantenni delle regioni
mediterranee, ma qui i soggetti sono nuovamente giovani omosessuali americani,
e tutti presentano anche polmonite pneumococcica. Si ipotizza dunque esplicita-
mente una sindrome, inizialmente chiamata GRIDS (Gay Related Immune Deficiency
Syndrome), e si propongono nuove ipotesi per spiegare l’immunodeficienza:
c) una partita di poppers contaminata (una droga ricreativa composta da al-
chil-nitriti)
d) consumo eccessivo di droghe, anche non contaminate
e) accumulo di malattie a trasmissione sessuale, che sovraccaricherebbero il si-
stema immunitario
f) batterio sconosciuto
g) virus sconosciuto
La prima ipotesi, quella dei poppers, risulta facile da eliminare, perché i casi
analoghi di morte continuano in altri luoghi e vengono compiute analisi tossicolo-
giche. Le ipotesi legate allo stile di vita, d) ed e) sembrano in questa fase dare conto
di tutta l’evidenza, mentre f) e g) sono di nicchia e vengono avanzate perché, in
quel periodo, c’è ricerca su batteri e virus come precursori dei tumori, ma risultano
più speculative. Nel 1982 arriva però l’evidenza sufficiente a eliminare le ipotesi
legate allo stile di vita: la sindrome viene riscontrata in diversi emofiliaci (uomini e
donne) e persone che hanno ricevuto sangue trasfuso, tra cui un bambino di venti
mesi: i comportamenti sessuali a rischio, l’omosessualità e l’uso di droghe non pos-
sono più essere cause dirette della sindrome e resta la spiegazione infettivologica.
I batteri, tuttavia, non possono resistere alla procedura di filtrazione che si usa per
trasferire il sangue agli emofiliaci, dunque l’ipotesi dell’infezione batterica risulta
più debole, perché non può spiegare l’evidenza relativa alla sindrome in quel grup-
po di pazienti.
Inizia quindi quella che potremmo chiamare la seconda fase della ricerca: il
ragionamento con l’apporto di nuova evidenza ha portato a selezionare l’ipotesi

dell’infezione virale come causa della sindrome (che a questo punto viene chiama-
ta AIDS, Acquired Immune Deficiency Syndrome, togliendo il riferimento discrimina-
torio all’omosessualità), ma occorre renderla precisa identificando il virus. Questa
fase è resa difficile dal fatto che i soggetti sviluppano i sintomi anni dopo l’infe-
zione, e nel frattempo vengono colpiti ogni tipo di infezione: da funghi, batteri e
altri virus “opportunisti”. Dopo vari tentativi che coinvolgono candidati patogeni
poi scartati, viene isolato nel 1983 in Francia un particolare virus in un paziente
con lifoadenopatia, già riconosciuta come uno stato precursore dell’AIDS, ma nella
quale i patogeni opportunisti sono meno numerosi. In pochi mesi il virus, poi chia-
mato HIV, viene riscontrato mediante un test del sangue appositamente sviluppa-
to in molti altri malati di AIDS, umani ma anche primati, e nel 1984 è riconosciuto
dal consenso della comunità scientifica come causa della sindrome17.
Riassumendo: questa ricostruzione della ricerca collettiva che ha portato a sta-
bilizzare la cosiddetta teoria virale dell’AIDS ha la forma, soprattutto nella sua pri-
ma fase, di un ragionamento abduttivo, in cui si cerca una generalizzazione causale
che renda conto di una serie di fatti epidemiologici (cluster di pazienti con le stesse
patologie rare) e clinici (sintomi, decorso). Nella prima fase le ipotesi non vengono
controllate sperimentalmente, ma la disponibilità di altra evidenza epidemiologica
(gli emofiliaci, i trasfusi e i bambini) permette di eliminarle, col tempo, quasi tutte.
La “migliore” ipotesi in questo caso viene anche sostanziata dall’identificazione
dell’agente patogeno e del meccanismo di infezione – che è la “causa” per eccellen-
za, anche se solo necessaria, e non anche sufficiente, per la malattia. Questa rico-
struzione della scoperta dell’HIV come causa dell’AIDS mostra quindi le caratteri-
stiche dell’abduzione che abbiamo illustrato: si tratta di un’inferenza speculativa,
in cui diverse conclusioni possono coesistere a parità di premesse, considerazioni
dettate dal paradigma di ricerca vigente suggeriscono quali siano più plausibili,
e nuova evidenza può far cambiare il grado di supporto di ciascuna rispetto alla
conclusione fino all’eliminazione di molte ipotesi concorrenti.
Tra poco, con la storia di Ignaz Semmelweis e la febbre puerperale, vedremo un
caso in cui le ipotesi ideate per abduzione vengono invece sottoposte a controllo
sperimentale (o semi-sperimentale) e così eliminate tutte, tranne una: un caso di
brillante scoperta del colpevole, come in una detective story. Ma occorre prima
introdurre la deduzione.

2.6 DALL’IPOTESI ALLE PREVISIONI E DALLE PREVISIONI AL CONTROLLO: DEDUZIONE

Torniamo all’inizio: come abbiamo visto, partendo da un problema posto all’os-
servazione e dalle conoscenze pregresse, lo scienziato formula un’ipotesi per abdu-
zione o per induzione (o per caso, fortuna, ispirazione). A questo punto, per sotto-
porla a controllo (osservativo o sperimentale), deduce da questa delle previsioni o
conseguenze: questo è un primo impiego del ragionamento deduttivo, antecedente
all’esperimento vero e proprio. Ce ne sono altri due dopo l’esperimento: la dedu-
zione ci serve quando falsifichiamo una teoria a partire dal risultato del controllo, e
successivamente, in una situazione molto favorevole, quando possiamo eliminare
tutte le ipotesi tranne una. Ma arriviamoci per gradi.
Diversamente dall’induzione e dall’abduzione, la deduzione è un’inferenza co-
dificata da regole formali, seguendo le quali la verità delle premesse garantisce la
verità della conclusione: in questo caso l’inferenza di dice valida. Le regole formali
della deduzione sono state codificate dalla logica sillogistica, nota fin da Aristotele,
e più recentemente dalla logica matematica, sviluppata all’inizio del XX secolo. Le
più semplici tra queste regole ci sono comunque note anche senza averle studiate:
il modus ponens (se A allora B, A, quindi B), il modus tollens (se A allora B, non B,
quindi non A) e la particolarizzazione (Tutti gli F sono G, x è un F, dunque X è un G).
Vediamo tre esempi molto semplici che esemplificano queste regole:
Tutti i fagioli del vaso di ceramica sono bianchi, quindi il fagiolo che ora estraggo dal
vaso sarà bianco (Particolarizzazione).
Se LP è iscritto al secondo anno, allora ha passato l’esame di Inglese 1. LP è iscritto
al secondo anno, quindi ha passato Inglese 1 (Modus ponens)
Se LP ha l’abbonamento del treno non deve fare il biglietto ogni giorno. LP deve fare
il biglietto ogni giorno, quindi non ha l’abbonamento del treno (Modus tollens).
Ancora diversamente rispetto a induzione e abduzione, la deduzione conserva
il grado di certezza e dalle premesse alla conclusione, ma non è ampliativa del-
la conoscenza: la conclusione riguarda sempre un caso che non è “nuovo”, bensì
contenuto nelle premesse dal punto di vista informativo. Attenzione però a non
confondere questo aspetto con la facilità del ragionamento deduttivo: dal punto di
vista cognitivo può essere molto difficile dedurre le conseguenze delle premesse
assunte, basti pensare che tutta la matematica è deduttiva, e nessuno direbbe che le
dimostrazioni matematiche avanzate sono banali.

Abbiamo ora tutto ciò che occorre per identificare un secondo ruolo della de-
duzione nel nostro schema semplificato del metodo scientifico: dal controllo alla
valutazione dei risultati. Consideriamo un’ipotesi o teoria T e una sua conseguen-
za deduttiva, che chiamiamo p: se è vera T, allora possiamo prevedere che p si
verificherà, in simboli:
T-->p
Supponiamo ora di concepire un esperimento o piano di osservazione per con-
trollare p. Il risultato dell’esperimento è che p effettivamente si verifica, ho quindi:
Prima premessa: (T-->p)
Seconda premessa: p
Ad esempio, dalla nostra ipotesi che tutti i fagioli del barattolo di ceramica sono
bianchi, abbiamo previsto che il prossimo che osserveremo sarà bianco, per con-
trollare abbiamo estratto un fagiolo, l’abbiamo osservato ed è effettivamente bian-
co.
Che cosa possiamo concludere? In questo caso, dal punto di vista deduttivo,
nulla, e in particolare non possiamo concludere che T è vera. Se guardiamo lo
schema della regola modus ponens riportata sopra, vediamo infatti che la forma
dell’inferenza non è questa. “Se T allora p, e p, dunque T” non esemplifica la regola
del modus ponens, che sarebbe invece “Se T allora p, e T, dunque P”. E nemmeno
del modus tollens. Cosa significa? Non sorprendentemente, che trovare una con-
ferma dell’ipotesi non basta a stabilire con certezza deduttiva che l’ipotesi è vera,
ma fornisce solo una ragione induttiva in più per tenerla in piedi fino al prossimo
esperimento: il controllo, se positivo, mostra dal punto di vista logico solo che non
abbiamo verificato che T sia falsa.
Supponiamo ora invece che, sempre partendo da T--> p, abbiamo effettuato la
nostra osservazione o esperimento di controllo, riscontrando che non si è verificato
quello che la teoria prevedeva. Abbiamo cioè
Prima premessa: T--> p
Seconda premessa: -p
Che cosa possiamo concludere? Se riguardiamo le regole formali per la dedu-
zione, vediamo che questa volta ce n’è una che fa al caso nostro: da queste due
premesse possiamo applicare il modus tollens, e concludere -T, compiendo un’in-

ferenza valida. Abbiamo così falsificato la nostra ipotesi e abbiamo tratto una con-
clusione certa e necessariamente vera, se lo sono le premesse.
Abbiamo dunque individuato il secondo ruolo della deduzione nel metodo
scientifico, nel controllo delle ipotesi tramite falsificazione. Come ha notato Pop-
per, la falsificazione e la conferma sono asimmetriche: se controllo la mia ipotesi
trovando che una delle sue conseguenze (già individuate per deduzione) non si
verifica, posso concludere deduttivamente, dal punto di vista logico, che l’ipotesi
è falsa, con tutta la certezza che mi dà la regola formale del modus tollens. Diversa-
mente, se controllo la mia ipotesi trovando che una delle sue conseguenze dedut-
tive si verifica, non posso concludere deduttivamente nulla. Ho solo accumulato
altro supporto induttivo e l’ipotesi rimane in circolazione, per essere sottoposta ad
altri controlli e confrontata con altra evidenza che può venire alla luce. L’asimme-
tria si vede nei numeri: un solo fagiolo nero falsifica l’ipotesi che tutti i fagioli del
barattolo sono bianchi, mentre cinquanta estrazioni di fagioli bianchi non permet-
tono nessuna conclusione certa.
Popper ha sostenuto che il metodo scientifico non sia altro che questo: inventare
un’ipotesi (congettura), dedurre previsioni da sottoporre a tentativi di falsificazio-
ne (confutazioni), e ancora dedurre da questo che l’ipotesi è falsa, se così è, quindi
ricominciare, cercando sempre di concepire “esperimenti cruciali”, cioè controlli
delle conseguenze di un’ipotesi che possano, per così dire, inchiodare la realtà a
un sì o a un no. Possiamo quindi capire perché Popper era convinto che, tutto som-
mato, l’induzione non sia così importante per il metodo scientifico, come abbiamo
ricordato nel capitolo precedente18.
In realtà, come ormai abbiamo imparato, una questione può essere concettual-
mente chiara e al contempo illuminare solo un aspetto della questione generale.
In questo senso, l’asimmetria della falsificazione rispetto alla verifica, per quanto
evidente, è come il problema dell’induzione di Hume: ci segnala un problema e ci
invita alla cautela rispetto alla conferma induttiva, ma va inserita in un contesto
più ampio, in cui talvolta, di fatto, sono più rilevanti altri aspetti. Prima di compli-
care le cose in questo senso – il Capitolo 3 e il capitolo 4 mostrano come si fa oggi
ad affrontare il problema della conferma induttiva con la metodologia della ricerca
– vediamo il terzo ruolo della deduzione nelle fasi successive all’esperimento. Que-
sta forma di ragionamento è stata chiamata “deduzione di Holmes”, in omaggio al
celebre investigatore Sherlock Holmes, protagonista delle storie di Arthur Conan
Doyle, che diceva “elimina l’impossibile e quello che resta, per quanto improbabi-
le, deve essere la verità”19. Ecco come funziona.

Ci troviamo nella situazione in cui possiamo assumere che un certo fenomeno

ha sicuramente una spiegazione e una soltanto. Può trattarsi di un fatto indivi-
duale (la mia phalaenopsis con i fiori rosa ha perso le foglie, la paziente EM ha certi
sintomi) o statistico (la diffusione insolita di una patologia in una popolazione) – in
quest’ultimo caso ci siamo accertati che non si tratti di un cluster casuale, avendo a
disposizione dati sufficienti. Abbiamo selezionato certo numero di ipotesi esplica-
tive (ideate per induzione o per abduzione, o in qualunque altro modo). Siamo poi,
mediante controllo sperimentale o osservazione programmata, riusciti a falsificarle
tutte, tranne una. Da queste premesse possiamo dedurre che quest’ultima rimasta
è l’ipotesi esplicativa. In sintesi:
Prima premessa: il fatto E ha una spiegazione (Determinismo)
Seconda premessa: Le ipotesi H1,..,Hn sono le uniche possibili ipotesi esplicative (Se-
lezione)
Terza premessa: H1,..,Hn-1 sono state falsificate dall’evidenza (Falsificazione)
Conclusione: Hn spiega E
Naturalmente la verità della conclusione dipende dalla verità delle premesse,
e della seconda non possiamo essere mai certi, perché potremmo avere compiu-
to male la selezione tra le spiegazioni possibili, perché fuorviati dalla conoscenza
di sfondo, o da ciò che contiene il paradigma in cui ci troviamo a operare. Se le
premesse sono vere, tuttavia, la conclusione segue logicamente: abbiamo trovato
il colpevole. Dunque – vedendo insieme i tre ruoli della deduzione - dopo aver
ragionato per deduzione per trovare le conseguenze delle ipotesi di partenza, e
dopo aver falsificato per deduzione tutte le ipotesi le cui conseguenze non si veri-
ficano, in qualche caso fortunato posso concludere per deduzione che l’unica non
falsificata è l’ipotesi esplicativa. Vediamo questo tipo di ragionamento nella storia
di Ignaz Semmelweis.
2.7 UNA DEDUZIONE HOLMESIANA: IL CASO DI IGNAZ SEMMELWEIS

Ignaz Semmelweis nasce a Budapest, studia medicina all’Università di Vienna
e dopo vari anni di precariato, come si dice oggi, viene assunto come assistente
all’Ospedale Generale nel 1846, nel reparto Maternità. Si tratta di un reparto molto
grande, diviso in due cliniche. Le pazienti vengono ricoverate nell’una o nell’altra

a seconda del giorno di ammissione. Le due cliniche servono anche per l’istruzione
dei giovani medici e ostetriche: per la divisione vigente all’epoca tra allievi maschi
e femmine, i medici fanno pratica solo nella prima clinica e le ostetriche solo nel-
la seconda. A quei tempi la febbre puerperale è uno dei maggiori rischi associati
al parto. Si tratta di una malattia quasi sempre mortale che si sviluppa nelle sei
settimane successive al parto. Quando Semmelweis comincia il suo lavoro come
assistente, la mortalità per febbre puerperale è del 9.92% dei ricoveri per la prima
clinica e del 3,88% per la seconda (i dati si riferiscono ai cinque anni precedenti).
Nei suoi diari, poi confluiti in un voluminoso trattato20, Semmelweis scrive di voler
capire il perché di questa differenza.
La prima ipotesi che considera è suggerita dal paradigma medico dominante
all’epoca: viene tratta della teoria del miasma, secondo cui le malattie sono causata
dall’aria maleodorante originata da acqua putrida e sostanze marce. La teoria ha in
effetti un buon successo anche predittivo in quegli anni: migliorando le condizioni
igieniche dei corsi d’acqua e degli scarichi nelle strade, negli edifici e in particolare
negli ospedali, si riducono i focolai di malattia. Semmelweis ragiona dunque così:
se la febbre puerperale ha origine miasmatica, allora un tasso di mortalità superio-
re nella prima clinica sarà dovuto a una peggiore atmosfera (odore, pulizia). Pro-
cede dunque al controllo osservativo, ma ispezionando con cura i locali delle due
cliniche, non nota alcuna differenza. La prima ipotesi è quindi falsificata.
La seconda ipotesi è simile alla prima: il sovraffollamento delle pazienti ri-
coverate causa la differenza in mortalità. Siamo sempre nell’ambito della teoria
miasmatica: secondo il paradigma dominante dell’epoca anche il sovraffollamento
contribuisce a rendere malsana l’aria e quindi a favorire le malattie. Anche qui
Semmelweis controlla tramite osservazione e scopre invece che negli ultimi anni la
prima clinica è meno affollata della seconda, perché si è sparsa la voce delle tante
morti, e le pazienti cercano di non farsi ricoverare lì, se possono. Dunque, dopo
breve controllo, un’altra falsificazione.
Una terza ipotesi, diremo psicosomatica, viene presentata da una commissione
istituita dall’ospedale per spiegare la questione: le maniere rudi degli studenti stra-
nieri che trattano le pazienti nella prima clinica sono responsabili della differenza
nei casi di febbre puerperale, perché provocano umiliazione e disagio alle donne
ricoverate e le predispongono così alla malattia. A quell’epoca Vienna è il centro
dell’impero ed è meta di immigrazione da molti paesi vicini e lontani. La commis-
sione stessa provvede a controllare l’ipotesi intervenendo sulla situazione, ovvero
riducendo drasticamente il numero dei non austriaci presenti nella prima clinica.

Il piccolo esperimento però fallisce, perché nei mesi successivi all’allontanamento

dei terribili “stranieri” le morti continuano ad essere più numerose lì che nell’al-
tra (e qui Semmelweis, non austriaco come loro, accetta di compiere il controllo,
pur lamentandosi nei suoi scritti dell’irragionevolezza dell’ipotesi: gli “stranieri”,
scrive, sono migliori e più attenti degli austriaci a rispettare le procedure, perché
arrivano a Vienna dopo accurata selezione).
Vale la pena ricordare anche una quarta ipotesi, sempre basata su un’idea
dell’influenza mente-corpo. Semmelweis nota che il prete che amministra il sacra-
mento dell’estrema unzione alle ricoverate attraversa tutta la prima clinica, anche
quando deve recarsi nella seconda. Con le parole di Semmelweis:
Si può immaginare quale impressione facesse su le puerpere la campanella del prete
che si sentiva suonare più volte al giorno: io stesso ero preso dall’angoscia quando
sentivo scorrere la campanella davanti alla mia porta e un sospiro penoso si levava
dal mio cuore per la nuova vittima che cadeva a motivo di una causa ignota questa
campanella era per me un ammonimento tragico perché io indagassi con tutte le mie
forze su tale ignota causa. Ebbene anche in questa differenza di ambiente tra i due
reparti si è creduto di trovare la spiegazione della differenza di mortalità.
Dall’ipotesi deriva che se le degenti della prima clinica smetteranno di sentire e
vedere il prete così frequentemente, il tasso di mortalità si abbasserà. Semmelweis
convince quindi il sacerdote a cambiare percorso e a non attraversare sempre la
prima clinica anche quando deve recarsi nella seconda. Purtroppo, però, dopo al-
cuni mesi non si vedono risultati.
A questo punto il giovane Ignaz sta perdendo la speranza di risolvere il problema:
Tutto era in dubbio, tutto rimaneva senza spiegazione, tutto era oscuro solo l’alto
numero dei decessi era una realtà incontestabile21.
Ma accade un fatto: il suo ex professore e collega, Kolletschka, muore in pochi
giorni di una malattia simile alla febbre puerperale. La malattia si è sviluppata
dopo che si è ferito accidentalmente con un bisturi utilizzato per le dissezioni ana-
tomiche. Ecco una nuova ipotesi per Semmelweis: la febbre è essere causata da
“particelle cadaveriche”, e questo spiega anche la mortalità superiore nella prima
clinica, dove in effetti esercitano i futuri medici che praticano anche dissezioni ana-
tomiche, mentre nella seconda ci sono solo le allieve ostetriche, che non studiano
anatomia. Dall’ipotesi deriva che se i medici si laveranno accuratamente le mani
dopo l’esercitazione con i cadaveri, eliminando le particelle cadaveriche, i casi di

malattia e morte nella prima clinica diminuiranno. Più tardi Semmelweis nota che
non solo i cadaveri, ma anche i tumori e altre condizioni dei pazienti possono con-
taminare le mani dei medici. Non senza qualche difficoltà data dal doversi imporre
nonostante la propria posizione accademica bassa, l’assistente ungherese imple-
menta quindi, dal maggio 1847, la pratica dell’igiene delle mani nella prima clinica
- ma anche nella seconda, con quello che possiamo comprendere intuitivamente
come un errore dal punto di vista sperimentale, ma non dal punto di vista etico.
I risultati sono eclatanti. Nel 1848 la mortalità per febbre puerperale nella prima
clinica è dell’1,27% e nella seconda dell 1,3%.
La storia di Semmelweis mostra molti aspetti del metodo sui quali ci siamo sof-
fermati finora: l’ideazione di ipotesi a partire da un problema, la deduzione delle
previsioni, la funzione del controllo osservativo-sperimentale e la falsificazione,
la deduzione holmesiana che permette di concludere deduttivamente che resta in
piedi un’ipotesi sola, per quanto assurda, e infine il ruolo del paradigma, cioè delle
teorie e dei metodi condivisi in un certo periodo storico, nella formazione e sele-
zione delle ipotesi esplicative.
Questa però non è una storia a lieto fine per il suo protagonista. Semmelweis è
l’autore di un trattato troppo lungo, in cui critica aspramente i colleghi più anziani
e rispettati, non è particolarmente socievole o simpatico, è sostenitore di un’ipotesi
che non si accorda con la teoria del paradigma dominante, che è quella miasmatica,
è alla fine uno che ha trovato che i medici, sia pure senza volerlo, sono causa indi-
retta di malattia e morte, ed è inoltre ungherese, figlio di un droghiere, e quanto a
carriera universitaria, non particolarmente precoce. Per tutte queste ragioni viene
respinto al concorso per la cattedra, poi ritenta e finalmente riesce, ma si sente umi-
liato e poco considerato all’Ospedale Generale d Vienna. Torna quindi a Budapest,
dove muore a 47 anni, alcolizzato e probabilmente affetto da Alzheimer precoce.
Un piccolo libro dello scrittore francese Louis-Ferdinand Céline, del 1975, sottoli-
nea questo aspetto di Semmelweis come eroe incompreso e maledetto22.
2.8 LA MEDICINA COME SCIENZA NORMALE

In questo capitolo abbiamo considerato il metodo scientifico come un processo
logico astratto e abbiamo visto i tipi di ragionamento che lo compongono. Pur man-
tenendo la stessa forma logica, il metodo scientifico oggi, nelle scienze biomediche,

si trova realizzato in concreto in tecniche metodologiche che riguardano tutte le

fasi: formulazione del problema, scelta del disegno sperimentale e della metodolo-
gia statistica, esecuzione, analisi dei dati, e anche pubblicazione e disseminazione
dei risultati. Ci sono ad esempio linee guida, raccomandazioni e protocolli per tutti
i disegni sperimentali, da quelli descrittivi da cui possiamo trarre ipotesi da con-
trollare, a quelli osservativi e sperimentali in cui possiamo in certi casi ottenere la
conferma di associazioni o di effetti causali23. Normalmente uno studio coinvolge
un biostatistico, che si occupa di questioni quali il numero dei soggetti da includere
(le dimensioni del campione), della misura opportuna per studiare il fenomeno, e
del software impiegato per l’analisi statistica. E per quanto riguarda la fase della
pubblicazione dei risultati, gli studi devono essere accettati da riviste o siti web con
peer-review (valutazione tra pari, cioè fatta da altri ricercatori diversi dagli autori,
che siano esperti di quel problema) o altre forme di selezione dei contenuti. Le ri-
viste hanno a loro volta regole che riguardano quali e quante informazioni devono
essere specificate a seconda del tipo di studio.
Le tecniche metodologico-statistiche sono istituzionalizzate (descritte e diffuse
da società scientifiche ed enti governativi per la salute), dettagliate nei manuali
universitari e soprattutto nelle pubblicazioni specializzate, in modo che possano
essere seguite da tutti allo stesso modo, in tutto il mondo, a garanzia dell’intersog-
gettività della conoscenza. Come abbiamo visto nel primo capitolo, questa inter-
soggettività è un ingrediente fondamentale della scienza, che ci permette di distin-
guerla da altre forme di conoscenza che chiamiamo “pseudoscienza”. Possiamo
dire ad esempio che la memoria dell’acqua è un’ipotesi pseudoscientifica non solo
perché è falsa (ricordate il polpo Paul? Il problema non è la solo la verità), ma per-
ché, una volta pubblicata su una rivista, è stata resa passibile di controllo da parte
di altri gruppi di scienziati, che non hanno trovato gli stessi risultati con la stessa
procedura, e nonostante questo uno dei suoi autori ha continuato a sostenerla,
uscendo così dalle regole condivise. Queste regole, l’insieme dei metodi, fanno
parte delle nostre ragioni per credere alle ipotesi scientifiche e quindi a delimitare
ciò che è scienza.
Le metodologie di ricerca non sono fisse, ma vengono aggiornate e perfezionate
nel tempo. A volte questo avviene parallelamente al progresso della tecnologia: ad
esempio, le nuove tecniche di sequenza e di editing del genoma umano hanno reso
possibili nuovi protocolli sperimentali per la ricerca di base. In altri casi le meto-
dologie vengono cambiate e riviste dopo una valutazione della loro efficacia sotto
vari aspetti, che includono ad esempio l’equilibrio tra costo economico e beneficio

– oggi esistono discipline e professionalità specifiche che si occupano proprio di

questo. Infine, tutte le procedure di ricerca nelle discipline biomediche vengono
inoltre considerate e valutate dal punto di vista etico, dato che coinvolgono esseri
viventi, animali e umani (come vedremo nel capitolo 4).
Tuttavia, sostanzialmente le metodologie di ricerca non vengono messe in di-
scussione dal singolo ricercatore o gruppo, che le riceve e le applica per risolvere i
problemi che eredita dai ricercatori precedenti, e più raramente a problemi nuovi.
Questo è un altro aspetto della “scienza normale”, per usare l’espressione di Kuhn:
nella scienza normale lo scopo del ricercatore è
quello di risolvere un rompicapo, preferibilmente uno in cui gli altri ricercatori han-
no fallito e la teoria corrente è necessaria per definire quel rompicapo e per garantire
che, data una sufficiente vivezza di ingegno, esso possa essere risolto. Ovviamente
il professionista in un’iniziativa di questo tipo deve spesso controllare la soluzione
congetturale del rompicapo che la sua ingegnosità gli suggerisce. Ma viene control-
lata soltanto la sua personale congettura. Se essa fallisce il controllo è impugnata
soltanto la sua abilità, e non il corpo della scienza corrente24.
Sostituiamo qui “teoria” con “metodologia” e il punto di Kuhn resta vero: come
non si mette in discussione la teoria, normalmente, se lo studio non mostra ciò che
ci si aspettava, così non si mette in discussione la metodologia ogni volta, prima di
usarla e nemmeno dopo, ma ci si fida del suo valore epistemico (come direbbero i
filosofi), ovvero della sua capacità già testata di produrre conoscenza. Piuttosto, si
mette in discussione l’ipotesi specifica (sull’efficacia di un intervento, sugli effetti di
un’esposizione, o qualunque sia) o la scelta e l’esecuzione del disegno sperimenta-
le. Parleremo estesamente di disegni sperimentali nei prossimi due capitoli.
Quindi il ricercatore oggi nelle scienze biomediche è un passivo esecutore di
procedure metodologiche già esistenti? Questa non è certamente una domanda
scientifica, ed è così vaga da non poter essere seriamente considerata neanche da
un filosofo. Possiamo però considerare qualche suggestione per dissipare l’implici-
ta connotazione negativa di quel “passivo”. In ordine sparso: non è facile decidere
quali regole e procedure applicare e quando. Lo si vede inoltrandosi nelle differen-
ze tra i disegni sperimentali. Secondo, non è facile applicarle senza errori. Terzo,
le procedure sperimentali e le loro linee guida, per quanto molto dettagliate, non
possono coprire ogni singolo aspetto e circostanza della loro applicazione pratica,
e sono per questo parzialmente flessibili al contesto e sensibili al grado di com-
petenza di chi ne fa uso. Un’analogia utile, per quanto irriverente, è con le ricette

di cucina25. Quarto, se lo scopo dello scienziato è risolvere problemi, utilizzare le

soluzioni già convalidate non solo non è passivo, ma è l’attività più ragionevole
in vista dello scopo. Quinto, esistono modelli della creatività umana in psicologia
cognitiva che spiegano questa facoltà in termini di uso particolarmente esperto
delle regole note26. L’esempio qui di solito è Johann Sebastian Bach, il compositore
che ha saputo usare in modo particolarmente esperto le regole dell’arte della fuga
(il tipo di componimenti musicali), esplorando per così dire tutto lo spazio con-
cettuale circoscritto da quelle regole. Anche i Beatles potrebbero qui funzionare
come esempio. Ma le suggestioni ci hanno portato già abbastanza lontano da quel
“passivo” che volevamo eliminare.

Possiamo astrarre una descrizione semplificata del metodo scientifico come processo
logico, che poi le varie discipline codificano in metodologie e pratiche. Dalla formu-
lazione di un’ipotesi che risolve un problema, lo scienziato trae conseguenze che
sottopone a controllo mediante esperimento o osservazione. Idealmente, se le conse-
guenze non si verificano, l’ipotesi è falsificata, oppure l’esperimento si ripete cercan-
do di evitare errori, oppure ancora, molto raramente, la teoria alla base viene rivista.
Abbiamo visto tre tipi di ragionamento in opera in queste fasi, corrispondenti a tre
tipi di inferenze. Di queste, la deduzione è l’unica che ha regole formali tali che da
premesse vere otteniamo sempre conclusioni vere. Non amplia la nostra conoscenza
ma permette di esplicitare le conseguenze di ciò che sappiamo o assumiamo. Si usa
per trarre previsioni da un’ipotesi, nella falsificazione, nonché nell’individuazione
dell’unica ipotesi rimasta, quando abbiamo falsificato tutte le altre di un insieme di
partenza. L’induzione è l’inferenza che da premesse su casi noti trae conclusioni su
casi non noti, sia generali (leggi, nessi causali), sia particolari. Non è logicamente
valida, e non possiamo giustificare su base razionale perché produce conoscenza, ma
possiamo trovare metodologie per compiere induzioni migliori. Si usa per formulare
ipotesi a partire dall’esperienza e parzialmente per confermarle. L’abduzione, infine,
è l’inferenza che ci serve per riportare un caso che vogliamo spiegare a una legge,
spiegazione o regolarità che ci è nota. Non è logicamente valida, la verità delle pre-
messe non garantisce che la conclusione sia vera, ma si fanno “buone” abduzioni
affidandosi alla propria conoscenza di sfondo e al paradigma in uso, che fornisce mo-
delli. Nell’ultima parte del capitolo è stato introdotta la nozione di scienza normale,

in cui non si mettono in discussione né le fondamenta teoriche di una disciplina, né

le metodologie e le pratiche di ricerca esistenti. La medicina contemporanea è una
scienza normale in questo senso e in particolare le metodologie e le pratiche di ricer-
ca, in tutte le fasi dall’ideazione dell’ipotesi alla sua pubblicazione, sono codificate e
istituzionalizzate.

NOTE DI CHIUSURA
1 Galilei, G (1970). Discorso sopra i massimi sistemi. Torino: Einaudi, 252, citato in Lau-
disa, F. e Datteri, E. (2012).
2 Su questa interpretazione della rivoluzione scientifica rimando di nuovo a Laudisa, F.
e Datteri, E. (2012), cap. 1.
3 Newton, I. (1997) Opere, a cura di Alberto Pala, vol. 1, Principi matematici della filoso-
fia naturale, Torino, UTET, 801-802
4 Bacone, F. (1975) [1620] Scritti filosofici. Torino: UTET, 607-608, citato in Castellani, E. e
Morganti, M. (2019) La filosofia della scienza. Bologna: il Mulino, 54.
5 Un quadro sintetico del problema del metodo, breve storia e dibattito attuale in inglese
si trova in Andersen, H. and Hepburn, B. (2020) Scientific Method. The Stanford Encyclopedia
of Philosophy (Winter 2020 Edition), Edward N. Zalta (ed.), URL = <https://plato.stanford.
edu/archives/win2020/entries/scientific-method/>. Per un’introduzione filosofica in italiano
rimando ai capitoli 1-4 di Ladyman, J. (2014) Filosofia della scienza. Roma: Carocci.
6 Per induzione, abduzione e deduzione rimando a Coliva. A. e Lalumera, E. Pensare.
Leggi ed errori del ragionamento. Roma: Carocci 2006.
7 Questa versione della storia del tacchino è in Chalmers, A. (1982) What is this thing Cal-
led Science. Milton Kynes: Open University Press, 14
8 Mill, J. S. (1869). A System of Logic, Ratiocinative and Inductive: Being a Connected View
of the Princilples of Evidence and the Methods of Scientific Investigation. London: Harper and
brothers, I, 6.
9 Mill, J. S. (1869). A System of Logic, Ratiocinative and Inductive: Being a Connected View
of the Princilples of Evidence and the Methods of Scientific Investigation. London: Harper and
brothers, III, VIII, p. 539.
10 Popper, K. R (1972) [1953]. Congetture e confutazioni: lo sviluppo della conoscenza scientifi-
ca. Bologna: il Mulino.
11 Popper, K. R. (1989) Logica della ricerca e società aperta, Antologia a cura di D. Antiseri.
Brescia: La Scuola. 36-37
12 Questa ricostruzione è tratta da Miner, J., & Hoffhines, A. (2007). The discovery of aspi-
rin's antithrombotic effects. Texas Heart Institute Journal, 34(2), 179-186.
13 Craven, L. L. (1950). Coronary thrombosis can be prevented. Journal of insurance medici-
ne 5(4), 47.
14 Craven, L. L. (1953). Experiences with aspirin (acetylsalicylic acid) in the nonspecific
prophylaxis of coronary thrombosis. Mississippi Valley Medical Journal 75: 38–44.
15 Questa ricostruzione si basa su Connor, S. and Kingman, S. (1989). The Search for the
Virus. Harmondsworth: Penguin Books.
16 Centers for Disease Control and Prevention (1981) Morbidity and Mortality Weekly Re-
port June 5, 30 (21), 1-3.

17 Gallo, R. C., & Montagnier, L. (2003). The discovery of HIV as the cause of AIDS. New
England Journal of Medicine, 349(24), 2283-2285.
18 Popper, K. R. (1970) [1964]. Logica della scoperta scientifica. Torino: Einaudi.
19 Questa caratterizzazione viene da Bird, A. (2010). Eliminative abduction: examples
from medicine. Studies in History and Philosophy of Science Part A, 41(4), 345-352.
20 Semmelweis, I. P. (1861). Die aetiologie, der begriff und die prophylaxis des kindbett-
fiebers. Wien: Hartleben. Ci sono molte ricostruzioni della storia di Semmelweis e la febbre
puerperale. Come campione del metodo scientifico è stato descritto dal neopositivista Hem-
pel in Hempel, C. G. (1965) Philosophy of natural science. Prentice Hall: Englewood Cliffs.
Per una lettura in termini di paradigmi, Gillies, D. (2005). Hempelian and Kuhnian appro-
aches in the philosophy of medicine: the Semmelweis case. Studies in history and philosophy
of science part C: Studies in history and philosophy of biological and biomedical sciences, 36(1),
159-181.
21 Le citazioni di Semmelweis in italiano sono tratte dalle pagg. 38-41 di Antiseri, D.,
Scandellari, C., & Federspil, G. (2003). Epistemologia, clinica medica e la questione delle
medicine eretiche. Cosenza: Rubbettino Editore.
22 Céline, L. F. (2020). Il dottor Semmelweis. Torino: Adelphi Edizioni.
23 Ne parleremo nel Capitolo 3 e nel Capitolo 4.
24 Kuhn, T.S. (1980) Logica della scoperta o psicologia della ricerca? In Giorello, G. (a cura
di) Critica e crescita della conoscenza. Milano: Feltrinelli, p. 83.
25 L’analogia è di Boem, F. (2020) Scientific Protocols as Recipes. Humana Mente 13 (38),
281-299
26 Ad esempio Boden, M. A. (2004) The Creative Mind: Myths and Mechanisms. London:
Routledge

GLI STUDI OSSERVAZIONALI
CAPITOLO TERZO
PIANO DEL CAPITOLO

La ricerca biomedica oggi consiste non tanto nell’inventare modi per studiare il
corpo umano e la salute, quanto nello scegliere ed eseguire il disegno sperimentale
adatto al proprio contesto e domanda di ricerca. In questo capitolo vediamo prima di
tutto le principali distinzioni tra i tipi di ricerca: primaria e secondaria, analitica e
descrittiva, sperimentale e osservativa, qualitativa e quantitativa, e alcuni concetti
fondamentali del disegno sperimentale. Ci concentriamo poi sugli studi osservazio-
nali, descrivendo i principali tipi (di coorte, caso-controllo, trasversale, serie di casi,
case report). La domanda che ci guida è: in che misura si tratta di procedure in grado
di fornire conoscenza? Quali sono i limiti e potenzialità epistemiche di ciascuna?
Affrontiamo inoltre la questione del rapporto tra associazione e causa.
3.1 CLASSIFICAZIONE DELLA RICERCA

Abbiamo detto che le tecniche metodologico-statistiche – assieme all’eviden-
za – fanno parte di ciò che costituisce la conoscenza scientifica, perché forniscono
ragioni per credere che la conclusione a cui si arriva sia vera o probabilmente vera.
La domanda metodologica è: come funziona ciascuna di queste tecniche, nei det-
tagli? La domanda del filosofo della scienza invece è: che tipo di ragione fornisce
ciascuna, quali sono i limiti e le potenzialità? Abbiamo posto la stessa domanda di

principio riguardo ai tre tipi di inferenza, induzione, abduzione e deduzione, nel

capitolo precedente. In questo capitolo e nel prossimo la rivolgeremo ai principali
tipi di studi che si usano oggi nella ricerca biomedica. Ci sono due confini alla no-
stra esplorazione. Da un lato affrontiamo solo in parte la domanda metodologica,
astraendo da molti dettagli nel descrivere gli studi. Dall’altro non rivolgiamo la
domanda filosofica alle tecniche statistiche. Anche queste sono parte del ragiona-
mento induttivo, contribuiscono a fornire ragioni di un certo tipo e hanno limiti e
potenzialità. La filosofia della statistica meriterebbe però una trattazione a parte1.
Cominciamo con un quadro generale della ricerca biomedica, quello di Figura
2
1 . Ci sono molti modi diversi di classificare i tipi di ricerca e questa rappresenta-
zione, che è apparentemente molto complessa, ha il vantaggio di mettere in luce
che ogni tipo di scienziato, per così dire (di laboratorio, clinico o epidemiologo) ha
il suo repertorio di tipi di studi, e ci permette di introdurre alcuni concetti fonda-
mentali. Nel corso del capitolo abbandoneremo poi il quadro generale di Figura
1, suddiviso per ambiti di ricerca, per procedere con una classificazione in base
al disegno dello studio: vedremo così che ricerca epidemiologica, clinica e di base
hanno in comune gli stessi tipi di studi, tanto che la suddivisione nei tre ambiti è
sfumata ai confini. Invece la differenza tra tipi di studi non è affatto vaga ma, come
si è detto all’inizio, sono tutti codificati dal punto di vista metodologico e statistico.
Prima di addentrarci nei tipi di studi clinici, epidemiologici e della ricerca di
base introduciamo quindi ora alcune distinzioni generali tra tipi di ricerca, parten-
do dai concetti fondamentali
Ricerca. Una ricerca è un processo finalizzato a ottenere conoscenza. In questo
caso parliamo di ricerca medica (non filosofica o storica o astronomica o geologica)
e quindi aggiungiamo che la ricerca è indirizzata a produrre conoscenza generale
e sistematica sull’organismo umano a partire da evidenza empirica (osservazione
ed esperienza, trasformate in dati), con il fine ultimo di migliorare lo stato di salute
degli individui e delle popolazioni.
Salute. Che cos’è la salute? Potremmo dire che sia uno stato un cui l’organismo
funziona in modo statisticamente normale e così da non limitare le aspettative di
vita e la qualità della vita di una persona. Il lettore attento avrà già capito che qui
ho cercato di spiegare un concetto apparentemente semplice e familiare, quello di
salute, con tre astruse nozioni come funzionamento normale, aspettative di vita e
qualità di vita. La definizione di salute è un problema medico-filosofico di grande
difficoltà: a seconda di che cosa intendiamo con questi tre concetti, avremo una
diversa nozione di salute e quindi un diverso obiettivo ultimo della ricerca. Se ad

Capitolo terzo - Gli studi osservazionali 65
Procedure di
misura
Procedure di
Teorica Sviluppo di metodi imaging
Sviluppo e
Studi su animali valutazione di test
Di base
Studi su cellule
Applicata
Sequenziamento ed
editing genetico
Biochimica
Fase I
Fase II
Sperimentale Trial farmacologico
Fase III
Studio di terapia
Fase IV
Primaria Clinica Studio prognostico
Osservazionale Studio diagnostico
Qualitativa Serie di casi
Report di
singolo caso
Qualitativa Serie di casi

Ricerca medica
Report di singolo
Descrittiva caso
Studio ecologico
Epidemiologica Studio di
caso-controllo
Studio di coorte
Osservazionale
Studio trasversale
Analitica Studio ecologico

Meta-analisi
Secondaria Semplice Trial clinico
Review Sperimentale
Sistematica Intervento
preventivo
Figura 1 – La ricerca medica

esempio intendo la qualità della vita in senso abbastanza ampio, allora un difetto
estetico al setto nasale è un problema di salute. Ma se intendo anche la questione
dell’aspettativa di vita in modo abbastanza ampio, allora la povertà è un problema
di salute. Come decidere? Apparentemente i concetti di salute, qualità di vita e
normalità mettono in gioco i valori (quello che giudichiamo buono e desiderabile)
di una società, non solo i fenomeni relativi al corpo umano. Dobbiamo qui necessa-
riamente passare oltre – ma lascio un segnale di allerta per un problema filosofico
aperto, e ne riparleremo in parte nel §4.83.
Primaria o secondaria. La ricerca primaria produce nuova conoscenza (racco-
glie dati, formula o testa ipotesi), mentre la ricerca secondaria elabora o valuta i
risultati della ricerca primaria. A questa categoria appartengono le linee guida e
i lavori di review e meta-analisi. Lungi dall’essere poco rilevanti, nell’ambito del
paradigma dell’Evidence-Based Medicine (EBM), che approfondiremo nel §4.6, le
meta-analisi di sono considerate oggi il migliore tipo di evidenza per le decisioni
cliniche e di salute pubblica, e le linee guida hanno un ruolo chiave per connettere
la ricerca con la pratica clinica (oltre ad avere valore medico legale).
Applicata o di base. Passiamo alle macro-categorie del livello successivo nel
grafico di Figura 1. La ricerca applicata (qui indicata come epidemiologica o clini-
ca) è diretta a fornire soluzioni a problemi che riguardano direttamente la salute
delle persone e delle popolazioni (ad esempio: la dieta può influenzare il rischio di
melanoma?). La ricerca di base o di laboratorio si pone invece domande che mira-
no a costruire modelli e teorie che spiegano i fenomeni, indipendentemente dalla
soluzione di problemi pratici (ad esempio: come funziona un certo processo nello
sviluppo cardiovascolare della Drosophila?). Comprende esperimenti su animali,
cellule, studi biochimici e le loro modellizzazioni matematiche, ma anche studi
per sviluppare metodiche sperimentali e di misurazione. Contingentemente – ma
è importante ricordarlo - tra la ricerca di base e quella applicata nelle discipline
biomediche ci sono differenze di tempo e di risorse. Di solito la ricerca applicata,
soprattutto clinica, ha tempi definiti tra la domanda e la risposta, quindi tra l’inizio
di un progetto e la pubblicazione, e può beneficiare di maggiori finanziamenti e
risorse. La ricerca di base può non dare risultati pubblicabili per anni e general-
mente è meno finanziata, ma dal punto di vista della costruzione della conoscenza
è indispensabile alla ricerca applicata. Ci sono casi eclatanti in questo senso. La
domanda di ricerca di base di Marie e Pierre Curie, “che cosa sono i raggi emanati
dall’uranio e sono prodotti anche da altri elementi?” (fisico-chimica, ma rilevante
per la medicina, a posteriori) ha portato alla scoperta del polonio e del radio, e

all’applicazione della radioattività a campi pratici diversi che vanno dalla diagnosi
e cura delle malattie alla costruzione di armi4.
Traslazionale. In realtà di solito i casi sono meno eclatanti di quello di Ma-
rie e Pierre Curie e si ritiene necessario favorire il rapporto tra ricerca di base ed
applicata e, all’interno della ricerca applicata, tra studi clinici ed epidemiologici,
adottando approcci detti traslazionali. L’idea è quella di impostare la ricerca di
base con concetti e domande che la rendano più facilmente applicabile alla clinica,
e la ricerca clinica con concetti e domande che ne accrescano l’impatto sulla salute
pubblica, favorendo poi il feedback tra i livelli. Un esempio di ricerca traslazionale
dal laboratorio alla clinica: studi in ingegneria dei materiali sullo sviluppo di mi-
crosfere in grado di veicolare piccole quantità di un farmaco contro il glaucoma,
che possono essere iniettate una tantum e quindi evitare gli svantaggi legati a una
somministrazione frequente5. Inoltre, tutta la ricerca preclinica dei trial farmaco-
logici, di cui parleremo nel §4.5, è ricerca traslazionale. Per semplicità le ricerche
di medicina traslazionale non sono rappresentate nel grafico della Figura 1, ma
occorre tenerle presente perché sono oggi molto favorite dalle agenzie istituzionali
che finanziano la ricerca.
Clinica o epidemiologica. Il nostro grafico di Figura 1 distingue, all’interno
della ricerca applicata, quella clinica da quella epidemiologica. Le definizioni dei
due ambiti possono chiarire il senso della distinzione. L’epidemiologia si occupa
di problemi che riguardano la distribuzione (frequenza, pattern) e le determinanti
(cause, fattori di rischio) di condizioni pertinenti alla salute (non solo malattie)
in una popolazione. Domande di ricerca, ad esempio, possono essere: qual è la
variazione stagionale dell’influenza in Italia? Com’è cambiata tra il 1970 e il 2020
negli Stati Uniti la relazione tra tasso di mortalità infantile ed etnia della madre?
L’oggetto di studio è la comunità e gli individui sono considerati collettivamente6.
La ricerca clinica strettamente intesa si pone domande sui modi per migliorare le
condizioni pertinenti alla salute degli individui (farmaci, terapie non farmacolo-
giche, interventi chirurgici, diagnosi, interventi di prevenzione). Tuttavia, come
si accennato, i due ambiti si sovrappongono in parte. Uno studio per testare gli
effetti dell’aspirina per la prevenzione dell’infarto cardiaco – ricordiamo la storia
del dottor Craven nel capitolo 2 – è di epidemiologia clinica. Vedremo che dal pun-
to di vista del disegno sperimentale, i tipi di studi principali nella ricerca clinica e
nella ricerca epidemiologica sono gli stessi. La ricerca clinica è anche contigua alla
ricerca di base: gli studi che nel grafico sono indicati come trial farmacologici di
Fase I sono studi di laboratorio su animali o tessuti, quindi condividono le stesse

metodiche della ricerca di base. C’è da aggiungere a questa distinzione un’altra

categoria che si sovrappone a entrambe: la Outcome research o ricerca sulla quali-
tà degli interventi7. Sicurezza dei farmaci, soddisfazione del paziente, equità del
trattamento, efficacia della cura o dell’intervento di prevenzione sono tutti fattori
indagati da questo tipo di ricerca, che è di definizione recente, ma è oggi molto
rilevante. Condivide le stesse metodologie degli altri ambiti di ricerca, per questo
non è rappresentata nel grafico.
Osservazionale o sperimentale. Passiamo alla distinzione tra ricerca osserva-
tiva e sperimentale, che è fondamentale quanto semplice da afferrare. Un’ipotesi
di ricerca generalmente esprime una relazione tra due aspetti di un fenomeno, la
variabile indipendente e la variabile dipendente, che nella ricerca medica applicata
si chiamano di solito rispettivamente esposizione ed esito. In uno studio sperimen-
tale il ricercatore interviene sulla variabile indipendente, cioè modifica l’esposizio-
ne, mentre in uno studio osservazionale questo non avviene. Ad esempio, in uno
studio osservazionale sulla relazione tra l’etnia della madre e la mortalità infantile,
il ricercatore non può evidentemente modificare l’etnia per vederne gli esiti, e il
suo ruolo è misurare e valutare l’impatto di un fattore sull’altro. Invece, in un trial
per un nuovo farmaco oncologico, i ricercatori decidono che una parte di pazienti
riceverà il nuovo prodotto, modificando la terapia esistente, mentre l’altro gruppo
riceverà la terapia consueta. La ricerca epidemiologica e clinica si divide in osser-
vativa e sperimentale, mentre sostanzialmente tutta la ricerca di base è sperimen-
tale, dato che anche la parte teorica richiede test dei metodi ottenuti.
Analitica o descrittiva. A livello di obiettivi, la ricerca analitica è rivolta a testa-
re un’ipotesi che esprime una relazione tra due aspetti di un fenomeno, indicati ri-
spettivamente dalla variabile indipendente e dalla variabile dipendente, mentre la
ricerca descrittiva, come dice la parola stessa, si limita a descrivere quel fenomeno.
A livello di disegno, negli studi analitici, a differenza di quelli descrittivi, è previsto
un gruppo di confronto o controllo: il fenomeno da spiegare viene osservato in due
gruppi, che differiscono idealmente solo per la variabile indipendente. La presenza
e la scelta di un gruppo di controllo è essenziale per evitare confondimenti – un
confondimento, come vedremo più avanti in maniera più precisa, è una variabile
che influisce sulla variabile dipendente, ma non è quella che volevamo studiare.
Inoltre, negli studi analitici si effettua un’analisi statistica sui dati raccolti che cor-
rispondono ai valori delle variabili, per fornire evidenza rispetto a una possibile
correlazione, mentre in quelli descrittivi c’è solo una misurazione di questi valori
(nel caso si tratti di studi quantitativi, qualifica che vedremo tra poco). Per queste

caratteristiche strutturali la ricerca descrittiva può solo suggerire ipotesi, ma non

testarle. Tutti gli studi sperimentali sono analitici (per cui questa qualifica viene
omessa nel grafico), mentre gli studi osservazionali possono essere sia analitici che
descrittivi. I report di serie di casi sui cluster atipici di polmonite pneumococcica in
California, che abbiamo menzionato nel §2.5 nella storia della scoperta dell’HIV,
erano studi di tipo osservazionale e descrittivo: nello studio si descriveva un solo
gruppo di malati e non si formulava un’ipotesi sulla causa della sindrome, ma sot-
tolineava la necessità di ulteriori studi per arrivare a formulare e confermare una
tale ipotesi. Uno studio osservazionale analitico sullo stesso fenomeno potrebbe
ad esempio confrontare l’incidenza della sindrome nella popolazione di tossico-
dipendenti e in quella di non tossicodipendenti per testare una correlazione. La
distinzione tra analitico e descrittivo si trova soprattutto nei testi di epidemiologia
– infatti non è riportata nel grafico in Fig. 1 per gli studi clinici. Può essere comun-
que utile anche in questo campo, dato che gli studi diagnostici e prognostici sono
quasi sempre osservativi, e la presenza o meno di un gruppo di confronto, come
vedremo più avanti, è rilevante sotto vari aspetti.
Ricerca quantitativa o qualitativa. Qui si fa riferimento sia al tipo di dati raccol-
ti che al metodo impiegato. In uno studio quantitativo (osservazionale o sperimen-
tale, descrittivo o analitico che sia) gli aspetti rilevanti del fenomeno studiato sono
espressi da variabili operazionalizzate, cioè definite in modo da consentire una
misurazione intersoggettiva e al più possibile accurata e precisa. Ci possono essere
diversi modi di operazionalizzare una stessa variabile, più o meno accurati e più
o meno semplici da mettere in pratica: per il peso corporeo, ad esempio, possiamo
far compilare ai soggetti un questionario di autovalutazione (semplice, ma poco
accurato), oppure pesarli in ospedale o in laboratorio (accurato, ma meno sempli-
ce); è opportuno, comunque, che in uno studio si utilizzi possibilmente una sola
operazionalizzazione. Con strumenti e metodi di misurazione standard, i valori
delle variabili diventano dati numerici su cui si può condurre (nel caso degli studi
analitici) un’analisi statistica. La scelta del metodo statistico dipende dal tipo di
variabili (continue, cioè con gradi, come peso o età, oppure categoriche, cioè si/no,
come diabete, infarto e morte), e da quale disegno sperimentale abbiamo scelto (ad
esempio uno studio caso-controllo, un trial controllato randomizzato prospettico
fattoriale, eccetera).
Un tipo di approccio alla statistica molto diffuso (classico, non Bayesiano) è
quello in cui l’analisi dei dati ci restituisce il p-value o significatività di un’ipotesi,
ovvero il grado in cui potrebbe essere dovuta al caso. Di solito si ritiene che un’i-

potesi sia significativa con p <0.05 oppure p<0.01, che indicano rispettivamente che
l’ipotesi riscontrato potrebbe essere dovuto al caso meno di 1 volta su 20, e meno
di 1 volta su 100. Le ipotesi di associazione tra variabili negli studi osservativi sono
poi in termini di grandezze quali il rischio relativo e l’odds ratio, mentre le misure di
impatto negli studi sperimentali sono il rischio differenziale e la frazione di rischio
attribuibile. Questi valori ci danno la misura dell’effetto di una variabile sull’altra.
Come si è detto all’inizio del capitolo, le misure adatte a ciascun disegno sperimen-
tale, così come le analisi, sono codificate, e solo in parte dipendono da una scelta
del ricercatore.
In uno studio quantitativo, infine, anche la numerosità del campione su cui si
effettua lo studio è determinabile con metodologie statistiche, altrettanto vincolate
dal disegno sperimentale. In termini molto generali, se pensiamo che la popolazio-
ne su cui stiamo effettuando l’indagine sia molto variabile e vogliamo risultati mol-
to precisi, dovremo aumentare la numerosità del nostro campione. La precisione
del risultato è data da un valore importante quando si legge e si valuta uno studio,
l’intervallo di confidenza, che indica l’intervallo di valori entro i quali stimiamo
che si collochi il valore della popolazione. Un intervallo più piccolo indica maggior
precisione.
Non ci occuperemo di statistica in questo libro, ma faremo riferimento a queste
nozioni nei prossimi capitoli solo nella misura in cui servono per capire meglio la
differenza fra i tipi di studi8.
In uno studio qualitativo si raccolgono invece informazioni sul contesto in cui
il fenomeno avviene, oppure sui significati e le esperienze delle persone coinvolte,
mediante ad esempio interviste, analisi di testi oppure osservazione sul campo.
Gli aspetti rilevanti non sono necessariamente operazionalizzati in modo da essere
misurabili, il campione può avere una numerosità non vincolata da regole mate-
matiche e non si compie un’analisi statistica, ma un’interpretazione dei risultati da
parte del ricercatore, in base a una teoria di sfondo che orienta le interpretazioni
(etnografia, fenomenologia, semiotica o altro). Gli studi qualitativi nella ricerca cli-
nica ed epidemiologica vengono usati per formare ipotesi, ad esempio per capire
perché i pazienti non fanno riabilitazione dopo un intervento ortopedico, oppu-
re come avviene, in un reparto ospedaliero, l’accordo sulle procedure da seguire
quando non si seguono le linee guida. Hanno impiego anche come complemento
alla ricerca quantitativa, è il caso delle ricerche di medicina narrativa o di psichia-
tria fenomenologica. Spesso questi studi non sono condotti da medici, ma da psico-
logi, antropologi o altre figure professionali, e costituiscono una piccola parte degli

articoli pubblicati. Approfondiremo tutte queste distinzioni parlando dei disegni

sperimentali nelle prossime pagine.
3.2 STUDIO DI COORTE PROSPETTICO

Il grafico in Figura 2 mostra i principali tipi di studi nella ricerca epidemiolo-
gica e clinica classificati in base al disegno sperimentale9. Parliamo qui di disegno
sperimentale o study design anche nel caso in cui la ricerca sia osservativa: si fa
riferimento alla progettazione della ricerca. Cominciamo in questa sezione l’analisi
dagli studi osservazionali, che sono i più diffusi nella letteratura pubblicata. Ini-
ziamo in particolare dagli studi di coorte: analitici e descrittivi, prospettici e retro-
spettivi. Questa sezione introduce anche alcune nozioni metodologiche di base che
serviranno per descrivere anche gli altri studi.
Il tipo di domanda a cui si può cercare di rispondere con uno studio di coorte
(detto anche di follow-up o longitudinale) è uno dei più intuitivi nella ricerca bio-
medica: un certo fattore (di rischio, di prevenzione o di prognosi), che chiamiamo
esposizione, è associato o meno a un certo evento, che chiamiamo esito? L’esposi-
zione aumenta il rischio o la probabilità di quell’esito, oppure come ne modifica
l’entità? In epidemiologia ci può interessare ad esempio sapere se fumare durante
la gravidanza aumenta il rischio di parto pretermine, oppure se modifica in senso
negativo il peso del neonato, o se c’è una relazione tra attività fisica in menopausa e
numero di visite al medico di base. In campo clinico ci possiamo chiedere se la po-
sizione supina del malato di polmonite acuta in terapia intensiva migliora i tempi
di remissione, o se la febbre durante i primi giorni di ricovero dopo un attacco di
ischemia cerebrale peggiora la prognosi, oppure ancora se una certa configurazio-
ne genetica aumenta il rischio per un disturbo del neurosviluppo.
Studio di coorte analitico prospettico (o di follow- up). In generale, come si è
detto sopra, uno studio analitico ha l’obiettivo di testare l’ipotesi che una certa
esposizione sia associata a un certo esito. L’ipotesi riceve conferma se riusciamo
a mostrare che l’esito è più frequente negli esposti rispetto ai non esposti. In uno
studio di coorte analitico prospettico si identifica un gruppo di soggetti con carat-
teristiche comuni e con esposizione al fattore che ci interessa monitorare, ovvero la
coorte. Si sceglie un altro gruppo con caratteristiche il più possibile simili a quelle
della coorte, ma con minima o nulla esposizione. Si fissano gli esiti che si intendo-

72
Libro Lalumera.indb 72
Intervento?
Studio speri- sì no Studio osser-

mentale vazionale
Gruppo di Gruppo di
controllo? confronto?
Assegnazione sì no Trial non Studio sì no Studio

random? controllato analitico descrittivo
Trial sì no Trial
controllato controllato non Studio Case report
randomizzato randomizzato trasversale
Direzione?
Studio Esposizione → Esito Contemporanei Studio Serie di casi

di coorte trasversale
Esposizione ← Esito
Studio
caso-controllo
Medicina e metodo sperimentale. Un’introduzione filosofica
Figura 2 – Tipi di studi epidemiologici e clinici
16/02/2021 11:26:53
no misurare (possono essere uno o più). Si seguono o, come si dice spesso, si “sor-
vegliano” entrambi i gruppi per un tempo prestabilito, detto follow-up, registran-
do alla fine la percentuale o il numero di esiti per ciascun gruppo. Se è maggiore
nel gruppo degli esposti, l’ipotesi che l’esposizione sia associata all’esito può essere
confermata (o più prudentemente, non falsificata).
Alcune nozioni tecniche serviranno a capire meglio10. La misura di associazione
che si usa di solito in uno studio analitico prospettico è il rischio relativo, definito
come rapporto tra rischi assoluti. Il rischio assoluto, o incidenza, è il rapporto tra
esiti e numero degli esposti, mentre la prevalenza è il rapporto tra i casi e la popola-
zione in generale. Se il rischio relativo della nostra coorte è maggiore di quello del
gruppo di controllo, allora l’associazione tra esito ed esposizione ha buone chance
di essere confermata. Dal punto di vista statistico occorre anche considerare l’in-
tervallo di confidenza. Questa misura ci dà una risposta matematica alla domanda
intuitiva “quanto è rappresentativo il nostro campione rispetto alla popolazione
generale?”– domanda basilare da porre ogni volta che studiamo un fenomeno non
in tutta la popolazione ma usando un campione, ovvero sempre, quando ragionia-
mo in modo induttivo. Qui, tuttavia, non ritorneremo più sulla questione dell’in-
tervallo di confidenza, perché è comune a tutte le inferenze induttive, e il nostro
interesse è qui vedere le differenze tra i tipi di studi.
Esempio. Torniamo allo studio di coorte prospettico. Ci sono studi con questo
disegno che durano per decenni e hanno dato un contributo molto rilevante alla
conoscenza medica. Un esempio famoso – pilastro della storia dell’epidemiologia -
è il British Male Doctors Study, ideato da Richard Doll e da Austin Bradford Hill, due
tra i padri dell’epidemiologia, e iniziato nel 1951 e terminato nel 2001. Lo studio
si situa in un contesto storico in cui il consumo di sigarette è diventato diffusissi-
mo, soprattutto tra gli uomini. Nel 1940 in Gran Bretagna il tumore al polmone è
la prima causa di morte, ma i rischi del fumo sono ancora sottovalutati. Vengono
effettuati alcuni studi di caso-controllo in Europa e Nord America su malati di
tumore al polmone (li vedremo tra poco) e il fumo di sigaretta comincia a essere
indicato come un possibile fattore di rischio. Doll e il suo gruppo decidono quindi
di intraprendere questo lungo studio di coorte sui medici britannici, inviando un
questionario sul consumo di sigarette a tutti i medici inglesi registrati all’albo: di
59600, 34494 vengono restituiti completi, successivamente però le donne vengono
escluse perché il campione è troppo poco numeroso. Altri questionari vengono
inviati nel 1957, 1966, 1971, 1978, 1991, 1998 e 2001 per registrare i cambiamenti di
abitudine rispetto al fumo, e da quello del 1978 in poi si chiede ai medici anche di

fornire informazioni sul proprio consumo di alcol e sull’indice di massa corporea.

A partire da questi dati e dal registro delle cause di morte, calcolando il rischio
relativo dei medici fumatori e dei non fumatori rispetto all’esito di mortalità per
patologie specifiche, lo studio ha permesso negli anni di mostrare l’incidenza delle
morti per cause specifiche nella coorte di riferimento, ma anche e soprattutto a dare
sostegno all’ipotesi di associazione tra fumo e morte per tumore al polmone, infar-
to cardiaco e patologie polmonari istruttive croniche. Infine, nel 2001 è stata testata
l’associazione tra numero di anni da fumatore e mortalità precoce. I risultati e i det-
tagli dello studio nelle sue varie fasi sono stati pubblicati in una serie di articoli tra
il 1964 e il 2004. I risultati hanno mostrato un rischio relativo di morte per tumore
polmonare di 8 per chi fuma fino a 14 sigarette al giorno, fino a 32 per i fumatori di
più di 25. la raccolta di dati tra i medici inglesi è ancora aperta. Leggiamo i risultati
dall’abstract di un articolo del 200411.
Risultati: L’eccesso di mortalità dei fumatori è riferita principalmente a patologie
vascolari, neoplastiche e respiratorie che possono essere causate dalle sigarette. Gli
uomini nati nel 1900-1930 che hanno fumato solo sigarette e hanno continuato a
fumare sono morti in media 10 anni prima dei non fumatori. Smettere di fumare a
60, 50, 40 o 30 anni ha prodotto un guadagno di circa 3, 6, 9 e 10 anni di vita. L’ec-
cesso di mortalità associata al fumo di sigaretta è stato minore per gli uomini nati nel
19° secolo e maggiore per quelli nati nel decennio dal 1920. La probabilità di morire
tra i 35 e i 69 anni dei fumatori rispetto ai non fumatori è stata del 42% contro il
24% (doppia) per i nati tra il 1900 e il 1909, e del 43% contro il 15% per i nati nel
decennio dal 1920. In età più avanzate, la probabilità di sopravvivere dall’età di 70
ai 90 anni è stata del 10% per i fumatori e del 12% per i non fumatori considerando
la mortalità del 1950 (cioè per gli uomini nati attorno al 1870), ma del 7% contro il
33% per i nati attorno al 1910.
Lo studio, dunque, ha confermato che le sigarette aumentano il rischio di mor-
te per alcune patologie specifiche, e chi ha fumato per più anni muore prima,
calcolando il rischio relativo dei fumatori e dei non fumatori rispetto all’esito di
mortalità per cause specifiche. Notate che nella sezione dei risultati si legge che
le patologie in questione “possono essere causate” dal fumo – come vedremo
nel §3.6, questo studio soddisfa molti dei criteri per interpretare in senso causale
un’associazione. I risultati dello studio e i dati raccolti, sia nei questionari di au-
tovalutazione compilati dai medici che nei registri di morte, sono stati utilizzati
rispettivamente in meta-analisi e in altri studi, che hanno rafforzato l’evidenza a

favore dell’associazione tra fumo e mortalità per tumore al polmone e malattie

cardiovascolari.
Vantaggi dello studio di coorte prospettico. Questo tipo di studio ha diverse
potenzialità. Prima di tutto è molto informativo. Può essere usato per rilevare l’in-
cidenza e la prevalenza di un esito (di una malattia) in una popolazione, può per-
metterci di testare un’ipotesi di correlazione tra esposizione ed esito per molti esiti
contemporaneamente. In campo clinico, questo disegno sperimentale è il più usato
per gli studi prognostici, cioè quelli che rispondono alle domande sul decorso delle
malattie o delle condizioni. I fattori prognostici hanno il ruolo logico delle esposi-
zioni e gli stati che ci interessa studiare, come la remissione o la morte, hanno il
ruolo degli esiti: lo studio consiste nel seguire una coorte di malati per un tempo
stabilito, misurando tutte le associazioni che si presentano tra le esposizioni e gli
esiti12. Anche gli studi diagnostici, che valutano l’accuratezza di un test (un test di
laboratorio, una modalità di esame fisico, una nuova tecnica di imaging) confron-
tandolo con quello già in uso, possono utilizzare una variante di questo disegno13.
Inoltre, uno studio di coorte analitico e prospettico, cioè con un gruppo di con-
trollo, è considerato il più valido tra gli studi osservativi per testare un’ipotesi di
associazione, tanto che a volte i risultati vengono interpretati in senso causale,
come si è detto commentando l’esempio dei British Doctors. Vedremo alla fine di
questo capitolo il difficile rapporto tra associazione e causa – che abbiamo già in
parte affrontato dal punto di vista filosofico nel capitolo 2.
3.3. VALIDITÀ INTERNA, CONFONDIMENTI E BIAS

Ma perché lo studio di coorte prospettico è il più valido tra gli studi osservativi?
Cosa significa validità? Il concetto di validità interna di uno studio deriva da quello
di validità di un’inferenza logica deduttiva, che, come ricordiamo, era la proprietà
di garantire la verità della conclusione se le premesse sono vere. Uno studio speri-
mentale è un’inferenza induttiva e, come tale, non può essere un’inferenza logica-
mente valida. La validità interna è dunque una misura di quanto uno studio riesce
a dare sostegno all’ipotesi di associazione o di causalità che intende testare, in vir-
tù dell’evidenza interna allo studio stesso (le premesse dell’induzione, diremmo).
Dipende da quanto, in base al suo disegno e alla sua esecuzione, riesce a evitare
confondimenti (intuitivamente: associazioni spurie) e bias (intuitivamente: errori).

Il concetto di validità interna non va confuso con quello di significatività statisti-

ca, il p-value. Come abbiamo già detto brevemente, il p-value è una misura restituita
dall’analisi statistica che applichiamo, che ci indica quanto è probabile, in base ai
dati immessi, che l’ipotesi di associazione testata sia casuale, cioè la probabilità
dell’ipotesi nulla14. Per convenzione (secondo alcuni non del tutto arbitraria, se-
condo altri sì), se il p-value è inferiore a 0.05 l’ipotesi è significativa – altri preferi-
scono abbassare la soglia a 0.01. Ma questo risultato può diventare irrilevante se
per ragioni non statistiche (scientifiche, metodologiche) giudichiamo che la vali-
dità interna dello studio sia bassa. Né più né meno di come diventa irrilevante la
conclusione di un’inferenza deduttiva invalida, qualunque essa sia. E viceversa,
uno studio valido che mostra che una certa associazione non è significativa può
essere molto utile per il progresso della conoscenza. Per questo e per altre ragioni,
la significatività statistica non è tutto quello che ci basta controllare per sapere se
intuitivamente “fidarci” delle conclusioni di uno studio che leggiamo, né tutto ciò
a cui dobbiamo aspirare per sapere di aver condotto un buono studio.
La validità esterna è poi la misura di quanto i risultati di uno studio sono gene-
ralizzabili alla popolazione di riferimento: dipende, tra le altre cose, dalla rappre-
sentatività del campione e presuppone la validità interna.
Tornando al nostro tema, uno studio di coorte prospettico è più valido rispetto
agli altri studi osservazionali che vedremo in questo capitolo perché per la sua
struttura è meno soggetto a confondimenti e bias. Vediamo ora più in dettaglio le
due nozioni e come si applicano al caso dello studio osservazionale di follow-up.
Se E è l’esposizione e H l’esito, un terzo fattore F è un confondimento se 1)
F è associato ad E e 2) indipendentemente da E, F è associato ad H. Il concetto
di confondimento non è matematico o statistico, ma metodologico o filosofico: è
un termine usato nella metodologia della ricerca contemporanea per indicare una
difficoltà delle generalizzazioni causali induttive: intuitivamente, eliminare le as-
sociazioni spurie per isolare solo le “vere cause”.
Confondimenti e bias dello studio di coorte prospettico. Un confondimento
possibile in uno studio di coorte può venire dalle caratteristiche del gruppo di con-
trollo. Supponiamo che il gruppo degli esposti abbia le caratteristiche A, B, C, D
più E, l’esposizione, mentre il gruppo di confronto abbia le caratteristiche A, B, C,
D ed F. Se c’è una diversa incidenza di esiti H nei due gruppi, non possiamo sapere
se sia associata ad E oppure a F (se sappiamo da altri studi che F è plausibilmente
rilevante per l’esito): non possiamo dire di avere testato l’ipotesi che E sia associata
ad H, ed F è un confondimento. In uno studio di coorte, come in ogni altro studio

analitico, è fondamentale quindi che il gruppo di confronto sia il più possibile si-
mile al gruppo degli esposti: idealmente i due gruppi dovrebbero differire solo per
l’esposizione. Questa regola metodologica di base era già tra i metodi per miglio-
rare le inferenze induttive sistematizzati da John Stuart Mill attorno al 1860, come
abbiamo visto nel §2.2.
Facciamo un esempio. Se la nostra ipotesi è che il fumo in gravidanza sia asso-
ciato con il parto pretermine, potremmo considerare come coorte le donne parte-
cipanti ai corsi pre-parto organizzati dall’ospedale in cui lavoriamo, dividerle in
fumatrici e non fumatrici, e osservarle per sei mesi fino al parto: se sono avvenuti
più parti pretermine nel gruppo delle fumatrici, l’ipotesi riceve sostegno. In ter-
mini epidemiologici, il fumo in gravidanza aumenta il rischio relativo di parto
prematuro, che è appunto il rapporto tra i valori di incidenza della coorte e del
controllo. Ma supponiamo ora che il gruppo delle fumatrici abbia anche un’altra
caratteristica che lo distingue dall’altro gruppo, cioè il consumo abituale di alcol.
Questa variabile è un confondimento perché sappiamo essere associata all’espo-
sizione, il fumo (ci sono studi che mostrano che le due abitudini sono correlate) e
può esserlo anche all’esito, cioè il parto pretermine.
Come si può evitare questo tipo di confondimento, nel disegno sperimentale?
Una possibile strategia è il matching (corrispondenza) tra gruppo di controllo e
gruppo degli esposti: in questo caso assicurandosi, prima di costituire i gruppi, che
anche tra le donne non esposte ci siano consumatrici abituali di alcol. In uno studio
con una coorte relativamente piccola, questo è fattibile. Molto meno nel caso dei
grandi studi di follow-up, come quello dei British Doctors. Qui viene in aiuto la sta-
tistica: esiste la possibilità di eliminare o ridurre l’effetto del confondimento dopo
avere già raccolto di dati, nella fase di analisi.
Un punto filosofico sui confondimenti, prima di passare ai bias. Per ogni tipo
di studio esistono metodi per minimizzarli, non esistono però regole per trovarli.
Nell’esempio: come facciamo a sapere che il consumo di alcol è un possibile con-
fondimento nel caso dell’associazione tra fumo e parto prematuro? Non c’è altro
modo se non basarsi sulla propria conoscenza scientifica del problema (come ve-
dremo nel §4.7). La randomizzazione, che vedremo nel Capitolo 4, è un tentativo
di evitare anche i confondimenti che non ci aspettiamo.
Il bias si può caratterizzare come un errore sistematico nello studio. Un errore
sistematico, intuitivamente, è quello che compio se uso una bilancia che pesa sem-
pre un chilo in più: rende le mie misurazioni consistenti ma scorrette, e replicabili
da me, ma non da altri con una bilancia diversa. Qui assumiamo che i bias siano

involontari da parte del ricercatore - se non lo sono si parla di frode. Ogni disegno
sperimentale ha bias tipici per come è strutturato. Esistono diversi modi di cata-
logare i bias: in un importante lavoro del 1979 David Sackett, uno dei promotori
della Evidence-Based Medicine, ne ha individuati 35 e ha proposto l’istituzione di un
elenco a disposizione di tutti che venga aggiornato al bisogno15.
Tutte le fasi e i soggetti coinvolti in uno studio sono potenziali fonti di bias: lo
sperimentatore, i dati, gli strumenti e i soggetti. Possiamo dire che capire quale bias e
quale confondimento vada considerato è un processo di tipo abduttivo che fa parte
della logica del metodo scientifico – ma come sappiamo, non ci sono regole per com-
piere buone abduzioni. In pratica, c’è consenso su alcuni bias principali o tipici per
tipo di studio. Il primo è il bias di auto-selezione: se il reclutamento dei soggetti è
volontario, può darsi che chi partecipa abbia caratteristiche sistematicamente diver-
se da quelle di chi invece decide di non partecipare. Immaginiamo ad esempio che in
uno studio osservazionale in cui una delle variabili da misurare è l’altezza degli ado-
lescenti, i ragazzini più preoccupati di essere troppo bassi rispetto alla loro età non
vogliano partecipare, creando così un gruppo di soggetti osservati non rappresenta-
tivo della popolazione. Il bias di selezione di dà invece quando i ricercatori scelgono
un gruppo di esposti che ha caratteristiche che possono influire sull’esito, ad esem-
pio sono pazienti troppo gravi, o individui troppo sani, eccetera. Infine, negli studi
osservazionali il ricercatore non determina l’assegnazione dei soggetti al gruppo di
esposizione o al gruppo di controllo (se c’è), ma si limita a osservare la relazione
tra esposizione ed esito. Il ricercatore sa quindi, di ogni soggetto se è esposto o non
esposto, e questo può influenzare sistematicamente il modo in cui lo “osserva”, cioè
raccoglie i dati, ad esempio involontariamente favorendo l’ipotesi da testare, e que-
sto vale anche per chi si occupa dell’analisi statistica. Anche il soggetto sa di essere
monitorato e quindi si possono verificare bias di performance – pensiamo a un grup-
po di soggetti studiati per gli effetti dell’esercizio fisico sulla riduzione dell’indice di
massa corporea, che decidono di fare tre volte di più dell’allenamento assegnato per
soddisfare le aspettative dei ricercatori. Questi sono bias di non-blinding: possono
esserci appunto quando l’assegnazione all’esposizione non è nascosta a nessuno, e
questo è tipico degli studi osservazionali. Vedremo ancora il blinding nel §4.2.
Lo specifico disegno sperimentale di ciascuno, poi, può esporsi a bias partico-
lari. Vediamo quelli dello studio di coorte prospettico, senza pretendere di fornire
una lista esaustiva16.
Bias di incidenza-prevalenza. Gli studi di coorte possono durare molto tempo.
Per provare a testare alcune ipotesi, come l’associazione tra fattori di rischio e mor-

talità per tumore, ma anche esempio per AIDS, i cui i sintomi appaiono molto dopo
l’infezione, il follow-up deve essere necessariamente lungo. Se lo studio di Doll si
fosse fermato alla prima valutazione degli esiti, nel 1964, i risultati non sarebbero
stati così rilevanti. Il disegno di uno studio di questo tipo non permette in alcun
modo di accorciare i tempi, perché la durata del follow up è essenziale. Con la du-
rata del follow-up aumenta la possibilità di perdere soggetti durante il periodo di
sorveglianza. Perdere soggetti può alterare l’equilibrio tra il gruppo degli esposti
e quello di confronto, quindi la misura dell’incidenza e della prevalenza dell’esito.
Può capitare così di non confermare l’associazione tra esposizione ed esito perché
il gruppo di controllo è diventato troppo piccolo rispetto all’altro, o viceversa di
confermarla perché abbiamo perso troppi soggetti esposti, ed entrambe sarebbero
conclusioni sbagliate. Ricordiamo che il rischio relativo, che misura l’associazione
tra esposizione ed esito, è un rapporto tra rischi assoluti o incidenze, e il rischio
assoluto è inversamente proporzionale alla numerosità del gruppo.
Da questo deriva l’opportunità di disporre di una coorte in cui possiamo pre-
vedere di perdere pochi elementi. Nell’esempio dei British Doctors, i medici sono
una buona coorte perché si presume saranno collaborativi e interessati al progetto
e continueranno a fornire le informazioni richieste. Inoltre, chi muore durante lo
studio non è un soggetto perso, perché la mortalità è uno degli esiti monitorati.
Un caso particolare della perdita di soggetti è il cambio di stato di un soggetto, da
esposto o non esposto o viceversa. Anche per questo è necessario aggiornare i dati
di esposizione dei soggetti durante il follow-up, se è molto lungo: i non ammalati si
sono ammalati? I non fumatori sono diventati fumatori? Se questo non viene fatto,
e ci sono cambiamenti di stato, di nuovo si altera il rapporto tra i gruppi.
Bias di classificazione. Abbiamo già ricordato che uno studio analitico deve
avere un gruppo di confronto che idealmente differisce dal gruppo degli esposti
solo per l’esposizione. Il problema è che talvolta i non esposti vengono classificati
come esposti, o viceversa. Ad esempio, in uno studio sull’effetto della lavorazione
di nichel sul tumore al polmone, potremmo sbagliare nel classificare come non
esposti gli addetti alla logistica della fabbrica, mentre in realtà sono esposti come
gli addetti alla lavorazione, e quindi inserirli nel gruppo di controllo. In questo
caso è probabile che il rischio relativo dei due gruppi risulterà minore e l’ipotesi di
associazione non riceverà supporto.
Un problema che invece non è tipico dello studio di coorte prospettico è quello
della qualità dei dati: l’assenza di tale bias di informazione diventa un punto di
forza per questo tipo di studio.

Bias di informazione. Facciamo un passo indietro: come si è detto introducen-

do la ricerca quantitativa, ogni variabile considerata in un disegno sperimentale
(con o senza intervento) deve essere operazionalizzata, cioè concettualizzata in
modo da consentire una misurazione intersoggettiva e al più possibile accurata e
precisa. Nell’esempio dei British Doctors, l’esposizione è l’abitudine al fumo, e vie-
ne operazionalizzata mediante un questionario di auto-valutazione delle proprie
abitudini. Possiamo immaginare che si tratti di un questionario di facile compren-
sione, che non deve essere aggiornato molto frequentemente da parte dei soggetti
(non si cambia la propria abitudine al fumo tutti i giorni), e che quindi i medici
sono in grado di completare senza troppe mancanze o errori. Anche l’esito in que-
sto studio è semplice da misurare: la morte è una variabile categorica (si/no, senza
gradi) e i dati sulle morti e le loro cause sono raccolti in tutto il mondo in apposi-
ti registri, stilati in accordo a regole internazionali. Questi aspetti determinano la
qualità dei dati che i ricercatori possono raccogliere e quindi la qualità dell’eviden-
za che lo studio elabora rispetto all’ipotesi da testare. Lo studio avrebbe invece un
bias se i soggetti compilassero i report in modo inesatto e incompleto, e in generale
se la raccolta dei dati fosse inaccurata o incompleta, anche a causa della scelta di
una operazionalizzazione troppo difficile o poco precisa. Generalmente, tuttavia,
in uno studio prospettico i ricercatori possono scegliere l’operazionalizzazione e
monitorare l’acquisizione e la registrazione dei dati.
Concludendo, se nel nostro studio di coorte prospettico siamo riusciti a pre-
vedere e controllare i confondimenti e a evitare in buona misura i bias, abbiamo
buone ragioni per credere al risultato che abbiamo trovato (che sia la conferma di
un’ipotesi di associazione o la falsificazione di questa ipotesi). Conoscere i bias e
i confondimenti tipici ci fornisce anche ragioni per decidere se, data la nostra do-
manda di ricerca e la nostra situazione di tempo, strumenti e conoscenze, questo
tipo di disegno sperimentale fa al caso nostro. Vediamone altri.
Il problema della durata e quello conseguente della perdita di soggetti si può
ovviare con uno
studio di coorte retrospettivo. Come leggiamo nel grafico in Figura 2, la dire-
zione logica dell’indagine in uno studio di coorte è sempre in avanti, cioè dall’e-
sposizione all’esito. Tuttavia, con lo stesso disegno sperimentale si può scegliere
di studiare una sequenza tra esposizione ed esito collocata completamente o par-
zialmente nel passato rispetto allo studio. Ad esempio, per testare l’ipotesi di as-
sociazione tra fumo in gravidanza e parto pretermine, potremmo voler utilizzare
i dati sulle donne iscritte ai corsi pre-parto due anni fa, e su come sono avvenuti

i loro parti, confrontandoli con il gruppo di controllo. La direzione logica dell’os-

servazione resta in avanti, dall’esposizione all’esito, ma la sequenza è collocata nel
passato rispetto a noi che osserviamo: in questo senso lo studio è retrospettivo e
la coorte è detta storica. Anche questo disegno sperimentale può essere usato per
rispondere a quesiti di prognosi: data una certa malattia o condizione di cui abbia-
mo i casi (ad esempio un ictus invalidante) e i controlli (ad esempio pazienti con
remissione) e cerchiamo nel passato i fattori prognostici di entrambi i gruppi, per
confrontarli.
Le ragioni per scegliere uno studio di coorte retrospettivo sono di solito di ordi-
ne pratico. In alcuni casi si non si avrebbe a disposizione il tempo di osservazione
richiesto per testare con uno studio prospettico l’effetto di quegli stessi fattori, che
potrebbe essere molto lungo, come abbiamo visto nell’esempio del British Doctor
Study. In altri casi si può contare su un repertorio di dati già raccolti che si giudica
adeguato (database, con cartelle cliniche, registri elettronici o questionari compila-
ti) e che quindi consente di risparmiare tempo e denaro. Infine, l’esposizione può
essere molto rara o non più disponibile: può trattarsi di un certo modo di lavorare
una sostanza in una fabbrica, dell’assunzione di un farmaco non più in commercio,
o di una circostanza nel passato che non si è più ripetuta, come le radiazioni emes-
se da una bomba atomica o da una centrale in avaria.
A fronte del tempo e denaro risparmiati, e della possibilità di esplorazione del
passato, tuttavia, in uno studio di coorte retrospettivo i ricercatori hanno meno
controllo sulla qualità dei dati rispetto allo studio prospettico (i dati sono già stati
acquisiti). Oggi c’è molta attenzione al modo in cui i dati sono registrati e conser-
vati, soprattutto in ambito sanitario, ma in un passato anche recente non era così.
Per questo motivo, a parità di condizioni (quando cioè si potrebbero progettare
sia uno studio retrospettivo, che uno prospettico per indagare un fenomeno) uno
studio con una corte storica è più soggetto al bias di informazione. A parte questo
bias, dato che lo studio di coorte retrospettivo e prospettico hanno la stessa struttu-
ra logica, sono generalmente considerati alla pari per quanto riguarda il supporto
induttivo che forniscono a un’ipotesi di associazione.

3.4 STUDI CASO-CONTROLLO

Anche in questi studi osservazionali la domanda da cui partiamo è se una certa
esposizione sia associata a un certo esito, e l’ipotesi di associazione è confermata se
riusciamo a mostrare che l’esito è più frequente negli esposti rispetto ai non esposti.
Negli studi caso-controllo il disegno sperimentale ha però direzione logicamente
opposta rispetto a quella degli studi di coorte: non dall’esposizione all’esito, bensì
dall’esito H all’esposizione E. Non quindi: è vero che questa esposizione è associata
a questo esito, ma: è vero che questo esito è associato a questa esposizione?
Per testare se E è associato ad H si parte dai casi: un gruppo di soggetti che
hanno in comune un certo esito H (ad esempio una patologia). Si sceglie un altro
gruppo con caratteristiche il più possibile simili, ma nei quali l’esito non si è veri-
ficato (ad esempio i non malati): i controlli. Si indaga quindi nel passato di casi e
controlli registrando quanti soggetti in ciascun sono stati esposti al fattore E (un
trattamento, un tratto comportamentale, un agente patogeno). Se l’esposizione è
stata maggiore nel gruppo dei casi rispetto al gruppo dei controlli, allora l’associa-
zione può essere confermata (o più prudentemente, non falsificata).
Partiamo ad esempio da un gruppo casi di neonati ricoverati per enterocolite.
Vogliamo capire se l’alimentazione con latte in polvere sia associata a questa pato-
logia. Identificato il gruppo di controllo, registriamo quanti bambini nutriti con il
latte in polvere ci sono tra i casi o tra i controlli consultando i dati a disposizione
dell’ospedale o intervistando o somministrando questionari alle madri. Analizzia-
mo quindi i dati. Come? Va notato che la misura per l’associazione che si usa qui
è la odds ratio, non il rischio relativo (odds si potrebbe tradurre come probabilità
dell’esposizione rispetto all’esito, ma non lo si fa mai). L’odds si calcola prima all’in-
terno del gruppo dei casi, come rapporto tra casi esposti e casi non esposti, poi
all’interno del gruppo dei controlli, come rapporto tra controlli esposti e controlli
non esposti. Il rapporto tra i due valori è la odds ratio: se è maggiore di 1, abbiamo
una parziale conferma che E sia associato ad H. Nell’esempio, potremmo conclude-
re che i bambini malati di enterocolite hanno più probabilità di essere stati nutriti
con il latte in polvere rispetto ai controlli sani. Non si tratta di una conclusione fa-
cile da comprendere, perché non riusciamo immediatamente a tradurla in termini
di rischio.
Perché non si misura l’associazione in termini di rischio relativo? Perché per il
rischio relativo ci serve l’incidenza, che è il rapporto tra esiti ed esposti, ma qui il
rapporto tra esiti ed esposti è determinato dalla scelta dei casi e dei controlli e non

può essere usato come dato sulla popolazione in generale. Non bisogna confonde-
re l’odds ratio con il rischio relativo nel comunicare o leggere i risultati di uno stu-
dio, perché il primo risulta sempre più alto del secondo. Si è dimostrato comunque
che il valore di odds ratio approssima quello di rischio relativo quando i numeri
sono piccoli17.
Esempio. Illustriamo in breve uno studio epidemiologico semi-fittizio che mo-
stra in modo evidente il disegno sperimentale del caso-controllo18.
Tra il 25 e il 27 febbraio del 2004 si registrano sei casi di salmonella (HAV) nella
piccola città di Marshfield nel Massachusetts. Nel 2003 non c’era stato nessun caso
e nel 2002 uno solo: si tratta quindi di un fatto insolito. Vengono quindi cercati altri
casi e se ne trovano 19 disposti a partecipare allo studio. I ricercatori li intervistano
e i risultati qualitativi suggeriscono di testare un’ipotesi di esposizione a cibo conta-
minato in alcuni ristoranti della città. Si procede quindi a progettare uno studio di
caso-controllo: al 19 casi di malati vengono associati 38 controlli sani corrispondenti
per età, genere e quartiere di residenza e si procede a verificare le possibili esposizioni
di cibo contaminato al ristorante nei due mesi precedenti. I dati mostrano che 10
dei casi e 9 dei controlli hanno mangiato da Papà Gino: l’odds ratio è di 1.1, troppo
basso per essere significativo. Invece, 18 tra i casi e 7 tra i controlli hanno mangiato
da Ron’s Grill: qui l’odds ratio è molto alto, 75. Dunque, i casi di salmonellosi han-
no un’alta probabilità di avere mangiato da Ron’s Grill. La conclusione può essere
utilizzata per impostare un altro studio che verifichi che c’è una fonte di infezione
da HAV nel ristorante, ad esempio un semplice test diagnostico a tutti gli impiegati.
VANTAGGI DI UNO STUDIO CASO-CONTROLLO

Questo tipo di studio è particolarmente adatto quando la nostra ipotesi riguar-
da esiti relativamente rari (come nell’esempio del cluster di casi di salmonellosi)
o che si verificano molto dopo le esposizioni (ad esempio, l’associazione dell’infe-
zione da HPV, papilloma virus, con i tumori ovarici). In entrambi i casi uno studio
prospettico sarebbe rispettivamente troppo lento per dare risultati utili per con-
tenere l’epidemia, o inutilmente lungo e costoso. Dal punto di vista pratico, i casi
si trovano spesso già in ospedale o a disposizione dei ricercatori e questo facilita
la fattibilità. La possibilità di usare la odds ratio come misura dell’associazione
permette inoltre di lavorare con gruppi di caso e controllo anche poco numerosi
rispetto a quelli che occorrerebbero per uno studio analitico prospettico. Infine, se

in uno studio prospettico si possono monitorare contemporaneamente diversi esi-

ti, simmetricamente in un caso-controllo si possono testare contemporaneamente
diversi fattori di rischio. Essendo relativamente brevi ed economici, gli studi di
caso-controllo sono molto usati, basta una ricerca veloce sui principali database di
letteratura medica per rendersene conto.
CONFONDIMENTI E BIAS
Il confondimento è un problema per gli studi di caso-controllo come per quel-
li di coorte prospettica. C’è sempre, in altri termini, la possibilità che i risultati
nascondano l’effetto di una variabile spuria – in questo caso, un’esposizione che
non avevamo considerato. Torniamo all’esempio del gruppo di casi di neonati con
enterocolite. Nel testare l’associazione con l’allattamento artificiale un possibile
confondimento può essere l’età gestazionale. È più probabile che i bambini nati
prematuramente siano allattati artificialmente, ma il fattore potrebbe essere di per
sé un rischio per l’enterocolite. Per eliminare un confondimento come questo oc-
corre selezionare appropriatamente i controlli in modo che corrispondano ai casi
rispetto al possibile fattore confondente, con diverse tecniche di matching che sono
dettagliate nei testi di metodologia e biostatistica19. Come abbiamo già notato, oc-
corre qui però già sapere o sospettare che cosa possa costituire un confondimento
per eliminarlo tramite matching.
La ragione per cui gli studi di caso-controllo sono tendenzialmente meno vali-
di di quelli prospettici è la presenza di alcuni bias strutturali. Vediamo solo i due
principali.
Bias di informazione. I dati in uno studio di caso-controllo sono storici: ven-
gono dal passato dei casi e dei controlli. Non sempre si hanno a disposizione le
stesse operazionalizzazioni delle esposizioni che si vanno a indagare per i casi
e i controlli, ad esempio per i neonati ricoverati potremmo avere registrazioni
accurate delle modalità di nutrizione, mentre per i controlli, se non sono ricove-
rati, solo le risposte a un questionario rivolto alle madri. In generale i ricercatori
hanno meno possibilità di assicurare la qualità dei dati che vengono dal passato
o si riferiscono a eventi passati ricordati dai soggetti. Qui si potrebbe notare un
ulteriore bias di ricordo (recall): è frequente che i casi ricordino meglio o diversa-
mente dai controlli la loro storia rispetto alle esposizioni. Intuitivamente: se ho
mal di schiena è più facile per me riportare alla mente se ho sollevato pesi o se
ho cambiato sedia da lavoro, rispetto a chi non ha alcun fastidio. Naturalmente

la presenza o assenza di questi bias dipende anche dal modo in cui lo studio pia-
nifica di ottenere i dati: i questionari sollevano sempre difficoltà, anche se sono
molto economici e pratici.
Bias di selezione. Si ha, come abbiamo visto nel §3.3, quando si sceglie il grup-
po di controllo tra soggetti che sono già più o meno esposti al fattore di rischio. Un
esempio semplice quanto poco plausibile: nell’indagine sull’epidemia da salmo-
nellosi, scegliere i controlli tra i lavoratori dei ristoranti della città avrebbe falsato i
risultati: essendo sani, l’associazione non sarebbe stata trovata. Consideriamo que-
sto caso, più realistico:
si vuole condurre uno studio caso-controllo per studiare l’associazione fra infezione
da Chlamydia trachomatis e malattia infiammatoria pelvica (PID). Negli ambulatori
specializzati in malattie sessualmente trasmesse vengono individuati 50 casi di don-
ne con sintomi di PID. I controlli vengono selezionati fra le donne che afferiscono
agli ambulatori per lo screening periodico con Pap test. In questo caso è probabile
che la stima dell’associazione sia distorta, dal momento che i controlli sono selezio-
nati in un gruppo a minor rischio di esposizione. Le donne che si sottopongono allo
screening, infatti, appartengono generalmente a strati medio-alti della popolazione e
hanno meno frequentemente infezioni sessualmente trasmesse e, quindi, un rischio
inferiore di infezione da Chlamydia rispetto alle donne seguite nei centri delle malat-
tie sessualmente trasmesse.20
3.5 STUDI TRASVERSALI

Chiudendo la nostra veloce panoramica dei tipi di studi osservazionali analitici,
vediamo ora il disegno di studio trasversale (cross-sectional). La domanda iniziale a
cui risponde questo tipo di studio è ancora: c’è un’associazione tra l’esposizione E e
l’esito H? La direzione logica però non è né da E a H come nello studio di coorte, né
da H ad E come nel caso-controllo: qui E e H vengono monitorati simultaneamen-
te. La procedura è la seguente: i ricercatori scelgono il campione non selezionando
secondo l’esposizione, né secondo l’esito, bensì solo per la rappresentatività rispet-
to alla popolazione generale che si vuole studiare, e all’interno di questo campione,
in un tempo fissato, misurano E e D. A questo punto si può calcolare la prevalenza
dell’esito nella popolazione (numero di esiti diviso il numero di soggetti), oppure
anche la odds ratio tra E e H. Si può complicare il disegno sperimentale inserendo

un gruppo di controllo, in questo caso il disegno sarà analitico – per questo, nel
grafico di Fig. 2 gli studi trasversali sono presenti in entrambe le categorie.
Dal punto di vista pratico, può accadere che si decida di intraprendere uno stu-
dio trasversale all’interno di una coorte già in uso per uno studio di follow-up – ad
esempio nella coorte dei British Male Doctors potremmo voler monitorare trasver-
salmente l’indice di massa corporea e il consumo di alcol e ottenere come risultato
la prevalenza del sovrappeso e l’ipotesi di una possibile associazione tra sovrappe-
so e consumo di alcol.
VANTAGGI E SVANTAGGI DEGLI STUDI TRASVERSALI

Sono relativamente veloci – scattano una foto, metaforicamente, di E e H - e
quindi economici. Permettono di monitorare più fattori contemporaneamente: più
esposizioni e più esiti. I dati di tutte le variabili vengono acquisiti allo stesso tempo,
potenzialmente evitando così differenze nella qualità e nella misurazione. In epide-
miologia e clinica gli studi trasversali hanno permesso di identificare molte diverse
comorbilità (compresenza di patologie differenti) e compresenza di fattori di rischio.
Gli svantaggi sono facilmente deducibili dalla forma del disegno. Per confon-
dimenti e bias possiamo riferirci a quanto detto per gli altri studi osservazionali
descritti in questo capitolo: a seconda che lo studio trasversale abbia o meno il
gruppo di controllo si pongono i problemi di classificazione e di selezione, e se
le informazioni richieste ai soggetti riguardano il passato si possono avere bias di
recall o di qualità dei dati. C’è però un problema specifico di questi studi, dato pro-
prio dalla struttura logica. Dato che E e H sono misurate contemporaneamente,
non è possibile interpretare in senso causale o nemmeno di rischio questa associa-
zione. Intuitivamente: è E il fattore che aumenta la probabilità di H, o viceversa?
Certamente ci sono casi in cui il buon senso ci aiuta a dare una risposta. Se ad esem-
pio abbiamo condotto uno studio trasversale sugli operai del settore conciario per
monitorare la prevalenza di dermatiti da contatto, è plausibile che la dermatite sia
l’effetto della situazione occupazionale e non viceversa. Tuttavia, questa resta solo
una buona ragione per iniziare o suggerire uno studio analitico con altro disegno
che testi l’ipotesi di associazione tra lavoro nel settore conciario e dermatite da con-
tatto – e come abbiamo ricordato più volte, una buona ragione per intraprendere
uno studio sull’associazione tra E e H non è ancora una buona ragione per sostene-
re che E è associato a H (e ancora meno che E causa H). Quindi il buon senso può
diventare un bias nell’interpretazione dei risultati.

Esempio. Leggiamo l’abstract di uno studio giapponese sul consumo di tè ver-

de e alcuni parametri associati al rischio di patologie cardiovascolari ed epatiche,
pubblicato nel 1995 sul British Medical Journal. Si tratta di un disegno trasversale
innestato in una coorte di follow-up21.
Obiettivo. Indagare l’associazione tra il consumo di tè verde e vari marcatori sierolo-
gici in una popolazione giapponese, con speciale riferimento agli effetti preventivi del
tè verde contro le malattie cardiovascolari e i disturbi del fegato.
Disegno. Studio trasversale.
Setting. Yoshimi, Japan.
Soggetti. 1371 uomini sopra i 40 anni di età resident a Yoshimi e sorvegliati nelle
abitudini di vita, tra cui il consumo giornaliero di tè verde. I campioni di sangue
sono stati sottoposti a diverse analisi biochimiche.
Risultati. Maggior consumo di tè verde è risultato associato a minore concentrazione
di colesterolo totale […], trigliceridi, maggiore concentrazione di colesterolo lipopro-
teico ad alta densità e minore di colesterolo lipoproteico a bassa e bassissima densità
[…], risultanti in una diminuzione dell’indice aterogenico. Un consumo frequente
(più di 10 tazze al giorno) è risultato correlato a diminuzione della concentrazione di
marcatori epatici, aspartato aminotrasferasi, alanina trasferasi e ferritina.
Conclusione. L’associazione inversa tra consumo di tè verde e svariati marcatori
sierologici mostra che il tè verde può agire come protezione contro le malattie cardio-
vascolari e I disturbi del fegato.
Possiamo chiederci se gli autori dello studio abbiano considerato i possibili
confondimenti: si potrebbe ipotizzare ad esempio che il consumo di tè verde sia
anche associato a una dieta povera di grassi e che questo fattore sia responsabile
dell’associazione. Ma soprattutto, questo esempio evidenzia uno dei problemi tipi-
ci di questo disegno trasversale: si conclude asserendo che c’è un’associazione tra
consumo di tè verde e variazione dei valori di interesse, laddove lo studio può solo
suggerire l’ipotesi di tale associazione, che va ulteriormente testata.
Un tipo particolare di disegno trasversale con gruppo di controllo è quello degli
studi diagnostici in clinica. Per valutare l’accuratezza diagnostica di un test, un
gruppo di soggetti che probabilmente hanno una certa malattia o condizione ven-
gono sottoposti al test diagnostico da valutare, oppure a quello già in uso che rap-
presenta lo standard, e i valori di accuratezza vengono confrontati. In questo caso,
quello che si misura in parallelo è l’accuratezza del nuovo test e l’accuratezza dello

standard, ma ovviamente non ci interessa l’associazione, bensì il confronto. Abbia-

mo visto che uno studio clinico diagnostico può anche essere di tipo longitudinale,
ma il vantaggio dello studio trasversale è la contemporaneità delle misurazioni. La
randomizzazione, che vedremo nel prossimo capitolo, può aumentare la validità
di questo tipo di studio, che quindi è da considerare di una specie a parte rispetto
al disegno trasversale tipico dell’epidemiologia e dell’epidemiologia clinica22.
3.6 SECONDO INTERMEZZO SULLE CAUSE: I CRITERI DI HILL

Interrompiamo la nostra carrellata sui tipi di studi osservazionali per soffer-
marci su un punto filosofico. Abbiamo notato nel §1.8 che l’idea che la scienza
abbia lo scopo di fornire spiegazioni causali, e che la ricerca scientifica sia in
grado di arrivare a testare leggi causali che governano i fenomeni, è tanto intu-
itiva quanto difficile da rendere precisa. È molto difficile infatti trovare una de-
finizione del concetto di causa al riparo da controesempi, ovvero, con una frase
più finto-filosofica, scoprire la vera natura della causalità. Inoltre, esplorando le
inferenze induttive abbiamo visto che concludere che esiste una legge causale da
una serie regolare di associazioni è niente meno che cadere nell’errore del povero
tacchino di Russell, giustiziato il giorno di Natale. Eppure, la ricerca epidemiolo-
gica e clinica, e in particolare gli studi osservativi descritti fin qui, quando tutto è
stato fatto quanto a livello del nostro possibile controllo di bias e confondimenti,
arrivano al massimo a fornire risultati di associazioni significative tra esposizio-
ni ed esiti. Dobbiamo comunque rassegnarci ad association is not causation? La
risposta non è semplicemente “sì”. Vedremo ora che una delle direzioni nella
ricerca epidemiologica è quella di usare una serie di criteri per valutare quanto
un risultato di tipo associativo si possa interpretare come una relazione causale.
I criteri, come si è detto sempre nel §1.8, si possono sostituire a una definizione
quando non ne troviamo una, ma abbiamo comunque bisogno di un modo suffi-
cientemente affidabile per riconoscere qualcosa e distinguerla dalle altre simili.
I criteri in questione sono stati esposti in un articolo di argomento metodologico
e filosofico di Sir Austin Bradford Hill – già ricordato tra i padri dell’epidemiolo-
gia –, pubblicato nel 1965. Sono in tutto 9, eccoli qui.
1. Forza dell’associazione. Per illustrare il primo criterio che ci può guidare a ri-
conoscere le ipotesi causali dalle altre ipotesi di associazione, Hill cita due esempi.

Già nel XIX si era noto che moltissimi dei pazienti con tumore ai testicoli erano
spazzacamini, e nel 1920 si era arrivati a stimare che l’incidenza della mortalità
per questo tumore tra gli spazzacamini fosse 200 volte più alta che in tutte le al-
tre categorie occupazionali. Possibile interpretare un’associazione così forte come
compatibile con il caso (ipotesi nulla) o come prodotta da una causa comune? Il se-
condo esempio è quello della mortalità per tumore al polmone tra i fumatori, anche
questa già attestata attorno al 1965 come notevolmente più alta rispetto alla popo-
lazione. Ipotizzare un’altra causa, ragiona Hill, significa cercarla in una condizione
così intimamente legata al fumo di sigaretta e alla quantità di sigarette che dovrebbe
essere individuabile facilmente. Se non la troviamo o non la riusciamo a inferire
razionalmente, credo che siamo autorizzati a rifiutare la vaga obiezione del critico in
poltrona “non lo puoi provare, quella condizione ci potrebbe essere”23.
Abbiamo visto nel §3.1 che, nell’approccio dominante, l’analisi statistica ci re-
stituisce il valore di significatività, il p-value, che si riferisce a quanto è probabile
che l’associazione testata sia casuale, partendo dai nostri dati. Nei due esempi la
significatività sarebbe così evidente da darci buone ragioni per eliminare l’ipotesi
nulla, cioè che non ci sia relazione tra essere uno spazzacamino e morire di tumore
ai testicoli, o tra fumare molto e morire di tumore al polmone. Tuttavia, resta da
notare che forza dell’associazione da sola non ci dice nulla sulla direzione dell’as-
sociazione, e le relazioni causali non sono simmetriche: se A è causa di B, B non è
causa di A. Ma il problema non si pone, direbbe Hill, perché la direzione è ovvia:
l’ipotesi che il tumore ai testicoli faccia diventare spazzacamini è ridicola. Tutta-
via – l’abbiamo già osservato - questo “ridicolo” viene dalla nostra conoscenza del
mondo biologico, non dalle basi di evidenza che lo studio presenta (dalla nostra
base induttiva), e in altri casi potrebbe non bastare.
2. Consistenza. Se un’ipotesi di associazione tra un’esposizione e un esito è
confermata da più studi, realizzati da diversi ricercatori in tempi e luoghi diver-
si, abbiamo una ragione in più per credere che si possa trattare di una relazione
causale. Questo secondo criterio di Hill coincide con il concetto contemporaneo di
replicabilità di un risultato. Ci sono diversi modi di caratterizzare precisamente la
replicabilità, ma per gli scopi di questo punto della nostra discussione è sufficiente
l’idea principale: un risultato replicato è un risultato migliore, perché cambiare
osservatori, soggetti nel campione e setting di osservazione contribuisce a ridurre i
bias di cui abbiamo parlato (di misurazione, di selezione, dell’osservatore). Inoltre,

con più studi per la stessa ipotesi si accrescono le dimensioni del campione rispet-
to alla popolazione di riferimento, e con questo potenzialmente la significatività:
diventa meno probabile che sia vera l’ipotesi nulla. Tuttavia, la consistenza del
risultato non elimina i possibili confondimenti, cioè che l’associazione sia dovuta
a un’altra condizione, non testata dallo studio: non cambiando la struttura logica
dell’esperimento, non cambia nemmeno la possibilità di incorrere in errori logici.
Anche per questo vedremo, nel capitolo 4, che gli studi osservativi vengono ritenu-
ti in generale meno adeguati a supportare risultati causali rispetto agli esperimenti
randomizzati.
3. Specificità. Se l’associazione tra E e H riguarda un esito o un’esposizione che
sono rari, particolari, o molto circoscritti – ad esempio, lavorare un certo metallo
con una certa tecnica, oppure usare un certo tipo di elmetto da bicicletta – abbiamo
un indizio in più per mettere da parte l’ipotesi nulla, secondo Hill. Questo crite-
rio in realtà non è particolarmente difendibile – dopotutto bias e confondimenti
sono indipendenti da quanto rara sia per noi una certa caratteristica del mondo,
ma dipendono dalle proprietà logiche dello studio. Si può tuttavia notare che con
esposizioni ed esiti precisamente specificati, aumenta la possibilità di soddisfare il
criterio di Consistenza, cioè che il risultato venga ottenuto anche da altri.
4. Ordine temporale. Si tratta di un criterio necessario per una relazione causa-
le: le cause devono precedere temporalmente gli effetti. Se ad esempio uno studio
osservazionale trasversale mostra una forte associazione tra consumo di droghe
ricreative e disoccupazione tra i giovani, non possiamo concludere che le droghe
causino la disoccupazione, né che lo stato di disoccupazione causi l’aumento di
consumo, perché non sappiamo se l’esposizione preceda temporalmente l’esito.
Anche nella ricerca di base non è sempre facile stabilire le relazioni temporali tra
i vari fattori e livelli che si misurano, e l’applicazione di questo criterio non è im-
mediata. Tuttavia, nel caso di studi sugli effetti di farmaci o situazioni di rischio,
che l’esposizione preceda l’effetto è una ragione in più per credere che non si tratti
di un’associazione spuria. Ecco cosa scriveva Ronald Fisher – figura storica della
statistica – a proposito dell’associazione tra fumo di sigarette e tumore al polmone,
interpretata in senso causale24:
La curiosa associazione con il cancro al polmone trovata in relazione all’abitudine
al fumo non porta facilmente la mente di alcuni di noi alla facile conclusione che i
prodotti della combustione, raggiungendo la superficie del bronco inducano, sep-

pure dopo un lungo intervallo di tempo, lo sviluppo di un tumore. Se, ad esempio,

fosse possibile inferire che fumare sigarette sia una causa di questa malattia, sarebbe
ugualmente possibile concludere dalle stesse premesse che inalare il fumo delle siga-
rette sia una pratica di considerevole valore profilattico per impedire la malattia, dato
che la pratica è più rara tra i pazienti con il suddetto tumore che tra gli altri.
Ma l’ipotesi di causalità inversa di Fisher – contraria quindi a quella sostenuta,
tra gli altri, da Hill e Doll - venne appunto rigettata sulla base dell’ordine tem-
porale: la tipica vittima del tumore al polmone inizia a fumare molti anni prima
dell’insorgenza della malattia.
5. Gradiente biologico. L’idea di questo criterio è che abbiamo una ragione in
più per interpretare un’associazione in senso causale, se le variazioni nell’intensità
dell’esposizione corrispondono a variazioni nelle misure del rischio o dell’esito: la
cosiddetta relazione dose-risposta. Scrive Hill:
Il fatto che il tasso di mortalità per cancro al polmone vari in modo lineare con il
numero di sigarette fumate al giorno, aggiunge molto alla semplice evidenza che i
fumatori hanno un tasso di morte più alto rispetto ai non fumatori. Il confronto sa-
rebbe indebolito, anche se non necessariamente annullato, se dipendesse mettiamo da
un tasso più alto nei fumatori leggeri e più basso nei fumatori pesanti25.
L’esempio è convincente: senza la relazione lineare tra fumo e rischio, saremmo
più dubbiosi nei confronti dell’interpretazione causale. Ma anche questo criterio
ha dei limiti, sia epistemici che di applicazione. In alcuni casi l’associazione da
valutare è tra fattori operazionalizzati con variabili discrete, non continue – come
essere uomo o donna, morire per Covid-19 o non morire per Covid-19, e in questi
casi non esiste una relazione dose-risposta. In altri casi la variazione è lineare ma
ha un gradiente, ad esempio l’esposizione alla radioattività e la temperatura sono
associate causalmente a certi esiti di patologia, ma solo oltre un valore di soglia. Di
nuovo, il gradiente biologico è un indizio, più che una prova, per concludere che
un’associazione è causale.
6. Plausibilità. Dall’articolo di Hill:
sarebbe d’aiuto se la relazione causale che sospettiamo esserci fosse anche biologi-
camente plausibile. Ma questa è una caratteristica che sono convinto di non poter
richiedere. Cosa sia biologicamente plausibile dipende dalla conoscenza biologica del
momento26.

La plausibilità indica la possibilità di ipotizzare un meccanismo che spieghi l’i-

potesi di associazione. In effetti, però, ci sono diversi casi nella storia della medicina
in cui associazioni non biologicamente plausibili (all’epoca) si sono rivelate essere
genuine relazioni causali. Pensiamo all’ipotesi di Semmelweis: un’associazione tra
esposizione alle particelle cadaveriche ed esito di sviluppo di febbre puerperale e
morte. A parte la caratterizzazione “cadaverica” dell’agente patogeno, l’associazio-
ne causale è stata confermata, ma era del tutto implausibile rispetto alle conoscenze
dell’epoca, in particolare era incompatibile con la teoria miasmatica delle malattie.
Dunque, la conoscenza biologica ha un ruolo di evidenza inferiore rispetto alla
conoscenza o alle ipotesi che si possono concludere dagli studi epidemiologici e
clinici? Hill è ambivalente, perché enuncia il criterio, ma subito lo ritira. Discuten-
do di gerarchia dell’evidenza nel REF torneremo su questo punto.
7. Coerenza. È un criterio simile al precedente. La coerenza è la compatibilità
logica con ciò che già si ritiene accertato sul fenomeno indagato, ad esempio la
patogenesi e i fattori di rischio di una malattia. Anche qui Hill enuncia il criterio e
ne prende subito le distanze, menzionando alcuni casi tratti dalla storia della me-
dicina: ad esempio, nel diciannovesimo secolo l’associazione tra infezione batterica
e tifo era ritenuta assurda. A questi potremmo aggiungere che la scoperta del ruolo
patogeno dell’Helycobacter Pylori nell’ulcera gastrica, per cui due medici australia-
ni, Barry Marshall e Robin Warren, hanno ricevuto il premio Nobel nel 1982, non
era coerente con la convinzione dell’epoca: si riteneva infatti che i principali fattori
di rischio fossero abitudini alimentari, fumo, stress e farmaci antinfiammatori. Pri-
ma del riconoscimento internazionale il povero Marshall arrivò perfino a inghiot-
tire una coltura di batteri sviluppando una brutta gastrite, per attirare l’attenzione
sulla sua ipotesi causale relativa all’ulcera27.
8. Analogia. Un altro criterio che può dare un indizio a sostegno dell’ipotesi
che l’associazione trovata con uno studio osservazionale sia di natura causale – e
la lunghezza della frase qui intende riflettere quanto indiretto e debole possa esse-
re questo indizio. Ad esempio, spiega Hill, ora che sappiamo che alcuni farmaci,
come il Talidomide, hanno effetti sul feto se assunti in gravidanza, possiamo per
analogia credere che alcune associazioni tra assunzione di farmaci ed esiti infausti
nei feti o nei nati siano causali (parleremo tra poco del Talidomide, nel §3.6)
9. Esperimento. L’associazione tra un’esposizione e un esito che ricaviamo da
uno studio osservazionale può ricevere interpretazione causale se un esperimento

arriva alla stessa conclusione. Questo criterio è quello epistemicamente più forte:
ci dà la ragione migliore per credere che una certa associazione sia di natura cau-
sale. Tuttavia, questo dipende dalle proprietà epistemiche degli studi sperimentali
(in particolare, di quelli randomizzati e controllati), come vedremo nel Capitolo 4.
Non è quindi un criterio per valutare gli studi osservativi.
Concludendo: Distinguere con certezza le ipotesi di associazione da quelle
causali è molto difficile. Le varie misure di associazione, come rischio relativo e
odds-ratio, non ci forniscono alcuna guida, perché sono appunto misure di asso-
ciazione, non di causalità – sarebbe come chiedersi quale misura del peso dell’oro
(chilogrammo o libbra) ci informa del suo prezzo. I criteri di Hill sono un gruppo
misto di ragioni più o meno buone per rafforzare la credenza che l’ipotesi tro-
vata tramite uno studio osservazionale sia causale. Dei criteri di Hill nessuno è
necessario e congiuntamente non sono sufficienti. Il gruppo è misto perché Forza,
Gradiente biologico, Specificità e Ordine temporale fanno riferimento all’evidenza
fornita dallo studio stesso, mentre Consistenza, Analogia, Esperimento, Coerenza
e Plausibilità ci portano a considerare evidenza al di fuori, in altri studi e nella
conoscenza di sfondo. Dal punto di vista epistemico i criteri non sono in grado di
eliminare in modo sistematico la possibilità dell’ipotesi nulla, né che l’associazione
che stiamo valutando sia spuria perché c’è una causa comune o un confondimen-
to. Sono euristiche di riconoscimento molto fallibili, come nell’esempio del §1.8 i
miei criteri per riconoscere l’argento. Tuttavia, mentre i teorici dell’epidemiologia,
filosofi e non, ne hanno chiari i limiti, i criteri di Hill, per la loro comoda forma a
checklist, sono ancora molto usati nei manuali per gli studenti e ad essi è assegnata
la funzione impropria di distinguere le “vere cause” dalle “mere associazioni”28.
L’articolo originale di Hill del 1965 resta un classico di grande chiarezza esposi-
tiva e del tutto lucido rispetto agli aspetti epistemici finora considerati. Si conclude
con un understatement, che introduce un ulteriore tema di discussione, eccolo:
Chi sa, si chiede il poeta Robert Browning, che il mondo non finisca domani? Vero,
ma sulla base dell’evidenza disponibile molti di noi pendolari si preparano a prendere
domattina il treno delle 8.3029.
Il tema è quello del rapporto tra le ragioni per credere e le ragioni per agire.
Sebbene io non possa giustificare razionalmente la mia convinzione che domani
il mondo esisterà ancora (ricordate il tacchino e il giorno di Natale), ho sufficienti
ragioni per agire come se questa ipotesi fosse vera. Analogamente, le ragioni per
credere che una certa ipotesi di associazione attestano un nesso di causalità pos-

sono essere insufficienti, ma potremmo avere ragioni pratiche sufficienti per agire
sulla base di quell’ipotesi di associazione. Le ragioni per agire possono compren-
dere anche considerazioni etiche e pratiche: il rischio per le persone, il tempo a
disposizione, i doveri morali, eccetera, dunque il bilancio con l’evidenza puramen-
te fattuale va costruito con attenzione. Riflettiamo su questo esempio, uno studio
condotto all’inizio del XX secolo proprio da Hill e riportato da Doll in un articolo
del 200130, interessante per le conclusioni concettuali che l’autore ne trae. Si tratta
di uno studio di coorte retrospettivo commissionato da una raffineria di nichel sul-
le cause di morte tra gli operai. La coorte storica è formata da circa 1000 lavoratori
e pensionati identificati dai registri della compagnia e viene seguita per 10 anni
dal 1929 al 1938, confrontando gli esiti con i dati di mortalità della popolazione
britannica. Lo studio identifica 16 su 1000 morti di cancro ai polmoni contro 1 su
1000 dei dati nazionali, 11 di tumore al naso contro meno di 1 su 1000 e 67 contro 72
su 1000 morti per altre cause. Lo studio non viene pubblicato, ma Bradford Hill lo
illustra nel suo testo di epidemiologia del 1966, sottolineando un dato importante.
Nel 1923, spiega Hill, sono stati introdotti alcuni cambiamenti nella lavorazione
del nichel, indipendentemente dalla valutazione del rischio rispetto alle morti di
tumore. Da quel momento nella coorte non è stato osservato più nessun aumento
di rischio relativo di mortalità per tumore al polmone o al naso: in altre parole,
l’eccesso di malattie mortalità in entrambe le condizioni è solo una caratteristica
degli operai che hanno lavorato in raffineria solo nei primi 23 anni del secolo. Lo
studio cioè porta evidenza a un’ipotesi di associazione tra la lavorazione del nichel
nella modalità anteriore al 1923 e le morti per cancro ai polmoni e al naso. È vero,
continua Hill,
che ad ora [siamo nel 1966] non è stato identificato nessun agente causale per questi
neoplasmi e nessuna sperimentazione su animali ha dato alcun indizio o supporto
a questa evidenza puramente statistica, ma dobbiamo sicuramente fare attenzione a
questo fenomeno, che molto chiaramente rende inutile l’asserzione secondo la quale,
se l’evidenza è solo statistica non possiamo accettarla per intraprendere azioni.
Per tutte le cautele già espresse sulla validità degli studi di coorte retrospettivi,
lo studio di Hill sui registri della fabbrica di nichel non è una buona ragione per
credere che la causa delle morti sia l’esposizione al nichel a cui gli operai della fab-
brica erano soggetti prima del 1923. Tuttavia, il suo autore sottolinea che si tratta di
una buona ragione per agire – in questo caso, plausibilmente, facendo sì che quella
modalità di lavorazione non sia più implementata, secondo un principio di cautela.

Si tratta di dare un valore pratico a un risultato scientifico anche dopo avere con-
statato che il suo valore epistemico non sufficiente per garantire piena conoscenza,
e dopo aver valutato le altre ragioni etiche e pratiche che emergono dal contesto.
Non è lo scienziato a doversi occupare delle ragioni per agire: si tratta di un com-
pito che va gestito nel rapporto tra la scienza e le istituzioni, in particolare quelle
che si occupano di politica sanitaria. Questo tema ci riporta anche a sottolineare il
ruolo di tutti i disegni sperimentali, a patto che siano ben compresi nei loro limiti,
indipendentemente dalla loro possibilità di confermare associazioni causali31.
3.7 STUDI ECOLOGICI

Torniamo a descrivere i tipi di studi, completando la rassegna degli studi os-
servazionali con quelli descrittivi. Nella ricerca epidemiologica e clinica, i prin-
cipali tipi di studi osservazionali descrittivi sono lo studio ecologico, lo studio
di caso e la serie di casi. Ma anche gli studi di coorte e di caso-controllo posso-
no avere varianti descrittive. Il tratto distintivo degli studi descrittivi è infatti la
mancanza di un gruppo di controllo: le variabili E e H vengono osservate in una
popolazione, in una coorte, in una serie di casi o in un caso, senza che avvenga
un confronto con un’altra popolazione, coorte, serie di casi o caso in cui E o H
sono assenti.
Se manca il gruppo di controllo viene meno la possibilità di eliminare i confon-
dimenti, ovvero le associazioni spurie. Questo non è un problema se utilizziamo
uno studio descrittivo per esplorare un problema di ricerca o per raccogliere dati
su una popolazione, per cui questi studi sono fondamentali e hanno un grande
valore euristico: permettono di fare nuove scoperte, sono la parte esplorativa della
ricerca epidemiologica e clinica, e quindi formano una parte irrinunciabile del me-
todo scientifico. Molto di ciò che sappiamo oggi sulle cause del cancro (ad esempio
sulla dieta e il tumore al colon, sulle aflatossine e il tumore al fegato e sull’HPV e
i tumori ovarici) hanno la loro origine nei confronti sistematici della prevalenza o
dell’incidenza di queste patologie in vari paesi o regioni, condotte negli anni 50 e
60 del secolo scorso, che hanno suggerito ipotesi causali, alcune delle quali all’epo-
ca non erano nemmeno biologicamente plausibili32. La struttura logica intrinseca
degli studi descrittivi diventa un problema se si travisa il loro ruolo rispetto alla
conferma di ipotesi di associazione. Come abbiamo visto anche nel Capitolo 2, par-

lando del metodo scientifico in astratto, la fase di ideazione di un’ipotesi a partire

dalla conoscenza di sfondo e dall’osservazione, e la parte di conferma dell’ipotesi,
sono logicamente distinte e non devono essere confuse.
Negli studi ecologici l’unità di analisi è di solito una popolazione, non un indi-
viduo: esposizioni ed esiti sono tipicamente relativi agli abitanti di una città, regio-
ne, stato o quartiere. Domande di ricerca possono essere ad esempio: come varia
la prevalenza di malattie respiratorie rispetto al prezzo delle sigarette negli stati
dell’Unione europea? Che relazione c’è tra il numero di medici di famiglia pro ca-
pite e i ricoveri ospedalieri nelle regioni italiane? Esiste una relazione tra inquina-
mento atmosferico e tasso di mortalità per Covid-19? La legalizzazione dell’aborto
e la mortalità femminile sono correlate33?
I vantaggi dello studio ecologico sono di due tipi. Dal punto di vista pratico,
possono essere relativamente veloci e poco costosi, dato che in molti casi i dati
sono già stati raccolti per altri scopi. I dati sulla popolazione in oggetto vengono
spesso da registri a disposizione delle istituzioni governative o sanitarie. Dal punto
di vista teorico, possono mettere in luce possibili associazioni tra le caratteristiche
collettive delle popolazioni - come l’organizzazione sanitaria, l’esposizione a un
fattore climatico o di inquinamento - e gli esiti in termini di malattia o salute, che
non potrebbero essere rilevate con studi su individui. Se riflettiamo sulle domande
formulate sopra, vediamo che sarebbe impossibile pensare ad altri disegni speri-
mentali adatti. Ad esempio, non potremmo pensare a uno studio di caso-controllo
per verificare le esposizioni a inquinamento atmosferico dei morti per Covid-19.
Inoltre, gli effetti di fattori come le leggi o l’organizzazione sanitaria si vedono a
livello di popolazione, non di individuo.
Esempio. Questo studio ecologico pubblicato nel 1999 affronta il problema del
confronto tra sistema sanitario degli Stati Uniti, in cui i servizi sanitari sono a ca-
rico di molte diverse assicurazioni pagate dal cittadino, con quello del Canada, in
cui lo stato si fa carico della sanità attraverso le tasse pagate dai cittadini (come in
Italia). Lo studio affronta il problema attraverso la domanda specifica dell’associa-
zione tra condizione socioeconomica e accesso alle cure e mortalità per patologia
cardiaca34. Vediamo come.
Background. Un sistema sanitario universalistico si propone di assicurare l’accesso
alle cure in base al bisogno anziché in base al reddito, e di migliorare le condizioni di
salute di tutti i cittadini. Abbiamo esaminato la performance del sistema sanitario ca-
nadese rispetto a questi obiettivi nelle province dell’Ontario, valutando gli effetti del

reddito, basato sul quartiere di residenza, sull’accesso a procedure cardiache invasive

e sulla mortalità a un anno dall’infarto miocardico acuto
Metodi. Abbiamo raccolto richieste di pagamento per prestazioni mediche, cartelle di
dimissioni ospedaliere e dati di mortalità per tutti i pazienti con infarto miocardico
acuto ricoverati negli ospedali dell’Ontario tra aprile 1994 e marzo 1997. I livelli
di reddito sono stati attribuiti in base ai redditi medi per quartiere di residenza de-
terminati dal censimento canadese del 1996. Abbiamo determinato le percentuali di
utilizzo e i tempi di attesa per l’angiografia coronarica e le procedure di rivascolariz-
zazione dopo l’ammissione per infarto miocardico acuto, e i tassi di mortalità a un
anno. Nell’analisi multivariata abbiamo tenuto conto dell’età, il genere e la gravità
della patologia del paziente; la specialità del medico curante; per l’ospedale di am-
missione il volume dei casi, il tipo, le strutture disponibili e la prossimità geografica
di centri di cura terziaria.
Risultati. La coorte studiata era di 51591 pazienti. Rispetto all’angiografia coronari-
ca, un aumento del reddito dal quintile dal quintile più basso al più alto è risultato
associato a un incremento del 23 per cento nelle percentuali di utilizzo e un decre-
mento del 45 per cento nei tempi di attesa. C’è una forte relazione inversa tra reddito
e mortalità a un anno (P>0.001). Ogni aumento di $10000 nel reddito medio basato
sul quartiere di residenza si associa a una riduzione del 10 per cento di mortalità a
un anno […].
Conclusioni. Nelle province dell’Ontario, nonostante il Canada abbia un sistema sa-
nitario universalistico, lo stato socioeconomico ha marcati effetti sull’accesso ai trat-
tamenti specializzati per le patologie cardiache e sulla mortalità a un anno dall’in-
farto miocardico acuto.
Dalle conclusioni dello studio si potrebbe inferire che un sistema sanitario uni-
versalistico non è una condizione sufficiente per assicurare lo stesso livello di cura
indipendentemente dal reddito. Ma si tratterebbe di una conclusione affrettata: per
il disegno dello studio l’ipotesi è quella di un’associazione tra reddito e accesso alle
cure e mortalità, ma è solo suggerita. L’ipotesi suggerita comunque ha portato ad
altri studi relativi alla stessa regione, in particolare studi di follow-up che hanno
mostrato che in gran parte il gradiente di mortalità è mediato da differenze iniziali
del profilo di rischio cardiologico dei pazienti più che da differenze nei processi di
cura. Questo a sua volta ha suggerito studi sugli stili di vita salutari in relazione ai
quartieri di residenza35.

LIMITI E BIAS
Il limite principale di uno studio ecologico viene dal suo disegno descrittivo
ed è quindi comune agli altri studi di questo tipo: senza un gruppo di control-
lo, se suggerisce un’ipotesi non può allo stesso tempo servire per confermarla. Il
principale bias specifico di questo tipo di studio ecologico è invece la cosiddetta
fallacia ecologica. Si tratta di inferire direttamente le proprietà di un individuo
dalle proprietà di una popolazione36. Non dobbiamo qui confondere la fallacia eco-
logica con il problema della rappresentatività del campione: in tutti gli studi in cui
utilizziamo un campione (che sia una coorte o un gruppo di casi) ci si può sempre
chiedere quanto le proprietà del campione in termini di esposizioni ed esiti siano
rappresentativi di tutta la popolazione. Ma qui c’è un problema ulteriore perché gli
esiti e le esposizioni sono già proprietà collettive di una popolazione. È stato notato
che a livello di popolazione qualsiasi malattia associata alla ricchezza o allo stile di
vita occidentale può essere correlata con le vendite di televisori o con il tempo o la
qualità della connessione a internet, ma non ha senso trasferire questa associazione
a livello individuale37.
3.8 CASE STUDIES E SERIE DI CASI

La struttura logica di un case study è semplice: si descrive un caso con un esito
di interesse, come lo sviluppo di una patologia, la reazione a un farmaco o a un
trattamento, ma anche un risultato diagnostico o prognostico. Una serie di casi è
uno studio che riunisce la descrizione di alcuni casi individuali in un unico report.
Una caratterizzazione più estesa dello studio di caso in clinica è la seguente:
il resoconto formale di un unico paziente e della sua condizione, compresi i segni e i
sintomi, i test diagnostici, i trattamenti e gli esiti38 .
Limiti
Come in ogni disegno sperimentale in cui non c’è un gruppo di controllo, l’o-
biettivo di questi studi non può essere la conferma di un’ipotesi tra un’esposizione
e un esito. Nei case studies, tuttavia, non c’è nemmeno una base per l’induzione:
non possiamo generalizzare dal caso singolo, che in nessun modo può essere un
campione per la popolazione di riferimento (il problema non è qui avere una sola
persona o unità di studio, ma avere un solo “caso”, cioè una sola esemplificazione

della relazione tra esposizione ed esito). Se si generalizza da questo tipo di studi si

commette un’evidente fallacia logica e metodologica.
Con lo sviluppo dell’epidemiologia e delle tecniche statistiche dal 1950 in poi,
la ricerca in medicina ha sostanzialmente declassato i case-studies e le serie di casi
come forma di costruzione e comunicazione di conoscenza. Come vedremo parlan-
do dell’Evidence-Based Medicine (REF), questo movimento di riforma metodologica
degli anni 90 del secolo scorso ha ulteriormente relegato in basso, dal punto di vi-
sta della qualità dell’evidenza, i case studies e le serie. Infine, dal punto di vista della
comunicazione della salute, la pubblicazione incontrollata (ad esempio non su una
rivista scientifica, ma sui media) di un caso di studio con esiti negativi può ledere
gli effetti di politiche di salute pubblica – la pubblicazione di alcuni casi degli esiti
negativi di un vaccino, già previsti in sede sperimentale oppure non ancora testati,
può vanificare ad esempio gli sforzi di una campagna di vaccinazione di massa.
Vantaggi
Tuttavia, restano diverse funzioni che questo tipo di studi può assolvere, e di
fatto molti ne vengono correntemente prodotti e disseminati: esistono riviste spe-
cializzate e sezioni di pubblicazioni prestigiose ad essi dedicate39. Prima di tutto, i
case studies e le serie di casi hanno una funzione euristica, cioè possono suggerire
nuove ipotesi. Abbiamo visto un esempio nel Capitolo 2 REF: una serie di casi di
polmonite pneumococcica tra maschi giovani in California ha allertato la sanità
statunitense rispetto alla possibilità di un’epidemia e dato origine all’ipotesi di una
sindrome, poi identificata come AIDS. In epidemiologia, questo è uno degli usi
della serie di casi. Anche in clinica ci sono esempi storici che hanno dato contributi
rilevanti. Vediamone uno, che definiremmo oggi di farmacovigilanza, cioè relativo
agli effetti di un farmaco già in commercio. Si tratta di una lettera alla rivista Lancet
pubblicata nel 196140
Gentilissimi,
Le anomalie congenite sono presenti circa nel 15% dei bambini. Negli ultimi mesi ho
osservato un’incidenza di quasi il 20% di gravi anomalie multiple in bambini parto-
riti da donne alle quali era stato prescritto il farmaco Talidomide (Distaval) durante
la gravidanza, come anti-emetico o sedativo. Queste anormalità sono presenti nelle
strutture che si sviluppano dal mesenchima – le ossa e la muscolatura dello stoma-
co. Lo sviluppo osseo sembra essere affetto in modi molto particolari, risultando in
polidattilia, sindattilia e mancato sviluppo delle ossa lunghe (radio o femore corti in
modo anormale). Qualcuno di voi lettori ha notato anomalie simili in bambini par-

toriti da donne che hanno assunto questo farmaco in gravidanza? Hurstville, New
South Wales, W. G.McBride
Questa lettera di un ginecologo australiano riuscì a portare all’attenzione di altri
studiosi gli effetti teratogenici (cioè come causa di malattia) del Talidomide, che
non erano noti né ipotizzati, anche perché all’epoca si tendeva a ritenere che la
mancanza di effetti collaterali nella madre fosse evidenza di sicurezza anche per
il feto. Dopo poco tempo il farmaco fu ritirato dal commercio e soprattutto comin-
ciarono gli studi di farmacovigilanza. Oggi non viene più prescritto alle donne in
gravidanza, ma la molecola ha trovato impieghi in oncologia e immunologia41.
Uno studio di caso in generale può servire a mettere in luce un aspetto di una
patologia che non è ancora stato studiato, che sia medico o non medico. Vediamo
questo esempio del 2020, durante la pandemia da Covid-19, pubblicato sul British
Medical Journal, di cui si riporta il riassunto che precede l’articolo:
Un operatore sanitario maschio, di 37 anni e precedentemente in buona salute, si è
presentato con confusione, sintomi psicotici e un tentativo di suicidio nel contesto di
una ricevuta diagnosi di Covid-19. Dopo trattamenti chirurgici e il ricovero in tera-
pia intensiva, ha avuto un buon recupero in termini di salute sia fisica che mentale.
Una serie di fattori ha contribuito alla sua presentazione, tra i quali l’infezione da
Sars-CoV-2, grave insonnia, stress correlato all’occupazione sanitaria, e il peculiare
tipo di stress associato alla pandemia da Covid-19. Questo caso mostra la necessità
di caratterizzare più approfonditamente le conseguenze psichiatriche del Covid-19
nei contesti di comunità, e dovrebbe ricordare ai medici clinici l’attenzione ai sintomi
psichiatrici in comorbidità durante la valutazione dei pazienti con nuove diagnosi
di Covid-19.
Infine, un’altra funzione dello studio di caso, che non ha vincoli sulla quantità
e il tipo di dettagli forniti e sullo stile della descrizione, è quello di fare da comple-
mento alla ricerca medica quantitativa con informazioni qualitative. Può contenere
ad esempio, oltre alla descrizione oggettiva (dal punto di vista del clinico) dei sin-
tomi di una condizione, anche il resoconto delle esperienze soggettive del paziente
dal punto di vista fenomenologico, oppure la sua storia raccontata in prima per-
sona. Qui la ricerca da quantitativa si fa qualitativa: non ci sono misurazioni delle
variabili ma interpretazioni dei fenomeni secondo una cornice concettuale data.
Alcuni studi di caso in psichiatria fenomenologica possono avere questa forma e
funzione. Leggiamo questo abstract42:

Quali sono le esperienze vissute di un individuo con un disturbo degenerativo cro-

nico? Lo scopo di questo studio è affrontare la questione esplorando una esperienza
personale individuale di vita con la malattia di Parkinson. Lo studio riporta dati
da interviste semi-strutturate con un soggetto femmina, analizzati con il metodo
dell’analisi fenomenologica interpretativa. L’analisi ha individuato due temi generali
introdotti qui. Il primo tema fornisce un quadro dettagliato dell’esperienza di vivere
con il morbo di Parkinson. Le sfide quotidiane della paziente parkinsoniana sono
varie e dinamiche e illuminano la complessa relazione tra mente e corpo. Il secondo
tema esamina come vivere con il Parkinson abbia un grave impatto sul senso del sé e
dell’essere agente. L’analisi mostra come i sintomi visibili della malattia di Parkinson
danneggino il senso di un sé integrato e autonomo.

La ricerca biomedica può essere classificata per oggetto in ricerca di base e applicata,
quest’ultima suddivisa in epidemiologica e clinica. Altre distinzioni importanti sono
quelle tra ricerca osservativa e sperimentale (con o senza intervento sulla realtà da
parte del ricercatore), analitica e descrittiva (con o senza gruppo di controllo), quan-
titativa e qualitativa (con o senza variabili operazionalizzate e con valori numerici).
Solo la ricerca analitica può testare ipotesi, mentre la ricerca descrittiva è appropria-
ta per trovare ipotesi da sottoporre ad altri studi. La validità interna di uno studio è
la sua capacità di evitare bias (errori sistematici) e confondimenti (errori logici che
danno origine ad associazioni spurie). I principali disegni di studio osservazionale
sono lo studio di coorte, prospettico e retrospettivo, lo studio di caso-controllo e lo
studio trasversale. I case-studies e le serie di casi sono studi descrittivi che possono
suggerire nuove ipotesi, ma i loro risultati non sono generalizzabili. Ciascun disegno
sperimentale osservazionale ha limiti epistemici e vantaggi. Non ci sono regole siste-
matiche per decidere quando un risultato in termini di associazione tra esposizione
ed esiti può essere interpretato come una relazione causale. Ci sono diversi criteri
che possono però darci ragioni più o meno buone per valutare l’evidenza fornita da
uno studio.

NOTE DI CHIUSURA
1 Rimando a Romeijn, J. (2017) Philosophy of Statistics. The Stanford Encyclopedia of Phi-
losophy (Spring 2017 Edition), Edward N. Zalta (ed.), URL = <https://plato.stanford.edu/
archives/spr2017/entries/statistics/>.
2 Lo schema è adattato dalla Figura 1 in Röhrig, B., Du Prel, J. B., Wachtlin, D., & Blettner,
M. (2009). Types of study in medical research: part 3 of a series on evaluation of scientific
publications. Deutsches Arzteblatt International, 106(15), 262.
3 In italiano rimando a Amoretti, M. C. (2015) Filosofia e Medicina. Roma: Carocci
4 Langevin-Joliot, H. (1998). Radium, Marie Curie and Modern Science. Radiation Resear-
ch, S3-S8.
5 Lavik, E., Kuehn, M. H., & Kwon, Y. H. (2011). Novel drug delivery systems for glau-
coma. Eye, 25(5), 578-586. Altri esempi si trovano in Eupati (2020) Traslational medicine,
https://toolbox.eupati.eu/resources/translational-medicine/, accesso del 31 dicembre 2020.
6 U.S. Department of Health and Human Services Centers for Disease Control and Pre-
vention (CDC) (2012) Principles of Epidemiology in Public Health Practice. Atlanta: CDC
7 Clancy, C. M., & Eisenberg, J. M. (1998). Outcomes research: Measuring the end results
of health care. Science, 282(5387), 245.
8 Per un’introduzione alla statistica nella ricerca medica in italiano si può fare riferimen-
to a Daniel, W. (1996) Biostatistica. Napoli: EdiSes.
9 La figura è adattata da Grimes, D. A., & Schulz, K. F. (2002). An overview of clinical
research: the lay of the land. Lancet, 359(9300), 57-61. Per la versione italiana Cartabellotta,
N. (2010) Pillole di metodologia della ricerca. Gimbe News 3, 2, 15-16.
10 Un riferimento molto sintetico e semplice per i concetti metodologici di base è Grimes,
D. A., & Schulz, K. F. (2002). An overview of clinical research: the lay of the land. The Lan-
cet, 359(9300), 57-61.
11 Doll, R., Peto, R., Boreham, J., & Sutherland, I. (2004). Mortality in relation to smoking:
50 years’ observations on male British doctors. British Medical Journal, 328(7455), 1519. Uno
dei primi articoli pubblicati sullo studio è Doll, R., & Hill, A. B. (1964). Mortality in rela-
tion to smoking: ten years’ observations of British doctors. British medical journal, 1(5395),
1399.
12 Laupacis A, Wells G, Richardson S, et al. Users guides to the medical literature. V. How
to use an article about prognosis. JAMA 1994; 272:234–237
13 Lo standard per gli studi diagnostici è tuttavia il disegno trasversale. La complessità
dello studio diagnostico merita approfondimento a parte, si veda ad esempio Rutjes AW,
Reitsma JB, Vandenbroucke JP, Glas AS, Bossuyt P.(2005) Case-control and two-gate desi-
gns in diagnostic accuracy studies. Clinical Chemistry 51:1335-41
14 Esiste un dibattito in corso sui vantaggi e gli svantaggi dell’approccio statistico in ter-
mini di probabilità dell’ipotesi nulla e sulla corretta interpretazione del p-value. Per un ap-

proccio critico si veda ad esempio Goodman, S. (2008). A Dirty Dozen: Twelve P-Value
Misconceptions. In Seminars in Hematology (Vol. 3, No. 45, pp. 135-140).
15 Sackett, D. L. (1979). Bias in analytic research. Journal of chronic diseases, 32(1-2), 51.
16 Per una trattazione più approfondita rimando al cap. 4 di Supino, P. G., & Borer, J.
S. (Eds.). (2012). Principles of research methodology: A guide for clinical investigators. Springer
Science & Business Media.
17 Schmidt, C. O., & Kohlmann, T. (2008). When to use the odds ratio or the relative
risk?. International journal of public health, 53(3), 165.
18 Tratto da LaMorte, W. (2016) Outbreak investigations. Boston: Boston University Scho-
ol of Public Health
19 Si veda ad es. Schlesselman J. (1982) Case-control studies. New York: Oxford Universi-
ty Press.
20 SaPeRiDoc. Centro per la salute perinatale e riproduttiva (2010) Bologna: Servizio Sani-
tario dell’Emilia- Romagna, https://www.saperidoc.it/flex/cm/pages/ServeBLOB.php/L/IT/
IDPagina/586
21 Imai, K., & Nakachi, K. (1995). Cross sectional study of effects of drinking green tea on
cardiovascular and liver diseases. British Medical Journal, 310 (6981), 693-696.
22 Sackett, D. L., & Haynes, R. B. (2002). The architecture of diagnostic research. British
Medical Journal, 324(7336), 539-541.
23 Hill, S. B. (1965). The Environment and Disease: Association or Causation?. Proceedings
of the Royal Society of Medicine, 58, 295-300, p. 296.
24 Fisher, R. A. (1958). Cancer and smoking. Nature, 182(4635), 596-596.
26 Ibid.
27 Marshall B. and Warren R. (1984). Unidentified Curved Bacilli in the Stomach of Pa-
tients with Gastritis and Peptic Ulceration. Lancet. 2 (8626/8627):1437-41. Per la storia della
scoperta e della sua difficile accettazione Thagard P. (1998). Ulcers and Bacteria I: Discovery
and Acceptance. Studies in History and Philosophy of Science. Part C: Studies in History and
Philosophy of Biology and Biomedical Sciences. 29:107-36.
28 Per una valutazione filosofica si veda Bird, A. (2011). The epistemological function of
Hill's criteria. Preventive Medicine, 53(4-5), 242-245. Per una discussione da parte di epide-
miologi, Lucas, R. M., & McMichael, A. J. (2005). Association or causation: evaluating links
between environment and disease. Bulletin of the World Health Organization, 83, 792-795.
30 Doll, R. (2001). Cohort studies: history of the method II. Retrospective cohort stu-
dies. Sozial-und Präventivmedizin, 46(3), 152-160.

31 Per il concetto di causalità in epidemiologia rimando a tutti i lavori del filosofo Alexan-
der Broadbent, ad esempio Broadbent, A. (2009). Causation and models of disease in epide-
miology. Studies in History and Philosophy of Science Part C: Studies in History and Philosophy
of Biological and Biomedical Sciences, 40(4), 302-311.
32 Si veda ad esempio Doll R, Payne P, Waterhouse J (1966) eds. Cancer incidence in five
continents, vol. I. Geneva: Union Internationale Contre le Cancer.
33 Su questa specifica domanda si veda Anon (1995). Abortion: one Romania is enough.
Lancet 1995; 345: 137–38.
34 Alter, D. A., Naylor, C. D., Austin, P., & Tu, J. V. (1999). Effects of socioeconomic status
on access to invasive cardiac procedures and on mortality after acute myocardial infar-
ction. New England Journal of Medicine, 341(18), 1359-1367.
35 Tu, J. V., & Ko, D. T. (2008). Ecological studies and cardiovascular outcomes resear-
ch. Circulation, 118(24), 2588-2593.
36 Grimes, D. A., & Schulz, K. F. (2002). Descriptive studies: what they can and cannot
do. The Lancet, 359(9301), 145-149.
37 Pearce, N. (2000). The ecological fallacy strikes back. Journal of Epidemiology and
Community Health, 54(5), 326.
38 Venes, D. (2009) Taber’s Cyclopedic Medical Dictionary. 21st edition. Philadelphia:
F.A. Davis Company
39 Si veda Nissen, T., & Wynn, R. (2014). The clinical case report: a review of its merits and
limitations. BMC research notes, 7(1), 264.
40 McBride, W. G. (1961) Thalidomide and Congenital Abnormalities. Letter to the Editor.
The Lancet 2 (December 16, 1961): 1358.
41 La vicenda completa è riassunta in Melchert, M., & List, A. (2007). The thalidomide
saga. The international journal of biochemistry & cell biology, 39(7-8), 1489-1499.
42 Bramley, N., & Eatough, V. (2005). The experience of living with Parkinson’s disease:
An interpretative phenomenological analysis case study. Psychology & Health, 20(2), 223-
235.

GLI STUDI SPERIMENTALI
CAPITOLO QUARTO
Dopo una breve riflessione sulla scelta tra osservare o sperimentare, il capitolo de-
scrive la struttura dei Randomized-controlled trial (RCT), con particolare attenzione
alla randomizzazione e al blinding, che aumentano la validità interna. Dopo aver de-
scritto vari disegni di RCT, i trial farmacologici e successivamente gli studi pre-spe-
rimentali e quasi-sperimentali, mettiamo a fuoco la questione degli RCT come gold
standard per la ricerca biomedica. Viene poi introdotta la gerarchia delle evidenze
per le questioni cliniche proposta dal movimento EBM (Evidence-based medicine),
considerando alcune critiche filosofiche. Discutendo della validità interna degli RCT
si introducono alla fine alcune questioni sui valori nella ricerca.
4.1 OSSERVARE O SPERIMENTARE?

Continuiamo in questo capitolo la nostra esplorazione dei tipi di studi nella
ricerca biomedica, guidata dalla domanda (epistemica, filosofica e metodologica):
che tipo di ragioni ci fornisce ciascun tipo di studio rispetto all’ipotesi che voglia-
mo testare? Abbiamo visto nel Capitolo 3 fino a dove arrivano gli studi osservazio-
nali, in cui si misurano o si confrontano gli effetti di un’esposizione su un outcome
con o senza un gruppo di controllo. Gli studi sperimentali differiscono da quelli
osservazionali perché le esposizioni sono interventi, cioè modifiche della realtà da
parte dei ricercatori: si agisce sulla variabile indipendente per vedere se e come
questo cambiamento avrà effetti sulla variabile dipendente. Claude Bernard, famo-

so medico scienziato della Francia di fine Ottocento, autore di una celebre introdu-
zione al metodo sperimentale in medicina (secondo molti storici, la prima), scrive-
va che nell’esperimento rispetto all’osservazione il ricercatore è attivo – anche poi
se deve tornare passivo per controllare gli effetti della sua modifica1. Molti o quasi
tutti gli studi di laboratorio e preclinici sono sperimentali (o quasi-sperimentali o
pre-sperimentali, secondo la distinzione che faremo nel corso di questo capitolo),
mentre in epidemiologia e clinica, come abbiamo visto, ci sono diversi tipi di studi
osservazionali.
Va detto subito che, dal punto di vista della validità interna di uno studio, la
semplice caratteristica di misurare l’effetto di un intervento anziché di un’esposi-
zione, in vista di un outcome, non fa differenza: non si tratta di un tratto strutturale
che aumenta la validità di per sé. La validità interna, lo ricordiamo, ha a che fare
con quanto il risultato che otteniamo da uno studio sia dovuto all’effetto dei fattori
che stimo esaminando e non ad altri. Come abbiamo visto, il gruppo di confronto
o controllo fa invece una differenza rispetto alla validità, e ancora di più l’assegna-
zione casuale dei soggetti all’intervento, cioè la randomizzazione di cui parleremo
tra poco. La questione, infatti, è sempre quanti confondimenti e bias sono tipici di,
o invece evitabili da, un certo tipo di studio. Vedremo che l’RCT, nelle sue varianti,
è in grado di evitarne molti e in generale di più rispetto agli altri tipi di studi che
abbiamo fin qui considerato.
Un RCT testa l’ipotesi che un intervento abbia un effetto rispetto ad un outcome
monitorando due o più gruppi (controllo), dei quali solo uno riceve l’intervento in
oggetto, e ai quali i soggetti sono assegnati in modo casuale. Viene impiegato per
domande di ricerca cliniche sull’efficacia di un nuovo farmaco (i trial clinici), e in
generale in tutti i campi della ricerca biomedica, dalla preclinica e di base in vivo
e in vitro (cioè sugli animali o in provetta), alla valutazione della qualità in sanità
e delle politiche di prevenzione per la salute pubblica. Nel Capitolo 3 ci è servito
come termine di paragone per evidenziare i limiti degli studi osservazionali, anche
di quelli con gruppo di controllo. Come vedremo nel §4.5 nel paradigma dell’EBM
l’RCT clinico è considerato in grado di fornire un’evidenza migliore di qualsiasi
studio osservazionale rispetto a questioni cliniche, e costituisce il paradigma di ec-
cellenza per la ricerca primaria, assieme alle meta-analisi per la ricerca secondaria.
Inoltre, secondo diversi metodologi – ma non tutti i filosofi sono d’accordo (lo ve-
dremo nel §4.6) - un’ipotesi confermata da un RCT costituisce conoscenza causale
in medicina: certamente si tratta di conoscenza fallibile, ma l’idea è che se un trial
randomizzato conclude che c’è un effetto dell’intervento studiato I sull’outcome O,

Capitolo quarto - Gli studi sperimentali 107
allora si tende a concludere che I è una delle cause di O (cambiamo qui la nostra
notazione schematica rispetto agli studi osservazionali, abbandonando esposizio-
ne E ed esito H, perché nel campo degli studi sperimentali si parla più frequente-
mente di Intervento e di Outcome).
Dunque, è sempre meglio optare per un RCT in fase di scelta del disegno speri-
mentale? Certamente no. Innanzitutto, come abbiamo già visto, una fase inelimina-
bile del metodo sperimentale è quella di formulare ipotesi. In questa fase sono più
adatti gli studi osservazionali e descrittivi, in cui, metaforicamente, non si restringe
troppo il campo di esplorazione. Con un’immagine: se qualcuno mi dice di cercare
nella sua cucina le chiavi dell’auto che ha dimenticato, non è opportuno che io mi
metta subito a verificare se sono nel ripiano dei biscotti svuotandolo completamente,
ma è meglio capire prima quanti e quali sono le superfici e i mobili da considerare.
Così come non possiamo nemmeno dire che sia sempre meglio optare per uno stu-
dio sperimentale, anziché per uno osservazionale. La scelta del tipo di studio va fatta
pesando ragioni epistemiche (che tipo di domanda di ricerca ci stiamo ponendo, che
tipo di evidenza può fornire lo studio in virtù della sua struttura), ma anche ragioni
pratiche (in sintesi: tempo, denaro, strutture), nonché vincoli etici (è giusto che questi
soggetti ricevano questo intervento, o vengano osservati in questo modo?), che non
abbiamo considerato2. In altre parole, la qualità dell’evidenza che uno studio può
dare rispetto a un’ipotesi, in virtù della sua struttura, è la caratteristica epistemica
che abbiamo analizzato principalmente fin qui, ed è fondamentale dal punto di vista
della conoscenza, ma le caratteristiche pratiche e quelle etiche della ricerca fanno al-
trettanto parte della scienza come attività situata nel mondo reale, e soprattutto delle
scienze biomediche, che si occupano dei viventi. In sintesi, dunque, un RCT non è
sempre la scelta migliore, perché non sempre è quello che davvero vogliamo, o pos-
siamo fare. Lo è però quando intendiamo testare un’ipotesi, tipicamente sull’efficacia
di un intervento, come vedremo nel caso dei trial farmacologici nel §4.5, e ci sono le
condizioni etiche e pratiche per condurlo e portarlo a termine.
4.2 STUDI CONTROLLATI RANDOMIZZATI (RCT)

Per la sua centralità paradigmatica, iniziamo quindi la nostra rassegna proprio
dall’RCT, per poi passare agli altri disegni sperimentali. Vediamone le fasi, in un
caso semplice. Si individua innanzitutto un’ipotesi di ricerca: essendo uno studio

analitico, che prevede un’analisi statistica, occorre determinare prima dello studio
quale I e quale o quali O vogliamo controllare e per quanto tempo. Per testare
l’ipotesi che l’intervento I produce O, si sceglie un campione di numerosità ade-
guata dalla popolazione di riferimento: questo è un problema in parte statistico
(quanti soggetti), in parte vincolato da ciò che si sa sul tipo di intervento e sulla
popolazione (quali soggetti). In un RCT clinico, la popolazione è tipicamente quel-
la dei pazienti affetti dalla patologia al cui trattamento l’intervento è destinato, e
il campione è formato da volontari. Dal campione si selezionano gli arruolabili,
ovvero si eliminano i soggetti che hanno qualche caratteristica incompatibile con il
trattamento, per vari tipi di ragioni (tipicamente: i troppo anziani o troppo giovani,
quelli che hanno diverse patologie, quelli che già assumono un farmaco potenzial-
mente influente sull’outcome). Si effettua quindi una misurazione iniziale, cioè si
registrano le principali caratteristiche di entrata (baseline o basale) di tutti i soggetti
arruolabili, ad esempio genere, età, stato socioeconomico, fattori prognostici, se-
guendo le linee guida apposite3. A questo punto si assegna ciascun soggetto a un
gruppo, detto braccio, dello studio (ce ne possono essere più di due, ma procedia-
mo con due, qui, per semplicità) in modo casuale (random) e possibilmente in modo
che tutti, ricercatori compresi, siano ciechi (blind) rispetto a quali soggetti vengano
assegnati a quale braccio. A seconda del braccio a cui viene assegnato, ogni sog-
getto riceve l’intervento I, oppure una condizione di controllo non-I. In uno studio
clinico non-I è di solito l’intervento standard già in uso, più raramente un place-
bo, cioè una sostanza considerata innocua rispetto all’outcome, ma in generale la
condizione non-I può essere anche equivalente al non ricevere alcun intervento. A
questo punto i due bracci vengono seguiti per il tempo prestabilito e al termine si
compie l’osservazione finale: vengono misurati gli outcome per il braccio I e per il
braccio non-I. Di solito si utilizza non una misura di associazione, ma una misura
di efficacia, che è il rischio assoluto, che dice quanto l’incidenza dell’outcome di-
penda dall’intervento. Si calcola facendo la differenza tra il rischio dell’outcome nei
controlli e nei trattati.
La randomizzazione è la caratteristica strutturale rilevante di un RCT, che ne
determina le proprietà epistemiche, cioè quanto – nel nostro vocabolario filosofico
– possa costituire una buona ragione per credere nell’effetto di I su O e, come ab-
biamo già detto, contribuisce essenzialmente al posto alto che questo tipo di studi
ha nella gerarchia della qualità delle evidenze. In generale, la randomizzazione in
un RCT è infatti ritenuta la migliore difesa rispetto ai confondimenti4. Si tratta di
un’assegnazione casuale: ricevere l’intervento I oppure non-I non è deciso in base

alle caratteristiche dei soggetti né delle loro preferenze né di altre considerazioni

dello sperimentatore, ma è come il lancio di una moneta, che assegna casualmente
i valori testa o croce. Va ricordato che, per randomizzare i soggetti ai bracci di uno
studio (o gli animali rispetto a un intervento, o le cellule rispetto a un trattamento),
occorre un software (o almeno un sacchetto scuro con i numeri, come quelli della
Tombola), perché l’assegnazione umana non è mai del tutto casuale, bensì in qual-
che modo vincolata dalle caratteristiche del nostro sistema cognitivo.
Nella ricerca di base si può applicare la randomizzazione non solo per allocare
i soggetti (in questo ambito si parla però preferibilmente di unità sperimentali)
all’intervento oppure alla condizione non-I, ma anche ad esempio per misurarli
o per conservarli. In uno studio in vivo potremmo ad esempio ipotizzare che le
caratteristiche della gabbia in cui vivono i topi del nostro campione possano in-
terferire su quanto ci interessa monitorare – ad esempio perché la prima gabbia
è più esposta al freddo della seconda. Randomizzeremo quindi non solo la scelta
tra intervento o non intervento, ma anche la scelta quale gabbia ospiterà il topo
durante il periodo di osservazione. Analogamente, se possiamo sospettare che
qualcosa di sistematico nelle nostre bilance o microscopi possa alterare la misura-
zione, potremmo randomizzare le unità sperimentali anche rispetto a quale sarà
lo strumento con cui vengono misurati. Ovviamente dove i soggetti trascorrono
il tempo durante lo studio e come vengono misurati è rilevante anche negli studi
clinici con i volontari umani, tuttavia il problema di questi effetti è particolarmente
pressante negli studi sugli animali e negli studi di laboratorio, per varie ragioni che
dipendono dalla differenza biologica tra umani, piccoli animali e cellule rispetto
alle condizioni in cui vengono esaminati.
A questo punto dobbiamo affrontare la domanda teorica: perché randomizza-
re? In che modo questa procedura è in grado di minimizzare confondimenti e bias?
Vediamolo in dettaglio. Abbiamo già detto, analizzando gli studi descrittivi, che gli
esposti e i non esposti, o i casi e i controlli, dovrebbero idealmente differire solo per
I, e avere tutte le altre caratteristiche rilevanti coincidenti, altrimenti ci sarà sempre
un F associato ad I che modifica O: un confondimento appunto. Abbiamo visto
anche che in vari disegni sperimentali si cerca di eliminare i confondimenti tramite
procedure di matching, ad esempio assicurandosi che i soggetti F (con patologia a
un certo stadio, di più di 50 anni, topo di una certa cucciolata, o qualunque sia la
caratteristica) siano proporzionali nei due gruppi. Tuttavia, sappiamo anche che
non è possibile individuare in anticipo tutti i possibili confondimenti: ne conoscia-
mo alcuni se siamo esperti del problema, ma quelli che non conosciamo potrebbero

essere infiniti. Se però abbiamo una procedura che dà a ciascun F, noto o ignoto, la
probabilità del 50% di trovarsi in un gruppo o nell’altro, allora il problema è risol-
to. La randomizzazione è questa procedura. Può essere condotta anche dopo aver
suddiviso i soggetti in blocchi (piccoli gruppi eterogenei da 10 o 20 soggetti) o in
strati, cioè insiemi definiti da una caratteristica rilevante come possibile confondi-
mento, ad esempio gravità della patologia o età5.
Apriamo una parentesi prima di proseguire con le altre caratteristiche dell’RCT.
Qualche lettore particolarmente attento può aver notato un particolare inquietan-
te: se lanciamo una moneta, la probabilità che venga testa (o croce) è sì del 50%,
ma solo per una serie infinita di lanci. Non c’è niente di strano, dal punto di vista
matematico, se lancio una moneta e viene testa per sei lanci su sette - pensare che
sia strano fa perdere milioni ai giocatori d’azzardo. Dunque, anche in un RCT la
probabilità che i potenziali confondimenti si distribuiscano ordinatamente al 50%
nei due bracci dello studio si dà solo per infinite assegnazioni. Ma noi non avremo
mai infinite assegnazioni, cioè infiniti soggetti in un trial, quindi c’è la possibilità
che per caso si verifichi l’analogo di sei lanci testa su sette, qualche rara volta.
È un problema? Sì e no. Per i filosofi lo è nella misura in cui non possiamo più
dire che un RCT sia completamente al riparo dai confondimenti, e quindi che ab-
biamo una via puramente logica e metodologica alla validità interna. Questo in
parte intacca la superiorità assoluta degli RCT rispetto agli altri disegni sperimen-
tali6. Per i metodologi invece non lo è, perché possiamo sempre dire che la rando-
mizzazione metta al riparo dai confondimenti salvo rari casi: rari, per intenderci,
come quelli in cui apparentemente vinco sempre giocando testa. Quindi rimane
intatta la superiorità relativa rispetto agli altri disegni sperimentali. Torneremo su
queste valutazioni comparative parlando del paradigma EBM nel §4.6.
Occorre ora completare la caratterizzazione della struttura degli RCT con la
questione del blinding. Questa procedura serve a ridurre una serie di possibili
bias, che abbiamo già visto nel §3.3. Se lo sperimentatore sa quali soggetti sono
assegnati al braccio I, potrebbe riservare ad essi, inconsciamente, un’attenzione
particolare, quindi ad esempio favorendo alla fine un outcome positivo se questo
era nell’ipotesi (bias dello sperimentatore). Se il soggetto sa se sta ricevendo E
oppure il trattamento standard, un placebo o nessuno, può mettere in gioco azio-
ni o emozioni che alterano l’effetto di I su O (bias di aspettativa e di performan-
ce). Se chi analizza i dati sa se sta lavorando con il braccio I con non-I, potrebbe
avere aspettative che alterano il suo giudizio o rendono più probabili gli errori
sistematici a favore o a sfavore della significatività dell’effetto (nuovamente un

bias dello sperimentatore). Ci possono essere dunque vari livelli di blinding, tutti
opzionali e dipendenti dallo scopo e dalle condizioni dell’esperimento. Se un
RCT in triplo cieco è idealmente auspicabile, nella pratica spesso uno o più blin-
ding sono impossibili: ad esempio quando E è una procedura chirurgica e non-E
un trattamento farmacologico, ovviamente il soggetto non può non rendersi con-
to della differenza, e anche chi amministra il trattamento – ma in questo caso
almeno l’analisi potrà essere cieca. Come per i bias che abbiamo visto per gli studi
osservazionali, qui vale la considerazione che non tutti possono essere eliminati
strutturalmente, ma la struttura deve essere la migliore per eliminarli, e diversi
aggiustamenti statistici sono possibili post hoc.
Vediamo un esempio semplice, un piccolo studio pubblicato sul British Medical
Journal nel 20007.
Esempio
Obiettivo: determinare se l’uso di un inalatore orale di nicotina può risultare in
una riduzione a lungo termine del fumo e se l’uso concomitante di sostituitivi della
nicotina sia sicuro.
Disegno. Trial randomizzato, doppio cieco e controllato con placebo. Trial di 4 mesi
e follow-up di due anni.
Setting. Due reparti di malattie polmonari in ospedali universitari della Svizzera.
Partecipanti. 400 volontari sani, reclutati tramite annunci sui quotidiani, desiderosi
di ridurre il fumo ma non in grado o non disposti a smettere immediatamente.
Intervento. Inalatore attivo o con placebo, al bisogno fino a un massimo di 18 mesi,
con incoraggiamento ai partecipanti di smettere di fumare il più possibile.
Principali misure di outcome. Numero di sigarette fumate al giorno dalla sesta set-
timana al termine. Decremento misurato con il monossido di carbonio emesso a cia-
scun tempo confrontato con la misurazione di partenza.
Risultati. Dopo 4 mesi, una sostanziale riduzione del fumo è stata raggiunta da 52
(26%) partecipanti nel gruppo attivo e 18 (9%) nel gruppo placebo (p<0.001; test di
Fisher). Le cifre corrispondenti dopo due anni sono 19 (9,5%) e 6 (3,0%) (P=0,012).
Conclusione. I soggetti che hanno inalato nicotina hanno efficacemente e senza rischi
ridotto il fumo nell’arco di 24 mesi. La riduzione con o senza sostitutivo della nicoti-
na può essere un primo passo fattibile verso lo smettere di fumare per chi non riesce
o non vuole smettere di colpo.

In questo esempio, all’inizio del trial gli sperimentatori hanno effettuato un’os-
servazione iniziale che comportava la misurazione di tutti questi parametri: con-
centrazioni di monossido di carbonio nel respiro, frequenza del fumo, funzionalità
respiratoria, pressione sanguigna, polso, peso, variabili ematologiche, concentra-
zioni di lipidi nel sangue e fibrinogeni e qualità di vita. L’osservazione è stata ripe-
tuta a 4 mesi (la fine del trial), e a 12 e a 24 mesi (la fine del follow-up).
4.3 ALCUNI TIPI DI RCT

Il disegno base dell’RCT può essere variato cambiando il numero delle osserva-
zioni, la sequenza temporale degli interventi e il numero di bracci - oltre che, come
si è detto, gestendo diversamente la randomizzazione e il blinding. Vediamo qui
di seguito i disegni più usati, con l’avvertenza che ce ne sono altri e che il livello
di complessità si può aumentare mettendo insieme più tipi in modo appropriato8.
Come per gli studi osservativi nel Capitolo 3, ci soffermeremo su vantaggi e svan-
taggi epistemici, e in parte pratici, e su qualche specifico bias.
Pretest-posttest
È la struttura dell’esempio del trial sulla sigaretta elettronica che abbiamo appena
considerato. La dicitura pre-test post-test fa riferimento alle osservazioni: si effettua-
no sia prima che dopo la somministrazione dell’intervento. Ci sono alcuni aspetti
da considerare: l’osservazione preintervento, essendo una fase che richiede l’otte-
nimento e la registrazione di dati, può introdurre ulteriori bias di strumentazione e
bias di misura – oltre a quelli che potrebbero esserci nella misurazione degli esiti. C’è
poi da considerare il bias di interazione, che si verifica quando l’osservazione ini-
ziale interferisce sull’outcome. Facciamo un esempio semplice: se vogliamo testare
l’efficacia di un certo regime ipocalorico sul peso corporeo, pesare i soggetti prima
del trattamento potrebbe alterare sistematicamente i risultati: chi scopre di essere
sovrappeso più di quanto credesse può essere infatti più motivato a calare di peso,
indipendentemente dal trattamento. Si può valutare ragionando (abduttivamente)
quanto possa pesare questa interazione – tendenzialmente, potremmo dire, peserà di
più per interventi di natura psicosociale o soft, come una dieta o la somministrazione
di un integratore e meno per procedure chirurgiche o di emergenza9.
Solo post-test. In un RCT solo post-test l’osservazione preintervento non c’è: si
registrano le caratteristiche di baseline minimamente richieste (informazioni de-

mografiche e cliniche) dei soggetti arruolabili, ma non si sottopongono ad altri

test o misurazioni: qualsiasi differenza tra i bracci nell’osservazione post-test sarà
quindi imputata all’intervento. Questo tipo di disegno può essere scelto quando
l’osservazione pre-test non è possibile (come nel caso in cui vogliamo misurare l’ef-
fetto di un intervento chirurgico di emergenza, rispetto alla mortalità come outco-
me), oppure non ha senso (perché, una volta fissati i criteri di arruolabilità del
campione, possiamo supporre che i gruppi siano sufficientemente simili).
Fattoriale. In un disegno fattoriale si varia il numero degli interventi: viene va-
lutato l’effetto di due o più interventi sull’outcome, misurando opzionalmente loro
interazioni. Ad esempio, in uno studio su una popolazione di grandi anziani i par-
tecipanti vengono randomizzati a ricevere un farmaco per i dolori reumatici lievi
o il placebo (con riduzione del dolore come outcome), e anche randomizzati a un
trattamento comportamentale per migliorare le capacità cognitive o alle attività
normali. In questo modo abbiamo due livelli, ciascuno con due bracci, con una
struttura 2x2, ma possono esserci anche trial fattoriali 3x2. In un caso come que-
sto, l’idea è sostanzialmente quella di avere due RCT quasi al prezzo di uno – il
prezzo non è solo economico, ma anche ad esempio in termini di difficoltà di repe-
rire i volontari. Qui il trial fattoriale funziona come due trial paralleli, e i risultati
potrebbero anche essere pubblicati separatamente. Vediamo parte dell’abstract di
un RCT fattoriale per testare il beneficio di tre trattamenti per le lesioni gastriche
precancerose10.
Metodo. Quasi tutti gli adulti tra i 35 e i 64 anni di età residenti in 13 villaggi sele-
zionati in modo random tra quelli della contea di Linqu, nella provincia di Shandong
in Cina sono stati identificati e sottoposti a endoscopie al basale nel 1994. Nel 1995,
3365 soggetti ammissibili sono stati randomizzati in un disegno fattoriale a tre in-
terventi o al placebo amoxicillina e omeprazolo per 2 settimane nel 1995 (trattamento
per l’Helycobacter Pylori); vitamina C, vitamina E e selenio per 7,3 anni (integratore
di vitamine); e estratto di aglio secco e olio di aglio distillato per 7,3 anni (integratore
di aglio). I soggetti sono poi stati sottoposti a biopsie nel 1999 e 2003 e la prevalenza
di lesioni gastriche precancerose è stata determinata tramite esame istopatologico
di sette luoghi standard. I 3365 soggetti ammessi randomizzati rappresentavano il
93,5% di quelli con endoscopia al basale e comprendevano tutte le categorie istologi-
che tranne tumore gastrico. Solo lo 0,8% aveva una mucosa gastrica normale.
Lo studio concludeva confermando l’effetto del trattamento per l’H-pylori nel
ridurre la prevalenza delle lesioni gastriche precancerose, ma non quello degli

integratori vitaminici o all’aglio. Lo studio ha un disegno appropriato per gli

obiettivi, e la durata (più di 9 anni) è necessaria perché le lesioni gastriche pre-
cancerose si sviluppano lentamente. Tuttavia, proprio questo lungo follow-up è
di solito associato al rischio di alcuni bias tipici. Potrebbe essere utile controlla-
re un bias di compliance, che è l’aderenza al trattamento da parte del soggetto.
Specialmente quando un trattamento è così lungo, la compliance può essere molto
variabile; si ha un bias quando tra chi davvero segue le prescrizioni e chi no c’è
una differenza che può influire sull’outcome – ad esempio, essere in generale più
attenti alla salute e quindi mangiare più sano11. Sempre per la lunghezza dello
studio (nove anni!) potrebbe esserci un bias di verificazione, che si a quando lo
strumento diagnostico, o in generale il modo per misurare una certa grandezza,
varia nel tempo (ad esempio, l’accuratezza dell’endoscopia potrebbe essere va-
riata dal 1994 al 2003). Sempre connesso alla durata dell’esperimento è il bias di
maturazione: si ha quando l’evoluzione nel tempo della condizione dei soggetti
indipendentemente dall’intervento influisce sull’outcome. Ad esempio, potrem-
mo ipotizzare che negli anni gli abitanti dei vilaggi siano diventati più sensibili
ai benefici di una dieta moderata.
Altre volte, diversamente dal’esempio appena considerato, il disegno fattoria-
le viene scelto per misurare l’interazione degli interventi l’uno sull’altro. Gli RCT
fattoriali di questo tipo sono molto usati nella ricerca di base. Leggiamo un passo
dall’Introduzione di uno studio pubblicato nel 2014 su Biotechnology and Bioengine-
ering (i riferimenti bibiografici nel testo sono stati eliminati per facilitare la lettura,
ma si possono controllare nell’originale)12.
C’è evidenza crescente del fatto che le cellule stromali, in particolare le cellule stro-
mali mesenchimali (MSC), controllano selettivamente lo sviluppo di diversi fenotipi
di cellule immunitarie negli organi linfoidi, sia primari che secondari. Ad esempio,
le MSC impediscono la differenziazione cellulare e la secrezione di citochine proin-
fiammatorie. Inoltre, è stato mostrato in vivo che le MSC possono regolare le funzioni
regolatorie dei macrofagi. Dunque, comprendere le interazioni tra MSC e macrofagi
può fornire nuove prospettive sulle interazioni cellulari e molecolari che governano gli
eventi di riprogrammazione dei macrofagi. Diversi studi in vitro hanno dimostrato
la differenziazione dei monociti al fenotipo M2 quando si trovano in co-coltura con le
MSC. Mentre lo stadio M1 è un componente normale della riparazione, molte delle
patologie dei macrofagi osservate si manifestano nella transizione inappropriata da
M1 a M2. Il controllo intracellulare delle MSC è regolato in gran parte da un numero

molto rilevante di prodotti di secrezione, che possono agire sia individualmente che in
sinergia. Dunque, dato il numero enorme di potenziali variabili sperimentali, l’analisi
della transizione dei macrofagi da M1 a M2 mediata dalle MSC è stata razionalizzata
in uno studio fattoriale frazionario per identificare gli effetti dei fattori singoli o com-
binati. Le colture di macrofagi sono state esposte a 13 dei più rilevanti fattori immu-
nomodulatori delle MSC ai loro livelli di secrezione biologica. Mentre per esplorare
ciascuno di questi fattori e le loro combinazioni richiederebbe 8192 pozzetti per ogni
singola replica biologica, il frazionamento di 1/64 del disegno sperimentale fattoriale è
in grado di ridurre il disegno a soli 128 pozzetti senza perdere nessuna informazione
relativa agli effetti dei fattori singoli e delle loro combinazioni a due.
L’estratto da questo studio di ricerca di base è utile a mostrare le potenzialità
del disegno fattoriale. Quando la domanda di ricerca è sia sugli effetti di vari fattori
che sulle loro interazioni, le ipotesi da testare aumentano in maniera combinato-
ria e con queste, per ragioni statistiche, aumenta la numerosità del campione che
ci occorre. Lo studio fattoriale è in grado di ovviare a questo problema. Nel caso
specifico è anche frazionario, cioè non tutte le combinazioni possibili di fattori e
combinazioni vengono analizzate.
Crossover. Mentre in tutti i disegni sperimentali che abbiamo considerato finora
gli interventi vengono effettuati in parallelo, in un RCT crossover si varia la struttura
temporale: gli interventi vengono somministrati in sequenza allo stesso soggetto.
Una struttura semplice è quella in cui i partecipanti sono randomizzati inizialmen-
te all’intervento E o all’intervento I e poi “passano dall’altra parte” (cross-over), cioè
ricevono la E se avevano provato I e I se avevano ricevuto E. Prima del passaggio
è necessario un periodo di wash-out, che serve a smaltire gli effetti del primo tratta-
mento. Il vantaggio immediato di questo tipo di studio è che ogni partecipante di-
venta il proprio controllo, eliminando quindi i il problema della variabilità biologi-
ca del campione (che non è un bias, non essendo un errore sistematico, ma casuale).
Ne segue anche che numero di soggetti da reclutare sarà relativamente più piccolo
rispetto ad altri disegni. Nel caso di una terapia diretta agli umani, il partecipante
potrà anche al termine esprimere preferenze sui trattamenti che ha ricevuto, dato
che li prova tutti. In ambiti di ricerca come la neurologia e la psichiatria gli RCT a
disegno crossover sono molto utilizzati, proprio per queste ragioni.
Come esempio leggiamo l’abstract di uno studio sull’effetto di una molecola
usata comunemente per il trattamento dei disturbi depressivi sulle cosiddette vam-
pate della menopausa, pubblicato su Menopause nel 200613:

Obiettivo. Valutare l’efficacia di un inibitore selettivo dei ricaptatori della serotonina

(SSRI) nel diminuire le vampate in una popolazione generale di donne.
Disegno. Trial doppio cieco, controllato con placebo, di tipo crossover, condotto in
un setting urbano negli Stati Uniti sud-occidentali. Sono state reclutate in tutto
102 donne tra i 40 e i 65 anni di con vampate e non in terapia ormonale. Dopo una
settimana di raccolta di dati di baseline sulle vampate, le partecipanti sono state
randomizzate a ricevere un placebo oppure il farmaco attivo (sertralina 50 mg) per 4
settimane. Questo intervento è stato seguito da un washout di 1 settimana e poi dal
passaggio al trattamento opposto per altre 4 settimane. Il numero e la gravità delle
vampate sono stati misurati.
Risultati. 102 donne sono state arruolate nello studio. Cinque hanno abbandonato
prima di fornire i dati di baseline. Delle 97 rimanenti, 52 sono state randomizzate
al farmaco attivo prima e 45 al placebo prima. Dieci hanno abbandonato lo studio
prima di completare le 10 settimane, lasciando 46 nel braccio con il farmaco prima e
41 nel braccio con il placebo prima. Al basale, il numero medio di vampate riportato
era di 45,6 per settimana, con un range di 2 a 148. Durante la fase dello studio con
la sertralina, le volontarie hanno avuto una riduzione di un quinto delle vampate
(p=0,002). La gravità delle vampate non è stata significativamente differente, ma
il punteggio complessivo (numero x gravità media) è migliorato significativamente
durante la fase con la sertralina.
Conclusione. La sertralina rispetto al placebo ha ridotto il numero e migliorato il

punteggio delle vampate e potrebbe essere un trattamento alternativo accettabile per
le donne che presentano questa condizione.
Quando non si può usare un disegno crossover, o quali sono le circostanze
che rendono uno studio di questo tipo irrimediabilmente biased? In tutti i casi in
cui possiamo ipotizzare che la seconda sequenza di trattamenti non troverebbe il
soggetto nella stessa condizione del primo: quando la condizione non è cronica,
ma degenerativa o ciclica, oppure quando il wash-out non sarebbe sufficiente a
eliminare gli effetti della prima sequenza di trattamento. Se ci interessa invece
proprio studiare l’effetto dell’ordine in cui i trattamenti vengono somministrati
(tipicamente quando si tratta di due o più molecole o interventi “veri”, senza
placebo) occorre adottare un disegno apposito, il quadrato latino, che qui ci limi-
tiamo a menzionare.

In sintesi, i diversi tipi di disegno sperimentale che variano sul modello del
RCT sono adatti a diverse domande di ricerca e anche in parte a diverse condizioni
pratiche, come la disponibilità dei soggetti. La scelta dell’uno o dell’altro dipende
anche dalla previsione dei possibili confondimenti e bias che possono interessare
lo studio della relazione tra interventi ed esiti. Come abbiamo ricordato, non c’è un
procedimento algoritmico per prevedere quali possano essere: ci si basa sugli studi
precedenti, sulla propria conoscenza della biologia del sistema e, per abduzione, si
procede alla scelta dei modi per minimizzarli.
4.4 STUDI QUASI SPERIMENTALI E PRE-SPERIMENTALI

Nella nostra rassegna di tipologie di studi occorre menzionare i disegni pre-spe-
rimentali e quasi-sperimentali, che sono utilizzati, come gli RCT, per testare l’effi-
cacia di un intervento (e quindi idealmente di arrivare a stabilire la causa di un
fenomeno) e si possono scegliere nei casi in cui, per ragioni etiche o pratiche, non
si può randomizzare rispetto all’intervento oppure è anche impossibile avere un
gruppo di controllo14. Generalmente si intende con pre-sperimentale uno studio
in cui viene somministrato un intervento in un campione si soggetti, ma manca il
gruppo di controllo (e quindi a fortiori anche la randomizzazione rispetto all’inter-
vento): l’effetto dell’intervento si può confrontare con l’osservazione iniziale (se è
uno studio pretest post-test) oppure solo misurare alla fine rispetto all’outcome (solo
post-test). Uno studio quasi-sperimentale invece include il gruppo di controllo o di
confronto, ma non avviene la randomizzazione rispetto all’intervento. Uno studio
quasi- sperimentale ha invece il gruppo di controllo, ma non la randomizzazione.
Si tratta di disegni relativamente semplici e in generale poco validi per testare
un’ipotesi causale di efficacia. Ci sono ad esempio i bias di maturazione (gli ef-
fetti sull’outcome dati dal progredire della condizione del soggetto, indipendenti
dall’intervento) e i bias di report (la tendenza sistematica a riportare solo i casi in
cui l’effetto è significativo). Ci sono poi i confondimenti, cioè gli effetti sull’outco-
me di una variabile associata all’intervento, ma che non viene controllata tramite
randomizzazione o matching.
Ci sono tuttavia della ricerca biomedica in cui di fatto questi studi sono molto
frequenti, come la chirurgia dei trapianti o l’infettivologia. Supponiamo di voler
testare l’efficacia di una profilassi antibiotica per un’infezione nosocomiale (cioè

che si sviluppa e si propaga in un ospedale) improvvisa e grave: non potremo

avere un gruppo di controllo, perché oltre all’ipotesi da testare c’è l’urgenza clinica
di risolvere il problema di quell’infezione in quei ricoverati, e non somministrare
l’antibiotico ad alcuni si loro per avere un gruppo di controllo sarebbe non etico
(ragioni etiche e ragioni per agire, che abbiamo introdotto nel §3.5). Oppure im-
maginiamo di voler provare l’effetto dell’uso di un disinfettante a base di alcol per
le mani sulla diffusione dell’infezione da enterococco vancomicina-resistente. In
questo caso può essere difficile randomizzare l’intervento rispetto ai pazienti sin-
goli perché uno stesso operatore sanitario, disinfettato o meno, si occupa di solito
di tutta una camerata o di tutto un corridoio. Randomizzare rispetto alle camere
potrebbe introdurre altri problemi dati dalle diverse caratteristiche che queste po-
trebbero avere, soprattutto se si tratta di studi multicentrici in cui ci sono soggetti
in diverse località geografiche15. Un inciso: vi ricorda qualcosa tutto questo? Il caso
di Ignaz Semmelweis che abbiamo visto nel §2.7: per testare le varie ipotesi sul-
le cause della febbre puerperale e sulla differenza di mortalità nelle due cliniche
ostetriche dell’ospedale di Vienna, e dovessimo implementare uno studio oggi ci
porremmo problemi di questo tipo.
In alcuni contesti particolari, come la pandemia da Covid-19 scoppiata nel
marzo del 2020, capita che studi pre-sperimentali o quasi-sperimentali vengano
condotti e pubblicati perché l’urgenza di avere dati su un certo fenomeno viene
valutata più della qualità dell’evidenza fornita – sono casi in cui le ragioni pratiche
pesano più di quelle epistemiche. Leggiamo qui parte dell’abstract di uno studio
pubblicato appunto nel 2020 su The Journal of steroid biochemistry and molecular bio-
logy16.
La vitamina D potrebbe essere una determinante biologica centrale per gli esiti
del Covid-19. L’obiettivo di questo studio quasi-sperimentale era stabilire l’effica-
cia dell’assunzione in bolo di vitamina D3 durante o appena prima l’infezione da
Covid-19 sul miglioramento della sopravvivenza tra anziani fragili con Covid-19 in
una residenza sanitaria assistita. Lo studio ha coinvolto 66 residenti di una struttu-
ra francese. I soggetti che avevano assunto vitamina D3 in bolo durante il Covid-19
o nel mese precedente erano il gruppo di intervento, mentre tutti gli altri residenti
costituivano il gruppo di controllo. Gli esiti primari e secondari sono stati la mor-
talità per Covid-19 e la Scala ordinale per il miglioramento clinico (OSCI) per la
fase acuta. Età, genere, farmaci giornalieri, abilità funzionali, uso di corticosteroidi,
idrossiclorochina e antibiotici sono stati considerati come possibili confondimenti
[…]. In conclusione, il supplemento di vitamina D3 in bolo subito prima o durante

il Covid-19 è risultata associata negli anziani fragili a un miglior tasso di sopravvi-

venza e a forme di Covid-19 meno gravi.
Come abbiamo già notato parlando degli studi osservazionali con più problemi
di validità interna nel Capitolo 3, l’atteggiamento epistemicamente corretto verso
gli studi quasi e pre-sperimentali non è evitarli o non considerarli, ma conoscerne i
limiti rispetto alla qualità dell’evidenza che sono in grado di fornire, che comunque
è in parte da bilanciare con l’esigenza di avere evidenza tout-court.
4.5 TRIAL FARMACOLOGICI

Occorre completare la nostra panoramica sugli studi sperimentali nelle disci-
pline biomediche con i trial farmacologici, detti spesso semplicemente trial clinici
(clinical trial): comprendono tutte le fasi necessarie a testare gli effetti di una nuova
molecola per la cura delle persone. Si tratta di grandi studi che durano diversi anni
e sono sponsorizzati dalle case farmaceutiche, che appoggiano sia finanziariamen-
te che con contributi metodologici le università, gli ospedali e i centri di ricerca che
ospitano le sperimentazioni. Le fasi dei trial farmacologici sono riconosciute da
tutte le istituzioni che si occupano della sicurezza dei farmaci, come la Federal Drug
Administration (FDA) negli Stati Uniti. La European Medicine Agency (EMA) per l’U-
nione europea e l’Agenzia italiana del farmaco (AIFA)17.
La sperimentazione preclinica comprende inizialmente studi in vitro (in pro-
vetta) o anche in silico (con modellizzazioni al computer) in cui la molecola viene
messa a contatto con colture cellulari o microrganismi. Lo scopo è identificare i
meccanismi con cui agisce, come viene assorbita e assimilata. Se i risultati di questi
test mostrano quello che si può interpretare come un potenziale effetto terapeutico,
si procede alla sperimentazione in vivo, cioè su modelli animali di malattie umane.
Gli studi su questi modelli hanno l’obiettivo di testare l’efficacia della molecola ri-
spetto a outcome specifici: ad esempio si verifica su un modello murino (realizzato
nei topi) che l’acido retinoico riduce la crescita delle cellule tumorali. Dai modelli
animali si estraggono anche dati di farmacocinetica, ovvero sull’assorbimento, di-
stribuzione nei tessuti, metabolismo ed escrezione della molecola.
La sperimentazione clinica inizia con la fase 1, che ha l’obiettivo di testare l’i-
potesi che il nuovo farmaco sia sicuro e tollerabile per gli esseri umani. La sicu-
rezza si riferisce al rischio di produrre esiti avversi (come insufficienza renale o

morte), misurabili con parametri di laboratorio, e la tollerabilità è il grado in cui i

pazienti sopportano il farmaco (che può dare disagi come sensazioni di nausea o
affaticamento)18. La fase 1 comprende studi non controllati in cui il farmaco viene
somministrato (spesso in una sola dose o in dose ridotta) a un piccolo campione
di volontari – a volte si tratta di pazienti ricoverati che possono beneficiare del
trattamento perché si trovano in uno stato di malattia in cui le cure standard non
hanno funzionato.
La fase 2 ha l’obiettivo di testare l’efficacia del farmaco e di stabilirne le dosi
ottimali. Consiste di studi controllati su volontari, soggetti che soffrono della con-
dizione che il farmaco dovrebbe curare. Vengono divisi in diversi gruppi e cui
viene somministrato il farmaco a diverse dosi, possibilmente, quando è eticamente
permesso, a confronto con il placebo, oppure con il trattamento standard. L’asse-
gnazione è blind per i volontari e, a volte, anche per gli sperimentatori.
La fase 3 è quella dell’RCT che arruola migliaia di volontari. Viene testata l’effi-
cacia (efficacy o anche effectiveness, vedremo la differenza nel §4.9) del nuovo farma-
co rispetto allo standard di cura (il trial può essere di superiorità, cioè per testare
se è migliore, o anche di non inferiorità). In fase 3 troviamo tutte le caratteristiche
del disegno degli RCT: randomizzazione, diversi livelli di blinding e attenzione ai
bias. A questo punto, se i risultati sono quelli attesi, il farmaco ottiene l’autorizza-
zione ad essere messo in commercio. Seguono di solito trial di fase 4 per rilevare
l’efficacia in contesti più simili a quelli di cura ordinaria, e studi di farmacovigilan-
za per rilevare i possibili effetti collaterali che non erano stati riscontrati nelle fasi
precedenti.
La metodologia dei trial clinici è regolamentata e attentamente monitorata nelle
sue varie fasi, data l’alta posta in gioco in termini etici ed economici. Dal punto
di vista della filosofia dell’evidenza (la nostra domanda su quanto buone siano
le ragioni per una certa conclusione) ci sono almeno due punti che occorre breve-
mente ricordare. Il primo è facilmente immaginabile: l’esistenza di bias derivanti
dalla presenza di uno sponsor della ricerca. I bias di sponsorizzazione vengono da
comportamenti, volontari o meno, che favoriscono lo sponsor, cioè l’ipotesi che il
farmaco sia sicuro, tollerabile ed efficace. Possono influire su varie fasi del trial e
includono, ad esempio, la scelta di campioni poco rappresentativi della popola-
zione di destinazione, la somministrazione del farmaco di controllo in dosaggio
inadeguato, la scelta di un’analisi statistica dei dati orientate a privilegiare un certo
esito, la mancata pubblicazione degli outcome non raggiunti o, simmetricamente,
la pubblicazione dei soli risultati positivi. I bias di sponsorizzazione non sono solo

un problema per la validità di un trial farmacologico, sia interna che esterna, ma

rappresentano anche un problema etico, dato che si tratta della sicurezza e della
salute delle persone19. Inoltre, hanno l’effetto di creare in una parte dell’opinione
pubblica la visione che le cosiddette Big Pharma, le grandi industrie farmaceutiche,
corrompano tutta la ricerca biomedica. Questo effetto di sfiducia verso la medicina
è non solo culturalmente rilevante, ma ha anche effetto sulla salute e sulla sicu-
rezza dei cittadini. Lo mostrano i casi di esitazione vaccinale e i casi di rifiuto a
ricevere trattamenti salvavita20. Le soluzioni per ridurre i bias da sponsor sono da
cercare, oltre che nella responsabilità etica individuale, in regolamenti sempre più
stringenti e anche nella progettazione di nuove forme di finanziamento non diretto
della ricerca da parte dell’industria.
Un secondo punto interessante dal punto di vista della filosofia dell’evidenza
dei trial clinici riguarda le ricerche sulla sicurezza e sugli effetti avversi. Abbiamo
visto che si tratta, in fase 1, di trial non controllati su piccoli gruppi, mentre per
quanto riguarda gli esiti avversi molta dell’evidenza deriva da serie di casi e da casi
singoli riportati dopo che il farmaco è già in commercio. (La triste vicenda del Tali-
domide, ricordata nel §3.8, ha avuto almeno l’esito positivo di iniziare questo tipo
di monitoraggio). Studi di fase 1 e report di esiti avversi forniscono evidenza di
tipo diverso, cioè che non può essere “messa insieme” (termine tecnico: amalgama-
ta) quantitativamente per ottenere dati, ad esempio con una meta-analisi, ma che in
questo caso sarebbe opportuno mettere insieme, indipendentemente dal fatto che
i case studies hanno minore validità interna. Alcuni filosofi e metodologi lavorano
quindi a modi per amalgamare l’evidenza negli studi di sicurezza farmacologica21.
4.6 RCT COME GOLD STANDARD

Torniamo ora al disegno degli RCT per soffermarci sulla tesi secondo cui un RCT
fornisce la migliore qualità di evidenza: con un RCT abbiamo migliori ragioni per
ritenere che l’ipotesi testata sia corretta22, rispetto ad altri studi che testano la stessa
ipotesi. In altre parole, gli RCT sono il gold standard, il termine di paragone ideale con
cui confrontare gli altri studi. Quella di gold standard è una nozione normativa molto
usata nella metodologia della ricerca biomedica: esprime una valutazione positiva su
una procedura (un disegno di studio, un trattamento, un tipo di test diagnostico) e le
assegna il ruolo di campione per misurare le altre che hanno le stesse finalità.

Abbiamo visto che la principale ragione per ritenere che gli RCT siano il gold
standard per la conferma di un’ipotesi è di tipo logico: la procedura di randomizza-
zione permette di minimizzare i confondimenti, distribuendo in modo idealmen-
te uniforme le caratteristiche dei soggetti nel gruppo di intervento e in quello di
controllo – idealmente come è ideale che la probabilità dei risultati Testa e Croce
lanciando una moneta sia la stessa. La seconda ragione è metodologica e pratica:
con il blinding un RCT si mette al riparo da diversi bias, gli errori sistematici che
potrebbero venire da aspettative, desideri e intenzioni che a livello non cosciente
potrebbero modificare il comportamento dei ricercatori e dei soggetti23.
Ci sono molti esempi che mostrano come i risultati di precedenti studi osserva-
zionali siano stati smentiti da successivi RCT, di solito nel senso che effetti notevoli
rilevati dagli studi osservazionali vengono sgonfiati nei successivi trial randomiz-
zati. Vediamone due, tratti da un editoriale pubblicato sul British Medical Journal
che sostiene observational studies propose, RCT dispose (gli studi osservazionali pro-
pongono, gli RCT dispongono)24. Il primo riguarda gli effetti della terapia ormona-
le sostituitiva per le donne in menopausa. Nel 1991 viene condotta una meta-ana-
lisi (una selezione degli studi pubblicati, con aggregazione statistica dei risultati)
di studi epidemiologici, da cui risulta che la terapia ormonale sostitutiva dimezza
il rischio relativo di malattia cardiovascolare. Il primo grande trial randomizzato
terminato nel 2002, tuttavia, non rileva nessun effetto, e trial successivi mostrano
una riduzione molto piccola in termini di odds ratio (0.96 del gruppo di intervento
contro 1.30 del controllo)25. Anche per il beneficio del betacarotene sull’incidenza
di tumore al polmone le cose non vanno diversamente. Nel 1990 una review con-
clude che assumere integratori di questa molecola ha un effetto protettivo, ma nel
1994 un grande trial randomizzato pubblicato sul New England Journal of Medicine
mostra addirittura il contrario: un aumento del 18% di rischio relativo di tumore ai
polmoni tra i consumatori di integratori26.
Un caso più recente e controverso è quello dell’Idrossiclorochina come tratta-
mento per i pazienti ricoverati con sindrome respiratoria acuta da Covid-19. Si
tratta di un vecchio farmaco in uso per la cura della malaria, dei reumatismi, delle
infiammazioni articolari e del lupus (una malattia autoimmune). All’inizio della
pandemia, nel marzo 2020, vengono pubblicati alcuni studi di serie di casi che mo-
strano un miglioramento di prognosi nei pazienti ricoverati con sindrome respira-
toria acuta da Covid-19 trattati con idrossiclorochina. Ci sono anche evidenze dalla
ricerca di base di come la molecola possa limitare l’entrata del virus nella cellula
umana, e anche ridurre le citochine prodotte durante lo sviluppo della sindrome

respiratoria acuta. L’idrossiclorochina viene dunque velocemente inserita nelle li-

nee guida per il trattamento della patologia senza aspettare ulteriore evidenza,
perché c’è chi sostiene che le condizioni di emergenza non consentano di aspettare
altri risultati. Il caso diventa controverso perché nel discorso pubblico sui media
prende connotazioni politiche, dopo che il presidente degli Stati Uniti in carica,
Donald Trump, si esprime a favore di questo trattamento. Intanto viene organizza-
to un RCT multicentrico chiamato ORCHID (Outcomes Related to COVID-19 Treated
with Hydroxychloroquine among In-patients with Symptomatic Disease): lo studio è a
doppio cieco, coinvolge 34 ospedali negli Stati Uniti, 1041 pazienti ammissibili,
242 randomizzati al braccio attivo e 237 al placebo, e dura da aprile a giugno. I
risultati, pubblicati in dicembre 2020 sul JAMA, mostrano che l’idrossiclorochina
non ha un effetto di miglioramento nelle condizioni cliniche dopo due settimane di
trattamento. Analogamente, altro RCT inglese conclude che la mortalità a 28 giorni
non è minore con l’idrossiclorochina27.
Ma se i risultati degli studi osservazionali e delle loro meta-analisi, oppure degli
studi clinici e di laboratorio, non corrispondono a quelli degli RCT, perché do-
vremmo fidarci degli RCT? Perché non il contrario? È la domanda del tutto sensata
che si pone Jeremy Howick, filosofo canadese autore di The Philosophy of Eviden-
ce-Based-Medicine. La risposta è in quanto detto all’inizio di questa sezione, cioè
che sappiamo a priori, ovvero per ragioni logiche, che l’RCT minimizza i confon-
dimenti con la randomizzazione ed evita più bias tramite il blinding: queste sono
appunto le ragioni per cui dobbiamo ragionevolmente concludere che costituisce
una migliore evidenza, nei casi di risultati discordanti28.
Resta un’obiezione da considerare: e se gli RCT sono fatti male? Restano co-
munque superiori all’evidenza fornita da uno studio osservazionale sullo stesso
quesito? “Fatti male” è un’espressione colloquiale per tutta una serie di difetti di
disegno ed errori di vario tipo, sistematici e non, che possono rimanere anche dopo
che lo studio è stato sottoposto a revisione e pubblicato. Ad esempio, il blinding
doppio e triplo potrebbe essere indicato nella metodologia dello studio, ma non
rispettato nella pratica. Un altro tipo di difetto epistemico – che riguarda più l’ap-
plicabilità rispetto alla validità interna – è una potenza statistica troppo bassa, cioè
una capacità insufficiente di rilevare un effetto tra le variabili, talvolta dovuta a un
campione troppo piccolo.
Esistono review e meta-analisi di questi problemi di fatto, non di principio, di cui
i trial possono soffrire. Questi studi mettono in luce il problema della qualità della
ricerca, che è diverso da quello della qualità dell’evidenza. Quando parliamo di

qualità dell’evidenza ci chiediamo che tipo di ragioni un certo disegno sperimen-

tale possa offrire rispetto a un’ipotesi, mentre quando parliamo di qualità della ri-
cerca conta la misura in cui le procedure standardizzate e le regole per quel tipo di
studio sono state seguite, o non seguite, in modo preciso e accurato dai ricercatori.
Questo può avvenire per fretta di pubblicare, disattenzione, intenzione disonesta,
ma per condizioni inadeguate del laboratorio o del setting, nonché per ignoranza
delle regole stesse.
Se gli RCT sono fatti male, dunque, la tesi a priori secondo cui costituiscono il gold
standard per la conferma di un’ipotesi è smentita a posteriori. Facciamo un esempio
semplice per capire questo punto. A priori, considerandone le caratteristiche, posso
dire che un treno ad alta velocità è un mezzo migliore rispetto a un treno regionale
per arrivare in meno di due ore a 200 km da qui: da orario il primo ci mette un’ora
esatta, e il secondo 1 ora e 59 minuti. Posso però rivedere il giudizio se mi informano
che il treno alta velocità che sto per prendere è guasto: viaggerà a velocità ridotta e
potrebbe essere più lento regionale del binario accanto, che a sua volta è in perfette
condizioni, e garantisce puntualità alla stazione di arrivo, sia pure in 1 ora e 59. Que-
sta, in sintesi, è la filosofia delle linee guida CEBM e GRADE, realizzate a partire dal
2000 circa per rendere più precisa la gerarchia dell’evidenza inizialmente proposta
dal movimento EBM. Vediamo nella prossima sezione di che cosa si tratta.
4.7 EBM: GERARCHIA DELL’EVIDENZA PER LE DOMANDE CLINICHE

Finora ci siamo occupati di metodo scientifico nella ricerca biomedica, e le do-
mande che ci hanno guidato sono state, prendendo in rassegna gli studi osserva-
zionali e sperimentali: in che misura e come questo disegno sperimentale fornisce
evidenza rispetto a una certa ipotesi? Quale disegno sperimentale costituisce la
migliore evidenza per una certa ipotesi? Abbiamo cioè considerato i tipi di studi
in relazione al problema della conferma o ideazione di ipotesi. In una gerarchia
dell’evidenza sulla conferma, abbiamo collocato gli RCT al posto più alto, e gli
studi osservazionali prospettici subito dopo. In parte abbiamo anche trattato la
questione della scelta del disegno sperimentale in base a questioni pratiche come il
tempo, i dati disponibili e in generale la fattibilità.
Qui invece spostiamo l’attenzione su una questione differente, ovvero l’applica-
zione della ricerca biomedica alla decisione clinica. La decisione clinica riguarda il

trattamento di un paziente (o generalmente di una persona, non necessariamente

ammalata, o anche di una comunità) e comprende la diagnosi (i test) e tutti i tipi
di interventi, sia curativi che preventivi. La domanda in questo caso è: in che mi-
sura e come questo disegno sperimentale fornisce evidenza per rispondere a una
domanda clinica? Ovvero: qual è la gerarchia dell’evidenza che un clinico deve
considerare per rispondere a un quesito di diagnosi o trattamento su un paziente?
Una domanda clinica ha di solito la forma di una valutazione dell’efficacia di un
trattamento o dell’accuratezza di un test, che il medico o l’infermiere si pone da-
vanti a un caso specifico. Esempi di domande cliniche sono: per questa paziente
con la condizione X, scelgo il trattamento Y oppure Z per aumentare l’aspettativa di
vita? Scelgo la terapia T o quella R per diminuire la percezione del dolore? Eseguo
il test P o il test Q per controllare l’evoluzione della malattia? Uso la tecnica N o la
tecnica M per operarla?) Che le due gerarchie di evidenza – quella per la conferma
di un’ipotesi e quella per la risposta a una domanda clinica – non siano identiche
si può capire considerando la ricerca di base: uno studio sperimentale con le ran-
domizzazioni e i controlli appropriati può fornire la migliore evidenza possibile
all’ipotesi di funzionamento di un certo meccanismo, senza per questo porsi il pro-
blema di rispondere a una domanda sull’efficacia di un trattamento.
L’idea di una gerarchia dell’evidenza per le domande cliniche è alla base
del’EBM, un movimento di riforma metodologica della medicina iniziato attorno
al 199029. Vediamo prima di che cosa si tratta, per poi passare alla gerarchia dell’e-
videnza. Come ci ricorda Howick, il filosofo che più se ne è occupato criticamente,
l’EBM si presenta esplicitamente come un nuovo paradigma nel senso di Kuhn
che abbiamo citato nel Capitolo 1, con l’idea di ridefinire le regole per le decisioni
cliniche. Non è solo una metodologia, ma una filosofia della metodologia, perché
include principi generali. La prima versione delle nuove regole è questa, che qui
citiamo da un articolo del 1996:
La EBM dequalifica l’intuizione, l’esperienza clinica non sistematica e il razionale
fisiopatologico come base sufficiente per la decisione clinica e sottolinea l’importanza
della valutazione dell’evidenza tratta dalla ricerca clinica.
La parte positiva è la qualificazione dell’evidenza tratta dalla ricerca clinica: con
questa, nei primi documenti dell’EBM, si intendono principalmente gli RCT, come
ricerca primaria, e le loro meta-analisi come ricerca secondaria: è la tesi degli RCT
come gold standard. Leggiamo ad esempio:

È nostro dovere nei confronti dei pazienti minimizzare l’applicazione di terapie inu-
tile e dannose basando i nostri interventi, ogni volta che è possible, sui risultati di
RCT appropriati30.
Vedremo tra poco che la tesi del gold standard è stata in parte rimodulata. La par-
te negativa della prima regola dell’EBM invece dequalifica alcuni tipi di evidenza,
ed è rimasta invariata nel tempo. Consideriamone le componenti.
L’intuizione e l’esperienza non sistematica sono le competenze del singolo clini-
co, maturate con l’esperienza e lo studio, assieme a quella capacità di dare giudizi
veloci che varia da soggetto a soggetto e che è tipica di chiunque svolga da tempo
una certa professione, e sia quindi esperto. Il razionale fisiopatologico è il mecca-
nismo in base al quale un trattamento o un test funzionano: spiega “come”, non
dimostra “che”. La regola storica dell’EMB ci dice che queste due componenti non
bastano: deve documentarsi su quanto sia stato pubblicato recentemente e agire su
questa base.
La prima regola storica dell’EBM non deve sembrarci ovvia. Oggi ci sono data-
base degli articoli pubblicati e soprattutto linee guida e protocolli continuamente
aggiornati, che digeriscono la mole di ricerca pubblicata e la adattano alle questioni
cliniche, ma questo non era ovvio quando l’EBM ha iniziato la sua storia. La clini-
ca non era scientifica, anche se la ricerca medica lo era da molto tempo. Che non
sia ovvia lo mostra anche la mole di discussioni che ha suscitato e ancora suscita,
in parte, nella comunità medica, a fronte del suo indubbio successo come pratica
metodologica.
Un’immediata critica che è stata rivolta alle prime formulazioni dell’EBM ri-
guarda il ruolo della clinical expertise come base di conoscenza e decisione. Ma
quindi essere un medico o infermiere esperto e intuitivo non serve a nulla, nel
paradigma EBM? La medicina non è forse un’arte di cura? Un secondo aspetto pro-
blematico è il ruolo del paziente, che nella prima formulazione dell’EBM è ridotto
a caso di applicazione di una conoscenza generale, quindi privato delle sue carat-
teristiche individuali. A fronte delle istanze di chi ha sottolineato l’importanza del
giudizio clinico e della singolarità della situazione del paziente, la regola dell’EBM
si è modificata nei decenni, e l’ultima versione è questa31:
l’EBM richiede l’integrazione della migliore evidenza scientifica con la nostra com-
petenza professionale [clinical expertise] e con i valori e le circostanze unici del no-
stro paziente. Con migliore evidenza scientifica intendiamo quella che proviene dalle
scienze mediche di base, ma specialmente dalla ricerca clinica orientata al paziente

sull’accuratezza e precisione dei test diagnostici (esame clinico incluso), sul potere
dei marker prognostici e sull’efficacia e sicurezza delle strategie terapeutiche, riabi-
litative e preventive. Con competenza professionale intendiamo la capacità di utiliz-
zare le nostre capacità cliniche e l’esperienza del passato per identificare rapidamente
lo stato di salute specifico di ciascun paziente e la sua diagnosi, e i rischi e i benefici
individuali di possibili trattamenti/esposizioni/test diagnostici rispetto ai suoi valori
e aspettative. Inoltre, la competenza professionale è necessaria per integrare l’evi-
denza con i valori e le circostanze del paziente. Con valori del paziente intendiamo
le preferenze, preoccupazioni e aspettative individuali che ogni paziente porta con
sé nell’incontro clinico e che, per servire ai suoi scopi, devono essere integrate in
decisioni cliniche condivise; con circostanze del paziente intendiamo lo stato clinico
individuale e il setting.
In sostanza, la competenza professionale del clinico ha un ruolo di euristica
rispetto alle possibilità di diagnosi o intervento – che andrà però confermata dall’e-
videnza – e un altro ruolo nell’adattare le conoscenze generali, tratte dall’evidenza,
al contesto particolare: la cosiddetta estrapolazione. Quanto al paziente, l’EBM ri-
conosce il ruolo della sua autonomia, cioè l’insieme di ragioni e valori che ne fanno
un soggetto umano, nella decisione clinica, e anche delle circostanze in cui si trova
(quale tipo di struttura sanitaria o più generalmente scenario in termini di risorse e
tempo): da caso a cui la conoscenza generale viene applicata ciecamente, dovrebbe
diventare quindi un caso a cui la conoscenza generale viene adattata.
In filosofia della medicina e tra i metodologi si discute se sia sufficiente attri-
buire solo questo ruolo alla competenza professionale del clinico, e se l’importo
epistemico del professionista possa essere differente a seconda delle sotto-discipli-
ne – ad esempio pensiamo allo psichiatra che deve decidere se fare interrompere
al suo paziente il trattamento farmacologico antidepressivo, o al chirurgo che deve
scegliere una tecnica o un’altra: si può sostenere che l’esperienza e le capacità per-
sonali in questi casi siano gran parte di ciò su cui di fatto si basa l’azione, e il pro-
blema di queste discussioni è se sia giusto che resti così, o se è opportuno andare
nella direzione del paradigma EBM32.
Quanto alla singolarità del paziente come rilevante alla decisione clinica, le di-
mensioni di discussione, sia metodologiche (come fare) che filosofiche (in base a
quali principi) sono due. Da una parte c’è la dimensione etica, in cui ad esempio ci
si può interrogare sullo spazio possibile a auspicabile dell’autonomia del paziente
nell’EBM33. Dall’altra c’è la dimensione epistemica, in cui ci si interroga sulla pos-

sibilità teorica e pratica di disegnare interventi di medicina personalizzata e di me-

dicina di precisione, anche grazie alla profilazione genetica: questi nuovi approcci
sono complementari oppure difficilmente conciliabili con l’EBM?34 .
Infine, dobbiamo considerare il terzo fattore declassato nella regola storica
dell’EBM, ovvero il razionale fisiopatologico. Nel Capitolo 1 l’abbiamo chiamato
spiegazione tramite meccanismi: il fenomeno in oggetto viene rappresentato come
prodotto di una gerarchia ordinata di parti e attività, generalmente individuate
mediante studi di laboratorio o modelli animali. Un esempio di razionale fisiopato-
logico è stato menzionato nella discussione del caso dell’idrossiclorochina del §4.5:
le evidenze in vitro su come la molecola possa inibire l’entrata del virus nella cellula
e altri fenomeni legati all’infezione. Perché la conoscenza dei meccanismi è così in
basso, nella gerarchia delle evidenze per le domande cliniche? Già discutendo i
criteri di Hill avevamo notato che la plausibilità e la coerenza, i due criteri in cui si
considera la spiegazione dei meccanismi che potrebbero sottostare a un certo effet-
to riscontrato in uno studio epidemiologico, vengono menzionati ma subito messi
da parte dall’autore stesso perché troppo dipendenti allo stato delle conoscenze del
momento. Certamente però tutte le evidenze sono legate allo stato delle conoscen-
ze del momento, potrebbe insistere il filosofo scettico. E infatti vedremo nel §4.7
come i filosofi della medicina siano particolarmente scettici verso il declassamento
del razionale fisiopatologico nell’EBM.
La discussione del ruolo epistemico di questi tre fattori – il giudizio clinico, l’u-
nicità del paziente e il razionale fisiopatologico – costituiscono buona parte di ciò
che anima il lavoro dei filosofi della medicina dal 2000 circa35. Il nostro percorso
qui tuttavia è un altro, cioè arrivare alla gerarchia dell’evidenza per le questioni
cliniche proposta dall’EBM, per completare quanto abbiamo detto sulla gerarchia
dell’evidenza per la conferma di un’ipotesi. La gerarchia è spesso rappresentata
graficamente come una piramide che ha le meta-analisi e gli RCT al vertice e, a
seguire, gli studi osservazionali e in fondo il giudizio degli esperti e il razionale
fisiopatologico. Qui, dato che siamo arrivati a distinguere tipi di studi e anche tipi
di ricerca, possiamo abbandonare questa visualizzazione semplice, che corrispon-
deva all’EBM dei primi tempi eroici, e optare per una rappresentazione meno di
impatto, ma più precisa e aggiornata. La filosofia di fondo è la stessa, ma i dettagli
contano36.
La gerarchia non è più una sola, ma si differenzia per tipo di ricerca: sull’effica-
cia degli interventi o farmaci, prognostica, diagnostica, sui fattori di rischio, eccete-
ra. Per ogni tipo di ricerca sono indicati in ordine dal migliore al peggiore i livelli di

evidenza, e per ogni livello si specificano i disegni di studio corrispondenti. Infine,

c’è una meta-regola che serve a connettere i livelli di evidenza con il grado di rac-
comandazione, che poi può essere inclusa in linee guida. Vediamo come esempio
due gerarchie e la metaregola proposte dal Center for Evidence-based Medicine
dell’Università di Oxford (ce ne sono altre, ad esempio GRADE)37:
Terapia, prevenzione, eziologia e rischio
1a = Review sistematiche (con omogeneità) di RCT

1b = RCT (con intervallo di confidenza piccolo)
1c = Studio all or none. (Applicabile quando tutti i pazienti sono morti prima che
l’intervento fosse disponibile, e adesso qualcuno dei trattati sopravvive, oppure
quando tutti i pazienti sono morti prima che l’intervento fosse disponibile e adesso
nessuno dei trattati muore).
2a = Review sistematica (con omogeneità) di studi di coorte
2b = Studio di coorte (o RCT di bassa qualità, ad es. follow-up <80%)
2c = Studio di terapia e studio ecologico
3a = Review sistematica (con omogeneità) di studi caso-controllo
3b = Studio caso-controllo
4 = Serie di casi (e studi di coorte e di caso controllo di bassa qualità)
5 = Opinione degli esperti senza valutazione critica, o basata sulla fisiologia, sulla
ricerca di laboratorio o su principi teorici.
Prognosi
1a = Review sistematiche (con omogeneità) di studi di coorte, algoritmo per la deci-

sione medica validato in diverse popolazioni
1b = Studio di coorte con follow-up >80%
1c = Serie di casi all or none.
2a = Review sistematica (con omogeneità) di studi di coorte retrospettivi o con grup-
po di controllo non trattato
2b = Studio di coorte retrospettivo o follow-up di pazienti non trattati in un RCT
Studio di coorte (o RCT di bassa qualità, ad es. follow-up <80%)
2c = Outcome research

4 = Serie di casi (e studi di coorte prognostici di bassa qualità)

5 Opinione degli esperti senza valutazione critica, o basata sulla fisiologia, sulla
ricerca di laboratorio o su principi teorici.
Grado di raccomandazione
A: studi consistenti di livello 1

B: studi consistenti di livello 2 o 3 o estrapolazioni da studi di livello 1
C: studi al livello 4 o estrapolazioni dai livelli 2 e 3
D: evidenza al livello 5 o studi inconsistenti a qualsiasi livello
Il grado di raccomandazione si trova specificato nelle linee guida per la pratica
clinica. Ad esempio, in una versione delle linee guida per il trattamento dei tumori
al seno leggiamo che l’intervento chirurgico conservativo, seguita da ricostruzione
cosmetica, è una raccomandazione di tipo A: questo significa che c’è consistente
evidenza di livello 1 per questo tipo di intervento38.
Come si nota, la gerarchia è articolata e non rigidamente legata all’idea degli
RCT come gold standard. Nel caso degli studi prognostici, ad esempio, non figura-
no affatto. Viene introdotto il concetto di buona o cattiva qualità dello studio, che
è indipendente dalla validità interna a priori che il tipo di studio può dare, ma
dipende da difetti quali operazionalizzazione o misurazione differente nel gruppo
di intervento e in quello di controllo, blinding non accurato, controllo dei confon-
dimenti non completo, eccetera. Gli studi di bassa qualità sono quelli che nel §4.5
abbiamo chiamato “fatti male”: nelle gerarchie dell’evidenza proposte dall’EBM
di nuova generazione, dunque, anche questa dimensione di valutazione conta, e
gli studi partono da un livello di qualità determinato a priori dal tipo di disegno,
ma poi possono essere promossi o declassati a seconda di questi parametri. Nel
§4.9 vedremo altri aspetti in base ai quali un RCT può essere “fatto bene” oppure
“male”, che hanno a che fare con la validità esterna più che con la validità interna.
Concludendo, la gerarchia dell’evidenza proposta dal movimento EBM rispon-
de alla domanda: quale tipo di studio fornisce l’evidenza migliore per rispondere a
un quesito di natura clinica? Che è leggermente diversa - sebbene connessa − dalla
domanda: che tipo di studio fornisce l’evidenza migliore per testare un’ipotesi?
La gerarchia si è evoluta nel tempo, dall’iniziale enfasi quasi ideologica sugli RCT
come gold standard, verso un sistema più complesso, ma più preciso, perché diffe-
renzia per tipi di ricerca e include più dimensioni di valutazione. Secondo alcuni

autori non si tratta nemmeno più di una gerarchia, ma di un insieme di regole – la

differenza naturalmente è sottile, e va lasciata ad altra sede39.
Tuttavia, i principi fondamentali, o la filosofia dell’evidenza dell’EBM restano
gli stessi nella misura in cui il razionale fisiopatologico, o conoscenza del mecca-
nismo, è relegato in basso, assieme all’opinione degli esperti senza valutazione
critica. Ma non avevamo detto che la conoscenza del meccanismo è conoscenza
causale? Perché dunque non ci serve? Occorre qui un terzo intermezzo sulla causa-
lità, dopo quelli in §1.8 e §3.6.
4.8 TERZO INTERMEZZO SULLE CAUSE: E I MECCANISMI?

Abbiamo considerato la nozione di meccanismo nel §1.7 parlando di spiegazio-
ne scientifica: secondo molti filosofi della scienza, individuare il meccanismo che
corrisponde a un certo fenomeno equivale a fornire una spiegazione di quel feno-
meno. Così, ad esempio, se conosciamo il meccanismo mediante il quale il virus
Sars-Cov-2 entra nella cellula umana, abbiamo spiegato come avviene l’infezione.
Nel §1.8 abbiamo aggiunto che una delle analisi della causalità più accreditate in
filosofia è proprio quella secondo la quale un A causa un B se c’è un meccanismo
che produce B a partire da A, dunque le nostre spiegazioni meccanicistiche sono
spiegazioni causali. Nell’esempio, il processo – il meccanismo - che coinvolge le
parti della cellula del virus e le parti della cellula umana è la spiegazione causale
di come il virus (A) causa l’infezione della cellula (B). Come abbiamo ricordato nel
§1.8, la concezione meccanicistica della causalità non è l’unica, ma ci sono buone
ragioni per sostenerla, e diamo qui per scontato che si adatti ad almeno alcune
delle cause che si scoprono e si testano nelle scienze biomediche. Questa è la nostra
prima premessa.
Continuiamo a ragionare aggiungendo che quando uno studio clinico fornisce
un risultato di associazione tra due fattori, ad esempio l’assunzione di un farmaco
in una certa dose e un certo esito, noi vorremmo che l’intervento e l’esito non fos-
sero meramente associati, ma che l’intervento fosse causa dell’esito – su questo era
d’accordo anche Hill, padre dell’epidemiologia, nel formulare i suoi nove criteri
(§3.6). In generale, è ragionevole pensare che per stabilire un legame di natura
causale (per confermare un’ipotesi che A causa B), ci occorra sapere che si dà asso-
ciazione regolare tra A e B, e anche che c’è un meccanismo che produce B a partire

da A. Su questa ultima tesi c’è molto consenso in filosofia della medicina40. Dun-
que, l’evidenza del meccanismo che produce B a partire da A è importante quanto
l’evidenza dell’associazione tra A e B per stabilire che A causa B. Dato che la gerar-
chia dell’evidenza per testare un’ipotesi e quella per orientare le decisioni cliniche
coincidono, questo significa in particolare che la gerarchia dell’evidenza dell’EBM
per orientare le decisioni cliniche è sbagliata e che il ruolo della conoscenza dei
meccanismi o razionale fisiopatologico deve essere rivalutato.
La conclusione appena enunciata è oggi la critica standard dei filosofi all’EBM.
Un modo troppo rapido per bloccarla, e quindi difendere l’EBM, è il seguente: non
è vero che testare un’ipotesi e rispondere ad un quesito clinico necessitano dello
stesso tipo di evidenza – lo vedremo nel §4.8 trattando della validità esterna degli
RCT, una questione rilevante per le decisioni cliniche ma non per la conferma delle
ipotesi. Tuttavia, lasciamo qui questa confutazione sbrigativa e vediamo una rispo-
sta più articolata.
La risposta è fornita da Jeremy Howick e parte dal notare che per ogni effetto
di un intervento A su un esito B, ci sono molti meccanismi coinvolti, oppure molte
parti e livelli di un unico grande meccanismo, di cui spesso non immaginiamo
nemmeno esattamente i confini41. La critica standard funzionerebbe se potessimo
conoscere tutti i meccanismi coinvolti, ma dato che nella grande maggioranza dei
casi questo non è possibile, la critica standard non funziona, e la gerarchia EBM
resta motivata. Howick fa un esempio. Il meccanismo di funzionamento dei farma-
ci antiaritmici suggeriva che potessero ridurre la mortalità nei pazienti colpiti da
infarto. Nel 1987 è iniziato un grande trial multicentrico randomizzato a 4 bracci
(CAST, Cardiac Arrythmia Suppression Trial), che ha coinvolto 1455 pazienti, per te-
stare i possibili benefici di tre di queste molecole rispetto al placebo. Nel 1989, tut-
tavia, due bracci sono stati chiusi per eccessiva mortalità nel gruppo di intervento.
Il risultato – di incremento di mortalità – è stato confermato da studi successivi42
Il problema, argumenta Howick, è che i meccanismi coinvolti nell’effetto della
molecola sull’esito mortale sono più numerosi di più di quelli che spiegano l’effetto
della molecola sul controllo dell’aritmia, e molti di questi erano e sono imprevedi-
bili e sconosciuti. Se l’evidenza del razionale fisiopatologico non equivale alla co-
noscenza di tutti i meccanismi coinvolti – come è in molti casi, data la complessità
del corpo umano e delle sue interazioni con l’ambiente - allora abbiamo una buona
ragione per ritenere che non si tratti di evidenza sufficiente e nemmeno necessaria
per confermare l’interpretazione causale di un effetto, o per prendere una decisio-
ne clinica.

Questa linea di difesa dell’EBM è di rado articolata nella letteratura metodolo-

gica, dove si possono invece trovare osservazioni come questa:
GRADE non considera la questione della plausibilità [biologica] nel senso stretto in
cui era intesa da Bradford Hill. Questo, in parte, è dovuto al fatto che qualunque re-
lazione può essere descritta come plausibile dato che i ricercatori penseranno sempre
a una spiegazione una volta che hanno trovato un’associazione43.
A ben guardare, questo laconico declassamento della conoscenza dei mecca-
nismi da parte degli autori di GRADE condivide la stessa premessa del punto di
Howick: dato che i meccanismi coinvolti in un’associazione tra fattori (ad esempio,
l’assunzione di un farmaco contro l’aritmia cardiaca e l’aumento di mortalità) sono
moltissimi, ce ne sarà sempre almeno uno che i ricercatori citano a sostegno di una
certa associazione che rilevano.
I filosofi che sostengono la critica standard hanno risposto che la loro obiezio-
ne alla gerarchia dell’evidenza EBM rimane valido in linea di principio: se tutta
l’evidenza meccanicistica per un certo effetto del fattore A su B fosse disponibile,
allora dovrebbe valere tanto quanto quella degli RCT, perché costituirebbe cono-
scenza causale. In fondo, che la conoscenza patofisiologica sia incompleta non è
una necessità concettuale, ma un fatto contingente. Questo è vero, ma non è un
ottimo argomento contro la gerarchia EBM, che non si occupa di definire la natura
concettuale della causalità in medicina, ma fornisce regole – né più né meno dei
criteri di Hill e di quelli di John Stuart Mill – per sbagliare meno nel ragionamento
induttivo, nella situazione epistemica contingente. In conclusione, quindi, la critica
standard non colpisce davvero la gerarchia dell’evidenza per le domande cliniche
proposta dall’EBM.
Tuttavia, i filosofi che hanno elaborato la critica standard hanno anche messo
in luce diversi ruoli che la conoscenza dei meccanismi svolge nella ricerca biome-
dica, che è plausibile definire come ineliminabili. Alcuni di questi li abbiamo già
individuati parlando, a partire dal Capitolo 3, di bias e confondimenti. Abbiamo
notato che non c’è una regola logica o statistica per determinare che, ad esempio,
l’età o l’indice di massa corporea possono essere fattori da controllare come possi-
bili confondimenti in uno studio sugli effetti di un intervento chirurgico all’anca,
mentre il colore degli occhi non lo è. In questi casi ragioniamo per abduzione e
le nostre premesse derivano da studi simili che abbiamo letto, oppure dalla co-
noscenza biologica dei meccanismi coinvolti. Dunque, questo tipo di conoscenze
sono necessarie nella scelta e nella realizzazione del disegno sperimentale. Anche

per l’analisi statistica occorre partire da una base di conoscenza biologica, dato
che per individuare la potenza statistica necessaria (e quindi la numerosità del
campione) occorre stimare prima la grandezza dell’effetto che si presume di tro-
vare – e questa stima, ovvimente, non è basata sul vuoto. Questo non è un ruolo
del razionale fisiopatologico come diretta evidenza, ma è comunque un ruolo nella
produzione di evidenza44.
Un’altra funzione importante di questo tipo di conoscenza è nell’applicazione
dei risultati di un RCT o di uno studio osservativo al singolo paziente, o caso, che
ci si trova ad affrontare: nel cosiddetto problema dell’estrapolazione45. Questo è
particolarmente rilevante nel caso di pazienti cronici con comorbilità – situazione
che si presenta sempre più frequentemente in società in cui l’aspettativa di vita si
allunga. Molti RCT testano l’efficacia di un trattamento solo, o al massimo ne valu-
tano l’interazione con altri due. Come si può decidere se somministrare un nuovo
farmaco a un paziente che è già sottoposto ad altre tre terapie? Può darsi che l’evi-
denza di alta qualità sulle interazioni non ci sia, quindi l’unica strategia razionale
è basarsi sull’ipotesi di possibili meccanismi di interazione – quindi su evidenza di
tipo fisiopatologico. Dunque, sapere che una certa conoscenza generale si può ap-
plicare o non applicare è spesso mediato dalla conoscenza patofisiologica generale,
e anche dalle ipotesi particolari sul singolo paziente.46.
Questo stesso punto è stato sollevato a livello di principio, non solo di fatto, dal-
la filosofa della scienza Nancy Cartwright47. L’RCT ci informa dell’effetto medio
sul campione, ma questa sarà sempre una misura differente da quella dell’effetto
singolo sul caso particolare. L’analogia tra il caso particolare e la media del campio-
ne non basta: secondo Cartwright il ragionamento con cui si applica la conoscen-
za generale ottenuta con un RCT al paziente singolo (ad esempio: che l’aspirina
riduce la percezione del mal di testa) non è giustificata se non con ragioni di tipo
causale (su come l’aspirina riduce il mal di testa), che dobbiamo mettere a sistema
con quello che sappiamo della condizione del paziente singolo: con la conoscenza
cioè dei meccanismi patofisiologici. Questa proposta, e altre di questo tipo, sono
di nuovo passibili della critica di Howick: e come facciamo a conoscere tutti i mec-
canismi rilevanti, dato che di solito sono innumerevoli? La discussione quindi è
aperta. Senza volere entrare nel merito, abbiamo qui evidenziato un altro possibile
ruolo dei meccanismi, non come evidenze per la decisione clinica, ma come vinco-
lo alla selezione delle evidenze per la decisione clinica.

4.9 ALTRE DIMENSIONI PER VALUTARE GLI RCT

Il nostro discorso sulle metodologie si è progressivamente spostato, nel corso
di questo capitolo, dalla domanda sulla validità interna (in che misura un certo
tipo di studio può dare conferma all’ipotesi che si propone di testare?) a quella
sulla validità esterna (in che misura un certo tipo di studio fornisce risultati appli-
cabili alla popolazione in generale e ai soggetti specifici fuori dal suo campione?).
La gerarchia dell’evidenza dell’EBM, mettendo in gioco la domanda clinica come
obiettivo, è basata su considerazioni di validità interna, ma ha in vista la validità
esterna degli studi clinici.
Quello di validità esterna è un concetto metodologico normativo (esprime una
valutazione, oltre a descrivere le caratteristiche di uno studio) – esattamente come
la validità interna. E come la validità interna si valuta principalmente in base a
bias e confondimenti, così ci sono condizioni che influiscono sulla validità esterna.
Parlando di validità esterna in relazione agli RCT, che testano quanto un inter-
vento modifichi un certo esito, è necessario introdurre la distinzione tra efficacy ed
effectiveness (si potrebbero tradurre con efficacia ed efficacia effettiva, ma di solito
si usano i termini inglesi):
Effectiveness: Una misura del beneficio che risulta da un intervento per un certo
problema di salute, nelle condizioni di cura normali per un particolare gruppo di
persone.
Efficacy: Una misura del beneficio che risulta da un intervento per un certo proble-
ma di salute nelle condizioni ideale di uno studio sperimentale48.
La effectiveness è connessa con la validità esterna e, al pari di questa, dipende da
diverse condizioni49. Vediamo le principali.
La scelta del campione. La numerosità del campione per un RCT è un proble-
ma statistico, mentre la scelta dei volontari e i criteri di arruolabilità sono un pro-
blema scientifico e pratico. Pratico perché può essere difficile trovare i volontari
e avere il loro consenso, soprattutto alla randomizzazione dei trattamenti – cioè
rispetto alla possibilità di non ricevere il nuovo farmaco, ma il placebo o il tratta-
mento standard. Alcuni tipi di persone sono più disposte a partecipare, e questo,
come abbiamo già notato nel Capitolo 3, può dare bias di selezione. Ma il proble-
ma è anche scientifico, perché, al netto delle questioni pratiche, occorre stimare
che le differenze tra il campione e la popolazione a cui l’intervento è destinato

non siano tali da compromettere l’applicabilità dell’intervento (effectiveness), e al

contempo che le caratteristiche del campione non impattino sulla fattibilità dello
studio, impedendo di valutare l’efficacy del trattamento. Questo è il problema
dei criteri di esclusione o criteri di arruolabilità (eligibility) negli RCT. Facciamo
un esempio veloce: in un trial per testare l’effetto di un vaccino anti-influenzale
sul rischio di infezione si decide di non arruolare gli ultra-ottantenni, perché
sono spesso in cura con altri farmaci, o potrebbero non riuscire a terminare il fol-
low-up (potenzialmente compromettendo la validità interna), e sono più fragili
rispetto ai possibili effetti avversi (una ragione etica per escluderli). Tuttavia, il
vaccino sarà raccomandato soprattutto agli anziani, dunque il risultato di effica-
cia, testato su persone più giovani e più sane, potrebbe non essere applicabile alla
popolazione a cui è prevalentemente destinato. L’equilibrio è complicato e c’è la
tendenza a non rispettarlo, di solito a scapito della validità esterna e per massi-
mizzare i risultati di efficacy. Vediamo parte dell’abstract di una review sistematica
sui criteri di arruolabilità, pubblicata nel 2007, ma ancora utile per illustrare il
problema50 (e nel frattempo possiamo vedere un esempio di review sistematica,
che abbiamo citato tra i tipi di studi nel §3.1)
Contesto. I criteri di arruolabilità selettiva per gli RCT sono vitali per la fattibilità e
la validità interna. Tuttavia, l’esclusione di certe popolazioni di pazienti può portare
a una ridotta generalizzabilità dei risultati.
Obiettivo. Determinare la natura e il tipo di criteri di arruolabilità tra gli RCT

pubblicati nelle più importanti riviste mediche, e il contributo dei criteri di arruola-
bilità alla rappresentazione della popolazione dei pazienti.
Fonte dei dati e selezione degli studi. Il database MEDLINE è stato consultato
per RCT pubblicati tra il 1994 e il 2006 su riviste mediche ad alto impact factor. Di
4827 articoli ne sono stati selezionati 283 con una tecnica seriale.
Conclusioni. Gli RCT pubblicati sulle maggiori riviste mediche spesso non ripor-
tano i criteri di arruolabilità in modo chiaro. Donne, bambini, anziani e persone con
comuni patologie sono inoltre frequentemente esclusi. I trial multicentrici e quelli
che riguardano farmaci hanno più frequentemente questi criteri di esclusione, che
possono impattare negativamente sulla generalizzabilità dei risultati. I nostri risul-
tati sottolineano la necessità di un’attenta considerazione e di una chiara indicazione
e giustificazione dei criteri di esclusione nei trial clinici.

Come si giustificano i criteri di esclusione? Ci sono, come potremmo aspettarci,

linee guida per il tipo di trial. Ad esempio, negli RCT per i trattamenti oncologici si
consiglia di non arruolare pazienti che abbiano già avuto in diverso tumore rispet-
to a quello su cui si indaga l’effetto. Tuttavia, questo può portare a escludere molti
possibili volontari altresì adatti, quindi è stato suggerito che una regola così rigida
venga sostituita con una valutazione più precisa dei parametri: ad esempio, avere
avuto un tumore alla prostata di per sé non esclude un volontario, ma lo esclude
avere certi parametri sierologici o radiologici51. In sostanza, qui torna la conoscen-
za dei meccanismi, o del razionale fisiopatologico, questa volta per calibrare gli
standard di giustificazione dei criteri di arruolabilità rispetto al difficile rapporto
tra validità interna e validità esterna.
Un’altra soluzione è quella di fare più trial per testare l’effetto dello stesso in-
tervento, inizialmente con criteri di arruolabilità stretti per testare che l’effetto ci
sia, poi con criteri molto più larghi, per controllare l’effectiveness. I trial con i criteri
molto più larghi possono arrivare a includere le circostanze normali di cura dei
pazienti con quel farmaco: si tratta degli RCT pragmatici52. Fare due o più trial per
lo stesso trattamento e organizzare grandi RCT pragmatici comporta ovviamente
costi aggiuntivi di vario genere: la scelta di andare oltre il primo trial dovrebbe
essere guidata non solo da queste considerazioni, ma soprattutto dalla stima di
quanto l’efficacy del primo RCT possa essere divergente dall’efficacia effettiva.
La scelta degli outcome. Per testare l’ipotesi di natura causale dell’efficacia di
un intervento, tipicamente il beneficio di un trattamento, un RCT stabilisce uno o
più esiti (outcome, di solito si usa il termine inglese) e parametri che fissano quando
lo studio va interrotto, o perché l’outcome è raggiunto, o per pericolo o morte dei
soggetti (end point, anche questo non si traduce). Ad esempio, in un trial per un
farmaco oncologico un outcome può essere la riduzione della massa tumorale e l’en-
dpoint un certo risultato dai test di imaging, ma anche un certo livello di mortalità
dei soggetti nel campione è un endpoint nel senso che, per un altro tipo di ragione,
determina la chiusura del trial. Un outcome surrogato è invece una condizione che
si considera associata all’outcome primario. Ad esempio, l’abbassamento del livello
di colesterolo può essere una condizione associata a minor rischio di mortalità per
malattia cardiovascolare, ma non è uguale a minor rischio per mortalità cardiova-
scolare.
La validità esterna di un RCT dipende in maniera rilevante, sia concettualmente
che di fatto, dalla scelta degli outcome. Un outcome primario è una dovrebbe esse-
re un beneficio diretto, ad esempio un miglioramento nei sintomi, nella capacità

funzionale, nella sopravvivenza, un decremento del rischio, e l’endpoint dovrebbe

essere la misura più diretta di uno di questi aspetti. Quanto agli outcome surrogati,
a volte l’associazione con quello primario viene smentita da studi successivi – ad
esempio, un farmaco per il trattamento dell’osteoporosi è risultato efficace rispet-
to all’outcome di aumento della massa ossea, ma poi responsabile di un aumento
nelle fratture. Questo è un primo problema per la validità esterna: lo studio con la
densità ossea come outcome poteva essere della migliore qualità, ma si è rivelato
clinicamente inutile53.
In generale, gli outcome surrogati sono più difficili da riportare alla condizione
del paziente al di fuori del campione. Lo psichiatra che prescrive un farmaco antie-
pilettico, e i suoi pazienti, possono trovare irrilevante l’evidenza di un trial che mo-
stra l’effetto di una certa molecola sull’intensità media delle crisi – quando invece
la frequenza è ciò che più impatta sulla qualità di vita. Il problema qui non è esat-
tamente di validità esterna, perché potrebbe darsi che quell’effetto di riduzione di
intensità media sia applicabile a buona parte della popolazione di riferimento, ma
è piuttosto di rilevanza clinica. Ci serve qui un’altra nozione, quella di outcome rile-
vante per il paziente: aggiunge una dimensione qualitativa alla scelta degli outcome.
L’attenzione a questo aspetto è uno degli sviluppi più recenti del paradigma EBM.
Cos’è rilevante per il paziente? Vivere meglio e di più, quindi migliore soprav-
vivenza (con effetto non minuscolo) e migliore qualità di vita. Come ricorda Howi-
ck, si tratta di nozioni filosoficamente complicate. La qualità di vita può essere
definita e misurata in molti modi, ma fondamentalmente la scelta è tra misure in
termini di assenza di patologie, non peggioramento (progress-free survival) e nor-
male funzionalità, e misure soggettive, che fanno riferimento alla soddisfazione
personale, alla felicità e in generale alle sensazioni e agli atteggiamenti, quindi tra
test medico-biologici e questionari psicologici. La sopravvivenza sembra semplice
da definire, ma occorre anche qui scegliere se abbia senso misurarla indipendente-
mente dalle condizioni di funzionalità e di vita.
Ma la questione della misurazione non è l’unica rilevante: la scelta è tra valori
diversi che prendiamo come obiettivi della ricerca medica. È stato osservato che gli
outcome nella ricerca oncologica sono spesso piccolissime variazioni nella soprav-
vivenza senza progresso di tumore (progress-free survival), che risultano poi non
impattare sulla qualità di vita che il paziente comunque può ottenere54. Il punto
alla fine è, quale tipo di miglioramento della vita di una persona consideriamo
rilevante? Quale merita il tempo e le risorse della ricerca? Non qualunque, e forse
non per tutti i contesti sarà uguale.

In conclusione, abbiamo qui progressivamente aggiunto altre dimensioni di va-

lutazione degli RCT: la validità esterna, su ci influiscono i fattori pratici ma anche
i criteri scientifici per l’arruolabilità o l’esclusione dalla sperimentazione, e la rile-
vanza degli outcome per il paziente. Quest’ultimo punto va oltre le questioni di me-
todo scientifico – come confermare un’ipotesi – e apre alle questioni di valore: quali
ipotesi ci interessano davvero? Cosa sono la vita e la salute che la ricerca medica si
propone di migliorare? Qui abbiamo solo domande e nessuna risposta: quest’area
di questioni non è ben esplorata come la metodologia per la validità interna: tutte
le nozioni in gioco (qualità della vita e patient-relevant outcome, per primi) necessi-
tano di chiarificazione concettuale, e successivamente di un dibattito filosofico55.

Il paradigma per gli studi interventistici è l’RCT, che grazie alla randomizzazione e
al blinding riesce ad avere maggiore validità interna rispetto ad altri tipi di studio.
Viene utilizzato con disegni di diverse complessità e costituisce gli studi di fase 3
nei trial farmacologici. L’EBM è un movimento di riforma metodologica iniziato
attorno al 1990 con lo scopo di valutare il tipo di evidenza per una domanda clinica.
Ridimensiona il ruolo della competenza del clinico e della conoscenza dei meccanismi
fisiopatologici e, nelle prime formulazioni, assume RCT e meta-analisi come gold
standard. Versioni più recenti e complesse forniscono regole per valutare l’evidenza
che sono più flessibili e differenziate. Molti filosofi della medicina hanno argomenta-
to che la conoscenza dei meccanismi dovrebbe avere un posto più alto nella gerarchia
dell’evidenza, dato che si tratta di conoscenza causale, ma esistono modi per difende-
re la posizione dell’EBM riguardo a questo, che consentono comunque di assegnare
ruoli importanti per la conoscenza dei meccanismi in varie fasi della ricerca. Per gli
RCT che testano gli effetti di farmaci o altri interventi si apre, oltre al problema della
validità interna, quello della generalizzabilità alla popolazione oltre al campione, cioè
la validità esterna. Un fattore importante sono i criteri di arruolabilità dei soggetti,
ma qui entrano anche in gioco la scelta degli outcome e il modo in cui decidiamo, in
base ai nostri valori, come definire ciò che è rilevante per il paziente.

NOTE DI CHIUSURA
1 Bernard, C. (1865). Introduction à l'étude de la médecine expérimentale par m. Claude
Bernard. Paris: Baillière.
2 Una trattazione sintetica e completa in inglese si trova in Wendler, D. The Ethics of
Clinical Research. The Stanford Encyclopedia of Philosophy (Winter 2017 Edition), Edward N.
Zalta (ed.), online https://plato.stanford.edu/archives/win2017/entries/clinical-research/,
accesso del 2 dicembre 2020.
3 Per uno studio clinico sono le CONSORT. Si veda Begg, C., Cho, M., Eastwood, S., Hor-
ton, R., Moher, D., Olkin, I., ... & Stroup, D. F. (1996). Improving the quality of reporting of
randomized controlled trials: the CONSORT statement. Jama, 276(8), 637-639.
4 Un’esposizione rapida e chiara delle fasi di un RCT si trova in Kendall, J. (2003). De-
signing a research project: randomised controlled trials and their principles. Emergency med-
icine journal: EMJ, 20(2), 164.
5 Le linee guida CONSORT per il report dei trial contengono tutte queste informazioni e
definizioni espresse in modo molto chiaro: Schulz, K. F., Altman, D. G., Moher, D., & Con-
sort Group. (2010). CONSORT 2010 statement: updated guidelines for reporting parallel
group randomised trials. Trials, 11(1), 32.
6 Il filosofo che ha sollevato questo punto critico è John Worrall, si veda ad esempio
Worrall, J. (2007). Why there's no cause to randomize. The British Journal for the Philosophy of
Science, 58(3), 451-488.
7 Bolliger, C. T., Zellweger, J. P., Danielsson, T., van Biljon, X., Robidou, A., Westin, Å.,
... & Säwe, U. (2000). Smoking reduction with oral nicotine inhalers: double blind, ran-
domised clinical trial of efficacy and safety. Bmj, 321(7257), 329-333.
8 Una guida utile è Supino, P. G. (2012). Fundamental issues in evaluating the impact of
interventions: Sources and control of bias. In Principles of Research Methodology (pp. 79-110).
Springer, New York, NY. Per la caratterizzazione dei tipi di RCT il riferimento è Higgins
JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Cochrane Hand-
book for Systematic Reviews of Interventions version 6.1 (updated September 2020). Cochrane,
2020. Available from www.training.cochrane.org/handbook.
9 Si veda ad esempio Glenn, B. A., Bastani, R., & Maxwell, A. E. (2013). The perils of
ignoring design effects in experimental studies: lessons from a mammography screening
trial. Psychology & health, 28(5), 593-602.
10 You, W. C., Brown, L. M., Zhang, L., Li, J. Y., Jin, M. L., Chang, Y. S., ... & Gail, M. H.
(2006). Randomized double-blind factorial trial of three treatments to reduce the prevalence
of precancerous gastric lesions. Journal of the National Cancer Institute, 98(14), 974-983.
11 Si veda Catalogue of Biases Collaboration, Spencer EA, Heneghan C. (2018) Compli-
ance bias. In: Catalogue Of Biases, www.catalogueofbiases.org/biases/compliancebias, ac-
cesso del 30 novembre 2020.

12 Barminko, J. A., Nativ, N. I., Schloss, R., & Yarmush, M. L. (2014). Fractional factorial
design to investigate stromal cell regulation of macrophage plasticity. Biotechnology and bio-
engineering, 111(11), 2239-2251.
13 Gordon, P. R., Kerwin, J. P., Boesen, K. G., & Senf, J. (2006). Sertraline to treat hot flash-
es: a randomized controlled, double-blind, crossover trial in a general population. Meno-
pause, 13(4), 568-575.
14 Si veda anche Shadish, W. R., & Heinsman, D. T. Experiments Versus Quasi-Experi-
ments: Do They Yield the Same Answer? Meta-Analysis of Drug Abuse Prevention Programs,
147.
15 Eliopoulos, G. M., Harris, A. D., Bradham, D. D., Baumgarten, M., Zuckerman, I. H.,
Fink, J. C., & Perencevich, E. N. (2004). The use and interpretation of quasi-experimental
studies in infectious diseases. Clinical infectious diseases, 38(11), 1586-1591.
16 Annweiler, C., Hanotte, B., de l’Eprevier, C. G., Sabatier, J. M., Lafaie, L., & Célarier,
T. (2020). Vitamin D and survival in COVID-19 patients: A quasi-experimental study. The
Journal of steroid biochemistry and molecular biology, 204, 105771.
17 Sul sito web dell’AIFA si trovano descritte le fasi dei trial, https://www.aifa.gov.it/web/
guest/sperimentazione-clinica-dei-farmaci, accesso del 6 gennaio 2021.
18 Shader, R. I. (2018). Safety Versus Tolerability. Clinical therapeutics, 40(5), 672-673.
19 Lexchin, J., Bero, L. A., Djulbegovic, B., & Clark, O. (2003). Pharmaceutical industry
sponsorship and research outcome and quality: systematic review. Bmj, 326(7400), 1167-
1170 e Catalogue of Bias Collaboration, Holman B, Bero L, & Mintzes B. (2019) Industry
Sponsorship bias. Catalogue Of Bias 2019: https://catalogofbias.org/biases/industry-spon-
sorship-bias/, accesso del 2 gennaio 2021.
20 Blaskiewicz, R. (2013). The Big Pharma conspiracy theory. Medical Writing, 22(4), 259-
261.
21 Si veda ad esempio Osimani, B. (2013). Until RCT proven? On the asymmetry of evidence
requirements for risk assessment. Journal of evaluation in clinical practice, 19(3), 454-462.
22 Ho adattato qui la definizione di quality of evidence for systematic reviews fornita dalle
linee guida GRADE, traducendo confidence con avere buone ragioni. Le traduzioni letterali
di confidence, come certezza, potrebbero infatti suggerire un elemento soggettivo che non
deve essere incluso. Si veda Schünemann H, Brożek J, Guyatt G, Oxman A, editors (2013)
GRADE handbook for grading quality of evidence and strength of recommendations. Up-
dated October 2013. The GRADE Working Group, disponibile a https://gdt.gradepro.org/
app/handbook/handbook.html#h.9rdbelsnu4iy, accesso del 20 novembre 2020.
23 Ovviamente i bias di non-blinding (dello sperimentatore e dei soggetti) non sono un
rischio per gli studi descrittivi, che non hanno gruppo di controllo, ma questo non significa
che questi possano fornire un’evidenza migliore per un’ipotesi da testare: hanno il proble-
ma centrale dei confondimenti. Questo punto fondamentale è sfuggito completamente a

Borgerson, K. (2009). Valuing evidence: bias and the evidence hierarchy of evidence-based
medicine. Perspectives in biology and medicine, 52(2), 218-233.
24 Smith, G. D., & Ebrahim, S. (2002). Data dredging, bias, or confounding: They can all
get you into the BMJ and the Friday papers. BMJ: British Medical Journal, 325(7378), 1437.
25 La meta-analisi è Stampfer M., Colditz G. (1991) Estrogen replacement therapy and
coronary heart disease: a quantitative assessment of the epidemiologic evidence. Preventive
Medicine 1991; 20:47-63. I risultati degli RCT sono in Beral V, Banks E, Reeves G. (2002)
Evidence from randomised trials on the longterm effects of hormone replacement therapy.
Lancet 2002; 360:942-4
26 La review è Willett W. (1990) Vitamin A and lung cancer. Nutrition Reviews 1990;
48:201-11, mentre il trial è Alpha-Tocopherol, Beta Carotene Cancer Prevention Study
Group (1994). The effect of vitamin E and beta carotene on the incidence of lung cancer and
other cancers in male smokers. New England Journal of Medicine 330:1029-35.
27 Kim, A. H., Sparks, J. A., Liew, J. W., Putman, M. S., Berenbaum, F., Duarte-García,
A., ... & Grainger, R. A Rush to Judgment? Rapid Reporting and Dissemination of Results
and Its Consequences Regarding the Use of Hydroxychloroquine for COVID-19. Annals of
Internal Medicine. Lo studio ORCHID è Self, W. H., Semler, M. W., Leither, L. M., Casey, J.
D., Angus, D. C., Brower, R. G., ... & Brown, S. M. (2020). Effect of hydroxychloroquine on
clinical status at 14 days in hospitalized patients with COVID-19: a randomized clinical
trial. JAMA, 324(21), 2165-2176. Si veda anche RECOVERY Collaborative Group. (2020).
Effect of hydroxychloroquine in hospitalized patients with Covid-19. New England Journal
of Medicine, 383(21), 2030-2040.
28 Howick, J. (2016) The Philosophy of Evidence-based Medicine. Oxford: Oxford Univer-
sity Press. Kindle edition, p. 53.
29 Uno degli articoli storici per l’EBM è Sackett, D. L., Rosenberg, W. M., Gray, J. M.,
Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine: what it is and what it
isn't. BMJ: British Medical Journal, 312(7023), 71. Si veda anche Howick, J. (2016) The Philoso-
phy of Evidence-based Medicine. Oxford: Oxford University Press per una breve ricostruz-
ione storica del movimento.
30 Sackett, D. L., et al. 1991. Clinical epidemiology: A basic science for clinical medicine,
2nd ed. Toronto: Little, Brown.
31 Straus, S. E., Glasziou, P., Richardson, W. S., Haynes, R. B., Pattani, R., & Veroniki, A.
A. (2005). How to practice and teach EBM. Evidence-Based Medicine. Third edition. New York:
Elsevier, 13-29.
32 In filosofia della psichiatria il ruolo epistemico del giudizio clinico è discusso in Thorn-
ton, T. (2007). Essential philosophy of psychiatry. Oxford: Oxford University Press. Per la dis-
cussione in chirurgia si veda ad esempio Black, N. (1999). Evidence-based surgery: a pass-
ing fad?. World journal of surgery, 23(8), 789-793.

33 Per la filosofia rimando a Bluhm, R. (2009). Evidence-based medicine and patient au-
tonomy. IJFAB: International Journal of Feminist Approaches to Bioethics, 2(2), 134-151 e nella
letteratura medica Rogers, W. A. (2002). Evidence‐based medicine in practice: limiting or
facilitating patient choice?. Health Expectations, 5(2), 95-103.
34 Si vedano ad esempio Goldberger, J. J., & Buxton, A. E. (2013). Personalized medicine
vs guideline-based medicine. Jama, 309(24), 2559-2560 e Senn, S. (2018). Statistical pitfalls of
personalized medicine. Natur, 563(7733), 619-621.
35 Una panoramica con opinioni si trova in Upshur, R. (2005). Looking for rules in a
world of exceptions: reflections on evidence-based practice. Perspectives in biology and medi-
cine, 48(4), 477-489.
36 Secondo Howick (vedi nota 22) la filosofia dell’evidenza dell’EBM non è cambiata in
modo rilevante, perché la conoscenza dei meccanismi e il giudizio degli esperti è sempre al
livello più basso. Tuttavia, la posizione degli studi osservazionali rispetto agli RCT è sicur-
amente diversa.
37 Oxford Centre for Evidence-Based Medicine (2009) Levels of Evidence (March 2009). Di-
sponibile a https://www.cebm.ox.ac.uk/resources/levels-of-evidence/oxford-centre-for-evi-
dence-based-medicine-levels-of-evidence-march-2009, accesso del 25 novembre 2020. Per
il sistema GRADE si veda Guyatt, G., Oxman, A. D., Akl, E. A., Kunz, R., Vist, G., Brozek,
J., ... & Schünemann, H. J. (2011). GRADE guidelines: 1. Introduction—GRADE evidence
profiles and summary of findings tables. Journal of clinical epidemiology, 64(4), 383-394.
38 Cardoso, F., Kyriakides, S., Ohno, S., Penault-Llorca, F., Poortmans, P., Rubio, I. T., ...
& Senkus, E. (2019). Early breast cancer: ESMO Clinical Practice Guidelines for diagnosis,
treatment and follow-up. Annals of Oncology, 30(8), 1194-1220.
39 Contro le gerarchie di evidenza e sulla dissoluzione delle gerarchie con GRADE, si
veda Stegenga, J. (2014). Down with the hierarchies. Topoi, 33(2), 313-322.
40 Il riferimento classico è Russo, F., & Williamson, J. (2007). Interpreting causality in the
health sciences. International studies in the philosophy of science, 21(2), 157-170.
41 Howick, J.( 2016) The Philosophy of Evidence-based Medicine. Oxford: Wiley. Edizione
del Kindle, pp. 124-128. Si veda anche Broadbent, A. (2011) Inferring causation in epidemi-
ology: mechanisms, black boxes, and contrasts. In Illari, Russo and Williamson (eds.) Cau-
sality in the Sciences, OUP, Oxford, 2011, 45-69.
42 La fonte è Yap, Y. G., & Camm, A. J. (1999). Lessons from antiarrhythmic trials involv-
ing class III antiarrhythmic drugs. The American journal of cardiology, 84(9), 83-89.
43 Schünemann, H., Hill, S., Guyatt, G., Akl, E. A., & Ahmed, F. (2011). The GRADE
approach and Bradford Hill’s criteria for causation. Journal of Epidemiology & Community
Health, 65(5), 392-395.
44 Si veda ad esempio La Caze, A. (2011). The role of basic science in evidence-based med-
icine. Biology & Philosophy, 26(1), 81-98.

45 Un lavoro filosofico interamente dedicato al problema è Steel, D. (2007). Across the

boundaries: Extrapolation in biology and social science. Oxford University Press.
46 Questo punto è sollevato tra gli altri da Upshur, R. (2005). Looking for rules in a
world of exceptions: reflections on evidence-based practice. Perspectives in biology and medi-
cine, 48(4), 477-489.
47 Deaton, A., & Cartwright, N. (2018). Understanding and misunderstanding random-
ized controlled trials. Social Science & Medicine, 210, 2-21.
48 Last, J. M. (2001) A Dictionary of Epidemiology. Fourth Edition. Oxford University Press,
disponibili sul sito del Centre for Evidence-based medicine, https://www.cebm.ox.ac.uk/
resources/ebm-tools/glossary, accesso del 6 dicembre 2020.
49 Un articolo riassuntivo utile su validità interna ed esterna scritto da un filosofo della
medicina è La Caze A. (2017) The randomized controlled trial: internal and external validi-
ty. In: Solomon M, Simon J and Kincaid H (eds). The Routledge Companion to Philosophy
of Medicine. London: Routledge, pp.200–203.
50 Van Spall, H. G., Toren, A., Kiss, A., & Fowler, R. A. (2007). Eligibility criteria of ran-
domized controlled trials published in high-impact general medical journals: a systematic
sampling review. Jama, 297(11), 1233-1240.
51 Gerber, D. E., Pruitt, S. L., & Halm, E. A. (2015). Should criteria for inclusion in cancer
clinical trials be expanded? Journal of comparative effectiveness research, 4(4), 289-291.
52 Ford, I., & Norrie, J. (2016). Pragmatic trials. New England journal of medicine, 375(5),
454-463.
53 Rothwell, P. M. (2005). External validity of randomised controlled trials:“to whom do
the results of this trial apply?”. The Lancet, 365(9453), 82-93.
54 Hwang, T. J., & Gyawali, B. (2019). Association between progression‐free survival and
patients’ quality of life in cancer clinical trials. International journal of cancer, 144(7), 1746-
1751. Per gli endpoint surrogati si veda Kim, C., & Prasad, V. (2015). Cancer drugs approved
on the basis of a surrogate end point and subsequent overall survival: an analysis of 5 years
of US Food and Drug Administration approvals. JAMA internal medicine, 175(12), 1992-1994.
55 Kersting, C., Kneer, M., & Barzel, A. (2020). Patient-relevant outcomes: what are we
talking about? A scoping review to improve conceptual clarity. BMC health services re-
search, 20(1), 1-16., Muldoon, M. F., Barger, S. D., Flory, J. D., & Manuck, S. B. (1998). What
are quality of life measurements measuring?. Bmj, 316(7130), 542.

RIFERIMENTI BIBLIOGRAFICI
Alter, D. A., Naylor, C. D., Austin, P., & Tu, J. V. (1999). Effects of socioeconomic status
on access to invasive cardiac procedures and on mortality after acute myocardial infarction.
New England Journal of Medicine, 341(18), 1359-1367.
Amoretti, M. C. (2015). Filosofia e medicina. Roma, Carocci
Andersen, H. and Hepburn, B. (2020) Scientific Method. The Stanford Encyclopedia of Phi-
losophy (Winter 2020 Edition), Edward N. Zalta (ed.), https://plato.stanford.edu/archives/
win2020/entries/scientific-method/, accesso 12 gennaio 2021
Andersen, H. and Hepburn, B. (2020) Scientific Method. The Stanford Encyclopedia of Phi-
losophy (Winter 2020 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/ar-
chives/win2020/entries/scientific-method/
Annweiler, C., Hanotte, B., de l’Eprevier, C. G., Sabatier, J. M., Lafaie, L., & Célarier,
T. (2020). Vitamin D and survival in COVID-19 patients: A quasi-experimental study. The
Journal of steroid biochemistry and molecular biology, 204, 105771.
Anon (1995). Abortion: one Romania is enough. Lancet 1995; 345: 137–38.
Antiseri, D., Scandellari, C., & Federspil, G. (2003). Epistemologia, clinica medica e la
questione delle medicine eretiche. Cosenza: Rubbettino Editore.
Bacone, F. (1975) [1620] Scritti filosofici. Torino: UTET
Barminko, J. A., Nativ, N. I., Schloss, R., & Yarmush, M. L. (2014). Fractional factorial
design to investigate stromal cell regulation of macrophage plasticity. Biotechnology and bio-
engineering, 111(11), 2239-2251
Beaney, M. (2018) Analysis. The Stanford Encyclopedia of Philosophy (Summer 2018 Edi-
tion), Edward N. Zalta (ed.), https://plato.stanford.edu/archives/sum2018/entries/analysis/,
accesso del 28 novembre 2020.

Begg, C., Cho, M., Eastwood, S., Horton, R., Moher, D., Olkin, I., ... & Stroup, D. F.
(1996). Improving the quality of reporting of randomized controlled trials: the CONSORT
statement. Jama, 276(8), 637-639.
Beral V, Banks E, Reeves G. (2002) Evidence from randomised trials on the longterm
effects of hormone replacement therapy. Lancet 2002; 360:942-4.
Bernard, C. (1865). Introduction à l’étude de la médecine expérimentale par m. Claude
Bernard. Paris: Baillière.
Beyerstein, B. L., & Beyerstein, D. F. (1992). The write stuff: Evaluations of graphology, the
study of handwriting analysis. Buffalo: Prometheus Books.
Bird, A. (2010). Eliminative abduction: examples from medicine. Studies in History and
Philosophy of Science Part A, 41(4), 345-352.
Bird, A. (2011). The epistemological function of Hill’s criteria. Preventive Medicine, 53(4-
5), 242-245.
Black, N. (1999). Evidence-based surgery: a passing fad?. World journal of surgery, 23(8),
789-793.
Blaskiewicz, R. (2013). The Big Pharma conspiracy theory. Medical Writing, 22(4), 259-
261.
Bluhm, R. (2009). Evidence-based medicine and patient autonomy. IJFAB: International
Journal of Feminist Approaches to Bioethics, 2(2), 134-151.
Boden, M. A. (2004) The Creative Mind: Myths and Mechanisms. London: Routledge
Boem, F. (2020) Scientific Protocols as Recipes. Humana Mente 13 (38), 281-299
Bolliger, C. T., Zellweger, J. P., Danielsson, T., van Biljon, X., Robidou, A., Westin, Å., ...
& Säwe, U. (2000). Smoking reduction with oral nicotine inhalers: double blind, randomi-
sed clinical trial of efficacy and safety. Bmj, 321(7257), 329-333.
Boniolo, G., Dalla Chiara, M. L., Giorello, G., Sinigaglia, C., & Tagliagambe, S. (2002).
Filosofia della scienza. Milano: Raffaello Cortina.
Borgerson, K. (2009). Valuing evidence: bias and the evidence hierarchy of evidence-ba-
sed medicine. Perspectives in biology and medicine, 52(2), 218-233.
Borges, J.L. (1984) L’idioma analitico di John Wilkins. In Altre inquisizioni, Tutte le opere.
Volume I. Milano: Mondadori. 1984
Bramley, N., & Eatough, V. (2005). The experience of living with Parkinson’s disease: An
interpretative phenomenological analysis case study. Psychology & Health, 20(2), 223-235.
Brewer, J. F. (1999). Graphology. Complementary Therapies in Nursing and Midwifery, 5(1), 6-14.
Broadbent, A. (2009). Causation and models of disease in epidemiology. Studies in Hi-
story and Philosophy of Science Part C: Studies in History and Philosophy of Biological and Biome-
dical Sciences, 40(4), 302-311
Campaner, R. (2005). Spiegazioni e cause in medicina: un’indagine epistemologica. Gedit edi-
zioni.

Riferimenti bibliografici 147
Campaner, R. (2011). Understanding mechanisms in the health sciences. Theoretical me-

dicine and bioethics, 32(1), 5-17.
Cardoso, F., Kyriakides, S., Ohno, S., Penault-Llorca, F., Poortmans, P., Rubio, I. T., ...
& Senkus, E. (2019). Early breast cancer: ESMO Clinical Practice Guidelines for diagnosis,
treatment and follow-up. Annals of Oncology, 30(8), 1194-1220.
Carnap, R. (1971). I fondamenti filosofici della fisica. Milano: Il Saggiatore
Cartabellotta, N. (2010) Pillole di metodologia della ricerca. Gimbe News 3, 2, 15-16.
Castellani, E., Morganti, M. (2019) La filosofia della scienza. Bologna, il Mulino
Catalogue of Bias Collaboration, Holman B, Bero L, & Mintzes B. (2019) Industry Spon-
sorship bias. https://catalogofbias.org/biases/industry-sponsorship-bias/, accesso del 2 gen-
naio 2021.
Catalogue of Biases Collaboration, Spencer EA, Heneghan C. (2018) Compliance bias.
In: Catalogue Of Biases, www.catalogueofbiases.org/biases/compliancebias, accesso del 30
novembre 2020.
Céline, L. F. (2020). Il dottor Semmelweis. Torino: Adelphi Edizioni.
Centers for Disease Control and Prevention (1981) Morbidity and Mortality Weekly Re-
port June 5, 30 (21), 1-3.
Chalmers, A. (1982) What is this thing Called Science. Milton Kynes: Open University Press
Clancy, C. M., & Eisenberg, J. M. (1998). Outcomes research: Measuring the end results
of health care. Science, 282(5387), 245.
Coliva. A. e Lalumera, E. Pensare. Leggi ed errori del ragionamento. Roma: Carocci
2006.
Connor, S. and Kingman, S. (1989). The Search for the Virus. Harmondsworth: Penguin
Books.
Craven, L. L. (1950). Coronary thrombosis can be prevented. Journal of insurance medicine
5(4), 47.
Craven, L. L. (1953). Experiences with aspirin (acetylsalicylic acid) in the nonspecific
prophylaxis of coronary thrombosis. Mississippi Valley Medical Journal 75: 38–44.
Curd, M., & Psillos, S. (Eds.). (2013). The Routledge companion to philosophy of science. Lon-
don: Routledge
Daniel, W. (1996) Biostatistica. Napoli: EdiSes
Davenas, E., Beauvais, F., Amara, J., Oberbaum, M., Robinzon, B., Miadonnai, A., ... &
Sainte-Laudy, J. (1988). Human basophil degranulation triggered by very dilute antiserum
against IgE. Nature, 333(6176), 816-818.
Dazzi, C., & Pedrabissi, L. (2009). Graphology and personality: an empirical study on
validity of handwriting analysis. Psychological reports, 105(3_suppl), 1255-1268.
Deaton, A., & Cartwright, N. (2018). Understanding and misunderstanding randomized
controlled trials. Social Science & Medicine, 210, 2-21.

Doll R, Payne P, Waterhouse J (1966) eds. Cancer incidence in five continents, vol. I.
Geneva: Union Internationale Contre le Cancer.
Doll, R. (2001). Cohort studies: history of the method II. Retrospective cohort studies.
Sozial-und Präventivmedizin, 46(3), 152-160.
Doll, R., & Hill, A. B. (1964). Mortality in relation to smoking: ten years’ observations of
British doctors. British medical journal, 1(5395), 1399.
Doll, R., Peto, R., Boreham, J., & Sutherland, I. (2004). Mortality in relation to smoking:
50 years’ observations on male British doctors. British Medical Journal, 328(7455), 1519
Elgin, C. Z. (2017). True enough. Boston: MIT Press.
Eliopoulos, G. M., Harris, A. D., Bradham, D. D., Baumgarten, M., Zuckerman, I. H.,
Fink, J. C., & Perencevich, E. N. (2004). The use and interpretation of quasi-experimental
studies in infectious diseases. Clinical infectious diseases, 38(11), 1586-1591.
Feynman, R. (1964) Messenger Lectures: The character of Physical Law. Cambridge,
MIT Press.
Fisher, R. A. (1958). Cancer and smoking. Nature, 182(4635), 596-596.
Ford, I., & Norrie, J. (2016). Pragmatic trials. New England journal of medicine, 375(5), 454-
463.
Galavotti, M.C.e Campaner, R. (2017) Filosofia della scienza. Milano: Egea
Galilei, G (1970). Discorso sopra i massimi sistemi. Torino: Einaudi
Galilei, G. Il Saggiatore, Milano, Feltrinelli 1992 (ed. or. 1623)
Gallo, R. C., & Montagnier, L. (2003). The discovery of HIV as the cause of AIDS. New
England Journal of Medicine, 349(24), 2283-2285.
Gerber, D. E., Pruitt, S. L., & Halm, E. A. (2015). Should criteria for inclusion in cancer
clinical trials be expanded? Journal of comparative effectiveness research, 4(4), 289-291.
Giannini, M., Pellegrini, P., Gori, A., & Loscalzo, Y. (2019). Is graphology useful in asses-
sing major depression?. Psychological reports, 122(2), 398-410
Gillies, D. (2005). Hempelian and Kuhnian approaches in the philosophy of medicine:
the Semmelweis case. Studies in history and philosophy of science part C: Studies in history and
philosophy of biological and biomedical sciences, 36(1), 159-181.
Glenn, B. A., Bastani, R., & Maxwell, A. E. (2013). The perils of ignoring design effects
in experimental studies: lessons from a mammography screening trial. Psychology & health,
28(5), 593-602. You, W. C., Brown, L. M., Zhang, L., Li, J. Y., Jin, M. L., Chang, Y. S., ... & Gail,
M. H. (2006). Randomized double-blind factorial trial of three treatments to reduce the pre-
valence of precancerous gastric lesions. Journal of the National Cancer Institute, 98(14), 974-983.
Goldberger, J. J., & Buxton, A. E. (2013). Personalized medicine vs guideline-based me-
dicine. Jama, 309(24), 2559-2560
Goodman, S. (2008). A Dirty Dozen: Twelve P-Value Misconceptions. In Seminars in He-
matology (Vol. 3, No. 45, pp. 135-140).

Gordon, P. R., Kerwin, J. P., Boesen, K. G., & Senf, J. (2006). Sertraline to treat hot flashes:
a randomized controlled, double-blind, crossover trial in a general population. Menopause,
13(4), 568-575.
Grimes, D. A., & Schulz, K. F. (2002). An overview of clinical research: the lay of the land.
Lancet, 359(9300), 57-61
Grimes, D. A., & Schulz, K. F. (2002). Descriptive studies: what they can and cannot do.
The Lancet, 359(9301), 145-149.
Guyatt, G., Oxman, A. D., Akl, E. A., Kunz, R., Vist, G., Brozek, J., ... & Schünemann, H. J.
(2011). GRADE guidelines: 1. Introduction—GRADE evidence profiles and summary of fin-
dings tables. Journal of clinical epidemiology, 64(4), 383-394.
Hempel, C. G. (1965) Philosophy of natural science. Prentice Hall: Englewood Cliffs.
Higgins J., Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Co-
chrane Handbook for Systematic Reviews of Interventions version 6.1 (updated September 2020).
Cochrane, 2020, www.training.cochrane.org/handbook, accesso del 2 gennaio 2021.
Hill, S. B. (1965). The Environment and Disease: Association or Causation?. Proceedings
Howick, J. (2016) The Philosophy of Evidence-based Medicine. Oxford: Oxford Univer-
sity Press.
Hoyningen-Huene, P. (2013). Systematicity: The nature of science. Oxford University Press.
Hwang, T. J., & Gyawali, B. (2019). Association between progression‐free survival and
patients’ quality of life in cancer clinical trials. International journal of cancer, 144(7), 1746-1751
Illari, P. M., & Williamson, J. (2012). What is a mechanism? Thinking about mechanisms
across the sciences. European Journal for Philosophy of Science, 2(1), 119-135
Imai, K., & Nakachi, K. (1995). Cross sectional study of effects of drinking green tea on
cardiovascular and liver diseases. British Medical Journal, 310 (6981), 693-696.
Jorge Luis Borges (1984) L’idioma analitico di John Wilkins. In Altre inquisizioni, Tutte le
opere. Volume I. Milano: Mondadori. 1984
Kendall, J. (2003). Designing a research project: randomised controlled trials and their
principles. Emergency medicine journal: EMJ, 20(2), 164.
Kersting, C., Kneer, M., & Barzel, A. (2020). Patient-relevant outcomes: what are we
talking about? A scoping review to improve conceptual clarity. BMC health services research,
20(1), 1-16
Kim, A. H., Sparks, J. A., Liew, J. W., Putman, M. S., Berenbaum, F., Duarte-García, A., ...
& Grainger, R. A Rush to Judgment? Rapid Reporting and Dissemination of Results and Its
Consequences Regarding the Use of Hydroxychloroquine for COVID-19. Annals of Internal
Medicine.
Kim, C., & Prasad, V. (2015). Cancer drugs approved on the basis of a surrogate end
point and subsequent overall survival: an analysis of 5 years of US Food and Drug Admini-
stration approvals. JAMA internal medicine, 175(12), 1992-1994.

Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi (ed. or.
1962)
Kuhn, T.S. (1980) Logica della scoperta o psicologia della ricerca? In Giorello, G. (a cura
di) Critica e crescita della conoscenza. Milano: Feltrinelli
La Caze A. (2017) The randomized controlled trial: internal and external validity. In:
Solomon M, Simon J and Kincaid H (eds). The Routledge Companion to Philosophy of Me-
dicine. London: Routledge, 200–203.
La Caze, A. (2011). The role of basic science in evidence-based medicine. Biology & Phi-
losophy, 26(1), 81-98.
Lalumera, E. (2019) Il problema della classificazione dei disturbi mentali. Cap. 4 in R.
Guerini e M. Marraffa (a cura di) (2019) Psicopatologia e scienze cognitive. Roma: Carocci
LaMorte, W. (2016) Outbreak investigations. Boston: Boston University School of Public
Health
Langevin-Joliot, H. (1998). Radium, Marie Curie and Modern Science. Radiation Research,
S3-S8.
Last, J. M. (2001) A Dictionary of Epidemiology. Fourth Edition. Oxford University
Press, disponibili sul sito del Centre for Evidence-based medicine, https://www.cebm.ox.ac.
uk/resources/ebm-tools/glossary, accesso del 6 dicembre 2020.
Laudisa F. (2012). Causalità. APhEx 5. On-line: http://www.aphex.it/index.php?Temi=-
557D030122027403210E057677 73
Laudisa, F. e Datteri, E. (2012) La natura e i suoi modelli. Bologna: Archetipolibri.
Laupacis A, Wells G, Richardson S, et al. Users guides to the medical literature. V. How
to use an article about prognosis. JAMA 1994; 272:234–237
Lavik, E., Kuehn, M. H., & Kwon, Y. H. (2011). Novel drug delivery systems for glauco-
ma. Eye, 25(5), 578-586.
Lexchin, J., Bero, L. A., Djulbegovic, B., & Clark, O. (2003). Pharmaceutical industry
sponsorship and research outcome and quality: systematic review. Bmj, 326(7400), 1167-
1170
Lorenzano P. (2014) What is the status of the Hardy-Weinberg law within population
genetics? In: Galavotti M.C., Nemeth E., Stadler F. (eds) European philosophy of science—
philosophy of science in Europe and the Viennese Heritage, Vienna Circle Institute Yearbo-
ok 17. Springer, Dordrecht, pp 159–172
Lucas, R. M., & McMichael, A. J. (2005). Association or causation: evaluating links betwe-
en environment and disease. Bulletin of the World Health Organization, 83, 792-795.
Marshall B. and Warren R. (1984). Unidentified Curved Bacilli in the Stomach of Patients
with Gastritis and Peptic Ulceration. Lancet. 2 (8626/8627):1437-41
McBride, W. G. (1961) Thalidomide and Congenital Abnormalities. Letter to the Editor.
The Lancet 2 (December 16, 1961): 1358

Melchert, M., & List, A. (2007). The thalidomide saga. The international journal of bioche-
mistry & cell biology, 39(7-8), 1489-1499.
Mill, J. S. (1869). A System of Logic, Ratiocinative and Inductive: Being a Connected View of the
Princilples of Evidence and the Methods of Scientific Investigation. London: Harper and brothers
Miner, J., & Hoffhines, A. (2007). The discovery of aspirin’s antithrombotic effects. Texas
Heart Institute Journal, 34(2), 179-186.
Muldoon, M. F., Barger, S. D., Flory, J. D., & Manuck, S. B. (1998). What are quality of life
measurements measuring?. BMJ, 316(7130), 542.
Nelson, D. L., & Cox, M. M. (2017). Lehninger Principles of Biochemistry 7th edition.
London, MacMillan, ii. Traversa, G., Maggini, M., Menniti‐Ippolito, F., Bruzzi, P., Chiarot-
ti, F., Greco, D., ... & Italian Study Group for the Di Bella Multitherapy Trials. (1999). The
unconventional Di Bella cancer treatment: A reflection on the Italian experience. Cancer,
86(10), 1903-1911.
Newton, I. (1997) Opere, a cura di Pala, A. vol. 1, Principi matematici della filosofia na-
turale, Torino, UTET
Nissen, T., & Wynn, R. (2014). The clinical case report: a review of its merits and limita-
tions. BMC research notes, 7(1), 264.
Okasha, S. (2012) Il Primo libro di filosofia della scienza. Torino: Einaudi.
Osimani, B. (2013). Until RCT proven? On the asymmetry of evidence requirements for
risk assessment. Journal of evaluation in clinical practice, 19(3), 454-462.
Oxford Centre for Evidence-Based Medicine (2009) Levels of Evidence (March 2009). Di-
sponibile a https://www.cebm.ox.ac.uk/resources/levels-of-evidence/oxford-centre-for-evi-
dence-based-medicine-levels-of-evidence-march-2009, accesso del 25 novembre 2020
Pagnini, A. (2010). Filosofia della medicina. Epistemologia, ontologia, etica, diritto.
Roma: Carocci.
Pearce, N. (2000). The ecological fallacy strikes back. Journal of Epidemiology and Commu-
nity Health, 54(5), 326
Popper, K. R (1972) [1953]. Congetture e confutazioni: lo sviluppo della conoscenza scientifica.
Bologna: il Mulino.
Popper, K. R. (1970) [1964]. Logica della scoperta scientifica. Torino: Einaudi.
Popper, K. R. (1989) Logica della ricerca e società aperta, Antologia a cura di D. Antiseri.
Brescia: La Scuola. 36-37
Psillos, S. (1999) Scientific Realism: How Science Tracks Truth, London: Routledge
RECOVERY Collaborative Group. (2020). Effect of hydroxychloroquine in hospitalized
patients with Covid-19. New England Journal of Medicine, 383(21), 2030-2040.
Ribot, T. (1898). Correspondance. Revue Encyclopédique, 8(232), 151, citato in Nicolas, S., An-
drieu, B., Sanitioso, R., Vincent, R. & Murray, D. (2015). Alfred Binet and Crépieux-Jamin: Can
intelligence be measured scientifically by graphology?. L’Année psychologique, vol. 115(1), 3-52.

Rimando a Romeijn, J. (2017) Philosophy of Statistics. The Stanford Encyclopedia of Phi-

losophy (Spring 2017 Edition), Edward N. Zalta (ed.), https://plato.stanford.edu/archives/
spr2017/entries/statistics/, accesso del 20 dicembre 2020.
Rogers, W. A. (2002). Evidence‐based medicine in practice: limiting or facilitating pa-
tient choice?. Health Expectations, 5(2), 95-103.
Röhrig, B., Du Prel, J. B., Wachtlin, D., & Blettner, M. (2009). Types of study in medical
research: part 3 of a series on evaluation of scientific publications. Deutsches Arzteblatt Inter-
national, 106(15), 262.
Rothwell, P. M. (2005). External validity of randomised controlled trials:“to whom do
the results of this trial apply?”. The Lancet, 365(9453), 82-93.
Russo, F., & Williamson, J. (2007). Interpreting causality in the health sciences. Interna-
tional studies in the philosophy of science, 21(2), 157-170.
Russo, L. (2003). Flussi e riflussi: indagine sull’origine di una teoria scientifica. Milano: Fel-
trinelli Editore.
Rutjes AW, Reitsma JB, Vandenbroucke JP, Glas AS, Bossuyt P.(2005) Case-control and
two-gate designs in diagnostic accuracy studies. Clinical Chemistry 51:1335-41
Sackett, D. L. (1979). Bias in analytic research. Journal of chronic diseases, 32(1-2), 51.
Sackett, D. L., & Haynes, R. B. (2002). The architecture of diagnostic research. British
Medical Journal, 324(7336), 539-541.
Sackett, D. L., Rosenberg, W. M., Gray, J. M., Haynes, R. B., & Richardson, W. S. (1996).
Evidence based medicine: what it is and what it isn’t. BMJ: British Medical Journal, 312(7023), 71.
SaPeRiDoc. Centro per la salute perinatale e riproduttiva (2010) Bologna: Servizio Sani-
tario dell’Emilia- Romagna, https://www.saperidoc.it/flex/cm/pages/ServeBLOB.php/L/IT/
IDPagina/586, accesso del 3 gennaio 2021.
Schlesselman J. (1982) Case-control studies. New York: Oxford University Press.
Schmidt, C. O., & Kohlmann, T. (2008). When to use the odds ratio or the relative risk?.
International journal of public health, 53(3), 165.
Schulz, K. F., Altman, D. G., Moher, D., & Consort Group. (2010). CONSORT 2010 sta-
tement: updated guidelines for reporting parallel group randomised trials. Trials, 11(1), 32.
Schünemann H, Brożek J, Guyatt G, Oxman A, editors (2013) GRADE handbook for
grading quality of evidence and strength of recommendations. Updated October 2013. The
GRADE Working Group, disponibile a https://gdt.gradepro.org/app/handbook/handbook.
html#h.9rdbelsnu4iy, accesso del 20 novembre 2020.
Schünemann, H., Hill, S., Guyatt, G., Akl, E. A., & Ahmed, F. (2011). The GRADE appro-
ach and Bradford Hill’s criteria for causation. Journal of Epidemiology & Community Health,
65(5), 392-395.
Self, W. H., Semler, M. W., Leither, L. M., Casey, J. D., Angus, D. C., Brower, R. G., ... &
Brown, S. M. (2020). Effect of hydroxychloroquine on clinical status at 14 days in hospitali-
zed patients with COVID-19: a randomized clinical trial. JAMA, 324(21), 2165-2176.

Semmelweis, I. P. (1861). Die aetiologie, der begriff und die prophylaxis des kindbettfie-
bers. Wien: Hartleben.
Senn, S. (2018). Statistical pitfalls of personalized medicine. Nature, 563(7733), 619-621.
Shader, R. I. (2018). Safety Versus Tolerability. Clinical therapeutics, 40(5), 672-673.
Shadish, W. R., & Heinsman, D. T. Experiments Versus Quasi-Experiments: Do They
Yield the Same Answer? Meta-Analysis of Drug Abuse Prevention Programs, 147.
Shang, J., Wan, Y., Luo, C., Ye, G., Geng, Q., Auerbach, A., & Li, F. (2020). Cell entry
mechanisms of SARS-CoV-2. Proceedings of the National Academy of Sciences, 117(21), 11727-
11734. Bechtel, W., & Abrahamsen, A. (2005). Explanation: A mechanist alternative. Studies
in History and Philosophy of Science Part C: Studies in History and Philosophy of Biological and
Biomedical Sciences, 36(2), 421-441
Smith, G. D., & Ebrahim, S. (2002). Data dredging, bias, or confounding: They can all get
you into the BMJ and the Friday papers. BMJ: British Medical Journal, 325(7378), 1437.
Stampfer M., Colditz G. (1991) Estrogen replacement therapy and coronary heart disease:
a quantitative assessment of the epidemiologic evidence. Preventive Medicine 1991; 20:47-63
Steel, D. (2007). Across the boundaries: Extrapolation in biology and social science. Oxford
University Press.
Stegenga, J. (2014). Down with the hierarchies. Topoi, 33(2), 313-322.
Straus, S. E., Glasziou, P., Richardson, W. S., Haynes, R. B., Pattani, R., & Veroniki, A. A.
(2005). How to practice and teach EBM. Evidence-Based Medicine. Third edition. New York:
Elsevier, 13-29.
Supino, P. G. (2012). The Research Hypothesis: Role and Construction. In Principles of
Research Methodology (pp. 31-53). Springer, New York, NY.
Thagard P. (1998). Ulcers and Bacteria I: Discovery and Acceptance. Studies in History
and Philosophy of Science. Part C: Studies in History and Philosophy of Biology and Biomedical
Sciences. 29:107-36.
Thornton, T. (2007). Essential philosophy of psychiatry. Oxford: Oxford University Press.
Tu, J. V., & Ko, D. T. (2008). Ecological studies and cardiovascular outcomes research.
Circulation, 118(24), 2588-2593.
U.S. Department of Health and Human Services Centers for Disease Control and Pre-
vention (CDC) (2012) Principles of Epidemiology in Public Health Practice. Atlanta: CDC
Upshur, R. (2005). Looking for rules in a world of exceptions: reflections on evidence-ba-
sed practice. Perspectives in biology and medicine, 48(4), 477-489.
Van Spall, H. G., Toren, A., Kiss, A., & Fowler, R. A. (2007). Eligibility criteria of ran-
domized controlled trials published in high-impact general medical journals: a systematic
sampling review. Jama, 297(11), 1233-1240.
Venes, D. (2009) Taber’s Cyclopedic Medical Dictionary. 21st edition. Philadelphia: F.A.
Davis Company

Wendler, D. The Ethics of Clinical Research. The Stanford Encyclopedia of Philosophy

(Winter 2017 Edition), Edward N. Zalta (ed.), online https://plato.stanford.edu/archives/
win2017/entries/clinical-research/, accesso del 2 dicembre 2020.
Wikipedia contributors. (2020, November 10). Paul the Octopus. In Wikipedia, The Free
Encyclopedia. Retrieved 16:17, December 13, 2020, from https://en.wikipedia.org/w/index.
php?title=Paul_the_Octopus&oldid=987926383
Wikipedia contributors. (2020, November 23). Science. In Wikipedia, The Free Encyclope-
dia. Retrieved 09:45, November 26, 2020, from https://en.wikipedia.org/w/index.php?title=-
Science&oldid=990161801
Wilde, M.; and Williamson, J. 2016. Models in medicine. In Routledge Companion to
Philosophy of Medicine, ed. by M. Solomon, J. Simon and H. Kincaid, 271–84. Routledge:
New York and London.
Willett W. (1990) Vitamin A and lung cancer. Nutrition Reviews 1990; 48:201-11, men-
tre il trial è Alpha-Tocopherol, Beta Carotene Cancer Prevention Study Group (1994). The
effect of vitamin E and beta carotene on the incidence of lung cancer and other cancers in
male smokers. New England Journal of Medicine 330:1029-35.
Woodward, J. (2019) Scientific Explanation. The Stanford Encyclopedia of Philosophy (Win-
ter 2019 Edition), Edward N. Zalta (ed.), https://plato.stanford.edu/archives/win2019/en-
tries/scientific-explanation, accesso del 24 dicembre 2020
Worrall, J. (2007). Why there’s no cause to randomize. The British Journal for the Philo-
sophy of Science, 58(3), 451-488.
Yap, Y. G., & Camm, A. J. (1999). Lessons from antiarrhythmic trials involving class III
antiarrhythmic drugs. The American journal of cardiology, 84(9), 83-89.

Che cos’è il metodo scientifico, che distingue le
scienze dagli altri saperi? E che cos’è il metodo
scientifico nella ricerca in medicina oggi? Questo
ELISABETTA LALUMERA
libro è un’introduzione alla metodologia della ri-
cerca clinica e insieme un’introduzione ad alcuni
ELISABETTA LALUMERA - MEDICINA E METODO SPERIMENTALE. UN’INTRODUZIONE FILOSOFICA

temi del dibattito contemporaneo in filosofia del-
la medicina. Con un linguaggio molto semplice,
senza formule statistiche né gergo filosofico e con MEDICINA E METODO SPERIMENTALE
esempi tratti dalla letteratura medica, il volume
traccia un percorso dai fondamenti del metodo
fino alla metodologia contemporanea e alla gerar- UN’INTRODUZIONE FILOSOFICA
chia delle evidenze della Evidence-based medicine.
Vengono illustrati i vari tipi di studi, osservazio-
nali e sperimentali chiedendosi, per ciascuno: che
tipo di ragioni fornisce? Quali sono i suoi limiti e
potenzialità epistemiche, cioè rispetto alla ricerca
della verità?
Elisabetta Lalumera (PhD in

filosofia, 2001) si occupa di
filosofia della medicina. Ha
studiato nelle università di
Bologna, Piemonte Orienta-
le, Londra e Aberdeen, e ha
insegnato Filosofia del linguaggio e della scienza
Feedback
all’Università di Milano-Bicocca dal 2006. Oggi
svolge attività di insegnamento e ricerca presso il
978-88-9385-250-0 dipartimento di Scienze per la Qualità della Vita
dell’Università di Bologna. Ha pubblicato sulle
principali riviste di filosofia della medicina inter-
nazionali e ha svolto attività di consulenza per
istituzioni sanitarie e ospedaliere. Tra i suoi libri:
Euro 18,00
Philosophy of Advanced Medical Imaging (a cura di,
con S. Fanti, Springer), Cosa sono i concetti (Later-
za) Pensare. Leggi ed errori del ragionamento (con
A. Coliva, Carocci). Fa parte del consiglio direttivo
del centro interateneo PhilHeaD-Research Center in
www.editrice-esculapio.it
Philosophy of Health and Disease.
CopertinaSceltaLalumera.indd 1 16/02/2021 10:56:37

Elisabetta Lalumera - Medicina e Metodo Sperimentale

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Elisabetta Lalumera - Medicina e Metodo Sperimentale

Caricato da

Copyright:

Formati disponibili

Che cos’è il metodo scientifico, che distingue le

scienze dagli altri saperi? E che cos’è il metodo

ELISABETTA LALUMERA - MEDICINA E METODO SPERIMENTALE. UN’INTRODUZIONE FILOSOFICA

Elisabetta Lalumera (PhD in

CopertinaSceltaLalumera.indd 1 16/02/2021 10:56:37

MEDICINA E METODO SPERIMENTALE

Libro Lalumera.indb 1 16/02/2021 11:26:51

Layout copertina: Laura Brugnoli

Libro Lalumera.indb 2 16/02/2021 11:26:51

Capitolo primo: Che cos’è la scienza............................................................................. 1

Capitolo secondo: Il metodo sperimentale................................................................ 33

Libro Lalumera.indb 3 16/02/2021 11:26:51

Capitolo terzo: Gli studi osservazionali..................................................................... 63

Capitolo quarto: Gli studi sperimentali................................................................... 105

Riferimenti bibliografici.............................................................................................. 145

Libro Lalumera.indb 4 16/02/2021 11:26:51

* Kuhn, T. S. (1999) La struttura delle rivoluzioni scientifiche. Torino: Einaudi, 68

Libro Lalumera.indb 5 16/02/2021 11:26:51

Libro Lalumera.indb 6 16/02/2021 11:26:51

di risposte. Incidentalmente, questo ruolo della filosofia non è modesto, perché è

Libro Lalumera.indb 7 16/02/2021 11:26:52

Bologna, 2 gennaio 2021

Libro Lalumera.indb 8 16/02/2021 11:26:52

PIANO DEL CAPITOLO

1.1 DUE CASI: LA GRAFOLOGIA E LA MEMORIA DELL’ACQUA

Libro Lalumera.indb 1 16/02/2021 11:26:52

Libro Lalumera.indb 2 16/02/2021 11:26:52

1.2 CHE COS’È LA SCIENZA

Libro Lalumera.indb 3 16/02/2021 11:26:52

Libro Lalumera.indb 4 16/02/2021 11:26:52

Libro Lalumera.indb 5 16/02/2021 11:26:52

dibattito interno14. Analogamente la medicina oggi utilizza molte classificazioni,

Libro Lalumera.indb 6 16/02/2021 11:26:52

Se ciò che esiste, secondo Galileo, è rappresentabile in caratteri matematici, al-

Libro Lalumera.indb 7 16/02/2021 11:26:52

diventare una legge o una generalizzazione legiforme quando raggiunge un certo

Libro Lalumera.indb 8 16/02/2021 11:26:52

siamo piuttosto bravi a riconoscerne uno quando lo vediamo. Un criterio operativo

Libro Lalumera.indb 9 16/02/2021 11:26:52

Dunque, la psicologia e la medicina non sono scienze, mentre la fisica e la chi-

Libro Lalumera.indb 10 16/02/2021 11:26:52

metodologici dell’epoca, all’evidenza disponibile e perché apparivano in grado di

Libro Lalumera.indb 11 16/02/2021 11:26:52

Perché questa digressione sulle rivoluzioni, parlando di scienza, di teorie e di me-

1.6 GLI SCOPI DELLA SCIENZA

Libro Lalumera.indb 12 16/02/2021 11:26:52

Altri obiettivi dell’impresa scientifica sono quello di prevedere i fenomeni

Libro Lalumera.indb 13 16/02/2021 11:26:52

di principio, ma etico-sociale, della credibilità e del prestigio della scienza risiede

1.7 TIPI DI SPIEGAZIONI SCIENTIFICHE

Libro Lalumera.indb 14 16/02/2021 11:26:52

Libro Lalumera.indb 15 16/02/2021 11:26:52

Libro Lalumera.indb 16 16/02/2021 11:26:52

spiegazione contiene. Tornando al primo esempio, il virus e la cellula ospite sono

Libro Lalumera.indb 17 16/02/2021 11:26:52

1.8 UN INTERMEZZO: E LE CAUSE?

Libro Lalumera.indb 18 16/02/2021 11:26:52

Libro Lalumera.indb 19 16/02/2021 11:26:52

Libro Lalumera.indb 20 16/02/2021 11:26:52

Libro Lalumera.indb 21 16/02/2021 11:26:52

Libro Lalumera.indb 22 16/02/2021 11:26:52

1.10 FILOSOFIA DELLA SCIENZA

Libro Lalumera.indb 23 16/02/2021 11:26:52

Libro Lalumera.indb 24 16/02/2021 11:26:52