Sei sulla pagina 1di 384

1

Cap. 1
Introduzione allo studio dell'epidemiologia
1.1.Epidemiologia e malattie dell'uomo negli ultimi 100 anni

OBIETTIVI:

apprendere una comune forma di espressione grafica dei dati;

constatare i progressi compiuti dalla medicina umana - per alcune malattie - nell'arco di un
secolo;

porre l'attenzione sull'importanza dell'interpretazione dei dati.

Questa prima unit didattica ha una funzione introduttiva e in essa vengono proposti, per sommi
capi, alcuni concetti di base per fornire una idea approssimativa riguardo all'approccio
epidemiologico ai problemi sanitari. Pi in particolare, vi si parla delle malattie nelle popolazioni,
della mortalit nell'uomo e negli animali, dei progressi della medicina, dell'importanza dei dati e
della loro presentazione e interpretazione.

I dati

Cominciamo col dire metaforicamente che la materia prima - malta,


cemento, mattoni - di ogni edificio epidemiologico costituita dai dati.
Che cosa sono i dati? Una risposta un po' pi esauriente a questa domanda
si trova nella prossima unit didattica; per ora basta dire che i "dati"
sono numeri o valori o attributi inseriti in un particolare contesto, e che
portano con s una dose di informazione. I dati rappresentano il raccolto
di ogni studio epidemiologico, ed anche il mezzo per giungere a
conclusioni scientificamente valide.
"Dati" sono contenuti, ad esempio, nel grafico (pi precisamente: diagramma a barre) che segue.
2

I dati del diagramma sono stati raccolti dal pi importante Ente internazionale che si occupa di
sanit pubblica: l'Organizzazione Mondiale della Sanit (World Health Organization); essi
rappresentano il numero di morti per alcune forme morbose nel 1900 e nel 1984.

In primo luogo da rilevare l'espressione dei dati numerici sotto forma di diagramma a
barre; questo un tipo di espressione molto utile perch consente di cogliere le
caratteristiche salienti e di effettuare raffronti direttamente a colpo d'occhio (prova per
un attimo a immaginare la minor immediatezza se gli stessi dati fossero presentati in forma tabulare,
e clicca sull'immagine a destra per vedere corrispondente la tabella).

La scala dell'asse orizzontale indica i tassi di mortalit per 100.000 persone e per anno (cio il
numero di morti ogni 100.000 persone in 1 anno per ogni causa considerata). Questo tipo di
espressione (morti/100.000/anno), molto comune in medicina umana, pu essere usato anche in
medicina veterinaria, eventualmente modificando arbitrariamente la scala (es. morti/1000/anno
oppure morti/10.000/mese ecc.) in rapporto alla dimensione numerica della popolazione di animali
in studio e ad altri fattori.

I progressi della medicina

Nel diagramma, le barre rosse forniscono i valori osservati nel 1900, quelle verdi i valori del 1984.
Ad esempio, dal diagramma si desume che nel 1984 sono morte per cancro circa 190 persone su
100.000, mentre nel 1900 ne sono morte - per la stessa causa - soltanto 60 su 100.000.

Ora prova a confrontare le differenze fra barre rosse (anno 1900) e


verdi (anno 1984) per ciascuna delle cause riportate nel diagramma,
tenendo presente che nella porzione alta sono riportate le malattie
infettive, mentre in basso vi sono le malattie non-infettive (per
comodit il grafico riprodotto rimpicciolito qui a destra, clicca per
ingrandirlo).
3

Puoi facilmente notare che, per le malattie infettive, le barre verdi indicanti la frequenza di morti nel
1984 sono pressoch inesistenti. In altre parole, oggi le malattie infettive rappresentano soltanto una
causa di morte trascurabile. In particolare, enormi progressi sono stati ottenuti soprattutto per quelle
malattie infettive che, in passato, hanno rappresentato un flagello per l'umanit. Basti evocare, fra
gli altri, morbi terribili quali: peste, vaiolo, colera; queste malattie non vengono nemmeno
considerate nel grafico, in quanto gi ai primi del '900 non rappresentavano pi un problema.

Spiccano invece i progressi per altre temibili malattie infettive: tubercolosi, influenza, polmonite,
difterite, gastroenteriti infettive e tutte le malattie dell'infanzia. Molte di queste malattie sono
attualmente pressoch scomparse, almeno nei paesi industrializzati cui il diagramma si riferisce.
Quelle che ancora persistono (es. alcune malattie infantili) non rappresentano pi una causa di
morte.
Ben diversa la situazione in paesi meno sviluppati, come si intuisce facilmente se si considera che
le malattie infettive causano annualmente nel mondo quasi 20 milioni di morti, cio oltre 1/3 di tutti
i decessi.

Una parte importante di questi progressi da attribuire alla epidemiologia ed alla medicina
preventiva

I progressi nella Medicina e nelle condizioni di vita dell'uomo nei Paesi industrializzati sono da
attribuire ad una serie di fattori, fra i quali emergono per importanza: miglioramento
dell'alimentazione, disponibilit di acqua pura, controllo dei vettori, pastorizzazione del latte,
educazione delle madri riguardo all'allevamento dei figli, vaccinazioni, utilizzo di antibiotici,
miglioramento generale dell'igiene e delle condizioni di vita.
In questo scenario, il contributo della medicina veterinaria non stato trascurabile: basti pensare ai
miglioramenti dell'igiene degli alimenti di origine animale ed alla lotta alle malattie che possono
essere trasmesse dagli animali all'uomo.

Anche in Italia la mortalit dell'uomo per malattie infettive e parassitarie, particolarmente elevata
agli inizi del secolo, andata progressivamente riducendosi nel tempo, grazie al miglioramento
delle condizioni igieniche e, recentemente, a una maggiore diffusione delle vaccinazioni ed
all'utilizzo di farmaci sempre pi efficaci.
Nel 1998 si sono registrati, a causa di malattie infettive, solo 0.6 decessi ogni 10.000 uomini e 0.5
decessi per ogni 10.000 donne. A scopo di raffronto, considera che nello stesso anno i morti per
malattie cardiovascolari sono stati 48 (maschi) e 32 (femmine), sempre ogni 10.000 individui.
L'interesse per la mortalit per malattie infettive e parassitarie oggi , quindi, limitato ad alcuni
fenomeni emergenti, quali la recrudescenza della tubercolosi, favorita anche dalla resistenza ai
farmaci tradizionali di alcuni ceppi del batterio (Mycobacterium tuberculosis) agente della malattia.
[Fonte dei dati: ISTAT, Istituto Nazionale di Statistica, www.istat.it].

Come si avr modo di imparare durante il corso degli studi, la diminuzione della mortalit per
malattie infettive avvenuta, seppure in misura pi limitata, anche nel settore veterinario
relativamente agli animali "da compagnia" (i cosiddetti pets); al contrario, un analogo
miglioramento non sembra essersi verificato nel settore dell'allevamento industriale degli
animali "da reddito", ossia quelli allevati come fonte di guadagno (bovini, suini, pollame ecc.) per
i quali le malattie infettive continuano a rappresentare fra le pi importanti cause di danni
economici o di mortalit.
4

Progressi o regressi?

Un'altra osservazione: esaminando il diagramma, si potrebbe dedurre che ai progressi ottenuti nel
caso delle malattie infettive si siano associati dei regressi per altre forme morbose (cancro e
malattie cardiache, per le quali la maggiore lunghezza della barra verde rispetto alla rossa
testimonia che si avuto un incremento della frequenza nel periodo 1900-1984).
Questi regressi sono soltanto apparenti e sono dovuti all'allungamento della vita media della
popolazione avvenuto nel corso del XX secolo. Infatti, per una corretta interpretazione dei dati,
bisogna tener conto che in una popolazione con molti anziani saranno pi frequenti le malattie
tipiche della senilit, quali appunto le neoplasie o le malattie di cuore.
La scienza medica ha fatto molti progressi ed ha prolungato la durata della vita dell'uomo; tuttavia
non si vive in eterno e quindi... di qualche malattia bisogna
pur morire! quindi del tutto logico che le patologie tipiche
degli anziani rappresentino una importante causa di morte in
popolazioni composte da molti individui in et avanzata. Per
effettuare un confronto preciso che annulli l'effetto dell'et, i
dati andrebbero standardizzati in base all'et (pi avanti verr
proposto un esempio di standardizzazione delle misure).

Ad ulteriore dimostrazione dei progressi compiuti nel campo


della sanit in tutto il mondo, nel diagramma a sinistra
riportato l'incremento delle speranze di vita delle popolazioni dei paesi sviluppati e non-sviluppati
nell'arco del XX secolo.

Una breve digressione: salute dei


ricchi e salute dei poveri

Nonostante i progressi compiuti, ancora


molto resta da fare. Dovrebbe essere
costantemente presente, nella nostra
coscienza di popoli di Paesi ricchi
economicamente (ma forse non
altrettanto ricchi sul piano morale e
spirituale), la triste condizione in cui
ancora versa una parte considerevole
dell'umanit.
Dati emblematici sono rappresentati nel grafico a destra, che illustra l'andamento della mortalit
infantile nel mondo. Dal 1960 al 2000 nei Paesi industrializzati la mortalit infantile diminuita
dell'80% circa (da 31 a 5.5); nell'Africa sub-sahariana, la diminuzione stata molto pi modesta (da
153 a 108, ossia circa il 30%). Deve far riflettere anche il fatto che nei Paesi non industrializzati la
mortalit infantile causata non da malattie intrinsecamente gravi o incurabili, bens da patologie
che potrebbero essere facilmente prevenute, quali semplice malnutrizione o disidratazione per
diarrea.

NELLA PROSSIMA UNIT:


viene ampliato l'argomento riguardante i dati e la loro interpretazione, e vengono elencati, in
maniera essenziale, gli obiettivi pratici che si possono conseguire attraverso l'applicazione dei
metodi epidemiologici.

Interpretazione dei dati... arte o scienza?


5

Cap. 1.
Introduzione allo studio dell'epidemiologia
1.2 Interpretazione dei dati... arte o scienza?

OBIETTIVI:

apprendere l'impostazione di uno studio scientifico

osservare delle strutture fondamentali di uno studio epidemiologico;

riflettere sull'importanza dell'interpretazione dei dati

L'epidemiologia viene considerata una scienza "eclettica" con molti punti di contatto con altri
settori di studio: le scienze biomediche di base, le scienze cliniche, la statistica ed anche,
relativamente alla epidemiologia umana, la antropologia, la demografia e la sociologia.

In ogni caso, l'epidemiologia (cos come molte altre discipline scientifiche) si basa sul metodo
scientifico. Il metodo scientifico viene usato nelle scienze naturali a partire dalla "rivoluzione
scientifica" del XVII secolo ed rimasto concettualmente invariato; esso si basa sull'osservazione
dei fenomeni naturali e, in buona sostanza, consiste in un procedimento che avanza per passi
successivi (vedi schema) dalle osservazioni fino alle conclusioni utilizzando un rigoroso sistema di
generazione e verifica della ipotesi.

Rappresentazione schematica del metodo scientifico


6

Non sempre i risultati degli esperimenti conducono nella giusta direzione: occasionalmente i
risultati ingannano, e si traggono conclusioni errate. Per la scienza saggia, si accontenta delle
umane limitazioni degli scienziati e non ne teme gli errori individuali, perch il suo incessante
processo di verifica collettiva le permette col tempo di individuarli ed emendarli.

Il metodo scientifico si basa non soltanto sull'osservazione, ma su un processo chiamato


ragionamento ipotetico-deduttivo, che un processo di generazione dell'ipotesi seguito da
tentativi di negare l'ipotesi stessa - cio un processo basato sulla falsificazione dell'ipotesi. In
sostanza, l'impossibilit di rifiutare l'ipotesi rappresenta la prova migliore della sua veridicit.
Pertanto, la forza di una ipotesi dipende dal grado con cui essa pu essere confutata.

Questo concetto stato espresso magistralmente dalla famosa frase di Sherlock


Holmes (il detective creato da sir Arthur Conan Doyle): una mia vecchia
massima che, una volta escluso l'impossibile, ci che resta, per quanto
improbabile, non pu che essere la verit.
Anche fra le famose Leggi di Murphy si trova qualcosa di adatto: la Legge di
Bates sulla ricerca, che recita: La ricerca consiste nel percorrere vicoli per vedere se sono ciechi.

Comunemente, quando si effettuano indagini epidemiologiche "di routine" nella pratica clinica e su
argomenti gi ampiamente noti, alcuni dei passi del classico metodo scientifico vengono omessi, e
lo schema dell'indagine pu essere riassunto in sole 3 fasi:

raccolta dei dati


elaborazione dei dati
interpretazione dei dati (conclusioni)

ESEMPIO. Veniamo interpellati per accertare la frequenza di mastite subclinica in un grande


allevamento di bovine da latte. Conosciamo gi bene questa patologia, e quindi non necessario
formulare alcuna teoria n ri-studiare quanto gi conosciamo sull'argomento, n dobbiamo
formulare alcuna ipotesi sulle cause di mastite, o sulle modalit di trasmissione ecc..
Passiamo quindi direttamente alla raccolta dei dati (ad esempio sottoponendo tutte le vacche in
lattazione ad un test idoneo a rivelare la presenza di mastite). Successivamente elaboriamo i dati (ad
esempio: calcoliamo la proporzione di animali positivi; evidenziamo eventuali correlazioni fra
mastite ed et o altri fattori; calcoliamo gli intervalli di confidenza ecc.). Finalmente, possiamo
trarre le debite conclusioni.

I DATI sono numeri (oppure valori non numerici, come ad esempio s o no, malato o sano ecc.), ma
non sono soltanto numeri. I dati sono numeri in un contesto.
Ad esempio, il numero "3.8" o il valore "3.8 kg" in s non portano alcuna
informazione. Ma se veniamo a sapere che una conoscente ha dato alla luce
un bambino del peso di 3.8 kg, allora questo numero assume significato in
uno specifico contesto e, ad esempio, possiamo congratularci per il buon
peso del bambino, indice di presumibile buona salute.
Il contesto implica il possesso di conoscenze sull'argomento, le quali ci consentono di formulare
giudizi. Ad esempio, sappiamo che un bambino alla nascita non pu pesare 450 grammi, n 45 kg.
Il contesto fa s che il numero contenga informazione.
7

I dati nella pratica

La struttura logica ora descritta (cio i processi di raccolta-elaborazione-interpretazione dei dati)


non peculiare dell'epidemiologia, ma comune anche ad altri settori della professione veterinaria.
Per esempio, nel procedimento diagnostico di fronte ad un animale ammalato, il veterinario
raccoglie dati ( anamnesi, visita dell'animale con evidenziazione dei sintomi, esami di
laboratorio ecc.); questi dati vengono elaborati (spesso quasi inconsciamente!) nella mente del
veterinario che infine, interpretandoli anche in base al suo buon senso clinico, arriver alla
diagnosi.

Durante la visita clinica di un animale, alcuni dei dati raccolti non sono esprimibili in forma
numerica. Ad esempio, impossibile (o molto difficile) misurare e rappresentare con precisione
attraverso un numero fenomeni come l'entit di una zoppicatura o il dolore provocato da una
manovra di palpazione addominale.
In altri casi, invece, i dati sono esprimibili in forma numerica; ad esempio, il numero di pulsazioni
cardiache al minuto.

Quasi sempre, le osservazioni non quantificabili numericamente possono essere trasformate in un


numero in base a criteri pi o meno arbitrari. Ad esempio, una zoppicatura potrebbe essere
codificata con i valori 0, 1, 2, 3, 4, dove 0 corrisponde ad andatura normale, 1 a zoppicatura appena
percettibile, 2 a zoppicatura lieve ecc. Questo tipo di trasformazione molto utile quando i dati
devono essere sottoposti ad una elaborazione.

In epidemiologia i dati sono sempre rappresentati da numeri. Ad esempio, uno studio


epidemiologico potrebbe mirare a stabilire QUANTI animali sono affetti da una malattia in un
determinato momento, oppure QUANTI nuovi casi si sono verificati in un lasso di tempo, oppure
QUANTI animali esposti ad un certo fattore vengono colpiti dalla malattia, ecc. Ecco perch
l'epidemiologia, servendosi di dati numerici, ricorre pi di altre discipline a tabelle o grafici in cui
riportare i dati numerici. Per lo stesso motivo, l'epidemiologia si serve frequentemente di due altre
discipline: la matematica e, soprattutto, la statistica. Quest'ultima comprende i metodi di studio dei
fenomeni collettivi e quindi rappresenta logicamente la compagna ideale dell'epidemiologia (e di
altre discipline).

I dati purtroppo non parlano da soli, ma vanno interpretati. L'interpretazione, per, non deve essere
lasciata al buon senso soggettivo dello sperimentatore. necessario definire una serie di metodi
formali, accettati dal mondo degli scienziati; questi metodi devono essere usati per l'analisi dei dati,
allo scopo di trarre conclusioni il pi possibili veritiere. La statistica comprende appunto questi
metodi.

Riassumendo: la statistica l'interfaccia tra la matematica e la scienza medica:

Attraverso procedimenti statistici di "analisi", i dati possono essere convertiti dalla forma grezza
iniziale (poco o nulla interpretabile) ad una forma pi comprensibile. Il fatto che, per tutte le
discipline scientifiche che studiano gli organismi viventi, i dati ottenuti attraverso gli esperimenti
oppure raccolti in campo (ossia in natura) non consentono mai di giungere ad una conclusione
con una certezza del 100%. La statistica ci aiuta in maniera oggettiva, numericamente, ad analizzare
8

le diverse ipotesi ed a valutare il grado di incertezza delle conclusioni cui siamo giunti. Ci
significa che lo studio e l'interpretazione dei fenomeni biologici dipendono imprescindibilmente
dalla statistica.

Inoltre, come vedrai pi avanti, attraverso i metodi statistici le osservazioni effettuate su un


campione possono essere generalizzate all'intera popolazione, attraverso un processo logico detto di
inferenza (statistica inferenziale).
D'altra parte, gi secoli or sono, due fra i pi grandi studiosi di tutti i tempi, padri delle scienze e del
metodo sperimentale, si erano resi conto che l'analisi dei dati parte inscindibile del processo di
ampliamento delle conoscenze umane:

Non devi pensare, per, che il processo di raccolta-elaborazione-interpretazione dei dati sia
puramente meccanico o possa essere in qualche modo automatizzato in tutte le sue fasi. Infatti, sia
nella raccolta che nell'elaborazione che - soprattutto - nell'interpretazione dei dati necessario
ingegno, acume e discernimento, associati ad una profonda conoscenza della storia naturale
della malattia (cio come essa si manifesta e decorre in natura, senza intervento del medico) nonch
di tutte le altre discipline mediche di base (anatomia, fisiologia, patologia generale ecc.). Ed forse
anche per questo che i sistemi di diagnosi computerizzata - ossia i cosiddetti sistemi esperti che
certo costituiscono un utilissimo ausilio diagnostico per casi particolari, come ad esempio gli
avvelenamenti - non possono (ancora?) competere con un buon clinico.

Gli obiettivi pratici dell'epidemiologia veterinaria

A questo punto potresti chiederti quali sono gli obiettivi pratici ottenibili attraverso la raccolta,
l'elaborazione e l'interpretazione dei dati. La risposta a questa domanda racchiude l'essenza stessa di
tutta l'attivit epidemiologica, e quindi non pu essere esaurita in poche righe. In seguito, verr
accennato ai compiti specifici ed agli scopi pratici della disciplina. Tuttavia, possiamo gi
anticipare che le informazioni sullo stato sanitario di popolazioni animali sono utili ad una ampia
gamma di soggetti, a partire dai semplici proprietari degli animali o allevatori, fino alle Autorit
9

sanitarie periferiche e centrali (nazionali ed internazionali) ed ai centri di ricerca.


Per ora, baster ricordare che le informazioni raccolte sono utili a:

identificare la causa e l'origine delle malattie, soprattutto (ma non soltanto) di quelle
diffusibili;
identificare la presenza di determinate malattie in un territorio;
accertare l'assenza di determinate malattie; questo spesso richiesto dai partner commerciali
(che non intendono correre il rischio di importare nuove malattie in territori indenni
attraverso l'acquisto di animali o di loro prodotti) e vale soprattutto per le malattie
trasmissibili;
individuare la frequenza, o la localizzazione geografica, o l'andamento nel tempo delle
malattie;
valutare l'importanza (sanitaria, economica, zoonosica ecc.) delle malattie esistenti in un
territorio;
determinare le priorit di intervento, tenuto conto delle risorse disponibili;
pianificare ed implementare piani di controllo e sorvegliarne l'andamento;
soddisfare le richieste di informazioni provenienti da organismi internazionali (es. Office
International des pizooties, OIE).
10

Cap. 1.
Introduzione allo studio dell'epidemiologia
2.1 Eventi-chiave nella storia dell'epidemiologia

OBIETTIVO

a scopo di cultura generale, conoscere alcuni eventi e personaggi celebri fra i tanti che hanno
caratterizzato la scienza medica ed hanno gettato le basi della epidemiologia moderna.

Nato a Kos (Grecia) nel IV secolo A.C., Ippocrate affranc la


medicina dalla speculazione filosofica e dalla superstizione, basando la
pratica medica sullo studio del corpo umano. Ritenendo che ogni
malattia avesse una spiegazione razionale, riconobbe l'importanza
dell'ambiente sulla comparsa e sull'evoluzione delle malattie. Per
primo descrisse con precisione i sintomi di alcune affezioni (come la
polmonite e l'epilessia nei bambini) e fu sostenitore di rimedi semplici,
quali il sonno, il riposo ed una buona alimentazione. Egli dimostr che
i pensieri ed i sentimenti avevano origine dal cervello e non dal cuore,
come allora si credeva. Ippocrate fu anche brillante studioso di matematica e geometria; egli
venne e viene ancora riconosciuto come "padre della medicina".

Girolamo Fracastoro (Verona 1478 - Affi 1553), fisico,


poeta, astronomo e geologo, propose un abbozzo della teoria
scientifica dei microrganismi come agenti di malattia ben 300 anni
prima della formulazione avvenuta ad opera di Pasteur e Koch.
Fracastoro raccolse la sua visione sulle epidemie nell'opera "De
Contagione et Contagiosis Morbis" (Sul Contagio e le Malattie
Contagiose), nella quale si affermava che ogni malattia era provocata
da un diverso tipo di corpuscoli in grado di moltiplicarsi rapidamente
e di trasmettersi dagli ammalati ai sani in 3 modalit: per contatto
diretto, per il tramite di materiali diversi (es. indumenti) ed attraverso l'aria. La teoria di
Fracastoro fu molto apprezzata, ma venne ben presto offuscata dalle dottrine mistiche del
medico rinascimentale Paracelso.

Durante le spaventose epidemie di peste che colpirono l'Europa negli


anni fra il 1346 ed il 1352, e che portarono a morte un quarto degli
abitanti dell'Europa, si cominci a tener conto delle persone morte ogni
settimana. Fu tuttavia soltanto 3 secoli pi tardi, per merito di John
Graunt (1620-1674), che prese corpo l'idea dell'utilit di disporre di
statistiche epidemiologiche sulla durata della vita e sulle cause di
morte. Graunt autore di una delle prime opere di statistica venute alla
luce in Europa ("Natural and political observations upon the bill of
11

mortality"), in cui i dati dei certificati di morte stilati dai ministri del culto vengono riassunti
sotto forma di tavole, percentuali e probabilit. Da esse si evince, ad esempio, l'alta
frequenza di morte nei bambini (1/3 di essi moriva in et <5 anni). E' curioso osservare che,
nonostante gli enormi mutamenti nel modo di vivere, allora come oggi i maschi erano
soggetti a mortalit pi elevata ed a pi bassa morbosit rispetto alle femmine.

Nel 1714 la peste bovina comparve in Inghilterra. Thomas


Bates, il medico del re Giorgio I, escogit una strategia di lotta che,
nella sostanza, pu essere considerata ancora attuale: fumigazione
dei ricoveri degli animali; abbattimento e distruzione per
seppellimento degli animali colpiti; riposo dei pascoli contaminati.
Gli allevatori venivano compensati delle perdite a spese dello Stato.

Nel 1775 Percival Pott, chirurgo inglese noto per i suoi studi sulla
tubercolosi nonch sulla colonna vertebrale, effettu quello che viene
ritenuto il primo studio di "epidemiologia occupazionale" o di "medicina
del lavoro" riguardante l'alta frequenza di cancro dello scroto negli
spazzacamini.
In precedenza, le malattie legate alle condizioni di lavoro in 50 diversi
mestieri erano stati studiate da Bernardo Ramazzini (1633-1714)
(laureato in medicina a Parma nel 1659) e pubblicate nella sua opera
fondamentale, il De morbis artificum diatriba.

Edward Jenner (1749-1823) aveva constatato che tutti coloro che


contraevano il "cow pox" (in italiano: vaiolo vaccino, che significa
letteralmente vaiolo delle vacche, ossia dei bovini), una forma di
vaiolo che colpiva i bovini, erano immuni del vaiolo umano. Dopo
oltre 20 anni di studi, nel 1796 egli inocul ad un bambino del pus
prelevato dalle pustole di individui colpiti da vaiolo vaccino; il
paziente, al quale venne inoculato in seguito del pus vaioloso umano,
non contrasse la malattia. Questo rappresenta il primo caso
documentato di prevenzione attiva di una malattia attraverso immunizzazione. Il termine
odierno di "vaccino" trae origine proprio dal metodo di Jenner che prevedeva l'inoculazione
appunto del virus del vaiolo vaccino. Da allora il metodo della vaccinazione jenneriana ebbe
grande diffusione ovunque; in Italia fu introdotto nel 1799.

Jacob Henle (1809-1885?), Louis Pasteur (1822-


1895) e Robert Kock (1843-1910)
rappresentano le figure chiave accreditate dello
sviluppo della teoria dei microrganismi quali
12

agenti di malattia, e dei principi basilari della medicina moderna.

John Snow compie a Londra, in occasione di due epidemie di colera


(1849 e 1853) studi con metodi epidemiologici rivoluzionari per quei
tempi e ancor oggi attuali. L'opera di Snow viene trattata
dettagliatamente e commentata in una apposita unit didattica.

Peter Panum (1820-1885), medico danese, applica i moderni


principi delle malattie infettive ad uno studio di un violento focolaio
di morbillo verificatosi nel 1846 nelle Isole Faroe, situate fra la
Scozia e l'Islanda. Favorito in tale attivit dall'isolamento geografico
e commerciale delle Isole, egli effettua raffronti fra la popolazione
semi-immune della Danimarca e quella delle Isole, individuando
elementi essenziali quali la "infettivit" dell'agente e la "recettivit"
dell'ospite. Calcola anche il periodo tipico di incubazione della
malattia (13-14 giorni). La sua opera occupa un posto importante fra i "classici" della storia
dell'epidemiologia.

Nel 1880 Daniel Salmon e Frederick Kilborne negli U.S.A.


osservano che la presenza di una zecca (Boophilus annulatus, che
funge da vettore) era associata ad una malattia dei bovini detta
Febbre del Texas, il cui vero agente causale (un protozoo parassita:
Babesia bigemina) venne identificato molti anni dopo. Attraverso il
loro lavoro, basato soprattutto sulla similarit della distribuzione
geografica del vettore e della malattia, fu possibile controllare
(controllare = tenere sotto controllo, ossia ridurre la frequenza dei
casi) la malattia prima di conoscerne la vera causa.
Nello stesso periodo in Inghilterra vengono eradicate due temibili
malattie del bovino: la peste bovina (1877) e la pleuropolmonite nel 1898; sei anni prima,
nel 1892, la pleuropolmonite contagiosa del bovino era stata eradicata negli Stati Uniti,
dopo una campagna di lotta durata 5 anni.

La seconda met del '900 segna l'inizio della moderna


epidemiologia.
Fra gli eventi importanti nel settore della medicina umana, sono da
ricordare: la vaccinazione di massa contro la poliomielite,
l'eradicazione del vaiolo, la dimostrazione del rapporto causa-
effetto fra tabacco e malattie cardiache e respiratorie, l'emergenza
di malattia nuove (AIDS).
Nel settore veterinario, prendono l'avvio i piani di lotta alle
"grandi" malattie: pullorosi aviare, tubercolosi bovina, brucellosi
bovina e ovi-caprina, afta epizootica, peste suina classica, leucosi
13

enzootica del bovino ecc.. Inoltre, compaiono nuove malattie o infezioni degli animali,
spesso con caratteri zoonosici (es. infezioni da Salmonella enteritidis del pollame,
encefalite spongiforme del bovino); in qualche caso si assiste alla ricomparsa di malattie
diffusibili ben note e che da anni erano state eradicate da intere nazioni (es. epidemia di afta
epizootica in Gran Bretagna nel 2001).
soprattutto grazie all'applicazione di metodi epidemiologici che le suddette malattie sono
state studiate e controllate con la massima tempestivit possibile, in rapporto alle diverse
situazioni ed alle risorse disponibili.
In tempi recenti si registra la nascita della epidemiologia molecolare che - attraverso
l'interazione con la biologia molecolare - opera soprattutto nel campo delle malattie
croniche, neoplastiche ed infettive; per queste ultime, identifica la sorgente degli agenti di
malattia, le loro relazioni biologiche, i geni responsabili della virulenza, gli antigeni
importanti per la profilassi vaccinale, ed i fenomeni di antibiotico-resistenza.

NELLA PROSSIMA UNIT:


viene illustrato uno studio storico che rappresenta un classico dell'epidemiologia e che riguarda le
epidemie di colera sviluppatesi a Londra attorno alla met dell'800. L'impostazione di questo studio
ancora attuale e dimostra, fra l'altro, come si possano ottenere risultati sorprendenti studiando la
malattia a livello di popolazione anzich di singolo individuo.
14

Cap. 1.
Introduzione allo studio dell'epidemiologia
2.2 Uno studio epidemiologico storico: le epidemie di Colera a Londra nel 1849 e
1853

OBIETTIVI

prendere conoscenza con uno dei principali campi d'azione dell'epidemiologia;

apprendere qualche dettaglio su un famoso studio epidemiologico storico;

constatare come - contrariamente al senso comune - le malattie possano essere combattute e


prevenute senza conoscerne la causa;

Epidemiologi pionieri della medicina

Uno dei pi importanti obiettivi dell'epidemiologia l'individuazione delle CAUSE di malattia;


tuttavia, questo stesso obiettivo perseguito da numerose altre discipline mediche, in quanto si
ritiene che la conoscenza della causa di malattia sia utile - se non indispensabile - per le azioni di
prevenzione e per la terapia.
L'epidemiologia ha anche un altro obiettivo, ancor pi ambizioso: quello di prevenire o ridurre la
frequenza di malattia in una popolazione ancor prima di conoscerne le cause. Perci, in alcune
situazioni gli epidemiologi possono essere considerati alla stregua di pionieri che per primi entrano
in azione quando compare una malattia 'nuova'.

ESEMPIO. I recenti episodi di quella nuova malattia indicata dai mass-media con la brutta
denominazione di "mucca pazza" (la denominazione corretta : encefalopatia spongiforme del
bovino) sono stati circoscritti tempestivamente e con efficacia - ancor prima di conoscerne l'agente
causale - attraverso misure di controllo scaturite da studi epidemiologici.

Anche se non mancano esempi di studi epidemiologici compiuti in un passato ormai lontano,
l'epidemiologia pu essere senz'altro ritenuta scienza medica giovane. Nel campo della medicina
umana l'epidemiologia considerata scienza a s stante da alcuni decenni; ancor pi recente
l'acquisizione di una mentalit epidemiologica in medicina veterinaria. Si parla qui di mentalit
o di approccio epidemiologico poich non facile stabilire la vera natura dell'epidemiologia, cio
si tratti di disciplina o teoria o di metodologia o addirittura di ideologia. In effetti, come si vedr in
seguito, l'epidemiologia spazia in diversi campi dello scibile umano, adottando anche schemi
derivati dal settore logico-filosofico (per esempio le regole del filosofo John Stuart Mill riguardo
alle cause di malattia).
15

Uno dei pi famosi studi del passato, impostato - in buona sostanza -


con metodo epidemiologico razionale ancor oggi valido, quello
compiuto dal dottor J. Snow (raffigurato nel ritratto a lato), un medico
ostetrico che ottenne popolarit attorno alla met del XIX secolo per
aver per primo utilizzato l'anestesia durante gli interventi chirurgici.
Egli fu pioniere anche nel campo delle malattie trasmissibili, come
dimostrano gli studi eseguiti a Londra in occasione di due focolai di
colera. Tali studi sono universalmente riconosciuti come un "classico"
nella storia dell'epidemiologia, per l'ingegnosit delle osservazioni e per
la modernit dell'impostazione metodologica. Essi vengono qui
sommariamente riassunti nei punti essenziali.

Il colera a Londra

Il momento storico corrisponde alla met del XIX secolo, prima del "periodo d'oro" della
Microbiologia (1879-1900), prima che i batteri venissero riconosciuti come agenti di malattia e
prima della "scoperta" dell'agente del colera dell'uomo (un batterio oggi denominato Vibrio
cholerae). In quel periodo il colera compariva regolarmente in Europa, causando elevata mortalit
oltre a drammatici problemi sociali. Nonostante le conoscenze mediche a quel tempo fossero assai
pi limitate di quelle odierne, era tuttavia noto che:

la principale manifestazione clinica era la diarrea acquosa profusa;


venivano spesso coinvolti interi nuclei familiari;
la malattia colpiva raramente medici e infermiere, bench essi fossero a costante contatto con
ammalati; ci contrastava con la visione corrente secondo cui le malattia contagiose venivano
contratte attraverso l'inalazione di "miasmi" o "esalazioni" provenienti dagli individui affetti.

La prima epidemia di colera: 1848-49

Dopo una violenta epidemia nel 1832, lo spettro del colera ricomparve a Londra nel 1848,
provocando oltre 15.000 morti. Vennero colpite soprattutto le persone che abitavano nelle povere
case situate al di sotto del livello del Tamigi, lungo le banchine del fiume. La malattia colp con
violenza i quartieri londinesi situati a sud del Tamigi, ed in particolare - cos not Snow - quelli
serviti da due Societ di approvvigionamento idrico: la "Southwark & Vauxhall Water Company"
e la "Lambeth Water Company". L'acqua distribuita da entrambe le societ veniva prelevata
direttamente dal fiume, in una zona prossima al centro della citt.

Vale la pena di ricordare che in quel periodo erano gi relativamente diffusi nella citt i servizi
igienici dotati di acqua corrente, e che fin dal 1830 erano stati messi in funzione i primi impianti
fognari. L'acqua veniva portata alle abitazioni attraverso una fitta rete gestita da alcune aziende
private. Ogni azienda ampliava a propria discrezione la propria rete, anche in concorrenza con altre
aziende, e quindi si era venuta a creare una sovrapposizione di reti idriche tale che lo stesso
quartiere, od anche lo stesso edificio, era sovente servito da due o pi societ.
16

Durante l'epidemia, Snow lavor intensamente a raccogliere dati ed osservazioni riguardanti


soprattutto le abitudini di coloro che erano stati colpiti e di quelli che erano rimasti sani, e continu
la raccolta retrospettiva dei dati anche dopo l'estinzione dell'epidemia. In base alle informazioni
raccolte, Snow fu in grado di avanzare le seguenti ipotesi, per quel tempo molto innovative se non
addirittura rivoluzionarie:

1. il colera veniva certamente trasmesso dagli individui ammalati a quelli sani;


2. la trasmissione doveva avvenire attraverso un qualche "veleno" (poison) che era in grado di
"moltiplicarsi" nell'individuo ammalato;
3. il "veleno" poteva essere portato attraverso qualche via, e quindi provocare malattia a distanza;
cio, non era necessario avere uno stretto contatto con l'ammalato n tanto meno inalare le sue
"emanazioni";
4. il "veleno" doveva essere introdotto nell'organismo per ingestione di qualche sostanza, cio per via
digerente, e non per altra via, essendo la diarrea la prima e principale manifestazione della
malattia;
5. l'acqua potabile rappresentava la peculiare, ma non esclusiva, via di diffusione del "veleno" alle
persone sane.

Snow anticipava di 32 anni la "scoperta" del batterio agente del colera (Vibrio cholerae) e di un
decennio la dimostrazione, avvenuta ad opera di Pasteur, che organismi viventi microscopici sono
causa di epidemie. Inoltre, la teoria di Snow contrastava con quella corrente all'epoca, secondo la
quale le malattie venivano trasmesse dall'inalazione di esalazioni (miasmi). Ecco perch le ipotesi
di Snow vennero accolte freddamente dal mondo scientifico e caddero nel vuoto, alla stregua della
miriade di idee disparate, e per lo pi prive di fondamento scientifico, che a quel tempo si
propagavano in occasione di ogni epidemia di colera.

La seconda epidemia di colera: 1853-54

Fra il 1849 ed il 1853 a Londra non vennero segnalati casi di colera. In questo periodo, una delle
due societ dell'acqua (la Lambeth) ristruttur gli impianti, spostando a monte della citt il punto
di rifornimento dell'acqua. L'altra societ (Southwark & Vauxhall) continu a prelevare l'acqua
dal tratto di fiume nella City.

Nell'estate del 1853 il colera riesplose; anche questa volta, la maggiore frequenza di casi di malattia
si ebbe a sud del Tamigi.
Snow si mise nuovamente all'opera, raccogliendo ancora i dati riguardanti la mortalit in rapporto
alla Societ fornitrice dell'acqua. Lo studio venne ampliato attraverso l'ottenimento - dal "General
Registar Office" - dei dati sul numero di abitazioni servite da una o l'altra delle societ dell'acqua.
La situazione risultava la seguente:
17

I suddetti dati, insieme ad altri (come, ad esempio, quelli riguardanti il numero di persone servite
dalle Societ fornitrici di acqua e la relativa mortalit per colera), e pur tenuto conto delle
sovrapposizioni degli acquedotti, dimostravano con sufficiente chiarezza - secondo Snow - che
l'acqua Southwark & Vauxhall era una causa importante della malattia. Questa ipotesi era confortata
anche dal fatto che la mortalit nelle abitazioni servite dalla Lambeth, a motivo dello spostamento a
monte del punto di raccolta dell'acqua, era diminuita rispetto alla precedente epidemia.

Nella tarda estate dello stesso anno il colera continuava a colpire con durezza, ed in particolare si
verific una grave epidemia fra Broad Street e Cambridge Street, proprio nella zona ove Snow
risiedeva (corrispondente all'odierno, centralissimo quartiere di Soho). Questa epidemia, la cui
storia divenuta leggendaria, venne studiata da Snow ancor pi meticolosamente, e venne anche
preparata una mappa della zona, in cui erano riportati graficamente sia i decessi che la
localizzazione delle pompe pubbliche per l'acqua.

Dall'esame della mappa, era evidente che i casi erano incentrati


attorno alla pompa pubblica di Broad Street (figura), da cui
18

sgorgava acqua della Southwark & Vauxhall. Snow, di fronte ad una assemblea di increduli ma
preoccupati ufficiali governativi, chiese ed ottenne che la maniglia della pompa di Broad Street
fosse rimossa. A partire da quel giorno, i casi di malattia in quella zona continuarono a diminuire,
ed in pochi giorni la malattia si esaur.
Oggi Broad St. si chiama Broadwick St., e nelle vicinanze del luogo dove era collocata la pompa si
trova un pub ("John Snow Pub") nel quale conservata la maniglia originale (o almeno cos si dice)
della pompa. [fai una passeggiata in Broadwick St]

Un elemento importante nel lavoro sistematico di Snow rappresentato dalla applicazione del
principio di falsificazione dell'ipotesi proprio del metodo scientifico moderno. Infatti, egli attu
una minuziosa e sistematica ricerca ed analisi di casi che sembravano contraddire la teoria
dell'origine idrica della malattia. Ecco alcuni esempi emblematici, tratti dal lavoro originale di
Snow:

... I minatori della Gran Bretagna sono stati colpiti dal colera pi degli addetti ad altri mestieri [...].
I minatori differiscono per molti ed importanti particolari da tutte le altre classi di lavoratori. Non vi
sono servizi igienici nelle miniere di carbone cos come - credo - nelle miniere di altro tipo. I
lavoratori soggiornano cos a lungo nelle miniere che sono costretti a portare con s il cibo, che
consumano sempre senza lavarsi le mani, e senza usare n forchetta n coltello. Ad una mia
domanda rivolta al personale di una miniera di carbone presso Leeds, ho ottenuto la seguente
risposta: "I nostri minatori scendono alle 5 del mattino, per essere pronti ad iniziare il lavoro alle 6,
e lasciano la miniera alle 15:30. In media, rimangono nella miniera 8-9 ore. Tutti i minatori portano
con s una riserva di cibo, solitamente focaccia con l'aggiunta, talvolta, di carne. Tutti hanno anche
una bottiglia contenente una bevanda. Temo che i nostri minatori non siano migliori degli altri
riguardo a pulizia. La miniera da considerare una enorme latrina, e naturalmente gli uomini l
consumano il loro pasto senza lavarsi le mani". E' evidente che, se un minatore viene attaccato dal
colera sul luogo di lavoro, la malattia ha la possibilit di trasmettersi ai colleghi di lavoro pi che in
ogni altro tipo di occupazione...

...C' una distilleria [brewery, vedi mappa] di birra in Broad St., vicino alla pompa, e dopo aver
appreso che nessuno di quei lavoranti era morto di colera, ho convocato il proprietario, Mr.
Huggins. Egli mi ha informato di avere impiegato nella distilleria circa 70 persone, e che nessuna di
esse ha contratto il colera - per lo meno in forma grave - e che soltanto due hanno accusato un lieve
malessere nel periodo in cui il morbo era prevalente. Agli impiegati permesso bere una certa
quantit di mosto di malto; Mr. Huggins ritiene che essi non bevano affatto acqua ed
assolutamente certo che non si sono mai riforniti di acqua dalla pompa della strada. Infatti,
all'interno della fabbrica esiste un profondo pozzo...

...Il dott. Fraser ha richiamato la mia attenzione sulle seguenti circostanze, che forse provano
definitivamente la connessione fra la pompa di Broad Street e l'epidemia di colera. [...] Nel West
End, il 2 settembre la vedova di un fabbricante di cartucce, dell'et di 59 anni, stata colpita dal
colera. Sono stato informato dal figlio della vedova che ella da mesi non si recava nelle vicinanze di
Broad Street. Tuttavia, ogni giorno da Broad Street a West End veniva un carretto, e la vedova era
solita farsi portare una grossa bottiglia di acqua della pompa di Broad Street, che lei preferiva.
L'acqua venne prelevata gioved 31 agosto, e la vedova ne bevve alla sera dello stesso giorno, ed
anche il venerd. Una nipote della donna, recatasi in visita alla vedova, bevve la stessa acqua e,
ritornata a casa nel quartiere di Islington (ove il colera era assente), mor poco dopo di colera.
Anche la vedova contrasse il colera alla sera del venerd e mor sabato. In quel tempo il colera non
era presente n nel West End n nei quartieri adiacenti. E' vero che molte persone che bevvero
l'acqua della pompa di Broad Street al tempo dell'epidemia, senza ammalarsi. Tuttavia, ci non
19

diminuisce la validit delle prove riguardanti l'influenza dell'acqua, come gi chiaramente indicato
in altra parte del presente lavoro...

Ancor prima di "scoprire" l'esistenza del batterio che causa il colera, l'acqua era stata
individuata come fattore importante nella trasmissione della malattia. Su questa base, lo stesso
Snow fiss alcune regole di comportamento che, nelle epidemie successive, si rivelarono efficaci
nel ridurre il contagio e che, nella loro semplicit, sono ancor oggi valide. Nelle parole originali di
Snow, le regole dettavano che:

tutti coloro che si occupano degli ammalati devono osservare le pi strette norme di pulizia; nella
stanza dove presente un paziente, dovrebbe essere disponibile un catino, acqua ed asciugamani,
da usare con frequenza e soprattutto prima di toccare il cibo;
in attesa di essere lavati, gli indumenti del malato dovrebbero tenuti essere immersi in acqua per
evitare l'essiccamento delle feci ed il loro dissolvimento in polvere. Il materasso e tutto ci che non
pu essere lavato dovrebbe essere esposto per un certo tempo ad una temperatura superiore a
212 gradi Fahrenheit [100 gradi centigradi] o superiore;
occorre fare attenzione all'acqua da bere o utilizzata per la preparazione dei cibi; essa non deve
essere contaminata da scarichi o fogne; l'acqua di provenienza sospetta dovrebbe essere bollita e,
se possibile, filtrata;
quando il colera presente nelle vicinanze, tutte le provviste portate in casa dovrebbero essere
lavate con acqua e portate a temperatura di 212 F;
se compare un caso di colera o di altra malattia trasmissibile fra le persone che vivono nella stessa
stanza, il malato dovrebbe essere portato in un altro luogo ed accudito soltanto dalle persone
indispensabili;
poich impossibile effettuare una pulizia delle miniere, o installarvi servizi igienici e mezzi per
consumare il pasto in buone condizioni igieniche, il tempo di lavoro dovrebbe essere suddiviso in
periodi di 4 ore anzich di 8, in modo che i minatori possano consumare il pasto a casa;
la gente non dovrebbe essere tenuta all'oscuro della trasmissibilit del colera nell'intento di evitare
il panico o l'abbandono dei malati (...);
alloggi adeguati dovrebbero essere messi a disposizione dei senza-casa e dei poveri;
le persone, e specialmente le navi, provenienti da localit infette dovrebbero essere sottoposti ad
un periodo di isolamento; nel caso del colera, non necessario che questo periodo sia di lunga
durata.

Il lavoro di Snow rivisitato nel XXI secolo

Una prima osservazione riguarda la fortunata circostanza di studiare aree servite


contemporaneamente da reti idriche di due o pi compagnie.
Ad un esame superficiale questa situazione potrebbe sembrare negativa ai fini dell'ottenimento di
risultati facilmente interpretabili: infatti, si potrebbe pensare che sia pi facile evidenziare
differenze fra interi quartieri serviti da acqua "buona" ed altri serviti da acqua "cattiva". Non va
tuttavia dimenticato che Snow disponeva di dati certi riguardo al tipo di acqua utilizzata dalle
singole famiglie, e quindi la sovrapposizione degli acquedotti risult poco influente; anzi, questa
situazione apport l'incommensurabile vantaggio di ridurre o annullare tutti quei fattori detti di
"confondimento" (confounders) come ad esempio: la classe sociale, la dimensione degli alloggi, il
numero di abitanti, il tipo di alimentazione, il regime igienico ecc.. Tutti questi fattori sicuramente
avrebbero giocato un ruolo importante se i raffronti fossero stati compiuti su quartieri diversi. Cos,
20

venne azzerato anche il fattore "altezza sul fiume" che alcuni ritenevano associato alla causa del
colera.

Altri elementi che giocarono a favore di Snow sono da ricercare nei caratteri clinici della malattia: il
colera di facile diagnosi (quindi tutti i casi vennero individuati facilmente), ed induce sintomi cos
evidenti che altamente improbabile che si potesse nascondere un caso (il colera era - ed -
malattia soggetta a denuncia obbligatoria alle Autorit).

Inoltre, l'associazione fra acqua e colera nell'epidemia del 1854 risult molte forte, nel senso che il
rischio di morire per colera nelle abitazioni servite dalla Southwark & Vauxhall era 8.4 volte
superiore rispetto alle abitazioni servite dalla Lambeth.

La "reversibilit" (vedi punto 5 dei Postulati di Evans), che oggi riconosciuta come importante
criterio per verificare l'esistenza di un rapporto causa-effetto, venne dimostrata da Snow mettendo a
raffronto l'epidemia del 1849 con quella del 1854. Nel tempo intercorrente fra le due epidemie, la
Lambeth spost a monte il punto di prelievo dell'acqua, e ci permise a Snow di verificare il logico
principio secondo cui "l'eliminazione di una causa induce una diminuzione dei casi di malattia".

Infine, la rimozione della leva della pompa di Broad Street deve essere visto pi come un aneddoto
storico che come un provvedimento risolutivo. Infatti, quando la leva venne rimossa, l'epidemia si
stava gi esaurendo spontaneamente (vedi grafico sottostante) perch la popolazione si era
allontanata ed erano rimasti pochi individui suscettibili, e ci aveva portato alla riduzione della
contaminazione ambientale da parte del bacillo del colera.

Applicando le odierne conoscenze ed i recenti metodi di studio, lo studio di Snow pu - ovviamente


- essere criticato sotto diversi aspetti. Tuttavia, l'approccio epidemiologico allo studio del problema
adottato da Snow resta ancora, a distanza di oltre 150 anni, di una modernit impressionante, cos
come stupefacente appare la precisione dei rimedi proposti.

[Per la monografia originale di John Snow si veda: "On the mode of communication of cholera".
Documento pubblicato da U.C.L.A., School of Public Health, Department of Epidemiology].
21

3. Definizione di
epidemiologia e concetti di base
3.1 Epidemiologia: qualche definizione

OBIETTIVO:

comprendere le difficolt che si incontrano nel definire l'epidemiologia

apprendere le cinque parole-chiave che caratterizzano la disciplina

ora il momento di rispondere alla classica domanda che ci si pone quando si affronta una nuova
disciplina dal nome non molto esplicativo:

Dal punto di vista etimologico, epidemiologia una parola composita (epi-demio-logia) di origine
greca, che letteralmente significa discorso riguardo alla popolazione

Lo studio delle malattie pu avvenire in 4 diversi contesti o dimensioni: (1) la dimensione


molecolare, utilizzata dalla biologia molecolare, dalla biochimica e dall'immunologia; (2) la
dimensione tissutale (ossia dei tessuti) e organica (ossia degli organi), utilizzata dalla anatomia
patologica; (3) la dimensione del singolo individuo, utilizzata dalla medicina clinica; (4) la
dimensione della popolazione, che quella utilizzata dall'epidemiologia.
22

Ovviamente queste dimensioni di studio non devono essere viste come disgiunte e fra loro separate;
al contrario, esse sono fortemente complementari: infatti, una comprensione approfondita di una
malattia si ha soltanto adottando un approccio integrato delle quattro suddette dimensioni.

Dire pi esattamente cosa sia l'epidemiologia non compito facile; prova indiretta ne l'esistenza di
moltissime definizioni.
Il fatto che l'epidemiologia, pi che un corpo di conoscenze autonomo e a s stante, una
metodologia, una tecnica di approccio ai problemi, una filosofia. L'epidemiologia un modo
diverso per studiare la salute e le malattie, ed scienza trasversale, in quanto, sovrapponendosi a
molte altre discipline, le aiuta a trarre conclusioni dai fatti.

Ecco alcune definizioni di epidemiologia proposte da illustri scienziati:

campo della scienza medica che si interessa delle relazioni tra i fattori che condizionano la
frequenza e la distribuzione di una malattia o di uno stato fisiologico in una popolazione
umana.(Maxcy)
studio della distribuzione e dei determinanti di salute o di stati correlati con la salute in
determinate popolazioni, e applicazione di questo studio al controllo dei problemi sanitari.
(Last)
strategia di studio dei fattori riguardanti: (a) l'eziologia, la prevenzione ed il controllo delle
malattie; (b) l'allocazione efficiente delle risorse per promuovere e mantenere uno stato di
salute in popolazioni umane. (Detels)

Nelle tre definizioni si fa riferimento esplicito all'uomo o alla medicina umana; tuttavia, come gi
detto, l'epidemiologia una metodologia di studio, e perci non esistono differenze sostanziali tra
epidemiologia medica ed epidemiologia veterinaria, se non quelle legate al soggetto di studio:
l'uomo in un caso, l'animale nell'altro.

Bisogna ammettere che le tre definizioni ora fornite sono complete ed autorevoli, ma certo non del
tutto comprensibili per chi si avvicina per la prima volta alla materia.
Esiste un'altra definizione pi semplice e quindi pi adatta a scopo didattico:
23

Il fatto che vengano studiate le malattie non nel singolo individuo ma collettivamente, ossia a
livello di popolazione, non deve far pensare che l'epidemiologia si occupi soltanto delle malattie
infettive o di quelle contagiose, che tipicamente (ma non sempre!) coinvolgono molti individui di
una popolazione (ma quasi mai tutti). Infatti, l'epidemiologia si occupa di TUTTE le malattie ma,
diversamente da altre discipline, se ne occupa esclusivamente a livello di popolazione piuttosto
che di individuo. Questo concetto verr ampliato e risulter pi chiaro in seguito. Gi fin d'ora
bene, comunque, ricordare che, in epidemiologia, la malattia nel SINGOLO animale non assume
alcun significato. Il singolo importante solo in quanto parte di una collettivit.

Cinque sono le parole-chiave della definizione:

frequenza
distribuzione
determinanti
salute-malattia
popolazioni

Esse che verranno considerate pi in dettaglio nella prossima unit.


24

3. Definizione di
epidemiologia e concetti di base
3.2 Definizione di epidemiologia: le cinque parole-chiave

OBIETTIVO:

apprendere, in maniera preliminare e molto sommaria, il significato delle 5 parole-chiave che


compaiono nella definizione di epidemiologia

Abbiamo gi visto nell'Unit precedente che, parlando in generale, l'epidemiologia si occupa delle
malattie, e degli eventi e fenomeni correlati alle malattie.

Ora prendiamo in considerazione di nuovo la definizione che, per la sua semplicit, pi efficace a
scopo didattico, e introduciamo in maniera schematica il significato delle cinque parole-chiave che
la compongono. Tieni presente che tutte queste parole chiave verranno chiarite pi o meno
dettagliatamente sia nelle prossime Unit di questo Capitolo, che in altre di Capitoli successivi.

1. frequenza: con questo termine si indica sia quanto spesso ('QUANTO') la malattia compare,
che il 'pattern temporale' ('QUANDO');
2. distribuzione: indica sia il pattern geografico ('DOVE') di comparsa o presenza della
malattia che le caratteristiche della popolazione ospite (per esempio se pi frequente negli
animali liberi o in cattivit, giovani o vecchi ecc.);
25

3. determinanti: il concetto di determinante fondamentale in epidemiologia e verr chiarito


in seguito). Per ora, sufficiente considerare il termine 'determinante' come sinonimo di
'causa', anche se ci non del tutto esatto;
4. salute/malattia: forse ti chiederai perch, nella definizione, si parli di determinanti di
salute/malattia e non, pi semplicemente, di determinanti di malattia. Anche questo verr
chiarito meglio in seguito. Tuttavia, gi da ora bene che tu tenga presente che
l'epidemiologia studia, oltre agli animali ammalati, anche gli animali sani; oppure, meglio,
l'epidemiologia studia animali ammalati a confronto con animali sani. Inoltre, devi
considerare che, oltre ai determinanti di malattia, esistono anche dei determinanti di
salute (fattori che contribuiscono a mantenere in salute l'animale o, se ammalato, a farlo
guarire). In epidemiologia si studiano sia i determinanti di malattia che i determinanti di
salute: perch questo animale si ammalato? perch quest'altro rimasto sano?
5. popolazioni: anche questo termine verr meglio chiarito successivamente. Per ora, basta
dire che per popolazione si intende un insieme di individui che hanno uno o pi caratteri
in comune (es. sono presenti nella stessa area geografica, oppure hanno la stessa et, oppure
vengono alimentati con la stessa razione ecc.).
26

3. Definizione di
epidemiologia e concetti di base
3.3 Differenze tra epidemiologia e clinica

OBIETTIVI:

apprendere le differenze fondamentali fra epidemiologia e medicina clinica

Le fondamentali differenze fra il diagnostico clinico e l'epidemiologo possono essere individuate


nei due seguenti campi:

1. il clinico si occupa della diagnosi e terapia di malattie nel singolo individuo; per
l'epidemiologo, invece, il singolo non ha alcun valore (se non in quanto parte di una
popolazione);
2. il compito del clinico quello di curare (e, se possibile, guarire) un animale ammalato; il
compito dell'epidemiologo invece quello di studiare (e prevenire) le malattie in
popolazioni confrontando gruppi (o sottopopolazioni) di animali sani con gruppi di animali
ammalati.

La seguente metafora, che raffronta la medicina clinica all'epidemiologia, famosa fra gli "addetti
ai lavori" nel campo della salute pubblica dell'uomo ma pu essere senz'altro adattata anche al
settore veterinario.
Immaginiamo che una grande valanga d'acqua, derivante da un malfunzionamento del sistema di
dighe di un invaso, stia minacciando la vita di un gran numero di persone. In questa circostanza, il
compito del clinico quello di fornire un salvagente alle persone minacciate o che gi sono state
travolte dall'acqua. Sull'altro versante, l'epidemiologo cerca di individuare il guasto nel sistema di
dighe, per bloccare l'inondazione e prevenirne delle nuove.
La metafora pu essere completata dal seguente corollario: la riparazione del guasto compito della
"salute pubblica".

Quanto finora esposto non deve per far ritenere che l'epidemiologia non sia utile al veterinario
clinico. Anzi, esiste un intero ed attualissimo settore di studio che riguarda l'applicazione dei
principi epidemiologici proprio alla pratica clinica sui singoli animali. Si tratta della cosiddetta
27

EBM (Evidence Based Medicine). In italiano la EBM viene detta, con una traduzione letterale
impropria, medicina basata sull'evidenza, dove per evidenza deve intendersi prova dei fatti.

Nello schema che segue vi sono alcune importanti domande che aiutano a capire perch anche ad un
veterinario clinico, ad esempio che si occupa di animali da compagnia, l'EBM e l'epidemiologia
possono risultare utili.

NELLA PROSSIMA UNIT:


si parla delle cause di malattia viste con l'ottica dell'epidemiologia; si parla anche del fatto che
raramente le malattie possono essere ascritte ad un'unica causa e di come il concetto generale di
causa sia inquadrabile in una visione probabilistica.
28

3. Definizione di
epidemiologia e concetti di base
3.4 Il concetto di determinante di malattia

OBIETTIVO:

assimilare il concetto di 'determinante' di malattia

Durante il corso di studi potresti aver assunto una visione delle malattie secondo cui:

Questa visione tende a ridurre il fenomeno-malattia ad un evento schematico e semplicistico che,


tuttavia, soltanto raramente trova corrispondenza nella realt. In questi rari casi, nei quali in gioco
una sola causa, si parla di "eziologia monofattoriale" o di "malattie monofattoriali". Queste
malattie sono generate da una causa talmente forte da essere capace da sola, di provocare tutti gli
eventi che conducono alla comparsa della malattia stessa. Questa causa forte corrisponde ad un
"determinante sufficiente" la cui presenza provoca sempre la malattia.

ESEMPIO 1. Un trauma che produce una ferita.


ESEMPIO 2. La resezione di un grosso vaso che provoca un'emorragia.
ESEMPIO 3. L'ingestione di un'unica ed elevata dose di una sostanza velenosa.

In effetti, le cose stanno diversamente:

Quasi sempre, infatti, la malattia la conseguenza di una interazione (idealizzata, nel grafico in
basso, dalle frecce verdi e rosse) estremamente complessa di fattori diversi (esterni o interni
all'organismo), che agiscono contemporaneamente o in successione sull'organismo, in sinergismo
o in antagonismo gli uni con gli altri. Queste malattie sono dette "multifattoriali" o "ad eziologia
multifattoriale".

Anche le malattie infettive, che classicamente si ritengono dovute ad una sola causa (un batterio o
un virus), sono quasi sempre soggette al principio ora enunciato. Puoi riflettere sulla semplice
osservazione che non tutti gli individui di una popolazione esposta ad un virus vanno incontro a
malattia: infatti, quella popolazione sar presumibilmente composta, oltre da individui pienamente
recettivi (che quindi ammaleranno), anche da individui che non ammaleranno perch - ad
29

esempio - immuni, oppure scarsamente recettivi su base genetica, oppure di et non compatibile con
l'evoluzione dell'infezione ecc.

ESEMPIO 1. Le colibacillosi del pollo sono indotte da una associazione tra un batterio (Escherichia
coli) ed alcuni fattori ambientali (sovraffollamento, cattiva qualit dell'aria ecc.). Si usa il plurale
("le" colibacillosi) e non il singolare ("la" colibacillosi) in quanto si tratta di un complesso di
malattie diverse per sintomatologia, localizzazione nell'ospite ecc.
ESEMPIO 2. L'adenomatosi polmonare della pecora una malattia contagiosa sostenuta da un virus
e caratterizzata dalla comparsa di lesioni simil-tumorali al polmone. Sono recettive le pecore di ogni
razza. Tuttavia in Islanda, dove la malattia stata ampiamente studiata ed eradicata nel 1952,
erano colpite molto pi frequentemente le pecore di razza gottorp rispetto ad altre razze.

Tutti i fattori che sono in grado di influenzare la comparsa o l'andamento di una malattia, non
potendo essere ritenuti causa di malattia in senso stretto, vengono detti DETERMINANTI.
In altre parole, in epidemiologia...

Nello schema sottostante delineato un esempio di determinanti di una malattia infettiva.


Soprattutto nel caso delle malattie sostenute da microrganismi, ma anche in altre malattie, i
determinanti possono essere classificati in 3 categorie, a seconda che si riferiscano all' ospite, all'
agente o all'ambiente. Le frecce, come gi detto, simboleggiano la complessit delle interazioni
tra i diversi settori. Per ognuno di tali settori sono riportati nel grafico soltanto alcuni fra gli
innumerevoli potenziali attributi.
30

Ti prego di notare la presenza, nello schema, di un determinante "necessario " o


"indispensabile" (l'agente) che deve essere presente perch la malattia si verifichi; esso corrisponde
alla causa tradizionalmente intesa; questo vale per alcune malattie - tipicamente per quelle
infettive - mentre per altre (es. tumori) non esiste alcun determinante indispensabile.
Attento a non confondere "necessario" con "sufficiente". Come gi detto, un determinante
sufficiente quello che produce inevitabilmente - anche da solo - un particolare effetto.

Anche nel caso delle malattie non-infettive i fattori causali sono riconducibili alla stessa classica
triade epidemiologica ospite-agente-ambiente gi vista, tenendo presente che, in questo caso,
l'agente non sar pi rappresentato da un microrganismo ma da altri fattori (chimici o fisici).

da sottolineare che al concetto di determinante si associa una concezione di "causa" diversa da


quella tradizionalmente intesa. Nell'accezione comune, per causa si intende un qualsiasi fattore,
elemento, circostanza che d origine ad un effetto (malattia) o ad una sequenza di eventi che
sfociano nell'effetto. Con il "determinante" si introduce invece il concetto di causa come "fattore
capace di incrementare la probabilit" della malattia.

Al concetto di determinante strettamente connesso quello di rischio. Infatti, in epidemiologia il


rischio rappresenta la probabilit, per un individuo o una popolazione, che un evento (in genere la
malattia) si verifichi in un dato momento o in un dato periodo di tempo.
31
32

3. Definizione di
epidemiologia e concetti di base
3.5 Il concetto di 'determinante' applicato alla vita quotidiana

OBIETTIVO:

verificare come il concetto di 'determinante' possa essere applicato ad eventi della vita quotidiana

gi stato accennato alle differenze fra causa (tradizionalmente intesa) e determinanti di


malattia. Ti ricordo che per determinante di malattia si intende "un qualsiasi fattore che, quando
alterato, produce un cambiamento nella frequenza o nei caratteri della malattia".

Questa unit pu essere considerata un intermezzo divertente (ed anche una pausa di riflessione)
sul concetto di determinante. In effetti, questo concetto di tale complessit da trovare radici e
trattazione in molte speculazioni filosofiche. Si veda, ad esempio, l'enunciazione dei Canoni di
John Stuart Mill.

Oltre che all'evento-malattia ed al piano puramente speculativo, il concetto di determinante


applicabile ed applicato ad una vastissima gamma di situazioni (anche della vita quotidiana) e
risulta fondamentale nell'approccio allo studio dei rapporti causa/effetto.

Nella figura sottostante, un problema purtroppo frequente nelle nostre citt (il furto di automobili)
viene illustrato attraverso l'evidenziazione di alcuni possibili determinanti. Si noti l'analogia con i
determinanti di malattia, e si noti come, anche in questo caso, sia probabile l'evenienza di
sinergismo o antagonismo fra determinanti.
33

molto difficile rispondere alla domanda Perch hanno rubato proprio la mia automobile?. Anzi,
una risposta semplice ed univoca non esiste. Ad esempio, le probabilit che venga rubata una
vecchia automobile di marca poco diffusa e di grossa cilindrata sono molto basse, diminuiscono
ulteriormente se la vettura parcheggiata all'interno di un garage, e si abbassano ancor di pi se il
garage si trova nelle vicinanze di una stazione dei Carabinieri.
Se assimiliamo il furto alla malattia (ed in effetti non forse il furto uno dei tanti mali che
affliggono la nostra societ?), allora i fattori elencati costituiscono determinanti di salute.

Con un esempio molto pi consono alla medicina veterinaria,


potremmo dire della "Malattia di Marek" (una malattia che
colpisce esclusivamente il pollo):
- che sono note linee genetiche resistenti;
- che si manifesta solo in animali di et superiore a 3-4
settimane;
- che pi rara negli allevamenti familiari che in quelli
intensivi;
- che pi rara nei polli vaccinati che in quelli non vaccinati.

Come vedi, abbiamo elencato alcuni determinanti di salute/malattia: genetica, et tipo di


allevamento, stato immunitario.

Prova ad immaginare altri determinanti di furto d'auto, diversi da quelli elencati; prova anche a
trovare altre situazioni comuni cui applicabile il concetto di determinante.
34

3. Definizione di
epidemiologia e concetti di base
3.6 I determinanti primari

OBIETTIVO:

affinare il concetto di 'determinante', ed individuare le classi di determinanti primari

Una classificazione completa e soddisfacente dei determinanti di tutte le malattie impossibile.


gi stato presentato un tipo di classificazione, valido essenzialmente nel caso delle malattie infettive
o infestive (v. Unit Il concetto di determinante di malattia). Esso prevede l'inquadramento dei
determinanti in una delle 3 categorie: agente, ospite, ambiente.

In questa Unit, ed in quella che segue, viene proposto un altro schema di classificazione (v. figura
sottostante), questa volta basato sull'importanza del determinante nella genesi della malattia. I
determinanti importanti vengono definiti primari, mentre quelli meno importanti sono
secondari. Come verr ripetuto anche nella prossima Unit, ti prego di notare che una
classificazione di questo tipo utile soprattutto a scopo didattico, per aiutarti a costruire un ordine
mentale nella prima fase di approccio allo studio delle cause delle malattie. In effetti, nella realt,
spesso difficile stabilire se un certo determinante abbia avuto un ruolo primario o secondario, ed
anzi, nella rete delle cause, lo stesso determinante pu assumemere di volta in volta un ruolo
primario o secondario, in dipendenza di una variet di circostanze.
35

I determinanti primari sono rappresentati dai fattori la cui variazione esercita un effetto maggiore
nella genesi della malattia. In altre parole, essi sono di importanza fondamentale per la comparsa
della malattia.
Spesso (ma non sempre), i determinanti primari sono fattori indispensabili per la comparsa della
malattia. Nello schema viene proposta una classificazione dei determinanti primari in 'intrinseci' (o
endogeni, ossia interni all'ospite) ed estrinseci (o esogeni); questi ultimi possono essere animati o
inanimati.

ESEMPIO. La pseudopeste del pollo una malattia che assume generalmente decorso acuto e
che riconosce come determinante primario estrinseco un virus appartenente alla famiglia
Paramyxoviridae.
36

3. Definizione di
epidemiologia e concetti di base
3.7 I determinanti secondari

OBIETTIVO:

affinare il concetto di 'determinante', individuando i determinanti secondari

I determinanti secondari sono rappresentati dai fattori la cui variazione esercita un effetto minore
nella genesi della malattia. In altre parole, essi non sono indispensabili n di importanza
fondamentale per la comparsa della malattia. In molti casi essi corrispondono ai cosiddetti fattori
"predisponenti" o "favorenti".

ESEMPIO. La polmonite enzootica del suino una malattia cronica, diffusa in tutto il mondo, che
provoca gravi danni economici negli allevamenti intensivi. Il determinante primario un batterio:
Mycoplasma hyopneumoniae. Tuttavia, la malattia si manifesta pi spesso, e con caratteri di
maggiore gravit, se sono presenti alcuni fattori (determinanti secondari), fra i quali:
sovraffollamento, scarsa ventilazione, sbalzi di temperatura, stress diversi (svezzamento,
37

formazione dei gruppi ecc.).


Questa stessa situazione (malattie da virus o da batteri aggravate da determinanti secondari) si
presenta con notevole frequenza in numerose malattie respiratorie o enteriche degli animali in
allevamento intensivo (es. colibacillosi del pollo; colibacillosi del vitello; colibacillosi del suinetto,
gastroenterite trasmissibile del suinetto ecc.)

Come nel caso dei determinanti primari, nello schema viene proposto un esempio di determinanti
secondari, suddivisi in intrinseci (o endogeni, ossia interni all'ospite) ed estrinseci (o esogeni).

Vale la pena di sottolineare che la classificazione proposta, in base alla quale i determinanti
vengono suddivisi in "primari" e "secondari", utile soprattutto a scopo didattico, ma pu non
risultare altrettanto valida nella pratica. La suddivisione, infatti, non deve essere ritenuta fissa e
nitida: in alcune situazioni, un determinante classificato come "secondario" pu viceversa agire
come determinante "primario".

ESEMPIO.
La costituzione genetica rappresenta certamente un determinante secondario riguardo alla malattia
di Marek (una malattia tumorale del pollo sostenuta da un herpesvirus). Infatti, la costituzione
genetica pu ostacolare la comparsa di malattia, essendo note "linee genetiche" di polli
relativamente resistenti, che si ammalano meno frequentemente o nelle quali la malattia meno
grave.
Per altre malattie (es. emofilia dell'uomo) la costituzione genetica rappresenta invece un
determinante primario.
38

3. Definizione di
epidemiologia e concetti di base
3.8 Salute e malattia

OBIETTIVI:

riflettere sul concetto di salute degli animali;

apprendere che il confine fra salute e malattia non sempre ben definito;

imparare che negli allevamenti le malattie gravi o mortali possono risultare meno dannose delle
malattie lievi.

Proseguiamo nell'esame dettagliato delle parole chiave della definizione di epidemiologia che
abbiamo adottato (epidemiologia = studio della frequenza, distribuzione e determinanti di
salute/malattia in popolazioni), ed in particolare consideriamo il binomio salute/malattia.
Forse potresti pensare che l'utilizzo delle due parole salute e malattia sia una inutile
ridondanza, e che quindi sarebbe stato sufficiente parlare pi semplicemente di determinanti di
malattia.
Tuttavia, devi ricordare che, negli studi epidemiologici, sono sempre compresi sia animali
ammalati che sani; d'altra parte, un animale pu essere considerato ammalato solo se
confrontato ad uno sano. Inoltre, lo studio del perch alcuni animali rimangono sani pu essere
utile a comprendere i motivi per cui altri animali si ammalano. Questo approccio , in un certo
senso, opposto a quello della medicina classica, che sostanzialmente studia soprattutto il perch
l'animale si ammala.
In altre parole, l'epidemiologia studia le cause di salute e le cause di malattia, mentre altre
discipline si limitano a studiare le sole cause di malattia. Ecco quindi giustificato l'impiego del
doppio termine salute/malattia.

I termini "salute" e "malattia" hanno un significato piuttosto vago e impreciso; in effetti, difficile
stabilire un confine netto fra salute e malattia. Secondo l'Organizzazione Mondiale della
Sanit, per salute si intende (nell'uomo) uno stato di completo benessere fisico, mentale e sociale,
e non la semplice assenza di malattia o di infermit; ovviamente molto difficile stabilire quando
un individuo si trova in completo benessere. Questo vale per gli essere umani e, forse ancor pi,
per gli animali. D'altra parte, piccole alterazioni di questo stato di benessere non possono essere
certo sufficienti a proclamare l'individuo ammalato.
L'accordo sullo stato di "salute" e "malattia" pu dipendere anche da fattori ambientali o sociali. Ad
esempio, oggi una persona che ha febbre a 38C senz'altro ritenuta ammalata. Per i medici dei
lager nazisti, invece, un detenuto era dichiarato "ammalato" soltanto quando la temperatura
superava i 39C.

Sempre allo scopo di sottolineare quanto possano essere imprecisi i confini tra salute e malattia,
consideriamo la storia naturale di una malattia. La storia naturale comprende l'evoluzione naturale
di una malattia nel tempo, ossia come essa si comporta, in assenza di qualsiasi intervento, sia nelle
popolazioni che nei singoli animali.
Ogni malattia prevede il verificarsi di diversi momenti che segnano il passaggio dallo stato di salute
39

allo stato di malattia. Questi momenti sono riassunti nello schema che segue, in cui l'evento
"diagnosi" contrassegnato da una linea tratteggiata, ad indicare che esso estraneo, a rigore, alla
storia naturale della malattia.

Un animale ammalato, in senso proprio, quando manifesta disfunzioni rilevabili attraverso i


sensi dell'osservatore dette sintomi o, meglio, segni clinici; in questo caso si parla di malattia
clinica.
D'altra parte, un animale pu essere affetto anche da malattie non evidenziabili attraverso i sensi del
medico veterinario; in questo caso si tratta di malattia subclinica, cio di anormalit anatomica
e/o funzionale evidenziabile soltanto attraverso test diagnostici.

ESEMPIO. Gli allevatori di piccioni viaggiatori consultano il veterinario perch i propri animali
hanno un basso rendimento nelle competizioni, pur apparendo in eccellente salute e perfettamente
sani per quanto riguarda l'aspetto, la conformazione e le funzioni organiche.

Negli animali da reddito, l'accertamento dello stato di salute pi semplice: in questa categoria di
animali, la produttivit considerata un buon indicatore dello stato di salute, in base al
ragionrvole principio che un animale
sano produce molto.

Vediamo ora qualche aspetto legato alla


presenza di una malattia clinica oppure
subclinica. In genere, una malattia in
forma subclinica meno grave, per il
singolo individuo, rispetto alla stessa
malattia in forma conclamata (malattia
clinica). Tuttavia, a livello di
popolazione, una malattia subclinica
pu essere pi dannosa di una malattia
clinica. Infatti, la malattia subclinica
quasi sempre colpisce un maggior
numero di individui. Ci abbastanza
logico, se si pensa che essa non viene
40

rilevata dall'allevatore; di conseguenza, non viene richiesto l'intervento del veterinario, n si


mettono in atto metodi per la sua prevenzione. L'elevata frequenza di individui con malattia
subclinica si osserva soprattutto per le malattie contagiose, in gruppi di animali molto numerosi ed
in allevamento intensivo. Una buona regola generale (che, ovviamente, ammette eccezioni), la
seguente: indipendentemente dalla/e causa/e primaria/e della malattia, il numero di animali con
malattia subclinica molto pi elevato di quelli con malattia clinica. Si veda al proposito la
figura a lato L'iceberg delle malattie.

Un esempio del "fenomeno dell'iceberg" rappresentato dalla frequenza di


morsicature dell'uomo da parte di cani. Negli Stati Uniti stato recentemente
calcolato che in 1 anno si siano verificati 20 casi mortali, 13.360 casi che
hanno richiesto l'ospedalizzazione, 334.000 una visita al pronto soccorso,
451.000 una visita di altro genere e ben 3.730.000 casi di morsicatura che non
sono stati sottoposti a trattamento medico di nessun tipo. Nell'ottica dei dati
ufficiali di salute pubblica, le ultime due categorie, che non comportano una
denuncia ufficiale, rappresentano la parte sommersa dell'iceberg.
Dati da: Weiss H.H. et al. (1998) Incidence of dog bite injuries treated in emergency departments. JAMA, 279, 51-53

Il fenomeno iceberg estremamente importante in epidemiologia, perch lo studio dei soli


individui con malattia conclamata (la parte emersa dell'iceberg) non sufficiente per evidenziare un
quadro esauriente dell'andamento di una malattia, della sua gravit e della sua importanza. Ad
esempio, nelle popolazioni di animali domestici, il fatto che una malattia sia presente o meno in un
gruppo di animali pu essere meno importante rispetto alla frequenza della malattia stessa. Infatti,
come gi detto, una elevata frequenza di malattia, anche subclinica, esercita un impatto sulla
produttivit dell'allevamento.

ESEMPIO. La mastite subclinica della bovina da latte ad alta produzione una malattia
virtualmente presente in tutti gli allevamenti intensivi ed praticamente impossibile da eliminare;
tuttavia, importante mantenere bassa la frequenza di animali colpiti affinch l'allevamento risulti
economicamente conveniente.

Bisogna infine considerare che esistono molti altri fattori (management, tecniche di allevamento,
alimentazione ecc.) che possono esercitare un grande impatto sulle produzioni animali, anche se, in
s, non sono capaci di provocare malattia. Come gi visto, tutti questi fattori sono determinanti di
salute o malattia.

Nello schema che segue sono riassunti i principali concetti esposti in questa Unit.
41

Nella figura a
lato riassunta
schematicamen
te l'evoluzione
che nel tempo
ha subto il
concetto di "salute".
In passato, la linea di demarcazione tra lo stato di salute e quello di non-salute era collocata in
corrispondenza della comparsa di chiari segni clinici di una patologia.
Attualmente la linea di demarcazione fra salute e malattia viene collocata molto pi precocemente.
Anche una semplice condizione di esposizione a fattori di rischio (cio fattori che potenzialmente
inducono malattie), rappresenta gi, di per s, uno stato di non-salute. Ad esempio, nelle nostre citt
l'innalzamento delle polveri sottili oltre una soglia prefissata configura una condizione di rischio e
fa scattare provvedimenti di restrizione del traffico.
L'approccio ora esposto si integra alla perfezione con il concetto di "prevenzione".
42

3. Definizione di
epidemiologia e concetti di base
3.9 Il concetto di "popolazione"

OBIETTIVO:

acquisire un concetto esteso del termine 'popolazione', cos come utilizzato in epidemiologia

Nel linguaggio comune, per popolazione si intende generalmente indicare l'insieme delle persone
(o degli animali) abitanti un luogo.

Nel linguaggio epidemiologico, il termine viene usato in un significato diverso, intendendo un


insieme di unit (spesso rappresentate da animali della stessa specie) che hanno uno o pi attributi
in comune.
Solitamente gli attributi vengono scelti con criteri arbitrari, ma utili ai fini dello studio che si
intende eseguire. importante definire con precisione i criteri da adottare per definire la
popolazione da studiare; ci si ottiene adottando regole precise per includere o no un elemento nella
popolazione. In genere, queste regole si fissano rispondendo per lo meno alle tre classiche
domande: chi o che cosa?, dove? quando? (What-Where-When).

La dimensione (o numerosit) della popolazione in studio non un fattore critico. Ad esempio, si


potrebbe studiare una popolazione composta da un numero estremamente grande di unit (es. le
uova che vengono prodotte in Europa nel corso di un anno), oppure, viceversa, una popolazione
molto piccola (es. i felini presenti in uno zoo).

Si possono studiare anche popolazioni indeterminate, cio composte da elementi non esistenti
fisicamente. Ad esempio, nello studio sull'efficacia di un vaccino per il cane, potrebbe interessare la
popolazione indeterminata di tutti i cani che verranno vaccinati in futuro con quel vaccino.

Come gi detto, molto spesso le unit che compongono la popolazione in studio sono rappresentate
da animali. In altri casi l'attenzione pu essere rivolta, piuttosto che ad un insieme di animali, ad un
insieme di altre "unit di interesse", come ad esempio cellule, batteri, ecc. Quindi, si potr studiare
una "popolazione di cellule" oppure una "popolazione di batteri" od ancora una "popolazione di
allevamenti" e cos via.

Non indispensabile che una popolazione sia uniforme (cio composta da unit dello stesso tipo).

ESEMPIO. L'afta epizootica una malattia virale che colpisce i mammiferi ungulati domestici, in
particolare bovini, ovini, caprini e suini, ma pu colpire anche gli erbivori selvatici, quali bisonti,
43

cervi, antilopi, renne, giraffe ecc. In uno studio sull'afta epizootica nell'Africa sub-sahariana la
popolazione di interesse potrebbe essere rappresentata da un insieme di animali appartenenti ad
alcune delle suddette specie.

Ecco alcuni esempi di "popolazione":

- le bovine in lattazione presenti in un allevamento il giorno 1 dicembre 2011;


- i vitelli di et <5 mesi presenti negli allevamenti della provincia di Parma al 10 novembre 2010;
- i suini macellati in provincia di Parma nel corso del 2006;
- i piccioni presenti nel centro storico di una citt in un dato periodo;
- le api di un alveare al momento in cui si effettua un trattamento antiparassitario;
- le forme di Parmigiano-Reggiano prodotte dai caseifici della provincia di Parma nel corso del
2011;
- gli allevamenti di bovine da carne attivi nella regione Veneto nel semestre luglio-dicembre 2009.

In molti casi non possibile esaminare tutta la popolazione di interesse, ma ci si deve accontentare
dell'esame di un campione. Questo argomento verr trattato estensivamente nel Cap. 9
(Campionamento). Per utile anticipare fin d'ora che, negli studi epidemiologici eseguiti su un
campione estratto da una popolazione, spesso si desidera generalizzare i risultati ottenuti.

ESEMPIO. Hai sottoposto ad un trattamento con un antibiotico 10 cani affetti da una certa malattia,
e ne sono guariti 9. Hai ottenuto un buon risultato sui 10 cani che rappresentano la tua popolazione
in studio; certamente sarai portato a generalizzare il risultato, ed a ritenere che il trattamento con
quell'antibiotico indurr la guarigione del 90% dei cani in altre popolazioni; ad esempio, sulla
popolazione indeterminata costituita tutti i cani che, in futuro, verranno colpiti da quella malattia e
verranno trattati con quell'antibiotico.

Insomma, in molti casi non ci interessano i risultati ottenuti proprio sul campione esaminato:
invece, i risultati interessano perch sono (o potrebbero essere essere) generalizzabili a popolazioni
pi ampie. Questo processo logico di generalizzazione viene detto inferenza.

Il significato generale del termine inferenza "processo logico per il quale, data una o pi
premesse, possibile trarre una conclusione". In statistica ed in epidemiologia il termine inferenza
44

assume un significato un po' diverso, ossia quello di generalizzazione di una conclusione cui si
pervenuti attraverso lo studio di una popolazione limitata.

L'inferenza fa parte di una branca della Statistica che si chiama appunto "statistica inferenziale".
Non farti intimorire dalla terminologia complicata... in effetti tutti noi facciamo
pi o meno inconsciamente processi di inferenza, quando "universalizziamo" il
contenuto di un certo numero (di solito limitato) di osservazioni. Ad esempio, se
il cielo nuvoloso usciamo con l'ombrello: infatti abbiamo imparato (abbiamo
fatto esperienza), dalle giornate nuvolose che si sono succedute nella nostra vita,
un principio generale: al cielo nuvoloso segue spesso una giornata di pioggia. In questo caso,
inferenza vuol dire anche previsione. In fondo, ci che chiamiamo esperienza largamente basato
sull'inferenza, che non altro che un procedimento di generalizzazione dei risultati ottenuti
esaminando un campione.

Se vuoi saperne di pi su questo argomento, ti rimando al Capitolo del campionamento.


45

3. Definizione di
epidemiologia e concetti di base
3.10 Livelli organizzativi di popolazioni

OBIETTIVO:

estendere il concetto di 'popolazione', considerando l'esistenza di diversi livelli organizzativi

Nel linguaggio comune, quando si parla di popolazioni si intende generalmente l'insieme delle
persone che abitano un luogo (es. popolazione di una citt) oppure l'insieme di animali o cose che
caratterizzano un luogo (es. la popolazione marina ecc.). In un significato molto restrittivo, con il
termine popolazione si indica soltanto la popolazione umana.

In epidemiologia, invece, il termine popolazione ha un significato molto pi ampio: popolazione


qualsiasi aggregato di un numero finito (o infinito) di unit che hanno una o pi caratteristiche
comuni. Nota che si parla di unit e non di animali. Infatti, se vero che spesso gli studi
epidemiologici sono edifici fatti con mattoni costituiti da animali, ma anche vero che, in altri
casi, i mattoni sono diversi e della pi svariata natura: anzich studiare animali, si possono
studiare allevamenti, campioni di latte, uova, batteri, canili, titoli anticorpali, biopsie da organi, ecc.
Perci, anche se pu sembrare strano, in epidemiologia sarebbe del tutto lecito parlare di
"popolazioni" di batteri, o di "popolazioni" di allevamenti ecc.

In effetti, il termine popolazione pu indicare un aggregato comprendente diversi livelli di


organizzazione; ad esempio, un insieme (ossia una popolazione) di cellule con caratteri simili
costituisce un tessuto; un insieme di tessuti costituisce un organo; un insieme di organi costituisce
un apparato; un insieme di apparati costituisce un individuo; un insieme di individui costituisce un
gruppo (mandria, gregge, sciame, branco, banco ecc.). Un insieme di gruppi di quest'ultimo tipo, o
un insieme di allevamenti, rappresentano anch'essi popolazioni, per esempio a livello di
provincia, regione ecc.
46

Ogni studio epidemiologico pu essere svolto su elementi a diversa tipologia e ad un qualsiasi


livello organizzativo; l'elemento costitutivo del livello organizzativo prescelto viene detto unit di
analisi o unit di interesse di quello studio.

In medicina umana o nel caso degli animali da compagnia l'unit di analisi pi spesso l'individuo;
nel caso degli animali da reddito, e soprattutto delle piccole specie allevate in gruppi numerosi
(polli, pesci ecc.), l'unit di analisi rappresentata invece, in molti casi, dal gruppo stesso o
dall'intero allevamento.

In tempi recenti, diventato normale considerare dal punto di vista epidemiologico anche le
popolazioni di microrganismi (batteri, miceti ecc.).

ESEMPIO 1. Vuoi conoscere la frequenza della malattia vaiolo ovino. L'obiettivo dello studio
quello di individuare la prevalenza della malattia nelle pecore allevate in una determinata regione.
La popolazione di interesse : tutte le pecore della regione; l'unit di interesse il singolo animale
(pecora).

ESEMPIO 2. Stai predisponendo un'inchiesta riguardo all'influenza aviare. L'obiettivo quello di


individuare la frequenza di allevamenti con soggetti siero-positivi. La popolazione di interesse :
tutti gli allevamenti di pollame della regione; l'unit di interesse il singolo allevamento.

ESEMPIO 3. Stai studiando i rapporti fra mastite bovina e produzione di formaggio


(caseificazione), e vuoi individuare l'esistenza di una eventuale associazione fra contenuto in
leucociti nel latte e qualit della caseificazione. La popolazione di interesse : tutti i caseifici della
regione; l'unit di interesse il singolo caseificio.

ESEMPIO 4. Stai studiando di nuovo i rapporti fra mastite bovina e produzione di formaggio
47

(caseificazione). Anche in questo caso, vuoi individuare l'esistenza di una associazione fra
contenuto in leucociti nel latte e qualit della caseificazione. La popolazione di interesse : tutte le
partite di latte conferite ad un certo caseificio in un dato periodo di tempo; l'unit di interesse la
singola partita di latte.

ESEMPIO 5. Lavori in una industria farmaceutica in cui stato sintetizzato un nuovo antibiotico.
Hai il compito di saggiarne l'attivit. L'obiettivo : valutare l'efficacia in vitro dell'antibiotico nei
confronti di una data specie batterica. La popolazione di interesse : tutti i ceppi di quella specie
batterica isolati da animali ammalati in un dato periodo di tempo; l'unit di interesse il singolo
ceppo batterico.
48

4. Compiti e
scopi dell'epidemiologia
4.1 Compiti specifici e scopi pratici della epidemiologia

OBIETTIVO:

apprendere i compiti e gli scopi dell'epidemiologia e rendersi conto che l'epidemiologia anche
disciplina diagnostico-pratica

In una precedente unit sono state fornite alcune definizioni che identificano il campo d'azione
dell'epidemiologia. Ora venuto il momento di precisare quali sono i principali scopi che possono
essere raggiunti attraverso i metodi epidemiologici.

Lo scopo ultimo dell'epidemiologia veterinaria quello di acquisire dati su cui basare decisioni
razionali per la prevenzione ed il controllo delle malattie in popolazioni animali; a ci segue
l'ottimizzazione dello stato di salute e quindi della produttivit.

Altre discipline mediche hanno uno scopo pressoch simile, anche se si occupano prevalentemente
di singoli individui e non di popolazioni. Negli studi epidemiologici e nell'attivit degli
epidemiologi possono tuttavia essere individuati elementi peculiari, quali:

1. raccogliere informazioni che descrivono la frequenza e la distribuzione dello stato di salute e


di malattia in popolazioni animali. Queste informazioni (o DATI) sono indispensabili per
conoscere se una malattia presente o meno in un territorio (fra l'altro, questa conoscenza
spesso necessaria ai fini commerciali per esportazioni, importazioni ecc.). I dati in oggetto
sono anche indispensabili per conoscere l'importanza (economica, sanitaria, o nei riflessi
della salute dell'uomo ecc.) delle diverse malattie in territori o popolazioni, utile per stabilire
una priorit nella pianificazione degli interventi;
2. identificare i fattori che influenzano la comparsa e l'andamento delle malattie nella
popolazioni. Questi dati servono soprattutto per l'impostazione di azioni di prevenzione,
eradicazione, controllo e di profilassi in genere.
3. quantificare le interrelazioni tra salute e malattia, cio accertare e studiare i determinanti
di salute e di malattia.
49

Gli obiettivi ora descritti si traducono in pratica nelle seguenti attivit pratiche:

1. determinare l'origine di una malattia la cui causa conosciuta (perch si verificato un


focolaio? da dove ha avuto origine? perch il numero di casi di una determinata malattia
aumentato? perch la malattia si estesa a nuovi territori? perch la malattia ora colpisce
nuove specie?);
2. studiare e controllare una malattia la cui causa inizialmente sconosciuta; (quali sono le
circostanze che favoriscono la malattia? perch alcuni si ammalano ed altri no?)
3. acquisire informazioni sulla ecologia e sulla storia naturale di una malattia (qual
l'andamento naturale della malattia nella popolazione, cio in assenza di qualsiasi
intervento?), soprattutto allo scopo di ridurro o eliminare i determinanti di malattia, e di
promuovere i determinanti di salute;
4. pianificare e monitorare i programmi di controllo delle malattie (qual la strategia migliore
per controllare una malattia? quali sono le malattie da controllare prioritariamente? i piani di
controllo gi in corso sono efficaci?)
5. valutare l'impatto economico delle malattie ed analizzare il rapporto costi/benefici dei piani
di controllo (quanti danni produce una malattia? qual il risparmio ottenuto con un piano di
controllo e, pi in generale, le risorse spese per il controllo sono spese bene?).
50
51

4. Compiti e
scopi dell'epidemiologia
4.2 Prevenzione - Controllo - Eradicazione

OBIETTIVO:

apprendere il significato di alcuni termini importanti in epidemiologia e nella pratica veterinaria,


soprattutto nel settore delle malattie infettive

gi stato accennato ad uno dei compiti basilari della epidemiologia, e cio quello di identificare
i fattori che influenzano la comparsa e l'andamento nella popolazione. Si detto anche che la
raccolta e la conoscenza di queste informazioni pu essere utile, soprattutto nel caso delle malattie
infettive, per l'impostazione di azioni di profilassi, di prevenzione, di controllo, e di eradicazione.
Questi quattro termini non sono sinonimi, ma ciascuno di essi assume un suo significato, che viene
brevemente illustrato qui di seguito.

Profilassi

il complesso delle misure utili a prevenire la comparsa e la diffusione delle malattie, soprattutto
trasmissibili. Essa pu essere applicata al singolo individuo oppure su intere popolazioni e
comprende misure di tipo "medico" (es. vaccini o farmaci) o "sanitario" (es. quarantena,
disinfezione). L'azione di profilassi pu essere applicata anche a condizioni diverse dalle malattie
trasmissibili. Ad esempio, una buona razione alimentare costituisce una forma di profilassi nei
confronti di malattie metaboliche, nutrizionali o da carenza.

Il termine quarantena deriva dai 40 giorni di isolamento delle navi prima dell'accesso al porto,
richiesti come misura contro la peste nera nel XIV secolo.

Per tutti i cani ed altri animali in ingresso nel Regno Unito era richiesto un periodo di sei mesi di
quarantena; tale provvedimento era giustificato dal rischio di importazione della rabbia. Questa
norma stata abolita alcuni anni or sono, e sostituita dal sistema del Pet Passport: gli animali
possono evitare la quarantena se esiste la documentazione che essi sono appropriatamente vaccinati.

I primi astronauti di ritorno dalla Luna furono messi in quarantena al momento del loro ritorno in un
laboratorio appositamente costruito.
52

Prevenzione

Per prevenzione si intende l'insieme di misure di profilassi (non solo mediche ma anche di tipo
sociale o economico) rivolte ad evitare l'insorgenza di una malattia in una popolazione esente da
quella malattia. Secondo alcuni, il concetto di prevenzione pu essere ampliato fino a comprendere
le misure che limitano la progressione e la gravit della malattia, adottate allo scopo finale di
eliminarla.

In questa ottica, il principale ente sanitario internazionale, cio la "Organizzazione Mondiale della
Sanit" (World Health Organization, WHO), ha definito 3 livelli di prevenzione della malattia
dell'uomo:

prevenzione primaria (volta a ridurre la incidenza (comparsa di nuovi casi) della malattia)
prevenzione secondaria (volta a ridurre la prevalenza (frequenza di casi esistenti) della
malattia)
prevenzione terziaria (volta a ridurre la gravit e le complicazione di malattie inguaribili).

La prevenzione primaria si attua rimuovendo i determinanti (fattori di rischio) delle malattie.


Ad esempio, la vaccinazione, l'utilizzo di acqua di bevanda di buona qualit ecc. Nell'uomo,
l'impiego delle cinture di sicurezza in automobile, l'uso di cuffie in ambienti di lavoro ad elevato
livello sonoro, l'utilizzo di test per individuare i donatori di sangue positivi per HIV o epatite B
sono tutti esempi di prevenzione primaria.
53

La prevenzione secondaria ha lo scopo di identificare l'ammalato precocemente, cio quando la


malattia (o la sua progressione) pu essere arrestata. Esempi di prevenzione secondaria nell'uomo:
pap-test, mammografia per l'individuazione di tumori mammari, ricerca del sangue occulto nelle
feci per l'individuazione del carcinoma colon-rettale.
La prevenzione terziaria sconfina spesso nella terapia: ad esempio, una appropriata dieta per un
diabetico.

La trasposizione di queste 3 definizioni al settore veterinario pu essere difficoltosa e non


universalmente accettata, soprattutto riguardo alla prevenzione terziaria.

Controllo

Il controllo di una malattia si attua riducendo la sua frequenza nella popolazione fino ad un livello
tale da rendere la malattia non classificabile fra i problemi sanitari o economici importanti.

Il controllo della malattia compatibile con l'esistenza di un limitato numero di casi o focolai. Il
livello di frequenza della malattia accettabile al fine di dichiarare quella malattia sotto controllo
varia in rapporto alle caratteristiche della malattia stessa. Per esempio, tale livello basso nel caso
dell'afta epizootica, pi alto nel caso della tubercolosi bovina. Contrariamente all'eradicazione, il
controllo non implica l'eliminazione della malattia e del relativo agente causale. Ad esempio, in
Italia nel 1997 la tubercolosi bovina era sotto controllo, ma non eradicata.

Eradicazione

L'eradicazione di una malattia comporta l'eliminazione della malattia in seguito alla eliminazione
del relativo agente da una regione, nazione o continente. L'eradicazione deve essere differenziata
dalla semplice eliminazione di una malattia: quest'ultima, infatti, corrisponde alla scomparsa di
tutti i casi clinici in una popolazione, il che non implica necessariamente la scomparsa dell'agente
eziologico.

ESEMPIO 1. In Norvegia stato attivato un piano di eradicazione di una malattia da virus del
bovino: la diarrea virale/malattia delle mucose. Il piano prevede l'identificazione degli
allevamenti infetti attraverso lo screening degli allevamenti di bovini da latte. In una prima fase
viene ricercata la presenza di anticorpi nel latte di massa; in caso di positivit viene esaminato il
latte delle primipare e quindi il siero di sangue. Agli allevamenti positivi viene impedita la
vendita di animali e l'utilizzo di pascoli in comune con animali di
altri allevamenti.

ESEMPIO 2. Nel corso del XX secolo sono state effettuate, a livello


mondiale, numerose campagne per eradicare la peste bovina
(rinderpest), una malattia che colpisce anche altri ruminanti e che
sostenuta da un virus della Famiglia Paramyxoviridae, simile a
quello del morbillo dell'uomo. Le campagne erano basate soprattutto
sull'uso di vaccini contenenti virus vivo ed attenuato nella sua
54

virulenza, in modo da provocare nell'ospite un'infezione asintomatica, seguita dall'instaurarsi di una


solida immunit .L'ultima campagna stata condotta sotto l'egida della FAO (Food and Agriculture
Organization). Il 14 Ottobre 2010, dopo nove anni di assenza di segnalazioni di casi della malattia a
livello mondiale, la FAO dichiarato eradicata la peste bovina. Questo il primo, e per il momento
unico, caso di eradicazione di una malattia del bestiame su scala mondiale.
55

4. Compiti e
scopi dell'epidemiologia
4.3 Obiettivi di uno studio epidemiologico

OBIETTIVO:

acquisire informazioni sugli obiettivi di base della epidemiologia veterinaria;

differenziare l'epidemiologia descrittiva (osservazionale) da quella analitica (sperimentale).

E' necessario premettere che non esiste una classificazione univoca delle tipologie di studi
epidemiologici. Esistono schemi di classificazione molto complicati, ed una loro esposizione
esauriente va al di l degli scopi del Quaderno. L'argomento reso ancor pi difficile dal fatto che,
in letteratura, c' qualche divergenza sulla terminologia.

In questa unit, ed in una successiva, viene fornito uno schema di base semplificato, e quindi
impreciso, ma efficace a scopo didattico per chi si avvicina per la prima volta all'Epidemiologia

Lo schema, gi accennato nelle Unit precedenti, prevede che gli obiettivi degli studi
epidemiologici possano essere riassunti in due grandi settori principali:

Il primo settore comprende la cosiddetta "epidemiologia descrittiva", che ha lo scopo primario di


studiare le caratteristiche di una malattia (frequenza, andamento ecc.) a livello di popolazione.
L'attributo "descrittiva" deriva dal fatto che, nello studio, ci si limita ad osservare e descrivere,
senza interferire con il fenomeno in studio. Con efficace acronimo tratto dalla lingua inglese, questi
studi sono caratterizzati da quattro W: What, Who, When, Where. Manca la quinta W, che
appannaggio degli studi analitici (o sperimentali, v.sotto).
In alcuni casi si studiano gruppi di animali con frequenza insolitamente alta o bassa di malattia, allo
scopo di avanzare delle ipotesi sulle cause ("determinanti") di quella malattia. In altri casi, si valuta
la frequenza di malattia al fine di quantificare il fenomeno-malattia e comprenderne la portata e
l'effetto sulla popolazione.

Si potrebbe condurre una indagine epidemiologica per conoscere qual la frequenza di


"infertilit" nelle bovine da latte di una regione. I dati ottenuti, debitamente analizzati e confrontati,
saranno utili per chiarire le dimensioni e le caratteristiche del problema "infertilit", per valutare
l'opportunit di intraprendere forme di lotta pianificata ecc.
56

In altri casi, l'epidemiologia descrittiva pu servire a dimostrare che una regione indenne da una
determinata malattia; questa conoscenza quasi sempre richiesta nello scambio o commercio di
animali o loro prodotti.
In genere, gli studi descrittivi (detti anche "studi ecologici") rappresentano un substrato prezioso
per gli studi analitici, e quindi li precedono.

Il secondo settore raccoglie tutte quelle attivit che hanno lo scopo di verificare una ipotesi; le
ipotesi pi frequenti riguardano l'effetto di uno o pi (presunti) determinanti di malattia. In altre
parole, si studia perch una malattia si sviluppa. Indagini di questo tipo rientrano nella cosiddetta
epidemiologia analitica. L'attributo "analitica" indica che ci si basa su procedimenti propri
dell'analisi. In questo tipo di studi si interferisce attivamente con la malattia in studio, manipolando
una o pi delle variabili in causa.
57

4. Compiti e
scopi dell'epidemiologia
4.4 Obiettivi di 3 discipline diagnostiche

OBIETTIVO:

esaminare i campi di azione dell'epidemiologia e metterli a raffronto con quelli della clinica e
della patologia. Capire perch tutte le discipline sono importanti.

Nello schema sottostante vengono riassunti gli obiettivi di 3 discipline diagnostiche: la clinica, la
patologia (anatomia patologica) e l'epidemiologia. Agli specialisti di ciascuna delle 3 discipline
considerate, lo schema potrebbe sembrer criticabile sotto molti aspetti; tuttavia lo ritengo
didatticamente molto utile, soprattutto nella fase iniziale del corso di studi. Infatti, lo schema
fornisce una buona idea dei diversi approcci diagnostici di tre importanti discipline che affronterai
(o forse hai gi affrontato), discipline che si intersecano e si integrano l'una con l'altra nella attivit
professionale del medico veterinario.

La clinica si occupa eminentemente del singolo animale; anche quando in gioco la salute di un
gruppo (es. i bovini di un allevamento da carne), si pone l'importanza sui singoli, per poi estrapolare
diagnosi e terapia a tutti gli animali interessati. L'attivit del clinico pu essere effettuata in
58

campo (nel caso degli animali da reddito); sempre pi spesso, tuttavia, il clinico coinvolto nella
visita di animali da compagnia, attivit che avviene in ambulatorio e quindi lontano dal luogo dove
l'animale (o gli animali) vive. Il fine ultimo dell'attivit del clinico quello di curare e guarire
l'animale (o gli animali) ammalati.

La patologia e l'anatomia patologica mirano ad una diagnosi generalmente "a posteriori", cio
effettuata sull'animale morto, al fine di conoscere la causa della malattia o della morte. Gli elementi
raccolti dalla patologia sono utili soprattutto a comprendere gli eventi patogenetici e l'evoluzione
della malattia nel singolo individuo. In sostanza, si mira a meglio comprendere la malattia per
meglio diagnosticarla e curarla in futuro.

Per quanto riguarda l'epidemiologia, si deve sottolineare ancora una volta come essa sia scienza che
si occupa di popolazioni. Il lavoro della raccolta dei dati deve avvenire in campo, cio dove vive la
popolazione stessa. Ovviamente, i dati (riguardanti sia gli ammalati che i sani) verranno poi
elaborati ed interpretati "a tavolino", probabilmente con l'utilizzo di un computer. Il fine ultimo
quello di ...
59

4. Compiti e
scopi dell'epidemiologia
4.5 Valutazione dell'ipotesi: studi osservazionali, sperimentali, teorici

OBIETTIVI:

acquisire una visione schematica dell'approccio epidemiologico alla valutazione di un'ipotesi


sulla causa di una malattia;

consolidare e riassumere le conoscenze sui tipi di studi epidemiologici;

differenziare fra variabili qualitative e quantitative

E' gi stato ripetuto pi volte nelle precedenti unit che uno dei compiti dell'epidemiologia quello
di accertare delle ipotesi; pi in particolare, una delle ipotesi pi frequenti riguarda i determinanti di
malattia, e pu essere espressa con il seguente enunciato generale:

L'approccio epidemiologico ad ipotesi di questo tipo pu essere effettuato con tre criteri diversi,
riassunti nello schema che segue:
60

Gli studi osservazionali (detti anche "ecologici"), sono quelli nei quali le variabili in studio (cio,
nel caso pi semplice, la variabile malattia e la variabile presunta causa) vengono monitorate, ma su
di esse non si effettua alcun tipo di intervento. Ci si limita a trarre informazioni sull'esistenza di un
rapporto causa-effetto dalla semplice osservazione dei fatti.
Un esempio storico di studio di questo tipo quello sul ruolo dell'acqua nella diffusione del
colera dell'uomo eseguito nella met del XIX secolo;

Gli studi sperimentali (o esperimenti controllati) sono i pi adatti a identificare i determinanti di


malattia. Possono essere effettuati in laboratorio o in campo.

Negli studi in laboratorio si lavora in genere su animali da laboratorio (topo, cavia ecc.), o su altri
substrati viventi (es. colture cellulari, colture d'organo ecc.), oppure, quando possibile, direttamente
sulla specie animale di interesse. Lo sperimentatore interferisce con entrambe le variabili in studio.

ESEMPIO. Si vuole valutare l'efficacia di un vaccino antirabbico in un


animale da esperimento (topino), attraverso un esperimento di challenge
dopo vaccinazione. Si utilizzano due gruppi di topini, dei quali uno viene
sottoposto a vaccinazione mentre l'altro non subisce alcun trattamento
(gruppo di controllo). Dopo un adatto periodo di tempo (necessario a
consentire al vaccino di esercitare la sua attivit), entrambi i gruppi vengono sottoposti ad infezione
sperimentale (challenge) con il virus rabbia. Quindi, si osserva e si confronta il numero di morti nei
due gruppi (vaccinati e di controllo).
Gli esperimenti di questo tipo possono risultare pi complessi se si vuole valutare l'attivit di un
nuovo vaccino a raffronto con un vaccino noto di riferimento. In questo caso, sono necessari 3
gruppi (controlli, vaccinati con vaccino nuovo e vaccinati con vaccino di riferimento). Negli studi
sperimentali di laboratorio si manipolano - in genere - due variabili; nel caso dell'esempio, le
variabili sono rappresentate dalla (a) vaccinazione e (b) dall'infezione sperimentale con virus
patogeno.

Negli studi in campo si lavora non su animali da laboratorio, ma direttamente sulla specie animal
di interesse, e si agisce, in genere, una sola variabile.

ESEMPIO. Vogliamo effettuare uno studio in campo sull'efficacia di un vaccino


antirabbico per bovini allevati nell'America meridionale. In questo continente i
bovini sono esposti alla rabbia trasmessa da pipistrelli ematofagi (i cosiddetti
vampiri). .Si potrebbero vaccinare i bovini allevati in una zona, e tenere gli
animali di un'altra zona come controlli non vaccinati. Successivamente,
l'efficacia del vaccino potrebbe essere desunta attraverso il monitoraggio della
frequenza della malattia nei due gruppi (vaccinati e non vaccinati).

Gli studi di laboratorio sono pi precisi rispetto a quelli di campo. Nota che qui il termine
precisione viene usato come sinonimo di ripetibilit; cio, un nuovo studio fornir risultati molto
simili al precedente se eseguito di nuovo nelle stesse condizioni. La precisione un grande
vantaggio degli studi di laboratorio, e dipende dal fatto che in laboratorio sono assenti i fattori
esterni (noti ed ignoti), che possono interferire con i risultati e che invece sono sempre presenti
negli studi di campo.
61

Gli studi teorici utilizzano modelli o simulazioni computerizzate. Nella maggior parte delle
situazioni in cui si ricercano i determinanti delle malattie, gli studi teorici si rivelano sicuramente
meno adatti dei precedenti. Essi comunque, pur essendo utilizzati pi spesso per altri scopi, possono
essere utili ad individuare potenziali determinanti, la cui effettiva attivit andr per
successivamente verificata in altro modo.

LE VARIABILI
Una variabile una caratteristica misurabile o un attributo che differisce nei soggetti considerati.
Per esempio, se viene misurato il peso di 300 suini, allora il "peso" rappresenta una "variabile".
Le variabili possono essere quantitative o qualitative. Queste ultime possono anche esser dette
categoriche.
Nell'esempio precedente, il "peso" dei suini una variabile quantitativa, in quanto misura una
quantit; se il gruppo dei 300 suini costituito da animali di razza diversa, allora la "razza" una
variabile qualitativa, in quanto definisce una qualit di ciascun animale.
62

Cap. 5. Dalla
associazione alla causalit
5.1 Il procedimento logico verso la causalit

OBIETTIVO:

illustrare il procedimento logico che guida la dimostrazione della causalit

Gli studi osservazionali sono fondamentali in epidemiologia e vengono utilizzati molto


frequentemente sia in medicina umana che in medicina veterinaria allo scopo di individuare i
determinanti delle malattie. Qui di seguito puoi trovare i princpi essenziali ed il flusso logico del
ragionamento che viene seguito in questo tipo di studi.

Prendiamo in considerazione il caso pi semplice di studio osservazionale, in cui si voglia tentare di


verificare se un certo fattore uno dei determinanti di una certa malattia. In uno studio di questo
tipo le variabili in gioco sono solo due:

1. la presunta causa
2. la malattia.

La presunta causa la cosiddetta variabile indipendente. La malattia invece la variabile


dipendente, in quanto dipende appunto dalla variabile indipendente.

Il procedimento logico che conduce alla dimostrazione di un rapporto causa-effetto fra variabile
indipendente e variabile dipendente pu essere schematizzato nei tre stadi riassunti nel seguente
schema:
63

Lo schema pu risultare non molto esplicativo, soprattutto perch - probabilmente - non ti chiaro
il significato di alcuni termini. Ad esempio, senz'altro ti chiederai: che cosa vuol dire
statisticamente? E causalmente? E cosa significa associato? Cosa vuol dire causalit?
Ebbene, ti prego di avere un po' di pazienza... nelle prossime unit verr spiegato tutto.
Ti consiglio di considerare lo schema come una specie di scatola grigia di cui in seguito
apprenderai il funzionamento. Gi fin d'ora, per, devi tenere presente che per arrivare alla
conclusione che qualcosa causa qualcos'altro devi percorrere nell'ordine i tre stadi indicati nello
schema.

Riassumendo:

I stadio. necessario accertare se la variabile indipendente (supposta causa o fattore di


esposizione) statisticamente associata con la variabile dipendente (l'effetto, come ad es.
la comparsa di malattia).
L'esatto significato del termine associazione verr chiarito in seguito, come pure
l'utilizzo dei metodi statistici.

II stadio. Soltanto nel caso in cui le variabili siano statisticamente associate, necessario
accertare, mediante una serie di criteri accettati, che le due variabili siano causalmente
associate;
III stadio. la fase finale in cui, sulla base del rapporto causale tra le due variabili
dimostrato nelle due fasi precedenti, possono essere effettuate elaborazioni sulla natura e
sulle conseguenze dell'associazione, utilizzando modelli teorici, simulazioni, esperimenti in
laboratorio o in campo ecc.

Quando i ricercatori possono agire attivamente sulla variabile indipendente (cosa che non avviene
negli studi osservazionali ma in quelli sperimentali), e osservare le conseguenti modificazioni
64

sulla variabile dipendente, essi possono trarre valide conclusioni su quanto tali modificazioni nella
variabile dipendente siano causate da quelle verificatesi nella variabile indipendente.
Al contrario, quando i ricercatori possono soltanto osservare la contemporanea variazione delle due
variabili (come negli studi osservazionali), allora essi possono solo definire una associazione tra
di esse, dimostrata dal fatto che al modificarsi dell'una si modifica anche l'altra. In questo caso,
per, non si pu escludere l'eventualit che entrambe le variabili siano, in maniera indipendente
l'una dall'altra, influenzate da una terza variabile. In questo caso, tra le due variabili considerate non
esiste un nesso causale, e l'apparente (ma inesistente!) relazione causa-effetto dovuta ad un effetto
detto di confondimento. Questo argomento verr sviluppato successivamente.

FAI ATTENZIONE! Nella prosecuzione dello studio, ti


consiglio di tenere presente lo schema mentale che segue:
tutto questo Capitolo ("Dalla associazione alla
causalit") dedicato allo sviluppo dello Stadio 1, ossia del
ragionamento e delle procedure riguardo alla dimostrazione di una
associazione statistica fra una presunta causa ed un effetto.
tutto il successivo Capitolo 6 ("L'approccio epidemiologico alle
cause di malattia") dedicato allo sviluppo dello Stadio 2, ossia
del ragionamento e delle procedure riguardo alla dimostrazione di
una associazione causale fra una presunta causa ed un effetto.
65

Cap. 5. Dalla
associazione alla causalit
5.2 Associazione, causalit e casualit

OBIETTIVO:

definire il significato del termine associazione in epidemiologia

Come promesso nell'unit precedente, comincio a spiegare il significato del termine associazione.
A questo scopo, inizialmente ti presento un esempio-domanda su cui ragionare usando il tuo buon
senso:

L'uomo comune osserva che in una buona parte (pi di un terzo!) dei casi di polmonite presente
anche il batterio, e quindi tende senz'altro a rispondere di s. Con un piccolo passo avanti, l'uomo
comune (... e forse anche tu!), sar probabilmente portato a concludere che il batterio la causa
della polmonite. Invece, di fronte ad un quesito di questo tipo, l'epidemiologia (ed il ragionamento
scientifico in genere) risponde non so: i dati forniti sono insufficienti.

Le motivazioni logiche che stanno alla base di questa risposta vengono esposte nella prossima
Unit.
66

Cap. 5. Dalla
associazione alla causalit
5.3 Associazione di eventi in epidemiologia

OBIETTIVI

considerare il concetto epidemiologico di associazione di due eventi;

rimarcare l'influenza del caso sui risultati degli esperimenti

Questa unit risponde ad un quesito che era stato formulato in precedenza, e che riguardava
l'esistenza o meno di associazione tra isolamento di Pasteurella multocida e polmonite del suino.

La risposta viene precisata nello schema soprastante. Essa chiama in causa il CASO, ed basata su
un procedimento logico che prevede un confronto fra la popolazione con la condizione in studio
(nell'esempio: polmonite) ed una popolazione di controllo, il pi possibile simile alla precedente
per quanto riguarda tutti gli altri fattori ma non affetta dalla malattia.
67

Supponiamo ora che il confronto NON evidenzi alcuna differenza: allora concluderemo
sicuramente che i due eventi non sono associati. Tuttavia, in pratica, molto difficile che i dati dei
due gruppi siano perfettamente corrispondenti; in altre parole, una differenza (in un senso o
nell'altro!) verr sempre evidenziata.

Supponiamo quindi che, pi verosimilmente, sia stata evidenziata una differenza fra i due gruppi e
che, per esempio, dai polmoni con polmonite si sia isolato il batterio con una frequenza superiore
a quella dei polmoni provenienti dalla popolazione sana di controllo. Ci non ancora sufficiente
per concludere che i due eventi (presenza del batterio e polmonite) sono associati. Infatti, la
differenza osservata potrebbe essere stata generata dal CASO!

ESEMPIO 1. Proviamo a consolidare l'affermazione precedente con un esempio pi banale e non


riguardante la medicina veterinaria, ma che concettualmente ricalca quello dei polmoni con
polmonite. Supponiamo di avere due sacchetti di numeri dischetti numerati; in un sacchetto ci sono
dischetti bianchi, nell'altro neri.
Immaginiamo ora di estrarre 10 numeri da ciascun sacchetto, e di ottenere il risultato della figura a
lato.
Fra i numeri bianchi,
7 sono dispari e 3
sono pari; fra i
numeri neri, 5 sono
dispari e 5 sono pari.
Puoi forse concludere
che i numeri bianchi
sono associati alla disparit?
Mi spiego meglio: i risultati della estrazione (i dati!) sono sufficienti a concludere che l'ignota
popolazione di numeri bianchi composta prevalentemente da numeri dispari?
Ovviamente la risposta no, poich i risultati dell'estrazione sono influenzati dal caso.

Resta ora da rispondere alla seguente domanda:

se vero che il caso pu influenzare i risultati, come posso dimostrare l'esistenza di associazioni ed
essere ragionevolmente sicuro che le differenze osservate non sono dovute al caso?

La risposta deriva dalla scienza statistica che, attraverso metodi che verranno accennati in
seguito, consente di escludere (con un certo grado di probabilit, ma mai con assoluta certezza) che
una eventuale associazione sia dovuta appunto al caso (vedi schema seguente).
68

Infine bisogna sottolineare che, anche quando la statistica afferma che l'associazione fra due eventi
NON casuale (ed allora si dice che esiste una differenza significativa), resta ancora da
dimostrare che i due eventi siano legati da un rapporto causa-effetto. In altre parole,
associazione non sinonimo di causalit. Questo argomento verr trattato in seguito. In
particolare, il passaggio dalla dimostrazione dell'esistenza di una associazione (che stiamo trattando
ora) alla verifica se tale associazione di tipo causale verr illustrato nel Capitolo 6 (L'approccio
epidemiologico alle cause di malattia).

Non farti confondere dalla grande somiglianza fonetica ed ortografica fra i termini casuale e
causale, ed anche casualit e causalit. I due termini hanno un significato assolutamente
diverso!
Casuale = dovuto al caso;
Causale = legato da un rapporto di causa-effetto.

Foglio di calcolo per Microsoft Excel che simula l'estrazione di numeri da tombola.
69

Cap. 5. Dalla
associazione alla causalit
5.4 Significativit statistica e causalit

OBIETTIVI:

illustrare alcuni principi di base utili quando si effettua un confronto

considerare l'utilit di un test di significativit statistica

Attraverso un semplice esempio, in questa Unit ti prospetto i rischi che si corrono quando si
effettuano confronti, ed introduco il concetto di significativit statistica. una Unit preparatoria,
in quanto si accenna ad argomenti che verranno trattati pi in dettaglio nelle Unit successive in
questo stesso Capitolo.

Immagina di aver effettuato un esperimento su due piccoli gruppi di animali (ossia due campioni)
allo scopo di mettere a confronto l'efficacia di due farmaci nella terapia di una certa malattia.

In pratica, hai reperito un certo numero di animali ammalati, e ne hai trattati alcuni con il farmaco A
ed altri con il farmaco B. I dati che hai ottenuto depongono per una maggiore attivit di A:
70

Ora, prima di concludere che A davvero migliore di B (dove davvero significa che A migliore
di B non solo sul tuo campione, ma anche sulla tua popolazione di interesse, ossia su tutti gli
animali che sono e saranno affetti da quella malattia), devi riconsiderare criticamente il tuo
esperimento. Infatti, A pu essere apparso migliore di B nel tuo esperimento, anche se in realt non
lo .

Le ipotesi da avanzare sono tre, riassunte nello schema che segue:

In particolare, l'ipotesi (1), se verificata, frutto di una "colpa" dello sperimentatore, che ha
selezionato un campione NON rappresentativo della popolazione oggetto dello studio. Un
campione non rappresentativo si dice distorto (o affetto da bias, dall'inglese bias=distorsione).
Ovviamente un campione distorto fornisce risultati non affidabili.
71

ESEMPIO 1. Nel tuo esperimento, i cani trattati con A potevano essere pi giovani ed in migliori
condizioni generali (quindi pi portati a guarire, magari anche spontaneamente) rispetto a quelli
trattati con il farmaco B.

ESEMPIO 2. In uno studio sullo stato vaccinale dei cani di una certa regione, esamini un campione
costituito dai cani presentati per una visita in ambulatorio; tuttavia, questo campione non
rappresentativo della popolazione canina, in quanto non comprende i randagi o quelli male accuditi
dal proprietario e che quindi non vengono mai n vaccinati n sottoposti a visita veterinaria.

L'ipotesi (2) chiama in causa il caso e la variabilit biologica (che viene trattata altrove). Pensa di
eseguire di nuovo, per su altri animali, l'esperimento sull'efficacia dei due farmaci gi fatto: sei
sicuro che otterresti gli stessi risultati? No, appunto perch nell'andamento dell'esperimento si
inseriscono fattori diversi, noto e ignoti, dovuti appunto al caso.

Per isolare l'effetto del caso, e quindi per escludere l'ipotesi (2), devi ricorrere alla statistica,
applicando un test che ti permetta di verificare la significativit dei tuoi risultati.
72

Cap. 5. Dalla
associazione alla causalit
5.5 Confrontare due proporzioni o due percentuali: il test chi-quadrato

OBIETTIVO:

imparare l' utilizzo del metodo del chi-quadrato attraverso un esempio

imparare che cosa vuol dire "statisticamente significativo"

Nell'unit precedente, ho sottolineato che l'applicazione di un test di significativit statistica un


passo indispensabile nel confronto fra due gruppi o popolazioni riguardo ad un parametro.

In questa unit ti presento un esempio di applicazione di uno dei test pi comuni e pi semplici, il
chi-quadrato.
L'esempio riguarda il confronto di due percentuali ottenute in un esperimento, allo scopo di
verificare se la differenza fra tali percentuali dovuta al caso oppure no. Se riuscirai a dimostrare
che la differenza non dovuta al caso, allora potrai affermare che essa statisticamente
significativa.
Ti ho gi spiegato lo schema logico da seguire . Lo schema molto semplice, in sostanza si tratta
di partire con una sorta di pregiudizio: qualsiasi sia la differenza esistente tra le due percentuali da
confrontare, inizialmente devi ritenere valida l'ipotesi zero. L'ipotesi zero (detta anche ipotesi
nulla) afferma semplicemente che la differenza osservata - di qualsiasi entit essa sia - dovuta al
caso. Questa ipotesi (che pu essere vera o falsa) verr accettata oppure rifiutata sulla base del
risultato di un appropriato test statistico. Nel confronto di due percentuali o di due proporzioni il
test appropriato , appunto, il test del chi-quadrato. In sintesi:

In montagna, puoi raggiungere un punto panoramico con una comoda


funivia, che in dieci minuti ti porta a destinazione. Oppure puoi fare da
73

solo, con le tue forze, ore di dura salita, una piccola sfida con te stesso. Dimenticherai facilmente la
prima esperienza, mentre la seconda ti rester, forse, nel cuore per sempre.
Analogamente, puoi fare il test chi-quadrato usando il computer (... la funivia!), ed in questo caso
troverai in internet tanti strumenti adatti (ce n' uno anche alla fine di questa unit). Oppure puoi
leggere qui di seguito (la sfida: lacrime e sangue!) una spiegazione passo-passo del funzionamento
del test.
A te la scelta.

Un esempio: l'efficacia di un farmaco

Supponi di voler mettere a confronto l'efficacia di un nuovo antibiotico (che


chiameremo con un nome di fantasia: xmicina) con un antibiotico gi in uso
(streptomicina) nella terapia di una malattia del cane (la leptospirosi), .
A questo scopo, intraprendi un test clinico su un campione di animali costituito dai
cani affetti da leptospirosi che vengono presentati in alcuni ambulatori ed ospedali
veterinari in un determinato periodo di tempo.
Durante la sperimentazione, ogni cane viene assegnato a caso al gruppo dei trattati con il nuovo
antibiotico oppure a quello dei trattati con la streptomicina (nel Cap. 9 capirai il perch di questa
assegnazione a caso).
Alla fine della sperimentazione, ottieni i dati riassunti nella sottostante Tabella 1.

Vale la pena di commentare in dettaglio la struttura della Tabella 1, considerato che tabelle di
questo tipo verranno usate sia in questo Capitolo che, molto pi estensivamente nel Cap. 11 (Test di
screening e test diagnostici).
Si tratta di una tabella 2x2 (due righe per due colonne), detta anche tabella di contingenza.
Non farti trarre in inganno dal fatto che, in effetti, ci sono tre righe e tre colonne: infatti la vera
tabella contenente i tuoi dati occupa soltanto nelle quattro celle gialle a, b, c, d. Le altre sono
derivate da queste, e non sono altro che i totali di riga e di colonna.
Nella cella a sono indicati i soggetti che sono stati trattati con xmicina e che sono guariti; nella cella
b i trattati con xmicina non guariti; nella cella c i trattati con streptomicina guariti; nella cella d i
trattati con streptomicina non guariti. I due totali di colonna indicano rispettivamente il numero
complessivo di guariti e di non guariti, mentre i totali di riga indicano rispettivamente il numero di
trattati con xmicina e con streptomicina.
Nota che, con gli stessi dati, avresti potuto compilare una
tabella analoga alla Tabella 1, ma ruotata di 90 gradi,
ossia ponendo il trattamento sulle colonne e l'esito sulla
righe, come quella a lato. Questa impostazione sarebbe
stata ugualmente corretta. Per lo standard per tabelle di questo tipo quello di disporre la
variabile indipendente (nel nostro caso: il trattamento xmicina/steptomicina) sulle righe e la
74

variabile dipendente (nel nostro caso: guarito/non guarito) sulle colonne. Noi adotteremo sempre
questo standard.

Torniamo alla tabella 1. Puoi notare che, su un totale di 123 cani, 62 sono stati sottoposti a
trattamento con xmicina e, fra questi, si sono registrati 52 casi di guarigione (84%). Fra i restanti 61
animali, trattati con streptomicina, ne sono guariti 40 (66%).

evidente che i dati grezzi indicano che la xmicina pi efficace della streptomicina. Per la
superiorit di xmicina potrebbe essere dovutra al caso... Allora, prima di giungere ad una
conclusione affrettata, occorre rispondere alla seguente domanda:

Supponi che, in realt, NON esistano differenze nell'efficacia dei due trattamenti. Che
probabilit c' di osservare - in uno studio di dimensioni simili a questo - differenze nell'efficacia
dei due antibiotici uguali o superiori a quelle che hai osservato?

La risposta a questa domanda dipende da quanto i dati ottenuti si discostano dai dati che sarebbe
lecito attendersi se i trattamenti avessero la stessa efficacia e se i dati fossero influenzati soltanto
dalla variazione casuale.

Rileggi ancora con attenzione la frase precedente: la chiave per comprendere il background
razionale di un test statistico. Riformulo la stessa frase in modo leggermente diverso, e ti pongo la
seguente domanda: se xmicina = streptomicina (ipotesi zero!), possibile ottenere risultati simili a
quelli che hai osservato? La risposta s, perch i tuoi dati potrebbero essere stati influenzati dal
caso. Facciamo un altro passo avanti, e chiediamoci: qual la probabilit di osservare una
differenza uguale o superiore a quella che hai ottenuto nel tuo esperimento?

Guarda ancora la Tabella 1. I tuoi dati dimostrano che complessivamente (cio indipendentemente
dal tipo di antibiotico) il trattamento risultato efficace nel 74.8% dei casi. Infatti sono guariti,
sempre complessivamente ed indipendentemente dall'antibiotico utilizzato, 52+40=92 animali (a+c)
su 123 trattati.
Applicando questa percentuale di successo (74.8%) a ciascuno dei due gruppi di cani in esame
(gruppo xmicina e gruppo streptomicina), puoi ricavare i dati della sottostante Tabella 2, che illustra
la situazione che ti saresti aspettato se i due antibiotici avessero avuto la stessa efficacia.
75

Nella Tabella 2, hai calcolato il valore a=46 assumendo una percentuale di guarigione del 74.8% nei
62 cani trattati con xmicina: 62*74.8/100=46.37, cio, approssimando all'unit, a=46.
Analogamente, ti saresti aspettato la guarigione del 74.8% dei 61 cani trattati con streptomicina
ossia di 45.63 soggetti.
I valori delle celle b e d possono poi essere facilmente ottenuti per differenza:
b = 62-46.37 = 15.63
d = 61-45.63 = 15.37

Il valore del chi-quadrato quantifica la differenza fra i dati osservati e quelli attesi, ed la somma
delle quattro celle a, b, c e d, per ciascuna delle quali si calcola il valore della frazione:

La magnitudine del chi-quadrato determinata dalla differenza fra i numeri osservati ed i numeri
attesi nel caso in cui i due trattamenti avessero avuto lo stesso effetto. La differenza al numeratore
della frazione viene elevata al quadrato; ci elimina i numeri negativi che possono comparire
quando il numero osservato minore di quello atteso. Poi il quadrato della differenza viene diviso
per il numero atteso; in questo modo la differenza per ogni cella viene aggiustata in rapporto al
numero di individui della stessa cella.
Pertanto, calcoliamo il chi-quadrato come segue:

evidente che il chi-quadrato aumenta con l'aumentare della differenza dei dati posti a raffronto. Se
esso supera certi valori prefissati (vedi tabella Valori di chi-quadrato), la differenza viene ritenuta
significativa; in caso contrario, non si pu affermare l'esistenza di una significativa differenza tra i
due eventi considerati.
Non ti resta quindi che confrontare il valore ottenuto con la Tabella dei valori di chi-quadrato
(reperibile via Internet o in qualsiasi libro di statistica e di una porzione viene riportata qui sotto).
76

Nel tuo caso, il valore ottenuto un chi-quadrato con 1 grado di libert; infatti, per tabelle come
quella che stiamo studiando, il grado di libert uguale a (numero di righe-1)*(numero di colonne-
1). Quindi: (2-1) * (2.1) = 1 grado di libert. ci significa che ti interessa soltanto la prima riga della
tabella (celle in verde).

Ora, confrontando il tuo valore di chi-quadrato (5.46) con quelli tabulati, noti che esso >3.841 e
<6.635. Ci consente di ritenere che la differenza fra i due gruppi sia significativa al livello di
probabilit 5% ma non al livello di probabilit 1%.

Puoi concludere che la differenza tra animali trattati con xmicina e quelli trattati con streptomicina
statisticamente significativa al livello di probabilit 5%.
In altre parole: ammettendo che i due antibiotici abbiano pari efficacia e ripetendo l'esperimento
infinite volte, potremo osservare piuttosto raramente (ossia 5 volte su 100 o meno!) dati simili a
quelli ottenuti oppure ancor pi favorevoli a xmicina.
In sostanza: in base ai risultati del test del chi-quadrato, l'affermazione xmicina pi efficace di
streptomicina ha il 95% di probabilit di essere vera (e quindi ha il 5% di probabilit di essere
falsa).
Se tu dovessi stilare una relazione con i risultati del tuo lavoro, potresti concludere pi o meno
come segue: In base ai risultati ottenuti, xmicina risultata pi attiva di streptomicina (P<0.05)
dove il valore P indica la probabilit di respingere una ipotesi zero vera.

Il metodo del chi-quadrato utilizzabile quando il valore contenuto in ogni cella (celle a, b, c, d
nella precedente Tabella 1) >5, ed il numero totale di osservazioni >30; in caso contrario,
occorre usare altri test (ad esempio, il test di Fisher, detto anche test esatto di Fisher o test delle
probabilit esatte di Fisher).

Il test del chi-quadrato uno dei tanti test di significativit statistica esistenti. Nella prossima Unit
ne verr trattato un altro: il test "t", che serve per confrontare due medie.
Ricordati comunque un principio generale valido sempre: qualsiasi test di significativit non pu
mai provare con certezza che una ipotesi zero vera o falsa; esso pu solo fornire una indicazione
della forza con cui i dati contrastano l'ipotesi zero.
77

Un metodo di calcolo pi semplice

Il sistema di calcolo del chi-quadrato ora fornito piuttosto complicato, e costringe a generare -
come abbiamo fatto nell'esempio - una nuova tabella con i valori attesi. Esiste un altro tipo di
calcolo, pi semplice, che consente di ottenere il chi-quadrato direttamente dai valori osservati.
Tale calcolo basato sulla seguente formula:

Procediamo con il calcolo:

Calcolare il numeratore della formula:


a*d = 52*21 = 1092
b*c = 10*40 = 400
1092-400 = 692
elevare al quadrato
692^2 = 478864
e moltiplicare per il numero di osservazioni totale
478864*123 = 58900272 (1)

Ora calcoliamo il denominatore:


(52+10)(52+40)(10+21)(40+21) = 10786264 (2)

Infine, dividiamo il numero trovato in (1) per quello trovato in (2):


58900272/10786264 = 5.46

Quando le frequenze attese sono basse (ma sempre >5) consigliabile utilizzare una formula del
chi-quadrato modificata secondo quanto proposto da F. Yates nel 1934:

I dati utilizzati nell'esempio sono fittizi ed utilizzati esclusivamente a scopo didattico per il calcolo
del chi-quadrato.
Il fatto che la differenza fra i due gruppi in studio sia risultata statisticamente significativa non
implica necessariamente che, nella pratica clinica, la xmicina avrebbe sostituito la streptomicina
nella terapia della leptospirosi del cane. Ad esempio, la xmicina potrebbe essere molto pi tossica,
oppure dotata di gravi effetti collaterali, oppure molto pi costosa ecc.

Infine, ti ricordo che il test chi-quadrato si pu estendere al confronto di pi di due gruppi, con
tabelle n x n. Per in tal caso il calcolo diverso da quello dell'esempio.

Foglio di calcolo per Microsoft Excel con un esempio di calcolo del chi-quadrato
78

Il mio consiglio: consolida quanto hai appreso risolvendo questo problema (si apre in una nuova
finestra)

NELLA PROSSIMA UNIT:


si accenna ad un caso diverso: il confronto fra due medie (anzich due percentuali). Attraverso un
esempio ed un foglio di calcolo, si illustra l'applicazione di uno dei test pi frequentemente
utilizzati per il confronto di due medie: il test t di Student.

Significativit statistica e causalit Confrontare due medie: il test t di Student


79

Cap. 5. Dalla
associazione alla causalit
5.6 Confrontare due medie: il test t di Student

OBIETTIVO:

imparare l'utilizzo del test t attraverso un esempio

Nella unit precedente hai imparato come stabilire (attraverso il test del chi-quadrato) se due
proporzioni (o due percentuali) sono significativamente diverse fra loro.
Vi sono molte altre situazioni in cui devi risolvere un problema concettualmente simile: quello di
confrontare due (o pi) valori ottenuti studiando due (o pi) gruppi, ma avendo a disposizione,
invece di due percentuali, dati di altro tipo. Ad esempio, potresti confrontare una variabile
qualitativa con una variabile quantitativa, oppure una qualitativa con un'altra pure qualitativa, od
ancora pi variabili quantitative con una o pi variabili numeriche ecc. ecc. Ciascuno di questi casi
richiede un test statistico adatto.

In effetti, uno degli aspetti pi difficili (...per i non-statistici!)


nell'elaborazione dei dati consiste proprio nella scelta del test da
utilizzare: c' anche chi ha paragonato la statistica... all'arte culinaria: un
test statistico come una ricetta di cucina. Un buon cuoco ottiene un
buon piatto a partire dagli ingredienti che ha a disposizione, cos come
uno studioso ottiene informazioni veritiere cucinando opportunamente,
con un test statistico adatto, i dati che ha raccolto.

UN PROBLEMA FREQUENTE: CONFRONTARE DUE MEDIE

Una circostanza frequente quella in cui si sono esaminati due (o pi) campioni di animali; sugli
animali di ciascun campione stata misurata una variabile numerica (es. altezza, peso, frequenza
cardiaca, produzione di latte ecc.), di cui stata poi calcolata la media.
Ti chiedi: la differenza fra le medie dei due campioni significativa?
Ossia: puoi affermare che la differenza osservata non dovuta al caso ma che, invece, esiste
veramente una diversit tra le medie delle due popolazioni da cui i campioni stessi derivano?
Oppure, esprimendoci in altro modo: puoi affermare che i due campioni appartengono a popolazioni
diverse riguardo alla variabile considerata?
80

Come vedi la questione, in buona sostanza, analoga a quella della unit precedente in cui hai
utilizzato il test del chi-quadrato per confrontare due proporzioni. Il fatto che la ricetta del chi-
quadrato va bene per confrontare due proporzioni, ma non utilizzabile se devi confrontare due
medie. Allora, devi ricorrere ad un altro test: ad esempio il test t (detto anche t di Student).
Lo schema di ragionamento da fare quello gi visto:

I calcoli da eseguire per effettuare il test t sono un po' pi complicati rispetto a quelli del chi-
quadrato, e perci non entreremo nei dettagli. Solo a titolo di curiosit, ecco la formula di calcolo
del valore t:

... e per i pi interessati (o masochisti?) dir che s la deviazione standard media delle deviazioni
standard dei due campioni, cio la radice quadrata della varianza che si ottiene sommando le
devianze dei due campioni e dividendo per la somma dei gradi di libert.
Una volta trovato il valore t, esso va confrontato con quelli tabulati in apposite Tabelle, che si
trovano in tutti i libri di statistica. Dal confronto fra il valore ottenuto e quello tabulato si potr
stabilire se la differenza fra le due medie dovuta al caso o no.
Ora che ti ho esposto brevemente il principio che "sta dietro" al calcolo del test t di Student, ti
81

consiglio di non preoccuparti pi di tanto di calcoli e tabelle di raffronto (che, fra l'altro, sono pi
complesse di quanti ti aspetteresti, vedi un esempio qui). Oggi, infatti, il test t si esegue al computer
con l'aiuto di apposito software, incluso in pacchetti statistici oppure reperibile in rete. Ad esempio,
alla fine di questa unit troverai un foglio di calcolo con cui calcolare il valore t su una serie di dati
che tu stesso puoi inserire.

In conclusione: importante che tu conosca non tanto il metodo di calcolo (difficile da ricordare),
quanto l'esistenza del test t ed il contesto in cui esso si applica. Ancora pi importante che tu sia
convinto che, anche nel confronto fra due medie, non si possono trarre conclusioni soggettive ad
occhio, ma indispensabile ricorrere ad un test statistico.

Un esempio di applicazione del test t

Stai sperimentando l'effetto sul suino dell'aggiunta alla razione di una miscela probiotica
costituita da batteri normalmente presenti nella flora intestinale del suino. L'ipotesi da verificare
che il probiotico favorisca l'accrescimento degli animali.
Allo scopo di verificare l'ipotesi, hai disegnato uno studio sperimentale preliminare su due piccoli
gruppi di suini. I gruppi sono fra loro omogenei (stessa razza, et, provenienza ecc.) e sono
mantenuti nelle stesse condizioni di allevamento (alimentazione, temperatura ambiente ecc.).
L'unica differenza che alla razione del Gruppo 1 (10 suini) viene aggiunto il probiotico, mentre al
gruppo 2 (11 suini) no.

All'inizio dell'esperimento ciascun suino viene pesato; dopo 21 giorni di trattamento i suini vengono
pesati di nuovo e per ogni animale si calcola l'incremento giornaliero medio. I dati (fittizi) sono
riportati nella tabella che segue.
82

Confrontando le medie degli accrescimenti, puoi notare che il valore del Gruppo 1 superiore a
quello del Gruppo 2 (643.8 g/giorno contro 637.0 g/giorno). La domanda : questa differenza
dovuta al probiotico oppure al caso?

L'ipotesi zero dice che la differenza dovuta al caso... accetti o rifiuti questa ipotesi? Per
rispondere, puoi applicare ai tuoi dati il test t.

Tieni presente, per, che il test t test va bene soltanto se i dati hanno una distribuzione Normale (se
ti serve un rapido ripasso di questo argomento, dai un'occhiata al Cap. 7). La trattazione dei
metodi per verificare la Normalit di un set di dati va oltre gli scopi del Quaderno. In linea di
massima, si utilizza un software statistico (tutti i pacchetti statistici hanno funzioni adatte a questo
scopo). In Excel, si possono utilizzare le formule ASIMMETRIA e CURTOSI.
I dati dell'esempio, sottoposti ad analisi, risultano avere una distribuzione normale. Se lo desideri,
puoi avviare una breve presentazione animata che illustra l'analisi dei tuoi dati con un software
statistico.
Infine, per i pi interessati, aggiungo che, se i dati non hanno una distribuzione normale,
necessario normalizzarli (con metodi sui quali non mi dilungo) oppure ricorrere ad test diversi dal t
di Student (es. il Test Mann-Whitney o il Test di Wilcoxon).

Una volta verificata la Normalit dei tuoi dati, puoi tranquillamente applicare il test t, magari
utilizzando questo foglio di calcolo.
Se non hai installato Excel sul tuo PC, puoi vedere una immagine di output del programma.

Nel foglio di calcolo dovrebbero essere gi presenti i dati corretti (in caso contrario, li puoi inserire
tu).
Come vedi dall'output di Excel, con i tuoi dati ottieni un valore t pari a 2.2796.
Che farne, di questo valore? Il procedimento di base abbastanza simile a quello che hai gi
appreso nel caso del test Chi-quadrato. In pratica, devi confrontare il valore t che hai ottenuto
(2.2796) con quelli presenti nella Tabella dei valori t, per 19 gradi di libert (gradi di
libert=numero osservazioni-numero gruppi; nel nostro esempio 21-2=19). Il tuo valore superiore
a quello della colonna p=5% (ma inferiore a quello della colonna p=1%). Perci puoi rifiutare
l'ipotesi zero e concludere che la differenza significativa per p<0.05 (ma non per p<0.01).
Ci significa che c' una probabilit inferiore al 5% (ma non all'1%) che la differenza di
accrescimento tra il gruppo trattato e quello di controllo sia dovuta al caso.

Nota che i due valori p (0.05 e 0.01) sono valori convenzionalmente utilizzati nel modo scientifico
(questo concetto viene spiegato meglio nella prossima unit).

Se hai utilizzato il mio foglio di calcolo (oppure un software statistico), il passaggio test descritto
(ossia quello di confrontare il tuo valore t con i valori della Tabella per 'n' gradi di libert) inutile:
infatti il programma restituisce direttamente il valore p.
83

Con i tuoi dati ottieni: p=0.0344.


Ci significa che c' una probabilit inferiore a 3.44% che la differenza di accrescimento tra il
gruppo trattato e quello di controllo sia dovuta al caso. In altri termini, puoi affermare che la
differenza fra gli animali trattati ed i controlli significativa per p=0.0344.

I risultati di un test statistico vanno interpretati correttamente. Vale la pena di ripetere qui quanto
gi detto nella Unit precedente a proposito del test del chi-quadrato: qualsiasi test di significativit
non pu mai provare con assoluta certezza che una ipotesi zero vera o falsa; esso pu solo fornire
una indicazione della forza con cui i dati contrastano l'ipotesi zero.

Per consolidare quanto appreso in questa unit ti consiglio di leggere subito la successiva, che
tratta i concetti di livello di significativit e di ipotesi zero.

Foglio di calcolo per Microsoft Excel per il calcolo del t di Student

Il mio consiglio: consolida quanto hai appreso risolvendo questo problema (si apre in una nuova
finestra)
84

Cap. 5. Dalla
associazione alla causalit
5.7 Prove di significativit

OBIETTIVO:

apprendere la base razionale di un test di significativit

apprendere un metodo di quantificazione di un test di significativit

Quando si effettua un test di significativit statistica, inizialmente si assume la cosiddetta ipotesi


zero (o ipotesi nulla), secondo la quale non esiste nessuna differenza tra i gruppi riguardo al
parametro considerato. Secondo l'ipotesi zero, i gruppi sono fra loro uguali e la differenza osservata
va attribuita al caso.

Ovviamente l'ipotesi zero pu essere vera o falsa. Ora tu devi decidere: accetti o rifiuti l'ipotesi
zero?
Per decidere devi analizzare i tuoi dati con un test statistico. Se il test ti consiglia di rifiutare
l'ipotesi zero, allora la differenza osservata viene dichiarata statisticamente significativa. Se invece
il test ti consiglia di accettare l'ipotesi zero, allora la differenza statisticamente non
significativa.

Come sempre avviene, i risultati di un test statistico non hanno un valore di assoluta e matematica
certezza, ma soltanto di probabilit. Pertanto, una decisione di respingere l'ipotesi zero (presa
sulla base del consiglio del test statistico) probabilmente giusta, ma potrebbe essere errata. La
misura di questo rischio di cadere in errore si chiama livello di significativit del test.

Il livello di significativit di una prova pu essere scelto a piacere dallo sperimentatore. Tuttavia, di
solito si sceglie un livello di probabilit di 0.05 (5%) o di 0.01 (1%). Questa probabilit (detta
valore P) rappresenta una stima quantitativa della probabilit che le differenze osservate siano
dovute al caso.
85

Pi precisamente, il valore P "la probabilit di ottenere un risultato altrettanto estremo o pi


estremo di quello osservato se la diversit interamente dovuta alla sola variabilit campionaria,
assumendo quindi che l'ipotesi iniziale nulla sia vera" (Signorelli).
Notare che P una probabilit e quindi pu assumere solo valori compresi fra 0 e 1. Un valore P
che si avvicina a 0 testimonia una bassa probabilit che la differenza osservata possa essere ascritta
al caso.

ESEMPIO. Hai effettuato una sperimentazione su due gruppi di animali affetti da una malattia. Un
gruppo stato trattato con il farmaco A, e l'altro con il farmaco B. Hai notato che gli animali trattati
con A guariscono di pi rispetto a quelli trattati con B. Per questo effetto potrebbe essere dovuto al
caso... sei sicuro che, ripetendo l'esperimento, otterresti ancora dati che indicano che A migliore di
B? Ovviamente no!
Allora, a partire dai tuoi dati, devi calcolare il valore P: in questo modo ottieni una stima
quantitativa della probabilit che le differenze osservate siano dovute al caso. In altre parole, P la
risposta alla seguente domanda: se in realt non ci fossero differenze fra A e B, e se la
sperimentazione fossa eseguita molte volte, quale proporzione di sperimentazioni condurrebbe alla
conclusione che A migliore di B?

Il livello di significativit 5% viene adottato molto frequentemente in quanto si ritiene che il


rapporto 1/20 (cio 0.05) sia sufficientemente piccolo da poter concludere che sia piuttosto
improbabile che la differenza osservata sia dovuta al semplice caso. In effetti, la differenza
potrebbe essere dovuta al caso, e lo sar 1 volta su 20. Tuttavia, questo evento improbabile.
Ovviamente, se si vuole escludere con maggiore probabilit l'effetto del caso, si adotter un livello
di significativit inferiore (es. 1%).
Quindi:

se l'ipotesi zero viene respinta al livello di significativit 5%, allora abbiamo il 5% di


probabilit di respingere un'ipotesi zero che - in effetti - era vera;
86

se l'ipotesi zero viene respinta al livello di significativit 1%, allora abbiamo l'1% di
probabilit di respingere un'ipotesi zero che - in effetti - era vera;
pi in generale, se l'ipotesi zero viene respinta al livello di significativit n%, allora abbiamo
n% di probabilit di respingere un'ipotesi zero che - in effetti - era vera.

Infine, necessario sottolineare un concetto molto importante: statisticamente significativo non


vuol dire importante, o di grande interesse, o rilevante. Statisticamente significativo significa
semplicemente che ci stato osservato difficilmente dovuto al caso.

Esempio. In una ipotetica sperimentazione, stato dimostrato che un farmaco ha


una attivit anti-ipertensiva: nei soggetti trattati la pressione sistolica diminuita,
in media, di 2 mm di Hg rispetto ai soggetti non trattati e questa differenza
risultata statisticamente significativa. Ci non implica automaticamente che il
farmaco sia un buon ipertensivo, anzi verosimile che esso sia pressoch inutile in
terapia, in quanto una riduzione cos limitata (2mm Hg) non ha alcun interesse
clinico.

Alcuni test statistici di comune impiego

Numerosi test statistici vengono usati per determinare con un certo grado di probabilit l'esistenza
(o l'assenza) di differenze significative nei dati in esame o meglio, pi in generale, di accettare o
rigettare una ipotesi zero. Il test del chi-quadrato ed il test t sono gi stati brevemente illustrati.
Nella tabella che segue vengono elencati alcuni dei test pi comunemente impiegati nella ricerca
medica, ed il loro campo di applicazione. Ulteriori dettagli riguardo a questi test, ed ad altri non
indicati nella Tabella, possono essere reperiti in tutti i libri statistica.
87

I test statistici, in medicina, consentono di stimare il grado di certezza di affermazioni e la


precisione di misure effettuate su un campione casuale di una determinata popolazione. Per ottenere
risultati validi, bisogna scegliere, fra le tante disponibili, le procedure statistiche adatte all'indagine
o all'esperimento effettuato.
Le procedure statistiche presuppongono che i campioni siano stati estratti a caso dalle popolazioni
studiate (v. unit didattica "Caratteri del campione" e successive). Se questo presupposto non
rispettato, i risultati che si ottengono possono non avere alcun valore.
Oltre a verificare che gli elementi del campione siano scelti a caso, occorre stabilire con esattezza
quale popolazione essi rappresentino. Ci particolarmente importante e difficile quando i soggetti
del campione provengono, come si verifica di frequente, da pazienti ricoverati in ospedali
veterinari: questi animali infatti sono scarsamente rappresentativi della popolazione generale. In
ogni caso, l'identificazione della popolazione di provenienza del campione fondamentale per
stabilire l'applicabilit dei risultati di una ricerca.
88

Cap. 5. Dalla
associazione alla causalit
5.8 Associazione e causalit: tipi di associazione

OBIETTIVO:

consolidare il concetto secondo cui associazione non sinonimo di causa

Gli studi epidemiologici spesso sono rivolti a stabilire l'esistenza di un'associazione statistica tra due
variabili in studio: la prima variabile di solito costituita da un presunto determinante (oppure
dalla esposizione ad un certo fattore), mentre la seconda variabile la comparsa della malattia.
L'accertamento dell'esistenza di una associazione fra le due suddette variabili soltanto il primo
passo sulla strada che conduce alla dimostrazione di una relazione causa-effetto fra le due variabili.
Una volta dimostrato che l'associazione esiste, necessario eseguire un secondo passo,
rappresentato dalla interpretazione del significato dell'associazione.

Questo secondo passo consiste, in sostanza, in una revisione critica del lavoro svolto, al fine di
verificare se sono stati evitati alcuni tranelli frequenti in studi di questo tipo. Infatti, esistono
anche associazioni non legate all'esistenza di una rapporto causa-effetto: sono le associazioni spurie
e le associazioni non causali.

Un'associazione spuria quella dovuta alla presenza di errori sistematici. L'errore sistematico
un errore che prevedibilmente causa, durante le osservazioni di raccolta dei dati, lo stesso tipo di
errore oppure un errore che va sempre nella stessa direzione. Esso dovuto a vizi nella
impostazione o nella esecuzione di uno studio.
89

Gli errori sistematici possono conseguire a svariati fattori (es. errato campionamento, imprecisione
nella diagnosi ecc.) e, in definitiva, conducono ad una stima errata (per difetto o per eccesso)
della forza dell'associazione.

ESEMPIO 1. L'utilizzo di una bilancia mal tarata, (che, per esempio, indica il 10% in pi del peso
effettivo) per stimare il peso di un gruppo di suini provoca un errore sistematico.
ESEMPIO 2. Nello studio dell'immunit nei confronti del virus della rabbia in una popolazione di
cani, l'esame di un campione di animali scelti fra quelli portati in un ambulatorio veterinario
probabilmente causa di un errore sistematico.

Una associazione non causale pu essere la conseguenza di una confusione fra causa ed effetto.
Questo argomento viene accennato in una Unit successiva.

Pi frequentemente, una associazione non causale deriva dal fatto che la malattia e l'esposizione
sono entrambe associate ad un altro fattore x, il quale il vero responsabile dell'associazione; in
questo caso si dice che l'associazione mediata dal fattore x. Una interazione di questo tipo prende
il nome di confondimento. Il confondimento viene trattato in una Unit successiva.
90

Cap. 5. Dalla
associazione alla causalit
5.9 Modello generale di associazioni causali e non causali

OBIETTIVO:

attraverso alcuni esempi, rafforzare il concetto di "associazione causale" e di "associazione non


causale".

gi stato detto che una associazione statistica pu indicare l'esistenza di una correlazione causale
tra la variabile in studio ed il fenomeno osservato. Tuttavia, la semplice esistenza di una
associazione non dimostra necessariamente l'esistenza di un rapporto causa-effetto fra le due
variabili risultate associate. Per giustificare questa osservazione, ti propongo un esempio (v. schema
sottostante) tratto dalla vita quotidiana, in cui i fattori consumo e rumore risultano associati pur
non essendo legati da una relazione causa-effetto. evidente, infatti, che un consumo elevato di
carburante non causa di alta rumorosit n, viceversa, una elevata rumorosit provoca un aumento
del consumo.

Generalizzando, si ottiene lo schema sottostante, che rappresenta un modello generale di


associazione.
91

La variabile A la vera causa della malattia; le due variabili di risposta, B e C, sono due
manifestazioni della malattia. Nel modello le frecce nere mostrano l'esistenza di una associazione
statistica causale tra A e B e tra A e C. In altre parole,

Tuttavia, pu essere dimostrata anche una associazione statistica (non causale, freccia rossa
tratteggiata) tra B e C, derivante proprio dal fatto che B e C sono entrambe (ma separatamente)
associate allo stesso fattore A. Cio:

ESEMPIO. Nello schema sottostante mostrato un esempio una correlazione di questo tipo.
L'esempio riguarda l' infestazione da Haemonchus contortus. Questo parassita un nematode
ematofago del bovino, pecora e capra che si localizza nell'abomaso provocando lesioni localizzate
alla mucosa (edema, emorragie
puntiformi, iperplasia, erosioni
ecc.). Esso si nutre di sangue e
quindi, quando presente in gran
numero, provoca anche anemia.
Supponiamo di effettuare uno studio
epidemiologico su questa malattia, al
fine di dimostrare l'esistenza di
associazioni tra le seguenti variabili:
92

presenza del parassita;


iperplasia della mucosa dell'abomaso;
anemia.
Sicuramente riusciremo ad evidenziare l'esistenza di associazioni statisticamente significative tra:
presenza del parassita ed iperplasia della mucosa
presenza del parassita ed anemia
iperplasia della mucosa ed anemia.
Di queste associazioni, le prime due sono causali, mentre la terza un'associazione non causale.
93

Cap. 5. Dalla
associazione alla causalit
5.10Esempio di associazioni causali e non causali

OBIETTIVO:

verificare attraverso un esempio l'esistenza di associazioni non causali

L'esempio che ti propongo riguarda la filariosi cardiopolmonare del cane.


Questa malattia provocata da un nematote parassita, Dirofilaria immitis,
che viene trasmesso al cane attraverso le punture di zanzara. La zanzara
inocula nel cane le microfilarie che, dopo alcuni stadi di sviluppo, si
trasformano in parassiti adulti e si localizzano nelle cavit cardiache e
nell'arteria polmonare. A questo stadio la filariosi malattia grave e
difficilmente guaribile; la terapia rischiosa e deve essere effettuata su
animali ospedalizzati. La strategia migliore la prevenzione, che si effettua
attraverso la somministrazione periodica (una volta al mese) di un farmaco
durante il periodo di attivit delle zanzare.

evidente che i proprietari premurosi nei confronti del loro animale effettuano il trattamento
preventivo. Ne consegue che i cani con filariosi pi frequentemente appartengono a proprietari che
poco si curano della salute dei loro animali. Proprio per questo stesso motivo, sar probabile che i
cani con filariosi abbiano anche una una infestazione da pulci.

In base a quanto detto finora, attraverso uno studio epidemiologico potresti certamente dimostrare
una associazione statistica tra filariosi e infestazione da pulci, e magari su questa base saresti tentato
di avanzare ipotesi errate come, ad esempio, che la pulce sia importante nel ciclo biologico della
filaria.

Invece, l'associazione osservata di tipo non causale, come illustrato nello schema sottostante.
94

bene ripetere che associazione non sinonimo di causa. ovvio che, per dimostrare l'esistenza
di un rapporto causa-effetto, non sufficiente raccogliere ed analizzare dati e dimostrare l'esistenza
di una associazione, ma necessario anche conoscere in maniera approfondita il problema che si
affronta.

Le regole per dichiarare l'esistenza di una relazione causa-effetto variano in rapporto ai settori di
studio. Probabilmente le scienze fisiche sono privilegiate, in quanto consentono di disegnare
esperimenti nei quali un singolo componente pu essere isolato e studiato.
Grandissime difficolt emergono invece in altri settori, come ad esempio quello della storia: qui,
non solo gli esperimenti sono impossibili, ma i dati provengono dal passato e non possono essere
facilmente verificati. Secondo alcuni studiosi, un certo numero di affermazioni sorprendenti su
cause-effetti nella storia non erano basate su fondamenti di logica e dovevano essere respinte. Fra
gli esempi pi clamorosi: (1) Non sono mai state dichiarate guerre tra nazioni in cui erano diffusi
ristoranti McDonald e (2) Prima della televisione: due guerre mondiali; dopo la televisione, nessuna
guerra mondiale.
95

Cap. 5. Dalla
associazione alla causalit
Associazione e causalit: esempio di confusione causa-effetto

OBIETTIVO:

per mezzo di un esempio, mostrare come si possa incorrere in un errore grossolano: scambiare la
causa per l'effetto.

Talvolta, nello studio delle cause di un fenomeno, pu accadere di confondere la causa con l'effetto.
In questa Unit ti presento un esempio di questo
grossolano errore.

Nell'ambito della preparazione della tesi di laurea,


supponi di aver ottenuto dati su:

frequenza di isolamento di Salmonella dalla


lettiera di gruppi di broiler;
umidit della lettiera degli stessi gruppi.

La tua popolazione di interesse era costituita da


tutti gli allevamenti di broiler di una Regione. I dati
sono stati raccolti selezionando dalla popolazione di
interesse, attraverso un adatto metodo di campionamento (che verr trattato in una Unit
successiva), un totale di 90 campioni di lettiera. Di questi, 19 provenivano da lettiere visibilmente
bagnate, ed i rimanenti 71 da lettiere normali. I 90 campioni di lettiera stati sottoposti ad esami di
laboratorio allo scopo di accertare la presenza di salmonelle e l'effettivo grado di umidit.

La salmonellosi del pollame una importante malattia sostenuta dal batterio Salmonella enterica. Il
ciclo di diffusione di questo agente molto complesso e prevede un intreccio di passaggi tra
animali, ambiente e uomo, tenendo presente che la salmonella viene eliminata nell'ambiente
attraverso le feci. La contaminazione degli ambienti e l'infezione degli animali possono diventare
persistenti, anche a causa della notevole resistenza del batterio nell'ambiente (molti mesi in assenza
di disinfezioni).

La lettiera, come avrai modo di imparare durante il corso degli studi, un elemento di importanza
fondamentale nell'allevamento dei broiler. E' costituita da materiali diversi (di solito paglia o
trucioli), ed ha lo scopo di isolare i polli dal pavimento, di assorbire l'umidit delle deiezioni, di
ridurre il contatto con le deiezioni e, attraverso le sue fermentazioni, di produrre calore e contrastare
o inibire lo sviluppo di agenti patogeni. La lettiera deve rimanere sempre asciutta (umidit <50%).
Una lettiera bagnata favorisce la comparsa di malattie diverse, oltre a provocare una riduzione
delle prestazioni degli animali.

I dati che hai raccolto sono stati tabulati come segue:


96

Come vedi, la frequenza di isolamento di Salmonella dalle lettiere bagnate (47.4%) risultata
superiore a quella da lettiere normali (16.9). Questa differenza statisticamente significativa
(P=0.013, test Chi-quadrato).

La tua formazione scientifico-professionale sar completa solo se conosci il significato e


l'interpretazione del valore P sopra riportato. Infatti, esso presentato in moltissimi lavori
sperimentali, la cui lettura necessaria non solo ai fini della preparazione di una tesi di laurea ma
anche successivamente, durante l'attivit professionale, nell'ottica della educazione permamente.
Se lo ritieni opportuno, puoi ripassare il test chi-quadrato e la significativit statistica.

A questo punto, potresti essere tentato di concludere (avventatamente) che un eccesso di umidit
della lettiera un determinante della salmonellosi dei broiler. Per, la tua ipotesi di causalit
risulterebbe infondata per aver confuso la causa con l'effetto!
Infatti, la presenza di salmonellosi pu causare una enterite cronica, accompagnata da diarrea.
L'emissione di feci liquide provoca sovraccarico della lettiera che non pi in grado di mantenersi
al giusto grado di umidit. Pertanto, l'infezione che causa un aumento dell'umidit, e non
viceversa.

Esiste un secondo motivo per cui la tua ipotesi di relazione causa-effetto infondata. Tale motivo
riguarda riguarda la mancata verifica di rispondenza ai criteri di causalit (che verranno trattati in
Unit successive: postulati di Evans, regole di J. S. Mill, criteri di causalit). Ricordati che la
dimostrazione dell'esistenza di un'associazione, anche se statisticamente significativa, soltanto il
primo passo sulla strada della causalit. A questo primo passo deve necessariamente seguirne un
altro: l'interpretazione del significato dell'associazione.
97

Cap. 5. Dalla
associazione alla causalit
5.12 Associazioni non causali e fattori di confondimento

OBIETTIVO:

illustrare un altro esempio di associazione non causale

verificare l'effetto di un fattore di confondimento (counfounder) sull'interpretazione di un


presunto rapporto causa-effetto.

Abbandoniamo per un attimo la scienza veterinaria per illustrare un ipotetico studio epidemiologico
eseguito sull'uomo; l'esempio particolarmente interessante in quanto, oltre ad essere altamente
dimostrativo, considera una malattia dell'uomo frequente nei paesi progrediti ( l'infarto
miocardico), e due presunti fattori causali legati ad abitudini molto diffuse: l'assunzione di caff ed
il fumo di sigaretta.

Immaginiamo che lo studio sia stato eseguito su una popolazione costituita da individui di sesso
maschile di et compresa fra 39 e 59 anni. La popolazione stata cos definita in quanto comprende
soggetti pi "a rischio" per la patologia considerata. Lo scopo dello studio quello di verificare
se il consumo di caff pu essere ritenuto un determinante dell'infarto alle coronarie.

Per lo studio stato reclutato un campione di 2600 persone, di cui 1300 erano forti bevitori di caff
e 1300 invece non consumavano questa bevanda. Definiamo i primi "C+" ed i secondi "C-". Tutte le
persone all'inizio dello studio erano in salute. Esse sono state seguite per 8 anni (periodo di "follow-
up"), registrando i casi di infarto avvenuti nei due gruppi. Il disegno dello studio illustrato nello
schema che segue.
98

Come si vedr in una unit successiva, un disegno dello studio di questo tipo tipico dei
cosiddetti "studi prospettivi", detti anche "studi di coorte".

Alla fine dello studio, risulteranno noti i dati rappresentati dai punti interrogativi nello schema
precedente. Ovviamente i valori che useremo sono fittizi, e sono stati scelti allo scopo di rendere
l'esempio didatticamente pi semplice.
Tali valori sono riassunti nella Tabella 1, da cui puoi subito notare come nel campione si siano
complessivamente verificati, nel periodo considerato, 295 casi di infarto su 2600 individui. Quindi
la proporzione di individui colpiti 295/2600 = 0.113 = 11.3%. In una prossima unit verr
spiegato come questa proporzione rappresenti una delle pi importanti misure di frequenza delle
malattie. Per ora basta dire che essa detta "incidenza" e che non una pura e semplice
proporzione, ma un tasso, in quanto prende in considerazione la variabile nel tempo (il periodo di
osservazione di 8 anni).

I dati in Tabella 1 dimostrano che l'incidenza nei bevitori di caff (C+) nettamente superiore
rispetto ai non-bevitori (C-):

Incidenza nei C+ = 215/1300 = 0.165 = 16.5%


Incidenza nei C- = 80/1300 = 0.061 = 6.1%

Per verificare che la suddetta differenza non sia da attribuire al caso, devi sottoporre i dati ad un test
statistico. Come gi hai appreso in precedenza, il test da utilizzare per confrontare due
proporzioni il test chi-quadrato.

Se sul tuo computer installato MS Excel o un programma compatibile, puoi verificarlo tu stesso
trascrivendo gli appropriati valori nelle celle a sfondo verde azzurre del foglio di calcolo .
Se non hai installato MS Excel, puoi vedere la schermata che si ottiene).

Il valore del chi-quadrato ottenuto molto elevato (69.7); a ci corrisponde una probabilit
estremamente bassa (P<0.0001) che la differenza fra i due gruppi sia dovuta al caso. Quindi, tale
differenza "statisticamente significativa".
Pertanto, puoi concludere che esiste una associazione statistica positiva tra incidenza di infarto
e assunzione di caff (per inciso, ricordati che le associazioni possono essere anche negative,
come quando il fattore provoca una riduzione della frequenza dell'effetto considerato). Nell'esempio
che stai esaminando, hai rilevato una associazione "positiva": in parole povere: "pi caff si beve,
pi probabile essere colpiti da infarto".
99

A questo punto per pu sorgere il dubbio che la differenza osservata non sia dovuta al caff,
ma a qualche altro elemento legato al consumo di caff e non tenuto in considerazione nello studio.
Ad esempio, si pu supporre ragionevolmente che i C+ conducano una vita pi sregolata e
stressante rispetto ai C-, e che siano anche pi dediti al vizio del fumo. Gi: il fumo di sigaretta
notoriamente un determinante di infarto, e in questo studio esso potrebbe aver rappresentato quello
che viene detto un "confondente" (in inglese: confounder) o "fattore di confondimento".

Il confondimento una situazione in cui un fattore (o una combinazione di fattori) diverso da quello
in studio responsabile, almeno in parte, dell'associazione che abbiamo osservato. Quando
presente un fattore di confondimento, i dati grezzi mostrano un quadro sbagliato della correlazione
tra causa ed effetto.

Vediamo adesso se, nel nostro campione, il fattore fumo associato all'infarto. A questo scopo,
attraverso le schede anamnestiche dei 2600 individui studiati, risaliamo allo stato di fumatore-s
(F+) o fumatore-no (F-) di ciascuno. Poi tabuliamo i dati delle due nuove sottopopolazioni (F+ e F-)
riguardo all'insorgenza di infarto. Con un linguaggio pi propriamente epidemiologico potremmo
dire: stratifichiamo la popolazione in base al fattore fumo.
Otteniamo i dati della Tabella 2:

L'incidenza negli F+ molto superiore rispetto all'incidenza negli F- :

Incidenza negli F+ = 220/1100 = 0.20 = 20%


Incidenza negli F- = 75/1500 = 0.05 = 5%

Anche in questo caso, il test chi-quadrato (ormai puoi eseguirlo da solo!) dimostra che la differenza
fra la frequenza di infarto nei fumatori e la frequenza di infarto nei non fumatori statisticamente
significativa (P<0.0001), e quindi non pu essere attribuita al caso.

A questo punto siamo di fronte ad un dilemma::

Per isolare l'effetto dell'assunzione di caff da quella del fumo, necessario approfondire l'analisi,
calcolando i tassi di incidenza per ambedue le variabili.
100

Attraverso un supplemento di anamnesi, ci procuriamo i dati necessari per stratificare in base al


fattore fumo ed al fattore caff. In pratica ci serve sapere quanti erano i fumatori e bevitori di caff,
quanti erano i non fumatori e bevitori di caff ecc. ecc. Con questi dati costruiamo la Tabella 3.

Notare che i dati in Tabella 3 sono conformi a quelli delle tabelle 1 e 2, cosa che pu essere
facilmente verificata calcolando, ad esempio: il totale dei bevitori di caff 1085+215 = 1300; il
totale dei non-bevitori di caff 80+1220 = 1300; l'incidenza nei fumatori [(20+200)/1100)]= 0.20;
l'incidenza nei bevitori di caff [(215/1300 = 0.165)]; ecc..

I dati della Tabella 3 forniscono nuove, importanti informazioni. Proviamo a controllare come varia
l'incidenza nei C+ e nei C- tenendo fissa la variabile fumo:

Nei fumatori:
Incidenza in F+C+ = 200/(200+800) = 0.20
Incidenza in F+C- = 20/(20+80) = 0.20

Nei non-fumatori
Incidenza in F-C+ = 15/(15+285) = 0.05
Incidenza in F-C- = 60/(60+1140) = 0.05

Verifichiamo ora come varia l'incidenza negli F+ e F- tenendo fissa la variabile caff:

Nei bevitori:
Incidenza in C+F+ = 200/(20+800) = 0.20
Incidenza in C+F- = 15/(15+285) = 0.05

Nei non-bevitori
Incidenza in C-F+ = 20/(20+80) = 0.20
Incidenza in C-F- = 60/(60+1140) = 0.05

Come vedi, l'associazione fra infarto e consumo di caff non reale, ma mediata dal fumo di
sigaretta. La variabile-fumo ha agito come fattore di confondimento perch non era distribuita
uniformemente all'interno dei due gruppi C+ e C- (guarda i due sottostanti diagrammi a torta) ed
101

inoltre era in grado di influenzare l'effetto studiato (l'infarto). Se essa fosse stata distribuita
uniformemente, l'effetto di confondimento non avrebbe potuto essere evidenziato. In sostanza,
l'eccesso di casi di infarto riscontrato nei C+ dovuto alla pi alta proporzione di fumatori in questo
stesso gruppo rispetto al gruppo C-.

UNA QUESTIONE DI TERMINOLOGIA.


Con la locuzione indicatore di rischio si indica soltanto l'esistenza di una associazione statistica,
non necessariamente causale.
La locuzione fattore di rischio riservata invece a quel fattore che si ritiene sia riconducibile ad
una delle cause della malattia. In altre parole, un fattore di rischio pu essere assimilato ad un
determinante di malattia. Nota che un fattore di rischio non n una causa necessaria n una causa
sufficiente di malattia.
Nell'esempio, il fumo un fattore di rischio mentre il caff un indicatore di rischio.

L'argomento trattato in questa unit concettualmente molto vicino a quanto si dir nell'unit
"Standardizzazione delle misure" (Capitolo 10: Misure di frequenza delle malattie).

P.S. Nonostante i dati utilizzati in questo esempio siano immaginari, si ritiene che il caff non incrementi
il rischio di infarto cardiaco. invece provato al di l di ogni ragionevole dubbio che che il fumo di
sigaretta una delle cause pi importanti di questa grave malattia. Perci, sia questo esempio occasione
per un utile consiglio: se fumi, smetti!
102

6. L'approccio
epidemiologico alle cause di malattia
6.1 Postulati di Henle-Koch

OBIETTIVO:

porre l'attenzione sugli storici postulati che, alla fine XIX secolo, hanno gettato le basi per una
moderna visione della causalit delle malattie

Lo straordinario aumento delle conoscenze sulle malattie infettive


sostenute da batteri, avvenuto negli ultimi lustri del 1800, condusse
Robert Koch (1843-1910), con il suo maestro Henle, a formulare i
postulati diventati poi cos famosi.

La formalizzazione dei postulati derivava soprattutto dalla grande


esperienza che questi due studiosi avevano accumulato nel campo
della tubercolosi dell'uomo, una delle pi temibili malattie di tutti i
tempi, il cui agente (la cui denominazione scientifica Mycobacterium tuberculosis) stato poi
denominato bacillo di Koch proprio in onore e memoria al suo scopritore. Koch applic i suoi
postulati allo scopo di dimostrare che gli agenti della tubercolosi del carbonchio (una malattia
sostenuta dal batterio Bacillus anthracis) erano diversi.

I postulati possono essere riassunti in quattro semplici punti:

Lo stesso Koch si rese conto che il suo schema aveva alcune limitazioni. Per esempio, l'agente del
colera dell'uomo, Vibrio cholerae, poteva essere isolato sia da individui ammalati che sani,
invalidando il punto 2 dei postulati. Ciononostante, i postulati di Henle-Koch hanno contribuito in
modo determinante allo sviluppo del concetto di causa in medicina. Infatti, fin verso la fine del
XIX secolo le posizioni della scienza al riguardo erano molto confuse; si credeva spesso che una
data malattia infettiva potesse essere provocata da batteri di diversa specie. In questo panorama
103

incerto, il lavoro di Koch port ordine nel caos. Sotto alcuni punti di vista, il fondamento dei suoi
postulati valido ancora oggi: ad esempio, la regola secondo la quale un dato microrganismo causa
una sola e ben determinata malattia alla base della dimostrazione (avvenuta nel 1977) che la
"malattia dei legionari" provocata da un batterio o che l'AIDS provocata da un virus (anni '80).

La sagacia del postulati di Henle-Koch risiede nella loro logica semplice: in sostanza, essi
richiedono che, prima di dichiarare che un dato microrganismo causa una data malattia, sia
necessario (a) associarlo ad una sindrome clinica, (b) isolarlo in coltura pura, (c) riprodurre la
malattia re-inoculandolo in un animale recettivo e (d) reisolare lo stesso agente da quest'ultimo
animale (v. schema seguente).

Come gi detto, i postulati portavano finalmente ordine in un settore della medicina in cui ancora
regnavano largamente empirismo e superstizione. La loro adozione consent all'epoca di ottenere
insperati successi nella prevenzione e nel controllo di numerose malattie batteriche.

Dopo oltre un secolo di progressi della medicina, l'impostazione dei postulati di Koch non pu pi
essere ritenuta valida ed stata soggetta a profonda revisione critica. In particolare, si pu osservare
che, ancora oggi, indiscutibile che un microrganismo che risponde ai postulati la causa della
malattia in questione. Tuttavia, la domanda importante : questo microrganismo la sola e
completa causa?

In effetti, oggi esistono molte malattie infettive che non soddisfano lo schema rigido di Koch, che
ignora i fattori ambientali e associa una sola causa ad una malattia e una sola malattia ad una
causa. Il principale limite dei postulati proprio quello di non considerare la possibilit di una
eziologia multipla (una malattia, molte cause - o meglio: determinanti) n l'eventualit che una
stessa causa possa indurre malattie differenti.

Recentemente stato effettuato un tentativo di riformulare i postulati di Koch alla luce delle attuali
conoscenze di biologia molecolare, a partire dal principio di base che una sequenza di acido
104

nucleico appartenente ad un ipotetico patogeno (e non pi l'agente stesso) dovrebbe essere presente
in molti casi della malattia in studio. (Per una trattazione approfondita di questo argomento si rimanda a Fredericks DN, & Relman
DA (1996). Sequence-based identification of microbial pathogens: a reconsideration of Koch's postulates. Clinical microbiology reviews, 9 (1), 18-33.

ESEMPIO. Una malattia degli animali emblematica dell'inadeguatezza


dei postulati di Koch la polmonite enzootica del vitello, malattia
respiratoria che colpisce un gran numero di soggetti dell'allevamento (
morbosit fino al 100%) e non raramente ad esito mortale (
mortalit 20%). Questa malattia non sostenuta da un singolo agente,
ma da una triade di fattori:
1) stress correlati alle tecniche ed alle condizioni di allevamento
(management);
2) una infezione primaria da parte di un virus;
3) una infezione secondaria da parte di un batterio.
Notare che in questo caso il termine infezione primaria e secondaria da riferire al tempo (la
105

6. L'approccio
epidemiologico alle cause di malattia
6.2 Postulati di Evans

OBIETTIVO:

prendere visione di una moderna impostazione della causalit delle malattie, cos come proposta
da Evans nel 1976

I postulati di Evans sono un insieme di 9 o 10 criteri (a seconda dell'interpretazione dei lavori


originali dello stesso Evans), ciascuno dei quali contribuisce in una certa misura alla dimostrazione
dell'esistenza di un rapporto causa-effetto fra un presunto determinante (o una esposizione) e la
comparsa di una malattia. Nello schema sottostante i postulati sono stati riassunti, a scopo didattico,
in soli 7 punti.

da notare come in tutti i postulati venga usato il verbo condizionale; ci indica che i 7 postulati
qui riassunti non rappresentano regole assolute da rispettare tutti insieme e ad ogni costo. Essi
devono piuttosto essere considerati come linee-guida dei ragionamenti di causalit nello studio
sulle cause di malattia.
106

L'ultimo postulato, non mostrato nello schema, vuole che All findings should make biological and
epidemiological sense. Ci significa che l'associazione tra l'ipotetico fattore causale e la malattia
deve essere biologicamente plausibile. Inoltre, l'epidemiological sense chiama in causa la
significativit statistica, concetto gi espresso pi volte nelle precedenti unit, che implica che lo
studio di raffronto debba essere condotto gruppi (o popolazioni) di animali, piuttosto che sul singolo
individuo.

Per la versione originale dei postulati, vedi: Evans A.S. (1976) Causation and disease: the Henle-
Koch postulates revisited. Yale J. Biol.Med., 49, 175-195. Evans A.S. (1978) Causation and
disease: a chronological journey. Am. J. Epid., 108:249-58.
107

6. L'approccio
epidemiologico alle cause di malattia
6.3 Prove di colpevolezza: criminalit e causalit

OBIETTIVO:

verificare come le cause di malattia trovino corrispondenza in un ambito ben diverso da quello
della medicina!

Nella Tabella soprastante sono elencati, nella parte destra, alcuni principi generali di causalit di
malattia che ricalcano largamente i postulati di Evans; questi principi sono stati posti a raffronto,
dallo stesso Evans, con i principi generali che muovono un ben diverso settore delle attivit umane:
il crimine.
108

In particolare, uno dei punti pi significativi il n. 3 che, invocando il ruolo dei cofattori (cio
fattori accessori di malattia o determinanti), porta un taglio netto alla vecchia impostazione di
Koch.

Il punto 5 precisa che il ruolo della presenta causa deve essere biologicamente credibile; cio, il
fattore in gioco deve disporsi agevolmente nel mosaico delle conoscenze consolidate riguardo alla
malattia.

Il punto 6 sembra un piccolo passo indietro rispetto alla concezione della causalit multipla; in
effetti, non sono rari gli esempi della possibilit che una stessa malattia venga indotta da cause
diverse; tuttavia, la precisazione nelle date circostanze chiarisce il concetto: si deve intendere,
infatti, che a parit di altri elementi (cio nella stesso punto della rete delle cause) solo il fattore
in gioco pu indurre la malattia in questione.

Infine, il punto 7 afferma che la causalit deve essere provata al di l di ogni ragionevole dubbio.
Questa affermazione porta in s il concetto di probabilit; in altre parole, non necessario
ricercare una prova di causalit matematicamente certa, ma occorre tuttavia che la prova sia provata
con un alto grado di probabilit; ci possibile soltanto ricorrendo alla statistica.
109

6. L'approccio
epidemiologico alle cause di malattia
6.4 Cause di malattia: regole di John Stuart Mill

OBIETTIVO:

adattare alle cause di malattia i cinque principi generali ( o canoni) elaborati dal filosofo J.S.
Mill

Nell'ambito della sua imponente costruzione di logica deduttiva ed


induttiva, J.S. Mill elabor, attorno alla met del XIX secolo, una serie di
regole su cui basare la dimostrazione della causalit. Nell'opera originale di
Mill le regole, dette canoni, sono princpi di ragionamento induttivo che si
applicano agli eventi sperimentali in genere. Essi sono stati estesamente
parafrasati, per adattarli specificamente all'evento-malattia, da Martin e
coll. (1987) e sono riportati nello schema sottostante.

I canoni hanno resistito ai profondi rivolgimenti delle conoscenze nei pi


diversi settori della scienza; essi restano attuali nella loro elegante
semplicit e rappresentano un monumento virtuale alle straordinarie capacit intuitive e di
ragionamento di J. S. Mill.
110

6. L'approccio
epidemiologico alle cause di malattia
6.5 Dimostrazione della causalit

OBIETTIVO:

rafforzare il concetto secondo cui associazione non sinonimo di causalit e apprendere


l'esistenza dei criteri di causalit

Nelle Unit precedenti abbiamo preso in considerazione alcuni test statistici da utilizzare per
verificare l'esistenza di una associazione. Tuttavia, nessun test statistico pu dimostrare, di per s, la
prova della causalit di una associazione, ossia la prova dell'esistenza di una relazione causa-effetto
fra il fattore studiato e la malattia. Il test statistico soltanto uno strumento per superare il primo
passaggio, ossia quello della dimostrazione dell'esistenza una associazione. Il passaggio successivo
consiste nel verificare la causalit della associazione.

Il flusso logico il seguente:

In sostanza, al fine di dimostrare l'esistenza di una relazione causa-effetto tra due fenomeni,
occorre

1. osservare l'esistenza di associazione e convalidare tale osservazione attraverso l'impiego di un test


statistico (es. chi-quadrato);
2. escludere la presenza di errori sistematici nello studio. Gli errori sistematici sono vizi
d'impostazione o di esecuzione di uno studio, che conducono a sovra- o sottostimare la forza di
111

un'associazione. Spesso essi derivano dall'impiego di un cattivo metodo di campionamento, che


spinge lo sperimentatore ad esaminare un segmento non rappresentativo della popolazione
oggetto dello studio. Quando un'associazione deriva da errori sistematici si dice spuria;
3. a questo punto, essendo l'associazione risultata statisticamente valida e priva di errori sistematici,
necessario un ultimo - ed importante - passo prima di arrivare alla dichiarazione dell'esistenza della
presunta relazione causa-effetto. Questo passo rappresentato dalla applicazione dei 5 criteri
di causalit;
4. infine, se i criteri vengono soddisfatti l'associazione da ritenere causale; altrimenti di tipo non
causale.
112

6. L'approccio
epidemiologico alle cause di malattia
6.6 I cinque criteri di causalit

OBIETTIVO:

fermare l'attenzione sui criteri di causalit, indispensabili ai fini dell'accertamento di una


relazione causa-effetto

Qualsiasi metodo statistico non pu costituire, di per s, la prova che un'associazione tra due
fenomeni sia basata su una relazione causa-effetto. Infatti, la prova deve avvenire seguendo una
metodica accettata nel mondo scientifico, e cio verificando la rispondenza a precisi criteri di
causalit.

Sono gi stati descritti i postulati di Henle-Koch, i postulati di Evans, e le regole di J.S. Mill,
che possono essere considerati veri e propri criteri di causalit. Per ai fini didattici, credo sia pi
utile riassumere i criteri di causalit in soli cinque punti facilmente comprensibili. Questi cinque
criteri derivano dalla proposta dello statistico inglese Sir Austin Bradford Hill (1965) e da quella del
Comitato Consultivo per la Salute Pubblica degli U.S.A. (1964). I cinque criteri, elaborati in un
ampio studio riguardante l'effetto del fumo nell'uomo, sono accettati nella comunit scientifica e
sono adattabili anche alle malattie degli animali:
113

Consistenza

La consistenza di un'associazione richiede che studi diversi, eseguiti in tempi diversi ed in diverse
condizioni sperimentali, evidenzino la stessa associazione.

"E questa sperienza si faccia pi volte, acci che qualche accidente non impedissi o falsassi tal prova, che le sperienzia
fussi falsa, e ch'ella ingannassi o no il suo speculatore" [Leonardo da Vinci].

Forza

La forza di una associazione un concetto un po' pi complesso.


In sintesi, una associazione fra un presunto determinante di malattia e la malattia medesima pu
essere pi o meno forte. Tale forza pu essere quantificata, ossia misurata calcolando, per
esempio, il rischio relativo. Il rischio relativo, che verr trattato in dettaglio in un'altra unit,
viene stimato attraverso il rapporto fra [proporzione di individui colpiti nel gruppo esposto alla
presunta causa] e [proporzione di individui colpiti nel gruppo non esposto]. Come vedrai in seguito,
quanto pi il rischio relativo si discosta dal valore 1, tanto pi forte l'associazione. Inoltre, la forza
dell'associazione aumenta se si riesce ad individuare l'esistenza di un effetto dose-effetto (cio, pi
intensamente o a lungo agisce la presunta causa, pi aumenta il rischio relativo).

Anche l'odds ratio costituisce un sistema per valutare la forza di una associazione.

ESEMPIO. Nell'uomo, la incidenza di cancro al polmone in fumatori risultata 4-16 volte pi


elevata rispetto a non-fumatori. Questa osservazione rappresenta una prova molto pi forte rispetto
a quella fornita da studi nei quali l'incidenza di cancro renale era 1.1-1.6 volte pi elevata nei
fumatori che nei non-fumatori.

Il concetto di forza stato magistralmente reso da Cosmacini e Sironi (2002):


"Che cosa distingue, dal punto di vista della concezione scientifica, una malattia del passato, quale
potrebbe essere la peste o il colera, da una malattia sociale del presente, quale potrebbe essere il
cancro?
Uno degli elementi di distinzione concettuale senza dubbio quello che implica nella prima un
criterio di causalit forte, tipica delle malattie infettive, e nella seconda un criterio di causalit
debole, tipica delle malattie degenerative. Nelle une la forza della causa sta nel fatto che la causa
patogena, cio l'agente infettivo, seguita forzatamente e con immediatezza dall'effetto
patologico, cio dalla malattia; nelle altre la forza minore, o debolezza relativa, sta nel fatto
che la causa o le cause patogene sono seguite probabilisticamente e a distanza dagli effetti
morbosi, con un determinismo eziologico radicalmente mutato. La vecchia idea di causa si
trasforma nel nuovo concetto di fattore di rischio."

Specificit

La specificit misura la costanza con cui una specifica esposizione produce una determinata
malattia; ovviamente, pi la risposta biologica alla presunta causa costante, e pi probabile che
quest'ultima sia una causa effettiva. Questo criterio applicabile soprattutto alle malattie infettive,
nelle quali - generalmente - l'esposizione ad un particolare agente di malattia provoca la comparsa
di quella stessa malattia. invece difficilmente applicabile a molte malattie cronico-degenerative
114

ove un singolo determinante (es. fumo di sigaretta) pu provocare effetti molto diversi (bronchiti,
tumori, malattia cardiovascolari ecc.).

Temporalit

La temporalit dell'associazione basata sul semplice ed inoppugnabile principio che ogni causa
deve precedere il relativo effetto. Questo criterio sembra cos evidente da risultare quasi banale.
Devi per considerare che, soprattutto per le malattie croniche, la successione temporale degli
eventi pu essere difficile da stabilire, anche perch l'inizio dell'effetto non sempre facilmente
evidenziabile. Ad esempio: quando inizia un tumore?
In alcune condizioni possibile addirittura incorrere nell'errore di assumere che una variabile abbia
preceduto temporalmente un'altra variabile quando invece si verificato l'opposto.

ESEMPIO. E' stato notato che, nell'uomo, le persone sovrappeso sono soggette ad un rischio pi
elevato di morte per cause cardiovascolari rispetto alle persone di peso normale. Quindi, sarebbe
logico prevedere che una perdita di peso in individui sovrappeso rappresenti un fattore protettivo.
Tuttavia, stato dimostrato che la mortalit, al contrario, aumenta in coloro che diminuiscono di
peso. La contraddittoriet dei dati viene giustificata se si tiene presente che, in molti casi, la perdita
di peso un segno precoce di alcune gravi malattie ad esito letale. Quindi, le condizioni che
causeranno la morte possono precedere e causare la perdita di peso, e non viceversa.

Coerenza

La coerenza pu venire definita anche plausibilit biologica. Essa richiede che la presunta causa
sia verosimilmente inquadrabile nel contesto delle conoscenze sull'argomento e sulla patogenesi.
Pu essere stabilita, per esempio, su modelli animali o su cellule viventi o su colture d'organo.

da sottolineare che ci che viene considerato biologicamente plausibile dipende dallo stato
delle conoscenze mediche in quel momento. Ad esempio, nel XVIII secolo il concetto di malattia
contagiosa era ritenuto non plausibile. D'altra parte, il meccanismo attraverso cui la agopuntura
induce anestesia poco chiaro e, quindi, per molti scienziati occidentali il fenomeno appare
biologicamente non plausibile.
In sostanza, la plausibilit biologica non da ritenere un criterio indispensabile: se essa presente,
allora la causalit pi probabile; se invece assente, allora devono essere ricercate altre prove di
causalit. Se queste esistono e sono forti, allora la mancanza di plausibilit biologica pu derivare
dalla pochezza delle conoscenze mediche piuttosto che dall'assenza di associazione causale.
115

6. L'approccio
epidemiologico alle cause di malattia
6.6 Studi retrospettivi e studi prospettivi per la dimostrazione di causalit

OBIETTIVO:

confrontare l'impostazione di studi retrospettivi e prospettivi, e verificarne le differenze.

Nella sequenza delle ricerche sulla eziologia di una malattia, spesso il veterinario clinico effettua
osservazioni di eventi che lo inducono a formulare ipotesi. Tali ipotesi, proprio proprio perch
derivanti da osservazioni limitate ed avvenute soltanto per caso, vanno verificate in modo obiettivo.
Le ipotesi eziologiche basate su osservazioni cliniche sono spesso riassumibili in una semplice
ipotesi del tipo:

Le affermazioni di questo tipo vengono verificate, in genere, prima con studi di tipo retrospettivo e
successivamente, se questi confermano l'ipotesi, con studi prospettivi (detti anche studi di
coorte).
L'impostazione di entrambi questi studi pu essere descritta con una tabella a doppia entrata, detta
anche tabella di contingenza perch viene usata per determinare se la distribuzione di una variabile
dipende in maniera condizionata (o contingente) dall'altra variabile. Tipicamente, negli studi
prospettivi o retrospettivi pi semplici, le due variabili tabulate sono rappresentate dalla
"esposizione" e dalla "malattia".
La tabella di contingenza ha il seguente aspetto:

La tabella molto semplice, ma ti consiglio di osservarla con attenzione, perch la chiave per
comprendere tutto quello che segue. Nella tabella si possono aggiungere i totali marginali (ossia i
116

totali di riga ed i totali di colonna), ottenendo due modalit di lettura (in verticale per colonne,
oppure in in orizzontale per righe), come nei due schemi che seguono.

Torniamo agli studi retrospettivi ed agli studi prospettivi, e vediamo ora qual l'impianto logico di
ciascuno di essi.

Studi retrospettivi (o studi caso-controllo)

Negli studi retrospettivi, lo sperimentatore inizia raccogliendo i cosiddetti casi, ossia gli individui
che presentano la malattia in studio. Nella tabella i casi sono rappresentati dal totale degli individui
(a+c). Viene anche scelto un adatto gruppo di paragone (o di controllo) che comprender individui
sani (b+d). A questo punto, attraverso una accurata anamnesi su tutti i soggetti in studio, si
stabilisce come gli ammalati (a+c) debbano essere assegnati alle celle a e c. Analogamente si
stabilisce quanti, fra i controlli, debbano essere assegnati alle celle b e d.
La tabella risulta ora completata, e si pu impostare l'analisi, confrontando gli odds di esposizione
nei casi (a/c) con gli odds di esposizione nei controlli (b/d) (confronto fra colonne) (quest'ultimo
passaggio verr spiegato nelle due Unit sucessive).

La struttura di uno studio retrospettivo riassunta nello schema che segue.


117
118

Come gi detto, gli studi retrospettivi sono basati su gruppi costituiti da individui che, gi all'inizio
dell'esperimento, sono noti come casi o controlli; per questo gli studi di questo tipo sono detti
anche studi caso/controllo.

Uno studio retrospettivo ha il vantaggio di fornire un risultato relativamente rapido, in quanto


all'inizio dello studio il tempo necessario all'accadimento degli eventi gi trascorso. Un altro
punto a favore degli studi retrospettivi, rispetto a quelli prospettivi, la applicabilit ad indagini su
malattie rare, per le quali i casi possono essere raccolti retrospettivamente anche da ospedali e
cliniche veterinarie.

per da notare che, proprio per la loro stessa natura, gli studi retrospettivi forniscono - in linea di
massima - risultati meno affidabili rispetto agli studi prospettivi. Si pensi ad esempio alla quota
aleatoria connessa con l'accertamento dell'avvenuta esposizione attraverso una anamnesi basata
sulla memoria degli addetti alla cura degli animali: si tratta evidentemente di un processo che porta
con s una certa dose di imprecisione.

Un altro elemento a sfavore degli studi retrospettivi riguarda l'eventualit che si voglia studiare una
malattia di breve durata e ad esito generalmente letale. In questa situazione, il "bias" potrebbe
derivare dalla selezione dei casi, i quali sarebbero costituiti dai pochi animali sopravvissuti,
certamente non rappresentativi della popolazione dei malati. Si potrebbe addirittura verificare il
paradosso di considerare come causa di una malattia un fattore che in realt protettivo: proprio
quello stesso fattore che ha consentito la sopravvivenza dei casi e che senz'altro risulter fortemente
associato ad essi.

Studi prospettivi (o studi di coorte)

Uno studio prospettivo inizia selezionando due gruppi, entrambi costituiti da animali sani: un
gruppo comprende soggetti che sono stati esposti alla presunta causa (o lo saranno in futuro), e
l'altro soggetti che non sono stati esposti (e non lo saranno).
Quindi, gli animali vengono seguiti nel tempo e andranno a distribuirsi nelle colonne degli
ammalati o dei sani.
In questo modo, alla fine dell'esperimento, la tabella risulter completata con i valori a, b, c, e d.
Si prosegue effettuando la analisi dei dati, confrontando la proporzione di malati tra gli
esposti [a/(a+b)] con la proporzione di malati tra i non esposti [c/(c+d)] (confronto fra righe).
119

La struttura di uno studio prospettivo riassunta nello schema che segue.

Lo studio prospettivo (detto anche di coorte) ha lo svantaggio di richiedere pi tempo, in quanto


si deve seguire nel tempo la comparsa degli eventi. Inoltre, esso non applicabile a malattie rare per
la difficolt nel reperimento di un numero di casi sufficiente.
Gli studi prospettivi sono superiori a quelli retrospettivi perch meno soggetti ad errori
120

sistematici, in quanto essi non dipendono da dati raccolti in precedenza magari con modalit poco
affidabili. Infatti, il ricercatore in grado di valutare personalmente la qualit dei dati raccolti,
soprattutto per quanto riguarda l'esposizione, cosa che invece sempre un po' aleatoria negli studi
retrospettivi.
Un altro punto a favore degli studi prospettivi che essi possono fornire una stima della incidenza
(ossia del numero di nuovi casi che compaiono in un dato tempo) della malattia e possono essere
utilizzati per studiare l'effetto di determinanti rari.

forse opportuno ricordare di nuovo che gli errori sistematici sono vizi di impostazione di un
esperimento che possono influenzarne i risultati, pregiudicandone l'interpretazione. Le principali
fonti di errori sistematici negli studi retrospettivi riguardano l'accertamento della esposizione che,
dovendo essere effettuato con una inchiesta anamnestica, per sua natura impreciso e prono ad
interpretazioni soggettive. Anche la selezione dei controlli pu essere fonte importante di errori
sistematici. Infatti, non sufficiente scegliere animali sani a caso, ma occorre che essi siano il pi
possibile simili agli ammalati; inoltre, se i risultati dello studio dovranno essere estesi alla
popolazione, i controlli dovranno presentare una distribuzione dell'esposizione simile a quella della
popolazione stessa.

Infine, nella figura seguente illustrata schematicamente la differenza fra studi prospettivi e
retrospettivi; in particolare, viene evidenziato il diverso momento di inizio dell'osservazione della
popolazione in rapporto alla comparsa di malattia.
121

6. L'approccio
epidemiologico alle cause di malattia
6.8 Esempio di verifica dell'ipotesi in uno studio retrospettivo

OBIETTIVO:

consolidare - attraverso un esempio - l'apprendimento dell'impostazione di uno studio


retrospettivo

Supponi di aver avuto l'impressione, nella tua pluriennale pratica clinica in


un ospedale veterinario, che la presenza di calcolosi urinaria (o urolitiasi)
sia pi frequente nei cani obesi o sovrappeso rispetto ai cani normali.
In base alle tue conoscenze riguardanti la fisiologia ed il metabolismo del
cane ed ai meccanismi che conducono alla formazione dei calcoli urinari,
hai il sospetto che fra le due condizioni (obesit e malattia) possa esistere
una associazione e, forse, anche una relazione di causa-effetto. In sostanza,
hai il sospetto che l'obesit possa essere un fattore che predispone alla
calcolosi, ossia un determinante di calcolosi nel cane.

Ti proponi di verificare la ipotesi dell'esistenza della associazione tra


obesit (OB) e calcolosi urinaria (CU) attraverso uno studio retrospettivo.

A questo scopo esamini le cartelle cliniche dei cani visitati negli ultimi 5 anni nell'Ospedale. Nel
periodo considerato, il numero di "casi" (ossia cani affetti da calcolosi, CU+) risultato pari a 1014.
Dalle stesse cartelle cliniche, accerti che 383 di questi animali erano obesi (OB+), mentre i restanti
631 erano non-obesi (OB-).

Ora procedi a selezionare un campione di cani "di controllo" (CU-) ossia di cani non affetti dalla
malattia (il metodo per selezionare un campione verr spiegato in un prossimo Capitolo). In
totale, il campione di cani di controllo costituito da 1487 animali. In base alle cartelle cliniche,
322 di questi erano OB+ e 1165 OB-.

Riassumi i dati in una tabella come quella che segue.


122

Ora ti chiedi: l'obesit pi frequente nei malati o nei non malati?

Per rispondere, devi confrontare la proporzione di OB+ nei CU+ con la proporzione di OB+ nei
CU-.

Attento a non confonderti nel passaggio ora descritto: magari ti era venuta l'idea (sbagliata!) di
calcolare la proporzione di CU+ negli OB+, e la proporzione di CU+ negli OB-.
Perch questa idea sbagliata? semplice: ricordi il disegno del tuo studio retrospettivo? Hai
selezionato un campione di CU+ ed uno di CU-, ed su questi campioni che devi effettuare i tuoi
calcoli!
Se ti poco chiaro, ti consiglio di rileggere l' Unit precedente.

Ora procedi a calcolare la proporzione di OB+ nei CU+ e la proporzione di OB+ nei CU-:

La proporzione di obesi nei malati superiore rispetto ai non malati. Tuttavia, come hai gi
imparato, questa differenza potrebbe essere dovuta al caso. Per ora, devi accettare l'ipotesi zero,
secondo cui la differenza osservata dovuta al caso.
Naturalmente, l'ipotesi zero pu essere vera o falsa. Come puoi sapere se, in base ai tuoi dati,
l'ipotesi zero da accettare o da rifiutare? La risposta facile: devi applicare un test statistico!
Un test statistico adatto al confronto di due proporzioni o di due percentuali il test del chi-
quadrato, gi visto nei dettagli in una Unit precedente.
Il calcolo manuale il seguente:
123

Applicando il test ai tuoi dati, ottieni un valore di chi-quadrato di 76.6

Il tuo valore ha con 1 grado di libert, essendo stato


ottenuto per confronto di due proporzioni. Esso
superiore rispetto a quello tabulato nella Tabella dei
valori di chi-quadrato (una parte di essa riprodotta qui
a sinistra) sia con probabilit 5% (valore tabulato:
3.841) che con probabilit 1% (valore tabulato: 6.635).
Quindi, puoi affermare che la differenza fra la
proporzione di obesi nei gruppi CU+ e CU-
statisticamente significativa ad un livello di
probabilit 1% o inferiore. Un modo di esprimersi
analogo il seguente: la differenza fra i gruppi CU+ e
CU-, riguardo al fattore obesit, statisticamente
significativa per P<0.01 (dove P sta per probabilit).
Pertanto, l'ipotesi zero pu essere tranquillamente rifiutata, in quanto hai il 99% di probabilit che
la differenza osservata tra i gruppi CU+ e CU- non sia dovuta al caso.
Lo stesso concetto pu essere espresso come segue: stata osservata una associazione calcolosi-
obesit di entit tale che, immaginando di ripetere per 100 volte uno studio analogo a questo (ma su
altri animali), per 99 volte osserveremo differenze pari o superiori a quelle osservate in questo
esperimento.

Invece di fare i calcoli a mano, puoi inserire i tuoi dati nel Foglio di calcolo (se non hai
installato Excel, puoi vedere qui la schermata che si ottiene).
Il foglio ti restituisce direttamente il valore P, e quindi il confronto con i valori di chi-quadrato
tabulati inutile. Il valore P 0.0000. Ci dovuto al fatto che vengono mostrati soltanto 4 decimali,
che sono pi che sufficienti per trarre la conclusione riguardo alla significativit statistica. Per
curiosit il valore P ottenuto con i tuoi dati 0.0000000000000000021.

Due ultime annotazioni prima di concludere questa unit didattica.

(1) Quanto hai ottenuto finora nella presen te simulazione non rappresenta ancora la dimostrazione
dell'esistenza di una relazione causa-effetto fra obesit e calcolosi, ma il primo ed indispensabile
passo in questa direzione. La dimostrazione della relazione causa-effetto si ottiene con la verifica
dei criteri di causalit (gi visti in precedenza).

(2) Con i dati ottenuti, opportunamente tabulati nella tabella 2x2, puoi calcolare il valore dell'odds
ratio. L'odds ratio fondamentale per l'interpretazione dei risultati di uno studio retrospettivo (come
quello di cui stiamo parlando). L'odds ratio rappresenta una misura della forza di una associazione,
e viene trattato pi dettagliatamente nella prossima unit didattica.

Dati tratti da: Lekcharoensuk C. e coll. (2000) Patient and environmental factors associated with
calcium oxalate urolithiasis in dogs. JAVMA, 217, 515-519 ed utilizzati con il consenso degli
Autori.
stato dimostrato che l'obesit aumenta il rischio di urolitiasi anche nel gatto e nella specie umana.
Per giustificare l'esistenza della associazione tra obesit e urolitiasi, stato ipotizzato che il cane
obeso ingerisca con la dieta un eccesso di minerali capaci di favorire la formazione di calcoli (nel
caso dei calcoli di ossalato di calcio, i minerali importanti sono il calcio e l'acido ossalico). Tali
minerali vengono eliminati primariamente per via renale, e quindi la loro concentrazione nelle urine
aumenta. Ci favorisce la precipitazione (ri-cristallizzazione) dei minerali nelle vie urinarie e quindi
la formazione di calcoli.
124

6. L'approccio
epidemiologico alle cause di malattia
6.9 Misura del rischio: odds ratio e rischio relativo

OBIETTIVO:

apprendere il significato e l'utilizzo di alcuni rapporti comunemente utilizzati per misurare la


forza di una associazione.

La misura (o quantificazione) di una associazione rappresenta uno fra i passi pi importanti da


compiere nell'indagine sulle cause delle malattie oppure nella valutazione degli effetti di un
trattamento terapeutico o di una azione di prevenzione od ancora, pi in generale,
nell'investigazione su un qualsiasi rapporto causa-effetto. Questo aspetto gi stato trattato in una
precedente unit. Inoltre, nell'intero capitolo precedente (Dalla associazione alla causalit)
sono state illustrate le basi razionali e qualche metodo per valutare la significativit statistica di una
associazione.
Ora venuto il momento di prendere in considerazione un paio di sistemi utili per quantificare una
associazione. Parlando in generale, nel procedimento di valutazione dell'esistenza di una
associazione sono in gioco due variabili:

1. la presunta causa o esposizione (variabile indipendente)


2. l'effetto (variabile dipendente, cos detta in quanto appunto subordinata alla variabile
indipendente). In genere l'effetto rappresentato dalla comparsa della malattia.

Come gi visto, l'esistenza di una associazione pu essere accertata attraverso studi retrospettivi
(o studi caso-controllo) o studi prospettivi (o studi di coorte). Negli studi retrospettivi si confronta
la frequenza di esposizione nei malati (casi) con quella nei non-malati ((controlli). Negli studi
prospettivi si confronta la frequenza di malattia negli esposti con quella nei non-esposti:
125

Il termine "esposto" viene usato per motivi storici e talvolta impropriamente: infatti, la variabile
indipendente pu essere anche un fattore interno all'ospite, ed in tal caso non avrebbe senso parlare
di "esposizione". Allora, vale la pena di chiarire che, nel linguaggio epidemiologico per
"esposizione" si intende la presenza di qualsiasi variabile che, in linea di ipotesi, pu causare un
certo effetto.

Esposizione = presenza di un fattore che pu (ipoteticamente) causare un certo effetto

Ora vediamo come si fa a quantificare l'associazione eventualmente riscontrata, ossia a


quantificare il rischio cui sono soggetti gli animali esposti.
Il procedimento diverso a seconda che si tratti di uno studio retrospettivo oppure di uno studio
prospettivo. Se lo studio retrospettivo si calcola l'odds ratio, se lo studio prospettivo si calcola il
rischio relativo.

Studio retrospettivo: l'odds ratio

Proseguiamo l'esempio dell'unit precedente riguardante l'associazione fra obesit e urolitiasi del
cane, ricordando che in uno studio retrospettivo si inizia selezionando i casi e i controlli e poi
andando ad accertare quanti fra i casi (e quanti fra i controlli) sono stati esposti alla presunta causa.
Lo studio ha fornito i seguenti risultati:

Il metodo da utilizzare per la misurazione dell'associazione in uno studio retrospettivo il calcolo


del cosiddetto odds ratio (OR) o rapporto degli odd o rapporto incrociato.
126

Per comprendere questa misura, occorre introdurre il concetto di "odds" (termine che non ha un
corrispondente in italiano; pu essere reso con "probabilit a favore"). Gli odds sono rappresentati
dal il rapporto fra il numero di volte in cui l'evento si verifica (o si verificato) ed il numero di
volte in cui l'evento non si verifica ( o si verificato).

Gli odds si utilizzano nel mondo delle scommesse, perch consentono allo
scommettitore di calcolare facilmente la somma da incassare in caso di vittoria.
Ad esempio, la vittoria della nazionale italiana di calcio nella semifinale Italia-
Francia ai mondiali del 1998 era data dai bookmakers a 4:1 "a sfavore". Questo
equivale a dire che, su una scala da 1 a 5, le probabilit di sconfitta (p) dell'Italia
erano considerate 4 volte pi alte di quelle di una sua vittoria (1-p), e quindi la vittoria dell'Italia
sarebbe stata pagata 4 volte la cifra scommessa [per i curiosi: vinse la Francia 4-3 ai rigori].
Ovviamente, gli odds si possono trasformare in probabilit: secondo i bookmakers, l'Italia aveva 1
probabilit su 5 (p=0.2) di vincere e 4 probabilit su 5 di perdere (p=0.8). Nota che (p di perdere) =
(1-p di vincere) e viceversa.

L'"odds ratio" si calcola attraverso i semplici rapporti (odds) fra le frequenze osservate e non
attraverso le proporzioni. Nel nostro esempio sulla urolitiasi del cane, calcoliamo gli odds
(ricordati: odds = p a favore / p contro) di esposizione nel gruppo dei casi e gli odds di esposizione
nel gruppo dei controlli, e poi ne facciamo il rapporto.

Notare che si utilizzano i semplici rapporti tra le frequenze osservate (a/c, b/d) e non le proporzioni
(a/a+c e b/b+d). Notare anche che, applicando le propriet delle frazioni, l'odds ratio pu venire pi
facilmente calcolato attraverso i prodotti delle celle incrociate della tabella (a*d e b*c); perci viene
anche detto, in italiano, "rapporto incrociato".

Ritorniamo all'esempio dell'obesit-urolitiasi e calcoliamo l'odds ratio (per tua comodit, i dati dello
studio sono riprodotti nella tabella qui sotto).
127

In termini matematici, non importante se l'OR viene calcolato come (a/c)/(b/d) oppure come
(a/b)/(c/d), perch in entrambi i casi si ottiene lo stesso rapporto incrociato: ad/bc. Tuttavia, in
termini razionali non ha senso usare la seconda formula. Infatti in uno studio retrospettivo, il
rapporto a/b (cos come il rapporto c/d), non dipende dalla malattia n dall'esposizione, ma bens
soltanto dallo sperimentatore stesso che ha avuto libert di reclutare un numero di casi e di controlli
a suo piacimento.

A questo punto, sorge la domanda: qual il significato del valore ottenuto? Ossia: come si
interpreta l'OR?
poich l'interpretazione identica a quella del rischio relativo, necessario pazientare un poco... la
risposta verr data nella parte finale di questa stessa unit.

Studio prospettivo: il rischio relativo

Diversamente da uno studio retrospettivo, uno studio prospettivo inizia suddividendo la


popolazione in esposti e non esposti e poi osservando nel tempo quanti fra gli esposti (e quanti fra i
non-esposti) si ammalano.

Supponiamo di intraprendere un nuovo studio per verificare se esiste una associazione fra
allevamento dei vitelli in ricoveri chiusi (esposizione, o variabile indipendente) e la comparsa di
polmonite (variabile dipendente). A questo scopo effettuiamo uno studio prospettivo, seguendo nel
tempo gruppi di vitelli allevati al chiuso oppure all'aperto e contando i casi di polmonite che si
verificano nei due gruppi.
Alla fine dello studio i risultati ottenuti [dati fittizi] vengono tabulati nella solita tabella di
contingenza:
128

Questa volta si tratta di uno studio prospettivo, e quindi si pu calcolare il rischio relativo (RR),
denominato in inglese risk ratio ossia rapporto fra i rischi. Infatti, il rischio relativo il rapporto
fra il rischio nel gruppo degli esposti e il rischio nel gruppo dei non esposti. Forse pi efficace e
pi precisa la seguente definizione: il rischio relativo il rapporto tra l'incidenza negli esposti e
l'incidenza nei non esposti (dove incidenza significa proporzione di nuovi casi; l'incidenza ed
altre misure di frequenza verranno trattate successivamente).
In base a quest'ultima definizione si comprende perch il rischio relativo viene detto anche
rapporto di incidenza.

Pertanto il calcolo del RR si sviluppa come segue:

Utilizzando i dati dello studio sulla polmonite dei vitelli (riprodotti nella tabella qui sotto), abbiamo:
129

Interpretazione dell'odds ratio e del rischio relativo

L'interpretazione identica sia che si tratti di valori di OR che di valori di RR. Dapprima occorre
sottolineare entrambi possono assumere valori teorici compresi fra 0 e +infinito.
intuitivo che un valore =1 indica assenza di associazione tra malattia ed esposizione, in quanto
testimonia che:

per il rischio relativo: l'incidenza negli esposti uguale all'incidenza nei non esposti;

oppure

per l'odds ratio: l'odds di esposizione nei casi uguale all'odds di esposizione nei controlli.

Un valore <1 indica una associazione negativa (cio il fattore pu proteggere dalla malattia) mentre
un rapporto >1 indica l'esistenza di una associazione positiva (il fattore pu causare la malattia).
Pi i valori si discostano da 1, in un senso o nell'altro, pi l'associazione forte.

Ricordati per che, prima di dichiarare l'esistenza di un rapporto causa-effetto tra l'esposizione e la
malattia, devi eseguire un test di significativit statistica (per escludere che la differenza sia dovuta
al caso) e poi devi verificare i criteri di causalit.

A rigore, l'odds ratio non una autentica misura del rischio in quanto si riferisce alla probabilit di
avere gi una malattia, mentre nel termine "rischio" implicita l'idea di un evento che si verificher
in futuro. Tuttavia, se si suppone che la durata media della malattia negli esposti sia simile a quella
nei non-esposti (e che la malattia non influenzi lo stato di esposizione), allora l'odds ratio
rappresenta una buona misura del rischio relativo.

In sintesi, l'interpretazione dell'odds ratio o del rischio relativo viene effettuata in base allo schema
che segue:
130

In base al suddetto schema di interpretazione, l'associazione obesit-urolitiasi del cane (OR=2.19)


dell'esempio precedente da classificare poco pi che modesta. L'associazione fra allevamento al
chiuso dei vitelli e polmonite (RR=3.93) da ritenere discreta.

Rischio attribuibile

Un altro importante indice di una associazione, da utilizzare negli studi prospettivi, il rischio
attribuibile (RA), che indica la quantit di rischio supplementare da ascrivere al fattore
considerato. Esso corrisponde alla differenza fra (incidenza negli esposti) e (incidenza nei non
esposti); pertanto, rappresenta la quota di malati tra gli esposti che potrebbe essere evitata se
venisse completamente rimosso il fattore di rischio in esame.
Nell'esempio dei vitelli con polmonite, RA=0.38. Ci indica che rimuovendo il fattore "cattiva
ventilazione" ci si aspetta di osservare una diminuzione del 38% dell'incidenza della malattia
(ammesso che tale fattore sia l'unico responsabile della polmonite).

Attenzione a non confondere il rischio relativo con il rischio attribuibile. Le due misure hanno scopi diversi. Infatti, il
RR costituisce misura della forza della associazione tra il fattore di malattia e la malattia medesima, ed un indice
utilissimo sulla strada della dimostrazione che il fattore causa della malattia.
Il RA rappresenta invece una misura dell'impatto che il fattore in esame ha sulla popolazione in studio.

Foglio di calcolo per Microsoft Excel per il calcolo dell'odds ratio e del rischio relativo.
131

6. L'approccio
epidemiologico alle cause di malattia
6.10 Dimostrazione dell'esistenza di una correlazione dose-effetto: la regressione
lineare

OBIETTIVO:

apprendere come verificare l'esistenza di una correlazione fra due variabili; in particolare,
apprendere la base del procedimento logico, ed un metodo statistico idoneo.

Finora, nello studio delle cause di


malattia e del rischio, abbiamo preso in
considerazione esempi con dati
qualitativi. Infatti, abbiamo classificato
gli animali in 4 categorie in base alla
qualit del loro stato (ossia: malati/non
malati) ed in base alla qualit
dell'esposizione ad una presunta causa di
malattia (ossia: esposti/non esposti),
secondo una tabella 2x2 che ormai
dovrebbe essere ben nota (v. a lato).
Forse utile ripetere che le 4 categorie sono rappresentate da animali (a) esposti e ammalati; (b)
esposti e non ammalati; (c) non esposti e ammalati; (d) non esposti e non ammalati.

Un caso diverso: dati quantitativi

In molti casi, un tale approccio strettamente "qualitativo" rappresenta una limitazione dei dati
ottenibili in studi epidemiologici sulle cause di malattia. Basti pensare che, in molti casi, la
classificazione di un animale nella categoria "esposti" o in quella "non esposti" in larga misura
arbitraria e rappresenta, in una certa misura, una forzatura della realt.
Ad esempio, animali che hanno avuto un'unica, lieve e transitoria esposizione ad una presunta causa
potrebbero essere (indebitamente?) classificati come "esposti" ed essere assimilati ad altri animali
che, invece, hanno subto una esposizione intensa e prolungata nel tempo. Insomma: spesso
l'esposizione non un fenomeno tutto-o-niente, ma avviene secondo un gradiente misurabile.

Anche la classificazione nelle due classi "malati" e "non malati" talvolta non soddisfacente, in
quanto la stessa malattia pu manifestarsi con gravit molto variabile e con segni clinici misurabili
e rappresentabili numericamente.
Per riassumere: ci sono casi in cui sia l'esposizione che la malattia si misurano quantitativamente, e
tali misure sono esprimibili attraverso numeri.

ESEMPIO. Una partita di mangime contaminata da un fungo che produce una potente tossina
(micotossina) che provoca emolisi (distruzione dei globuli rossi), e quindi anemia. L'intensit della
esposizione potrebbe essere misurata attraverso la dose di micotossina ingerita/giorno; la gravit
della malattia essere misurata potrebbe essere misurata attraverso il conteggio degli eritrociti nel
sangue.
132

Ecco quindi sorgere la necessit di disporre di altri metodi di studio, diversi dalla "solita" tabella 2 x
2, per verificare l'esistenza di un rapporto causa-effetto quando i dati sono quantitativi.

Per rafforzare quanto finora esposto, ti ricordo che - sempre riguardo alla dimostrazione della
causalit - hai gi imparato un principio generale abbastanza intuitivo: "se fra fattore ed una
malattia si individua una correlazione dose-effetto, allora quel fattore pu essere una delle cause
della malattia" ( regole di John Stuart Mill). Infatti, ragionevole pensare che quanto pi intensa
la causa, tanto pi grave (o frequente) sar la malattia. Analogamente, uno dei cinque criteri di
causalit afferma che la forza di una associazione aumenta se si dimostra l'esistenza di una
correlazione dose-effetto. evidente che quando si parla di correlazione dose-effetto si parla di
dati quantitativi, per i quali necessario un approccio diverso da quello che hai imparato finora.

In questa Unit, attraverso un esempio, esaminerai uno dei metodi pi usati come per studiare e
descrivere una relazione quantitativa tra due variabili: la regressione lineare.

La regressione lineare serve per descrivere la relazione tra due variabili quantitative

Esempio. Effetto collaterale di un farmaco

Supponiamo di sospettare che, fra gli effetti indesiderati di un certo farmaco, si annoveri quello di
innalzare la pressione arteriosa.

Verifichiamo questa ipotesi attraverso un esperimento: somministriamo dosi crescenti del farmaco
ad alcuni ratti da esperimento, e misuriamo la variazione della pressione diastolica che si verifica
dopo la somministrazione.
In dettaglio, vengono utilizzati 16 ratti, suddivisi in 8 gruppi di 2 animali ciascuno. Il primo gruppo
di controllo e non viene trattato; al secondo gruppo il farmaco viene somministrato in dose di 1
mg/kg, al terzo gruppo in dose di 2 mg/kg e cos via. I risultati sono riassunti nella seguente tabella.

Osserva bene i dati della tabella: anche "a occhio" si nota che la variabile dipendente (ossia l'effetto:
innalzamento della pressione) correlata alla variabile indipendente (ossia la presunta causa: il
farmaco). In altre parole: l'entit dell'aumento della pressione sembra essere associata alla dose.

Esiste un modo per visualizzare graficamente l'andamento del fenomeno: basta utilizzare i dati delle
due variabili per costruire un diagramma a nuvola di punti (detto anche diagramma a dispersione, o
diagramma xy; in inglese: scatterplot): in un sistema di assi cartesiani si pone: asse x=variabile
indipendente e asse y=variabile dipendente. Con i dati dell'esempio, sull'asse x poniamo il farmaco
e sull'asse y la variazione della pressione, ottenendo il seguente diagramma:
133

Per interpretare un diagramma a dispersione occorre valutarne l'aspetto globale, che rivela (1) la
direzione, (2) la forma e (3) la forza della relazione che lega le due variabili. Vediamo brevemente
queste tre caratteristiche.

DIREZIONE. L'aspetto del Diagramma 1 dimostra l'esistenza di una associazione positiva. Infatti,
due variabili (ti ricordo che nell'esempio le variabili sono: x= la dose del farmaco, y= l'aumento
della pressione) si dicono associate positivamente quando i valori alti di una variabile tendono a
presentarsi insieme ai valori alti dell'altra variabile, ed analogamente i valori bassi dell'una tendono
a presentarsi insieme ai valori bassi dell'altra. Viceversa, due variabili sono associate negativamente
quando ai valori alti dell'una tendono ad associarsi valori bassi dell'altra variabile. Nei casi in cui le
variabili non sono associate, la direzione non pu essere individuata.

FORMA. La forma viene desunta dalla disposizione dei punti nel diagramma. Parleremo soltanto
della regressione lineare, ossia del caso in cui i punti si dispongono approssimativamente su una
linea retta. Esistono anche altri tipi di relazioni, non lineari e quindi pi complesse, ma le relazioni
lineari sono particolarmente importanti per un buon motivo: la linea retta quella su cui tende a
disporsi molto frequentemente il "pattern" dei punti ottenuti in molti studi biologici.
134

FORZA. La forza si pu desumere dal grado di disseminazione dei punti nel diagramma. Se i punti
sono molto disseminati, (ma sempre con tendenza a disporsi su una retta), la relazione tra le due
variabili debole; se invece i punti sono raggruppati attorno ad una retta, allora la relazione forte.
Anche l'inclinazione della retta importante: tanto pi la retta inclinata, quanto pi la relazione
forte.

Esiste un metodo per formalizzare direzione, forma e forza di una relazione lineare fra due variabili.
Questo metodo viene trattato nella prossima Unit.
135

6. L'approccio
epidemiologico alle cause di malattia
6.11 Il coefficiente di correlazione e la retta di regressione

OBIETTIVO:

apprendere come quantificare la correlazione fra due variabili qualitative attraverso il


coefficiente di regressione r

apprendere il metodo di costruzione della retta di regressione

apprendere il significato dell'equazione della retta e la sua interpretazione

Nella Unit precedente hai


appreso i principi di base sulla
regressione. In particolare, hai
imparato a desumere,
osservando "a occhio" un
diagramma a nuvola di punti,
tre caratteristiche importanti
che legano due variabili:
direzione, forma e forza.

Tuttavia, l'occhio umano non uno strumento adatto per misurare con precisione, osservando la
nuvola di punti, direzione, forma e forza di una relazione lineare. Abbiamo bisogno di una strategia
di analisi dei dati oggettiva, svincolata dal giudizio personale dell'osservatore e possibilmente che ci
fornisca una misura numerica. Questa misura detta correlazione, e contiene informazioni sulla
forza e sulla direzione di una relazione lineare tra due variabili. Per quanto riguarda la forma,
esistono senz'altro metodi adatti, che per sono troppo complessi per venire trattati qui.

La correlazione

Per indicare la correlazione si usa di solito la lettera "r". r viene detto "coefficiente di correlazione"
e si calcola con l'aiuto di un software statistico.
136

A rigore, il coefficiente di correlazione non dovrebbe essere utilizzato per due variabili legate da
una relazione causa-effetto; esso infatti descrive una semplice relazione tra due variabili.
Commettiamo una piccola inesattezza in omaggio alla semplificazione.
Nel caso della regressione, il coefficiente di correlazione viene talvolta detto coefficiente di
regressione.

Il coefficiente di correlazione r pu assumere valori compresi fra -1 e 1. I valori positivi indicano


l'esistenza di una correlazione lineare positiva; i valori negativi indicano una correlazione negativa;
il valore 0 indica assenza di correlazione.

Non possono essere date regole fisse per l'interpretazione del coefficiente di correlazione, che
dipende da una serie di considerazioni. Possiamo dire che in genere, nel settore biomedico ed in
epidemiologia, vengono considerati "buoni" valori attorno a 0.7 (nel caso di una correlazione
positiva) oppure a -0.7 (per una correlazione negativa).

Il coefficiente di correlazione ed il coefficiente di determinazione

Torniamo all'esempio dei ratti trattati con un farmaco nell'unit precedente. Per tua comodit, nella
figura sottostante sono riportati i dati ottenuti ed il grafico a dispersione:
137

Immettendo i dati ottenuti in un apposito software (va bene anche Excel), puoi calcolare il valore r,
che risulta pari a di 0.862:

Il valore r >0, e quindi la correlazione positiva; inoltre, il coefficiente assume un valore


abbastanza alto, e ci dimostra che la correlazione buona. In altri termini, le due variabili vanno di
pari passo, nel senso che quando aumenta il valore dell'una aumenta generalmente (e
proporzionalmente) anche il valore dell'altra. Ci significa che dal valore della variabile
indipendente pu essere approssimativamente desunto quello della variabile dipendente.

Una volta ottenuto r, possiamo calcolare r2 (r-quadrato), semplicemente elevando r al quadrato.


r2 viene detto anche coefficiente di determinazione ed un indice ricco di significato, in quanto
esprime la variabilit nella variabile dipendente spiegata dalla variabile indipendente. In parole pi
semplici, r2 rappresenta la variazione nei valori di y che pu essere giustificata dalla variazione di x.

Nel nostro caso, r2 pari a 0.743.

Perci, ammettendo che il farmaco sia causalmente legato alla variazione di pressione (ossia, pi
in generale, ammettendo che x sia causalmente legato a y), allora il 75% circa di tale variazione
giustificata dall'effetto del farmaco.

Ricorda che il coefficiente di correlazione r descrive soltanto l'esistenza di una correlazione, ma non
dimostra nulla riguardo alla causalit di tale associazione. Lo stesso dicasi per r2. Per dimostrare la
138

causalit dovranno essere sviluppati altri ragionamenti, come ad esempio quelli connessi alla
applicazione dei criteri di causalit.

La retta di regressione

Hai gi imparato che la regressione lineare si usa quando le variabili in studio hanno fra loro una
relazione lineare, e quindi i punti del diagramma a dispersione tendono a disporsi secondo una linea
retta. Hai anche utilizzato l'occhio come strumento per individuare (appunto "ad occhio e croce") la
retta corrispondente. Tuttavia, come gi
detto, l'occhio non un buono strumento a
questo scopo; entrano in gioco fattori
soggettivi, e a partire dallo stesso
diagramma ciascuno di noi potrebbe
individuare rette diverse rappresentative
della nuvola di punti. Ad esempio, nel
diagramma a sinistra, qual la retta
"giusta"?. Potremmo litigare a lungo senza
venirne a capo. Ecco quindi che serve un
sistema obiettivo e ben codificato che
consenta di tracciare la retta che meglio
rappresenta l'andamento della nuvola di
punti.

Essenzialmente, il principio su cui si basa


l'individuazione della retta di regressione
molto semplice. Infatti, ragionevole pensare
che la retta migliore quella che ha distanza
minore, sull'asse delle ordinate, da tutti i punti
del diagramma. Costruiamo, per ogni punto,
un quadrato che ha come lato la distanza
verticale (ordinata) del punto dalla retta (v.
figura a destra). Ripetiamo il procedimento per
ogni punto del diagramma e sommiano le aree
di tutti i quadrati. La retta che meglio
rappresenta la nuvola di punti quella che fa
registrare la minor superficie dei quadrati. Per questo motivo, il metodo ora descritto si chiama
"metodo dei minimi quadrati". Ovviamente questo procedimento non si fa pi "a mano", ma si
ricorre all'aiuto del calcolatore.

Infine, una volta trovata la retta di regressione, si pu trovare l'equazione della retta medesima. Dai
ricordi delle scuole superiori, sai che l'equazione di una retta ha la forma:

dove x e y sono le due variabili da correlare.


139

Anche in questo caso, per ricavare l'equazione partendo dai dati sperimentali si ricorre al
calcolatore, che con i dati del nostro esempio genera la seguente:

y= 1.13 + 1.63x

L'equazione rappresenta un sistema semplice e molto elegante per descrivere il fenomeno che hai
osservato; inoltre, rappresenta anche uno strumento per fare previsioni. Ad esempio, potresti
domandarti quale sar l'incremento di pressione somministrando 5.5 mg del farmaco. Basta
sostituire, nell'equazione, il valore x con 5.5. Ottieni:

y= 1.13 +(1.63 * 5.5) = 10.1

Usare cautela nel prevedere valori al di fuori del range dei dati sperimentali della variabile
indipendente. Nel tuo caso il range va da 0 a 7 mg, ma potresti essere tentato di utilizzare
l'equazione della retta per prevedere che, ad esempio, 30 mg del farmaco provocano un aumento di
pressione di 50 mm Hg... Un tale utilizzo della retta pu condurre a conclusioni poco affidabili e
quindi da evitare.

Lo schema che segue riassume tutti risultati che hai trovato a partire dai dati dell'esempio dell'Unit
precedente:

Puoi dedurre che:

esiste una correlazione fra la dose del farmaco e l'innalzamento della pressione diastolica;
la correlazione positiva (ad un aumento del farmaco corrisponde un aumento della pressione)
come dimostrato dal fatto che il coefficiente di correlazione r >0;
140

la correlazione abbastanza forte, come dimostrato (a) dal valore piuttosto elevato (0.862)
raggiunto da r e (b) dal valore piuttosto elevato (1.63) del parametro che determina la pendenza
della retta;
il 74% circa dell'innalzamento della pressione pu essere spiegato dal farmaco;
in assenza del farmaco, la variazione di pressione prossima a zero, come dimostrato dal valore
dell'intercetta.

L'esperimento che abbiamo simulato nell'esempio stato effettuato in laboratorio e quindi in


condizioni rigorosamente controllate, nel senso che non sono intervenute variabili estranee. Ad
esempio, sia i ratti di controllo (quelli che non hanno ricevuto il farmaco) che tutti gli altri erano
uguali per sesso, et peso ecc.; l'alimentazione era la stessa; le condizioni di allevamento erano
identiche ecc. Con i dati raccolti possiamo quindi concludere con ragionevole certezza che "il
farmaco provoca un aumento della pressione diastolica nel ratto, e questo aumento correlato alla
dose".

In altre situazioni, sarebbe stato opportuno, prima di concludere per un rapporto dose-effetto,
controllare la presenza di eventuali fattori di confondimento e poi verificare i criteri di
causalit.

Foglio di calcolo per Microsoft Excel per calcolare il coefficiente di correlazione e l'equazione
della retta.
141

7. Variabilit
biologica: concetti minimi
7.1 Variabilit biologica e distribuzione di frequenze

OBIETTIVO:

definire la variabilit biologica;

utilizzare la distribuzione delle frequenze e la distribuzione cumulativa delle frequenze per


riassumere i dati di misure biologiche;

confrontare l'esposizione dei dati in forma tabulare e in forma grafica.

Tutti i dati che derivano da osservazioni sperimentali e le misurazioni di qualsiasi grandezza fisica
comportano delle variazioni. Inoltre, poich la variabilit individuale una propriet intrinseca di
tutti gli esseri viventi, le misure biologiche, pi delle misure di altre grandezze fisiche, sono
soggette a inevitabili variazioni.
Queste variazioni, oltre a derivare dall'imprecisione dello strumento di misura di volta in volta
utilizzato, sono dovute alla diversit del parametro considerato fra individui ed anche, nell'ambito
dello stesso individuo, da un'occasione all'altra, da un osservatore all'altro ecc.

Tutti sanno che i valori della pressione arteriosa che cambiano da una persona all'altra e, nella
stessa persona, cambiano nel tempo a seconda dello stato emozionale ecc.

I motivi che rendono ogni individuo diverso da ogni altro sono praticamente infiniti. La genetica,
l'et il sesso, le condizioni di vita o di allevamento, l'alimentazione, il clima e un'infinit di altre
variabili esercitano tutte sull'individuo un effetto grande o piccolo. Ovviamente, alcune di queste
variabili sono pi importanti di altre; tuttavia, sempre la somma degli effetti di molte cause
diverse che rende ogni individuo diverso dall'altro. L'insieme di tutte queste variabili (o fattori o
cause) che interferiscono imprevedibilmente su un fenomeno prende il nome di caso.

Per i motivi ora esposti, la valutazione dei dati biologici necessita di tecniche statistiche utili ad
ovviare agli inconvenienti che potrebbero derivare dalla variabilit dei dati stessi. Prima di
esaminare i principi di base di alcune tecniche statistiche di comune impiego, utile una breve
introduzione sulle modalit di presentazione dei dati.

Come riassumere e presentare i dati

Supponiamo che tu sia in possesso di una serie di dati, rappresentati dalle altezze al garrese di 659
cani di razza Bracco italiano. In pratica, si tratta di una serie di 659 valori che hai immesso, uno
per ogni riga, in un foglio di calcolo come questo:
142

Come vedi, si tratta di un database molto semplice, con una sola variabile (l'altezza al garrese) che
stata collocata nella colonna A, mentre in ogni riga c' una osservazione. Avresti potuto disporre,
per ciascun animale, di osservazioni di altre variabili (es. sesso, et ecc.); allora, avresti dovuto
utilizzare altre colonne (sesso in colonna B, et in colonna C ecc.).
Se vuoi, puoi dare un'occhiata al foglio di calcolo con il database completo. Nota che si tratta di dati
fittizi (ossia generati a tavolino): Tuttavia questi dati sono abbastanza verosimili, in quanto
rispettano lo standarddi razza, che prevede una altezza da 55 a 67 cm.

evidente che i dati grezzi del database sono difficilmente interpretabili se non vengono
organizzati in qualche modo o sottoposti a elaborazioni. A questo scopo esiste una intera branca
della statistica, detta statistica descrittiva che aiuta appunto a descrivere i dati, e di cui qui
imparerai soltanto i principi di base.

Distribuzione di frequenze
Con questa denominazione si indica un sistema di raggruppamento di serie di dati in modo da poter
individuare facilmente quali valori sono pi frequenti e quali pi rari.
Nella Tabella che segue sono riportati i dati del database con l'altezza al garrese dei 659 esemplari
di cani Bracco italiano.
143

La forma tabulare facilmente comprensibile: nella colonna di sinistra sono indicate le classi
utilizzate per raggruppare i dati riguardanti l'altezza del campione di cani. Nell'esempio ogni classe
ha ampiezza di 1 cm. La seconda colonna la colonna delle frequenze, in cui viene presentato il
numero di osservazioni (cio di animali) che rientra nella corrispondente classe. Quindi, le prime
due colonne contengono, da sole, tutti i dati derivanti dalle misurazioni effettuate.

Nell'esempio che ti sto proponendo, ho suddiviso tutte le osservazioni in 17 classi di ampiezza 1


cm. Parlando in generale, il numero di classi in cui suddividere i dati dipende da molti fattori (es.
numero di osservazioni, distanza fra il fato minimo e quello massimo ecc.). Per motivi di praticit e
di facilit di interpretazione, consigliabile che la distribuzione delle frequenze preveda un numero
di classi compreso fra 5 e 20 circa.

Dividendo il numero di osservazioni di ciascuna classe per il numero totale di osservazioni (nel
nostro caso: 659) e moltiplicando il risultato per 100, otteniamo la frequenza percentuale, riportata
nella terza colonna.

Ad esempio, il valore 0.6 presente nella prima riga della terza colonna stato ottenuto come segue:
4/659*100. Il valore successivo (1.1) deriva da: 7/659*100, e cos via.

La frequenza percentuale una frequenza relativa standardizzata. Rispetto alla frequenza assoluta
della seconda colonna, la frequenza percentuale offre il vantaggio di facilitare il confronto con altri
dati derivanti da altre indagini o da altre casistiche nelle quali stato esaminato un diverso numero
di animali.
Nell'ultima colonna vengono riportate le percentuali cumulative; queste si ottengono, per ogni
144

classe, sommando la frequenza percentuale di quella stessa classe con tutte classi che la precedono.
Questo tipo di espressione dei dati utile per valutazioni quantitative di ogni classe di frequenza.
Ad esempio, possiamo rilevare che il 68% circa dei nostri ipotetici bracchi pi basso di 62 cm. In
quest'ultima affermazione insito il concetto di percentile (o centile) (vedi Unit
successiva).

Le distribuzioni di frequenze possono essere rappresentate anche in forma grafica; una delle forme
di espressione pi utilizzate a questo scopo l'istogramma. E' evidente che la presentazione dei dati
in forma grafica (vedi sotto) molto pi accattivante e immediata; nell'esempio si pu osservare
come la distribuzione dei dati segua un andamento particolare, in quanto le barre disegnano una
sorta di 'campana' approssimativamente simmetrica attorno alla classe di maggiore frequenza.
Quest'ultima, che nell'esempio corrisponde alla classe 61.00-61.99 cm (con valore centrale 61.5),
viene detta moda. La curva a campana, tipica di molti fenomeni biologici, viene detta curva di
distribuzione Normale o gaussiana.

L'istogramma diverso dal diagramma a barre (vedi sotto), anche se ad una prima occhiata i due
tipi di grafico sembrano uguali.
L'istogramma si usa per rappresentare dati di tipo continuo, ossia che possono assumere un qualsiasi
valore entro un certo intervallo. Il peso e l'altezza sono esempi di dati continui. Nell'istogramma le
barre devono essere contigue, per rappresentare la continuit delle misure effettuate.
Il diagramma a barre si usa invece per rappresentare dati di tipo nominale (ad esempio il colore del
mantello). Nel diagramma a barre consigliabile che le barre siano separate da spazi.
145
146

7. Variabilit
biologica: concetti minimi
7.7 Frequenze cumulative, mediana e centili

OBIETTIVO:

rinfrescare la nozione di "mediana" quartili e centili

apprendere un metodo di calcolo della mediana e dei quartili.

Il grafico sottostante comprende un tracciato della distribuzione cumulativa delle frequenze dei dati
esposti nella precedente unit. Questo tracciato utile per determinare graficamente i centili (o
percentili) di una distribuzione.

La curva stata costruita utilizzando un sistema di assi cartesiani in cui sull'asse delle ascisse sono
state riportate le classi di frequenza e sull'asse delle ordinate le percentuali cumulative. Quindi,
nel quadrante sono stati individuati i punti corrispondenti ad ogni classe di frequenza; questi punti
sono stati infine uniti tra loro da una linea, che rappresenta appunto il tracciato della distribuzione
cumulativa delle frequenze.
Per mezzo di questo grafico si possono calcolare in modo approssimativo i percentili (o centili)
come segue: sull'asse delle ordinate devi scegliere il punto corrispondente alla precentuale
desiderata. Ad esempio, il valore che divide il 10% delle osservazioni (nel grafico corrisponde a
circa 57 cm) detto decimo centile, e cos via.
147

Poich i percentili pi utili e comunemente usati sono il 25, il 50 ed il 75, nel grafico sono stati
evidenziati sull'asse delle ordinate i punti corrispondenti a 25%, 50% e 75%. Da questi punti stata
tracciata una linea orizzontale fino ad intersecare il tracciato e poi dal punto di intersezione stata
abbassata una perpendicolare all'asse delle x. In questo modo, sono stati individuati graficamente (e
con una certa approssimazione) in ascissa i percentili prescelti. (ovviamente i percentili si possono
calcolare con precisione con metodi statistici).

Nell'esempio illustrato nel grafico, il 25 percentile corrisponde a 58.8 cm circa, il 50 a poco meno
di 61 cm ed il 75 a 63.3 cm circa. Ci significa che il 25% dei nostri bracchi era pi basso di 58.8
cm, il 50% era pi basso di 61 cm ecc. Significa anche che, dato un bracco di altezza A, possiamo
calcolare come esso si colloca nella popolazione da cui deriva. Per esempio, il 90% dei bracchi
pi basso di 65 cm, e quindi un cane alto 65 cm cadr nel "90esimo percentile".
Il 25 percentile detto anche "primo quartile" in quanto raccoglie il primo quarto della
popolazione; analogamente, il 75 percentile detto anche "terzo quartile".
Il 50 percentile, detto anche mediana, un indice di tendenza centrale fra i pi importanti, e la sua
applicazione pratica verr accennata in seguito.

Se i dati sono ordinati in senso crescente (o decrescente), calcolare la mediana molto facile.
Infatti, tenendo presente che la mediana quel valore che lascia alla sua sinistra e alla sua destra un
numero uguale di unit, allora:

con un n. dispari di osservazioni la mediana il valore centrale;


con un n. pari di osservazioni la mediana la media dei due valori centrali.

Usando lo stesso sistema si possono calcolare anche i quartili ed i centili. Come gi detto, i quartili
sono i 3 valori che separano i dati in 4 gruppi di uguale grandezza, e cio il 25esimo, il 50esimo ed
il 75esimo percentile. La differenza tra il 25 ed il 75 percentile comprende il 50% centrale delle
osservazioni ed chiamata distanza interquartile.

ESEMPIO. Con i seguenti 10 dati:


2, 2, 3, 4, 5, 6, 7, 7, 7, 9
la mediana 5.5, il primo quartile 2.5 ed il terzo quartile 7. La distanza interquartile 4.5.

Un buon sistema per rappresentare graficamente i dati la cosiddetta "Tecnica dei 5 numeri" o "Box
and wiskers plot" (letteralmente: diagramma a scatola e baffi), in cui la "scatola" comprende la
mediana ed delimitata dal 25 e dal 75 percentile, mentre i "baffi" limitano i valori minimo e
massimo. Nel diagramma sottostante vengono rappresentati i dati riguardanti l'altezza del bracchi
della unit precedente.
148

Dal diagramma salta all'occhio che la distribuzione della popolazione simmetrica: infatti la parte
del box a destra della mediana ed il suo wisker sono molto simili a quelli della parte sinistra. Prova
a confrontare questo diagramma con il seguente, che rappresenta le altezze ottenute misurando una
popolazione di cani razza Segugio italiano a pelo forte.

Si osserva che i valori minimi e massimi (ossia i wisker di sinistra e di destra) sono diminuiti entrambi, e che la distanza
fra i wisker pi piccola; anche la dimensione del box ridotta, mentre la distribuzione rimasta simmetrica. A colpo
d'occhio si pu dedurre che i segugi sono pi piccoli dei bracchi, e che la loro altezza pi uniforme.

Facciamo un altro esempio di confronto fra due popolazioni, sempre utilizzando il box and wisker plot. Immagina di
confrontare la popolazione di bracchi gi vista con un'altra ipotetica popolazione di cani della stessa razza. Ottieni i plot
sottostanti, dai quali si deduce che la seconda popolazione (colore viola) , nel complesso, pi piccola della precedente
e che in essa sono presenti pochi individui di taglia molto grande. aumentata anche la distanza tra il 25 ed il 75
percentile (il box pi grande), e quindi vi pi dispersione fra le altezze comprese nel 50% centrale delle
osservazioni.
149

7. Variabilit
biologica: concetti minimi
7.3 Variabilit biologica: indici di tendenza centrale

OBIETTIVO:

definire i principali indici di tendenza centrale (media, moda, mediana)

Quando i dati riportati in una tabella statistica o in una distribuzione di frequenze sono molto
numerosi, il loro uso e la loro interpretazione sono difficili. Nel caso di caratteri con modalit
quantitative (cio "misurabili" e non semplicemente qualitativi come, ad esempio, i caratteri
pari/dispari, bianco/nero, acceso/spento ecc.), possibile calcolare dei valori singoli (o indici)
rappresentativi dell'intera tabella e che riassumono i caratteri principali dei dati stessi.
In particolare, sono utilizzati spesso i cosiddetti indici di tendenza centrale, cos denominati
perch individuano il centro della distribuzione delle frequenze.

La media, la moda e la mediana sono i 3 principali indici di tendenza centrale, e vengono definiti
come segue:

media aritmetica: quel numero che, sostituito ad ognuno degli elementi dell'insieme di partenza,
ne conserva inalterata la somma. La media si calcola facilmente dividendo la somma di tutti i valori
per il numero di osservazioni;
moda: il dato che presenta la maggior frequenza. Il termine ha una forte affinit con quello usato
nel linguaggio comune, nel quale si dice, per esempio, che un oggetto "di moda" quando usato
dalla maggioranza di un gruppo di persone;
150

mediana: il valore che occupa il posto centrale in una successione di dati ordinati in modo non
decrescente.

La moda l'unico indice di tendenza centrale che pu essere utilizzato con dati di tipo qualitativo.
151

7. Variabilit
biologica: concetti minimi
7.4 Indici di tendenza centrale per distribuzioni simmetriche e deformate

OBIETTIVO:

mettere a confronto l'aspetto di una distribuzione Normale (gaussiana) e di una non-Normale


(asimmetrica)

Riportando in un sistema di assi cartesiani i risultati di misurazioni di caratteri biologici (es. numero
di eritrociti/mm3, et al primo parto, durata della gestazione ecc.) effettuati su una serie di individui
diversi, si ottiene spesso una curva particolare con una forma a campana, simile a quella rossa del
Grafico 1.
Questo tipo di curva ha un solo picco, che corrisponde alla classe di massima frequenza o moda;
si tratta quindi di una curva unimodale), che viene detta curva gaussiana o cruva Normale.
Essa simmetrica, nel senso che si pu dividere in due parti, specularmente uguali, tracciando una
linea verticale in corrispondenza del valore di massima frequenza.
Questa curva ha molte propriet interessanti, alcune delle quali verranno accennate in una
prossima unit. In particolare, importante ricordare che nelle distribuzioni Normali la moda, la
media e la mediana assumono lo stesso valore.

Non sempre i dati sperimentali danno origine a curve simmetriche; talvolta possono essere generate
curve pi o meno asimmetriche (eventualmente con andamento bimodale o trimodale ecc.). Fra le
152

curve asimmetriche, una di quelle pi tipiche originata da misurazioni biologiche assume un


andamento simile alla curva blu del sovrastante grafico (o un andamento ad essa speculare).
L'asimmetria in questo caso riguarda la parte destra della distribuzione e, quindi, la curva si dice
deformata positivamente o a deformazione positiva, in quanto la coda pi prolungata in
direzione positiva. Una curva con aspetto speculare sarebbe detta deformata negativamente o
a deformazione negativa.

Molti parametri ematologici hanno una


distribuzione pressoch Normale.

Tuttavia, alcuni di essi mostrano,


nell'uomo, una distribuzione con coda
deformata positivamente (es. fosfatasi
alcalina).
Altri test evidenziano, invece, una coda
verso sinistra e quindi la distribuzione
asimmetrica e deformata verso i valori
negativi.

Nella figura a lato viene mostrata la


frequenza delle distribuzioni della
concentrazione di emoglobina nel sangue umano: si tratta di un buon esempio di distribuzione
asimmetrica deformata negativamente.

Un esempio di deformazione asimmetrica, con coda deformata positivamente, viene fornito dal
seguente grafico a barre, che mostra la distribuzione del numero di vacche adulte negli allevamenti
di bovine da latte in Norvegia [da Paisley et al., Prev. Vet. Med. 44, 141-151, 2000].

importante notare che, nelle distribuzioni asimmetriche, moda, media e mediana non
coincidono, ma assumono la disposizione indicata nel grafico 1 dove, come si vede, la media
l'indice che pi viene influenzato dall'esistenza di dati estremi.
153

7. Variabilit
biologica: concetti minimi
7.5 Indici di tendenza centrale: caratteristiche

OBIETTIVO:

riassumere le caratteristiche degli indici di tendenza centrale ed individuarne pregi e difetti


salienti

Nella Tavola che segue sono riassunte le caratteristiche principali degli indici di tendenza centrale.

La media certamente l'indice pi utilizzato, sia in ambito scientifico che nelle necessit della vita
comune. Esso ha il vantaggio di essere adatta a manipolazioni matematiche (e statistiche); il
principale difetto dovuto al fatto che la media assume significato soltanto quando si riferisce a
distribuzioni di frequenze con andamento Normale (gaussiano). In caso contrario, essa
fortemente influenzata dai dati estremi e quindi non rappresenta pi adeguatamente la centralit.

La mediana (o 50 percentile) , al contrario della media, poco influenzata dall'esistenza di valori


insolitamente estremi (cio molto superiori o inferiori a quelli degli altri dati), ma presenta lo
svantaggio di non essere adatta a manipolazioni matematiche.
154

La moda, infine, ha il vantaggio di avere un significato facilmente intuibile; tuttavia essa non pu
essere utilizzata nel caso di distribuzioni
bi- o pluri-modali.

ESEMPIO. Non raro riscontrare ceppi


batterici che manifestano una
distribuzione bimodale riguardo alla
sensibilit ad alcuni antibiotici. Nel
grafico a lato viene mostrato un esempio
della distribuzione di un campione di
ceppi di un batterio Gram negativo
(Escherichia coli) che sono stati messi a
contatto con l'antibiotico ampicillina.
Nell'asse delle ascisse riportata la
concentrazione dell'antibiotico, nell'asse
delle ordinate la frequenza percentuale
di ceppi sensibili.
Nota che i ceppi batterici esaminati possono essere suddivisi in due sottopopolazioni: una che
sensibile ad una concentrazione di antibiotico di 64 mcg/ml, l'altra che sensibile a 2 mcg/ml.
L'andamento della distribuzione , appunto, bimodale.
155

7. Variabilit
biologica: concetti minimi
7.6 Variabilit biologica: indici di variazione (o di dispersione)

OBIETTIVO:

definire alcuni indici di variazione (o indici di dispersione) e fra essi, in particolare, la deviazione
standard

gi stato accennato ad alcune caratteristiche dei pi comuni indici di tendenza centrale (media,
moda, mediana).

Oltre alla tendenza centrale, spesso auspicabile individuare l'entit delle variazioni presenti in
una serie di dati. Esistono numerosi indici utilizzabili come misure di variabilit. Quelli di pi
comune impiego sono: l'intervallo di variazione, i percentili, la deviazione standard.

Intervallo di variazione

L'intervallo di variazione si ottiene semplicemente calcolando la differenza fra il dato pi alto e


quello pi basso (tale differenza viene detta campo di variazione o range), oppure specificando il
valore del dato pi alto e quello del dato pi basso. L'intervallo di variazione non considera la
variabilit delle osservazioni fra i due estremi ed ha lo svantaggio di dipendere strettamente dal
numero di osservazioni e di aumentare con l'aumentare di esse.

Esempio. La misurazione dell'altezza al garrese di 8 bracchi italiani ha fornito i seguenti valori (in
cm):
54, 57, 57, 58, 59, 60, 60, 61, 66.
L'intervallo di variazione di 66-54 = 12 cm.
156

Percentili

Un altro modo di esprimere le variazioni quello di calcolare i percentili; in particolare, la


dichiarazione del 25, 50 e 75 percentile un buon sistema per quantificare la variabilit di dati
che non hanno una distribuzione Normale.
I percentili sono gi considerati dettagliatamente in una precedente unit.

Deviazione standard

Molto spesso, negli studi bio-medici, i dati vengono riassunti attraverso il pi comune indice di
tendenza centrale: la media. In questo caso, per descrivere compiutamente la popolazione,
sempre necessario dichiarare anche, come indice di variazione, il valore della deviazione standard.
La deviazione standard (o scarto quadratico medio) rappresenta la distanza media dei dati dalla
loro media. Essa si indica con il simbolo (leggi: sigma, ossia la lettera sigma minuscola
dell'alfabeto greco) se ci si riferisce alla deviazione standard di una popolazione, oppure con la
lettera s se si indica quella di un campione.
La deviazione standard un ottimo indice di variazione dei dati quando essi sono distribuiti
normalmente e rappresenta probabilmente l'indice di variazione usato pi comunemente. Tuttavia
bene ripetere ancora una volta che esso deve essere utilizzato soltanto quando i dati hanno una
distribuzione normale.
La deviazione standard si calcola facendo la radice quadrata della varianza (vedi l'Appendice in
questa stessa Unit).

Il fatto che la sola media sia insufficiente per descrivere esaurientemente un


campione o una popolazione pu essere dimostrato con un semplice esempio.
Supponiamo di misurare lo stesso carattere (ad esempio la lunghezza in cm) in
due campioni di pesci ornamentali contenuti in due diverse vasche, e di
ottenere i seguenti dati:
CAMP.A: 2, 3, 4, 5, 6, 7, 8, 9, 10 (media=6; s=2.6)
CAMP.B: 5, 6, 6, 6, 6, 6, 6, 6, 7 (media=6; s=0.4)
Evidentemente i due campioni sono molto diversi l'uno dall'altro, ma la media assume lo stesso
valore per entrambi. Se presentassimo i dati affermando, ad esempio, che "i due campioni hanno la
stessa media" potremmo generare la falsa impressione che i due campioni sono molto simili fra
loro.
Il modo corretto di presentare i dati prevede invece di dichiarare che " in CAMP.A la media pari a
6 con deviazione standard di 2.6, e in CAMP.B la media 6.0 con deviazione standard 0.4".
Per esprimersi pi brevemente: CAMP.A: 6.02.6, CAMP.B 6.00.4.
157

Notare che in questo modo si fornisce l'indicazione del fatto che CAMP.B era molto omogeneo,
contrariamente a CAMP.A.

A questo punto potresti chiederti se, per riassumere le caratteristiche di una serie di dati, meglio
utilizzare media e deviazione standard oppure mediana e percentili.. La risposta molto semplice ed
riassunta nello schema che segue.

Appendice: calcolo della deviazione standard

La formula serve a calcolare la deviazione standard di una serie di misure. La devianza la


somma dei quadrati delle deviazioni dei valori individuali dalla loro media aritmetica (m), mentre i
gradi di libert sono il numero di osservazioni (n) di cui composto il campione, meno 1 (cio:
gradi libert = n-1).
158

Supponiamo di avere il seguente campione, di cui vogliamo


calcolare media e deviazione standard:
19, 21, 24, 21, 17.

valore
individuale x
--------------
19
21
24
21
17
-------------
somma = 102
media = 102/5 = 20.4

Ora calcoliamo la differenza di ogni valore individuale dalla


media, cio il valore (x-m) detto anche scarto o
deviazione, e quindi eleviamo al quadrato gli scarti e sommiamo
tali quadrati

valore
individuale x scarto scarto quadr.
--------------
19 19-20.4 = -1.4 1.96
21 21-20.4 = 0.6 0.36
24 24-20.4 = 3.6 12.96
21 21-20.4 = 0.6 0.36
17 17-20.4 = -3.4 11.56
-----
27.20

La devianza 27.20. I gradi di libert sono n-1, cio 4.


Dividiamo la devianza per 4:

27.2 / 4 = 6.8 e ed estraiamo la radice quadrata

Radice quadrata di 6.8 = 2.61, che la deviazione standard


della serie di dati.

Nel calcolo della varianza perch dividere per n-1 anzich per n?
La risposta a questa domanda non semplice; esiste senz'altro una spiegazione teorica della
formula, che per troppo complicata per i nostri scopi. Baster sottolineare che la statistica
sanitaria e biologica spesso si basa su un numero di osservazioni piuttosto piccolo; ci consiglia di
ottenere una particolare affidabilit dei risultati. Dividendo per n-1 si ottiene una varianza (e quindi
una deviazione standard) lievemente superiore rispetto a quanto si otterrebbe dividendo
semplicemente per n. Una deviazione standard un po' pi elevata rappresenta un approccio
"conservativo" all'analisi dei dati, nel senso che la dispersione potr forse essere sovrastimata, ma
non si cadr mai nell'errore opposto. Ci particolarmente importante quando i dati vengono
utilizzati per eseguire un processo di inferenza.

.
159

7. Variabilit biologica: concetti minimi


7.7 Indici di variazione: caratteristiche

OBIETTIVO:

precisare le caratteristiche di base (con pregi e difetti) di 3 indici di variazione

Nella figura che segue sono riassunti schematicamente pregi e difetti dei 3 indici di variazione che
hai conosciuto nelle Unit prededenti.

Il range o intervallo di variazione rappresentato dalla distanza fra il dato con il valore minimo e
quello con il valore massimo. Presenta l'inconveniente di essere influenzato dai valori estremi; in
effetti, basta un solo valore eccezionalmente al di sopra (o al di sotto) degli altri dati per far
aumentare il range. Inoltre, esso non agevolmente utilizzabile nel calcolo statistico.

La deviazione standard ha il pregio di entrare nel calcolo di ulteriori manipolazioni matematico-


statistiche da effettuare sui dati, ma dovrebbe essere utilizzata soltanto se i dati stessi hanno una
distribuzione Normale.
160

I percentili sono validi sia per distribuzioni Normali (si ricorda che, in tal caso, il 50 percentile
uguale alla media) che non Normali. Ti ricordo che, al fine di fornire un'idea della variabilit dei
dati, bene indicare sempre non soltanto il 50 percentile (ossia la mediana) ma anche - ed almeno -
il 25 ed il 75 percentile. I percentili hanno l'inconveniente di non essere utilizzabili per ulteriori
manipolazioni statistiche.
161

7. Variabilit
biologica: concetti minimi
7.8 Variabilit biologica, deviazione standard e normalit

OBIETTIVO:

Giustificare ed analizzare criticamente l'utilizzo della media la deviazione standard per stabilire
il range di normalit

gi stato detto che fonti di variazione sono presenti in ogni misurazione di un carattere biologico.
Tale variabilit non tuttavia del tutto imprevedibile: infatti, molti fenomeni naturali seguono un
modello teorico definito curva di distribuzione Normale o gaussiana.

Questo modello ha una propriet estremamente interessante. Infatti, in presenza di dati a


distribuzione normale, si pu risalire ai caratteri della popolazione che ha generato i suddetti dati
conoscendo soltanto media e deviazione standard. Questa affermazione, che magari a prima vista ti
sembra poco importante, invece di grande valore, in quanto possiamo dimostrare che, in una
gaussiana, il 95% dei dati cade nell'intervallo media 1.96 volte la deviazione standard:

Ampliando il discorso, si pu dimostrare, ad esempio, che:


- l'intervallo [media 2.57 volte la deviazione standard] comprende il 99% dei dati
- l'intervallo [media 1.00 volte la deviazione standard] comprende il 68% circa dei dati
come illustrato nella figura che segue.
162

Parlando pi in generale, si pu dimostrare che:


- l'intervallo [media zvolte la deviazione standard] comprende il X% dei dati, dove i valori z e X
vengono ricavati da apposite tabelle.

Quanto detto finora utile per trovare la risposta ad una frequente domanda che sorge spontanea
quando si effettua una misura di un carattere biologico su uno (o pi) individui. La domanda

il valore osservato deve essere considerato normale?

ESEMPI. Sono stati ottenuti i seguenti valori. Possono essere considerati "normali"?
- 240 pulsazioni cardiache/minuto in un pappagallino ondulato;
- 150.000 linfociti per mm cubo nel sangue di un bovino;
- 45 atti respiratori/minuto in un cane boxer adulto.

In pratica, per rispondere devi gi conoscere quelli che sono ritenuti i valori normali oppure, se
non li ricordi, devi consultare qualche apposita tabella.

Tutti sanno che il numero normale di globuli rossi nell'uonmo maschio compreso fra 4.8 e 5.6
milioni per mm cubo.

A questo punto una buona domanda la seguente; come sono stati stabiliti i valori normali? La
definizione dei limiti della normalit un processo complicato. A motivo dalla variabilit biologica,
teoricamente qualsiasi valore potrebbe essere normale. La complessit del problema, anzi
l'impossibilit a risolverlo in maniera definitiva, dimostrata indirettamente dal fatto che sono stati
proposti diversi criteri per stabilire la normalit, e che nessuno di essi immune da critiche.
Tuttavia il criterio che va per la maggiore il seguente:
163

Come abbiamo gi detto, spesso in biologia si osservano distribuzioni Normali; perci in base alla
propriet della curva di distribuzione Normale, i limiti della normalit si ottengono con
l'espressione [media 1.96 deviazioni standard].
Nel caso in cui la distribuzione sia asimmetrica, pur valendo sempre il principio del 2.5 e 97.5
percentile, il range di normalit non potr essere calcolato semplicemente come [media 1.96
dev.st.], ma dovr essere accertato in altro modo (ad esempio individuando i percentili in un
tracciato cumulativo di frequenze).

Una semplice critica che si pu avanzare riguardo alla definizione di normalit ora esposta la
seguente: se vengono considerati anormali tutti gli individui che si trovano al di sotto del 2.5
percentile ed al di sopra del 97.5 percentile, allora la prevalenza (ossia la frequenza) di ogni
malattia dovrebbe essere esattamente pari al 5%; cio, in una popolazione sar sempre ammalato il
5% degli individui. Ci evidentemente non compatibile con il comune modo di intendere la
frequenza di una malattia.
Attenzione, una critica alla critica: nell'obiezione ora esposta si assume (erroneamente!!!) che
anormale sia sinonimo di ammalato.
164

8. Probabilit
8.1 Probabilit: definizione ed eventi complessi

OBIETTIVO:

definire il concetto di probabilit e calcolare la probabilit di eventi complessi

La maggior parte dei fenomeni che interessano la medicina soggetta a variazioni casuali: ad
esempio, il fattore di rischio (o determinante) R pu indurre la malattia M1 oppure la malattia M2
oppure nessuna malattia. Pertanto, impossibile stabilire una relazione se R allora M1; bisogna
invece affermare se R, allora probabile M1.

Il caso interviene in due tempi nelle osservazioni che si effettuano su una popolazione. Esso infatti
dapprima responsabile della variabilit fra gli individui (nessun individuo uguale a nessun altro);
in un secondo tempo, il caso agisce nuovamente quando si selezionano, per un determinato studio,
alcune osservazioni dalla massa delle possibili osservazioni (cio si esamina un campione).

Anche se l'effetto del caso si manifesta con una estrema complessit, il caso obbedisce tuttavia a
leggi piuttosto semplici. La conoscenza di queste leggi pone il ricercatore in una condizione di
superiorit rispetto all'osservatore empirico; in particolare, la conoscenza delle leggi del caso
consente di valutare i fenomeni in base alla loro probabilit.

Uno di punti di forza dell'epidemiologia la capacit di fare previsioni. Per esempio, spesso si
definisce il rischio relativo, cio il rischio di contrarre malattia di animali con un determinato
fattore (razza, o tipo di allevamento ecc.) rispetto al rischio corso da un gruppo di controllo non
soggetto a quello stesso fattore. Pi in generale, si pu affermare che una delle pi importanti
attivit di un epidemiologo quella di calcolare la probabilit che si verifichi l'evento-malattia (o
pi in generale: un qualsiasi evento) in rapporto a particolari situazioni o fattori.

ESEMPI.
in corso una epidemia di una data malattia. Che probabilit c' che un allevamento venga
coinvolto?
Un allevatore ha acquistato un animale proveniente da un allevamento in cui presente una certa
malattia. Che probabilit c' che l'animale sia affetto da quella malattia?
Stai trattando un gatto con una data terapia. Che probabilit c' che il gatto guarisca? Che
probabilit c' che il gatto muoia?
Una bovina risultata positiva ad un test per la diagnosi della tubercolosi. Che probabilit c' che
il test "dica la verit", ossia che quella bovina sia veramente ammalata?
Un cane affetto da displasia dell'anca. Che probabilit c' che riacquisti la completa funzionalit
dopo l'intervento operatorio?

La probabilit di un evento non altro che l'espressione quantitativa della frequenza con cui esso
si verifica.
Pi propriamente, bene parlare di frequenza relativa: infatti la probabilit (Pr) che si verifichi
un evento aleatorio A data dal rapporto tra il numero di casi favorevoli (quelli in cui A si verifica)
ed il numero di casi possibili (cio il numero di volte che A pu verificarsi). Da un punto di vista
strettamente statistico, la probabilit viene definita come la frequenza relativa di un evento, i cui
valori sono compresi nell'intervallo [0;1] ove 0 indica un evento impossibile e 1 un evento certo.
165

ESEMPIO 1. Lanciando una moneta l'evento testa si verifica una volta ogni due lanci, quindi la
probabilit di tale evento 1/2, cio 0.5.

ESEMPIO 2. Qual la probabilit che una carta da gioco estratta a caso da un mazzo di 52 sia un
asso? Poich nel mazzo vi sono 4 assi, la probabilit di 4/52. In questo il numero di casi
favorevoli pari a 4 (asso di cuori, quadri, fiori, picche), mentre ognuna delle 52 carte del mazzo
rappresenta un potenziale evento favorevole.

ESEMPIO 3. Supponiamo che in un episodio di avvelenamento da esteri fosforici in un allevamento


di bovini si siano verificati 48 casi su un totale di 192 animali alimentati con il mangime
contaminato. La probabilit di ammalare per un bovino scelto a caso stata pertanto: 48/192 = 0.25
ovvero 25%.
Notare che, diversamente dai due esempi precedenti, in questo caso si tratta di una probabilit a
posteriori, cio valutata su un evento gi accaduto.

Dagli esempi si nota che la probabilit pu venire espressa attraverso una frazione, un numero
decimale o una percentuale. Il numero decimale assume sempre un valore compreso fra 1 (quando
l'evento si verifica sempre, e quindi il numeratore uguale al denominatore) e 0 (quando l'evento
non si verifica mai, e quindi il numeratore uguale a 0).

intuitivo che:
166

Questo concetto ti sar molto utile nel prossimo Capitolo, in cui imparerai le basi del Campionamento.

Ad esempio, se il 75% dei ceppi di Enterococcus resistente alla tetraciclina, allora avremo una probabilit pari a 0.75 (75%) che un ceppo di
Enterococcus preso a caso sia resistente.

In alcuni casi necessario calcolare la probabilit di eventi complessi, definiti come combinazioni specifiche (A e B) oppure alternative specifiche (A
o B). Le regole che permettono di affrontare i pi semplici problemi di probabilit di eventi complessi sono enunciate nella prossima unit.

Foglio di calcolo per Microsoft Excel con una simulazione dei risultati (testa/croce) ottenibili
lanciando una moneta.
167

8. Probabilit
8.2 Probabilit di eventi complessi

OBIETTIVO:

enunciare la regola dell'addizione e la regola della moltiplicazione, che si applicano alla


probabilit di eventi complessi

Vi sono situazioni in cui occorre valutare la probabilit di eventi che si esprimono come
combinazioni specifiche (es. evento A e evento B) oppure come alternative specifiche (es. eventi A
o evento B). In questi casi si parla di "eventi complessi".

Gli eventi complessi si gestiscono attraverso due regole di base

la regola della moltiplicazione


la regola della addizione

Regola della moltiplicazione

La regola della moltiplicazione si applica ad una combinazione di eventi; essa stabilisce che la
probabilit (Pr) che si verifichino contemporaneamente l'evento A e l'evento B equivale al prodotto
delle probabilit di ciascun evento:

Pr(A e B) = Pr(A)* Pr(B)


ed anche

Pr(A e B e C) = Pr(A) * Pr(B) * Pr(C)

e cos via.

Questa regola vale soltanto se A e B sono indipendenti, cio nel caso in cui il verificarsi di A non
influenzi il verificarsi di B e viceversa.
168

ESEMPIO. Supponi di studiare la resistenza dei batteri agli antibiotici. In particolare, hai osservato
che il 70% dei ceppi di Enterococcus resistente alla tetraciclina ed il 30% alla ciprofloxacina. Si
tratta di due antibiotici appartenenti a classi diverse ed a diverso meccanismo d'azione, e quindi
probabilmente le resistenze sono indipendenti. Preso a caso un ceppo di Enterococcus, c'
probabilit 0.7 che esso sia resistente alla tetraciclina, 0.3 che sia resistente alla ciprofloxacina. La
probabilit che il ceppo sia resistente contemporaneamente a tetraciclina e ciprofloxacina
0.7x0.3=0.21, ossia 21%.

Regola della addizione

La regola dell'addizione si applica, invece, ad una alternativa di eventi; essa stabilisce che la
probabilit che si verifichi A oppure B oppure entrambi equivale alla somma delle probabilit dei
singoli eventi. E' necessario per considerare se i due eventi si escludono reciprocamente (ossia il
verificarsi di uno inibisce la possibilit del verificarsi dell'altro) oppure no.

Se si lancia un dado, gli eventi "ottenimento di un 2" e "ottenimento di un 3" si escludono


reciprocamente. Infatti, non possibile ottenere contemporaneamente un 2 e un 3 nello stesso
lancio. Il verificarsi di un evento esclude la possibilit dell'altro evento.

Nel caso in cui gli eventi si escludano reciprocamente, la regola dell'addizione :

Pr(A o B) = Pr(A)+ Pr(B)

Un allevatore di cani possiede 16 barboncini, 24 bassotti e 8 pastori tedeschi, per un totale di 48


animali. Le notizie riguardanti ciascun animale vengono raccolte in una scheda. Estraendo una
scheda a caso, quel la probabilit che si tratti di un cane di piccola taglia (barboncino o bassotto)?
Gli eventi si escludono reciprocamente, in quanto ogni scheda riguarda un animale dell'una oppure
dell'altra razza. Applicando la regola dell'addizione avremo:
(prob. di estrarre un barboncino) + (prob. di estrarre un bassotto) = (16/48) + (24/48) = 0.833 =
83.3%.

Nel caso in cui A e B non si escludano reciprocamente (cio possa verificarsi A e B


congiuntamente), a tale somma necessario
sottrarre la Pr (A e B). Il motivo di Ci si ricava
osservando la figura accanto: se i due insiemi
rappresentano rispettivamente la probabilit di
successo dell'evento A (in rosa) e dell'evento B
(in azzurro), allora la probabilit che si verifichi
almeno uno dei due uguale alla somma delle
aree dei due insiemi. Per nel momento in cui si considera l'unione dei due insiemi bisogna togliere
la quantit relativa alla loro intersezione in quanto essa viene considerata due volte: una volta per
ciascun insieme. Quindi

Pr(A o B) = Pr(A)+ Pr(B) - Pr(A e B)


:
169

Un farmaco induce nel cane, come effetto collaterale, aumento della produzione di saliva
(ipersalivazione) nel 10% dei trattati. Il farmaco viene somministrato a 2 cani. Qual la probabilit
che almeno uno manifesti ipersalivazione? I due eventi non si escludono reciprocamente, quindi:
Pr(A o B) = 0.1 + 0.1 - (0.1*0.1)= 0.19 = 19%
170

8. Probabilit
8.3 Probabilit e statistica

OBIETTIVO:

apprendere l'enunciato della "Legge dei grandi numeri" e l'esistenza di una probabilit "a
posteriori"

Chiunque, con un minimo di ragionamento e di buon senso, pu arrivare alla conclusione che,
lanciando una moneta, la probabilit teorica che esca una delle due facce pari a 1/2. Se vuoi
verificare se-e-quanto la teoria corrisponde alla pratica, non devi far altro che armarti di molta
pazienza e lanciare la moneta pi volte, registrando i risultati e poi studiarli da un punto di vista
statistico.

Supponiamo che tu abbia effettuato tre serie di 10, 100, e 1000 lanci, ottenendo i risultati riassunti
nella tabella che segue.

Puoi osservare che, aumentando il numero dei lanci, le frequenze percentuali tendono ad avvicinarsi
al valore 50, che la probabilit teorica che esca ognuna delle due facce.

Generalizzando i risultati, si pu affermare che, esaminando un gran numero di eventi, la frequenza


relativa di un evento aleatorio si avvicina alla probabilit teorica dell'evento. In altre parole: la
differenza fra il valore osservato nella pratica e il valore teorico atteso tende a diminuire
all'aumentare del numero di prove che si eseguono. Questa affermazione rappresenta la legge dei
grandi numeri.

Un caso frequente in epidemiologia: quando non si conosce la probabilit a priori

A questo punto bisogna sottolineare che, in epidemiologia, molto spesso si studiano eventi aleatori
per i quali non possibile calcolare la probabilit teorica a priori. In questi casi torna utile la legge
dei grandi numeri: infatti accettiamo come probabilit, che chiamiamo "probabilit statistica", la
frequenza relativa di un evento che si ottiene da un numero abbastanza elevato di prove o di
osservazioni, tutte effettuate nelle stesse condizioni.
171

Ad esempio, non possibile sapere la probabilit che esca "testa" lanciando una moneta truccata.
L'unico modo per conoscere tale probabilit di lanciare un gran numero di volte la moneta
registrando i risultati. Ad esempio, su 1000 lanci otteniamo 612 volte testa. Allora puoi stimare che
la probabilit di ottenere testa con quella moneta sia pari a 0.612. Questa probabilit ottenuta
empiricamente pu essere soltanto stimata, ma non calcolata con precisione. Quasi certamente se tu
facessi un'altra serie di 1000 lanci otterresti un risultato lievemente diverso! Ovviamente, pi alto
il numero di prove e maggiore la precisione della stima.

Studiando le malattie a livello di popolazione si possono raccogliere dati indispensabili per


rispondere a quesiti che coinvolgono la probabilit statistica. Ad esempio, potrebbe essere
interessante rispondere a domande del tipo:

che probabilit c' che un animale affetto da


una certa malattia sopravviva se non si
effettua nessuna terapia?
che probabilit c' che un animale affetto da
una certa malattia sopravviva se sottoposto
ad una data terapia?
che probabilit c' che un allevamento venga
coinvolto in una epidemia?
che probabilit c' che un intervento di
vaccinazione degli animali recettivi arresti il
diffondersi di una epidemia?

Evidentemente si tratta di domande per le quali


non pu essere calcolata una probabilit teorica
(a priori). invece necessario procedere
empiricamente, raccogliendo dati sul fenomeno
che ci interessa e poi calcolare la probabilit a
posteriori sfruttando la legge dei grandi numeri.

Un metodo statistico basato sulla probabilit a


posteriori viene utilizzato per calcolare la
probabilit di una persona di essere in vita o di
morire in un certo periodo di tempo. La Tabella a
lato rappresenta la distribuzione della
popolazione italiana nell'anno 2000 (fonte dei
dati: ISTAT) rapportata a 100.000 individui. In
essa viene riportato, separatamente per maschi e
femmine, il numero di persone in vita ad et
raggruppate in classi di ampiezza 5 anni. Sulla
172

base dei dati contenuti nella tabella si possono calcolare sia le probabilit di morte che di vita per
una persona appartenente ad ogni classe di et.

Per esempio, per trovare la probabilit che un maschio di 45 anni muoia nei 5 anni successivi
occorre considerare che nel periodo sono morti 1308 individui (ossia 96089-94781) su 96089 in vita
all'inizio del periodo stesso. La probabilit di morte si ottiene calcolando il rapporto fra il numero di
morti nel quinquennio considerato ed il numero di vivi a 40 anni:

Confrontando i dati delle tavole di mortalit di anni diversi si pu monitorare indirettamente lo stato
di salute complessivo di una popolazione ed i progressi dell'assistenza medica. Ad esempio,
nell'anno 1987 la probabilit di morte nei 5 anni successivi per un maschio di 45 anni era
dell'1.84%, mentre nel 2000 tale probabilit era scesa a 1.36%.

Oltre alla probabilit di morte, si pu calcolare la probabilit di sopravvivenza. Ad esempio, la


probabilit che una persona di sesso maschile di 45 anni resti in vita nei 5 anni successivi si ottiene
con il rapporto fra il numero dei maschi vivi a 50 anni ed il numero di vivi a 45 anni:

Nota che la somma (probabilit di essere in vita)+(probabilit di morire) deve essere pari a 1.
Quindi, una volta nota la probabilit di morte, la probabilit di sopravvivenza si pu ottenere anche
facendone il complemento a 1: probabilit di sopravvivere = 1 - probabilit di morire.

Quantificare la prognosi

Se si raccolgono dati riguardanti l'andamento della


mortalit nei pazienti affetti da una certa malattia, si
possono compilare tavole utili a esprimere con una certa
precisione il destino di un paziente (quantificare la
prognosi). Ad esempio, per il cancro della prostata si
potrebbero ottenere i dati riassunti nella Tabella a lato. In
tal modo, alla domanda del paziente cui venisse
diagnosticata la malattia, il medico potrebbe rispondere
affermando che il 90% dei pazienti di quel tipo ancora
in vita dopo 1 anno, e che tale percentuale scende a 67 anni dopo 5 anni e si riduce ancora a 58
dopo 10 anni.
173

9.
Campionamento
9.1 Scopi del campionamento

OBIETTIVI:

specificare i motivi che inducono - od obbligano - ad esaminare un campione piuttosto che la


popolazione in toto

individuare i principali obiettivi di un campionamento

Raramente in uno studio epidemiologico possibile esaminare ogni singolo animale della
popolazione. Infatti spesso si limitati dalle risorse disponibili (economiche, di personale, di
laboratori, di tempo ecc.); in altre occasioni, anche supponendo di disporre di risorse illimitate,
l'intera popolazione da studiare non fisicamente raggiungibile oppure non del tutto nota . Pensa,
ad esempio, ad una indagine epidemiologica da effettuare su animali selvatici di una certa specie
(es. camosci) in un parco: probabilmente non sar conosciuto con esattezza il numero degli animali
presenti, n il rapporto maschi/femmine n la distribuzione per et ecc..
In altri casi, il numero di individui che compongono la popolazione da studiare talmente elevato
che lo studio di ognuno di essi fattibile solo teoricamente. Pensa, ad esempio, alle api di un
alveare o ai pesci presenti un laghetto di allevamento. Infine, possibile trovarsi di fronte ad una
combinazione delle suddette difficolt, come ad esempio nel caso si volessero studiare gli insetti
vettori di una determinata malattia in una determinata zona.
Talvolta, soprattutto nel lavoro di ricerca medica, la popolazione addirittura infinita o, meglio,
indeterminata in quanto non conoscibile in modo esaustivo, neppure virtualmente.

ESEMPIO. Una popolazione indeterminata rappresentata da tutti gli animali che, oggi e in futuro,
necessiteranno di una particolare terapia, oppure dall'insieme delle concentrazioni di mercurio
misurabili in tempi diversi in un lago).

Non sempre per popolazione si intende un aggregato di animali; talvolta si pu lavorare su una
popolazione di batteri, o di virus, o di cellule in coltura, o di campioni di latte ecc. Anche in questi
casi evidente che sar spesso impossibile esaminare l'intera popolazione.

L'esame di un campione, ossia di un numero ridotto di osservazioni, invece dell'intera popolazione


consente di superare i problemi ora accennati. Un campione non altro che un insieme di elementi
tratti da una popolazione (o "universo"). Un universo consiste della totalit degli elementi che
hanno certe caratteristiche. Il campione soltanto una parte del tutto.
174

Scegliere un campione da una popolazione significa effettuare un campionamento. Esaminare


ogni singolo individuo della popolazione significa effettuare un censimento; esaminare gli animali
di un campione significa effettuare una indagine (o inchiesta o sondaggio, in inglese survey).

Per una serie di motivi, raramente possono essere studiate tutte le unit che compongono una
popolazione. Pertanto, si studia soltanto una parte pi o meno grande della popolazione, per poi
generalizzare all'intera popolazione i risultati ottenuti. Questo processo di generalizzazione dei
risultati ottenuti studiando un campione detto inferenza:

ESEMPIO. Un farmacologo somministra un farmaco a 30 cani con una


certa malattia, mentre somministra semplice soluzione fisiologica ad
altri 30 cani (i controlli). Dopo una settimana guarito il 25% degli
animali trattati con il farmaco ed il 19% dei controlli. Questo risultato
stato ottenuto su un campione di animali, e non implica necessariamente
che il farmaco sia efficace; infatti, lo stesso esperimento condotto su
altri animali potrebbe portare a risultati diversi. Non c' dubbio che
sugli animali del campione il farmaco ha funzionato meglio del placebo.
Per non puoi essere sicuro che il farmaco funzioner anche sulla popolazione di tutti i cani affetti
da quella malattia.
Le ipotesi sono due: il farmaco funziona oppure il farmaco non funziona. Quale ipotesi scegliere?
Qui viene in aiuto la statistica: attraverso un processo di inferenza basato su metodi statistici
(statistica inferenziale) si pu stimare con obiettivit l'efficacia del farmaco sulla popolazione in
generale, a partire dai risultati ottenuti studiando un campione.
Alcuni principi di base della statistica inferenziale sono stati trattati nel Capitolo 5; altri verranno
trattati pi avanti in questo stesso capitolo.

Quando si effettua uno studio per mezzo di un campione, necessario tener presente che non si
otterranno mai risultati del tutto affidabili. Come si vedr in seguito, per valutare la "bont" di uno
studio campionario indispensabile tener conto di vari fattori, fra i quali i pi importanti sono: i
175

criteri di scelta della popolazione in studio, il metodo con cui si selezionato il campione, il periodo
di osservazione, i metodi adottati per identificare i casi di malattia, le tecniche di analisi, la
precisione delle misure effettuate.
176

9.
Campionamento
9.2 Caratteri del campione

OBIETTIVO:

analizzare i caratteri del campione e spiegare perch non esiste il campione perfetto

intuitivo che da una popolazione possono essere estratti moltissimi campioni, che probabilmente
saranno tutti diversi fra loro:

altrettanto intuitivo che le caratteristiche di un campione non saranno mai perfettamente identiche
a quelle della popolazione. Il campione non sar mai la fotocopia precisa della popolazione di
origine. Quindi, se studi un campione allo scopo di effettuare una inferenza sulla popolazione,
giungerai inevitabilmente a conclusioni non del tutto veritiere. In questa unit, e nelle successive,
imparerai come ovviare a questo inconveniente.

Immagina di aver effettuato una indagine su un campione; in pratica, hai misurato un certo
carattere in ciascuna delle unit del campione. Ora vuoi utilizzarev i tuoi dati per trarre delle
conclusioni. Ti devi porre due domande fondamentali:
177

La risposta a queste due domande genera i concetti di validit interna e di validit esterna di uno
studio epidemiologico eseguito su un campione (studio campionario).

Validit interna

La validit interna misura quanto i risultati di uno studio sono corretti per il campione di individui
che sono stati studiati. Essa viene detta interna perch si applica al campione, e non
necessariamente agli altri individui della popolazione. Forse questo concetto ti potr sembrare una
sottigliezza inutile. Per devi pensare che non sempre si tratta di fare misurazioni facili, semplici ed
affidabili (come ad esempio pesare ratti da laboratorio). In molti casi, le cose sono pi complicate:
negli studi clinici, la validit interna dipende dalla correttezza di impostazione dello studio stesso,
dalla scelta di buone tecniche diagnostiche e da un loro corretto utilizzo, da una buona elaborazione
dei dati ecc. Nel caso dei dati ottenuti attraverso questionari, un fattore che contribuisce ad
abbassare la validit interna rappresentato dalla propensione degli intervistati a mentire
sistematicamente su determinate domande, come illustrato nell'esempio che segue.

ESEMPIO. Effettui un sondaggio per conoscere la percentuale di cani


che vengono sottoposti a vaccinazione periodica nei confronti della
leptospirosi; a questo scopo, sottoponi ai proprietari dei cani la
seguente domanda: Lei fa vaccinare annualmente il suo cane per la
leptospirosi?.
Prevedibilmente i proprietari che hanno cura del loro cane (e che lo
vaccinano regolarmente) saranno ben felici di rivelare il loro
comportamento virtuoso e quindi risponderanno correttamente con un
"s". Al contrario, molti di coloro che omettono di vaccinare il cane non saranno disposti ad
ammetterlo, per non apparire egoisti o avari, e quindi tenderanno a mentire, rispondendo anch'essi
con un "s". Ci evidentemente far diminuire la validit interna del campione.

La validit interna viene diminuita sia dalla variazione casuale che da ogni elemento di bias.
La validit interna condizione necessaria ma non sufficiente perch uno studio sia utile.

Validit esterna

La validit esterna il grado di generalizzabilit delle conclusioni tratte da uno studio. Ad


esempio, nel caso di uno studio epidemiologico clinico, essa risponde alla domanda "Supponendo
che i risultati dello studio siano veri, essi si applicano anche ai miei pazienti?". In altre parole, la
validit esterna misura il grado di verit dell'assunto secondo cui gli animali studiati sono "uguali"
ad altri animali affetti dalla stessa condizione.

Per semplicit, assumiamo ora che lo studio sia provvisto di ottima validit interna; ci significa che
conosciamo con esattezza le caratteristiche del campione che abbiamo esaminato. Le conclusioni
che ne abbiamo tratto sono certamente valide per gli individui del campione, ma non possiamo dire
se e quanto tali conclusioni siano generalizzabili alla popolazione da cui il campione stato estratto.
La soluzione a questo problema verr accennata nelle unit successive ( metodi di
campionamento, limiti fiduciali, ecc.).

Ovviamente, le conclusioni ottenute attraverso uno studio campionario sono valide soltanto se esiste
una buona validit interna ed esterna. Nella figura seguente viene schematizzato il flusso del
ragionamento riguardo alla validit interna ed esterna di un campione, al fine di giungere a
conclusioni affidabili.
178

intuitivo che::

1. attraverso lo studio di un campione, si pu soltanto stimare (cio determinare con un certo


margine di errore) il carattere della popolazione da cui il campione deriva; tuttavia, tale carattere
non potr mai essere determinato con esattezza;
2. la accuratezza della stima direttamente correlata al numero di osservazioni che si compiono
del fenomeno in studio.

ESEMPIO 1. Vogliamo conoscere il peso di un gruppo di 600 suini pronti


per la macellazione. Non abbiamo la possibilit di pesare tutti i 600
animali; quindi, estraiamo un campione di 6 soggetti, li pesiamo e
calcoliamo la media. evidente che, con questo metodo, avremo un
valore che si potr scostare anche di parecchi chili dalla media della
'popolazione' da cui essi provengono (cio il gruppo di 600). Ma se
misuriamo altri individui e li aggiungiamo ai primi, la nuova media ottenuta sar pi vicina a quella
vera; cio, la precisione della nostra misura aumenter parallelamente all'aumento del numero di
animali pesati. Tuttavia, non otterremo una misura perfetta finch non avremo pesato tutti i suini.

ESEMPIO 2. Abbiamo il compito di effettuare un'indagine sui rapporti fra mastite della bovina e
179

produzione di latte. Nel territorio sono presenti, in pianura, 14 grandi allevamenti, per un totale di
2900 bovine adulte da latte; nella zona montagnosa, vi sono invece 36 piccoli allevamenti (300
animali in totale). La popolazione di interesse : tutte le bovine da latte. L' unit di analisi la
singola bovina da latte. Le nostre risorse ci consentono di esaminare un campione di 300 animali.
Se tutti gli animali verranno selezionati dagli allevamenti della pianura, avremo un campione non
rappresentativo. Un campione pi rappresentativo sar invece rappresentato dal 90% circa di bovine
degli allevamenti di pianura e dal 10% di vacche di montagna.

In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei
risultati che quasi certamente si discostano (poco o tanto) dalla vera misura della popolazione.
ben vero che il campione dovrebbe rappresentare una immagine della popolazione ridotta dal punto
di vista numerico ma fedele dal punto di vista qualitativo. Tuttavia, non possiamo mai essere sicuri
che il campione rappresenti una copia perfetta della popolazione da cui esso stato estratto, a meno
di non esaminare... l'intera popolazione!

Infatti, posto [n=numero di individui che compongono una popolazione], supponiamo di analizzare
il pi ampio campione possibile costituito da [n-1] individui. Ebbene, intuitivo che, anche in
questo caso, il campione non sar perfettamente rappresentativo della popolazione, in quanto
l'unico individuo non esaminato potrebbe possedere caratteri molto diversi da quelli di tutti gli altri
[n-1] individui.

L'errore di campionamento rappresentato dalla differenza tra i risultati ottenuti dal campione e
la vera caratteristica della popolazione che vogliamo stimare.

L'errore di campionamento non pu mai essere determinato con esattezza, in quanto la vera
caratteristica della popolazione (e rester!) ignota. Esso tuttavia pu essere contenuto entro limiti
pi o meno ristretti adottando appropriati metodi di campionamento. Inoltre, esso pu essere
stimato; ci significa che, con adatti metodi statistici, si possono determinare i limiti probabili
della sua entit.
180

9.
Campionamento
9.3 Errore di campionamento

OBIETTIVO:

analizzare i fattori che contribuiscono all'errore di campionamento

Abbiamo gi visto che un campione non mai perfettamente rappresentativo della popolazione da
cui stato estratto. Ci implica che, ogni qual volta studiamo un campione, otteniamo dati che non
rispecchiano la realt: dobbiamo tener conto di un errore di campionamento.

I fattori responsabili dell' errore di campionamento sono sostanzialmente due: la variazione


casuale e la selezione viziata.

La variazione casuale

La variazione casuale dovuta al caso, cio a quell'insieme di fattori o cause, piccole o grandi,
che agiscono su un fenomeno senza che noi possiamo o vogliamo controllarli esattamente e
prevederne quindi l'azione (Cavalli-Sforza). La variazione casuale ha portato alla nostra
osservazione proprio quegli individui che costituiscono quel campione, nei quali la misura che
vogliamo studiare assume un valore pi alto o pi basso, senza una regola precisa.
La variazione casuale fa s che una misura effettuata su un campione non fornisca un valore identico
a quello ottenibile misurando l'intera popolazione: c' sempre - un certo errore, che viene detto
errore campionario. Questo errore deriva semplicemente dal fatto che stiamo osservando soltanto
una parte della popolazione.

L'EFFETTO DEL CASO.


Tutti noi ricorriamo al "caso" per giustificare, ad esempio, il motivo per cui su 100 lanci di una
stessa moneta non sempre esce per 50 volte 'testa' e per le restanti 50 'croce'. Questo stesso motivo
(la variazione casuale) vale a giustificare il seguente esempio.
Supponiamo di avere a disposizione due farmaci, A e B, ugualmente efficaci, nel senso che
181

guariscono il 50% dei pazienti trattati. Supponiamo di fare un esperimento per studiare l'effetto dei
due farmaci; supponiamo che, in questo esperimento, non sia presente alcun bias (vedi oltre in
questa stessa unit), e quindi che i dati ottenuti siano assolutamente affidabili. Tuttavia, soprattutto
se l'esperimento viene eseguito su un numero limitato di soggetti, facilmente osserveremo che il
farmaco A induce guarigione con maggior frequenza rispetto al farmaco B (o viceversa). Questo
effetto dovuto, appunto, alla variazione casuale,

Ovviamente, l'errore di campionamento condizionato dall'esistenza di variabilit tra gli


individui che compongono la popolazione di partenza; se tutti - per assurdo - avessero lo stesso
carattere in egual misura, l'esame di qualsiasi numero di individui fornirebbe lo stesso valore, e
quindi l'errore di campionamento sarebbe nullo.

La selezione viziata

La selezione viziata quella che viene effettuata su un segmento non rappresentativo della
popolazione. Questo avviene quando la scelta delle unit che costituiranno il campione viene
effettuata con regole non rigorosamente causali. Talvolta, lo stesso sperimentatore che, definendo
delle regole estemporanee volte a neutralizzare - nelle intenzioni - gli effetti del caso e di ottenere
un campione pi aderente alla popolazione, commette un errore che rende i dati inutilizzabili.
Infatti, un campione che non stato ottenuto correttamente fornisce misurazioni e risultati per i
quali impossibile calcolare il cosiddetto errore di campionamento. La selezione viziata fa s che
all'errore campionario si sommi un altro tipo di errore, detto errore non campionario o bias.

ESEMPIO 1. Vogliamo accertare la proporzione di cani vaccinati contro il cimurro in una


provincia. Non potendo esaminare tutti i cani dell'area considerata, decidi di esaminare un campione
di animali. Per comodit, scegli i cani che vengono presentati presso alcuni ambulatori del
capoluogo. Il campione cos ottenuto sar sicuramente distorto (affetto da "bias"), in quanto
composto quasi esclusivamente da cani "cittadini" che, notoriamente, sono oggetto di maggiori cure
da parte del proprietario rispetto a quelli che risiedono in campagna. Inoltre, anche il fatto stesso
che il cane venga portato in ambulatorio testimonia l'attenzione da parte del proprietario verso la
salute del suo animale, ed probabile che questa attenzione si sia tradotta in una corretta profilassi
vaccinale. Infatti, ovvio che i cani trascurati non vengono vaccinati n vengono portati dal
veterinario!
Quindi, il tuo campione sar distorto perch (1) hai selezionato cani cittadini e (2) hai selezionato
cani portati in ambulatorio. Presumibilmente, tutti i cani del tuo campione (distorto!) risulteranno
vaccinati per il cimurro e quindi sarai portato a concludere erroneamente che "tutti i cani della
provincia sono vaccinati per il cimurro".

ESEMPIO 2. Il frammento prelevato con una biopsia epatica rappresenta circa 1/50000
dell'organo. Essendo il campione cos piccolo rispetto all'intero organo, esiste la possibilit di ampie
variazioni da un campione all'altro. Inoltre, poich il frammento viene esaminato, in genere, allo
scopo di diagnosticare una malattia dell'intero fegato, esiste la possibilit che il processo di
inferenza sia viziato. Ad esempio, si preleva un campione di tessuto sano in un organo ammalato.
182

In conclusione, si pu affermare che soltanto quando la scelta degli individui che compongono il
campione stata dettata dal puro e semplice caso, possibile prevedere e calcolare l'entit della
differenza tra campione e popolazione.
In caso contrario, il campione si dice distorto. Con un campione distorto, non possibile
calcolare l'errore di campionamento ed i dati ottenuti saranno difficilmente utilizzabili.

Pi precisamente, per bias si intende "un processo, effettuato in qualsiasi stadio della
inferenza, che tende a fornire risultati che si discostano sistematicamente (ossia sempre nella stessa
direzione) dai valori veri".

A differenza del bias (che influenza i dati sistematicamente in una direzione o nell'altra), la
variazione casuale fornisce dati che possono essere parimenti al di sopra o al di sotto del valore
vero. Di conseguenza, la media di molte osservazioni non-distorte si avvicina al valore vero della
popolazione, anche se i singoli dati utilizzati per ottenere la media possono discostarsi di molto dal
valore vero.
183

ESEMPIO. Nello schema A (a lato) sono


raffigurati due bersagli. Quello a sinistra (A1)
il risultato di 17 tiri effettuati da un buon
tiratore che ha sparato con un buon fucile.
L'insieme dei fori si pu considerare come un
campione delle infinite possibili combinazioni
di 17 tiri che quel tiratore pu ottenere
sparando con quel fucile. Come vedi, i fori
hanno una disposizione casuale, ma tendono a disporsi attorno al centro del bersaglio.
Il bersaglio di destra (A2) stato utilizzato dallo
stesso tiratore, ma con un fucile con il mirino
disallineato. Anche in questo caso, i fori hanno
una disposizione casuale, ma tendono a disporsi
attorno ad un punto che NON corrisponde al
centro del bersaglio.

Ora supponi (schema B) di non conoscere la


vera posizione del centro bersaglio (la quale, fuor di metafora, equivale alla VERA caratteristica
della popolazione in studio, la quale in effetti
non mai nota).
Supponi anche di estrarre a caso un campione di
17 colpi dagli infiniti campioni possibili. Con
un buon campionamento (che equivale ad un
buon fucile) otterrai il campione raffigurato a
sinistra (B1); se, invece, il campione sar affetto
da bias, otterrai un campione come quello a
destra (B2). Ora, sempre in base ai dati dello schema B, prova ad "inferire" (ossia ad indovinare) la
posizione del centro del bersaglio.

Ragionevolmente collocherai i bersagli come indicato nello schema C: con il campione di colpi di
sinistra (C1) (cio quello del fucile preciso) l'inferenza sar attendibile, come dimostra la corretta
collocazione del centro del bersaglio rispetto alla realt (cos come raffigurato in A1). Al contrario,
utilizzando il campione distorto (C2), sarai indotto a ritenere che il centro del bersaglio sia spostato
rispetto al reale e non riuscirai a posizionarlo correttamente. In quest'ultimo caso, fuor di metafora,
non sarai in grado di stimare correttamente la vera caratteristica della popolazione.
184

9.
Campionamento
9.4 Metodi di campionamento

OBIETTIVO:

descrivere la logica di un buon campionamento ed elencare alcuni dei pi comuni metodi di


campionamento

Il principio informatore generale di un buon campionamento prevede di utilizzare lo stesso


principio dell'estrazione a sorte, ossia quello della casualit assoluta, in modo tale che ciascuna
unit della popolazione abbia la stessa probabilit di entrare a far parte del campione. In tal
caso il campione viene detto randomizzato o casuale.
Affidandosi al caso si ottiene, in una qualche misura, la garanzia che il campione sar
rappresentativo della popolazione stessa, ossia ne rifletter le caratteristiche con una certa
approssimazione.

Immagina di avere una lista di 100000 animali, e che una met di questi siano maschi e l'altra met
siano femmine. La teoria statistica delle probabilit dice in anticipo che, se estrarrai in modo
casuale mille soggetti dalla lista, otterrai un campione composto per met da maschi e per met da
femmine, con un livello di approssimazione prevedibile a priori.
Analogamente, supponi di ripetere molte volte il lancio di una moneta. L'evento "testa" o "croce"
condizionato soltanto dal caso: le prime volte potr uscire sempre "testa" (oppure sempre "croce"),
ma alla lunga la proporzione di teste e croci nella "popolazione" di lanci tender ad equilibrarsi.

Un campionamento randomizzato offre il vantaggio di fornire un campione privo di errori


sistematici (bias) e consente di accertare l'attendibilit dei risultati o, per meglio dire, i rapporti fra i
risultati forniti dal campione e la vera caratteristica della popolazione.

Nelle unit successive verranno illustrati brevemente cinque fra i pi comuni metodi di
campionamento. Di essi, uno un metodo non probabilistico, mentre i restanti 4 sono basati sulla
randomizzazione:

campionamento non probabilistico (o campionamento "di convenienza")


campionamento per randomizzazione semplice (o campionamento casuale semplice)
185

campionamento per randomizzazione sistematica (o campionamento sistematico)


campionamento per randomizzazione stratificata (o campionamento stratificato)
campionamento a grappolo ("cluster")
186

9.
Campionamento
9.5 Campionamento con metodo non probabilistico

OBIETTIVO:

descrivere modalit e caratteristiche del campionamento di convenienza (non probabilistico)

Il campionamento di convenienza viene effettuato con un metodo non probabilistico che non offre a
tutte le unit della popolazione la stessa possibilit di entrere a far parte del campione. In pratica,
alcuni gruppi o individui hanno maggiore probabilit di essere scelti rispetto agli altri. Il
campionamento non probabilistico considerare un cattivo metodo di campionamento.

Esso prevede la selezione del campione in base a criteri di comodo o di praticit, per esempio
perch gli animali sono pi facilmente accessibili, o per ragioni di costo, o perch in una certa zona
sono disponibili volontari ecc.

Anche una scelta soggettivamente ritenuta "casuale" dall'operatore (con le classiche parole ...
scelgo io a caso!) non assicura l'ottenimento di un buon campione, perch l'intervento umano
sempre portatore di distorsioni derivanti da pregiudizi o scelte pi o meno inconsapevoli.

Con un campionamento di convenienza si reclutano preferenzialmente unit "particolari" rispetto


alla popolazione, ad esempio animali provvisti di un carattere capace di influenzare il carattere che
vogliamo studiare. Un campione cos ottenuto soggetto a distorsione (bias) che, essendo appunto
dovuto al metodo di selezione, viene detto bias di selezione. Ovviamente un campione di questo
tipo fornisce dati poco affidabili e pregiudica il processo di generalizzazione dei risultati (
inferenza).

ESEMPIO. La tua tesi di laurea ha come oggetto la stima della


frequenza di parassitosi intestinali nel cane, che intendi valutare
attraverso l'esame di campioni di feci. La popolazione oggetto
della tua indagine : tutti i cani della provincia di Parma. Procedi
quindi a prelevare le feci di un campione di animali; per tua
187

convenienza (vuoi risparmiare tempo e denaro!), scegli di effettuare la raccolta dei campioni da
animali che si trovano soprattutto nel tragitto che va dal paese dove abiti a Parma, la citt dove
studi. Alla termine della raccolta, il tuo campione geograficamente distribuito come indicato nella
mappa a lato, in cui ogni puntino rosso rappresenta un prelievo. E' evidente che questo campione
non rappresentativo della popolazione-oggetto prevista nella tua tesi. Quindi, il tuo campione
distorto.

ESEMPIO. In un allevamento intensivo di 250 bovine da latte, devi


indagare sulla prevalenza di mastite subclinica. La popolazione di
interesse : tutte le bovine dell'allevamento in lattazione in quel periodo.
Operativamente non possibile esaminare tutte le bovine, quindi decidi di
sottoporre ad esami di laboratorio i campioni di latte prelevati dalle prime
20 bovine che si presenteranno in sala di mungitura. Questa strategia di
campionamento molto conveniente, in quanto non devi attendere l'arrivo
di tutte le bovine. Bisogna per precisare che nell'accesso alla sala si
instaura infatti un ordine di precedenza ben preciso, basato anche sull'et; quindi, le primipare
(ossia le bovine di primo parto) non entreranno a far parte del campione. Il tuo campione risulter
distorto.
188

9.
Campionamento
9.6 Campionamento per randomizzazione semplice

OBIETTIVO:

apprendere modalit e caratteristiche del campionamento per randomizzazione semplice

Il campionamento per randomizzazione semplice (o campionamento casuale semplice) si


effettua estraendo una certa quota di unit dalla popolazione attraverso un metodo che garantisce la
casualit delle estrazioni.

La casualit viene ottenuta estraendo numeri a partire da un elenco (detto "lista di


campionamento") in cui sono presenti tutti gli individui della popolazione da studiare. Il
metodo deve garantire la casualit dell'estrazione. Teoricamente, nel caso di liste molto
piccole, potrebbe andar bene l'estrazione di numeretti come nel gioco della tombola.
Ovviamente, per in realt si utilizzano sistemi diversi, come un computer provvisto di
apposito software, oppure una calcolatrice tascabile fornita della apposita funzione, oppure le
cosiddette Tavole generatrici di numeri casuali.
189

ESEMPIO 1: UTILIZZO DI UN FOGLIO DI CALCOLO.


Hai il compito di stimare la presenza di anticorpi nei confronti del virus della pseudorabbia nelle
scrofe di un allevamento da riproduzione. Nell'allevamento sono presenti 128 scrofe, tenute in box
singoli numerati da 1 a 128. Desideri selezionare un campione di dimensione pari a circa il 10%
della popolazione. La popolazione in analisi sono le 128 scrofe. La lista di campionamento
costituita da numeri da 1 a 128. L'unit
di analisi la singola scrofa.
Puoi usare un un apposito programma
per la generazione di numeri casuali
che forse hai installato sul tuo PC,
oppure una delle tante risorse
disponibili in Internet, oppure un
foglio di calcolo (v. immagine di
esempio a lato). Nel foglio di calcolo
dovrai utilizzare la funzione =CASUALE() che restituisce un numero decimale casuale compreso
fra 0 e 1. A te servono numeri interi compresi fra 1 e 128, quindi dovrai usare la formula
=INT(CASUALE()*128+1). Come vedi, nell'esempio a lato sono stati estratti i seguenti animali: 9,
34, 44, 60, 63, 65, 74, 85, 97, 99, 106,111, 122.

ESEMPIO 2: UTILIZZO DELLA TAVOLA DEI NUMERI RANDOM.


Si tratta di un sistema di ottenimento di numeri casuali che stato quasi del tutto sostituito dai
metodi elettronici. La Tavola per pu essere proficuamente utilizzata in campo (ad esempio un
190

allevamento o in altre condizioni disagevoli) quando necessario estrarre un campione piccolo.


L'impiego della tavola molto semplice, e viene illustrato in una breve presentazione animata.

La randomizzazione semplice (come altri metodi basati sul caso) un metodo valido per il
campionamento perch ha le seguenti caratteristiche:

risponde ai caratteri di un buon campionamento: ogni individuo della lista di campionamento ha la


stessa probabilit di entrare a far parte del campione;
un metodo basato sulla casualit, e quindi consente la valutazione dell'attendibilit dei risultati
ottenuti.

Tuttavia, bisogna osservare che vi sono situazioni in cui questo metodo risulta poco pratico se non
addirittura inapplicabile. Il principale svantaggio quello di richiedere la preventiva numerazione di
tutti gli animali (o una loro facile numerabilit); poi, una volta estratti i numeri, necessario
individuare nella popolazione i soggetti corrispondenti. La scarsa applicabilit di questo metodo
viene illustrata nell'esempio che segue.

ESEMPIO. Supponiamo di voler esaminare un campione


di 100 broiler da estrarre con randomizzazione semplice
da un gruppo di 4000. La procedura richieder la
numerazione da 1 a 4000 di tutti i soggetti (per esempio
tramite un anello alla zampa), l'estrazione dei 100 numeri
casuali e la cattura dei 100 corrispondenti animali. Queste
operazioni necessitano tempo e mano d'opera; nella
pratica non sono applicabili, anche perch esistono altri
metodi di campionamento molto pi adatti in queste
condizioni (v. prossima Unit).

Il campionamento per randomizzazione semplice viene invece agevolmente applicato quando si


dispone di una popolazione gi numerata, preferibilmente composta di un numero non elevato di
unit, meglio se allevate in box singoli o in posta fissa (es. scrofe o bovini a
stabulazione fissa).
Un'altra tipica applicazione della randomizzazione semplice riguarda
l'estrazione di unit gi numerate e registrate su schede o in un database
informatico. Ad esempio, potresti estrarre in questo modo un campione di
proprietari di cani dalla clientela del tuo ambulatorio, oppure un campione di
allevamenti di una Provincia ecc. ecc.

Foglio di calcolo per Microsoft Excel che genera numeri casuali (con ripetizione) compresi fra 0 e
un numero n a scelta .

Foglio di calcolo per Microsoft Excel che genera n numeri casuali (senza ripetizione) compresi fra
due numeri interi a scelta .
191

9.
Campionamento
9.7 Campionamento per randomizzazione sistematica

OBIETTIVO:

apprendere modalit e caratteristiche del campionamento per randomizzazione sistematica

Il campionamento per randomizzazione sistematica (o campionamento sistematico) le unit


che costituiranno il campione sono estratte dalla popolazione con un intervallo regolare; in pratica,
a partire dalla popolazione (lista di campionamento), si sceglie una unit ogni n dove n il
numero (approssimato all'intero) che si ottiene dividendo la numerosit della popolazione per la
numerosit del campione desiderato.

Questo metodo pi pratico rispetto alla randomizzazione semplice, ed assicura anche che le
singole unit del campione siano distribuite uniformemente all'interno della popolazione.

Occorre tuttavia porre attenzione che l'intervallo di campionamento prescelto non sia influenzato da
qualche variabile esterna che ha la stessa ciclicit del campionamento (v. successivo ESEMPIO 3).

ESEMPIO 1. Nel corso di una indagine sulle ulcere gastriche del maiale, devi ottenere un campione
costituito da 40 stomaci suini prelevati dai 450 suini che vengono macellati quotidianamente in un
macello. La lista di campionamento rappresentata dai 450 suini, numerati in base in base all'ordine
di macellazione. Preleverai uno stomaco ogni 11 animali macellati.

ESEMPIO 2. Stai conducendo un'indagine per stimare la frequenza di


parassitosi intestinale in un gregge di 500 pecore. Intendi esaminare
un campione di 25 animali, dai quali preleverai un campione di feci
da sottoporre ad esame parassitologico. Un campionamento per
randomizzazione semplice si rivela impraticabile, in quanto gli
animali non sono contrassegnati. Decidi quindi di utilizzare la
randomizzazione sistematica, che non prevede una preventiva
identificazione degli animali: il gregge viene fatto passare attraverso
una strettoia, e viene selezionato un animale ogni 20. In questo modo ottieni il campione
randomizzato di 25 animali.
192

ESEMPIO 3. Hai l'incarico di stimare il livello di contaminazione


batterica di un incubatoio, ed in particolare di osservare se esso
subisce variazioni nel tempo. Procedi quindi al prelievo di materiali
diversi (tamponi da filtri dell'aria, dai pavimenti, dalle camere di
schiusa ecc.) attraverso randomizzazione sistematica: per comodit, la
randomizzazione sistematica viene fatta in base al giorno della
settimana: i prelievi vengono fatti 1 giorno ogni 7, cio tutti i marted.
Per, a tua insaputa, nell'incubatoio ogni luned viene effettuata una
operazione di pulizia e disinfezione particolarmente energica.
Pertanto, il campione costituito dai tamponi del marted non rappresentativo.

Nella figura che segue viene schematizzato un esempio di campionamento per randomizzazione
sistematica, ipotizzando di dover estrarre 5 animali da una popolazione di 24. Per evitare di iniziare
sempre dell'animale n. 1, l'animale da cui iniziare (nell'esempio: il numero 3) viene scelto a caso.

Nota che il campionamento sistematico non pu essere considerato una forma di randomizzazione
"a pieno titolo", in quanto garantisce una casualit di selezione molto pi limitata rispetto al
campionamento casuale semplice.
Ad esempio, mediante la la randomizzazione semplice si possono estrarre, da una popolazione di
100 animali, ben 1013 campioni diversi costituiti 10 animali ciascuno. Nello stesso scenario, il
campionamento sistematico consente invece di ottenere soltanto 10 differenti campioni.
193

9.
Campionamento
9.9 Campionamento per randomizzazione stratificata

OBIETTIVO:

apprendere modalit e caratteristiche di un campionamento per randomizzazione stratificata

Il campionamento per randomizzazione stratificata viene effettuato quando si studia un carattere


che, presumibilmente o notoriamente, influenzato da un certo fattore presente nella popolazione.
In pratica, prima di effettuare l'estrazione del campione la popolazione viene suddivisa in strati
basati sul fattore che influenza il carattere da studiare. Quindi, all'interno di ciascuno strato si
sceglie un campione con un metodo che garantisca la casualit come, ad esempio, il metodo della
randomizzazione semplice o sistematica.

Nello schema che segue viene riassunto il procedimento di selezione del campione, in cui si ipotizza
che la razza degli animali sia un fattore che influenza il fattore che dovr essere studiato.
194

Un campione ottenuto per stratificazione ha il vantaggio di rappresentare meglio la popolazione


da cui stato estratto. Per, la ridotta numerosit dei vari strati pu rendere poco attendibili le stime
riferite ai singoli strati.

Il campionamento per randomizzazione stratificata pi flessibile di quello eseguito con


randomizzazione semplice in quanto nei diversi strati pu essere scelta una percentuale differente
(es. 2% in uno strato, 5% in un altro ecc.).

La stratificazione apporta, in genere, un altro importante vantaggio: quello di ottenere, all'interno di


ogni strato, una varianza (e, di conseguenza, un errore standard) inferiore rispetto alla varianza
complessiva della popolazione. Si tratta di un vantaggio che, a prima vista, potrebbe sembrare poco
importante, ma che invece essenziale per aumentare la precisione della stima che si otterr dallo
studio del campione. Questo argomento verr accennato in una unit successiva.
195

ESEMPIO. Hai la necessit di misurare il livello di copertura anticorpale


nei confronti di una certa malattia in un allevamento di bovini. Sei a
conoscenza del fatto che i bovini con contrassegno auricolare <1000 sono
stati vaccinati nei confronti di quella malattia, mentre non noto lo stato
immunitario degli altri, acquistati di recente. evidente che la
vaccinazione influenza la variabile che vuoi misurare, e quindi sar
opportuno effettuare un campionamento per stratificazione: strato dei
vaccinati (marca auricolare <1000) e dei non vaccinati. Inoltre,
presumibile che la variabilit (varianza) del livello anticorpale dello strato "vaccinati" sar inferiore
rispetto a quello della popolazione complessiva costituita dalla somma dei due strati.

ESEMPIO. Supponi di voler studiare la produzione


di latte delle bovine in una regione ove vengono
allevate vacche di due diverse razze: la Bianca Val
Padana e la Frisona. noto che la produzione di
quest'ultima superiore (per motivi genetici) rispetto
alla Bianca; perci, converr suddividere la
popolazione-oggetto in due strati (strato Bianca e strato Frisona) e poi campionare all'interno
di ciascuno di essi per randomizzazione semplice o sistematica. Supponi inoltre di conoscere che,
nella regione considerata, il rapporto numerico Frisona/Bianca sia 9/1; allora, potrai scegliere un
campione proporzionale che rispetti la proporzione esistente nella popolazione: un campione di 100
vacche sar composto da 90 Frisone e 10 Bianche Val Padana.

Ovviamente lo stato di tutte le unit della lista di campionamento riguardo ai fattori su cui basata
la stratificazione, deve essere noto prima di scegliere il campione. Ci costituisce una limitazione
operativa del campionamento stratificato

Non indispensabile che il numero di animali che compongono il campione all'interno di ciascuno
strato sia proporzionale alla dimensione dello strato nella popolazione. Cio, in altre parole, si pu
effettuare un campionamento "non proporzionale". Naturalmente, con un campionamento non
proporzionale, le inferenze sulla
popolazione andranno debitamente
aggiustate.

ESEMPIO. Vuoi effettuare un


campionamento per randomizzazione
stratificata in una popolazione di suini. Il
carattere di popolazione importante ai fini
della stratificazione il peso. La
popolazione distribuita, in rapporto al
peso, come indicato nella tabella a lato.
Nella stessa tabella vengono riportati due
esempi di campionamento (proporzionale e non proporzionale), supponendo di voler ottenere un
campione di dimensione pari al 10% della popolazione.
196

9.
Campionamento
9.9 Campionamento a grappolo

OBIETTIVO:

apprendere modalit e caratteristiche del campionamento a grappolo o "a cluster" (cluster


sampling)

Il campionamento a grappolo consiste un un metodo in cui, invece di procedere alla selezione


diretta delle singole unit di interesse, si selezionano di gruppi (grappoli o cluster) di unit. Nella
pratica, spesso i cluster sono gi preformati, e comprendono un numero limitato di unit (es. nidiate
di suinetti, box di vitelli, ecc.). In alternativa, i cluster possono essere individuati artificialmente (es.
cluster di allevamenti
raggruppati su base
geografica).

ESEMPIO 1. Devi verificare la presenza di una infezione virale che colpisce


i cuccioli di cane poco dopo la nascita. A questo scopo devi prelevare un
campione di sangue da sottoporre ad esami di laboratorio. L'unit di indagine
rappresentata dal cucciolo. La lista di campionamento rappresentata da tutti i cuccioli che
nasceranno, durante un determinato periodo di tempo, negli allevamenti da controllare. Decidi di
effettuare un campionamento a grappolo, selezionando, mediante randomizzazione semplice o
sistematica, un certo numero di nidiate. Ci ti consente di ridurre le risorse da impiegare nella
indagine, e di minimizzare lo stress agli animali.

ESEMPIO 2. Un allevamento di galline ovaiole composto da un


solo grande capannone che ospita 6000 galline alloggiate in 1500
gabbie contenenti 4 soggetti ciascuno. La lista di campionamento
rappresentata da tutte le galline. necessario prelevare un
campione di sangue da un campione di 300 animali. Effettui un
campionamento a grappolo, selezionando (per randomizzazione
semplice oppure sistematica) 75 gabbie, e prelevando il campione
di sangue dai dai 4 soggetti presenti in ciascuna .
197

Nello schema che segue viene riassunto un procedimento di selezione del campione mediante
campionamento a grappolo.

Rispetto alla randomizzazione semplice, sistematica o stratificata, il campionamento a grappolo


offre il vantaggio di facilitare notevolmente il reclutamento dei soggetti; di conseguenza si
abbassano costi e tempi dell'indagine. Tuttavia, proprio perch si lavora su gruppi preformati,
l'errore di campionamento pu essere pi elevato rispetto ai suddetti metodi di randomizzazione.
198

9.
Campionamento
9.10 Variabilit di una stima

OBIETTIVO:

esaminare i rapporti fra campione e popolazione da cui esso proviene

Finora abbiamo descritto alcuni metodi che consentono di estrarre da una popolazione un campione
affidabile. In questa Unit (es in quelle successive) vediamo come si utilizzano i dati che si
ottengono dallo studio del campione.

Dopo aver selezionato un campione, procederai a misurare il parametro che ti interessa su tutte le
unit) del campione stesso. Alla fine del tuo lavoro, conoscerai lo stato degli animali che
compongono il campione. Per, in realt, questo dato non ti interessa molto: infatti, a te interessa
conoscere lo stato degli animali dell'intera popolazione!

ESEMPIO. E' necessario valutare la copertura anticorpale per il virus della


pseudopeste in un gruppo di 1000 galline. Prelevi un campione di sangue da 20
soggetti scelti mediante randomizzazione, e poi effettui il dosaggio degli anticorpi
pseudopeste. Delle 20 galline, 18 (90%) risultano protette. Questa conclusione non
ti soddisfa del tutto: in effetti, a te interessa sapere qual la percentuale di animali
protetti nell'intero gruppo e non nel campione!

Proseguiamo il ragionamento iniziato nell'esempio. Sicuramente il tuo buon senso ti porter a


ritenere che, se protetto il 90% del campione, allora sar protetto il 90% della popolazione. Pi in
generale:
199

L'uguaglianza dello schema non una vera uguaglianza matematica. Tornando all'esempio: puoi
essere sicuro che siano protette proprio 900 galline su 1000? Ovviamente no, potrebbero essere, per
esempio, 870 o 815, o 945 ecc.. In sostanza, il problema che stiamo affrontando quello di fare un
corretto processo di inferenza. In altre parole, dobbiamo passare dal particolare (il campione) al
generale (la popolazione) senza commettere un errore troppo grande. Ci non pu essere ottenuto
ricorrendo al semplice buon senso. Il problema va risolto, invece, con un metodo oggettivo,
ricorrendo alla statistica inferenziale (non farti spaventare da questa terminologia... vedrai che pi
facile di quel che pensi!).
Sar quello che faremo nelle prossime Unit di questo Capitolo.

In base a quanto detto finora, dovresti essere convinto che l'uguaglianza dello schema precedente va
sostituita con questa:

Il processo di inferenza porta sempre con s una certa quota di errore. Ci inevitabile, perch il
campione non potr mai essere perfettamente rappresentativo della popolazione da cui proviene.
Pertanto, attraverso la misura ottenuta su un campione, potremo soltanto ottenere una stima della
200

vera caratteristica della popolazione. Questa stima, come vedrai nelle prossime Unit, pu essere
calcolata facilmente.

Per ora baster dire che la precisione della stima influenzata da alcuni fattori, dei quali ne conosci
gi uno: il metodo di campionamento. Infatti, se il campionamento non stato fatto correttamente, il
campione distorto, non rappresentativo della popolazione, e quindi la stima inaffidabile.

Un altro fattore molto importante che influisce sulla precisione della stima il numero di
animali che compongono il campione (numerosit del campione). Anche questo un concetto
facilmente intuibile: campioni grandi sono pi affidabili, e permettono stime pi precise

ESEMPIO. Continuando l'esempio precedente, se tu avessi selezionato un campione di 200 galline


(anzich di 20), ti saresti avvicinato maggiormente alla vera percentuale di animali protetti nel
gruppo di 1000, e quindi avresti potuto fare una stima pi precisa. L'opposto sarebbe accaduto se tu
avessi esaminato un campione composto soltanto da 4 galline.

Riassumendo: stima significa valutazione approssimativa. La stima, per sua stessa natura, non
pu essere esatta ma, se il campione stato selezionato con una metodica corretta
(randomizzazione), ne potremo stabilire la variabilit, ossia i limiti probabili di oscillazione.
201

9.
Campionamento
9.11 Esempio di calcolo della variabilit di una stima

OBIETTIVO:

analizzare un esempio di calcolo della stima di prevalenza di una malattia in una popolazione in
base ai risultati di un campione randomizzato

constatare che la variabilit di una misura effettuata su un campione non dipende dalla
numerosit della popolazione

Un esempio esplicativo

Supponi di voler accertare, attraverso l'impiego di un test, il


numero di animali colpiti da una certa malattia subclinica
in un allevamento ove sono presenti 500 suini all'ingrasso,
sistemati in 20 box da 25 animali ciascuno. Per rendere i
calcoli pi semplici, ipotizziamo che il test fornisca sempre
risultati veritieri.
Non possiedi risorse sufficienti per esaminare tutti i 500
animali (che rappresentano la "popolazione di interesse"), ed allora decidi di saggiare un
campione costituito da 40 suini. A questo scopo, effettui un campionamento a grappolo,
sottoponendo al test 2 animali per ogni box, scelti a caso. In questo modo ottieni un campione
randomizzato di 40 animali.

Nota. Il campionamento a grappolo stato scelto perch, nello scenario ipotizzato, quello pi
conveniente sul piano pratico. Ai fini dell'esempio, per, avresti potuto utilizzare un altro tipo di
campionamento, purch randomizzato (es. randomizzazione semplice, o randomizzazione
sistematica, o sttatificata).

Sottoponi al test i 40 animali del campione; 14 di essi risultano test-positivi. Quindi, nel campione
la proporzione di positivi pari a 14/40=0.35. Quindi: p=0.35, ossia 35%. Poich il campione
randomizzato, non sono presenti fonti di distorsione (bias) e, quindi, esso rappresentativo della
popolazione di interesse (i 500 suini).
Allora, inizialmente, ragionevole assumere che anche nella popolazione la positivit sia all'incirca
pari a 0.35. La situazione viene riassunta nello schema che segue:
202

Come gi detto, la composizione del campione influenzata soltanto dal caso (non ci sono errori
sistematici). Pertanto, il valore statistico che hai calcolato (0.35) influenzato soltanto dall' errore
campionario, di cui possiamo calcolare i limiti.

In altre parole, possiamo stimare quale sar la vera proporzione di test-positivi nella popolazione.
A questo scopo, a partire dalla proporzione p ottenuta (0.35), dobbiamo calcolare dapprima la
varianza e poi, da questa, l'errore standard. Quest'ultimo rappresenta l'indice della variabilit
della nostra statistica. Il calcolo si esegue come segue:

La variabilit della proporzione di animali test-positivi ottenuta dallo studio del campione pu
essere stimata come segue:

Con i dati del nostro esempio, abbiamo:


203

Se lo preferisci, puoi convertire la proporzione in valore percentuale, semplicemente moltiplicando


per 100. Allora ottieni:

Ecco espresso qui sopra il concetto di stima: essa ti dice che puoi essere abbastanza sicuro che la
vera percentuale di test-positivi nella popolazione sia compresa fra 27.5 e 42.5%. Questa stessa
affermazione pu essere espressa meglio cos: esiste una certa probabilit che la vera percentuale
di test-positivi nella popolazione sia compresa fra 27.5 e 42.5 %.

Naturalmente non possiamo accontentarci di affermare genericamente che esiste una certa
probabilit: questa certa probabilit vogliamo conoscerla! quello che faremo nella prossima
Unit, in cui porteremo a termine l'esempio qui iniziato.

Dalla formula per il calcolo della varianza puoi dedurre che la grandezza dell'errore standard in
relazione inversa con la numerosit del campione, Ci conferma quanto detto nell'Unit precedente:
pi il campione, pi la stima precisa.
Invece, contrariamente a quanto si pensa comunemente, la precisione della stima non dipende dalla
numerosit della popolazione da cui il campione stato estratto (a patto che il campione sia
"abbastanza" piccolo - diciamo almeno 10 volte pi piccolo - rispetto alla popolazione).
Nell'esempio ora concluso, l'errore standard assume lo stesso valore nel caso in cui il campione di
40 animali provenga da una popolazione di 500 o, per esempio, di 5000 o di 50000 ecc. Infatti,
come puoi verificare dando un'occhiata ai calcoli, la numerosit della popolazione non compare nel
procedimento di calcolo dell'errore standard.

La relazione esistente tra p ed errore standard


(v. grafico a lato) molto interessante perch ti
aiuta a comprendere il motivo per cui l'errore
standard cos utile per esprimere la variabilit
di una proporzione. Se tutti i soggetti si
trovano in una classe oppure nell'altra (ad
esempio sono tutti test-negativi oppure tutti
test-positivi), allora p=0 oppure p=1, e quindi
la radice quadrata di p*(1-p), ossia l'errore
standard, pari a zero. Questa conclusione
ragionevole, in quanto l'errore standard una
misura di variabilit, ed ovviamente se tutti gli individui della popolazione appartengono alla stessa
classe la variabilit uguale a zero.
Al contrario, la massima variabilit si ha quando ogni elemento della popolazione ha uguale
probabilit di appartenere ad una classe o all'altra (ossia: p=0.5). In questo caso, l'errore standard
assume il massimo valore possibile, ossia 0.5.
204

UN CASO PARTICOLARE: un campione grande rispetto alla popolazione. Se la numerosit del


campione superiore a 1/10 della numerosit della popolazione, allora nel calcolo dell'errore
standard occorre introdurre un fattore di correzione detto "correzione per una popolazione finita".
Definiamo:
N la numerosit della popolazione;
n la numerosit del campione.
Il fattore di correzione si calcola come: (N-n)/N. Esso si utilizza come nell'esempio che segue.

Supponiamo di aver estratto, dalla stessa popolazione di 500 suini dell'esempio precedente, un
campione di 100 animali, e di aver ottenuto la stessa proporzione di animali positivi (35%). Si tratta
di un campione relativamente grande, pari a 1/5 della popolazione, e quindi nel calcolo dell'errore
standard necessario considerare il fattore di correzione per una popolazione finita. Perci, il
calcolo dell'errore standard diventa:

A rigore, il fattore di correzione dovrebbe essere utilizzato anche nel caso di campioni piccoli
rispetto alla popolazione. Tuttavia quando il campione piccolo il valore del fattore di correzione si
approssima ad 1, e quindi diviene ininfluente nel calcolo dell'errore standard. Per questo motivo
esso viene generalmente omesso.

Foglio di calcolo per Microsoft Excel che visualizza, con un diagramma a torta, i limiti fiduciali in
un campione a scelta.
205

9.
Campionamento
9.12 Errore standard e limiti fiduciali

OBIETTIVI:

apprendere il concetto di limiti fiduciali

utilizzare l'errore standard per il calcolo dei limiti fiduciali

Calcoliamo l'intervallo di confidenza

Proseguiamo l'esempio lasciato in sospeso nella Unit precedente (se non l'hai letta, ti consiglio di
farlo ora). Riassumendo: avevi studiato un campione di 40 suini, avevi calcolato un semplice valore
statistico: la proporzione di animali positivi per una certa malattia. I suini positivi erano 14, quindi
la proporzione era risultata pari a 14/40=0.35 (35%); l'errore standard di questa proporzione era di
0.0754 (7.54%).

L'errore standard rappresenta un indice della variabilit della proporzione; possiamo anche dire
una misura l'affidabilit della proporzione: pi esso piccolo, pi la proporzione che hai calcolato
nel campione si avvicina alla vera proporzione della popolazione.

Nella pratica, l'errore standard serve per calcolare l'intervallo fiduciale o intervallo di confidenza
(sinonimo: limiti fiduciali) della proporzione. L'intervallo di confidenza l'intervallo di valori entro
i quali si stima che cada, con un livello di probabilit scelto a piacere, il valore vero della
popolazione. In realt si sceglie quasi sempre un livello di probabilit di 0.95 o, pi raramente, 0.99,
ottenendo rispettivamente l'intervallo di confidenza al 95% o al 99%.

L'intervallo di confidenza per una proporzione si calcola come segue:


206

Certamente ti chiederai da dove vengono i valori scritti in blu nello schema soprastante. Per quanto
riguarda i moltiplicatori dell'errore standard, la risposta presuppone nonzioni di statistica un po'
avanzate; quindi sarebbe troppo complicata ed al di fuori dello scopo di questo Quaderno. Quindi ti
consiglio di prendere questi due valori (1.96 e 2.58) come numeri magici da utilizzare senza porti
troppe domande.

L'intervallo di confidenza calcolato come: valore statistico 1 volta l'errore standard fornisce una
confidenza del 68% circa, troppo bassa per essere di una qualche utilit pratica.

Per quanto riguarda i due livelli (0.95 e 0.99, oppure in percentuale 95% e 99%) di probabilit, si
pu dire che essi sono adottati per convenzione, e rappresentano uno standard nel campo bio-
medico. Essi consentono di avere una probabilit abbastanza alta (appunto 95% o 99%) di
individuare l'intervallo giusto senza per ampliarlo eccessivamente. Infatti evidente, dalle
formule dello schema soprastante, che l'ampiezza dell'intervallo cresce con l'aumentare della
probabilit.

Torniamo al nostro esempio. Con i dati che hai a disposizione, l'intervallo di confidenza 95% si
calcola come segue:

Ed analogamente l'intervallo di confidenza 99%:

Nello schema che segue visualizzato il raffronto fra l'ampiezza dei due intervalli di confidenza.
207

In conclusione, puoi affermare:

con confidenza 95% che la percentuale di positivit nella popolazione compresa fra 20% e 50%
circa;
con confidenza 99% che la percentuale di positivit nella popolazione compresa fra 15% e 55%
circa;

Ripetiamo ancora il significato dell'espressione confidenza 95%: c' una probabilit del 95%
che l'intervallo trovato includa la vera caratteristica della popolazione.

Questa definizione non del tutto corretta, e certamente uno statistico puro potrebbe storcere il
naso... ma in questa sede giustificata dal Teorema di Saki che recita: una piccola inesattezza a
volte risparmia tonnellate di spiegazioni :-))

Ecco una definizione migliore (ma anche un po' pi difficile da assimilare): confidenza 95%
significa che se ripetessimo la stessa indagine per 100 volte con gli stessi metodi (ma su 100
campioni diversi), probabilmente otterremmo ogni volta una stima diversa; tuttavia, il vero valore
della popolazione sarebbe all'interno del nostro intervallo di confidenza 95 volte su 100. In altre
parole, l'intervallo di confidenza fornisce un risultato aderente alla realt nel 95% dei casi.

Un caso diverso: l'intervallo di confidenza di una media

Prima di trattare questo argomento, vale la pena di fare un po' di chiarezza riguardo a due statistiche
sulle quali molto spesso c' confusione: la deviazione standard e l'errore standard.

La deviazione standard indica variabilit di una misura effettuata sul campione; invece, l'errore
standard indica la variabilit di un valore statistico (es. una percentuale, una media ecc.). Devi fare
attenzione a non confondere l'errore standard con la deviazione standard! Si tratta di due cose molto
diverse. Ripetiamo di nuovo:

la deviazione standard descrive la variabilit di una serie di misure effettuate su un campione o una
popolazione.
l'errore standard descrive l'incertezza nella stima di un valore statistico (es. media, proporzione
ecc.);
208

ESEMPIO. Sono stati pesati singolarmente 100 suini, ottenendo alttrettanti valori (es. 94.0, 92.2.,
97.9 ecc.). Il peso medio risultato pari a 95.2 kg. Sui 100 valori del peso di ciascun suino puoi
calcolare la deviazione standard (come gi descritto altrove). Sulla media ottenuta puoi invece
calcolare l'errore standard.

Abbiamo visto come si calcola l'errore standard di una proporzione (o percentuale). Ma come si fa a
calcolare l'errore standard di una media? molto semplice: basta dividere la deviazione standard
per la radice quadrata della numerosit del campione (n):

Nota che, ancora una volta, l'errore standard dipende dalla numerosit del campione: pi grande il
campione, pi piccolo sar l'errore standard, e quindi pi attendibilit la media calcolata.

L'errore standard della media pu essere utilizzato per calcolare l'intervallo di confidenza, cos
come gi visto per le proporzioni. Il calcolo molto simile:

dove t un coefficiente desumibile dalla Tabella dei valori t per la distribuzione di Student (ne
trovi qui una semplificata). Nell'uso della tabella, devi tener conto che i gradi di libert si calcolano
come: numerosit del campione - 1.

ESEMPIO. Hai misurato il peso di un campione di 29 suini di un gruppo in allevamento. La media


risultata pari a 82.5 kg, con una deviazione standard di 3.50 kg. L'errore standard della media :

L'intervallo di confidenza 95%, con 28 gradi di libert, :

Puoi concludere, con confidenza 95%, che il peso medio dei suini del gruppo compreso fra 81.17
e 83.83kg.
209

9.
Campionamento
9.13 Dimensione o numerosit del campione

OBIETTIVO:

acquisire informazioni sui criteri che regolano la scelta del numero di unit che compongono il
campione da studiare ("numerosit del campione");

apprendere un semplice metodo per determinare la dimensione di un campione

Secondo l'opinione comune, la bont dei risultati ottenibili da un campione (ad esempio i risultati di
un sondaggio) dipende unicamente dal numero degli individui che compongono il campione stesso
e non dal modo con cui essi sono stati selezionati. La debolezza di questo assunto gi stata
dimostrata nelle unit precedenti.

Un'altra opinione comune prevede che la dimensione del campione debba essere proporzionata alla
dimensione della popolazione in studio. Le leggi della statistica dimostrano invece che questo
assunto completamente falso. Ad esempio, il fatto di voler fare un sondaggio sugli abitanti di un
capoluogo di provincia, su quelli di una grande citt o addirittura su tutta la popolazione italiana
non ha nessuna influenza sul numero di persone necessario per ottenere un campione
rappresentativo. Insomma, contrariamente a quello che l'intuito potrebbe suggerire, un campione di
1000 persone pu, se scelto con un metodo appropriato, rappresentare con la stessa attendibilit e
gli stessi limiti la popolazione di Parma, oppure quella dell'Emilia, oppure quella dell'intera Italia,
nel senso che il margine di errore dovuto al campionamento sar sempre pari al 3% circa. Ci a
patto che la popolazione sia sufficientemente grande, ossia composta da almeno 10000 unit.

D'altra parte, a questa stessa conclusione si pu giungere in base a quanto contenuto nella unit
precedente, in cui si spiega che l'errore standard di una proporzione in relazione inversa con la
dimensione del campione, ma non dipende affatto dalla numerosit della popolazione in studio.
Infatti - come gi visto - nel calcolo dell'intervallo di confidenza 95% di una proporzione, la
numerosit della popolazione da cui il campione proviene non viene considerata:

Applicando la soprastante formula che permette di calcolare l'intervallo di confidenza 95%,


verifichiamo l'affermazione secondo la quale il margine di errore con un campione di 1000 unit
sempre <3%.
Supponiamo che p=0.5, ossia che la proporzione di animali immuni nel campione sia del 50%.
Applicando la formula, otteniamo p = 0.5 0.031, ossia 50% 3.1%.
210

Ci nel caso in cui la varianza nella popolazione sia massima (p=0.5); negli altri casi, il margine di
errore risulta ancora pi basso. Ad esempio, con p=0.25, l'I.C.95% 25% 2.7%.

E' abbastanza naturale che, prima di intraprendere un'indagine epidemiologica, ci si interroghi su


quante unit di interesse (animali o allevamenti ecc.) dovranno essere esaminate per
raggiungere con sufficiente attendibilit l'obiettivo desiderato.
Questa una delle parti pi delicate nella pianificazione di una indagine. Ovviamente, pi grande
sar il campione e pi precisi e attendibili saranno i risultati, a patto che il campione sia stato
selezionato con un metodo corretto. Tuttavia, indagini su campioni di grandi dimensioni sono pi
costose e richiedono pi tempo. Quindi, bisogna accettare un compromesso.

Il calcolo della dimensione del campione, pi propriamente detta numerosit, abbastanza


complicato e, soprattutto, richiede la conoscenza di informazioni diverse. I principali fattori che da
considerare nell'individuazione della numerosit del campione sono: la varianza ed l'ampiezza
desiderata dell'intervallo di confidenza.

La varianza

La varianza una misura del grado di variazioni o oscillazioni presenti, relativamente al parametro
che vogliamo stimare, nella popolazione. L'entit di queste variazioni pu essere derivata, almeno
approssimativamente, dall'esperienza, o dai risultati di altre analoghe indagini effettuate in
precedenza, o dalla conoscenza della storia naturale della malattia, o da altri fattori.
Una popolazione in cui il parametro da misurare presenta ampie oscillazioni ha una varianza
elevata; una popolazione in cui le oscillazioni sono scarse ha una varianza bassa. intuitivo che la
precisione di un campione maggiore quando la popolazione da cui stato estratto
tendenzialmente omogenea, mentre minore quando la popolazione eterogenea.

ESEMPIO. Consideriamo due diverse popolazioni. La popolazione A costituita da bovine da latte


ad alta produzione della stessa razza ed allevate in grandi allevamenti intensivi. La popolazione B
rappresentata da bovine da latte di razza diversa ed allevate in allevamenti a differente tipologia (sia
intensivi che piccoli allevamenti tradizionali). Se siamo interessati al calcolo della produzione
media di latte nelle due popolazioni, sar evidente che la varianza della popolazione A sar minore
rispetto alla varianza della popolazione B.

La varianza un fattore importante nel calcolo della numerosit del campione. In popolazioni a
bassa varianza, lo studio di pochi animali fornisce comunque un buon quadro della vera
caratteristica di popolazione.
211

In una popolazione teorica composta da n individui tutti identici fra loro, lo studio di 1 solo
individuo sufficiente per ottenere una indicazione precisa riguardo alla intera popolazione.

Al contrario, se la varianza alta, sono necessari molti animali, poich ciascuno degli animali
prescelti pu essere molto diverso dalla media della popolazione.

Il livello di confidenza

L'intervallo di confidenza rappresenta una misura della bont di una stima. Un intervallo di
confidenza molto ampio suggerisce che non siamo molto sicuri del punto in cui si trova il vero
valore. Viceversa, un intervallo ristretto indica che siamo abbastanza sicuri che il valore trovato
piuttosto vicino al valore vero della popolazione; in questo caso la stima sar, quindi, pi precisa.
Il livello di confidenza una misura della sicurezza della stima: ad esempio, con un livello di
confidenza 95% siamo sicuri al 95% che il valore vero cade nell'intervallo trovato. Cio, se
ripetessimo lo studio 20 volte, in media sbaglieremmo 1 volta ma saremmo nel giusto 19 volte.
Per convenzione si utilizza generalmente il livello di confidenza 95%; talvolta si impiegano anche i
livelli 90% o 99% o 99.9%. La scelta del livello di confidenza spesso dettata da considerazioni
pratiche (quantit di risorse e di tempo disponibili ecc.) pi che dalla teoria. chiaro che, se
desideri raggiungere un livello di confidenza elevato, dovrai esaminare un campione pi grande.

Anche la performance del test che verr utilizzato gioca un ruolo importante nel calcolo della
numerosit del campione. Se il test poco affidabile (cio a bassa sensibilit e/o specificit),
allora la numerosit del campione dovr essere alta. Questo argomento viene trattato
estensivamente nel (cio a bassa Capitolo 11.

Una formula semplice per determinare la dimensione del campione

All'atto pratico, la determinazione della numerosit del campione dipende da considerazioni di tipo

non-statistico;
statistico.

Le prime riguardano, ad esempio, le risorse disponibili (mano d'opera e finanziamenti, l'universo di


riferimento ecc.) gi accennate. Le considerazioni di tipo statistico consistono nella precisione
desiderata e nella frequenza attesa (ossia che si prevede di ottenere) della variabile che si vuole
studiare.

PRECISIONE DESIDERATA. Viene espressa attraverso l'errore massimo tollerabile e pu essere


calcolata in termini assoluti o relativi.

ESEMPIO. Vuoi accertare la proporzione di animali ammalati ( "prevalenza") in una popolazione


di bovini. In base ad una serie di elementi in tuo possesso (es. indagini gi effettuate in precedenza
nella stessa popolazione, indagini simili in popolazioni simili ecc.) prevedi che la prevalenza pari a
0.3 (30%). Ritieni accettabile un errore del 7%. Quanti bovini della popolazione dovranno essere
212

studiati se la stima derivante dal campione deve cadere entro 7 punti percentuali rispetto alla vera
prevalenza, con confidenza 95%?

PREVALENZA ATTESA. Sembra paradossale suggerire che occorre "indovinare" la prevalenza


prima di effettuare un'indagine che ha lo scopo di accertare la prevalenza, ma... proprio cos.
Molto spesso, per c' qualche indizio che permette di avvicinarsi al valore reale. Se proprio non
sai... che pesci prendere, ipotizza una prevalenza 0.5 (ossia 50%): questo approccio di tipo
conservativo, nel senso che, come potrai dedurre dalla formula che imparerai fra poco, una
prevalenza del 50% ti fa adottare un campione grande.

La formula

Supponi di voler stimare la prevalenza di una malattia (o di un altro carattere) in una popolazione.
Come gi detto, attraverso lo studio del campione vuoi una stima della prevalenza con una
determinata precisione ed a un prescelto livello di confidenza. La dimensione pu essere calcolata,
con un livello di confidenza 95%, attraverso la seguente formula:

Se desideri una confidenza del 99%, sostituisci il valore 1.96 con 2.58.

Ora, per mezzo di un esempio, calcolerai la dimensione del campione necessaria in una indagine.

Sospetti che la prevalenza di una malattia in una popolazione sia pari a 0.3. Vuoi studiare un
campione per stimare la prevalenza della malattia nella popolazione con precisione 0.07 (ossia 7%).
Ci significa che, ammesso che il tuo pronostico di prevalenza 0.3 sia abbastanza giusto, ti aspetti
che i limiti dell'intervallo di confidenza della stima siano compresi fra 0.23 e 0.37. Vuoi calcolare la
dimensione del campione necessaria.

Sostituendo i valori appropriati nella formula, ottieni:

Per ottenere il tuo scopo, dovrai esaminare un campione di 165 animali.

Puoi verificare a ritroso, come descritto di seguito ed utilizzando conoscenze che hai gi acquisito,
che un tal campione risponda alle tue aspettative:
hai estratto un campione di 165 animali;
supponi che, fra questi, ne siano risultati ammalati 44 (prevalenza = 44/165= 0.26, valore
abbastanza vicino alla tua previsione);
il valore 0.26 una stima, ne puoi calcolare la variabilit attraverso l'errore standard (magari con
l'aiuto del foglio di calcolo);
l'errore standard risulta pari a 0.034;
213

conoscendo l'errore standard puoi calcolare i limiti fiduciali 95% (o intervallo di confidenza
95%);
ottieni un limite fiduciale inferiore di 0.19 ed un limite superiore di 0.33
la precisione della tua stima , come desiderato, del 7%. Infatti: 0.26-0.19=0.07 ed anche 0.26-
0.33=-0.07.

Infine, resta da aggiungere che se il campione piuttosto grande (circa 1/20 o pi) rispetto alla
popolazione da cui stato estratto, se ne pu ridurre la numerosit con la formula che segue:

Se, nell'esempio precedente, i 165 animali dovessero essere estratti da una popolazione di 740,
allora il campione potrebbe essere ridotto a (165*740)/(165+740)=135.

Foglio di calcolo per Microsoft Excel per calcolare la numerosit del campione.
214

9.
Campionamento
9.9 Campionamento mirato al rilevamento della presenza di malattia

OBIETTIVO:

apprendere un metodo per calcolare la dimensione del campione al fine di escludere/confermare


la presenza di malattia in una popolazione

In alcuni casi, lo scopo del campionamento non quello di stimare un parametro quantitativo della
popolazione o di valutare la frequenza di un fenomeno, bens, pi semplicemente, quello di stabilire
qualitativamente se una malattia presente (o no) in una determinata popolazione.

Questa necessit si verifica spesso in occasione di epidemie per verificare l'eventuale diffusione sul
territorio di una malattia infettiva. La stessa necessit emerge anche in corso programmi di
monitoraggio o controllo o eradicazione di una malattia.

Consideriamo ad esempio le seguenti situazioni:

nei programmi di controllo delle malattie diffusibili negli allevamenti intensivi di diverse specie
animali, si pu adottare lo schema dell'allevamento accreditato. Questo schema utile
soprattutto negli allevamento di riproduzione che forniscono animali ad altri allevatori.
L'accreditamento prevede che l'allevamento venga sottoposto a test che consentono di dichiararlo
indenne da determinate malattie. Ci significa che gli acquirenti possono acquistare con
maggiore tranquillit e, d'altra parte, gli animali provenienti da allevamenti accreditati spuntano
prezzi pi elevati rispetto agli animali convenzionali.
i piani di profilassi su scala nazionale tendono, in genere, a ottenere una popolazione indenne da
una particolare malattia, attraverso un processo (es. abbattimento oppure vaccinazione seguita da
abbattimento ecc.) che conduce alla eradicazione della malattia. Alla fine del piano di
eradicazione, le Autorit sanitarie devono avere la certezza che la malattia stata eradicata. In
seguito, sono necessarie azioni di monitoraggio per accertare il mantenimento dello stato di
indennit.
l'esportazione di animali vivi o di loro prodotti uno strumento importante per il progresso
dell'agricoltura, soprattutto dei paesi meno sviluppati; tuttavia, ad un Paese esportatore viene
sempre richiesto, da parte del Paese importatore, di dimostrare che lo scambio non comporta rischi
di diffusione di malattie trasmissibili.

Il problema principale legato al fatto che molto difficile - se non impossibile - dimostrare con
certezza matematica che una popolazione di animali esente da una determinata malattia. Le
difficolt derivano da 2 fattori principali:

1. Il primo fattore legato al fatto che, per dichiarare indenne la popolazione, si deve saggiare ogni
animale che fa parte della popolazione stessa. Ci comporta, soprattutto nel caso di popolazioni
costituite da un ingente numero di individui, l'impiego di risorse ingenti (e non sempre disponibili).
2. Il secondo fattore legato al test che si utilizza per il rilevamento dello stato di malattia o di
infezione. Nessun test perfetto; molti test possono fornire, anche se in piccola percentuale,
215

risultati falsi-negativi. Ossia, il test pu classificare come sano un animale che in realt
ammalato

ESEMPIO. Abbiamo un allevamento di galline costituito da circa


40.000 riproduttori (cio che producono uova destinate
all'incubazione). Dobbiamo dimostrare che gli animali sono
indenni da pullorosi (malattia sostenuta da Salmonella pullorum,
caratterizzata dalla trasmissione per via verticale). Per ottenere
una dimostrazione certa dovremo esaminare tutti le 40.000
galline. Infatti, possibile (anche se improbabile) che l'infezione
sia localizzata ad un solo o a pochissimi animali. Esaminando un campione, si corre il rischio di
non includere nel campione i pochi animali infetti.
Decidiamo quindi di sottoporre al test diagnostico tutte le galline; supponiamo che i risultati siano
tutti negativi. A questo punto, siamo CERTI che la malattia non presente nella popolazione?
Ovviamente no, perch il test potrebbe aver fornito qualche esito falso-negativo.
Quindi, concludiamo che:

Tenuto conto delle difficolt ora esposte, si pu aggirare il problema considerando che una malattia,
se presente nella popolazione, probabilmente colpir un certo numero di individui e non uno solo..

Su questa base, potrebbe essere molto interessante rispondere alla seguente domanda:

ESEMPIO. Possiamo prevedere che la salmonellosi del suino, che una malattia contagiosa,
difficilmente colpir meno del 5% dei soggetti appartenenti ad un gruppo. Possiamo calcolare la
numerosit del campione tale che si possa identificare con una certa sicurezza (confidenza!) la
presenza della malattia, se essa presente nel gruppo. In altre parole, possiamo estrarre dal gruppo
un numero di animali tale che da avere nel campione almeno 1 soggetto positivo.

La risposta si trova nella formula che segue, utile per risolvere il problema impegnando il minimo
di risorse, ed ottenendo un risultato affidabile ad un livello di confidenza prescelto. Questo livello di
confidenza misura la probabilit che la popolazione sia esente dalla malattia se tutti gli n individui
del campione esaminato risultano negativi; in genere si adotta un livello di confidenza 0.95 (95%) o
0.99 (99%).
216

Formula tratta da: Cannon R.M., Roe R.T. (1982). Livestock Disease Surveys: a Field Manual for
Veterinarians. Australian Government Publishing Service, Canberra.

Nella prossima Unit la formula viene applicata ad un esempio pratico.

Nel caso in cui la popolazione oggetto dell'indagine sia di numerosit infinita (o composta da un
numero elevato di unit, dell'ordine di migliaia), si pu adottare la seguente formula, pi semplice,
che fornisce all'incirca gli stessi risultati della precedente a patto che la prevalenza presunta sia >5%
circa:

Concludendo: anche se non possiamo provare con certezza che una popolazione esente da una
malattia, possiamo per ottenere una stima, con precisione a nostra scelta, saggiando un numero
adeguato di animali. In altre parole, potremo dimostrare con un certo grado di probabilit che la
malattia non presente nella popolazione.

da sottolineare che per l'applicazione della formula richiesta la conoscenza presuntiva di D, cio
del numero di animali positivi nella popolazione ( prevalenza). Questa stima presuntiva pu
essere effettuata in base alla conoscenza dei caratteri generali della malattia in studio, della sua
storia naturale, dei meccanismi di trasmissione, della situazione ambientale e geografica e di altri
fattori contingenti.

Foglio di calcolo per Microsoft Excel che visualizza, con un diagramma a torta, la dimensione del
campione in rapporto alla prevalenza della malattia ed al livello di confidenza.
217

9.
Campionamento
9.15 Esempio di campionamento mirato al rilevamento di malattia

OBIETTIVO:

verificare, tramite un esempio, l'utilizzo della formula che fornisce la numerosit del campione
qualora si voglia rilevare la presenza di una malattia.

Nella Unit precedente stato descritto un metodo di determinazione della numerosit del
campione nel caso si voglia determinare qualitativamente la presenza/assenza di una malattia in una
popolazione. Ora mettiamo alla prova il metodo attraverso un esempio.

Supponi di dover accertare se, in un allevamento di 1000 suinetti


all'ingrasso, presente la Rinite atrofica, una malattia sostenuta da
due batteri Gram negativi: Bordetella bronchiseptica (forma lieve non
progressiva) oppure Pasteurella multocida (forma grave progressiva).
La prevalenza di questa malattia variabile, ma in genere non
raggiunge livelli elevati. Pertanto ipotizzi che, se l'infezione presente
nel gruppo, la sua prevalenza possa essere molto bassa: 0.01, ossia 1%,
o superiore. Ci significa che, se la malattia presente nel gruppo di 1000 suini, almeno 10 di essi
sono infetti.
Ovviamente non puoi permetterti di esaminare tutti gli animali, ma dovrai procedere su un
campione. Ti chiedi quindi: qual' la dimensione del campione per poter concludere con
ragionevole certezza che, se tutti gli animali del campione risultano negativi, il gruppo non
infetto?. La ragionevole certezza non altro che il livello di confidenza. Decidi di adottare un
livello di confidenza 0.95 (95%). Applicando la formula descritta nell'Unit precedente, ottieni:

Pertanto, esaminerai 258 suini; se tutti risulteranno negativi, concluderai - con confidenza 95% -
che il gruppo esente da quella malattia.
Il vantaggio di un approccio di questo tipo diventa ancor pi evidente nel caso in cui la prevalenza
presunta sia pi elevata: con gli stessi dati dell'esempio, ipotizzando per che il numero di animali
ammalati sia pari o superiore a 50, la dimensione del campione scende a 57 animali.

Guarda la Tabella che segue: comprenderai meglio l'estrema l'utilit della formula nel caso in cui
sia necessario stabilire se in una popolazione presente o no una malattia. Nella Tabella sono
riportati alcuni esempi di numerosit del campione in funzione della dimensione della dimensione
218

della popolazione, della frequenza (prevalenza) della malattia nella popolazione stessa e del livello
di confidenza prescelto (95 o 99%).

Proviamo ad usare la Tabella: supponi, ad esempio, di dover esaminare una popolazione composta
da 300 animali al fine di escludere la presenza di una determinata malattia, ipotizzando che il
numero di animali "positivi" in questa popolazione non sia inferiore a 15, ossia che la prevalenza
non sia inferiore a 0.05.
Nella Tabella, ti devi collocare sulla riga popolazione=300 e nella cella di intersezione con la
colonna prevalenza=0.05. Qui leggi i valori 54 e 78. Ci significa che, esaminando un campione
randomizzato di 54 animali senza trovare alcun positivo, potrai affermare con confidenza 95% che
quella popolazione esente dalla malattia. Per ottenere un livello di confidenza 99% dovresti
esaminare 78 animali.
Dai dati in Tabella puoi notare che la numerosit del campione fortemente influenzata dalla
prevalenza della malattia; quando la prevalenza molto elevata, il fattore numerosit della
popolazione diventa ininfluente.

Alla fine di questa Unit trovi un foglio di calcolo che ti permette di calcolare e visualizzare, con un
diagramma a torta, la numerosit del campione in rapporto alla prevalenza della malattia ed al
livello di confidenza prescelto.

Un problema leggermente diverso

In altre occasioni, pu essere utile rispondere ad un quesito concettualmente simile al precedente.


Supponi che siano stati esaminati n animali tratti da una popolazione a numerosit N; tutti gli n
animali esaminati sono risultati negativi. Il quesito il seguente: qual , con confidenza a scelta, il
numero massimo di animali malati nella popolazione?
219

Al quesito si risponde applicando la stessa formula vista nell'Unit precedente, ma che con un po' di
manipolazione algebrica stata risolta per D come segue:

ESEMPIO. Supponi di aver riscontrato che un campione di 200 galline,


appartenenti ad un gruppo di 5000, risultato negativo per una certa malattia (es.
pullorosi, una particolare forma di salmonellosi). Supponendo che la malattia sia
presente nel gruppo, qual il numero massimo di animali infetti presenti? A questa
domanda si risponde come segue:

Foglio di calcolo per Microsoft Excel che visualizza, con un diagramma a torta, la dimensione del
campione in rapporto alla prevalenza della malattia ed un livello di confidenza a scelta.
220

10. Misure di
frequenza delle malattie
10.1 Misure di frequenza delle malattie: espressione generale

OBIETTIVI:

apprendere i principi di base da utilizzare per la misura della frequenza di fenomeni morbosi

differenziare fra rapporti, tassi e proporzioni

Una attivit fondamentale in epidemiologia la quantificazione delle malattie o di fenomeni ad


esse correlati. La conoscenza del numero di individui ammalati o infetti in una popolazione
indispensabile per una vastissima gamma di motivi, fra i quali i pi importanti sono: stimare i
danni, prevedere l'evoluzione della malattia nel tempo, mettere a punto azioni di profilassi.

Per, la semplice enumerazione dei casi di malattia e la loro espressione come valore assoluto,
senza fornire alcun significativo riferimento, raramente utile. Per ottenere dei dati utilizzabili ed
interpretabili, dobbiamo esprimere i risultati delle nostre misure sotto forma di proporzioni o
rapporti, o tassi.

ESEMPIO 1. Supponiamo di aver osservato che, nell'arco di 1


anno, in una citt si sono verificati 500 incidenti in cui sono state
coinvolte automobili di colore grigio, mentre nel caso delle vetture
di qualsiasi altro colore gli incidenti sono stati soltanto 300. Questa
semplice enumerazione dei valori osservati ci autorizza a pensare
che guidare un'auto grigia pi rischioso che guidare un'auto di un
altro colore? Oppure: nel 2004 a Parma si verificato un solo
incidente in cui stata coinvolta una automobile rosa. Pensi che ci
dimostri che le auto rosa sono pi sicure delle altre?

ESEMPIO 2. Con un ragionamento analogo, potremo affermare che


"il letto il posto pi pericoloso che esiste, perch muoiono pi
persone nel letto che in qualsiasi altro luogo". Oppure che "le
persone ammalate muoiono pi frequentemente quando sono
ricoverate in ospedale che quando vengono curate a casa".
Ovviamente, queste affermazioni sono paradossi dovuti al fatto che si considera soltanto il numero
di morti in valore assoluto e non rapportato a qualche riferimento valido. Infatti, per esprimere
correttamente dati di questo tipo, bisogna utilizzare una frazione con un numeratore ed un
denominatore. In genere, molto facile stabilire la grandezza che sta al numeratore (in questo
caso: il numero di morti); pi difficile invece configurare un denominatore idoneo ad attribuire un
buon significato alla frazione. Ricordati: l'importante usare il denominatore giusto!

Le misure di frequenza delle malattie possono riferirsi ad una vasta gamma di eventi o di fenomeni.
Considera, ad esempio, lo schema seguente in cui vengono mostrate alcune componenti che
contribuiscono, come evento finale, alla morte degli animali per una malattia infettiva.
221

Dallo schema puoi notare che, in una popolazione, una certa quota di animali sono recettivi a quella
malattia infettiva; di questi, solo alcuni sono esposti all'agente causale; fra gli esposti, alcuni si
infettano e, fra gli infetti, alcuni si ammalano. Infine, alcuni degli ammalati muoiono. evidente
che, a seconda degli eventi considerati, si possono calcolare frequenze diverse. Ad esempio, potresti
calcolare la proporzione di:
- esposti sulla popolazione totale
- malati sugli esposti
- morti sulla popolazione totale
- morti sugli infetti
- di morti sugli ammalati
- eccetera

Potresti studiare anche la probabilit futura di eventi, cercando di prevedere, ad esempio, quanti
individui (o allevamenti ecc.) si infetteranno o si ammaleranno o verranno a morte in un
determinato periodo di tempo all'interno di popolazioni di dimensioni e con caratteristiche diverse.
Tutte queste misure (o previsioni) vengono espresse attraverso una frazione in cui al denominatore
si pone un valore appropriato a seconda della misura che si sta compiendo e dell'evento in studio.
Molto spesso, quando si studia l'evento malattia in una popolazione, al denominatore si pone il
numero di animali biologicamente capaci di esprimere l'evento-malattia, ossia tutti gli animali
che, in quella popolazione, possono ammalarsi, ossia presentare sintomi clinici della malattia. Ai
fini del calcolo, non verranno quindi considerati come facenti parte della popolazione quegli
animali che, per et, sesso, razza o altri fattori, non possono contrarre la malattia in oggetto.

ESEMPIO 1. Vuoi indagare sulla frequenza di oviduttite (flogosi dell'ovidotto) in un gruppo di polli
da riproduzione in cui sono presenti 4560 animali (570 galli e 3990 galline). La popolazione sar
rappresentata soltanto dalle 3990 femmine, in quanto i maschi non sono biologicamente capaci di
esprimere l'evento studiato.

ESEMPIO 2. La frequenza di cancro della cervice nella cagna verrebbe sottostimata se nella
popolazione venissero compresi anche i soggetti che sono stati sottoposti a isterectomia.

L'insieme degli individui biologicamente capaci di esprimere l'evento viene detto popolazione a
rischio. Gli individui della popolazione a rischio che sono soggetti ad uno o pi "fattori di rischio"
222

(assimilabili ai determinanti) vanno a formare la cosiddetta popolazione ad alto rischio, come


indicato nella figura seguente.

Vale la pena di sottolineare di nuovo anche che le misure di frequenza delle malattie, per avere un
senso, devono essere indipendenti dalle dimensioni della popolazione. Perci assurdo esprimere il
numero dei soggetti che presentano un certo carattere in una popolazione utilizzando semplicemente
un un valore assoluto.

ESEMPIO. Considera la seguente affermazione: Nell'allevamento di suini del sig. X oggi vi sono
15 animali ammalati.. Questa affermazione non chiarisce affatto la situazione dell'allevamento:
infatti i 15 ammalati potrebbero far parte di un piccolo allevamento di 100 animali oppure di un
grande complesso di 10000.

In conclusione, per esprimere la frequenza di un fenomeno (es. malattia), non puoi utilizzare non un
valore assoluto, ma devi ricorrere ad una frazione la cui forma generale indicata in questo schema:

Come vedi, si tratta di una frazione un po' particolare, in quanto il numeratore compreso nel
denominatore! Essa assume sempre un valore compreso fra 0 e 1, e viende detta proporzione.
Per rapporto si intende invece una frazione in cui il numeratore non compreso nel
223

denominatore. Ben difficilmente in epidemiologia si ha a che fare con numeri negativi; perci
possiamo ritenere che un rapporto assuma un valore compreso fra 0 e +infinito..

ESEMPIO. Nell'allevamento dell'esempio precedente (composto da 570 galli e 3990 galline):


- rapporto femmine/maschi : 3990/570=7.0
- rapporto maschi/femmine : 570/3990=0.143
- proporzione di galli : 570/(570+3990)=0.125 (12.5%)
- proporzione di galline: 3990/(3990+570)=0.875 (87.5%)
Nota che, conoscendo la proporzione di galline, possibile calcolare la proporzione di galli (e
viceversa) in questo modo:
proporz. galli = 1 - proporz. galline = 1 - 0.875 = 0.125.

Perch meglio utilizzare una proporzione piuttosto che un rapporto? Il principale motivo legato
alla mancanza di simmetria del rapporto. Considera il rapporto A/B. Se A pi grande di B, il
rapporto pu variare in un intervallo (range) compreso fra 1 ed infinito. Se invece A assume un
valore inferiore a B, allora il range del rapporto ristretto a valori fra 0 e 1.
In altre parole, se modifichiamo il modo con cui definiamo il rapporto (passando da A/B a B/A o
viceversa) i valori nel range 1...infinito passano nel range 0...1 e viceversa.

Rapporti e proporzioni sono misure statiche, che si intendono effettuate in un determinato istante e
nelle quali non viene considerata la variabile tempo. I tassi sono invece misure dinamiche, che
rappresentano la variazione di una quantit per la variazione unitaria di un'altra quantit
(generalmente il tempo). Pensa all'utilizzo del termine tasso applicato ai depositi bancario: es.
tasso di interesse annuo, mensile ecc..

Un elemento di confusione dovuto al fatto che, in medicina, il termine tasso viene usato talvolta
come sinonimo di rapporto o proporzione, in quanto non si considera la variabile tempo. Ad
esempio, si parla di tasso di glicemia per indicare la quantit di glucosio presente per unit di
volume di un campione di sangue.

In conclusione, ti consiglio di utilizzare i termini tasso, rapporto e proporzione in base al


preciso significato su esposto; tuttavia, non devi dimenticare che talvolta tasso pu essere usato
impropriamente come sinonimo di proporzione.
224

10. Misure di
frequenza delle malattie
20.2 Morbosit e mortalit

OBIETTIVO:

apprendere le caratteristiche ed il metodo di misurazione di due fra le pi importanti misure di


frequenza: la morbosit e la mortalit

Abbiamo gi descritto la frazione che consente di definire la frequenza di un fenomeno, ed ora la


utilizziamo per calcolare due fra le pi importanti misure di frequenza: "morbosit" e "mortalit"

Morbosit

La morbosit (dal latino morbus=malattia; inglese: morbidity) la proporzione degli animali


ammalati in un dato momento, in rapporto al numero di animali "a rischio". Per animali "a rischio"
si intendono quelli che, nella popolazione considerata, possono contrarre la malattia in studio.

bene precisare che per animale ammalato si intende un animale che manifesta sintomi clinici
di malattia, e che quindi la morbosit una misurazione di un fenomeno clinico. Quando si intende
indicare, invece, la frequenza di un fenomeno non propriamente definibile come malattia o non
rilevabile clinicamente (es. infezione), si deve impiegare il
termine prevalenza.

ESEMPIO. In un allevamento di 160 bovini presente la


tubercolosi. Alla visita clinica, 8 animali evidenziano segni della
malattia ( cachessia ed con ingrossamento dei linfonodi). Tutti i
160 bovini sono a rischio, ossia possono ammalarsi. Calcoli la
morbosit attraverso la proporzione: 8/160 = 0.05 = 5%.
225

I 152 animali apparentemente sani vengono sottoposti ad un test diagnostico (es. "la prova della
tubercolina"). Risultano positivi 15 animali; puoi calcolare la prevalenza della infezione
subclinica: 15/152 = 0.10 = 10%.

Talvolta in medicina veterinaria si usa impropriamente il termine "morbilit" come sinonimo di


"morbosit". A rigore, il termine morbilit dovrebbe essere usato soltanto in medicina umana quale
misura della attivit lavorativa persa, calcolata come: (n. giorni di assenza dal lavoro) / (n. giornate
lavorative previste).
In medicina veterinaria la distinzione tra morbilit e morbosit ovviamente priva di senso. Per
restare in sintonia con la terminologia della medicina umana, ti consiglio di utilizzare "morbosit" e
non "morbilit".

Mortalit

La mortalit il rapporto tra il numero di animali morti in una popolazione, durante un periodo di
tempo, ed il numero di animali che compongono la popolazione stessa. Per ora possiamo dire,
semplificando, che la mortalit si calcola come illustrato nello schema che segue. Per vedrai, nella
prossima Unit, che le cose non sono sempre cos facili, e che il calcolo pu essere un po' diverso.

Ti prego di considerare che la malattia ha una certa durata, mentre la morte un evento che, in
pratica, avviene in un istante. Pertanto, ha senso misurare la morbosit in un determinato istante,
mentre lo stesso non si pu dire per la mortalit che deve essere sempre calcolata in rapporto al
tempo. Ecco perch la mortalit si misura attraverso un tasso (tasso di mortalit) e non
attraverso una proporzione.

Bisogna aggiungere un chiarimento riguardo agli animali a rischio del denominatore nel grafico
soprastante. Come gi sai, per animali a rischio intendiamo quelli biologicamente capaci di
esprimere l'evento. Per tutti gli animali sono capaci di esprimere l'evento-morte! Quindi in effetti
al denominatore puoi porre tutti gli animali della popolazione. In questo modo, calcolerai il
cosiddetto tasso grezzo di mortalit. Nella prossima Unit vedrai che si possono calcolare
anche altri tipi di mortalit, usando denominatori pi selettivi.

ESEMPIO. In un acquario tropicale contenente 90 pesci, nell'arco di 24 ore


ne muoiono 12. Osservando i restanti 78, si trova che 8 presentano evidenti
segni di malattia. Con questi dati puoi calcolare quanto segue: tasso di
226

mortalit: 12/90 = 0.133 in 24 ore; morbosit al momento dell'osservazione: 8/78 = 0.102.

Mortalit cumulativa

Si dice mortalit cumulativa la somma delle mortalit rilevate in una popolazione attraverso
una serie di osservazioni nel tempo, generalmente su lunghi periodi. Essa pu essere rappresentata
per mezzo di una curva, come nel grafico di esempio, ove viene mostrato un esempio di andamento
della mortalit cumulativa in un gruppo di broiler. Il grafico contiene anche la curva della
mortalit cumulativa attesa, cio la mortalit standard prevista per quel tipo di allevamento.

Foglio di calcolo per Microsoft Excel che visualizza l'andamento della mortalit cumulativa in una
227

10. Misure di
frequenza delle malattie
10.3 Tassi di mortalit

OBIETTIVI:

Definire alcuni tassi di mortalit (tasso grezzo, tasso specifico e tasso proporzionale)

Nella Unit precedente stato accennato ad una semplice misura della mortalit in una
popolazione. In sintesi, stato detto che il tasso grezzo di mortalit si ottiene calcolando la
proporzione di morti in una popolazione rispetto al totale di animali a rischio, in un periodo di
tempo. A questo proposito, era stato presentato un semplice esempio di calcolo del tasso mortalit
in un acquario tropicale, contenente 90 pesci, in cui nell'arco di 24 ore ne erano morti 12: tasso di
mortalit: 12/90 = 0.133 in 24 ore. Per, con questo approccio, pu sorgere un problema: quello di
calcolare il denominatore. Infatti, le cose sono facili ed il numero di animali a rischio pu essere
determinato agevolmente se la popolazione chiusa (ossia non si verificano entrate o uscite di
animali, come nell'esempio dell'acquario), ma si complicano se la popolazione aperta.

In questa unit vediamo come si calcola il tasso grezzo di mortalit in popolazioni aperte, ed anche
anche qualche altra misura pi selettiva del tasso grezzo.

Tasso grezzo di mortalit in popolazioni aperte

Nel caso di popolazioni aperte, il tasso di mortalit si misura pi ponendo al denominatore la media
della popolazione a rischio:
228

In demografia, il tasso grezzo di mortalit si calcola su un periodo di 1 anno; si tratta di misurare


popolazioni aperte. Per, trattandosi di popolazioni a numerosit molto elevata, per facilitare i
calcoli al denominatore della frazione si pone convenzionalmente la popolazione esistente a met
anno, oppure la media fra quella esitente al 1 Gennaio e quella al 31 Dicembre.
Ad esempio, in Italia durante il 1983 si sono verificati 553.568 decessi su un totale di 56.835.784
residenti a met anno. Il tasso grezzo di mortalit stato pari a: 553.568 / 56.835.784 = 0.00974. In
pratica, si osservato circa 1 decesso ogni 103 residenti circa.

Ovviamente nel campo della medicina veterinaria, a motivo della durata variabile della vita delle
specie animali, dell'ampia diversificazione delle specie allevate e dei tipi di allevamento, non
avrebbe alcun senso utilizzare la popolazione a met anno. invece necessario calcolare la media
della popolazione a rischio in periodi variabili (che potr essere di 1 settimana o 1 mese ecc. a
seconda della situazione da descrivere), calcolando la media del numero di animali presenti in un
determinato lasso di tempo.

A questo punto ti chiederai sicuramente come si fa a calcolare la media della popolazione a rischio.
Il calcolo viene impostato come nell'esempio seguente.

ESEMPIO. Supponi di voler calcolare il tasso di mortalit verificatosi nell'arco di una settimana in
un gruppo di suini aperto e composto inizialmente da 100 animali. Nel gruppo si sono osservati i
seguenti eventi:

Nela seconda colonna riportato il numero di animali presenti (a rischio) in ciascun giorno,
tenendo conto dei movimenti (morti ed uscite); nel periodo considerato il totale cumulativo ha
raggiunto 537 presenze. Quindi, possiano calcolare che, in media, ogni giorno della nel gruppo
erano presenti 537 / 7 = 76.7. Questa la popolazione media nel periodo considerato. Ora puoi
facilmente calcolare il tasso di mortalit nella settimana, come segue: 11 / 76.7 = 0.143 = 14.3%

Tasso di mortalit attributo-specifico

Come si visto finora, i tassi grezzi si applicano all'intera popolazione, senza specificare alcuna
caratteristica (es. et, razza ecc.) degli individui che la compongono. I tassi grezzi sono validi
soprattutto nei gruppi di allevamenti intensivi, composti quasi sempre da animali con caratteristiche
uniformi.
229

Se si deve misurare la mortalit in popolazioni eterogenee, pu essere necessario suddividere la


popolazione in sottogruppi omogenei rispetto a una o pi attributi (ad. esempio, sesso, et ecc.) e
calcolare i tassi nell'ambito dei sottogruppi. In questo caso, i tassi vengono detti tassi specifici o
tassi attributo-specifici, in quanto misurati specificando una determinata caratteristica degli
animali.

Il tasso di mortalit attributo-specifico si calcola come indicato nello schema seguente.

Ricordati che, nel caso di popolazioni aperte, al denominatore dovrai utilizzare la media della
popolazione a rischio provvista dell'attributo, cos come gi visto in precedenza
per il tasso grezzo.

ESEMPIO. Un allevamento di bovine da latte composto da 180 bovine adulte,


da 32 manze e da 28 vitelli. Nell'arco di una settimana vengono a morte 6
vitelli. Devi tener conto del fatto che la patologia del vitello molto diversa da
quella degli adulti, e che i vitelli vengono allevati separatamente dagli adulti.
Perci non avrebbe senso misurare il tasso grezzo di mortalit (6/240 = 0,025
nella settimana). La situazione osservata nell'allevamento viene invece espressa
meglio dal tasso attributo-specifico: tasso di mortalit nei vitelli = 6/28 = 0.214
= 21.4% durante la settimana considerata.

Tasso di mortalit causa-specifico

Un altro tipo di tasso di mortalit usato di frequente prevede la misurazione selettiva in base alla
causa della morte, e viene detto tasso di mortalit causa-specifico. Esso rappresenta l'indice della
mortalit dovuta ad una certa causa. Pu essere calcolato sull'intera popolazione, oppure per
sottogruppi scelti in base ad un carattere importante riguardo alla malattia considerata (es. et,
razza, provenienza ecc.), ottenendo tassi di mortalit causa- e attributo-specifici.

Il tasso di mortalit causa-specifico in popolazioni chiuse si calcola come segue:

Anche in questo caso, se la popolazione aperta, al denominatore dovrai utilizzare la media della
popolazione a rischio.
230

ESEMPIO. Nell'esempio precedente erano morti per cause ignote 6 vitelli su 28 in una settimana.
Ora accerti che 4 di essi sono morti per colibacillosi. Il tasso di mortalit nei vitelli per
colibacillosi nella settimana considerata 4/28 = 0.143 = 14.3%. Nota che, se riferito all'intero
allevamento di bovine da latte, questo un tasso causa- e attributo-specifico.

Tasso proporzionale di mortalit

Viene detto anche rapporto proporzionale di mortalit (RPM). Esprime la proporzione della
mortalit da ascrivere ad una determinata causa per il periodo considerato. Si calcola dividendo il
numero di morti per una causa X per il numero di morti per tutte le cause. Viene usato per valutare
il contributo di una causa alla mortalit complessiva.

da notare che questo tipo di espressione non fornisce alcuna indicazione sul tasso
effettivamente rilevato (v. i due esempi che seguono), ma pu essere utile per stilare una sorta di
classifica delle cause di morte in una popolazione.

Nota che al denominatore non si pongono i soggetti della popolazione a rischio, ma il numero totale
di soggetti morti per qualsiasi causa nel periodo considerato.

ESEMPIO 1. Nell'arco di 15 giorni, in un gruppo di 24 vitelli ne sono morti 8,


di cui 4 per enterite da Escherichia coli. Il tasso grezzo di mortalit nel
periodo pari a 8/24 = 0.33 (33%). Il rapporto proporzionale di mortalit per
colibacillosi 4/8 = 0.5 (50%). Ci indica che la colibacillosi stata
responsabile del 50% di tutte le morti osservate.

ESEMPIO 2. Nell'arco di 15 giorni, in un gruppo di 24 vitelli ne sono morti 8; la mortalit 10


volte pi bassa rispetto all'allevamento dell'esempio precedente: 8/240 = 0.033 = 3.3%. Fra gli 8
morti, 4 avevano una enterite da Escherichia coli. Il rapporto proporzionale di mortalit per
colibacillosi in questo allevamento identico a quello calcolato nell'allevamento precedente: 4/8 =
0.5 (50%).
231

10. Misure di
frequenza delle malattie
10.4 Sopravvivenza e letalit

OBIETTIVO:

definire il significato dei termini sopravvivenza e letalit

Tasso di sopravvivenza

Bisogna premettere che questo argomento molto complesso, soprattutto sul piano metodologico,
ed assume una importanza soprattutto in medicina umana. In questa sede si accenner soltanto ai
principi di base.

Il tasso di sopravvivenza la proporzione di individui con una certa malattia che sopravvivono per
un dato tempo.
Il calcolo del tasso di sopravvivenza si basa sulle informazioni raccolte su casi di malattia, spesso in
numero di centinaia o migliaia, sempre molto complicato e necessita di elaborazioni statistiche ad
hoc (es. analisi di Kaplan-Meier).
Tralasciando le problematiche operative che si presentano in questo tipo di analisi, nello schema
sottostante viene indicata una semplice base razionale per il calcolo, in cui la sopravvivenza
espressa come probabilit per un animale di restare in vita per un determinato periodo di tempo.

In pratica, gli studi di sopravvivenza relativi ad una singola malattia si eseguono arruolando nel
gruppo in esame (coorte) gli individui mano a mano che essi contraggono quella malattia. Ecco
perch, nello schema soprastante, per animali ammalati si devono intendere i nuovi casi di
malattia; poi, fra questi, vengono contati, nel tempo, i morti.

Dai dati ottenuti attraverso studi sulla sopravvivenza, possono essere ottenute le curve di
sopravvivenza, utili per rispondere alla domanda che probabilit ha un individuo con una certa
malattia di sopravvivere per un dato tempo?
232

ESEMPIO. stata effettuata una


indagine epidemiologica sul tempo
di sopravvivenza di persone con
tumore del colon-retto nel periodo
1974-1978. I numerosi dati raccolti
sono stati sottoposti ad
elaborazione statistica, ed stata
ottenuta una curva di
sopravvivenza, riportando in
ascissa il tempo post-diagnosi ed in
ordinata la percentuale di
sopravvivenza (v. grafico a lato).
Dal grafico si pu dedurre, fra
l'altro, che: (a) ad 1 anno dalla
diagnosi sopravvissuto il 65% dei
pazienti; (b) a 3 anni sopravvissuto il 38%; (c) a 10 anni sopravvissuto il 20%; (d) l'andamento
della curva dimostra che una quota rilevante delle morti si verifica nei primi due anni dopo la
diagnosi.
In oncologia umana si parla talvolta di sopravvivenza mediana, intendendo il tempo in cui
sopravvissuto il 50% dei pazienti (e quindi il 50% deceduto). Nel grafico di esempio la
sopravvivenza mediana si colloca attorno a 2 anni.

I tempi di sopravvivenza, dipendono, oltre che dal tipo di malattia, anche dal cosiddetto tempo
zero, cio dallo stadio di evoluzione della malattia utilizzato per rilevare il "nuovo caso". Il tempo
zero pu essere fissato arbitrariamente in corrispondenza di qualsiasi evento nell'evoluzione della
malattia (comparsa di anticorpi; comparsa di marcatori tumorali; comparsa di sintomi; inizio del
trattamento ecc.). Per questo motivo, i tassi di sopravvivenza riportati dalla letteratura possono
variare ampiamente anche quando si riferiscono ad una stessa malattia.

Negli animali domestici spesso la sopravvivenza dipende, oltre che dai caratteri intrinseci della
malattia, anche da altri fattori artificiosi o soggettivi (ad esempio: eutanasia negli animali da
compagnia o fattori economici negli animali da reddito). Talvolta, soprattutto negli allevamenti
intensivi, la misura della sopravvivenza non assume alcun interesse pratico: ad esempio, nel caso di
una malattia a lento decorso in broiler, in cui i soggetti ammalati vengono eliminati
dall'allevatore in quanto il loro allevamento risulta antieconomico.

Tasso di letalit

Il tasso di letalit la proporzione di animali morti per una certa malattia in un periodo sul totale di
casi della malattia osservati nello stesso periodo di tempo.
233

Il tasso di letalit viene impiegata per indicare la probabilit, per un ammalato, di venire a morte per
quella malattia in un dato periodo di tempo. Esso rappresenta una misura della capacit che ha una
malattia di portare a morte l'animale colpito. Nel settore veterinario questo parametro utile
soprattutto nel caso di malattie acute, e particolarmente delle malattie infettive.

Nota che il tasso di letalit il complemento ad 1 del tasso di sopravvivenza, cio [letalit = 1 -
sopravvivenza]. Ci intuitivo, se pensi che, in ogni istante, la somma della letalit e della
sopravvivenza deve essere uguale ad 1 (100%).

Infine, nella figura che segue viene schematizzato il calcolo del tasso di sopravvivenza e di letalit
per una malattia.
234

10. Misure di
frequenza delle malattie
10.5 Prevalenza e incidenza: definizioni

OBIETTIVI:

apprendere il significato dei termini prevalenza incidenza cumulativa, densit di


incidenza; apprendere il calcolo delle suddette misure;

individuare i fattori che possono causare variazioni della prevalenza o dell'incidenza

Parlando in generale, le misure di frequenza delle malattie possono descrivere:

l'insieme di tutti i casi esistenti in un determinato momento ed in una determinata popolazione


il verificarsi di nuovi casi

A questo scopo si usano quindi due misure fondamentali: la prevalenza e l'incidenza. Queste due
misure sono molto diverse fra loro: con una metafora, possiamo dire che la prevalenza la
fotografia di un fenomeno, mentre l'incidenza ne il film..

Prevalenza

In termini generali, la prevalenza misura la proporzione di "eventi" presenti in una popolazione in


un dato momento. Per "evento" si intende un qualsiasi carattere ricercato; ad esempio: infezione,
presenza di anticorpi, stato di gravidanza ecc.. Molto spesso l'evento che si ricerca rappresentato
dalla malattia o dall'infezione, e pertanto possiamo dire che la prevalenza misura la proporzione di
individui di una popolazione che, in un dato momento, presentano la malattia.
Poich il fattore tempo - a rigore - non importante nel calcolo della prevalenza, questa misura
di tipo statico e quindi non un tasso; si tratta invece di una proporzione (che, te lo ricordo,
assume un valore compreso fra 0 e 1).
235

Sempre in termini generali, la prevalenza di calcola come E + / (E + + E - ) dove E + rappresenta il


numero di individui (oppure di unit) che esprimono l'evento studiato e E - rappresenta il numero
di individui privi dell'evento ma capaci di esprimerlo:

Abbiamo gi detto che, spesso, l'evento studiato rappresentato dallo stato di malattia (evento
malattia). Allora, la prevalenza di animali ammalati si calcola come M + / (M + + M - ) dove M +
rappresenta il numero di ammalati e M - il numero di animali "a rischio".

Ricordati che gli "animali a rischio" NON sono quelli sottoposti ad uno o pi determinanti di
malattia (fattori di rischio), bens - pi semplicemente - quelli non ancora ammalati ma
"suscettibili" di ammalarsi, ossia che possono contrarre la malattia in studio. Animali a rischio =
animali a rischio di ammalarsi.
In pratica, misurare la prevalenza di animali ammalati corrisponde a misurare la morbosit. In altre
parole, la morbosit un caso particolare di prevalenza, in cui l'evento studiato rappresentato dalla
presenza di malattia clinica (questo argomento gi stato trattato in una precedente Unit).

Riassumendo:
236

ESEMPIO. In un allevamento di bovini sono presenti 120 capi, che


vengono sottoposti al test di intradermoreazione alla tubercolina
(detto comunemente test della tubercolina) per la diagnosi di
tubercolosi. Dopo l'inoculazione della tubercolina per via
intradermica, si attendono 72 ore e quindi si effettua la lettura,
misurando lo spessore della plica cutanea al punto di inoculo. Tutti
i 120 capi sono animali "a rischio", ossia possono contrarre la
tubercolosi; 15 di essi reagiscono positivamente al test, mentre i
restanti 105 risultano negativi. Allora, la prevalenza di bovini con tubercolosi di 15/(15+105), vale
a dire 0.125 oppure 12.5%.

La prevalenza impiegata nella programmazione sanitaria, in quanto misura l'impatto e la


penetrazione che una malattia ha in un determinato territorio. Diversamente dall'incidenza, essa pu
essere determinata attraverso una sola indagine epidemiologica, esaminando tutti gli individui della
popolazione o, pi verosimilmente, un campione rappresentativo.
L'utilit della conoscenza della prevalenza di una malattia si delinea anche nel caso in cui si voglia
stimare il danno indotto da quella malattia in una popolazione, oppure quando si desideri stimare le
difficolt di realizzazione di un piano di profilassi, o, ancora, quando si vogliano stimare i rapporti
costi/benefici prima dell'avvio del piano.

La prevalenza ora descritta una delle pi importanti misure di frequenza ed detta anche
prevalenza "puntuale" misura la frequenza di malattia in un dato momento. Esiste anche una
prevalenza cosiddetta "di periodo", che si calcola con il seguente rapporto: (animali che sono
risultati ammalati in un determinato periodo di tempo) / (popolazione a rischio nel periodo). In altre
parole, la prevalenza di periodo si ottiene addizionando la prevalenza all'inizio dell'osservazione
con l'incidenza durante l'intervallo di osservazione. Attenzione a non confondere la prevalenza di
periodo con l'incidenza!

Incidenza (o incidenza cumulativa)

In termini generali, l'incidenza misura la proporzione di "nuovi eventi" che si verificano in una
popolazione in un dato lasso di tempo. Anche in questo caso, per "evento" si pu intendere la
237

comparsa di un qualsiasi carattere. Tuttavia, quasi sempre l'incidenza si utilizza per misurare la
comparsa di nuovi casi di malattia.

Per questo motivo, possiamo dire che l'incidenza rappresenta la proporzione di individui che
vengono colpiti dalla malattia in un determinato periodo di tempo.

L'incidenza, bene sottolinearlo, misura il numero di nuovi casi nel periodo di tempo ed individua
il rischio (cio la probabilit) che ha un animale di contrarre la malattia in quel periodo di tempo.
L'incidenza pu essere vista come un modo per misurare la velocit di transizione dallo stato di
salute (assenza di malattia) allo stato di malattia in una popolazione.

L'incidenza rappresenta la variazione di una quantit (i nuovi ammalati) rispetto alla variazione di
un'altra quantit (il tempo); essa quindi una misura dinamica e costituisce un vero tasso.

ESEMPIO. Dopo 9 mesi ritorni nello stesso allevamento dell'esempio precedente, allo scopo di
calcolare l'incidenza della malattia. Pertanto, sottoponi nuovamente al test della tubercolina soltanto
i 105 animali che erano risultati negativi. Alla lettura dopo 72 ore, ne risultano positivi 17, mentre i
restanti 88 sono negativi. Quindi, l'incidenza in 9 mesi 17/(17+88) = 0.162 = 16.2%.

Nel calcolo dell'incidenza, la durata del lasso di tempo in cui effettuare l'osservazione
discrezionale. Essa viene fissata soprattutto in base ai caratteri della malattia: per le malattie a
rapida diffusione o evoluzione si considera generalmente un periodo di una durata inferiore rispetto
alle malattie che diffondono lentamente o che sono di lunga durata.

Riassumendo:

L'incidenza importante nello studio delle cause di malattia e del loro effetto a livello di
popolazione: infatti, una variazione dell'incidenza testimonia una modificazione dell'equilibrio dei
determinanti di malattia, o una modificazione dello stato di recettivit della popolazione ecc. In
aggiunta alla prevalenza, la valutazione dell'incidenza risulta utile nella valutazione dell'efficacia di
un programma di prevenzione.

Predire il futuro
Come gi detto, l'incidenza una misura del tasso di diffusione di una
malattia all'interno di un gruppo con caratteristiche note ed
inizialmente esente da quella malattia; perci l'incidenza viene usata
238

anche per prevedere (cio misurare la probabilit) la comparsa di quella malattia in individui con
caratteristiche simili a quelli studiati.

Cliccando sull'immagine sottostante, puoi avviare uno schema animato che illustra un esempio di
calcolo della incidenza.

Ricordati:

Resta da sottolineare che il metodo di misurazione dell'incidenza fin qui descritto riguarda il calcolo
dell'incidenza tout court, detta anche incidenza cumulativa: si tratta della proporzione di animali
di una popolazione chiusa (cio in cui non si verificano nascite, introduzioni di animali o perdite di
soggetti per qualsiasi motivo) che presenta la malattia in un determinato periodo di tempo. Essa,
come gi detto, equivale alla probabilit per ciascun individuo di aver contratto la malattia nel
periodo considerato.

ESEMPIO.
Supponi di aver osservato un gruppo di 100
suini per un periodo di 10 giorni. In questo
periodo, si sono verificati casi di malattia come
illustrato nella tabella e nel grafico a lato.
Supponi che i 100 suini rappresentino
popolazione "chiusa" (ossia: nel periodo
considerato non sono avvenuti ingressi o uscite
di animali) e che la malattia non abbia provocato
la morte di nessun animale. All'esaurirsi della
malattia (giorno 7) l'incidenza cumulativa stata
pari a 0.20 circa (20%). Infatti,
complessivamente si sono osservati 20 nuovi
casi su 100 animali presenti.

Densit di incidenza

Talvolta, nella misurazione dell'incidenza, il calcolo del denominatore (ossia degli animali a rischio
nel periodo) impossibile. questo il caso delle popolazioni aperte, ossia quando si verificano
239

entrate ed uscite di animali durante il periodo di osservazione. Giustifichiamo questa affermazione


con un esempio.

ESEMPIO. In una voliera che ospita 20


canarini, inizialmente sani, compare una
malattia. La voliera viene tenuta sotto
osservazione per 5 giorni. In questo periodo
si verificano gli eventi riassunti nella
Tabella 1: (a) 8 nuovi casi di malattia; (b)
morte di 4 canarini ammalati; (c) rimozione
da parte del proprietario di 5 soggetti sani.
Il calcolo dell'incidenza cumulativa
semplice e si effettua come segue: (nuovi
casi) / (popolazione a rischio all'inizio
dell'osservazione). Con i dati della Tabella,
il calcolo il seguente: 8/20 = 0.4, ossia 40% in 5 giorni.
Ora esamina la situazione con attenzione. Porre un valore di 8 al numeratore senz'altro
giustificato, poich i nuovi casi di malattia sono stati proprio otto. Ma ti sembra corretto porre 20 al
denominatore? Qual stata effettivamente la popolazione a rischio nei 5 giorni di osservazione?
Non certo i 20 soggetti iniziali, visto che il marted ne sono stati allontanati 5 e fra mercoled e
gioved ne sono morti 4. Perci il valore di incidenza cumulativa di 0.4, calcolato ponendo 20 al
denominatore, non rappresenta una stima accurata di quanto effettivamente avvenuto nella
popolazione.
Il problema non pu essere risolto che cambiando l'unit di misura del denominatore, e calcolando
non pi l'incidenza cumulativa ma una nuova misura di frequenza: la cosiddetta densit di
incidenza.

La densit di incidenza si calcola ponendo al numeratore i nuovi casi di malattia, cos come gi
fatto per il calcolo della densit di incidenza. Al denominatore si pone, invece, la somma di tutte le
unit di tempo di osservazione di tutti gli animali prima che l'evento-malattia si sia verificato; per
questo motivo, il denominatore viene misurato in tempo/animali (es. bovino-anno, suino-mese ecc.).
La densit di incidenza utilizzata raramente in medicina veterinaria, e perci non verr trattata
esaurientemente in questa sede.
240

Limitiamoci a completare
l'esempio precedente, in cui
otterremo una insolita unit di
misura della densit di incidenza:
il... canarino-giorno!
Calcoliamo la densit di incidenza
sui dati dell'esempio. A scopo
didattico, supponiamo
convenzionalmente che
l'osservazione quotidiana inizi alle
ore 0:00 e termini alle 24:00, e
che che ogni evento (morte, nuovo
caso ecc.) sia avvenuto a
mezzogiorno.
Ovviamente ci serve un numeratore ed un denominatore. Il calcolo del numeratore molto
facile: indiscutibile che si sono verificati 8 nuovi casi di malattia. Pi difficile trovare il
denominatore: ti consiglio di osservare la Tabella 2. Essa identica alla precedente Tabella 1, con la
sola differenza che stata aggiunta la colonna a bordo rosso in cui viene riportato il numero di
animali a rischio rimasti nella voliera in ciascuno dei giorni considerati. Ad esempio, il valore 16.5
del marted deriva dal fatto che in questo giorno 7 animali (i 2 ammalati ed i 5 rimossi) su 20 sono
rimasti a rischio solo per 1/2 giornata ciascuno, e quindi in totale contano 3.5 giorni.
Se ancora hai dubbi in proposito, ti consiglio di guardare uno schema auto-esplicativo degli eventi
che si sono succeduti nella voliera: clicca sull'icona a lato!.

Le insidie nascoste...

I concetti di prevalenza puntuale, prevalenza di periodo, incidenza e incidenza cumulativa


sembrano relativamente semplici da assimilare, ma possono trarre in inganno. Vediamo di chiarire
le cose con l'aiuto dell'esempio raffigurato nello schema sottostante.

Nello schema, sull'asse orizzontale viene rappresentato il tempo. Ogni riga orizzontale blu,
numerata da 1 a 8, rappresenta un animale: quando la riga sottile, l'animale in salute, mentre le
barre rosa indicano la presenza della malattia.
Quindi, nello schema rappresentato lo stato sanitario di 8 animali che compongono una
241

popolazione chiusa (nel periodo di osservazione non ci sono state uscite di animali n nuovi arrivi).
Ecco qualche calcolo esplicativo:

prevalenza puntuale al tempo T0 = 2/8 = 0.25 (si tratta degli animali n. 5 e n.7);
prevalenza puntuale al tempo T1 = 3/8 = 0.375 (animali n. 3, 6 e 7);
incidenza cumulativa nel tempo T0-T1 = 4/6 = 0.67 (animali n. 1, 3, 4, 6) - notare che gli animali 5 e
7 sono stati esclusi dalla popolazione in esame, che non conta pi 8 animali bens 6. Infatti gli
animali 5 e 7 erano gi ammalati all'inizio del periodo di osservazione, e quindi non devono entrare
nel conteggio dei nuovi casi;
possibile che la popolazione non sia stata monitorata continuamente durante il periodo T0-T1, ma
che sia stata semplicemente confrontata la situazione sanitaria esistente al tempo T0 con quella
esistente al tempo T1. In tal caso, l'incidenza cumulativa T0-T1 corrisponde a 2/6 =0.33 (animali n. 3
e 6, che erano sani in T0 e malati in T1). Gli animali n. 1 e 4 si sono ammalati e sono guariti durante
il periodo e quindi sono sfuggiti all'osservazione! Ovviamente questo tipo di calcolo meno preciso
di quello visto al punto precedente.

Infine...

nella seguente tabella vengono riassunte le caratteristiche salienti dell'incidenza e della prevalenza.

... mentre, nella prossima tabella, incidenza e prevalenza vengono messe a raffronto fra loro.
242
243

10. Misure di
frequenza delle malattie
10.6 Prevalenza, incidenza e utilizzo degli intervalli di confidenza

OBIETTIVI:

perch importante calcolare gli intervalli di confidenza quando si effettuano misure di


frequenza di malattia in un campione

Come gi illustrato nella precedente unit didattica, le misure pi frequentemente utilizzate per
stimare la frequenza di una malattia in una popolazione sono l'incidenza e la prevalenza.

Molto spesso, queste misure non vengono effettuate sull'intera popolazione di interesse, ma su un
campione di numerosit pi o meno elevata. Ci significa che, una volta concluso lo studio, i dati
ottenuti non sono utili soltanto a conoscere la frequenza di malattia nel campione (cosa che in
genere interessa poco), bens, con un processo di inferenza, a stimare la frequenza di quella
malattia nell'intera popolazione.

L'intervallo di confidenza fornisce informazioni riguardo alla precisione dei valori ottenuti
attraverso lo studio di un campione.
Ad esempio, un intervallo di confidenza 95% comprende un intervallo di valori che tiene conto
della variabilit del campione, in modo tale che si pu confidare - con un margine di certezza
ragionevole (appunto il 95%) - che quell'intervallo contenga il valore vero dell'intera popolazione
che non hai avuto modo di esaminare. Ovviamente, ci vero solo se nello studio non sono presenti
errori sistematici.

L'intervallo di confidenza rappresenta un parametro di fondamentale importanza soprattutto negli


studi epidemiologici in cui la variabilit del campione (molto spesso dovuta al fatto che il campione
piccolo) pu rendere aleatoria l'interpretazione dei risultati.
Questo stesso concetto gi stato illustrato nella unit didattica riguardante l'errore standard, ma
credo che valga la pena di sottolinearlo di nuovo qui.

Per i pi curiosi, dir che, per calcolare l'intervallo di confidenza, necessario un modello di
probabilit che tenga conto dei diversi possibili risultati di uno studio. Di tali modelli ne esistono, in
statistica, molti tipi (ad es. basati sulla distribuzione binomiale o su quella di Poisson oppure su
quella gaussiana). In genere, quando il numero di osservazioni abbastanza ampio, si utilizza
proprio quest'ultimo modello di distribuzione gaussiana (detta anche "normale"). Comunque, non
lasciarti intimorire da questi argomenti statistici un po' tecnici: per fortuna il calcolo dell'intervallo
di confidenza , come vedrai, molto semplice.

Data una certa prevalenza P, l'intervallo di confidenza 95% si ottiene con il calcolo della formula
qui sotto, dove il segno +/- permette il calcolo di due valori: il limite superiore dell'intervallo (che si
ottiene utilizzando il +) ed il limite inferiore (che si ottiene utilizzando il -):
244

Analogamente, dato un certo valore di incidenza I, l'intervallo di confidenza 95% si ottiene nel
modo seguente:

A questo punto. avrai di certo capito che la formula per il calcolo dell'intervallo di confidenza una
sorta di utilissimo coltellino svizzero che funziona in tutti i casi in cui hai calcolato una qualsiasi
proporzione (o una percentuale):
245

ESEMPIO. Supponiamo che in uno studio sulla displasia dell'anca di cani di razza "pastore
tedesco" siano risultati affetti dalla malattia 18 cani su un campione di 180 cani esaminati. La
prevalenza nel campione : 18/180 = 0.1, cio 10%.
Calcoliamo l'intervallo di confidenza 95%:

Pertanto, il limite inferiore dell'intervallo di confidenza 95% 0.056 (5.6%) ed il limite superiore
0.145 (14.5%). Ci significa che, in media, il 95% di tali intervalli derivanti da studi privi di errori
sistematici contiene il parametro vero della popolazione. In altre parole, possiamo essere abbastanza
sicuri che la percentuale di cani con displasia dell'anca nella intera popolazione da cui stato tratto
il campione di 180 cani sia compresa fra 5.6 e 14.5%.

Infine, resta da ricordare che se vuoi ottenere un intervallo di confidenza 99% (invece che 95%),
non devi far altro che sostituire il coefficiente 1.97 con 2.57.

ESEMPIO. Nello stesso studio sulla displasia dell'anca di cui sopra, calcolerai l'intervallo di
confidenza 99% come segue:

NELLA PROSSIMA UNIT:


si parla di una misura di frequenza (il tasso di attacco), che pu essere considerata una particolare
forma di incidenza, da utilizzare in determinate situazioni.

Prevalenza e incidenza: definizioni Tasso di attacco


246

10. Misure di
frequenza delle malattie
10.7 Tasso di attacco

OBIETTIVO:

definire il tasso di attacco primario e secondario e differenziarlo dall'incidenza

Il tasso di attacco (attack rate) pu essere considerato un caso particolare di incidenza, che trova
applicazione quando l'esposizione al determinante (o ai determinanti) di malattia avvenuta per
breve durata, e di solito su popolazioni chiuse, o ben definite ed a numerosit limitata.
Si tratta quasi sempre di focolai di malattia a sorgente comune, ossia nei quali tutti i casi di
malattia hanno avuto origine da un'unica esposizione (es. avvelenamenti, esposizione a radiazioni,
somministrazione di una razione contaminata da salmonelle ecc.).

In medicina umana, l'utilizzo tipico del tasso di attacco si ha nei casi di tossinfezione alimentare.

Poich - come gi detto - l'esposizione di breve durata, il tasso di attacco rappresenta una sorta di
incidenza cumulativa: infatti, una volta esauritosi il focolaio, non vengono pi osservati nuovi
casi derivanti da quella esposizione, anche se il periodo di osservazione viene prolungato
indefinitamente.

Anche per le malattie neonatali (ossia quelle che si verificano entro pochi giorni dalla nascita)
potrebbe essere pi indicato parlare di tasso di attacco piuttosto che di incidenza.

Il tasso di attacco si calcola come D/(D+N), dove D indica il numero di casi di malattia che si
verificano in un determinato lasso di tempo, mentre N indica gli animali a rischio rimasti sani nel
periodo:

ESEMPIO. In un acquario contenente 43 pesci tropicali si verificato


un guasto al riscaldatore, e la temperatura dell'acqua ha subto, per la
247

durata di 16 ore, una diminuzione di 12 gradi (16 C rispetto ai 28 C previsti). Prima del guasto i
pesci erano in buona salute. Nelle 48 ore dopo il guasto, lo shock termico ha provocato la morte di
12 esemplari. Il tasso di attacco risulta quindi:
12/(12+31) = 0.28 = 28% in 48 ore.
Si tratta di un tasso di attacco, e non di una incidenza, in quanto la causa ha agito su tutti i soggetti
per un tempo definito e limitato. Anche se si prolungasse il periodo di osservazione anche ben oltre
le 48 ore dell'esempio, non si osserverebbe pi alcun nuovo caso.

Una misura di frequenza collegata al tasso di attacco il tasso di attacco secondario.

Il tasso di attacco secondario si applica esclusivamente alle malattie trasmissibili, ed indica la


proporzione dei casi (detti casi secondari) che si sviluppano per contatto con uno o pi casi primari
entro un tempo corrispondente al periodo di incubazione della malattia. Per caso primario
(detto anche caso-indice), si intende il primo animale (o i primi animali) della popolazione che si
ammala della malattia trasmissibile in questione.

Nell'uomo i casi secondari sono spesso rappresentati dai familiari, oppure dai compagni di scuola, o
dai colleghi di lavoro. In medicina veterinaria, i casi secondari sono quasi sempre gli animali
appartenenti allo stesso gruppo o allo stesso allevamento.

I casi che si verificano in tempi successivi al periodo di incubazione del caso primario derivano
verosimilmente dal contatto con i casi secondari, e sono quindi detti casi terziari.

evidente che anche il tasso di attacco secondario un tipo particolare di incidenza. Esso
rappresenta una buona misura della contagiosit della malattia nelle circostanze in questione, ossia
della sua capacit di trasmettersi da un ospite all'altro.

Nello schema che segue viene illustrato un esempio di andamento di un focolaio di una malattia
trasmissibile originato da un singolo caso-indice, che ha dato origine a casi secondari ed a casi
terziari.
248
249

10. Misure di
frequenza delle malattie
10.8 Relazioni tra incidenza e prevalenza

OBIETTIVO:

individuare le interrelazioni tra prevalenza e incidenza

gi stato accennato a come l'incidenza dipenda soltanto dal tasso di comparsa della malattia.
Al contrario, la prevalenza dipende soprattutto da due variabili: l'incidenza e la durata della
malattia. Nella figura viene rappresentato un modello che riproduce,attraverso una metafora visiva,
alcuni dei fattori che agiscono sul livello della prevalenza.

Nel modello, il livello della prevalenza direttamente correlato all'apertura della valvola
dell'incidenza, cio al numero di nuovi casi di malattia. D'altra parte, la prevalenza influenzata
negativamente da due dispositivi che tendono a ridurne il livello: la valvola della letalit, che sottrae
individui ammalati al totale della popolazione, e la pompa della guarigione, che li restituisce alla
popolazione sana di partenza.
250

Lo scopo del modello quello di sottolineare come una variazione di prevalenza di una malattia
possa derivare da una variazione dell'incidenza e/o del decorso della malattia. Attenzione: il
modello non tiene conto di un eventuale stato di immunit che, come nel caso di molte malattie
infettive, si pu instaurare negli animali guariti.

Mettiamo alla prova il modello simulando alcune situazioni. Per esempio, i miglioramenti nella
terapia di alcune malattie inguaribili (es. AIDS dell'uomo) corrispondono ad una riduzione del
flusso attraverso la valvola della letalit e quindi hanno l'effetto (apparentemente irragionevole) di
indurre un aumento della prevalenza.
D'altra parte, per altre malattie (guaribili) la prevalenza pu ridursi per effetto dell'accorciamento
del decorso per una pi rapida guarigione in seguito alla somministrazione di un farmaco molto
attivo; questo effetto, nel modello, corrisponde ad un aumento della portata della pompa della
guarigione. Oppure, all'opposto, la prevalenza pu diminuire perch la malattia porta a morte i
colpiti pi rapidamente (apertura della valvola della letalit).

ESEMPIO 1. Sei interessato allo studio della infestazione da ascaridi negli allevamenti di polli
rurali. L'infestazione si instaura nella la maggior parte degli animali in giovane et e, in assenza di
trattamento dura virtualmente tutta la vita dell'animale. Per questo, nel tuo studio hai ottenuto una
prevalenza molto elevata (48%), mentre l'incidenza di periodo (es. 1 mese) risultata bassa.
ESEMPIO 2. Vuoi valutare incidenza e prevalenza della bursite infettiva in un allevamento
industriale di polli nel quale non si vaccina nei confronti di questa malattia. La malattia, altamente
contagiosa, colpisce i polli di 3-8 settimane di et, con un quadro clinico molto evidente e decorso
molto breve (4-5 giorni). La malattia comparsa nel gruppo quando gli animali avevano 5 settimane
di et, e si esaurita a 6.5 settimane. Allora, l'incidenza nel periodo considerato (3-8 settimane) sar
molto elevata, mentre la prevalenza, in un determinato istante (es. al 50 giorno) potr essere pari a
zero.

Talvolta una variazione dell'incidenza pu essere soltanto apparente ed essere dovuta ad un


artefatto, come nel caso in cui vangano utilizzati nuovi metodi diagnostici che consentono una
diagnosi pi precoce. In questo caso, anche se l'incidenza reale della malattia rimane costante,
attraverso il nuovo strumento diagnostico verr individuato un numero maggiore di casi rispetto a
quanto si era verificato in passato, e ci corrisponder appunto ad un aumento (apparente)
dell'incidenza.

Nella tabella che segue sono riassunti i fattori principali che influenzano il livello della prevalenza
di una malattia in una popolazione.
251

I fattori pi importanti sono senz'altro l'incidenza e la durata della malattia. Se l'incidenza rimane
pi o meno costante nel tempo, allora la prevalenza funzione dell'incidenza e della durata della
malattia:
252

10. Misure di
frequenza delle malattie
10.9 Malattia epidemica, endemica, sporadica

OBIETTIVO:

comprendere e differenziare le caratteristiche di una malattia epidemica, endemica e sporadica

Epidemia

Nel discorso comune, si parla di epidemia quando si osserva l'improvvisa insorgenza di una malattia
(o l'espansione di una malattia gi esistente), con tendenza ad interessare un gran numero di
individui. Questa definizione non sbagliata, ma non coglie il significato pi importante insito nel
termine: quello di un evento inaspettato. Ecco quindi che appare molto pi appropriata la
definizione che segue.

Una epidemia (o malattia epidemica o epizoozia) una malattia che colpisce un numero di
individui (casi) significativamente superiore a quanto ci si sarebbe atteso in quella zona ed in quel
periodo di tempo.

Quando una epidemia geograficamente molto estesa interessando intere Nazioni o continenti, si
parla di pandemia.
253

Tutti sanno che


ogni anno, durante i
mesi invernali, si
verificano casi di
influenza
nell'uomo. Molto
spesso i media ci
avvisano,
annunciandoci in
anticipo
l'imminente arrivo
della epidemia.
Per, in base alla definizione fornita sopra, questo modo di esprimersi non giustificato, dal
momento che generalmente la malattia si ripete in maniera simile ogni anno, e quindi non affatto
inaspettata. Nel grafico viene illustrata l'incidenza dell'influenza nell'uomo negli anni dal 2004 al
2009. Il grafico aggiornato a novembre 2009. Come puoi vedere, una autentica epidemia si
verifica a partire dalla 42 settimana del 2009 (curva rossa). Probabilmente giustificato parlare di
epidemia anche per il 2004-05 (curva blu).

Ovviamente, perch si possa parlare di epidemia si deve verificare un certo incremento, ossia
necessario che compaia un certo numero di casi. Ti chiederai quanti casi sono necessari. A questa
domanda non c' una risposta univoca: il numero di casi dipende da numerose variabili, fra cui le
pi importanti sono: il tipo di agente, il tipo di popolazione, il periodo di tempo (es. stagione)
considerato. per da sottolineare che, in base alla definizione ora esposta, non indispensabile un
numero rilevante di casi per dar luogo ad una epidemia.

ESEMPIO 1. In Emilia Romagna da anni non si osservano casi di rabbia n negli animali n
nell'uomo. Pertanto, la comparsa di un numero anche limitatissimo di casi (es. 3 o 4) definibile
epidemia. Tuttavia, secondo alcuni autori, un evento di questo tipo potrebbe essere definito anche
come focolaio, anche se meglio riservare questo termine ai casi di malattia fra loro correlati e
che si verificano in una area geografica molto limitata.
ESEMPIO 2. Nel 1995 si verificata in Colombia la prima epidemia, dopo 22 anni, di una grave
malattia virale trasmissibile dall'animale all'uomo: l'encefalite equina venezuelana. Vi furono 75000
casi di malattia nell'uomo, con 300 decessi; inoltre, si stima che, fra i 50000 equini della regione La
Guajira, si sia verificata una mortalit superiore al 7%. Uno dei determinanti dell'epidemia stato
attribuito alla stagione eccezionalmente piovosa, che ha provocato un aumento della densit della
zanzara-vettore Aedes taeniorhynchus

Nelle zone dove una malattia costantemente presente (malattia enzootica, vedi oltre), non
sempre facile stabilire quale numero di nuovi casi debba essere raggiunto al fine di dichiarare
l'esistenza di una epidemia.
Per le malattie dell'uomo stato proposto di calcolare la incidenza attesa in base ai dati esistenti e
riguardanti la situazione endemica nel passato; quindi, si calcola la soglia epidemica aggiungendo
all'incidenza attesa un valore pari ad (errore standard * 1.65). Se il numero di casi rilevato supera la
soglia epidemica cos calcolata, allora si in presenza di una epidemia.

Endemia

Malattia endemica (o endemia o enzoozia) una forma morbosa che costantemente presente
in una popolazione o in una determinata area geografica. Se la prevalenza della malattia bassa,
si tratta di malattia ipoendemica; se, invece, la prevalenza alta la malattia iperendemica.
254

ESEMPIO 2. La malaria dell'uomo in molte regioni tropicali.


ESEMPIO 2. Nel bovino, la leucosi enzootica, malattia presente in tutte le aree geografiche e verso
cui, soprattutto in Europa, sono in atto piani di profilassi che mirano alla sua eradicazione.

Si definisce endemo-epidemica la malattia che endemica in una determinata regione, ma che


talvolta si presenta, nella stessa regione, con caratteristiche epidemiche.

ESEMPIO. Il colera dell'uomo in alcune regioni (es. India); l'encefalomielite equina venezuelana.

Malattia sporadica

Infine, si dice sporadica una malattia che si presenta irregolarmente ed imprevedibilmente nello
spazio e nel tempo, generalmente con bassa frequenza.

ESEMPIO 1. Una forma particolare di leucosi del bovino, la leucosi cutanea, colpisce pi spesso
bovini di 2-3 anni di et e si manifesta in forma sporadica.
ESEMPIO 2. L'aspergillosi dei volatili (malattia che colpisce numerose specie, localizzata
prevalentemente a polmoni sacchi aerei), i cui focolai si manifestano in forma sporadica.

Nel Grafico 1 vengono illustrati esempi di andamento nel tempo di una malattia epidemica,
endemica e sporadica.

una epidemia o no?

molto facile individuare una epidemia quando una malattia infettiva e altamente contagiosa
penetra in una popolazione o in un territorio indenne, colpendo in breve tempo un numero molto
elevato di animali.
Non sempre per le cose sono cos evidenti, e talvolta pu non essere facile stabilire se un certo
incremento di casi di malattia costituisca o no una epidemia.
255

Nel Grafico 2 viene esemplificato l'andamento di una certa malattia in una popolazione per
un intero anno, dal 1 gennaio al 31 dicembre (clicca sull'icona a fianco per vedere la tabella
dei dati). Per semplicit supponiamo che la popolazione sia "chiusa", ossia il numero di
animali non abbia subito variazioni nel periodo considerato. Osserva il grafico sottostante in cui,
come al solito, in ascissa abbiamo posto il tempo ed in ordinata il numero di nuovi casi.

Il picco evidenziato rappresenta una epidemia? Fornire una risposta a problemi come questo pu
essere piuttosto complicato. Tuttavia, semplificando il problema, si pu trovare almeno una linea-
guida (derivante dalla definizione stessa di epidemia) che conduce ad una risposta ragionevole.

Si gi detto che una epidemia si ha in presenza di un numero imprevisto di casi, ossia superiore al
normale; quindi, la domanda : "il picco rappresenta una situazione anormale?" Per rispondere ti
puoi basare sulla definizione di normalit gi fornita nel capitolo riguardante la variabilit
biologica: supponi che le frequenze di nuovi casi rilevate nel tempo precedente il picco considerato
abbiano una distribuzione approssimativamente gaussiana; allora, in questo caso puoi adottare il
criterio secondo cui anormale un valore al di fuori dell'intervallo media 2 volte la deviazione
standard. Nel grafico sottostante, questo intervallo evidenziato dalla la fascia gialla. Come vedi,
il picco osservato in settembre si trova al di sopra della fascia gialla, e quindi fuori dai limiti della
normalit; ci rappresenta un indizio che depone a favore dell'ipotesi che si tratti di una epidemia.
256

Per l'approccio statistico che abbiamo utilizzato ha molte limitazioni, non applicabile in tutte le
condizioni ed ha soltanto uno scopo orientativo. Nella pratica non ci si pu basare soltanto sul
calcolo di una semplice media e deviazione standard dei dati storici, ma necessario ricorrere ad
analisi statistiche pi specifiche. Inoltre, bisogna anche tener conto di altri elementi, dipendenti sia
dalla storia naturale della malattia che dalle caratteristiche popolazione in studio (es. distribuzione
spaziale, eventuali relazione tra i diversi casi di malattia ecc.).

A titolo di esempio, nella figura che segue viene fornito l'output completo di un test statistico
specificamente dedicato a evidenziare le variazioni stagionali di una malattia, generato con il
software WINPEPI - PEPI-for-Windows (Abramson JH, 2007, www.brixtonhealth.com). L'analisi
stata condotta sugli stessi dati dell'esempio precedente. Ti consiglio esaminare attentamente il
grafico ed i dati nell'ovale rosso sottostante; puoi tranquillamente trascurare il restante output, che
viene riportato per completezza.
257

Nel grafico, il triangolo rosso denota l'esistenza di un picco epidemico nel mese di agosto. Inoltre, il
test statistico di Freedman fornisce un valore P<0.05. Ci significa che la probabilit che
l'incremento dei casi in agosto sia dovuto al caso inferiore al 5%. Pertanto il picco osservato in
agosto pu essere considerato una epidemia.
258

10. Misure di
frequenza delle malattie
10.10 Altri parametri di frequenza di malattia

OBIETTIVO:

elencare altre formule utili per esprimere la frequenza di una malattia

Finora abbiamo descritto alcune misure di frequenza di malattia classiche (morbosit e mortalit,
incidenza e prevalenza ecc.). Vi sono altre misure di frequenza che possono essere calcolate;
alcune di esse si riferiscono al caso in cui si voglia studiare l'effetto di una esposizione, con lo scopo
al fine di verificarne l'importanza nella genesi di una malattia.

Il punto di partenza rappresentato, ancora una volta, dalla Tabella a due entrate, che gi ben
conosci, in cui gli animali vengono raggruppati in 4 categorie in basa all'esposizione ed alla
comparsa o meno della malattia:

Attraverso i dati A, B, C, D della Tabella si possono derivare, numerosi parametri o proporzioni. Ad


esempio, si possono derivare le seguenti misure di frequenza:
259

Un tipico esempio di applicazione di tali proporzioni rappresentato dalle indagini epidemiologiche


da compiere in occasione di focolai di tossinfezione alimentare nell'uomo. Infatti, in questi casi
piuttosto facile, tramite un semplice questionario, identificare le persone esposte ad un
particolare alimento (cio quelle che se ne sono cibate); inoltre, la sintomatologia generalmente
molto evidente, quindi non offre difficolt nemmeno l'accertamento della presenza di malattia. Le
proporzioni cos ottenute vengono poi interpretate, come sempre con l'ausilio della statistica, per
individuare l'alimento pi probabilmente responsabile.

ESEMPIO. Si verificato un focolaio di gastroenterite dopo un


pranzo di nozze cui hanno partecipato 92 persone. Fra gli alimenti
presi in
considerazione, quello
pi sospetto il gelato
alla vaniglia. Avevano
mangiato gelato alla
vaniglia 32 persone e,
di queste, 30 si sono ammalate. Si sono ammalate
anche 7 persone che non avevano mangiato il gelato
alla vaniglia.
I dati vengono tabulati nella Tabella a lato. Calcoliamo
alcune proporzioni utili:
esposti=32/92;
ammalati=37/92;
ammalati ed esposti=30/92;
ammalati negli esposti= 30/32;
ammalati nei non esposti=7/60;
esposti negli ammalati=30/37;
esposti nei non ammalati=2/55.
Si pu calcolare anche l'odds ratio, che il rapporto fra (odds di esposizione nei casi) e (odds
esposizione nei non-casi): (30/7)/(2/53)=113.6.
260

Se non ti chiaro come stata generata la Tabella 2x2, puoi dare un'occhiata ad una
presentazione animata.

Fai attenzione ad una questione di terminologia: convenzionalmente quando si dice, ad esempio,


ammalati negli esposti NON si indica la semplice frequenza (nell'esempio: 30), ma si intende
invece la proporzione di ammalati fra gli individui esposti, e cio 30/(30+2). Lo stesso dicasi per
gli altri parametri (esposti negli ammalati ecc.).
261

10. Misure di
frequenza delle malattie
10.11 Standardizzazione delle misure

OBIETTIVO:

constatare come il raffronto di alcune misure possa aver significato soltanto quando effettuato su
popolazioni standardizzate

Molti dei tassi o proporzioni finora descritti (es. morbosit, mortalit ecc.) possono essere utilizzati
per confrontare due (o pi) popolazioni soltanto se le popolazioni sono abbastanza simili riguardo
alle caratteristiche che potrebbero influenzare il parametro misurato.

In caso contrario, il raffronto pu condurre a conclusioni errate, in quanto tali caratteristiche


possono agire come confondenti o elementi di confondimento (confounders).

Questo concetto pu essere compreso pi facilmente ricorrendo ad un esempio.

Un esempio di standardizzazione

Un allevatore di pesci tropicali d'acqua dolce tiene le vasche di


allevamento in due diverse locali (d'ora in poi denominati come
Loc-1 e Loc-2). Tutte le caratteristiche principali
dell'allevamento (provenienza e temperatura dell'acqua,
trattamenti effettuati ecc.) sono identiche in Loc-1 e in Loc-2.
L'unica differenza importante sembra essere l'alimentazione: in
Loc-1 si utilizza il mangime Mang-1, mentre per i pesci allevati in Loc-2 si utilizza un altro
mangime (Mang-2) prodotto da una ditta diversa.
L'allevatore riferisce di aver notato una mortalit pi elevata in Loc-2 e, poich l'unica differenza
fra i due gruppi il mangime, attribuisce la colpa al Mang-2.
Il tuo compito quello di condurre una indagine epidemiologica per verificare se le osservazioni
dell'allevatore sono corrette e se giustificato incolpare il Mang-2.

Il primo elemento da verificare la mortalit. In base ai dati raccolti dall'allevatore, di cui non
abbiamo motivo di dubitare, si registrato quanto segue:
262

Dall'esame della tabella si vede facilmente che in Loc-2 la mortalit stata quasi doppia rispetto a
Loc-1. Tuttavia sappiamo che questa osservazione, in s, non sufficiente a dichiarare che la
mortalit in Loc-1 significativamente superiore rispetto a Loc-2. Infatti, la differenza osservata
potrebbe essere dovuta al semplice caso. Come gi hai appreso (v. Capitolo 5), per escludere
questa ipotesi necessario applicare un test statistico. Si tratta di effettuare un confronto fra due
percentuali, quindi adatto il test del chi-quadrato. Puoi farlo tu stesso utilizzando questo foglo
di calcolo. Il test fornisce un valore P=0.0007: esistono soltanto 7 probabilit su 10000 che la
differenza nella mortalit osservata nei due locali di allevamento sia dovuta al caso. Puoi affermare
che la differenza osservata statisticamente significativa;

Sembra proprio che l'allevatore abbia ragione. Tuttavia, non sei ancora del tutto convinto. Decidi di
fare un sopralluogo in allevamento (l'epidemiologia non si fa solo a tavolino...), e ti rendi conto che,
in entrambi i locali, vengono allevate 3 diverse specie di pesci: Tanichthys, Rasbora e Barbus.

Chiedi all'allevatore se sono stati registrati i dati di mortalit separati per specie; la risposta
positiva. Quindi, compili una nuova tabella della mortalit per ciascun locale, usando con i dati
disaggregati per ciascuna delle tre specie, come segue:
263

Come vedi, i dati aggiuntivi dimostrano che la mortalit osservata in ciascun specie (caselle verdi)
all'incirca la stessa nei due gruppi e quindi non dipende dal locale di allevamento (e quindi
nemmeno dall'alimentazione).
La differenza fra i tassi grezzi di mortalit, che ha tratto in inganno l'allevatore (caselle rosa), era da
attribuire soltanto alla diversa distribuzione delle specie di pesci nelle vasche dei due locali e non ad
altri fattori.

Concludiamo dicendo che dall'esempio scaturisce la seguente osservazione di carattere generale.


Occorre fare molta attenzione quando si confrontano due popolazioni o due gruppi allo scopo di
rilevare differenze (non solo riguardo alla mortalit ma anche per tanti altri parametri). Infatti, le
differenze osservate potrebbero derivare da fattori di distorsione o di confondimento presenti nelle
popolazione. Nel caso della valutazione del tasso di mortalit dell'uomo, il pi importante di questi
fattori l'et. Per gli animali in allevamento possono agire altri fattori, come ad esempio la razza o
la specie (come nell'esempio), il regime vaccinale, l'igiene ambientale ecc.. Per evitare di giungere a
conclusioni sbagliate, necessario considerare con molta attenzione lo scenario delle popolazioni su
cui si sta lavorando. Se possibile, opportuno effettuare una standardizzazione. [Per saperne di pi su
questo argomento consultare il Libro, Cap. 10.7, pag 137 e segg.] .

Forse sarai sorpreso nell'apprendere che il tasso grezzo di mortalit


annuo pi alto in Italia che in molti Paesi africani o del Terzo
Mondo.
Ad esempio, il confronto fra Italia e Algeria registra valori di
9.93 in Italia vs 4.72 in Algeria (stime 2012). Ci significa che
in Italia ogni anno muoiono circa 10 persone su mille, ed in Algeria
soltanto 5.
264

Questi dati sono dovuti al fatto che il confronto viziato dalla differente composizione delle due
popolazioni rispetto all'et. Infatti, notoriamente (ed ovviamente) nelle popolazioni umane l'et
rappresenta il principale fattore che influenza la mortalit.
In Italia la popolazione mediamente pi vecchia che in Algeria (et mediana 43.5 vs 27.6), perch
la struttura della popolazione diversa: in Italia vi sono meno giovani e pi anziani, come
dimostrano i seguenti dati: da 0-14 anni: 13.8% vs 24.2%; da 15-64 anni 65.9% vs 70.6%; 65 anni
ed oltre 20.3% vs 5.2%) [Fonte dei dati: The World Factbook, www.cia.gov].
In questi casi, il raffronto dei tassi grezzi non ha alcun valore. necessario un raffronto
265

11. Test di
screening e diagnostici
11.1Utilizzo di un test per lo screening di popolazioni

OBIETTIVO:

apprendere il significato o lo scopo di un test di screening

verificare le differenze di base tra screening e diagnosi

Molti pensano che un test sia una specifica procedura di laboratorio (es. test della glicemia,
colesterolo ecc.) o una procedura che viene valutata attraverso uno strumento e che pertanto meno
dipendente dal giudizio soggettivo dell'esaminatore.
Questa opinione non certamente sbagliata, ma per i nostri scopi piuttosto limitativa: infatti in
questo capitolo tratteremo dei test in una accezione pi ampia, intendendo per test qualsiasi ben
definita procedura, oggettiva e possibilmente standardizzata, che viene utilizzata al fine di
raccogliere una ben definita informazione.
In questa ottica, possono essere tranquillamente considerati test anche la auscultazione cardiaca
o la percussione polmonare o l'esame della mucosa congiuntivale ecc.. Anche le domande di un
questionario possono essere viste come un test.

Un test di screening un test che viene applicato ad animali (popolazione) apparentemente


sani (o a stato sanitario ignoto) soggetti ad una probabilit (rischio) pi o meno elevata di
presentare la malattia considerata. In questo modo, tutti gli individui della popolazione (oppure un
campione) vengono sottoposti al controllo diagnostico. In genere, i test di screening sono
procedure poco costose e di rapido e semplice impiego.

L'individuazione di animali ammalati o infetti attraverso operazioni di screening ha rappresentato, e


continua a rappresentare, la base dei grandi piani di lotta nei confronti di alcune malattie degli
animali.
266

Negli animali, le azioni di screening vengono effettuate nei confronti di malattie di notevole gravit
(sul piano sanitario o economico) oppure di malattie trasmissibili all'uomo.
In medicina umana, lo screening viene indirizzato preferenzialmente a quelle condizioni morbose in
cui una diagnosi precoce ed il conseguente intervento terapeutico siano in grado di ridurre
l'incidenza o la mortalit.

ESEMPIO 1. In Italia, cos come in molti altri Stati, la profilassi nei confronti della tubercolosi
bovina basata sull'utilizzo di una prova di ipersensibilit cutanea (il test della tubercolina); la
prova si effettua su tutti i bovini di et superiore a 7 settimane.
ESEMPIO 2. La brucellosi dei bovini e degli ovi-caprini anch'essa soggetta a profilassi
obbligatoria in molti Stati; in Italia, previsto l'impiego di test sierologici (test al rosa bengala e
fissazione del complemento).
ESEMPIO 3. Nel settore avicolo, da tempo in atto un piano di controllo nei confronti della
pullorosi (malattia trasmissibile sostenuta da Salmonella pullorum e Salmonella gallinarum),
anch'esso da effettuarsi con l'impiego di un test sierologico: l'agglutinazione rapida su sangue in
toto. Vengono saggiati, in operazioni di screening, tutti gli animali da riproduzione.

Lo screening pu essere effettuato per individuare la presenza di malattia in singoli animali oppure
gruppi di animali (es. gregge, mandria di bovini ecc.). In quest'ultimo caso, l'individuazione anche
di un solo animale infetto sufficiente a dichiarare infetto l'intero gruppo (anche se non tutti gli
individui sono necessariamente infetti). Questo approccio particolarmente utile quando si utilizza
un test di screening che non particolarmente efficiente nell'individuare gli animali infetti (cio
provvisto di bassa sensibilit).

Lo screening ed il procedimento diagnostico possono essere attuate per mezzo dello stesso test,
tuttavia lo screening differisce dalla diagnosi. Questa affermazione viene giustificata con i 2 punti
che seguono (la comprensione completa del secondo punto richiede concetti che verranno spiegati
pi avanti):

1. nel procedimento diagnostico il test viene eseguito su animali ammalati, cio che mostrano
sintomi clinici che, in una qualche misura, fanno sospettare la presenza di quella malattia; lo
screening, invece, preve l'applicazione del test su tutti gli individui della popolazione,
indipendentemente dal loro stato di salute;
2. poich il valore predittivo di un test dipende dalla prevalenza della malattia, ne consegue che
la performance del test sar meno soddisfacente in caso di screening rispetto al caso in cui lo
267

stesso test venga utilizzato a scopo diagnostico. Infatti, evidente che la prevalenza della malattia
fra gli individui che mostrano segni clinici sar superiore rispetto alla prevalenza considerata nella
popolazione nel suo complesso.

Vale la pena di ripetere che in epidemiologia il termine test non


comprende soltanto le classiche prove diagnostiche, simili a quelle
ora accennate, da eseguire sull'animale. Infatti, per test si intende
un qualsiasi procedimento ben codificato che viene attuato allo
scopo di verificare un'ipotesi. Pertanto, anche una ispezione
d'allevamento eseguita con criteri prefissati, una necroscopia, un
semplice questionario ecc. possono essere considerati test, e ad
essi si applicano i principi e le considerazioni che seguiranno nel
Capitolo (sensibilit, specificit, valore predittivo ecc.).
In effetti, in tutte le attivit di soluzione dei problemi sono usati test; quindi, la comprensione dei
princpi della loro valutazione ed interpretazione di importanza basilare.
268

11. Test di
screening e diagnostici
11.2 Lo screening alla prova dei fatti

OBIETTIVO:

simulare l'esecuzione di uno screening e ricordare che i test non sono infallibili

differenziare i test patognomonici da quelli non patognomonici

Prima di iniziare una azione di screening, tutti gli animali della popolazione di interesse ti sembrano
apparentemente sani. Simuliamo uno screening su una popolazione si composta da 32 cani,
rappresentati nello schema seguente:

Se tu fossi... dotato di ultravista come Superman, potresti vedere che in realt alcuni animali sono
ammalati. Fai scorrere il puntatore del mouse sullo schema!

Purtruppo tu non sei dotato di ultravista, e per individuare gli ammalati devi sottoporre tutti gli
animali ad un test. Per, un test non fornisce quasi mai risultati perfettamente rispondenti alla realt.
C' sempre un certo rischio - o meglio, una certa probabilit - che il test risulti positivo in un
animale che in realt sano. Esiste anche il rischio inverso, cio che il test risulti negativo in un
animale ammalato. Insomma: non si pu essere del tutto sicuri che un test... dica il vero. Vedrai
nelle prossime Unit la complessit di problemi che derivano da tale situazione.

Continuiamo la simulazione sulla popolazione di 32 cani, ipotizzando che 24 siano risultati test-
negativi e 8 test-positivi. Nella pratica, in effetti i dati che otterrai dallo screening sono proprio solo
e soltanto questi: 24 test-negativi e 8 test-positivi.
Quando eseguirai un test nella pratica, ti chiederai: fra i test-positivi, quanti sono davvero malati
(positivi veri)?. Ed anche: fra i test-negativi, quanti sono davvero sani (negativi veri?). Troverai
269

nelle Unit che seguono la risposta a queste domande. Per ora, sufficiente che tu ti renda conto
soltanto dell'esistenza del problema, che viene illustrato in questo schema:

Se tu fossi Superman (fai scorrere il puntatore sullo schema soprastante!), vedresti che:
a) 6 cani ammalati (colore fucsia) sono risultati test-positivi (positivi veri)
b) 2 cani sani sono risultati test-positivi (positivi falsi, cerchi verdi)
c) 1 cane ammalato risultato test-negativo (negativo falso, cerchio azzurro)
d) i restanti cani sani sono risultati test-negativi (negativi veri)

Riassumendo:

Test patognomonici e non

Gli innumerevoli test disponibili in medicina veterinaria possono essere suddivisi, in base
all'affidabilit dei risultati da essi forniti, in due categorie: test patognomonici e non
patognomonici.
270

Il termine patognomonico mutuato dalla medicina clinica: un sintomo di malattia si dice


patognomonico quando indiscutibilmente serve a riconoscere una malattia, e quindi presente solo
e soltanto in pazienti affetti da quella malattia e non da altre.

Analogamente un test patognomonico un test che, quando fornisce esito positivo, indica con
certezza la presenza del carattere ricercato.

Quasi tutti i test impiegati in medicina sono non-patognomonici; in altre parole, essi - siano positivi
o negativi - non forniscono un risultato certo, ma soltanto probabile. Pertanto, alcuni dei risultati
positivi forniti da un test non patognomonico saranno positivi-falsi, cos come alcuni negativi
saranno negativi-falsi.

Al contrario, un test patognomonico non genera mai risultati positivi-falsi, ma pu fornire risultati
negativi-falsi.

ESEMPIO. Supponiamo di utilizzare un test per l'individuazione


di bovini infetti da Brucella abortus, agente della brucellosi
bovina. Un test sierologico, che ha lo scopo di individuare la
presenza di anticorpi specifici, fornir sicuramente, oltre a
risultati positivi-veri e negativi-veri, anche risultati positivi-falsi
e negativi-falsi.
I positivi-falsi possono comparire - ad esempio - nel caso in cui
l'animale abbia subto infezione da parte di un microrganismo antigenicamente simile a Brucella
abortus, come Yersinia enterocolitica tipo IX, che induce la formazione di anticorpi simili a quelli
di Brucella.
Un risultato falso negativo verr invece ottenuto, ad esempio, saggiando il siero di una bovina che si
infettata assai recentemente, e che quindi non ha ancora prodotto anticorpi specifici. Il test
sierologico quindi un test non patognomonico.

Supponiamo ora di perseguire lo stesso scopo (individuazione delle bovine infette) utilizzando un
altro test: l'esame colturale del latte delle bovine allo scopo di dimostrare la presenza di Brucella. In
caso di positivit, la bovina non potr essere che infetta, non essendo il batterio ubiquitario n
commensale; in altre parole, una bovina che elimina Brucella con il latte sicuramente affetta da
brucellosi.
Se invece l'esame colturale del latte risulta negativo, non potremo essere sicuri dell'assenza di
infezione: infatti gli animali infetti eliminano le brucelle con il latte in maniera intermittente.
Pertanto, l'esame colturale del latte per la diagnosi di brucellosi un test patognomonico.
271

Da quanto finora esposto, si potrebbe trarre la conclusione che i test patognomonici sono migliori di
quelli non patognomonici. Questo non sempre vero. Infatti, nel giudicare un test migliore di un
altro, occorre tenere presente una serie di fattori e considerazioni, che verranno discussi - almeno in
parte - nelle prossime unit. Baster qui sottolineare come, nell'esempio precedente, il test
patognomonico abbia i seguenti svantaggi su quello non patognomonico: costo molto pi elevato;
frequenza molto pi elevata di falsi-negativi; necessit che l'animale sia in lattazione ecc.
272

11. Test di
screening e diagnostici
11.3 Valutazione della performance di un test

OBIETTIVO:

disegnare uno schema logico che permetta di valutare la bont (performance) di un test
diagnostico

Nell'unit precedente, abbiamo visto che non esistono test capaci di accertare il reale stato
(malato/sano) di un animale in tutte le situazioni e nel 100% dei casi. In altre parole: non esistono
test infallibili. L'esito del test (sia esso positivo, cio deponga a favore dell'esistenza della
malattia, o negativo) deve essere visto come una indicazione di probabilit.

Inoltre, facile comprendere come la probabilit di ottenere risultati veritieri (cio aderenti alla
realt) sia soprattutto legata al tipo di test, all'intimo meccanismo del suo funzionamento, ed a cosa
esso misura . Da ci deriva che la performance varia da test a test.

Immagina di voler valutare la performance di un test, che chiameremo test X. Per semplicit,
supponiamo che questo test fornisca un risultato dicotomico del tipo vero/falso (sano/malato). Il
procedimento per valutare la performance del test X prevede che tu abbia a disposizione animali -
sia ammalati che sani - dei quali noto con certezza - o con la massima attendibilit - il reale stato
malato/sano. Ci si pu ottenere con metodi diversi a secondo delle circostanze; spesso ci si serve
del miglior test disponibile, che viene detto golden test (test aureo). Si assume che i risultati del
golden test siano completamente veritieri; in altre parole, si assume che il golden test non sbagli
mai.

Il golden test deve essere biologicamente diverso dal test X, ossia deve basarsi su un meccanismo
differente.

Procedi quindi a saggiare gli animali sia con il test X che con il golden test, e ad inserire i dati
ottenuti nelle quattro celle (a, b, c, d) di una Tabella a doppia entrata:
273

Il significato delle celle chiaro:

cella a: animali T+M+ (test-positivi e ammalati);


cella b: animali T+M- (test-positivi e sani);
cella c: animali T-M+ (test-negativi e ammalati);
cella d: animali T-M- (test-negativi e sani).

Evidentemente, la performance del test dipende dai valori ottenuti nelle quattro celle, e soprattutto
alla proporzione di misclassificazioni (classificazioni errate), rappresentate dai falsi-positivi (cella
b) e falsi-negativi (cella c). Con un test infallibile, le misclassificazioni non esistono, quindi b=0 e
c=0. Per i test infallibili sono davvero molto rari. I test di comune impiego restituiscono sempre
una certa quota di risultati non veritieri e ci genera una serie di problemi che andremo a
considerare in questa Unit e nelle successive.

Tieni presente stiamo considerando una simulazione a scopo didattico. Nella pratica, la popolazione
in esame di norma si esamina con un solo test, che ti consente di suddividere gli animali in due
gruppi: i test-positivi (a+b) ed i test-negativi (c+d).

Attraverso i quattro valori (a, b, c, d) della Tabella, puoi procedere alla valutazione della
performance del test X (sensibilit, specificit valori predittivi ecc.), come vedrai nelle Unit che
seguono.

L'individuazione di un golden-test non sempre facile. Talvolta si pu utilizzare un test


relativamente semplice e poco costoso. Ad esempio, in un caso di mastite acuta di una bovina, la
diagnosi clinica di "mastite da Staphylococcus aureus" viene confermata facilmente attraverso
esame colturale del latte (che, in questo caso, rappresenta il golden test). Tuttavia, molto pi spesso
necessario ricorrere a golden test lunghi, complicati, costosi o rischiosi per il paziente (es.
laparatomia esplorativa, biopsia).

Abbiamo detto - e ripetuto - che un test diagnostico fornisce quasi sempre una certa quota di
risultati falsi-positivi e falsi-negativi. Di conseguenza, il calcolo della prevalenza di una malattia in
274

una popolazione in base al risultato di un test non fornisce il valore della prevalenza reale, bens la
cosiddetta prevalenza apparente.

Vedrai in una prossima Unit come, attraverso il Teorema di Bayes, sia possibile calcolare la
prevalenza reale conoscendo la prevalenza apparente e due caratteristiche del test utilizzato: la
sensibilit e la specificit.
275

11. Test di
screening e diagnostici
11.4 Sensibilit e specificit di un test

OBIETTIVI:

apprendere il significato della "sensibilit" e della "specificit" di un test

calcolare la sensibilit e la specificit di un test avendo a disposizione i dati necessari

La sensibilit e la specificit sono due misure che vengono impiegate per valutare la capacit di
individuare, fra le unit di una popolazione, quelle provvisti del carattere ricercato e quelli che
invece ne sono privi. Quasi sempre, quando si esegue un test su un animale, il carattere ricercato
rappresentato dalla presenza di una malattia; quindi, negli esempi, far riferimento a questo tipo di
utilizzo del test.

Il termine sensibilit in senso epidemiologico viene utilizzato diversamente da quanto avviene in


immunologia, in farmacologia o in altri settori, ove un test sensibile quello capace di svelare la
presenza di piccole quantit di anticorpi, tossine, enzimi ecc.. Evidentemente, questo concetto di
sensibilit da tenere ben distinto da quello utilizzato in epidemiologia: infatti, un test
immunologicamente molto sensibile potrebbe essere poco sensibile se utilizzato a scopo
epidemiologico.

Per farti meglio comprendere il concetto sensibilit e specificit di un test, ti consiglio di partire
dalla tabella a due entrate gi descritta nell'Unit precedente, e che, per tua comodit, viene qui
riprodotta di nuovo:
276

Memorizza la disposizione delle righe e colonne della tabella, sarai facilitato nell'apprendimento
delle prossime unit didattiche!
Ricordati:
colonne=realt (malato/sano);
righe=esito test:
(positivo/negativo);
a=malati test-positivi;
b=sani test-positivi;
c=malati test-negativi;
d=sani test-negativi.
Questa disposizione delle righe
e delle colonne nella Tabella non obbligatoria, ma quella adottata pi comunemente e
rappresenta quasi uno "standard".

Vediamo ora pi in dettaglio le principali caratteristiche della sensibilit e della specificit di un


test.

Sensibilit

Abbiamo gi visto che non tutti gli animali malati, sottoposti ad un test, risultano positivi:

La sensibilit risponde alla domanda: quanti, degli animali malati sottoposti al test, sono risultati
positivi?.

Pertanto, la sensibilit di un test la sua capacit di identificare correttamente gli animali malati. In
termini di probabilit, la sensibilit la probabilit che un animale malato risulti positivo al test.
Possiamo anche dire che la sensibilit la proporzione di animali malati che risultano positivi al
test.

.
277

La seconda definizione la migliore allo scopo di intuire il calcolo della la sensibilit: nella tabella,
i malati sono rappresentati da (a+c) e, fra questi, i test-positivi sono rappresentati da (a);
quindi, la sensibilit si calcola con la proporzione a/(a+c):

Ti ricordo che la frazione a/(a+c) ha la particolarit di includere al denominatore il valore presente


al numeratore; si tratta quindi di una proporzione, che pu assumere soltanto valori compresi fra
0 e 1 (esprimibili anche come percentuali da 0 a 100).

Ad un esame superficiale, potresti pensare che una altissima sensibilit l'unica qualit desiderabile
in un test: infatti, il poter identificare correttamente, attraverso un test, tutti gli animali ammalati
tutto quello che ti serve.

Tuttavia, se esamini meglio la questione, ti rendi conto che le cose non stanno proprio cos: un'alta
sensibilit non sufficiente. Infatti, necessario anche un altro requisito: un buon test deve
identificare come positivi soltanto gli animali che hanno la malattia; cio, necessario che fra i test-
positivi non siano inclusi anche animali sani. Da questa osservazione discende il concetto di
specificit.

Specificit

Non tutti gli animali sani, sottoposti ad un test, risultano negativi:


278

La specificit risponde alla domanda: quanti, degli animali sani sottoposti al test, sono risultati
negativi?.

Pertanto, la specificit di un test la sua capacit di identificare correttamente gli animali sani. In
termini di probabilit, la specificit la probabilit che un animale sano risulti negativo al test.
Possiamo anche dire che la specificit la proporzione di animali sani che risultano negativi al test

Ancora una volta, quest'ultima definizione la migliore per di intuire il calcolo della la specificit:
nella tabella i sani sono rappresentati da (b+d) e, fra questi, i test-negativi sono rappresentati
da (d); quindi, la specificit si calcola con la proporzione d/(b+d):
279

Nota che anche la specificit, come la sensibilit, definita attraverso una proporzione e quindi
assume un valore compreso fra 0 e 1.

Nelle operazioni di screening su larga scala, che coinvolgono un elevato numero di individui, la
specificit del test di grande importanza. Ad esempio, nel 2002 in Italia sono stati effettuati
746.678 test per la BSE (encefalopatia spongiforme bovina); di essi, 34 sono risultati positivi.
Questi dati indicano che il test utilizzato era dotato di specificit straordinariamente elevata. Se si
fosse utilizzato un test con specificit pari a 0.99 (ossia 99%), l'1% dei bovini SANI saggiati
sarebbe risultato positivo: ossia ben 7467 animali!

Stima della sensibilit e specificit

I valori di sensibilit e specificit di un test vengono calcolati attraverso esperimenti eseguiti su un


campione. Lavorando su un campione, come gi ricordato, esiste il problema della variabilit
dovuta al caso. Perci soprattutto quando il campione studiato piccolo, opportuno calcolare
l'intervallo di confidenza (es. intervallo di confidenza 95%), che serve a quantificare la precisione
della stima ottenuta riguardo ai valori di sensibilit e specificit.

L'intervallo di confidenza di una percentuale (o di una proporzione) stato trattato in una unit
precedente. Qui di seguito c' un esempio a scopo di... ripasso.

Per il calcolo dell'intervallo di confidenza 95% di un dato valore di sensibilit, si utilizza la formula
seguente:

Per calcolare l'intervallo di confidenza 99% basta sostituire il coefficiente 1.96 con 2.53.

Ovviamente la suddetta formula pu essere utilizzata anche per il calcolo dell'intervallo di


confidenza della specificit: devi sostituire il valore di Se con Sp, e n con il totale degli animali
non-malati (ossia b+d).

ESEMPIO. Hai applicato un test in un campione di 95 animali. Quarantadue animali sono risultati
test-positivi e 53 test-negativi. I risultati riassunti nella sottostante Tabella.
280

Qui di seguito, il calcolo della sensibilit e della specificit e dei relativi intervalli di confidenza

95%.

L'interpretazione ed il significato dell'intervallo di confidenza sono gi stati spiegati in una unit


precedente.

L'ampiezza dell'intervallo di confidenza dipende dal numero n di animali che hai esaminato: pi
grande questo numero, pi ristretto l'intervallo di confidenza. Ci viene illustrato nel grafico
sottostante, che mostra la precisione di una stima di sensibilit di un test in rapporto al numero di
animali esaminati. Si tratta di un grafico di esempio, in cui vengono riportati gli intervalli fiduciali
assumendo che il test abbia Se=0.75. Gli intervalli fiduciali 95% (area azzurra), sono stati calcolati
applicando la suddetta formula, sostituendo p con 0.75.

Per concludere

Infine, per sottolineare nuovamente i risvolti pratici legati alle caratteristiche di sensibilit ed alla
specificit di un test, si pu ricordare che...
281
282

11. Test di
screening e diagnostici
11.5 Sensibilit e specificit: influenza del valore di soglia (cut-off)

OBIETTIVO:

consolidare il concetto di sensibilit e specificit

apprendere i motivi per cui molto difficile che esista un test con sensibilit e specificit 100%

comprendere come si possa far variare la sensibilit e la specificit di un test, ma solo a prezzo di
compromessi

Finora abbiamo illustrato le caratteristiche di un ipotetico test che forniva risultati del tipo
positivo/negativo oppure sano/malato oppure si/no. Un test di questo tipo, con output binario (in
due sole categorie), viene detto nominale dicotomico; si tratta di un test qualitativo in quanto
misura l'esistenza (qualit) di un fenomeno e non la sua ampiezza (quantit).

Esistono anche test semi-quantitativi che generano risultati classificabili in pi di due categorie. Ad
esempio, attraverso un test si pu classificare come segue lo stato di un paziente dopo un
trattamento: molto peggiorato, peggiorato, stazionario, poco migliorato, migliorato, molto
migliorato. Le variabili di questo tipo, costituite da dati qualitativi suddivisi in pi categorie con una
direzione chiaramente implicita (es. migliorepeggiore o viceversa), vengono dette ordinali.

Ancora, i test possono essere di tipo quantitativo, fornendo risultati numerici misurabili su una scala
numerica (variabili continue), come ad esempio i valori di densit ottica (D.O.) di un test ELISA
misurati con lo spettrofotometro.

Il test ELISA (Enzyme-Linked ImmunoSorbent Assay) test quantitativo che impiega un enzima
coniugato ad un anticorpo per identificare e quantificare la presenza di anticorpi (o di antigeni) nel
siero di sangue o in altri materiali. In caso di positivit, l'enzima induce una variazione di colore
tanto pu intensa quanto pi elevata la presenza di anticorpi (o di antigeni) nel campione. La
variazione di colore viene rilevata attraverso uno strumento (spettrofotometro) e si esprime con un
valore numerico attraverso una unit di misura detta assorbanza (o densit ottica).

Per i test quantitativi (ed anche per quelli semi-quantitativi), sorge un problema di interpretazione:
occorre stabilire un valore critico o soglia o cut-off, che rappresenta il limite di separazione tra
positivit e negativit del test. Ci corrisponde generalmente alla separazione ammalato/sano.
283

ESEMPIO. Al di sotto di quale numero di eritrociti/mm3 un animale pu essere giudicato anemico?


Al di sopra di quale densit ottica ottenuta con un test ELISA un animale da ritenere malato?
Quanto deve essere ingrossato un linfonodo per far sospettare la presenza di una metastasi?

La scelta del cut-off di estrema importanza: sarai forse sorpreso nell'apprendere che la sensibilit
e la specificit possono essere fatte variare a piacimento variando il cut-off. Ora, attraverso un
esempio-simulazione, giustifichiamo questa affermazione, e ne discutiamone le implicazioni.

Il mio consiglio: prima di proseguire con questa Unit, assicurati di aver ben saldi i concetti di
sensibilit e specificit spiegati nell'unit precedente!

Un esempio-simulazione

Nel grafico 1 sono riportate delle curve teoriche ottenute supponendo di saggiare con un test
ELISA quantitativo, sieri di sangue prelevato da un campione di animali sicuramente ammalati e da
un campione di animali sicuramente sani.

Vediamo come stato costruito il grafico.


Sull'asse delle ascisse (orizzontale) stata riportata la densit ottica (D.O.) restituita dal test. Puoi
notare che sono stati ottenuti valori compresi fra 0.2 a 1.6; tieni presente che il valore di D.O.
proporzionale alla quantit di anticorpi presenti nel siero: pi anticorpi ci sono nel siero e maggiore
la D.O. Ovviamente, pi la D.O. elevata , maggiore la probabilit che l'animale sia ammalato.

Sull'asse delle ordinate (verticale) riportata la frequenza di osservazioni, cio il numero di animali
che hanno evidenziato il titolo corrispondente in ascissa. Si nota che gli animali sani hanno fatto
registrare valori di D.O. mediamente pi bassi rispetto agli animali malati: la curva verde infatti
pi a sinistra rispetto alla rossa. Si nota anche che le due curve si sovrappongono parzialmente, ed
proprio questa area di sovrapposizione che verr presa in considerazione nella discussione che
segue.

Forse ti aspettavi che i sieri degli animali sani facessero


registrare valori di D.O. costantemente pari a zero. Oppure,
ti aspettavi che gli animali sani facessere registrare valori
284

sempre inferiori rispetto agli ammalati (v. grafico a sinistra). In questi casi, il test sarebbe perfetto
ed infallibile, e non ci sarebbero problemi di interpretazione.
Purtroppo nella pratica ci non si verifica, e non devi stupirti che in una certa quota di animali sani
possa evocare una risposta positiva ad un test, e viceversa: questo fenomeno pu essere dovuto ad
una variet di cause che non possibile trattare in questa sede.

Torniamo al Grafico 1. Il problema quello di stabilire un limite di separazione fra e sani e malati,
ossia di stabilire il valore di D.O. al di sopra del quale l'animale viene ritenuto malato e al di sotto
del quale viene ritenuto sano. Per essere pi chiari: guarda l'asse delle ascisse e rispondi alla
seguente domanda: a partire da quale valore di D.O. classifichi come ammalato un animale?

Supponi di adottare come cut-off il valore di 1.0. Ci significa che dichiarerai come sano ogni
animale con D.O. 1.0, e dichiarerai malato ogni animale con D.O. >1.0.

Considera il sottostante Grafico 2: con un cut-off=1, suddividi gli animali in due classi: test-positivi
e test-negativi. Nota che, in realt, fra quelli classificati come test-negativi sono compresi animali
negativi veri (area verde) ed animali negativi falsi (area tratteggiata viola). Analogamente, fra i test-
positivi sono compresi animali positivi veri (area rosa) ed animali positivi falsi (area tratteggiata
gialla).

Riassumendo: adottando un cut-off=1, si ottengono quattro classi di animali: (a) positivi veri, (b)
positivi falsi, (c) negativi falsi, (d) negativi veri. Sicuramente ricordi che queste quattro classi
corrispondono a quelle gi viste nell'Unit precedente in cui, attraverso la tabella di contingenza,
stata definita la sensibilit e la specificit di un test:
285

Finora abbiamo simulato l'ipotesi di adottare un cut-off=1. Ma che cosa succede adottiamo un cut-
off diverso? Osserva ancora il Grafico 2, ed immagina di aumentare il cut-off (spostando verso
destra la linea blu) o di diminuirlo (spostando la linea verso sinistra).

Se aumenti il cut-off, ottieni i seguenti effetti:

il numero complessivo di test-positivi diminuisce, ed aumenta quello di test negativi


aumenta l'area d, ed anche l'area c;
diminuisce l'area a, ed anche l'area b.

Di conseguenza, la sensibilit [a/(a+c)] diminuisce, e la specificit [d/(b+d)] aumenta.

Se diminuisci il cut-off, ottieni i seguenti effetti:

il numero complessivo di test-positivi aumenta, e diminuisce quello di test negativi


diminuisce l'area d, ed anche l'area c;
aumenta l'area a, ed anche l'area b.

Di conseguenza, la sensibilit [a/(a+c)] aumenta, e la specificit [d/(b+d)] diminuisce. Potresti


scegliere valori di cut-off tali addirittura da massimizzare la sensibilit oppure la specificit come
illustrato nei grafici che seguono:

Nel primo caso (Sensibilit=1) il cut-off stato abbassato a circa 0.8: sotto questa nuova ipotesi, il
test riesce ad individuare tutti i soggetti ammalati essendo il valore dell'area c=zero. Per, come
contropartita, hai un aumento dell'area b (positivi falsi). Poich c=0, la sensibilit massima, ossia
pari a 1; questo effetto favorevole bilanciato da una diminuzione della specificit.

Nel secondo caso (Sensibilit=1) il cut-off stato alzato a circa 1.3: sotto questa nuova ipotesi, il
test riesce ad individuare tutti i soggetti sani, essendo il valore dell'area b=zero. Per, come
contropartita, hai un aumento dell'area b (negativi falsi). Poich b=0, la specificit raggiunge il
valore massimo di 1; questo effetto favorevole bilanciato da una diminuzione della sensibilit.
286

In genere conveniente scegliere un cut-off di compromesso (es. del Grafico 1): sia la sensibilit
che la specificit hanno un valore <1, e perci si otterr una quota di risultati positivi falsi e di
negativi falsi. Questo inconveniente inevitabile, e deriva dalla parziale sovrapposizione delle due
curve di distribuzione (sani e malati).

Per riassumere:

diminuendo il cut-off di un test, aumenta la sensibilit a scapito della specificit;


aumentando il cut-off di un test, aumenta la specificit a scapito della sensibilit.

ESEMPIO. Langenbach e coll. (2001) hanno calcolato sensibilit e specificit del test "Esame
clinico dei linfonodi" di cani e gatti al fine di diagnosticare metastasi di tumori solidi. L'esame
clinico stato posto a raffronto con un test di riferimento (golden test) rappresentato dall'esame
istologico dei linfonodi.
noto che, durante le malattia neoplastiche, si possono verificare tumefazioni ed ingrossamenti dei
linfonodi regionali, e l'ingrossamento rilevabile mediante una semplice palpazione. Uno dei
problemi connessi con questa tecnica rappresentato dalla valutazione dell'entit
dell'ingrossamento e dalla sua interpretazione. In particolare: sufficiente un modico ingrossamento
oppure l'aumento di volume del linfonodo deve essere notevole?
Gli Autori hanno classificato la modificazione del volume in 3 categorie: (1) no ingrossamento; (2)
ingrossamento lieve; (3) ingrossamento notevole. Questo tipo di classificazione ha fatto sorgere il
quesito se gli animali appartenenti la categoria (2) (ingrossamento moderato) fossero da assegnare
alla categoria degli ammalati o dei non ammalati. Gli Autori hanno applicato due criteri di
interpretazione: interpretazione permissiva e interpretazione severa. Nel primo caso gli animali con
linfonodi lievemente ingrossati venivano classificati come "sani", nel secondo come "malati". Ci
corrisponde proprio ad una variazione del cut-off.
In sintesi, sono stati ottenuti i seguenti risultati:
287

Come si vede, l'interpretazione permissiva (corrispondente ad un innalzamento del cut-off) ha fatto


registrare una sensibilit inferiore ed una specificit superiore rispetto alla interpretazione severa
(corrispondente ad un abbassamento del cut-off).

Privilegiare la sensibilit o la specificit?

Purtroppo a questa domanda non pu essere data una risposta univoca. Come abbiamo ora
dimostrato, il valore di cut-off influenza sia la sensibilit che la specificit del test. Esso viene scelto
in base ad una serie di considerazioni: ad esempio, deve essere ben nota la storia naturale della
malattia, nonch le conseguenze sanitarie ed economiche dei negativi falsi e dei positivi falsi. Nel
caso di alcune malattie infettive, talvolta anche un solo animale falso negativo pu risultare
particolarmente pericoloso, in quanto escretore dell'agente di malattia e quindi disseminatore del
contagio

ESEMPIO. Nello screening effettuato sulle persone donatrici di sangue necessario adottare test
provvisti della massima sensibilit. Infatti, assolutamente indispensabile tutelare chi riceve la
donazione e quindi non si pu correre il rischio di trasfondere sangue infetto (risultato falsamente
negativo ai test di sicurezza). Su questa base, diventa tollerabile la distruzione di una certa quota di
campioni non infetti (risultati falsamente positivi ai test di sicurezza).

Nel caso di malattie rare, conviene utilizzare un test ad alta sensibilit, altrimenti si rischia di non
individuare i pochi casi presenti; al contrario, se la prevalenza della malattia elevata,
generalmente pi utile un test altamente specifico: infatti vanno assolutamente contenuti i positivi
falsi al fine di non esaurire rapidamente le risorse per le richieste diagnostiche o terapeutiche del
gran numero di animali positivi (veri e falsi).

In epidemiologia clinica, nella scelta di un test diagnostico, si dovrebbero sempre considerare le


caratteristiche di sensibilit e specificit e privilegiare l'una o l'altra a seconda delle circostanze.
Un test sensibile dovrebbe essere scelto quando le conseguenze di una mancata diagnosi sono
particolarmente gravi (es. malattie ad esito solitamente mortale, ma che possono essere
efficacemente curate).
I test sensibili sono utili anche durante il processo diagnostico iniziale, al fine di ridurre il ventaglio
di possibilit (diagnosi differenziale) quando esso ampio. In tal caso, il test sensibile viene
applicato soprattutto allo scopo di escludere una o pi malattie. Infatti, un test sensibile di
maggior aiuto al clinico quando fornisce un risultato negativo.

Un test specifico particolarmente utile per confermare una diagnosi gi effettuata con altri mezzi.
Infatti, un test specifico raramente positivo in assenza della malattia. I test altamente specifici
sono particolarmente utili quando un risultato falso positivo risulta particolarmente dannoso (sotto
l'aspetto organico, emotivo per il proprietario, finanziario ecc.). In sostanza, un test molto specifico
di maggior aiuto al clinico quando fornisce un risultato positivo.
288

11. Test di
screening e diagnostici
11.6 Valori predittivi di un test

OBIETTIVO:

definire le caratteristiche e calcolare il valore predittivo positivo ed il valore predittivo negativo


di un test

Anche per la comprensione del valore predittivo di in test conviene, come gi avvenuto a proposito
della sensibilit e della specificit, tenere presente la ormai ben nota (v. Unit precedente) Tabella
di contingenza a due entrate, in cui le colonne indicano lo stato reale dell'animale (M+, malato; M-,
sano) e le righe l'esito del test (T+, positivo, T-, negativo):

Il mio consiglio: prima di proseguire con questa Unit, assicurati di aver ben saldi i concetti di (v.
sensibilit e specificit!

importante tenere ben separati i concetti di sensibilit (Se) e specificit (Sp) dal valore predittivo.
La Se e la Sp sono caratteri propri del test e legati al suo intimo funzionamento. In genere essi sono
dichiarati dal produttore e sono (o dovrebbero essere) noti prima dell'applicazione del test sulla
popolazione: Se e Sp sono probabilit pre-test.

Tuttavia, una volta eseguito il test, Se e Sp perdono importanza. Infatti, dopo uno screening di
popolazione, o nell'attivit diagnostica ambulatoriale, oppure - pi in generale - quando si deve
interpretare il risultato di un test, diventano importanti due probabilit post-test. Infatti,
auspicabile avere un'idea della quota di soggetti realmente ammalati (positivi veri, cella a) sul totale
degli animali risultati positivi al test (celle a+b). Analogamente, bene conoscere la quota di
soggetti realmente sani, (negativi veri, cella d) sul totale dei negativi al test (celle c+d).

Il valore predittivo positivo


289

Non tutti gli animali positivi ad un test sono realmente ammalati. Quindi, in presenza di un animale
positivo ad un test, occorre rispondere alla seguente domanda:

La risposta a questa domanda pu essere data solo in termini di probabilit, calcolando il valore
predittivo positivo (VPP) che indica la probabilit che un animale test-positivo sia davvero
ammalato. Esso rappresenta la proporzione di animali test-positivi che sono ammalati. A partire
dalla tabella di contingenza, il VPP si calcola cos: a/(a+b).

Il valore predittivo negativo

Non tutti gli animali negativi ad un test sono realmente sani. Ecco quindi che, in presenza di un
animale negativo ad un test, occorre rispondere alla seguente domanda:
290

Anche in questo caso, la risposta pu essere data solo in termini di probabilit, calcolando il valore
predittivo negativo (VPN) che indica la probabilit che un animale test-negativo sia davvero sano.
Esso rappresenta la proporzione di animali test-negativi che sono sani. A partire dalla tabella di
contingenza, il VPN si calcola cos: c/(c+d).

Il valore predittivo positivo viene da alcuni detto valore predittivo di un risultato positivo oppure
valore predittivo di un test positivo. Analogamente dicasi per il valore predittivo negativo:
valore predittivo di un risultato negativo o valore predittivo di un test negativo.

Calcolare i valori predittivi nella pratica: il Teorema di Bayes

In questa Unit ti ho spiegato come si calcolano i valori predittivi, assumendo di possedere... poteri
soprannaturali attraverso i quali si conosce non solo il risultato del test, ma anche lo stato reale
(malato/sano) degli animali. A scopo didattico questa assunzione stata necessaria, ma siamo
rimasti su un piano teorico, un po' avulso dalla pratica. Infatti, ti chiederai senz'altro come sia
possibile calcolare il valore predittivo di un test nella attivit professionale di campo.
291

Questo problema pu essere risolto per mezzo dell'inferenza bayesiana, basata sul Teorema di
Bayes, uno studioso del XVIII secolo. L'inferenza bayesiana una branca della statistica
inferenziale, in cui le probabilit non sono intese come frequenze o proporzioni, bens come livelli
di fiducia nel verificarsi di un dato evento. La base teorica del Teorema complessa, e coinvolge
argomenti di probabilit e statistica che travalicano le competenze di un medico veterinario.
Tuttavia, puoi vedere il Teorema pu come una utile scatola nera che consente di acquisire
conoscenze non raggiungibili in altro modo.

Nel caso che ci interessa, l'utilizzo del Teorema di Bayes abbastanza semplice: basta applicare la
formula appropriata, ossia quella che consente di ottenere, conoscendo Se e Sp del test, la
prevalenza reale a partire dalla prevalenza apparente. Una volta nota la prevalenza reale, sar facile
risalire al valore predittivo positivo e negativo.

Per una spiegazione pi dettagliata puoi fare riferimento ad una presentazione animata con un
esempio pratico.

Stima di un valore predittivo

Come gi detto a proposito della sensibilit e della specificit, anche per i valori predittivi si
possono calcolare gli intervalli di confidenza, che rappresentano un buon indice della precisione dei
valori ottenuti
Per il calcolo degli intervalli di confidenza 95% di un dato valore predittivo positivo, si utilizza la
formula seguente, in cui n corrisponde al totale degli animali risultati test-positivi:

Ovviamente la suddetta formula pu, con le opportune variazioni, essere utilizzata anche per il
calcolo dell'intervallo di confidenza del valore predittivo negativo: basta sostituire VPP con VPN e
n con il totale degli animali test-negativi.

ESEMPIO. Supponiamo che tu abbia effettuato uno screening


applicando un test ad un campione composto da 95 animali, ottenendo i
risultati riassunti nella Tabella a lato.
[Nota che questa una simulazione a scopo didattico in cui ti fornisco
dati supplementari rispetto a quelli che ottieni in campo: infatti in realt,
nella pratica, dopo lo screening, non otterrai i 4 valori della tabella, ma
soltanto i seguenti due dati: test-positivi n=42; test-negativi n=53].
I calcoli sono come segue:

Se vuoi ottenere l'IC99% (anzich 95%), basta sostituire il coefficiente 1.96 con 2.54.
L'interpretazione ed il significato dell'intervallo di confidenza sono gi stati spiegati in una unit
precedente.
292

Da cosa dipendono i valori predittivi?

Il valore predittivo positivo dipende, come lecito attendersi, dalla Se e dalla Sp del test; in
particolare, esso aumenta con l'aumentare di questi due parametri.
per importante sottolineare un altro aspetto pi sorprendente, e particolarmente importante nella
pratica: il valore predittivo positivo dipende anche da un fattore indipendente dal test: la prevalenza
della malattia nella popolazione sottoposta a screening. Questo aspetto come viene illustrato
attraverso un apposito esempio nella prossima unit.

Valore predittivo in epidemiologia clinica


gi stato accennato al fatto che, nella scelta di un test diagnostico, il clinico dovrebbe
considerare le caratteristiche di Se e Sp. Tuttavia, una volta che il test stato effettuato ed ha fornito
un risultato (non importa se positivo o negativo), la Se e la Sp perdono importanza.
Infatti, Se e Sp si riferiscono a individui il cui stato di salute/malattia noto. Ma se si conoscesse lo
stato del paziente, non sarebbe necessario effettuare alcun test! Ecco quindi che, nell'attivit del
clinico, l'obiettivo il seguente: determinare lo stato del paziente, dato il risultato di un test. In
questa ottica, sono importanti i valori predittivi (negativo e positivo).
293

11. Test di
screening e diagnostici
11.7 Relazione tra valori predittivi e prevalenza

OBIETTIVO:

valutare la relazione esistente fra i valori predittivi di un test di screening e la prevalenza della
malattia

Fra il valore predittivo (VPP) e negativo (VPN) di un test e la prevalenza della malattia nella
popolazione che viene sottoposta a screening esiste una relazione molto importante. La
comprensione di questa relazione facilitata ricorrendo ad un esempio-simulazione.

Supponi di effettuare uno screening nei confronti della brucellosi bovina in 3 diverse aree
geografiche (Area1, Area2, Area3), usando un test con sensibilit e specificit note. In ciascuna
area sono presenti 30000 animali da sottoporre a screening. Ancora una volta, come gi fatto nelle
Unit precedenti, supponiamo di avere... poteri soprannaturali, e di conoscere la prevalenza reale in
ciascuna area:

AreaA: prevalenza = 0.1(10%);


AreaB: prevalenza = 0.01 (1%);
AreaC: prevalenza = 0.001 (0.1%).

Lo screening viene effettuato con test di Agglutinazione rapida al Rosa bengala(Rose Bengale
Test, con Se=0.620 e Sp=0.995 [Gall D. & Nielsen K., Rev. sci. tech. Off. int Epiz., 2004, 23 (3), 989-1002].

Le 3 Tabelle sottostanti riassumono i risultati ottenuti nello scenario ora descritto.


294

Il valore predittivo positivo

Come vedi, il valore predittivo positivo (VPP) diminuisce con il diminuire della prevalenza della
malattia. Questo accade perch la diminuzione della prevalenza comporta l'incremento degli
animali sani; ci, a sua volta, fa s che aumenti il numero di esiti positivi falsi.

Commentiamo brevemente i risultati che hai ottenuto.

Nella Area1, con prevalenza elevata, il VPP di 0.932, ci significa che su 100 bovini positivi al
test, 93 sono ammalati, mentre 7 sono positivi falsi. Considera che la profilassi della brucellosi
avviene per eradicazione, ed i bovini che risultano infetti devono essere abbattuti; se ci si basasse
soltanto sull'esito di questo test di screening, nello scenario in questione si pagherebbe una sorta di
tassa a fondo perduto del 7%, rappresentata dai bovini sani da abbattere erroneamente in quanto
considerati infetti. L'entit (7%) di questo effetto collaterale sembra accettabile, considerando anche
il beneficio rappresentato dal fatto che, dopo l'abbattimento, la prevalenza registra un notevole calo
(da 0.1 a 0.039).

Consideriamo l'Area2 e l'Area3, nelle quali il VPP rispettivamente 0.556 e 0.110. Ci comporta
che il 44.4% e l'89.0% degli abbattimenti sarebbe ingiustificato, riguardando animali sani ma test-
positivi. Questa situazione risulterebbe inaccettabile nella pratica per una serie di motivi, che
possono essere riassunti in uno solo fonfamentale: un eccessivo rapporto costi / benefici (ossia il
rapporto fra il costo delle azioni di profilassi ed i benefici indotti da tali azioni). Pertanto, in questi
295

casi dovranno essere adottate misure correttive per migliorare il VPP. Ad esempio, si potranno
utilizzare due test invece di uno solo.

Il grafico sottostante illustra l'andamento del valore predittivo positivo in rapporto alla prevalenza,
per tre test di esempio a diversa sensibilit e specificit. evidente che, quando la prevalenza della
malattia nella popolazione elevata, la performance di tutti i test buona. Invece, per valori di
prevalenza molto bassi il valore predittivo di tutti i test si avvicina a zero; in queste condizioni,
qualsiasi test diagnostico diventa virtualmente inutile a scopo diagnostico. Puoi notare,
confrontando l'andamento delle 3 curve, che l'effetto della prevalenza sul valore predittivo
proporzionale al decrescere della sensibilit e specificit del test.

Il fatto che il valore predittivo positivo dipenda dalla prevalenza sconsiglia l'effettuazione di azioni
di screening per malattie rare. Infatti, uno screening per una malattia rara presenta i seguenti
inconvenienti: (1) pochi individui ne trarranno beneficio (proprio in quanto malattia rara); (2) molti
individui (i falsi-positivi) ne trarranno un danno, in quanto verranno ingiustamente considerati
ammalati.

Il valore predittivo negativo

Analogamente al VPP, anche il VPN dipende dalla prevalenza della malattia nella popolazione. La
relazione va in senso opposto rispetto a quanto hai visto per il VPP. Infatti, il VPN aumenta con il
diminuire della prevalenza, come schematizzato nel grafico sottostante.
296

VPN: il rischio di importare un animale ammalato

Quando si acquista un animale (o un prodotto di origine animale), buona norma accertarsi che
esso non sia affetto da malattie trasmissibili o contaminazioni che, in tal modo, potrebbero essere
introdotte in un allevamento indenne (ossia nel quale l'agente della malattia non presente). Di
solito prima dell'acquisto l'animale viene sottoposto ad un test. Tuttavia, hai imparato che i test non
sono infallibili. Perci sorge legittima la domanda dell'allevatore:

"se l'animale da acquistare test-negativo, che probabilit ci sono che esso sia ammalato?"

Si pu rispondere semplicemente che la probabilit pari a (1-VPN). Infatti, ti ricordo che la


probabilit si esprime con un numero compreso fra 0 (l'evento non si verifica mai) e 1 (l'evento si
verifica sempre). Come ben ricordi, il VPN rappresenta la probabilit dell'evento "l' animale test-
negativo sano" di conseguenza (1-VPN) rappresenta la probabilit dell'evento alternativo, ossia
"l'animale test-negativo ammalato".
Il punto importante che, come hai appena visto, il VPN (ed anche il VPP) sono correlati alla
sensibilit ed alla specificit del test, ma dipendono anche dalla prevalenza della malattia nella
popolazione. Per questo motivo, anche conoscendo la sensibilit e la specificit del test, non
possibile rispondere direttamente alla domanda dell'allevatore, a meno di non conoscere (o stimare)
la prevalenza. In tal caso, si pu applicare il teorema di Bayes, usando la seguente formula:

ESEMPIO. Un bovino appartenente ad un gruppo in cui si stima che la prevalenza della brucellosi
sia pari a 0.20 viene sottoposto con esito negativo al test di agglutinazione rapida al Rosa bengala
297

(Se=0.620 e Sp=0.995). Ci si domanda qual : la probabilit quell'animale sia ammalato.


Applichando la formula soprastante ottieni:
1.VPN=((0.2*0.380) / [(0.2*.380)+ (0.8*0.995)] = 0.0872 (8.72%).

Foglio di calcolo per Microsoft Excel che simula l'applicazione di un test in una popolazione e
calcola Se, Sp, VPP e VPN.

Foglio di calcolo per Microsoft Excel per calcolare, conoscendo P, Se e Sp, la probabilit che un
animale test-negativo sia ammalato.

Foglio di calcolo per Microsoft Excel per visualizzare l'andamento di VPP e VPN in rapporto a P,
Se e Sp.
298

11. Test di
screening e diagnostici
11.8 Metodi per migliorare il valore predittivo di un test di screening

OBIETTIVO:

individuare i metodi per migliorare il valore predittivo positivo (VPP) di un test da utilizzare per
lo screening di popolazioni

Abbiamo visto nell'Unit precedente che il valore predittivo positivo (VPP) un elemento di
fondamentale importanza per la riuscita delle operazioni di screening. Abbiamo visto anche che il
VPP correlato alla prevalenza: esso decresce al diminuire della prevalenza, potendo raggiungere
livelli inaccettabilmente bassi e tali da compromettere l'efficienza dell'azione di screening.

Come migliorare il VPP?

Il primo metodo per ottenere un accettabile VPP quello di operare su popolazioni ad alto rischio,
nelle quali la prevalenza si presume assuma valori elevati. Se questa opzione non praticabile,
allora si pu cercare di individuare, nella popolazione, sottogruppi ad alto rischio sui quali
concentrare il programma di screening.

Fra gli interventi di diagnosi precoce dei tumori dell'uomo previsti dal Sistema Sanitario Nazionale,
si annovera la mammografia. Il test viene effettuato allo scopo di individuare tempestivamente i
tumori della mammella e prevede l'esame biennale delle donne di et compresa fra 50 e 69 anni.
Questa fascia di et pi a rischio rispetto alle altre ed in essa l'incidenza maggiore. Perci il
valore predittivo del test pi elevato rispetto a quanto si avrebbe esaminando indiscriminatamente
tutte le donne.

Il secondo metodo per migliorare il VPP quello di utilizzare due (o, raramente, pi di due) test.
Operativamente, ci pu avvenire con due diverse modalit (che verranno prese in considerazione
nelle prossime Unit):

(1) in serie, cio prima un test e poi, su quelli risultati positivi, l'altro;

(2) in parallelo su tutti gli animali.

L'interpretazione dei risultati di test in serie ovvia: si considerano ammalati gli animali risultati
positivi al primo ed al secondo test.
Pi complicata l'interpretazione dei test in parallelo, per i quali si pu adottare la strategia di
interpretazione con modalit OR oppure con modalit AND. Questo argomento viene affrontato in
una successiva unit.

Riassumendo:
299
300

11. Test di
screening e diagnostici
11.9 Test multipli: utilizzo di 2 test in serie

OBIETTIVO:

verificare, per mezzo di un esempio, il miglioramento del valore predittivo ottenibile utilizzando
due test in serie

Per capire meglio il funzionamento di questa strategia di screening, ci serviremo di un esempio in


cui i due test in serie vengono utilizzati su una popolazione di 8000 animali. Allo scopo di rendere
l'esempio comprensibile, dobbiamo assumere di possedere... poteri soprannaturali che ci fanno
conoscere lo stato reale (malato/sano) di ciascuno di questi 8000 animali. In particolare, sappiamo
che 111 di essi sono ammalati e 7889 sono sani.

I due test che hai a disposizione hanno le seguenti caratteristiche:

TEST1: Se=0.937, Sp 0.987


TEST2: Se=0.981, Sp=0.990; questo test pi costoso e pi sensibile del TEST1

Sottoponi al TEST1 tutti gli 8000 soggetti della popolazione, e poi applichi il TEST2solo su quelli
risultati positivi al TEST1.

Otterrai questi risultati:

Se vuoi, puoi fare il seguente breve "ripasso" verificando che i risultati tabulati soddisfano i dati
forniti:
301

TEST1: Se = 104/111 = 0.937; Sp=7789/7889 = 0.987;


TEST2: Se = 102/104 = 0.981; Sp = 99/100 = 0.990

Come vedi, alla fine del procedimento di applicazione in serie del TEST1 e del TEST2, gli 8000
animali sono stati classificati come segue:
- 103 positivi (di cui 102 positivi veri e 1 positivo falso)
- 7897 negativi (7796 negativi al TEST1 + 101 negativi al TEST2). Fra questi 7987 negativi, 7888
sono negativi veri e 7+2 negativi falsi.

Ora puoi calcolare Se, Sp e VPP complessive, ossia quelle ottenute utilizzando i due test in serie:

Nella Tabella che segue sono evidenziati in colore gli animali classificati incorrettamente (mis-
classificati). Puoi vedere che:
- al TEST1 hai classificato come sani 7 animali che in realt sono malati; questi 7 animali non
verranno pi testati;
- al TEST1 hai classificato come malati 100 animali in realt sani, che per verranno poi saggiati
con il TEST2;
- al TEST2 hai classificato come malato 1 animale che in realt sano;
- al TEST1 hai classificato come sani 2 animali che in realt sono malati.
302

Rispetto agli esiti del TEST1, al TEST2 sono stati dichiarati sani 2 animali che in realt sono
malati. Questo effetto negativo derivante dall'applicazione del TEST2 largamente compensato dal
fatto che con il secondo test si sono quasi annullati i positivi falsi, che passano da 100 a 1.

Proviamo a fare qualche conto sui benefici della strategia Due test in serie utilizzando i dati dello
scenario che hai appena visto, ed ipotizzando che un esame di laboratorio con il TEST1 costi 1 e
con TEST2 costi 10:
(a) se utilizzi soltanto TEST1, spendi 8000 ed ottieni 107 mis-classificazioni: 100 positivi falsi e 7
negativi falsi);
(b) se utilizzi soltanto TEST2, spendi 80000 ed ottieni 81 mis-classificazioni: 79 positivi falsi e 2
negativi falsi (dati non mostrati nelle tabelle);
(c) se utilizzi i due test in serie, spendi 10040 ed ottieni 10 mis-classificazioni: 1 positivo falso e 9
negativi falsi.

Ricordati che ti puoi attendere risultati simili a quelli dell'esempio soltanto se i due test sono
biologicamente indipendenti l'uno dall'altro. Per biologicamente indipendenti si intende che i
test sono basati su meccanismi diversi o, meglio, che misurano grandezze diverse (es. differenti
classi di anticorpi).

L'utilizzo di due test in serie previsto, ad esempio, nell'ambito del piano di profilassi di Stato della
brucellosi bovina, con l'impiego di due test sierologici: il test al rosa-bengala in prima istanza e
quindi, sui positivi, la fissazione del complemento. Questi due test possono essere ritenuti
biologicamente indipendenti, in quanto misurano classi diverse di anticorpi, e quindi il loro
impiego in serie risulta efficace.

Se i due test sono biologicamente dipendenti, allora si otterranno probabilmente risultati meno
brillanti di quelli dell'esempio. Infatti, in test biologicamente simili i risultati tendono ad essere
correlati, nel senso che aumenta la probabilit che essi forniscano lo stesso risultato quando
applicati allo stesso animale.
303

Attenzione a non commettere l'errore di confrontare il valore predittivo positivo del primo test con
quello del secondo. Infatti nel nostro esempio:

VPP TEST1 = 104/204 = 0.509


VPP TEST2 = 102/103 = 0.990

Apparentemente il TEST2 di gran lunga superiore rispetto al TEST1; tuttavia, il confronto


viziato. Infatti occorre ricordare che il VPP dipende (oltre che dalla specificit e sensibilit
intrinseche del test), anche dalla prevalenza; in questo caso il TEST2 stato applicato su un
gruppo di animali gi positivi al TEST1 test e nei quali, perci, la prevalenza era molto elevata,
come risulta dal seguente calcolo.

Popolazione sottoposta al TEST1:


- Prevalenza reale = 111/8000 = 0.013
- Prevalenza apparente (in base ai risultati del test) = 204/8000 = 0.025

Popolazione sottoposta al TEST2:


- Prevalenza reale = 104/204 = 0.509
- Prevalenza apparente (in base ai risultati del test) = 103/204 = 0.505

La scelta dell'ordine di serie dei due test (prima TEST1 poi TEST2, oppure viceversa prima TEST2
poi TEST1) viene effettuata tenendo conto soprattutto dei costi e della praticit di esecuzione dei
test. Infatti, evidentemente preferibile che il primo test (quello applicato su un numero maggiore
di individui) sia il meno costoso e/o quello di pi facile esecuzione oppure meno invasivo per il
paziente.
304

11. Test di
screening e diagnostici
11.10 Test multipli: utilizzo di 2 test in parallelo

OBIETTIVO:

verificare i vantaggi derivanti dall'impiego di 2 test eseguiti in parallelo

Oltre all'utilizzo di test multipli in serie, gi visto in precedenza, un altra modalit di impiego di
test multipli quella di applicare 2 (o pi) test contemporaneamente agli animali della
popolazione da saggiare.
La sensibilit e la specificit della combinazione di test dipendono dalla modalit di interpretazione
dei risultati. Infatti, potranno ottenere le seguenti combinazioni di risultati:

TEST1 positivo e TEST2 negativo (T1+/T2-)


TEST1 negativo e TEST2 positivo (T1-/T2+)
TEST1 positivo e TEST2 positivo (T1+/T2+)
TEST1 negativo e TEST2 negativo (T1-/T2-)

Applicando due test contemporaneamente sorge un problema di interpretazione dei risultati. Infatti,
pacifico che gli animali T1+/T2+ siano considerati ammalati. Analogamente, pacifico che gli
animali T1-/T2- siano considerati sani. Ma come interpretare gli animali T1+/T2- e quelli T1-/T2+?
Vi sono due possibilit: l'interpretazione OR e l'interpretazione AND.

L'interpretazione in modalit OR considera infetto (o ammalato) un animale che risultato


positivo ad un test o all'altro o ad ambedue. Vengono quindi classificati come ammalati i seguenti
animali: T+/T+, T+/T-, T-/T+.
Questa interpretazione aumenta la sensibilit ma diminuisce la specificit. Ci intuitivo, in quanto
si fornisce a ciascun animale una maggiore opportunit (=probabilit) di reagire positivamente.
305

Nota che, ai fini della sensibilit e della specificit globali, l'utilizzo di due test in parallelo
modalit AND sovrapponibile all'utilizzo degli stessi due test in serie (v. unit precedente).
Per, nella pratica, fra le due strategie (serie/parallelo) vi una differenza importante: nel caso dei
test in serie il numero complessivo di test da effettuare inferiore rispetto a quanto ai test in
parallelo. Infatti, nel caso della strategia in serie si effettua il primo test su tutti gli animali, ed il
secondo test solo su quelli risultati positivi. Invece, con la strategia in parallelo si saggiano tutti
gli animali sia con il primo che con il secondo test. Per questo motivo la strategia test in parallelo
modalit AND normalmente non viene utilizzata.

L'interpretazione in modalit AND considera infetto (o ammalato) un animale che risultato


positivo ad entrambi i test. Vengono quindi classificati come ammalati i seguenti animali: T+/T+.
Questa modalit consente di ottenere una maggiore specificit; ci facilmente intuibile se si pensa
che, per ciascun animale saggiato, la probabilit di risultare positivo a entrambi i test inferiore
rispetto a quanto avviene interpretando i risultati con modalit OR.
306

11. Test di
screening e diagnostici
11.11 Test in parallelo: interpretazione con modalit OR o AND

OBIETTIVO:

apprendere, per mezzo di un esempio, gli effetti su sensibilit e specificit quanto due test
applicati in parallelo vengono interpretati con modalit OR o AND

individuare le situazioni pratiche in cui preferibile l'una o l'altra interpretazione

Proseguiamo l'Unit precedente ed esaminiamo una simulazione-esempio di applicazione di due test


in parallelo.

In questa simulazione, esamini una popolazione di 6000 bovini, applicando su ciascuno di essi due
test (TEST1 e TEST2). Per rendere efficace l'esempio, supponiamo che tu conoscsa gi lo stato
reale di ciascuno dei 6000 animali (cosa che non avviene mai nella pratica!). In particolare, sai che
300 di essi sono ammalati, ed i restanti 5700 sono sani.

Una volta effettuati i test, ordini i dati ottenuti in un database in un foglio di calcolo, di cui viene
riportato qui sotto u estratto (se lo desideri, disponibile anche il foglio di calcolo completo). Come
vedi, nel database ogni riga rappresenta un animale, mentre ogni colonna contiene una variabile.
Nota che i dati sono stati codificati secondo un metodo di uso comune, ossia utilizzando il codice
0 (che significa 0 oppure negativo, o pi in generale assenza del fenomeno) oppure
viceversa il codice 1.

Ti ricordo che, come gi visto nell'unit precedente, l'interpretazione OR considera ammalato


l'animale risultato positivo ad un test, o all'altro o ad ambedue. L'interpretazione AND considera
ammalato l'animale risultato positivo ad entrambi i test.
307

Ora, sempre utilizzando i dati del database, puoi allestire le tabelle di contingenza separatamente
per ciascuno dei due test, e calcolarne la sensibilit e la specificit, come segue:
308

A questo punto puoi tabulare, sempre a partire dal database, i risultati combinati dei due test in
parallelo, come nella Tabella sottostante. Per chiarire la lettura della Tabella, aggiungo che:
- il valore 80 indica che 80 animali ammalati sono risultati +/-, ossia positivi al TEST1 e negativi
al TEST2;
- il valore 200 indica che 200 animali sani sono risultati +/-, ossia positivi al TEST1 e negativi al
TEST2;
- il valore 40 indica che 40 animali ammalati sono risultati -/+, ossia negativi al TEST1 e positivi
al TEST2;
... e cos via.

Infine, puoi calcolare la sensibilit e la specificit dei due test in parallelo, sia con intepretazione in
modalit AND che in modalit OR. Il calcolo illustrato graficamente, con l'aiuto dei colori,
nella Tabella che segue.
309

In sintesi:

Infine, per riassumere il tutto, nella figura seguente vengono schematizzate le differenze fra
l'interpretazione OR e quella AND.
310

Si pu vedere come, nel caso dell'interpretazione OR meno probabile - rispetto all'utilizzo di


un singolo test - che un animale infetto sfugga alla diagnosi; tuttavia, si avr un incremento dei
falsi-positivi, ossia dei soggetti sani che vengono classificati come ammalati. Si ottiene un
innalzamento della sensibilit, a scapito della specificit.

Nel caso dell'interpretazione AND, pi facile che sfuggano alla diagnosi animali infetti, per
diminuisce la probabilit che un animale sano sia classificato come ammalato. La specificit
aumenta, a scapito della sensibilit.
311

11. Test di
screening e diagnostici
11.12 Validit di un test e concordanza fra test

OBIETTIVO:

apprendere un semplice criterio di valutazione della concordanza fra due test (o della efficienza
di un test)

Validit di un test

Abbiamo visto, nelle Unit precedenti, che dopo aver applicato un test su una popolazione
assumono importanza due indici: il valore predittivo positivo ed il valore predittivo negativo, che
misurano quanto i risultati ottenuti si avvicinano alla realt. Ci, per, pu essere riassunto in un
solo indice, detto validit (o efficienza, o accuratezza).

La validit di un test la sua capacit di classificare correttamente sia gli animali malati che quelli
sani. La validit tanto pi alta quanto pi il test classifica come positivi gli animali realmente
malati e come negativi quelli realmente sani. In altri termini, la validit la capacit di generare
risultati rispondenti al vero sia negli individui ammalati che in quelli sani.

La validit pu essere calcolata facilmente qualora si conosca il vero stato degli individui che sono
stati sottoposti al test. In tal caso, utilizzando la ben nota Tabella di contingenza, la validit si
esprime con la proporzione: (a+d)/(a+b+c+d).

ESEMPIO. Abbiamo sottoposto 300 bovini al test della tubercolina per la diagnosi di tubercolosi;
successivamente, i bovini sono stati macellati, e su di essi stata effettuato un minuzioso esame
anatomo-patologico di visceri e linfonodi per evidenziare le lesioni tipiche della tubercolosi. Hai
312

ottenuto i risultati riportati nella tabella.


L'esame anatomo-patologico rappresenta il golden
standard; infatti, puoi essere ragionevolmente certo
che un animale privo di lesioni specifiche sia esente
dall'infezione, e viceversa. La prova della tubercolina
ha identificato correttamente 25 animali infetti e 253
animali sani (v. Tabella a lato). La validit della
prova della tubercolina : (25+253) / 300 = 0.928. Ci significa che il test della tubercolina, nelle
tue condizioni, ha identificato correttamente lo stato di un animale (non importa se malato o sano)
nel 92.8% dei casi.

Concordanza fra due test

Quando si tratta di valutare la performance di un test, talvolta pu essere necessario confrontarlo


non con la realt o con l'esito di golden test, bens con un altro test, magari non eccellente ma di
comune impiego nella pratica. In questo caso, non si parla pi di validit, ma di concordanza.

La concordanza pu riguardare non solo il grado di accordo che si osserva fra due test, ma anche
quello fra due (o pi) operatori che interpretano l'esito di uno stesso test (es. radiografie,
elettrocardiogramma, auscultazione cardiaca ecc.), oppure fra due letture effettuate da uno stesso
operatore in tempi diversi. Non si vuole stabilire quale classificazione sia pi corretta, bens
stabilire se i criteri utilizzati per l'interpretazione del test siano efficienti, e se classificazione sia
riproducibile.

Il calcolo della concordanza analogo a quello della validit. Supponendo quindi di confrontare due
test (TestA e TestB), si ha quanto segue:

ESEMPIO. Hai saggiato 134 sieri suini con due test (TestA e TestB) allo scopo di verificare la
presenza di paratubercolosi nel bovino, ottenendo i seguenti risultati: 18 positivi a entrambi i test;
102 negativi ad entrambi i test; 8 positivi a TestA e negativi a TestB; 6 negativi a TestA e positivi a
TestB. La concordanza fra i due test : (18+102)/(18+102+8+6) = 0.896.
313

L'indice Kappa di Cohen

La concordanza calcolata come sopra descritto criticabile in quanto non tiene conto della quota di
concordanza dovuta al caso.

Esempio. Due studenti decidono di valutare, ognuno


per proprio conto, una serie di 100 radiografie
dell'addome di altrettanti cani con sospetto di
calcolosi epato-biliare. Gli studenti sono e
classificano le immagini radiologiche attraverso... il
lancio di una moneta. Verosimilmente, essi
otterranno risultati simili a quelli della Tabella a lato,
raggiungendo una concordanza del 50% in base al calcolo seguente: (25+25)/100=0.5.

Come vedi, una classificazione puramente casuale, come quella ottenuta attraverso il lancio di una
moneta, restituisce valori di concordanza prossimi a 50%, che sono ovviamente ingannevoli. Per
calcolare la quota di concordanza vera occorre stabilire quanta parte della concordanza totale
osservata dovuta al caso, e quanta invece dovuta al reale accordo tra gli osservatori o i test
utilizzati. Ci si ottiene attraverso un metodo statistico che, a partire dai dati della tabella di
contingenza, consente di calcolare il Kappa di Cohen.

L'interpretazione dei valori Kappa si esegue secondo le seguenti linee-guida: k<0.2= concordanza
scarsa; k compreso fra 0.2 e 0.4 = concordanza modesta; fra 0.41 e 0.61 = moderata; fra 0.61 e 0.80
= buona; >0.80 = eccellente.

Per maggiori informazioni sul Kappa di Cohen e per le modalit di calcolo, ti consiglio di
consultare il Libro oppure questa presentazione animata.

Foglio di calcolo per Microsoft Excel che calcola il Kappa di Cohen a partire da una tabella di
contingenza 2x2.
314

12. Trasmissione
e mantenimento delle infezioni
12.1 Malattie trasmissibili

OBIETTIVO:

definire il concetto di "malattia trasmissibile" e mostrare come esistano malattie trasmissibili non
contagiose

Per "malattia trasmissibile" si intende una malattia il cui agente causale pu essere trasferito da
un individuo ad un altro.

Le malattie trasmissibili possono essere suddivise in infettive o non infettive. Ciascuna di queste due
categorie comprende malattie contagiose o non contagiose:

Alcune malattie trasmissibili infettive non contagiose richiedono l'intervento di un vettore (questo
punto di vista non condiviso da tutti). Il vettore serve a propagare l'agente da un individuo
all'altro.

ESEMPIO. La anemia infettiva del cavallo una malattia che si trasmette agli animali recettivi
quasi esclusivamente attraverso l'intervento di insetti ematofagi (tafani, zanzare ecc.) che si
comportano esclusivamente come vettori meccanici. Altre vie di trasmissione, non naturali e
molto meno comuni, sono rappresentate da aghi di siringhe o altri strumenti contaminati da
sangue proveniente da un animale infetto.
315

Esistono per anche malattie trasmissibili infettive non contagiose che non necessitano
dell'intervento di un vettore, quali quelle sostenute da clostridi (es. tetano, botulismo, carbonchio
ecc.).

ESEMPIO. Il tetano si contrae attraverso contaminazione di ferite o soluzioni di continuo di cute o


mucose da parte di terriccio o altro materiale contenente le spore. Le spore tetaniche sono molto
diffuse in natura e si riscontrano con frequenza nel terreno, nei foraggi, nel letame ecc. L'animale
ammalato di tetano non contagiante, nel senso che la trasmissione ad un animale sano non si
verifica.

Le malattie trasmissibili non infettive e contagiose sono tipicamente quelle sostenute da parassiti.

Infine, da ricordare che le malattie trasmissibili non infettive e non contagiose comprendono
alcune malattie genetiche (tipiche, nell'uomo, il daltonismo e l'emofilia) che si trasmettono per via
verticale.

Le malattie trasmissibili ed il concetto di " ZOONOSI"


Da tempo immemorabile noto che esistono malattie che possono trasmettersi dagli animali
all'uomo; queste malattie vengono dette "zoonosi". Nel 1959 l'Organizzazione Mondiale della
Sanit ha adottato la seguente definizione:
"zoonosi = malattie e infezioni naturalmente trasmesse tra animali vertebrati e l'uomo"
In questo contesto sono state considerate da alcuni soltanto le malattie trasmissibili, mentre altri vi
hanno incluso anche le morsicature di serpente e le allergie dell'uomo causate da animali. stata
anche sottolineata l'opportunit di includere infezioni opportunistiche 'non-naturali', come ad
esempio quelle che possono verificarsi in pazienti immunodepressi.
L'interesse per le zoonosi ha portato ad un ampliamento delle conoscenze ed ha spinto ad
approfondire anche alcuni aspetti socio-economici. In questa ottica, Mantovani ha recentemente
proposto un allargamento della definizione di zoonosi:
"zoonosi = danno alla salute e/o qualit della vita umana causato da relazione con (altri) animali
vertebrati, o invertebrati commestibili o tossici"
Se si accetta questa definizione allargata, in aggiunta alle classiche malattie trasmissibili, vengono
considerate zoonosi anche: le malattie allergiche da contatto con animali o da ingestione di alimenti
di origine animale; le malattie da sostanze chimiche (es. antibiotici) presenti negli alimenti di
origine animale; i traumi (calci, morsicature ecc.); le malattie derivanti da morsi di serpente o da
punture di artropodi; le malattie da inquinamento animale (sporcizia, rumore, sovraffollamento) e
da sostanze chimiche usate per gli animali.

Per notizie pi esaurienti: A. Mantovani. Appunti sullo sviluppo del concetto di zoonosi. Atti III Convegno
Nazionale di Storia della Medicina Veterinaria. Lastra a Signa (FI), 23-24 settembre 2000, pag. 119-129.
316

12. Trasmissione
e mantenimento delle infezioni
12.2 Ciclo di una malattia trasmissibile

OBIETTIVO

individuare, su base temporale, i diversi stadi di una malattia trasmissibile

Il ciclo di una malattia comprende collettivamente i diversi stadi che si succedono nel corso di un
evento morboso. La conoscenza del ciclo della malattia importante, sia nel singolo animale
(medicina clinica)che in popolazioni (epidemiologia), per la messa a punto di strategie di terapia
e di profilassi.

Il ciclo-tipo di una malattia pu essere suddiviso in diverse fasi, alcune delle quali possono
sovrapporsi. La figura soprastante rappresenta soltanto una schematizzazione estremamente
semplificata degli eventi che si verificano in un animale ammalato in funzione del tempo.

esposizione: l'evento iniziale che, nel caso delle malattie infettive, d origine alla infezione;
periodo di incubazione: il tempo che intercorre tra l'esposizione e la comparsa di sintomi clinici.
Per le malattie non trasmissibili esso detto periodo di latenza. Questo periodo varia ampiamente
variabile in rapporto al tipo di agente, all'ospite ed a numerosi altri fattori;
periodo prodromico: il periodo di transizione tra lo stato di salute e quello di malattia,
caratterizzato dai primi sintomi (spesso non specifici della malattia);
malattia clinica (o subclinica): in questo periodo i sintomi della malattia raggiungono la loro
massima evidenza. Se i sintomi sono molto marcati, la malattia in "forma acuta"; se sono di
minore intensit, allora la malattia in "forma subacuta". Non sempre i sintomi sono presenti; nel
caso in cui manchino, si parla di "malattia subclinica" o asintomatica.
Se la malattia grave, pu verificarsi la morte dell'animale ammalato
regressione: il periodo in cui i sintomi si fanno meno intensi; spesso la regressione dovuta alla
reazione dell'ospite (es. produzione di anticorpi). Tuttavia, possibile che l'ospite non riesca a
317

guarire completamente, e quindi la malattia entra in una lunga fase detta di cronicizzazione, cio
acquisisce i caratteri della malattia cronica;
convalescenza e guarigione: in questa fase si ha il ristabilimento completo delle funzioni
dell'organismo, che ritorna in stato di salute. Notare che alcune malattie provocano lesioni
permanenti e quindi inibiscono una guarigione perfetta;
stato di portatore: ovviamente pu realizzarsi soltanto nel caso delle malattie infettive: in questa
fase, che in molti casi NON si verifica, l'animale alberga l'agente (ed capace di trasmetterlo ad
animali recettivi), senza manifestare alcun segno di malattia. L'animale portatore in stato di
infezione subclinica o di infezione latente.

Per le malattie infettive, il periodo di trasmissibilit o di contagiosit (cio il lasso di tempo durante
il quale l'animale pu trasmettere l'infezione ad altri animali) dipende da molti fattori (tipo di
malattia, tipo di ospite, ecc.). Come regola generale, questo periodo (evidenziato in arancio nello
schema) inizia poco dopo l'infezione, persiste negli animali portatori ma si esaurisce dopo la
guarigione.
318

12. Trasmissione
e mantenimento delle infezioni
12.3 Infezione latente e stato di portatore

OBIETTIVO

apprendere il significato dei termini infezione latente e portatore

Per infezione latente (o, impropriamente, malattia latente) si intende una situazione in cui un agente
patogeno presente allo stato quiescente in un ospite. L'infezione o la malattia rimangono
inapparenti per un periodo di tempo molto superiore rispetto al periodo di incubazione "normale"
per quella malattia.

Durante il periodo di infezione latente, la presenza dell'agente nell'ospite non pu essere dimostrata
con mezzi convenzionali. L'infezione latente ha durata indefinita, ma pu essere riattivata (e
quindi passare allo stato di malattia) per effetto di fattori diversi o eventi stressanti.

ESEMPIO. Talvolta i suini adulti, dopo infezione da parte del virus della pseudorabbia (Suid
Herpesvirus 1, SHV1), detta anche Malattia di Aujeszky, rimangono clinicamente sani e non
presentano mai segni clinici, oppure li presentano a distanza di mesi; tuttavia, normalmente, la
malattia si manifesta dopo un periodo di incubazione di pochi giorni.

L'animale con infezione latente detto portatore.


In senso lato, si possono riconoscere diversi tipi di portatore, in rapporto all'evento malattia:

portatore sano l'animale in cui la malattia destinata a non svilupparsi mai;


portatore in incubazione l'animale che si trova nel periodo di tempo compreso fra infezione e
comparsa della sintomatologia;
portatore latente l'animale con infezione latente, nel quale la malattia non si sviluppa oppure si
sviluppa in tempi molto pi lunghi rispetto al periodo di incubazione normale per quella malattia;
portatore convalescente l'animale che ha superato la malattia e che continua ad albergare
l'agente per un tempo variabile in rapporto al tipo di agente ed all'ospite.
319
320

12. Trasmissione
e mantenimento delle infezioni
12.4 Trasmissione orizzontale e verticale

OBIETTIVO:

definire le modalit di trasmissione orizzontale e verticale ed evidenziarne le rispettive


caratteristiche.

Le malattie diffusibili (infettive o parassitarie) conseguono alla penetrazione (o, pi raramente, alla
colonizzazione superficiale) nell'organismo da parte di agenti patogeni (virus, batteri, miceti,
protozoi, elminti ecc.).

Molto spesso l'agente patogeno non in grado di replicare al di fuori dell'ospite; questo sempre
vero per i virus, i quali sono parassiti endocellulari obbligati e quindi necessitano assolutamente, per
la loro vita, di esseri viventi. Tutt'al pi l'agente pu sopravvivere (cio resistere, ossia
rimanere vitale, ma senza moltiplicarsi) al di fuori dell'ospite per un tempo pi o meno lungo.

allora evidente che la sopravvivenza continuativa di un agente, sia essa associata o meno
all'induzione di malattia nell'ospite, pu avvenire soltanto se avviene la trasmissione a nuovi ospiti
sensibili, nei quali l'agente replica. Oltre a replicare (o moltiplicarsi) nell'ospite, l'agente deve avere
l'opportunit di essere trasmesso ad un altro ospite recettivo, in modo da dar luogo al cosiddetto
ciclo vitale. Tipicamente, la trasmissione avviene da un ospite ammalato ad uno sano recettivo:

La trasmissione pu avvenire per via orizzontale (detta anche laterale) oppure per via verticale. La
trasmissione orizzontale pu essere di tipo diretto o indiretto; la trasmissione verticale pu avvenire
in utero (mammiferi) o in ovo (uccelli, pesci ecc.).
321

Trasmissione orizzontale

Le malattie trasmesse orizzontalmente sono quelle trasmesse da un qualsiasi segmento di


popolazione ad un altro.

La trasmissione orizzontale pu essere diretta o indiretta.

La trasmissione orizzontale diretta si verifica quando un ospite recettivo si infetta per contatto
fisico con un ospite infetto oppure con suoi escreti.

La trasmissione orizzontale indiretta coinvolge un veicolo intermedio, animato o inanimato, che


trasmette l'agente. Questo veicolo detto vettore, sebbene sia pi corretto utilizzare questo
termine soltanto per i veicoli animati.
Il vettore di specie diversa rispetto all'ospite primario e, molto spesso, rappresentato da un
artropode.
322

ESEMPIO di trasmissione DIRETTA.


In un allevamento intensivo di polli da carne allevati su lettiera vi sono
alcuni soggetti con coccidiosi (malattia intestinale sostenuta da specie
diverse di un protozoo appartenente al genere Eimeria). Questi parassiti
replicano nelle cellule della mucosa intestinale e vengono emessi all'esterno
con le feci in una forma di resistenza detta oocisti. I polli sani allevati
nello stesso ambiente, ingerendo frammenti di lettiera oppure acqua o
mangime contaminato da feci, acquisiscono l'infestione. In questo modo il parassita compie il suo
ciclo vitale.

ESEMPIO di trasmissione INDIRETTA.


Le encefalomieliti virali del cavallo (provocate da virus appartenenti alla famiglia
Togaviridae, gen. Alphavirus) si trasmettono quasi esclusivamente attraverso vettori
rappresentati da zanzare di varie specie. Per questo, le encefalomieliti virali del
cavallo hanno un andamento stagionale che proporzionale al numero ed all'attivit
dei vettori: nelle zone temperate la frequenza maggiore si ha nella tarda estate,
mentre nelle zone tropicali la frequenza aumenta durante la stagione umida.

La trasmissione di agenti infettanti a lunga distanza attraverso l'aria, viene talvolta impropriamente
ritenuta indiretta, sebbene sia pi corretto classificarla come diretta in quanto non coinvolto
alcun veicolo intermedio.

Trasmissione verticale

La trasmissione per via verticale avviene da una generazione dell'ospite alla successiva attraverso
l'infezione dell'embrione o del feto in utero (mammiferi) o in ovo (uccelli, rettili, pesci, artropodi).
Secondo alcuni anche la trasmissione alla progenie attraverso il latte da considerarsi verticale.

ESEMPIO. La leucosi enzootica del bovino dovuta ad un virus appartenente alla famiglia
Retroviridae, genere HTLV-BLV (Human T-cell Lymphotropic Virus - Bovine Leukemia Virus).
Una delle vie di trasmissione di questa malattia quella verticale: il feto si infetta per via
diaplacentare. possibile, anche se non frequente, l'infezione del neonato per ingestione di latte o
colostro.
323

12. Trasmissione
e mantenimento delle infezioni
12.5 Tipi di ospite

OBIETTIVO:

descrivere i diversi significati del termine ospite in base alle possibili interazioni agente-
animale

In biologia Con il termine di ospite si designa la specie al cui interno (o sulla cui superficie)
presente un altro essere vivente, in situazione di commensalismo, parassitismo o simbiosi
mutualistica. L'attributo ospite viene usato anche per la cellula (cellula ospite) nella quale si
riproduce un parassita intracellulare (es. un virus).La specie ospite deve essere intesa in senso
lato, e quindi e comprende anche gli artropodi, che talvolta svolgono un ruolo importante nella
diffusione delle malattie. Di solito, nell'ospite avviene la moltiplicazione o lo sviluppo dell'agente.

Esiste una variet di termini che descrivono le interazioni ospite-parassita; si tratta di termini usati
da microbiologi, parassitologi, epidemiologi, infettivisti ecc. Ognuno di questi termini pu
assumere un significato specifico all'interno di ogni disciplina. In questa sede verr fatto un breve
cenno soltanto agli aspetti che riguardano l'epidemiologia.

Ospite definitivo

Ospite definitivo un termine usato in parassitologia per indicare l'ospite in cui un parassita
compie la fase di riproduzione sessuata.

ESEMPIO. Taenia pisiformis riconosce come ospite definitivo il cane, la volpe


ed altri carnivori, nei quali il verme adulto si localizza a livello di intestino tenue.
Ospiti intermedi sono soprattutto coniglio e lepre, animali nei quali, dopo
ingestione di alimenti contaminati con feci di animali parassitati, si sviluppano
larve cistiche (Cysticercus pisiformis) che si localizzano sulla sierosa peritoneale (Cisticercus
pisiformis).

Ospite primario e ospite secondario

Ospite primario (o ospite naturale). Si tratta di una specie animale che mantiene un'infezione
nella zona occupata dalla popolazione della specie animale stessa. Poich un agente infettante
324

spesso dipende dall'ospite primario per la sopravvivenza a lungo termine, l'ospite primario spesso
detto anche ospite di mantenimento.

Ospite secondario una specie addizionale (in aggiunta a quella dell'ospite primario) coinvolta
nel ciclo vitale di un agente, specialmente al di fuori della zona endemica.

Talvolta questa distinzione non molto netta, ed anche un ospite secondario pu agire come ospite
di mantenimento.

ESEMPIO. La pseudorabbia (o malattia di Aujeszky) una malattia virale che riconosce come
ospite primario il maiale. In questa specie compaiono i diversi quadri di malattia, oppure infezioni
asintomatiche o, ancora, infezioni latenti. La stessa malattia pu colpire anche molte altre specie di
animali domestici o selvatici; diversamente da quanto avviene nel maiale, in questi la malattia ha
esito quasi costantemente letale.

Ospite intermedio, accidentale, paratenico

Ospite intermedio: ospite in cui un agente va incontro ad un qualche tipo di sviluppo. Il termine
viene impiegato in parassitologia, e si riferisce pi spesso ad una riproduzione di tipo asessuato.

ESEMPIO. Railletina cesticillus un cestode (verme piatto) che vive, allo stadio adulto,
nell'intestino tenue del pollo, del fagiano e di altri volatili. Le proglottidi gravide, o parti di esse,
emesse con le feci vengono ingerite da un ospite intermedio rappresentato da un insetto dell'ordine
Coleoptera. Nell'ospite intermedio l'embrione si sviluppa, trasformandosi in larva cisticercoide.
L'ospite definitivo si infesta ingerendo un ospite intermedio parassitato.

Ospite accidentale (o incidentale, a fondo cieco, o dead-end): un ospite che generalmente non
trasmette la malattia e nel quale, quindi, l'agente non pu completare il suo ciclo biologico. La
definizione di "ospite accidentale" si applica soltanto ad una combinazione ospite-agente. Lo stesso
ospite pu essere definitivo, intermedio, accidentale ecc. per un diverso agente.

ESEMPIO. Nella pseudorabbia (vedi sopra), l'infezione di specie diverse dal maiale poco o nulla
diffusibile (perch il virus non viene escreto da parte dell'ospite), e porta costantemente a morte gli
325

animali colpiti. Quindi le specie diverse da quella suina sono da considerare, nell'epidemiologia
della pseudorabbia, come a fondo cieco.

Ospite paratenico: un ospite attraverso il quale l'agente trasferito meccanicamente e nel


quale non compie alcuno sviluppo.
Il termine ospite paratenico viene utilizzato esclusivamente in elmintologia. In altre discipline si
usa il termine vettore meccanico.

Angiostrongylus cantonensis un nematode che vive nelle arterie polmonari


del ratto. Le uova deposte dalle femmine adulte passano ai capillari
polmonari, dove si sviluppano e schiudono, producendo una larva (L1). Le
larve L1 penetrano negli alveoli polmonari, risalgono la trachea, pervengono
in faringe, vengono ingerite ed, infine, escono dall'ospite con le feci.
All'esterno, le larve passano in diverse specie di molluschi terrestri
(lumache) nei quali si sviluppano le forme larvale infestanti L3. Il ciclo si
conclude quando il ratto ingerisce una lumaca parassitata. Tuttavia, numerosi altri animali (sia
invertebrati (granchio, aragosta) che vertebrati (bovino, suino) , se ingeriscono il mollusco
parassitato, possono agire come ospiti paratenici e veicolare le larve L3. Nell'uomo che si ciba di
ospiti paratenici contenenti le larve L3, queste possono migrare alle meningi e provocare una
meningoencefalite eosinofilica.

Ospite di amplificazione, ospite serbatoio

Ospite di amplificazione: con questa denominazione si indica una specie animale che, per un
cambiamento temporaneo nella dinamica della popolazione accompagnato da un incremento di
numero degli individui, pu improvvisamente consentire un aumento della concentrazione
dell'agente.
326

Ospite serbatoio o reservoir quello in cui un agente normalmente vive e si moltiplica,


talvolta senza provocare malattia clinicamente evidente; un ospite di questo tipo rappresenta una
temibile fonte di infezione per altri animali.
Gli animali possono essere importanti reservoir di infezioni dell'uomo.

ESEMPIO. Brucella melitensis l'agente principale della brucellosi degli


ovini e dei caprini. In questi animali, il batterio causa una sintomatologia
fugace, rappresentata - in sostanza - da aborto. Esso, in genere, si verifica
una sola volta nella vita dell'animale; tuttavia, gli animali infetti restano
per lungo tempo portatori ed escretori dell'agente. Pertanto, la pecora e la
capra possono essere considerate serbatoi di B. melitensis. Esse rappresentano una importante
fonte di infezione per l'uomo, anche in considerazione del fatto che Brucella melitensis pu essere
escreta con il latte.
327

12. Trasmissione
e mantenimento delle infezioni
12.6 Tipi di vettore

OBIETTIVO

definire il termine vettore ed evidenziare le differenze fra vettore biologico e vettore


meccanico

Etimologicamente vettore deriva dal latino vector, che significa "colui che porta". Questo termine
pu essere impiegato in senso lato o ristretto.

In senso lato, per vettore si intende qualsiasi cosa, o essere vivente, che permette il trasporto o la
trasmissione di un agente patogeno.

ESEMPIO. Nel diftero-vaiolo aviare (una malattia virale che colpisce


numerose specie di uccelli, e sostenuta da virus appartenenti alla
Famiglia Poxviridae) possono essere considerati vettori in senso lato:
(1) un pollo ammalato introdotto in un gruppo di recettivi;
(2) le croste provenienti dalle lesioni vaiolose;
(3) un automezzo che ha trasportato polli ammalati;
(4) un insetto che veicola materiale contaminato;
(5) ecc.

Se si utilizza il significato ampio, i vettori possono essere distinti in animati o inanimati.


Nell'esempio precedente, i vettori (2) e (3) sono vettori inanimati. Questi ultimi sono detti anche
fomiti. Quindi, fomite sinonimo di vettore inanimato
328

Nel significato ristretto, un vettore un essere vivente (quasi sempre un invertebrato, e pi spesso
un artropode) che, in virt del suo comportamento ecologico, capace di trasmettere un agente di
malattia.
Nell'ambito dei vettori (intesi in senso ristretto) possono essere riconosciute due categorie. I vettori
meccanici sono quelli nei quali l'agente patogeno veicolato non compie alcuno sviluppo. I vettori
biologici sono, invece, quelli in cui l'agente si moltiplica oppure deve compiere una parte
importante del proprio ciclo vitale.
Talvolta i vettori biologici attivi, ed i vettori meccanici sono detti passivi .

ESEMPIO. Le zanzare possono veicolare meccanicamente il virus del vaiolo aviare, e


rappresentano pertanto dei vettori passivi di questa malattia. Il plasmodio della malaria nelle
zanzare del genere Anopheles compie una parte essenziale del ciclo di sviluppo; si tratta, in questo
caso, di vettori attivi o biologici.
329

12. Trasmissione
e mantenimento delle infezioni
12.7 Fattori associati alla diffusione delle infezioni

OBIETTIVO

inquadrare e schematizzare le variabili che condizionano la diffusione delle malattie infettive o


parassitarie

Le malattie trasmissibili possono diffondere all'interno di una popolazione o di un territorio pi o


meno rapidamente e con modalit diverse.

Fra le diverse variabili che intervengono nel processo di diffusione delle malattie trasmissibili, le
pi importanti sono legate alle caratteristiche dell'ospite, alle caratteristiche dell'agente ed
alla efficienza del contatto.

Pi in dettaglio (v. schema), l'ospite favorisce (o ostacola) la diffusione di una malattia a seconda di
due caratteri principali: la recettivit e la contagiosit. A sua volta, l'agente responsabile della
malattia possiede almeno 3 caratteri importanti ai fini della trasmissione: l'infettivit, la virulenza e
la stabilit.
I suddetti caratteri vengono brevemente sviluppati nelle due Unit che seguono.
330

12. Trasmissione
e mantenimento delle infezioni
12.8 Diffusione delle infezioni e caratteristiche dell'ospite: recettivit e contagiosit

OBIETTIVO

fornire i concetti di base su alcuni attributi dell'ospite che sono implicati nella diffusione delle
malattie trasmissibili all'interno di una popolazione o fra popolazioni diverse

La capacit di un ospite a trasmettere una malattia condizionata da numerosi fattori, tra i quali i
pi importanti sono la recettivit (o suscettibilit) e la contagiosit.

Parlando in generale, la recettivit la capacit di sviluppare un determinato evento. In


epidemiologia per, per recettivit molto spesso si intende la capacit di ospitare un agente
patogeno e di permetterne lo sviluppo o la moltiplicazione.

Un fattore importante che condiziona la recettivit la specie animale. Infatti, a seconda della
malattia, la recettivit pu essere molto ampia, oppure limitata ad una sola specie o a gruppi di
specie. La gamma di specie animali recettive ad una malattia viene detta, nel suo complesso,
spettro d'ospite

ESEMPIO. La malattia di Marek una malattia virale che colpisce esclusivamente il pollo; quindi,
si dice che il virus della malattia di Marek ha uno spettro d'ospite molto ristretto.
Al contrario, il virus della rabbia pu infettare una vasta gamma di specie animali, e quindi esso ha
uno spettro d'ospite allargato.

Un altro fattore importante che influisce sulla recettivit l'immunit derivante da una pregressa
infezione o da una vaccinazione.

La recettivit all'interno di una stessa specie pu variare ampiamente ed essere accompagnata, ad


esempio, alla selezione di animali geneticamente resistenti. L'animale recettivo pu diventare
vettore o portatore.

La contagiosit la propensione di una malattia o di un agente a diffondere all'interno di una


popolazione recettiva per vie naturali (contatto diretto o indiretto).
331

La contagiosit dipende da moltissime variabili; fra esse, le pi importanti sono, in genere:

1. durata del periodo in cui l'ospite infettante;


2. quantit di agente escreto dall'ospite.

Vi sono anche altri fattori che influenzano la contagiosit. Ad esempio, un animale non diventa
infettante subito dopo l'avvenuta infezione. Il tempo che intercorre tra l'infezione e la escrezione
dell'agente un altro fra i tanti elementi che contribuiscono a determinare la contagiosit di una
malattia. Questo periodo di tempo assume denominazioni diverse a seconda del tipo di agente
implicato. In particolare, esso viene denominato:

periodo di prepatenza per le malattie parassitarie


fase di eclisse per le malattie da virus
periodo di latenza per le malattie da batteri.

Nel caso delle malattie non infettive, il periodo di latenza indica l'intervallo di tempo compreso
tra l'esposizione alla causa e la comparsa della malattia.
332

12. Trasmissione
e mantenimento delle infezioni
12.9 Diffusione delle infezioni e caratteristiche dell'agente

OBIETTIVO

illustrare alcuni caratteri dell'agente patogeno importanti ai fini della trasmissione della malattia

Fra le pi importanti caratteristiche che influenzano la trasmissione degli agenti infettivi sono da
annoverare: (1) infettivit, (2) virulenza, (3) stabilit.

L'infettivit un attributo dell'agente che misura con quanta facilit esso in grado di infettare
l'ospite. L'infettivit inversamente proporzionale al numero di organismi necessari per l'instaurarsi
dell'infezione in un determinato ospite.
L'infettivit varia ampiamente in rapporto ad i diversi agenti.

ESEMPIO. I virus che infettano i batteri (batteriofagi) hanno un'infettivit molto elevata: 1 solo
batteriofago pu indurre infezione in un batterio. Al contrario, nel caso dei virus animali, l'infezione
si instaura soltanto con quote di virus molto pi elevate (es. 1000 o 100000 particelle infettanti).

L'infettivit pu variare in rapporto ai differenti ceppi dello stesso agente e dipende anche da altri
fattori quali la via di infezione, l'et dell'ospite, il suo stato di resistenza innata o acquisita ecc.
Quando un agente capace di infettare pi di una specie animale, la sua infettivit varia in rapporto
alla specie ospite. In sostanza, l'infettivit di un agente non un parametro assoluto, ma deve essere
specificata in correlazione con altre variabili.

ESEMPIO. La dose infettante di Campylobacter jejuni isolato da pollo di 500 batteri per il pollo e
di 107 per il gabbiano.
Il virus dell'encefalomielite aviare riproduce la malattia se somministrato in bassa dose a pulcini
recettivi di 1 giorno di et; se si utilizzano pulcini di et superiore, sono necessarie dosi via via pi
elevate. Quindi, l'infettivit del virus dell'encefalomielite aviare strettamente correlata all'et.

La virulenza misura la patogenicit (o potere patogeno) di un agente, ossia quanto esso capace di
provocare una malattia e di indurre lesioni nei tessuti colpiti.

La stabilit di un agente la sua capacit a sopravvivere per tempi pi o meno lunghi al di fuori
dell'ospite. Talvolta viene detta anche resistenza. Gli agenti poco stabili nell'ambiente vengono
detti labili. Ovviamente la stabilit di un agente dipende molto dalle condizioni ambientali
(temperatura, umidit radiazioni UV ecc.) in cui esso si viene a trovare.

Le spore batteriche sono fra le forme di vita pi pi stabili conosciute, potendo rimanere vitali per
anni. Al contrario, alcuni virus (es. alcuni coronavirus dell'uomo) resistono soltanto poche ore.

Riassumendo:
333

Infettivit, virulenza e stabilit in epidemiologia

da notare qui sopra sono state esposte le "classiche" definizioni di infettivit, virulenza e stabilit,
mutuate dalla microbiologia e che si riferiscono pi all'interazione tra un agente ed un; singolo
animale che a una popolazione.

In epidemiologia, l'infettivit viene invece misurata su popolazioni di animali, e si ottiene


calcolando la proporzione di individui che si infettano sul totale di quelli esposti all'agente.

Sempre ragionando in termini di popolazione anzich di singolo individuo, si pu affermare che la


patogenicit (o potere patogeno) di un microrganismo esprimibile con la proporzione di infetti
che sviluppano malattia clinica.

Attenzione a non confondere l'infettivit con il concetto di morbosit, la quale invece misura la
proporzione di ammalati sul totale di animali che possono contrarre quella malattia.

La virulenza di un agente un altro fattore che influenza la trasmissione; essa strettamente


correlata alla patogenicit.

Per un dato agente, la virulenza viene definita come la capacit di moltiplicarsi nell'ospite e di
indurre malattia e lesioni. Anche in questo caso si tratta di una definizione riferita al singolo
334

animale. Per l'epidemiologo, la virulenza di un agente correlata alla proporzione di animali


ammalati che vanno incontro a malattia grave (o muoiono). Negli studi epidemiologici, la virulenza
pu essere stimata misurando la letalit.

ESEMPIO. Il virus della rabbia provvisto di alta infettivit, alta patogenicit ed alta virulenza.
Infatti, gli individui che vengono esposti al virus (es. morsicati da un cane rabido [nota la
terminologia: rabido, NON rabbioso!]) quasi certamente si infettano; inoltre, tutti quelli che si
infettano vanno incontro a malattia e tutti gli ammalati muoiono.

da notare che una elevata virulenza non necessariamente associata ad una maggiore diffusibilit
dell'agente nella popolazione: infatti, un agente molto virulento provoca la morte dell'ospite un
breve tempo, e questo riduce la probabilit che l'agente si trasmetta ad altri ospiti recettivi.

Infine, il tempo durante il quale un microrganismo pu rimanere infettante al di fuori dell'ospite


detto stabilit. Alcuni organismi sopravvivono soltanto per breve tempo, cio sono molto labili.
La stabilit aumentata dalla presenza, sull'agente, di una barriera protettiva (es. spora).

ESEMPIO. Le leptospire, agenti di malattia in diverse specie animali, sono poco stabili in ambiente
secco. Il virus del vaiolo molto stabile e, al riparo dalla luce solare diretta, pu conservare
l'infettivit per anni. Le forme vegetative di Bacillus anthracis (l'agente del carbonchio ematico)
sono relativamente labili, mentre le spore dello stesso batterio (e le spore batteriche in genere) sono
fra le pi resistenti forme di vita note.
335

12. Trasmissione
e mantenimento delle infezioni
12.10 Diffusione delle infezioni ed efficienza del contatto

OBIETTIVO

sottolineare il ruolo di alcune variabili riguardo al contatto tra animali infetti ed animali sani

L'efficienza del contatto descrive le condizioni che facilitano l'instaurarsi dell'infezione nel singolo
animale e la sua diffusione a livello di popolazione.
Per una particolare infezione, l'efficienza dipende dalla stabilit dell'agente, dalle vie di escrezione
da parte dell'ospite infetto e dalla via di penetrazione nell'ospite suscettibile.

Riguardo alla durata, il contatto pu essere assai breve oppure prolungato. La durata della
contagiosit determina il numero dei suscettibili che vengono infettati da un singolo soggetto
infetto. Quindi, ad esempio, le infezioni virali dell'apparato respiratorio superiore hanno in genere
una contagiosit breve (giorni) mentre bovine affette da TBC possono essere escretrici del bacillo
col latte per anni.

Anche il comportamento degli animali pu condizionare l'efficienza del contatto. Esempio tipico
quello della rabbia, nel senso che animali per natura timidi e schivi, quando sono colpiti da rabbia
tendono ad avvicinarsi all'uomo ed appaiono addirittura mansueti. Ci incrementa la possibilit di
contatto dell'uomo con il virus.

La patogenesi della malattia pu influenzare la probabilit di trasmissione; per es., le malattie


respiratorie possono indurre tosse e starnuti, cui si accompagna diffusione dell'agente tramite
aerosol.
336

12. Trasmissione
e mantenimento delle infezioni
12.11 Vie di infezione

OBIETTIVO

apprendere un inquadramento ragionato delle vie di infezione (o di infestione)

La sede o le sedi attraverso le quali un agente penetra nell'ospite sono dette vie di infezione e
sono riassunte schematicamente nella seguente figura. In essa l'organismo rappresentato come un
modello di forma sferica nel quale vengono evidenziate le possibili vie di penetrazione di un agente.
Notare che le mucose dell'apparato respiratorio, digerente e genitale vengono considerate come
superfici corporee, in quanto sono tutte a contatto pi o meno diretto con l'ambiente esterno.

Fra le vie riportate nel modello, quelle pi frequentemente utilizzate da agenti infettivi o parassitari
sono: la via respiratoria, la via digerente, la via cutanea.
337

VIA ORALE

La via orale una delle pi comuni, specialmente in relazione ai microrganismi con habitat
intestinale che spesso vengono eliminati dall'ospite infetto con le feci. Agenti quali rotavirus,
salmonelle e molti parassiti gastrointestinali possono contaminare acqua ed alimenti, che agiscono
quindi come fomiti.
Nel caso in cui gli agenti ingeriti vengano escreti con le feci, si parla di ciclo oro-fecale.

Gli agenti che penetrano per via orale possono essere disseminati dall'ospite infetto attraverso una
variet di vie, oltre a quella fecale.

ESEMPIO. L'infezione da Brucella abortus nel bovino avviene pi spesso per via orale, ma l'agente
viene poi escreto col latte o con le secrezioni uterine al momento del parto o dell'aborto.

I bassi valori di pH gastrico rappresentano una efficiente barriera alla trasmissione di questo tipo
per numerosi agenti.

VIA RESPIRATORIA

E' un altro frequente metodo di trasmissione per molti agenti infettivi. Gli agenti raramente si
presentano come singole particelle in sospensione nell'aria, ma sono invece inglobati in materiale
organico sotto forma di goccioline o polvere. La natura e le dimensioni di queste particelle
influenzano la loro dispersione e stabilit. Negli animali l'aria inspirata viene sottoposta a filtrazione
(seni nasali, turbinati ecc.) e, se questo sistema ben funzionante, raramente le particelle sono in
grado di raggiungere le vie respiratorie profonde (alveoli polmonari). Pertanto, almeno inizialmente,
l'infezione si instaura a carico delle vie aeree superiori.

Le infezioni che si trasmettono per via respiratoria si verificano con maggiore probabilit in
presenza di un'elevata densit di popolazione e di scarsa ventilazione. Queste condizioni si
riscontrano frequentemente nell'allevamento intensivo di diverse specie animali.

ESEMPIO. Escherichia coli nel pollo pu provocare una vasta gamma di malattie (artrite, sinovite,
oviduttite, onfalite ecc.). Tuttavia, nell'allevamento intensivo del broiler, la forma pi comune
quella respiratoria
338

In condizioni ambientali estreme, possono venire trasmesse per via respiratoria malattie che assai
raramente lo sono in condizioni normali.

ESEMPIO. Il virus della rabbia si trasmette normalmente attraverso il morso di animali infetti.
Tuttavia, stata dimostrata la possibilit acquisizione della malattia per via respiratoria dopo
permanenza in caverne nelle quali si erano insediate colonie di pipistrelli.

VIA CUTANEA E TRANS-MUCOSALE

La trasmissione attraverso la cute detta percutanea.


Alcuni agenti si localizzano soltanto a livello cutaneo e la trasmissione si verifica soltanto per
contatto diretto o tramite fomiti (es. micosi cutanee, ectoparassiti). La incidenza di queste forme,
e soprattutto di quelle che si trasmettono per contatto diretto, fortemente influenzata dalla densit
della popolazione di ospiti suscettibili.

La cute integra una efficace barriera per la maggior parte degli agenti infettanti; fra i
microrganismi, soltanto pochi (es. leptospire) possono oltrepassare la cute integra o macerata da una
lunga permanenza in acqua. Alcuni parassiti, e particolarmente gli stadi immaturi di alcuni
nematodi e trematodi, possono penetrare attraverso la cute intatta (es. Schistosoma e Ancylostoma).

Al contrario, sulla cute lesionata da tagli o abrasioni possono instaurarsi numerose infezioni che
rimangono localizzate (es. infezioni da Staphylococcus aureus). Altri agenti, possono indurre una
infezione generalizzata, con o senza localizzazione al punto di ingresso.

Un'altra importante forma di infezione percutanea quella derivante dal morso di vertebrati o dalla
puntura di artropodi.
Agenti che sono presenti nella saliva (virus della rabbia) possono essere trasmessi attraverso
morsicature. Non sono da dimenticare le numerose malattie infettive o parassitarie trasmesse dalla
puntura di artropodi.

Nonostante poche malattie possano essere trasmesse attraverso la cute integra, numerosi agenti
possono invece infettare le mucose integre. Ci vale, in particolare, per gli agenti che sono labili
nell'ambiente esterno e che richiedono, ad esempio, un contatto sessuale diretto (Tripanosoma
equiperdum nel cavallo).
339

12. Trasmissione
e mantenimento delle infezioni
12.12 Modalit di trasmissione

OBIETTIVO

esaminare le caratteristiche fondamentali delle principali vie di trasmissione delle malattie

INGESTIONE

Pu verificarsi attraverso veicoli meccanici (fomiti), per esempio acqua contaminata, o ingestione
di ospiti intermedi (cisti di cestodi nella carne).
Gli agenti ingeriti, dopo la replicazione e lo sviluppo, vengono solitamente escreti con le feci,
originando un cosiddetto ciclo fecale-orale. Per alcuni agenti, l'escrezione avviene
esclusivamente per via fecale, in quanto l'infezione localizzata al solo tratto intestinale (es.
paratubercolosi del bovino).
Altri agenti, una volta assunti per ingestione, possono invadere il torrente circolatorio ed essere
escreti, oltre che per via fecale, anche per vie addizionali come l'urina o le secrezioni respiratorie
(es. virus della peste bovina).

INALAZIONE

L'assunzione del contagio avviene attraverso aria contaminata.


La modalit pi comune prevede l'escrezione di patogeni attraverso l'apparato respiratorio da parte
di soggetti infetti e la penetrazione nell'ospite recettivo per inalazione.
A questo proposito da sottolineare che le goccioline eventualmente presenti nell'aria espirata (es.
colpi di tosse) sono di dimensioni relativamente grandi; esse
tendono a sedimentare rapidamente per effetto del loro
stesso peso e non viaggiano a lunga distanza. Pertanto, il
rischio di infezione per inalazione di un aerosol espirato
limitata alla zona posta direttamente di fronte e nelle
340

immediate vicinanze dell'individuo infetto. Questa zona viene detta cono espiratorio.

Molto diversa trasmissione per aerosol, che comporta la formazione di particelle molto piccole e
che, quindi, sedimentano molto lentamente e sono facilmente veicolate dalle correnti d'aria. In
questo caso, possibile la trasmissione a lunga distanza.
Propriamente, per aerosol si intende una sospensione colloidale di particelle molto piccole (1-
1000 nanometri o nm) liquide o solide (fase dispersa) in un gas (fase disperdente). Pertanto, con il
termine aerosol si pu anche indicare una sospensione di particelle virali, mentre i batteri non
possono formare aerosol in quanto hanno dimensioni maggiori (>1000 nm) rispetto a quelle
colloidali.

Le dimensioni delle particelle e la distribuzione dei flussi nelle vie aeree consentono di prevedere in
quale regione anatomica avverr il deposito. In linea di massima ed a titolo di esempio, si pu
affermare che, nell'uomo:

le particelle di diametro superiore a 10 micrometri sono intercettate a livello delle vie aeree alte
quelle comprese fra 5 e 10 micrometri si depositano preferibilmente fra la faringe e la V/VI
diramazione bronchiale
quelle di 1-5 micrometri raggiungono e si depositano a livello delle diramazioni bronchiali pi
periferiche
quelle di diametro <1 micrometro tendono ad essere riespirate

CONTATTO

La trasmissione per contatto quella che si verifica senza l'intervento di vettori o di elementi
esterni. E' particolarmente importante nel caso degli agenti che vengono eliminati attraverso le
superfici corporee (es. virus della malattia vescicolare o del vaiolo) e che penetrano nell'ospite
recettivo per via cutanea. Pochissimi agenti vengono trasmessi per autentico 'contatto'; in genere
necessario che sulla cute del ricevente ci siano delle soluzioni di continuo, anche microscopiche. La
trasmissione per contatto pu verificarsi anche attraverso morsicatura (rabbia) o graffio (es.
malattia da graffio del gatto).

INOCULAZIONE

l'introduzione dell'agente nell'organismo ospite attraverso puntura della cute o attraverso una
ferita.
La forma pi tipica di trasmissione per inoculazione avviene ad opera di artropodi che inoculano
l'agente per puntura della cute. (es. mosca tsetse per Tripanosoma, che si sviluppa nelle ghiandole
salivari ed intestino della mosca stessa). L'inoculazione talvolta rappresenta un caso particolare di
trasmissione per contatto (es. morsicatura di cane rabido, ossia affetto da rabbia).

TRASMISSIONE IATROGENA

Letteralmente significa originata da un medico. Si riferisce a quel tipo di trasmissione che si


verifica nel corso di pratiche mediche o chirurgiche. Pu avvenire per introduzione di patogeni
mediante (1) strumentazione non sterile (chirurgia in assenza di asepsi, tatuaggi), oppure (2)
farmaci o vaccini accidentalmente contaminati da agenti patogeni (es. Pseudomonas aeruginosa in
antibiotici per trattamento mastiti in asciutta).
341

ACCOPPIAMENTO

Esistono agenti che possono essere trasmessi durante il coito; alcuni si trasmettono soltanto in
questo modo e sono responsabili delle cosiddette malattie veneree, oggi pi comunemente
definite come malattie a trasmissione sessuale.
La trasmissione sessuale pu avvenire anche negli artropodi (es. virus della peste suina africana
che pu essere trasmesso dal maschio alla femmina di zecche del genere Ornithodoros).
342

12. Trasmissione
e mantenimento delle infezioni
12.13 Trasmissione a lunga distanza di agenti di malattia

OBIETTIVO

esaminare e commentare le modalit di trasmissione a lunga distanza delle malattie diffusibili

Attraverso i metodi schematizzati nella figura, le malattie infettive o parassitarie possono essere
trasmesse a lunga distanza per movimenti di animali, vettori e fomiti.

Fino a tempi non molto lontani, il trasporto di persone, animali o cose avveniva per vie terrestri
(carri, carovane) o marine. I viaggi a lunga distanza richiedevano settimane o mesi e ci
rappresentava, di per s, un buon provvedimento di quarantena. Infatti, durante il viaggio,
eventuali malattie in incubazione avevano modo di manifestarsi attraverso la comparsa di sintomi
clinici; in tal modo, esse venivano individuate e ci consentiva di adottare adeguati provvedimenti
sanitari.

L'incremento nell'uso del trasporto aereo ha incrementato la probabilit che animali con malattia
in incubazione possano giungere a destinazione in breve tempo e prima della comparsa dei sintomi.

Ad esempio, nel recente passato, il commercio ed il trasporto di cavalli, in occasione di


competizioni sportive o per compravendita e riproduzione, ha contribuito alla diffusione su scala
mondiale di alcune malattie diffusibili (metrite contagiosa, anemia infettiva, piroplasmosi, influenza
equina).

Lo stesso problema ovviamente si verifica anche nel caso dell'uomo, i cui frequenti viaggi
rappresentano un rischio per la diffusione di malattie esotiche.

Non da dimenticare l'importanza delle migrazioni di intere popolazioni animali. Tipico esempio
quello di numerose specie di uccelli, che migrano stagionalmente in direzione nord-sud e viceversa.

Un altro sistema di trasmissione di malattie a lunga distanza quello che prevede l'intervento di
aerosol contenenti particelle solide molto piccole (2-1000 nm) dette nuclei essiccati, assai stabili
343

e capaci di essere veicolate a lunga distanza dalle correnti aeree. La formazione di questi nuclei
dipende in larga misura dalle condizioni ambientali (temperatura e umidit relativa). La pioggia
provoca la sedimentazione dei nuclei.

da sottolineare che anche i vettori (artropodi ecc.) possono essere veicolati accidentalmente a
lunga distanza con gli stessi mezzi di trasporto (aerei compresi) utilizzati per la movimentazione di
uomini o cose.

Infine, da citare la possibilit (remota ma temibile) che agenti di malattia vengano disseminati
attraverso somministrazione di prodotti (farmaci o vaccini) accidentalmente contaminati da un
agente patogeno.

ESEMPIO. Negli anni '70 comparve negli allevamenti di galline una malattia che provoca calo
dell'ovodeposizione (perci detta Egg Drop Syndrome '76) sostenuta da un Adenovirus. Si ritiene
che la malattia sia stata disseminata su scala mondiale dall'impiego di un vaccino nei confronti di
un'altra malattia aviare (malattia di Marek) accidentalmente contaminato dall'adenovirus in
questione che, a quel tempo - non era ancora noto.
344

12. Trasmissione
e mantenimento delle infezioni
12.14 Trasmissione delle malattie per via verticale

OBIETTIVO

illustrare le modalit di trasmissione per via verticale

La trasmissione verticale quella basata sulla riproduzione e che prevede la trasmissione di un


agente patogeno da un genitore alla discendenza.
Vi sono due modalit di trasmissione verticale: ereditaria e congenita.

Le malattie a trasmissione ereditaria sono legate al genoma di uno dei due genitori. Per esempio,
alcuni retrovirus (virus che hanno la capacit di integrarsi con il genoma dell'ospite) possono essere
trasmessi ereditariamente.

Le malattie a trasmissione congenita o, pi semplicemente congenite sono quelle che -


letteralmente - sono presenti alla nascita. Pertanto, in senso stretto anche le malattie ereditarie fanno
parte di questo gruppo. Tuttavia nell'uso comune il termine congenito si riferisce a quelle malattie
acquisite in utero (oppure in ovo) piuttosto che ereditate.

La trasmissione pu avvenire a vari stadi dello sviluppo embrionale o fetale oppure si pu avere
l'infezione del nascituro durante l'attraversamento del canale del parto.
L'infezione dell'embrione o del feto pu indurre aborto (se incompatibile con la vita) oppure
comparsa di deformazioni o mostruosit. Alternativamente, il neonato pu presentare una infezione
inapparente e continuativa (infezione innata), non accompagnata da alcun sintomo clinico.

Alcuni artropodi (soprattutto zecche ed acari) trasmettono batteri, virus e protozoi da una
generazione all'altra attraverso le uova (trasmissione transovarica).

ESEMPIO. Anaplasmosi bovina (malattia protozoaria, frequente nelle zone tropicali e sub-tropicali,
trasmessa da diverse specie di zecche). Babesiosi del cane (trasmessa da zecche del genere
Dermatocentor e Haemaphysalis).
345

Alcuni artropodi trasmettono l'infezione soltanto per via trans-stadiale, cio da uno stadio di
sviluppo all'altro.

ESEMPIO. Theileriosi, causata da protozoi del genere Theileria che infettano bovino, pecora e
capra e che sono trasmessi da zecche del genere Rhipicephalus.
346

12. Trasmissione
e mantenimento delle infezioni
12.15 Strategie di mantenimento dell'agente

OBIETTIVO

elencare e commentare le strategie difensive e di mantenimento messe in atto dall'agente di


infezione, sia all'interno che all'esterno dell'ospite

La trasmissione di un agente prevede momenti in cui l'agente nell'ospite, altri in cui l'agente si
trova nell'ambiente esterno o in un vettore. Dal punto di vista dell'agente, sia l'ambiente interno che
quello esterno all'ospite presentano dei rischi per la sopravvivenza.

AMBIENTE INTERNO ALL'OSPITE

L'ospite possiede una vasta gamma di meccanismi di difesa naturali: agenti chimici di superficie,
cellule difensive specifiche, fagociti, immunit umorale. Perch l'infezione abbia successo, l'agente
deve essere capace di sfuggire - almeno in parte - a questi meccanismi, ma deve anche superare la
competizione da parte di altri agenti che possono contemporaneamente competere per la stessa
nicchia.

Gli agenti hanno elaborato strategie diverse per resistere alle difese dell'ospite.

ESEMPI. Cuticola acido-resistente degli elminti, utile per resistere all'acido gastrico; localizzazione
intracellulare di virus e batteri per sfuggire all'immunit umorale; capsula, che protegge dalla
fagocitosi i batteri che la possiedono; mutazione della struttura antigene, per eludere le difese
immunitarie.

AMBIENTE ESTERNO

Due sono i rischi principali nell'ambiente esterno: l'essiccamento e le radiazioni ultraviolette.

L'essiccamento non sempre letale, ma spesso inibisce la moltiplicazione dei batteri; stesso effetto
hanno le basse temperature.
Le alte temperature che si raggiungono nei climi temperati non sono - in genere - letali per gli
agenti, ma possono esserle nei climi tropicali.
Molti agenti sono parzialmente protetti dall'essiccamento in quanto sono eliminati con le urine o le
feci; essi possono persistere a lungo se pervengono in ambienti adatti. Ad es., le leptospire che
sopravvivono molto pi a lungo in terreni paludosi che in zone aride. Alcuni agenti sono
straordinariamente resistenti all'essiccamento (es. poxvirus del diftero-vaiolo aviare, che pu
sopravvivere per mesi nelle croste essiccate). Molti altri agenti possono resistere a lungo in
materiali inanimati nell'ambiente (fomiti) (es. salmonelle nei mangimi).
347

STRATEGIE DI MANTENIMENTO

Possono essere classificate nelle 5 categorie schematizzate nella figura soprastante e che vengono
brevemente descritte di seguito.

1) ANNULLAMENTO DELLO STADIO NELL'AMBIENTE ESTERNO

Alcuni agenti si trasmettono da un ospite all'altro senza passaggio nell'ambiente; ci pu avvenire


per mezzo di 4 metodi principali, indicati nello schema seguente.

2) FORME DI RESISTENZA

Alcuni batteri (es. Clostridium e Bacillus) formano spore che resistono a lungo anche a temperature
superiori a 100 C e che possono "sopravvivere" nell'ambiente per decenni.
Una particolare forma di resistenza quella nei confronti degli antibiotici, basata su una
modificazione genetica del batterio. Questa resistenza rappresenta un grave problema terapeutico,
soprattutto delle malattie sostenute da alcuni generi batterici (Salmonella, Escherichia,
Staphylococcus) che pi spesso di altri presentano antibiotico-resistenza.
Alcuni elminti e protozoi (es. coccidi) originano forme di resistenza (cisti) che possono anche
proteggere l'agente dai meccanismi di difesa dell'ospite. Ad es., il protozoo Toxoplasma gondii pu
sopravvivere per anni in forma cistica all'interno dell'ospite.
348

3) RAPIDLY-IN, RAPIDLY-OUT

Alcuni agenti penetrano nell'ospite, replicano e lo abbandonano molto rapidamente, prima che esso
abbia avuto il tempo di attuare una risposta immune (o morire). Molti virus dell'apparato
respiratorio compiono un ciclo di questo tipo in sole 24 ore. Questa strategia condizionata dalla
disponibilit continua di ospiti recettivi. Ci potrebbe giustificare l'assenza di tali infezioni
(enteriche o respiratorie, come ad esempio quella sostenuta dal virus del raffreddore) in popolazioni
a bassa densit. Si ritiene anche che queste infezioni non fossero presenti nelle popolazioni
preistoriche.

4) PERSISTENZA NELL'OSPITE

Alcuni agenti possono persistere per lungo tempo nell'ospite, anche per tutta la vita. La persistenza
si verifica perch le difese dell'ospite non sono in grado di eliminare l'agente. Ci pu essere la
conseguenza del fatto che l'agente si "adattato" ai fagociti o ha sviluppato altre strategie per
sfuggire ai meccanismi immunitari. Fra questi meccanismi sono importanti l'immunodepressione e
la tolleranza.

La persistenza pu essere associata ad un lungo periodo di incubazione o di prepatenza. Rientrano


in questo gruppo le malattie da virus cosiddetti "lenti". Es.: Maedi-Visna, un virus lento della
pecora, provoca sintomi respiratori e nervosi dopo un periodo di incubazione di oltre 2 anni.
Similmente la scrapie provoca sintomi respiratori ed ha un periodo di incubazione di 1-5 anni. La
persistenza di tale virus nell'ospite facilita la trasmissione verticale e, forse, anche quella
orizzontale.
Alternativamente, il periodo di prepatenza di un agente pu essere relativamente breve, ma
l'escrezione pu protrarsi a lungo (cio si ha un lungo periodo di contagiosit).
L'escrezione pu essere intermittente; per es., l'infezione da Salmonella spp pu essere associata
349

con episodi intermittenti di malattia clinica o subclinica, durante i quali si ha escrezione del batterio.
In alcune infezioni l'escrezione pu essere continua (es. Leptospira hardjo nel bovino, escreta per
12-24 mesi). Il lungo periodo di contagiosit dell'ospite assicura all'agente la disponibilit di una
popolazione recettiva (dovuta alle nuove nascite).

Oltre che nell'ospite vertebrato, gli agenti possono persistere anche nel vettore artropode. Per es. il
virus della peste suina africana persiste nelle zecche fino ad 8 mesi. Inoltre, alcuni agenti possono
essere escreti dal vettore per lunghi periodi.

5) AMPLIAMENTO DELLO SPETTRO D'OSPITE

Molti agenti possono infettare pi di una specie. Ad esempio, l'80% dei microrganismi che infettano
l'uomo riconoscono anche altre specie ospiti. Un importante ruolo del veterinario proprio quello di
controllare queste malattie (zoonosi). Alcune infezioni sono inapparenti in alcuni ospiti, e ci
ne rende difficile il controllo. Es. Borrelia burgdorferi, l'agente trasmesso da zecche e che provoca
la malattia di Lyme nell'uomo ed in altri animali, provoca infezione inapparente anche in numerosi
mammiferi domestici e selvatici ed in uccelli.
350

13. Pattern di
malattia
13.1 Curve epidemiche e distribuzione spaziale delle malattie

OBIETTIVO:

apprendere come l'andamento di una malattia nel tempo possa essere rappresentato graficamente;

apprendere un metodo di rappresentazione di una malattia attraverso una mappa.

Abbiano detto pi volte che l'epidemiologia si occupa delle malattie in popolazioni. In questa ottica,
importante, pi che occuparsi della malattia nei singoli casi, osservarne l'andamento nelle
popolazioni, seguendone l'evoluzione sia nel tempo che nello spazio.

Le curve epidemiche

Una delle pi comuni forme di visualizzazione dell'andamento nel tempo di una malattia in una
popolazione rappresentazione attraverso un grafico, in cui il numero di nuovi casi ( incidenza) si
pone in ordinata ed il tempo in ascissa:

Il grafico che si ottiene dai dati raccolti durante una epidemia genera una curva epidemica (pi
correttamente rappresentata da un diagramma a barre). La curva epidemica fornisce indicazioni
preziose riguardo all'andamento di una epidemia, e pu contribuire a rispondere ad importanti
domande quali: qual stata la via di diffusione della malattia? quando si verificata l'esposizione
all'agente della malattia? quale stato il periodo di incubazione? si sono verificati dei casi
secondari?

L'andamento nel tempo della malattia, riprodotto dalle barre o dalla forma della curva, pu essere
utile anche per sviluppare ipotesi riguardo alla causa della malattia e alle sue caratteristiche
epidemiologiche, e per fare previsioni sull'andamento futuro.

Nella figura che segue rappresentato un esempio di andamento tipico di una curva epidemica di
una malattia trasmissibile (nella pratica non sempre la curva epidemica ha questo aspetto).
351

Si pu notare un andamento bi-modale: infatti la curva ha due picchi che testimoniano che la
malattia diffusiva. I primi casi formano la curva pi piccola (detta curva primaria);
successivamente essi contagiano altri individui della popolazione, che vanno a formare la curva
secondaria. Ovviamente si tratta di una rappresentazione schematica, e non sempre in natura pu
essere evidenziato un andamento simile a questo. Infatti, l'aspetto della curva dipende da numerose
variabili fra cui le pi importanti sono: via di escrezione e velocit di propagazione dell'agente
eziologico, densit della popolazione, proporzione di animali recettivi. Il lasso di tempo che separa
la curva primaria dalla secondaria corrisponde approssimativamente al periodo di incubazione
della malattia.

Fra le tante variabili che condizionano l'andamento di una malattia in una popolazione, alcune fra
le pi importanti verranno descritte in una prossima unit.

Sia chiaro fin d'ora, tuttavia, che una epidemia pu verificarsi ed estendersi soltanto in presenza di
una determinata densit minima di animali recettivi nel territorio. Questa densit minima detta
livello di soglia ed stata definita matematicamente nel Teorema della Soglia di Kendall.

La distribuzione spaziale

Se le curve epidemiche servono a


rappresentare una malattia in funzione del
tempo, vi sono casi in cui invece utile
illustrare la distribuzione geografica (o
spaziale) della malattia.

Nel caso pi semplice, la distribuzione


spaziale riassunta in una mappa in cui
riportata la frequenza dei casi esistenti in un
determinato istante (mappa di prevalenza)
oppure dei nuovi casi comparsi in un dato
periodo di tempo (mappa di incidenza).
Nell'immagine a destra si trova un esempio di
mappa in cui raffigurata, attraverso un
gradiente di colore, la prevalenza di
352

allevamenti bovini positivi per tubercolosi nell'anno 1998.

La rappresentazione spaziale di una malattia pu avere anche un altro scopo, e cio quello di
facilitare l'identificazione di concentramenti (cluster) di casi in determinate aree, con lo scopo di
identificare una causa di malattia. Una mappa di questo tipo gi stata descritta a proposito dello
studio delle epidemie di colera compiuto a Londra da John Snow nel 1849-53.

Oggi sono disponibili sofisticate tecniche di analisi capace di individuare un anomalo


concentramento (clustering) dei casi e di correlare il clustering con eventuali fattori di rischio.
Questa possibilit pu risultare molto utile nello studio delle cause di malattia a tutti i livelli, da
quello del singolo allevamento fino a quello internazionale.
353

13. Pattern di
malattia
13.2 Il teorema della soglia di Kendall

OBIETTIVO:

illustrare, per mezzo di un esempio, il teorema della soglia di Kendall

La propagazione di una epidemia di una malattia che si trasmette per contatto condizionata
dall'esistenza di una densit minima di animali.

Il livello minimo di densit (livello di soglia) stato definito in un modello matematico detto
Teorema della Soglia di Kendall.

Nella figura illustrato il teorema con un esempio che si riferisce alla rabbia in una popolazione di
volpi. Al di sopra una certa densit di animali recettivi, una volpe ammalata pu infettare, in media,
pi di una volpe recettiva. Ci provoca un aumento progressivo del numero di volpi colpite dalla
malattia, e quindi ha origine una epidemia.
Pi elevata la densit degli animali, maggiore la probabilit, per una volpe ammalata, di riuscire
ad infettarne altre; quindi, pi ripida sar la fase di progressione della curva epidemica.
Al contrario, nel caso in cui ogni volpe rabida riesca a contagiare, in media, meno di 1 volpe
recettiva, si assister all'estinzione spontanea dell'epidemia. In uno scenario di questo tipo, il
numero di nuovi casi decresce col passare del tempo; inoltre, gli animali colpiti vengono a morte, e
quindi la malattia si esaurir in un tempo pi o meno lungo.
354

Il modello, cos come illustrato qui, molto schematizzato e non tiene conto di numerosi altri fattori
che, in alcune situazioni, possono influenzare la trasmissione della malattia all'interno di una
popolazione. Tuttavia, in casi particolari come quello della rabbia ora esemplificato, esso si
rivelato adeguato nel predire l'andamento della diffusione della malattia.

Purtroppo, pochi valori di soglia sono noti riguardo alle malattie degli animali; ad esempio, stato
calcolato che una densit minima di 12 cani/km2 necessaria perch possa comparire una epidemia
di una malattia virale del cane: la parvovirosi.
355

13. Pattern di
malattia
13.3 Andamento delle epidemie

OBIETTIVO:

illustrare un esempio di andamento tipico della diffusione di una malattia in una popolazione

Nello schema soprastante illustrato l'andamento di una tipica epidemia che si verifica quando un
agente infetta una popolazione costituita da animali pienamente recettivi.

Ogni cerchio rappresenta un animale infetto; le linee nere indicano l'avvenuto trasferimento
dell'infezione da un animale all'altro. I cerchi rossi rappresentano gli animali che riescono a
trasmettere il contagio ad altri animali. I cerchi blu simboleggiano gli animali che non sono riusciti
ad infettarne altri.

Durante il I periodo, la maggior parte della popolazione suscettibile (curva rossa), e quindi la
malattia ha modo di diffondersi facilmente negli individui della popolazione. Contemporaneamente,
si assiste ad un lieve incremento dell'immunit di popolazione, dovuta ai soggetti che si sono
infettati e successivamente si sono immunizzati; l'andamento dell'immunit di popolazione nel
tempo rappresentata dalla curva blu sull'asse cartesiano.
356

Nel grafico, le curve della immunit di popolazione e della recettivit di popolazione indicano la
proporzione di animali della popolazione che, in rapporto al tempo, risultano rispettivamente
immuni o suscettibili alla malattia.
In altre parole, la curva blu rappresenta il tasso di immuni e la curva rossa il tasso di recettivi.

Durante il II periodo, il numero di animali suscettibili diminuisce: ci la conseguenza del fatto


che quelli ammalatisi durante il I periodo sono morti oppure sono passati nella categoria degli
"immuni". Pertanto, aumenta il numero di infetti che, non avendo sufficienti contatti con animali
recettivi, non riescono a trasmettere il contagio (cerchi blu); tuttavia, la malattia si manifesta ancora
con discreta frequenza, in quanto i recettivi sono ancora relativamente numerosi. L'immunit di
popolazione continua a crescere.

Nel III periodo l'immunit di popolazione raggiunge il massimo livello. Il numero di contagianti si
fa via via pi basso, il numero di immuni pi, e quindi l'epidemia si esaurisce spontaneamente.

Il modello ora utilizzato semplicistico, in quanto presuppone una popolazione inizialmente del
tutto recettiva e tiene conto - in sostanza - soltanto della variabile immunit di popolazione.
Tuttavia, necessario ricordare che i fattori associati alla diffusione delle infezioni sono numerosi
ed interagiscono fra loro e con altre variabili ambientali, per somma o sinergismo, formando un
mosaico di grande complessit.
Fra i pi rilevanti, sono da ricordare alcuni fattori legati all'ospite ( recettivit, contagiosit, vie di
escrezione, periodo di incubazione), altri legati all'agente ( infettivit, virulenza, stabilit) ed,
infine, altri legati alla efficienza del contatto.

In alcuni casi, la frequenza della malattia ha un andamento temporale particolare, con fluttuazioni
abbastanza prevedibili. Nota che, in questi casi, non si tratta di epidemie, in quanto nel concetto di
epidemia insita la imprevedibilit dell'evento.
Le malattie che vengono trasmesse da punture di vettori (insetti e artropodi) hanno una forte
predilezione per i mesi caldi (estate ed inizio autunno) in corrispondenza con la maggiore attivit
dei vettori.
Anche malattie non trasmesse da artropodi o insetti possono manifestare un andamento stagionale,
come la leptospirosi nell'uomo in alcune aree geografiche: la frequenza della malattia subisce un
aumento in corrispondenza delle stagioni calde (estate-autunno). Ci dipende dalle caratteristiche
dell'agente e da motivi legati al comportamento dell'uomo, che durante la buona stagione buone
trascorre pi tempo all'aperto ed ha maggiori probabilit di infettarsi per contatto con animali
357

portatori.
Anche la malattia di Lyme, una malattia dell'uomo trasmessa da una zecca, viene di solito contratta
d'estate, quando le zecche sono pi attive e le persone trascorrono molto tempo all'aperto e senza
indumenti protettivi.
Nel diagramma che segue illustrato l'andamento stagionale della leptospirosi negli U.S.A.

In altri casi, le fluttuazioni avvengono in tempi pi lunghi. In tal caso si parla di andamento
secolare.
La registrazione della frequenza di casi di malattia in una popolazione per un lungo periodo (anni)
utile, oltre che conoscere meglio la storia naturale della malattia, anche per prevederne la probabile
incidenza futura e per pianificare i pi appropriati
programmi di controllo o prevenzione.

ESEMPIO.
Nell'uomo la epatite virale si manifestata fino al 1968
con cicli della durata di circa 7 anni.
Una spiegazione di questo fenomeno che la popolazione
va incontro a modificazioni della suscettibilit, e che
l'incremento della frequenza corrisponde ad un aumento
della recettivit. Poi, quando molti individui sono stati
infettati, si instaura una immunit di popolazione che
provoca un regresso della frequenza delle infezioni.
358

13. Pattern di
malattia
13.4 Epidemie a sorgente comune e a propagazione

OBIETTIVO:

evidenziare le caratteristiche differenziali tra epidemie a sorgente comune ed epidemie a


propagazione

In alcune situazioni, tutti i casi (intendendo per caso il singolo animale ammalato) hanno
origine da una stessa causa (es. un animale infetto o un alimento contenente un agente patogeno).
Una epidemia di questo tipo viene detta epidemia a sorgente comune.
Se il periodo di esposizione breve, allora l'epidemia con sorgente comune detta epidemia
puntiforme o, meno bene, puntuale (in inglese: point source), e tutti i casi si verificano,
all'incirca, entro un lasso di tempo corrispondente al periodo di incubazione. Tipiche epidemie a
sorgente comune e con breve periodo di incubazione sono le tossinfezioni o intossicazioni
alimentari che derivano dall'assunzione, da parte di una collettivit, di alimenti contaminati da
patogeni. Nell'uomo questo evento si pu verificare, ad esempio, in occasione di pranzi di nozze
oppure attraverso un alimento distribuito in una mensa.
Nel grafico viene appunto illustrato l'andamento di una epidemia originata da una tossinfezione
alimentare, in cui il periodo di esposizione alla causa breve (e corrisponde alla durata del pasto);
nell'esempio si vede come il periodo di incubazione corrisponda sia compreso fra 10 e 18 ore circa.
Tipicamente, tutti i casi di una epidemia puntiforme si verificano entro un lasso di tempo
corrispondente al periodo di incubazione dell'agente in causa.
359

Una epidemia a propagazione , invece, quella causata da un agente che viene escreto
inizialmente da uno o pi casi primari, e quindi si propaga nel tempo ad individui recettivi che
costituiscono casi secondari. Uno dei casi primari spesso il caso-indice, cio il primo che stato
notato dagli investigatori.

L'intervallo di tempo fra picchi di successivi picchi o grappoli (cluster) temporali di casi, che
separa i casi primari da quelli secondari, riflette il periodo di incubazione della malattia.

L'andamento delle curve epidemiche, all'interno di una popolazione definita e soggetta a variabili
note, pu essere descritto attraverso modelli matematici. Uno dei modelli di base pi noto quello
di Reed e Frost.
360

13. Pattern di
malattia
13.5 Il sistema informativo WAHID

OBIETTIVO:

far conoscere l'esistenza di uno strumento di importanza fondamentale in epidemiologia


veterinaria: il sistema informativo WAHID dell'OIE

Nella tua futura attivit professionale di medico veterinario, ti capiter sicuramente di dover
rispondere ad interrogativi riguardo:

alla presenza o all'assenza di una determinata malattia in una data regione o area geografica;
all'esistenza di eventi epidemiologici eccezionali;
al numero di casi di zoonosi osservati;
ai nominativi laboratori di referenza per la diagnosi di una specifica malattia;
ai focolai di malattia in corso;
alle misure di controllo adottate dagli Organismi preposti;
al confronto - a scopo commerciale - della situazione sanitaria di Paesi diversi;
ecc. ecc.

Le domande ora esposte interessano non soltanto i veterinari che si occupano di sanit pubblica o
quelli inquadrati nelle ASL oppure negli Istituti Zooprofilattici ecc., ma anche i professionisti
esercitano la clinica dei grandi o piccoli animali.
Ad esempio, il proprietario di un cane presentato per un controllo nel tuo ambulatorio, e che dovr
compiere un viaggio in Grecia e Turchia, potrebbe chiederti se in questi Stati presente la rabbia.
Dove trovare una risposta attendibile, come quella mostrata nella figura che segue? Lo apprenderai
in questa stessa unit!

.
361

Oggi possibile rispondere a tutte le domande elencate sopra (ed a molte altre riguardanti lo stato
sanitario delle popolazioni animali) ed ottenere le informazioni desiderate, aggiornate in tempo
reale e riguardanti tutto il mondo. Ci avviene attraverso l'interrogazione di un database dell'OIE.
Questa sigla deriva dalla denominazione "Office International des Epizooties" (www.oie.int): fin
dai primi anni del secolo scorso era emersa la necessit di combattere le malattie degli animali a
livello mondiale, e ci condusse alla creazione dell'OIE attraverso un accordo internazionale
firmato nel 1924. Nel 2003 l'"Office" ha cambiato la sua denominazione in quella attuale "World
organisation for animal health" (Organizzazione mondiale per la Salute Animale), mantenendo per
la storica sigla OIE.

L'OIE l'organizzazione intergovernativa responsabile del miglioramento della salute degli animali
in tutto il mondo, riconosciuta come organizzazione di riferimento da parte dell'Organizzazione
Mondiale del Commercio (OMC). Nel 2010 contava 177 Paesi membri.

A partire dal 2007, l'OIE ha reso disponibile l'interfaccia WAHID (World Animal Health
Information Database), che permette di interrogare un database mondiale di informazione
zoosanitaria, liberamente accessibile a partire dal sito dell'OIE oppure all'indirizzo
www.oie.int/wahid.

L'interfaccia WAHID consente di accedere a tutte le informazioni disponibili sulle malattie animali,
zoonosi comprese, segnalate da Paesi, suddivise per regioni, per mese e per anno. L'interfaccia
permette di ottenere anche moltissime altre informazioni, come ad esempio quelle sulla consistenza
delle popolazioni animali a livello nazionale o regionale, oppure mappe epidemiologiche che
descrivono la distribuzione delle malattie animali nel mondo, o ancora strumenti per comparare la
situazione sanitaria di Paesi diversi ecc..

E' impossibile descrivere a parole tutti i contenuti e le potenzialit di WAHID. Oltre tutto,
dilungarsi sulle potenzialit di WAHID sarebbe molto noioso. Ti consiglio di visitare il sito
WAHID: in una decina di minuti potrai renderti di persona che la quantit e la qualit delle di
informazioni disponibili sono davvero straordinarie.

Qui di seguito, soltanto a titolo di esempio, inserisco la sintesi dei risultati di qualche semplice
interrogazione.
362

Eventi epidemiologici eccezionali in Italia nel 2010


363

Casi di zoonosi denunciati in Italia nel 2010


364

Distribuzione della tubercolosi bovina nel mondo, gennaio-giugno 2010


365

Possibili rischi legati all'importazione di animali dall'Austria (al 2 gen 2011)


366

14. Modelli
matematici
14.1 I modelli in epidemiologia

OBIETTIVO:

apprendere lo scopo e le caratteristiche di un "modello"

costruire un semplice modello

Un modello una rappresentazione che contiene la struttura essenziale di un oggetto o un processo


o un evento reale. La rappresentazione pu assumere due forme diverse:

1. forma fisica (come ad esempio il modello di un aereo o di un edificio)


2. forma simbolica (come nel linguaggio naturale, o in una simulazione al computer o in una serie di
equazioni matematiche).

Caratteristiche importanti dei modelli sono le seguenti:

i modelli sono necessariamente imperfetti

Proprio perch si tratta di una rappresentazione, il modello non pu includere ogni aspetto della
realt. Prima di creare un modello, necessario fare alcune assunzioni sulla struttura essenziale e le
correlazioni fra gli eventi (o gli oggetti) nel mondo reale.
Per esempio, uno studioso del comportamento potrebbe voler costruire
un modello riguardo al tempo necessario ad un topo per attraversare
un labirinto alla ricerca del cibo. Nella costruzione del modello si
potrebbero includere fattori diversi, come ad esempio il tipo di cibo
offerto, la preventiva conoscenza del labirinto da parte dell'animale, il
tempo trascorso dall'ultimo pasto. Altri fattori, ritenuti poco importanti
o ininfluenti ai fini della "struttura essenziale" del fenomeno da
studiare (es. il sesso del topo, l'ora del giorno in cui viene eseguito
l'esperimento ecc.) potrebbero invece essere esclusi dal modello.
I fattori, noti o ignoti, che non vengono inclusi nel modello (perch non sono presi in
considerazione, oppure sono ritenuti poco influenti o secondari) possono ridurre la capacit
predittiva del modello stesso, nel caso essi esercitino invece un influsso sul fenomeno in studio.

i modelli possono essere manipolati e modificati con relativa


facilit

Il disegnatore di un aliante costruisce fisicamente un modello di una


nuova forma delle ali e ne saggia le caratteristiche nella galleria del
vento. In base ai risultati ottenuti, la forma viene modificata ed il
modello viene sottoposto a un nuovo test nella galleria del vento. Si
esaminano di nuovo i risultati e si apportano le modifiche ritenute utili, e cos via.
La manipolazione dei modelli che vengono costruiti, anzich in forma fisica, in forma simbolica
367

(modelli matematici) ancora pi facile: molto spesso sufficiente modificare il valore di una
variabile o di una costante, o ritoccare un'equazione, oppure modificare i dati di input ecc.

La creazione di un modello inizia con una attenta osservazione del fenomeno in studio e poi,
eventualmente, anche sulla sua manipolazione, osservandone gli effetti ed anche utilizzando il
metodo scientifico di falsificazione dell'ipotesi. Tutte le osservazioni vengono interpretate per
cogliere gli aspetti pi importanti del fenomeno, tralasciando quelli ritenuti marginali. Poi, si
costruisce il modello, lo si fa "funzionare" e si controlla se-e-quanto i risultati ottenuti
corrispondono con la realt. Infine, il modello viene riconsiderato e modificato per renderlo ancor
pi efficiente, e cos di seguito.

Qual l'utilit di un modello? La risposta abbastanza ovvia: la rappresentazione di un processo


per mezzo di un modello, pur essendo semplificata rispetto alla realt, si rivela utile per individuare
il funzionamento intimo del processo medesimo. In effetti, l'uso dei modelli ci permette di eliminare
(almeno in teoria!) tutte le caratteristiche non significative del fenomeno e concentrarci soltanto
sugli aspetti importanti.

Ad esempio, esistono modelli che illustrano le associazioni e le interazioni tra i determinanti di


malattia (modelli causali); si veda in proposito quello gi illustrato a proposito della causalit
delle associazioni.

In epidemiologia i modelli fisici, ossia che riproducono in scala un qualche oggetto fisico (es. il
modellino di una scuderia o di una stalla) non vengono utilizzati. Ci si avvale invece dei cosiddetti
"modelli matematici". Un modello matematico un modello simbolico costituito da una equazione
(o una serie di equazioni) che prende in considerazione i diversi parametri che sono sono
coinvolti nella genesi e nella evoluzione del fenomeno studiato (in genere: la malattia).

In buona sostanza, un modello matematico pu essere considerato alla stregua di un "elaboratore


specializzato" di informazioni: l'utilizzatore introduce i dati di input, il modello li macina
effettuando i calcoli previsti ed, infine, restituisce i dati di output.
368

ESEMPIO. Costruiamo un semplice modello.


Consideriamo una popolazione virtuale composta da infiniti animali che vivono all'infinito.
Supponiamo che al tempo t 0 essi siano tutti esenti dalla malattia M. Al tempo t 1 aggiungiamo alla
popolazione un numero D 1 di individui con una malattia contagiosa M che si trasmette da 1 animale
ammalato ad 1 animale sano in 1 unit di tempo.
Assumiamo D 1 =10; allora, al tempo t 2 gli animali ammalati saranno 20, a t 3 saranno 40, a t 4
saranno 80 e cos via.
Il numero di animali ammalati viene riprodotto dalla seguente equazione:

Per mezzo del modello possiamo prevedere la diffusione nel tempo della malattia all'interno della

popolazione:

Ora perfezioniamo il modello, supponendo che la malattia sia capace di provocare la morte del 30%
degli animali colpiti entro 1 unit di tempo dopo l'infezione. Allora si verificher la seguente

situazione:

Adesso il numero di animali ammalati presenti in un dato istante t n all'interno della nostra
popolazione-modello pu venire calcolato come:

In epidemiologia i modelli sono costruiti per scopi diversi: ad esempio, prevedere l'andamento di
una malattia in determinate condizioni oppure prevedere l'effetto sulla prevalenza o
sull'incidenza qualora vengano adottare determinate misure di controllo. Un buon modello permette
di simulare "a tavolino" (o meglio: davanti al display di un computer) ci che avverr in natura (o
nell'allevamento) e quindi pu rappresentare un utilissimo strumento nello studio delle malattie.
369

In tempi recenti, modelli matematici sono stati utilizzati frequentemente per analizzare i rapporti
costi/benefici di azioni di profilassi di molte malattie degli animali.

Il rapporto costi/benefici deve essere sempre tenuto presente quando si effettuano azioni di
profilassi, controllo, eradicazione ecc. a tutti i livelli (dal singolo allevamento fino alle grandi
profilassi su scala nazionale).
Un intervento sanitario su popolazioni pu essere
efficace oppure
efficiente

Attenzione a non confondere questi due attributi, che non sono sinonimi. Infatti, dato un certo
intervento sanitario con un dato obiettivo, si dice che l'intervento "efficace" quando esso
"funziona", cio consente di raggiungere il risultato voluto. Un intervento "efficiente" invece
qualcosa di pi: esso consente di raggiungere il risultato voluto, ma utilizzando un dispendio
minimo di risorse.
Una azione sanitaria efficiente (e quindi "buona" sotto tutti gli aspetti), quando la somma dei costi
delle risorse impiegate (personale, laboratori, attrezzature, vaccini, farmaci, indennizzi agli
allevatori, restrizioni nel commercio ecc. ecc.) inferiore alla somma dei benefici ottenuti
(abbassamento della mortalit, aumento della produttivit, tutela della salute dell'uomo ecc. ecc.).
Insomma, efficienza significa ...massima resa, minimo sforzo!
Naturalmente, il rapporto costi/benefici dovr sempre essere inferiore ad 1; ci particolarmente
vero per i grandi piani su scala nazionale (es. brucellosi, tubercolosi ecc.) che assorbono risorse
ingenti e quindi comportano costi ingenti a carico della collettivit.

ESEMPIO. Supponi che un ipotetico piano di lotta contro la


poliomielite dell'uomo (malattia che colpisce soltanto durante
l'infanzia) preveda la vaccinazione di tutta la popolazione (adulti e
bambini). Poich sono disponibili vaccini che inducono una protezione
eccellente, il piano sar senz'altro efficace, in quanto la frequenza della
malattia verr notevolmente ridotta dall'intervento immunizzante.
Tuttavia, il piano avrebbe potuto essere anche efficiente se fossero stati
vaccinati soltanto i soggetti a rischio, ossia i bambini, evitando l'inutile e costosa immunizzazione
degli adulti.

Dopo questa breve parentesi sui costi/benefici, torniamo ai nostri modelli.


Un modello tanto migliore quanto meglio "mima" quanto succede (e prevede quanto succeder...)
nella realt. Per valutare a priori (e sempre con grande approssimazione!) la bont di un modello, si
possono considerare i seguenti interrogativi:

il modello costruito con "buon senso", ossia rispettoso delle conoscenze sulla storia naturale
della malattia?
il modello prende in considerazione tutti i determinanti che sono associati alla malattia?
a ciascuno dei determinanti considerati viene assegnata una importanza relativa adeguata? Il
valore di ciascun determinante gi noto, oppure pu essere stimato precisione accettabile?

Si comprende facilmente che la costruzione di un buon modello un procedimento difficile; basta


pensare a quanto gi detto sulla variet dei determinanti, sulla problematicit della loro
quantificazione e sulla complessit delle interazioni tra i determinanti e l'ospite.
L'utilit pratica di un modello epidemiologico non assoluta; ad esempio, si ritiene che, almeno per
ora, non si possano pianificare le strategie di controllo di una malattia sulla base soltanto delle
370

previsioni fornite dai modelli. Tuttavia, essi possono essere molto preziosi se usati in aggiunta ai
metodi epidemiologici pi tradizionali (v. epidemiologia descrittiva e epidemiologia analitica).

I modelli matematici possono essere classificati in diversi modi. Una classificazione prevede la
suddivisione dei modelli in descrittivi o prescrittivi.
I modelli descrittivi sono quelli che forniscono una descrizione (o anche una previsione) del
funzionamento attuale (o futuro) di un fenomeno.
I modelli prescrittivi offrono informazioni utili per prendere decisioni al fine di influenzare
l'andamento di un fenomeno.
Dunque, un modello descrittivo descrive i meccanismi che sottostanno ad un fenomeno, mentre un
modello prescrittivo aiuta ad assumere una decisione (il minor costo, i migliori benefici ecc.).
logico supporre che nello studio di un fenomeno (es. una malattia) vengano dapprima messi a punto
modelli di tipo descrittivo e soltanto in un secondo tempo modelli di tipo prescrittivo.

Un altro tipo di classificazione, pi interessante ed attuale, riguarda la capacit dei modelli di tener
conto dell'effetto del caso e della variabilit dei dati di input. Su questa base i modelli possono
essere classificati come "deterministici" o "stocastici". Questo argomento viene trattato nella
prossima unit.
371

14. Modelli
matematici
14.2 Modelli deterministici e modelli stocastici

OBIETTIVO:

differenziare, anche con l'aiuto di un semplice esempio, un modello deterministico da un modello


stocastico

Una delle classificazioni pi attuali dei modelli matematici utilizzati nei diversi settori delle
Scienze, compreso quello dell'epidemiologia, prevede l'inquadramento nelle seguenti due tipologie:

1. modelli deterministici
2. modelli stocastici

I modelli deterministici sono i pi semplici; in essi, le variabili di input assumono valori fissi. E'
vero che i risultati (output) generati da questi modelli possono tener conto, entro certi limiti, della
variabilit e dell'effetto del caso (ad esempio, con appropriati metodi statistici possono essere
calcolati gli intervalli di confidenza); tuttavia, si tratta sempre di elaborazioni di tipo
deterministico, in quanto non si tiene in considerazione l'incertezza associata alle variabili di input.

L'ideale deterministico, tipico della cultura dell'era newtoniana, prevede che i fenomeni naturali
possano essere considerati in una logica basata sul presupposto che ogni evento sia ricollegabile ad
una causa che lo provoca. Sulla base di questo principio, formalizzato inizialmente da Laplace
(1749-1827), molti scienziati ritennero che, una volta noto lo stato iniziale di un sistema e le forze
agenti su di esso, fosse possibile individuare con precisione pressoch assoluta l'evolversi del
sistema applicando le leggi della meccanica newtoniana. Pertanto, si riteneva che fosse possibile,
almeno in via di principio, ottenere metodi di misura cos precisi da eliminare ogni
indeterminazione sui valori misurati.
Attualmente questo approccio stato abbandonato, in quanto incompatibile con il "principio di
indeterminazione di Heisenberg", a favore della concezione probabilistica introdotta dalla
meccanica quantistica.

Al contrario, i modelli stocastici (stocastico = dovuto al caso, aleatorio, dal greco


stochastiks=congetturale) tengono in considerazione le variazioni (causali e non) delle variabili di
input, e quindi forniscono risultati in termini di "probabilit". importante sottolineare che ci che
differenzia i modelli deterministici da quelli stocastici che in questi ultimi si tiene conto della
variabilit dei dati di input.

In genere i modelli stocastici hanno una struttura pi complessa di quelli deterministici. Di


maggiore complessit sono i calcoli, che vengono eseguiti sempre con l'ausilio del computer.
Esistono anche applicazioni dedicate specificamente a questo scopo, fra le quali una delle pi note
"@RISK" (Palisade Corp.).

Ovviamente i modelli stocastici sono anche pi affidabili in quanto, proprio perch tengono conto
del caso, sono capaci di fornire risultati pi aderenti alla realt.
372

Un esempio di modello deterministico e di modello stocastico

Supponiamo che, in base ad un nostro semplice ed immaginario modello, la incidenza di una


malattia sia desumibile dal prodotto di due sole variabili, v 1 e v 2 , ciascuna delle quali pu assumere
un valore compreso fra 0 e 1. Possiamo allora creare il seguente modello:

Purtroppo non conosciamo con esattezza il valore di v 1 e v 2 , anche perch nel "mondo reale" questi
valori sono soggetti a variazioni. Abbiamo per elementi che testimoniano che v 1 pu oscillare fra
0.2 e 0.3 e che v 2 pu oscillare fra 0.4 e 0.6.
L'approccio deterministico molto semplice. Ad esempio, la cosa pi ragionevole potrebbe essere
quella di utilizzare come input del modello i valori medi di v 1 e v 2 per calcolare uno scenario
"medio"; alternativamente si potrebbero scegliere i valori estremi per calcolare il migliore o il
peggiore scenario. Si otterrebbero rispettivamente i seguenti valori di incidenza:
scenario medio: i 1 = 0.25 * 0.5 = 0.125 = 12.5%
scenario migliore: i 2 = 0.2 * 0.4 = 0.08 = 8%
scenario peggiore: i 3 = 0.3 * 0.6 = 0.18 = 18 %
Il limite del modello che fra le possibilit calcolate (migliore e peggiore) ve ne sono infinite altre
che, per quanto possiamo dedurre dal modello, sono tutte egualmente probabili.

L'approccio stocastico tiene invece conto della variabilit delle due variabili di input, i cui valori
potrebbero assumere - ad esempio - una distribuzione simile a quella indicata nei due grafici
sottostanti (generati con @Risk) ove le barre orizzontali sotto agli istogrammi indicano il 5 ed il
95 percentile.
373

Successivamente, il calcolo dell'incidenza viene effettuato attraverso una simulazione con il metodo
"Montecarlo". In pratica, il programma ha estratto a caso, tenendo conto delle suddette distribuzioni
di frequenza, un valore per v 1 ed un valore per v 2 . I due valori sono stati moltiplicati fra loro,
ottenendo un valore di incidenza. Questo processo di estrazione e moltiplicazione di coppie di
valori stato ripetuto per centinaia di volte, ottenendo centinaia di valori diversi di incidenza, che
sono stati utilizzati per generare la seguente distribuzione di frequenza.

Nota che il valore medio dell'incidenza (0.124) analogo a quello medio ottenuto con il modello
deterministico. Con il modello stocastico, si ha l'incomparabile vantaggio di poter prevedere - su
base probabilistica - l'intera gamma di possibilit di andamento del fenomeno in studio. Ad
esempio, dall'istogramma della distribuzione per incidenza si pu desumere che: (1) la probabilit
che l'incidenza sia <0.1023 del 5%; (2) la probabilit che l'incidenza sia >a 0.1488 del 5%; (3) la
probabilit che l'incidenza sia compresa sia compresa fra 0.1023 e 0.1488 del 90%.
374

14. Modelli
matematici
14.3 Il modello di Reed e Frost

OBIETTIVO:

acquisire una conoscenza di base del classico modello deterministico di Reed e Frost e
verificarne l'efficienza attraverso lo studio di una serie di esempi

L'aspetto di una curva epidemica in una epidemia a propagazione - all'interno di una data
popolazione - pu essere definito su base matematica, attraverso l'impiego di modelli. Uno dei
modelli di base pi famosi quello di Reed e Frost. Si tratta di un modello deterministico che oggi
assume un'importanza soltanto storica, via via che vengono messi a punto modelli pi sofisticati,
ma ha il pregio di essere facilmente comprensibile e quindi molto utile a scopo didattico per la
comprensione della intima "essenza" di un modello.
Il modello di Reed e Frost stato soggetto ad ampiamenti, affinamenti e modifiche.
Nella sua forma originaria pi semplice, che viene proposta qui a scopo didattico, prevede una
suddivisione della popolazione in 3 gruppi, comprendenti animali (1) infetti, (2) recettivi e (3)
immuni. Inoltre, previsto che ogni animale infettato si ammali (cio diventi un caso) e poi
guarisca e diventi immune (cio resistente ad una reinfezione). Perci questo modello rientra fra i
modelli detti "SIR" (Susceptible, Infected, Resistant).
Inoltre, il modello assume che: la malattia si trasmette con un'unica modalit; il periodo di
incubazione fisso; tutti gli animali si distribuiscono a caso nella popolazione e quindi sono
soggetti alla stessa probabilit di venire a contatto con animali ammalati; la popolazione chiusa
(non c' ingresso di animali dall'esterno); le condizioni rimangono costanti per tutta la durata
dell'osservazione.

Secondo il modello, l'andamento della curva epidemica e l'immunit di popolazione dipendono (a)
dal numero complessivo di individui che costituiscono la popolazione, (b) dal loro stato
(contagianti, recettivi ed immuni) e (c) dalla capacit della malattia di trasmettersi da un individuo
all'altro.
375

Supponendo breve il periodo di contagiosit degli animali infetti, e supponendo costante il


periodo di incubazione, allora, partendo con un caso singolo (o con pi casi con infezione
contemporanea), i nuovi casi si svilupperanno in una serie di stadi.

Il modello viene costruito utilizzando la seguente formula:

La durata dell'unit di tempo t viene di solito fatta coincidere con il periodo di incubazione o di
latenza.
Il valore q corrisponde a (1-p) dove p=probabilit, per un dato individuo, di avere un contatto
efficiente con un altro individuo, in modo che si verifichi infezione se l'uno era recettivo e l'altro
infettante. Il valore di p esprime una probabilit; esso quindi compreso fra 0 e 1. poich p la
probabilit di contrarre infezione, q (ossia (1-p)) la probabilit di non contrarre infezione.
Naturalmente il valore di p dipende da una variet di fattori e non facile da determinare. Di solito
p viene stimato empiricamente mediante osservazione di epidemie reali.

Simulazione di una epidemia con il modello di Reed e Frost

Supponiamo che inizialmente (tempo 0) la nostra popolazione sia costituita da 199 animali recettivi,
1 caso e 0 immuni. Pertanto

S t0 =199
C t0 =1

Supponiamo che la probabilit di avere un contatto efficiente sia pari a 0.06. Quindi

p=0.06
q=1-0.06=0.94

Al tempo t+1:

C t1 = 199(1-0.941)=12

S t1 =199-12=187

Al tempo t+2

C t2 =187(1-0.9412)=98
376

S t2 =187-98=89

e cos via.

Il numero di animali immuni a ciascun tempo il totale cumulativo degli animali infetti durante il
periodo precedente. Quindi al tempo t+1 il numero di animali immuni :

I t1 =1

al tempo t+2

I t2 =12+1=13

e cos via.

Nella figura sottostante sono riportati i dati ottenuti dal modello di Reed e Frost con i parametri in
esempio, per l'intera durata dell'epidemia.

Dall'esame del modello si evince che la probabilit che si verifichi un'epidemia e l'aspetto della
curva epidemica sono funzioni del contatto efficiente e del numero di animali recettivi.
La proporzione di una popolazione che risulta recettiva viene usata spesso come guida generale
della probabilit di diffusione di un'infezione. Si ritiene che - in genere e con larga approssimazione
- almeno il 20-30% della popolazione debba essere recettiva perch abbia luogo una epidemia. Ne
consegue che l'infezione non diffonder se il 70-80% della popolazione immune.
Questo utile a prevenire epidemie di grandi dimensioni, tuttavia, da notare che l'infezione potr
diffondere ugualmente, anche in presenza di una elevata immunit di popolazione, se il numero di
animali recettivi tale che

(p * St) > 1

Negli esempi che seguono sono riportate alcune curve epidemiche simulate su popolazioni
numericamente diverse ed utilizzando parametri diversi per il rapporto immuni/recettivi e per la
probabilit di contatto efficiente.

ESEMPIO 1. C=1 S=999 I=500 p=0.005


377

ESEMPIO 2. C=200 S=800 I=0 p=0.005

ESEMPIO 3. C=1 S=99999 I=0 p=0.001

ESEMPIO 4. C=50 S=190 I=760 p=0.004

ESEMPIO 5. C=500 S=1000 I=4500 p=0.06

Foglio di calcolo per Microsoft Excel che fornisce una rappresentazione grafica di un modello di
Reed e Frost, con parametri che possono essere variati a piacere.
378

14. Modelli
matematici
14.4 Infezione da Neospora caninum nel bovino: un modello matematico

OBIETTIVO:

apprendere come si possa utilizzare un modello matematico per prevedere l'andamento


dell'infezione da Neospora caninum in una popolazione bovina e per individuare le misure di
controllo pi efficaci

Per una migliore comprensione del modello, consigliabile conoscere gli elementi essenziali
dell'infezione. Vedi: L'infezione da Neospora caninum nel bovino: una breve sintesi

La presente unit didattica basata sul seguente lavoro: N. P. French, D. Clancy, H. C. Davison
and A. J. Trees - Mathematical models of Neospora caninum infection in dairy cattle: transmission
and options for control. International Journal for Parasitology, 1999, 29, 1671-1704.
Il documento full-text accessibile [solo per gli utenti dell'Universit di Parma - dominio: unipr.it]
in Internet via ScienceDirect nel formato HTML o nel formato PDF.
[Equazioni e dati utilizzati con il permesso degli Autori].

Il modello usa un sistema di equazioni differenziali per descrivere la trasmissione del parassita in
un allevamento di bovini da latte. Secondo quanto finora noto, l'infezione da Neospora canis nel
bovino possiede le seguenti caratteristiche peculiari:

un animale sano oppure colpito da infezione persistente


gli animali si infettano ma non si ammalano - e quindi non guariscono
l'animale che si infettato rimane infetto per tutta la vita
l'infezione non induce immunit protettiva, quindi tutti gli animali non infetti sono recettivi

Nella realt i fattori ora accennati semplificano l'andamento dell'infezione nella popolazione; perci
anche il modello pu essere semplice ed al tempo stesso efficiente. In questa unit didattica viene
illustrata soltanto una parte del modello deterministico descritto dagli Autori, i quali hanno creato
anche un pi complesso modello stocastico.

Il modello deterministico dell'infezione da Neospora prende in considerazione un allevamento in


cui siano presenti bovine infette (il cui numero indicato con Y) e bovine non infette (X).
L'andamento dell'infezione nell'allevamento viene descritto con un modello matematico che
considera i seguenti parametri
379

ro = tasso di natalit

In effetti, nel modello non si utilizza il vero tasso di natalit, ma bens il tasso con cui le manze
vengono aggiunte al gruppo delle bovine in lattazione (ro1 = manze infette; ro2 = manze non
infette). In UK i dati demografici degli allevamenti bovini da latte indicano che ro=0.2. Per
semplicit nel modello non si tiene conto del periodo intercorrente tra nascita e prima lattazione
(2-3 anni); ci consente di mantenere semplice il modello senza influenzarne apprezzabilmente
l'output.

mu = tasso di mortalit/riforma

Rappresenta il tasso annuo con cui le bovine vengono rimosse dal gruppo (mu1= bovine infette;
mu2= bovine non infette) perch muoiono spontaneamente (mortalit) oppure, molto pi
frequentemente, perch non pi produttive (riforma). In UK i dati demografici indicano che
mu=0.3.

fi = trasmissione verticale, per via transplacentare

In base ai dati disponibili, questa probabilit pari a 0.95 (si ritiene che da 100 vacche infette
nascano in media 95 vitelli infetti e 5 vitelli sani).

beta = trasmissione orizzontale all'interno del gruppo

Questo parametro dipende dalla prevalenza dell'infezione. I meccanismi di questo tipo di


trasmissione sono per ora poco noti; uno di essi rappresentato dalla somministrazione ai vitelli di
pool di colostro.

tau = trasmissione orizzontale dall'esterno del gruppo

Anche questa poco conosciuta, e chiama in causa verosimilmente ospiti diversi dal bovino, come
ad esempio il cane.

Il modello funziona secondo lo schema seguente:


380

Nel modello i parametri di natalit e di mortalit/riforma per gli animali infetti possono essere scelti
a piacere; poi, nella elaborazione dei dati, tali parametri vengono mantenuti fissi. Il tasso di
mortalit/riforma deve essere sempre superiore al tasso di natalit (mu1 > ro1), cos come avviene
in realt. Inoltre, per semplicit, si assume che la numerosit del gruppo resti costante; ci si ottiene
lasciando variare liberamente la crescita netta della popolazione non infetta:
ro2-mu2 = ((mu1-ro1)Y)/X

In termini matematici, lo schema sopra riportato viene espresso nella seguente forma:

da cui si vede che il numero di suscettibili X (riquadro verde):

viene aumentato per: (1) nascita di vitelli sani da vacche infette (per i quali la trasmissione verticale
non avvenuta) e (2) nascita di vitelli da vacche non infette
viene diminuito per (1) tasso di mortalit o riforma di animali sani e (2) avvenuta infezione per via
orizzontale
381

Dallo schema si vede anche che il numero di infetti Y (riquadro rosso):

viene aumentato per (1) nascita di vitelli infetti da vacche infette e (2) infezione di animali sani per
via orizzontale
viene diminuito per mortalit o riforma di animali infetti

Le equazioni del modello sono le seguenti:

Il funzionamento e le previsioni che si possono trarre dal modello vengono meglio apprezzate
utilizzando il Foglio di calcolo per Microsoft Excel allegato a questa unit didattica. Qui di seguito
vengono riportati alcuni esempi di grafici (brevemente commentati) dell'andamento della
prevalenza in un allevamento in presenza di valori diversi dei parametri. I grafici sono stati generati
con il predetto foglio di calcolo.
382
383
384

Foglio di calcolo per Microsoft Excel che fornisce una rappresentazione grafica di alcuni aspetti
del modello di French e coll., con parametri che possono essere variati a piacere.

Potrebbero piacerti anche