Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Cap. 1
Introduzione allo studio dell'epidemiologia
1.1.Epidemiologia e malattie dell'uomo negli ultimi 100 anni
OBIETTIVI:
constatare i progressi compiuti dalla medicina umana - per alcune malattie - nell'arco di un
secolo;
Questa prima unit didattica ha una funzione introduttiva e in essa vengono proposti, per sommi
capi, alcuni concetti di base per fornire una idea approssimativa riguardo all'approccio
epidemiologico ai problemi sanitari. Pi in particolare, vi si parla delle malattie nelle popolazioni,
della mortalit nell'uomo e negli animali, dei progressi della medicina, dell'importanza dei dati e
della loro presentazione e interpretazione.
I dati
I dati del diagramma sono stati raccolti dal pi importante Ente internazionale che si occupa di
sanit pubblica: l'Organizzazione Mondiale della Sanit (World Health Organization); essi
rappresentano il numero di morti per alcune forme morbose nel 1900 e nel 1984.
In primo luogo da rilevare l'espressione dei dati numerici sotto forma di diagramma a
barre; questo un tipo di espressione molto utile perch consente di cogliere le
caratteristiche salienti e di effettuare raffronti direttamente a colpo d'occhio (prova per
un attimo a immaginare la minor immediatezza se gli stessi dati fossero presentati in forma tabulare,
e clicca sull'immagine a destra per vedere corrispondente la tabella).
La scala dell'asse orizzontale indica i tassi di mortalit per 100.000 persone e per anno (cio il
numero di morti ogni 100.000 persone in 1 anno per ogni causa considerata). Questo tipo di
espressione (morti/100.000/anno), molto comune in medicina umana, pu essere usato anche in
medicina veterinaria, eventualmente modificando arbitrariamente la scala (es. morti/1000/anno
oppure morti/10.000/mese ecc.) in rapporto alla dimensione numerica della popolazione di animali
in studio e ad altri fattori.
Nel diagramma, le barre rosse forniscono i valori osservati nel 1900, quelle verdi i valori del 1984.
Ad esempio, dal diagramma si desume che nel 1984 sono morte per cancro circa 190 persone su
100.000, mentre nel 1900 ne sono morte - per la stessa causa - soltanto 60 su 100.000.
Puoi facilmente notare che, per le malattie infettive, le barre verdi indicanti la frequenza di morti nel
1984 sono pressoch inesistenti. In altre parole, oggi le malattie infettive rappresentano soltanto una
causa di morte trascurabile. In particolare, enormi progressi sono stati ottenuti soprattutto per quelle
malattie infettive che, in passato, hanno rappresentato un flagello per l'umanit. Basti evocare, fra
gli altri, morbi terribili quali: peste, vaiolo, colera; queste malattie non vengono nemmeno
considerate nel grafico, in quanto gi ai primi del '900 non rappresentavano pi un problema.
Spiccano invece i progressi per altre temibili malattie infettive: tubercolosi, influenza, polmonite,
difterite, gastroenteriti infettive e tutte le malattie dell'infanzia. Molte di queste malattie sono
attualmente pressoch scomparse, almeno nei paesi industrializzati cui il diagramma si riferisce.
Quelle che ancora persistono (es. alcune malattie infantili) non rappresentano pi una causa di
morte.
Ben diversa la situazione in paesi meno sviluppati, come si intuisce facilmente se si considera che
le malattie infettive causano annualmente nel mondo quasi 20 milioni di morti, cio oltre 1/3 di tutti
i decessi.
Una parte importante di questi progressi da attribuire alla epidemiologia ed alla medicina
preventiva
I progressi nella Medicina e nelle condizioni di vita dell'uomo nei Paesi industrializzati sono da
attribuire ad una serie di fattori, fra i quali emergono per importanza: miglioramento
dell'alimentazione, disponibilit di acqua pura, controllo dei vettori, pastorizzazione del latte,
educazione delle madri riguardo all'allevamento dei figli, vaccinazioni, utilizzo di antibiotici,
miglioramento generale dell'igiene e delle condizioni di vita.
In questo scenario, il contributo della medicina veterinaria non stato trascurabile: basti pensare ai
miglioramenti dell'igiene degli alimenti di origine animale ed alla lotta alle malattie che possono
essere trasmesse dagli animali all'uomo.
Anche in Italia la mortalit dell'uomo per malattie infettive e parassitarie, particolarmente elevata
agli inizi del secolo, andata progressivamente riducendosi nel tempo, grazie al miglioramento
delle condizioni igieniche e, recentemente, a una maggiore diffusione delle vaccinazioni ed
all'utilizzo di farmaci sempre pi efficaci.
Nel 1998 si sono registrati, a causa di malattie infettive, solo 0.6 decessi ogni 10.000 uomini e 0.5
decessi per ogni 10.000 donne. A scopo di raffronto, considera che nello stesso anno i morti per
malattie cardiovascolari sono stati 48 (maschi) e 32 (femmine), sempre ogni 10.000 individui.
L'interesse per la mortalit per malattie infettive e parassitarie oggi , quindi, limitato ad alcuni
fenomeni emergenti, quali la recrudescenza della tubercolosi, favorita anche dalla resistenza ai
farmaci tradizionali di alcuni ceppi del batterio (Mycobacterium tuberculosis) agente della malattia.
[Fonte dei dati: ISTAT, Istituto Nazionale di Statistica, www.istat.it].
Come si avr modo di imparare durante il corso degli studi, la diminuzione della mortalit per
malattie infettive avvenuta, seppure in misura pi limitata, anche nel settore veterinario
relativamente agli animali "da compagnia" (i cosiddetti pets); al contrario, un analogo
miglioramento non sembra essersi verificato nel settore dell'allevamento industriale degli
animali "da reddito", ossia quelli allevati come fonte di guadagno (bovini, suini, pollame ecc.) per
i quali le malattie infettive continuano a rappresentare fra le pi importanti cause di danni
economici o di mortalit.
4
Progressi o regressi?
Un'altra osservazione: esaminando il diagramma, si potrebbe dedurre che ai progressi ottenuti nel
caso delle malattie infettive si siano associati dei regressi per altre forme morbose (cancro e
malattie cardiache, per le quali la maggiore lunghezza della barra verde rispetto alla rossa
testimonia che si avuto un incremento della frequenza nel periodo 1900-1984).
Questi regressi sono soltanto apparenti e sono dovuti all'allungamento della vita media della
popolazione avvenuto nel corso del XX secolo. Infatti, per una corretta interpretazione dei dati,
bisogna tener conto che in una popolazione con molti anziani saranno pi frequenti le malattie
tipiche della senilit, quali appunto le neoplasie o le malattie di cuore.
La scienza medica ha fatto molti progressi ed ha prolungato la durata della vita dell'uomo; tuttavia
non si vive in eterno e quindi... di qualche malattia bisogna
pur morire! quindi del tutto logico che le patologie tipiche
degli anziani rappresentino una importante causa di morte in
popolazioni composte da molti individui in et avanzata. Per
effettuare un confronto preciso che annulli l'effetto dell'et, i
dati andrebbero standardizzati in base all'et (pi avanti verr
proposto un esempio di standardizzazione delle misure).
Cap. 1.
Introduzione allo studio dell'epidemiologia
1.2 Interpretazione dei dati... arte o scienza?
OBIETTIVI:
L'epidemiologia viene considerata una scienza "eclettica" con molti punti di contatto con altri
settori di studio: le scienze biomediche di base, le scienze cliniche, la statistica ed anche,
relativamente alla epidemiologia umana, la antropologia, la demografia e la sociologia.
In ogni caso, l'epidemiologia (cos come molte altre discipline scientifiche) si basa sul metodo
scientifico. Il metodo scientifico viene usato nelle scienze naturali a partire dalla "rivoluzione
scientifica" del XVII secolo ed rimasto concettualmente invariato; esso si basa sull'osservazione
dei fenomeni naturali e, in buona sostanza, consiste in un procedimento che avanza per passi
successivi (vedi schema) dalle osservazioni fino alle conclusioni utilizzando un rigoroso sistema di
generazione e verifica della ipotesi.
Non sempre i risultati degli esperimenti conducono nella giusta direzione: occasionalmente i
risultati ingannano, e si traggono conclusioni errate. Per la scienza saggia, si accontenta delle
umane limitazioni degli scienziati e non ne teme gli errori individuali, perch il suo incessante
processo di verifica collettiva le permette col tempo di individuarli ed emendarli.
Comunemente, quando si effettuano indagini epidemiologiche "di routine" nella pratica clinica e su
argomenti gi ampiamente noti, alcuni dei passi del classico metodo scientifico vengono omessi, e
lo schema dell'indagine pu essere riassunto in sole 3 fasi:
I DATI sono numeri (oppure valori non numerici, come ad esempio s o no, malato o sano ecc.), ma
non sono soltanto numeri. I dati sono numeri in un contesto.
Ad esempio, il numero "3.8" o il valore "3.8 kg" in s non portano alcuna
informazione. Ma se veniamo a sapere che una conoscente ha dato alla luce
un bambino del peso di 3.8 kg, allora questo numero assume significato in
uno specifico contesto e, ad esempio, possiamo congratularci per il buon
peso del bambino, indice di presumibile buona salute.
Il contesto implica il possesso di conoscenze sull'argomento, le quali ci consentono di formulare
giudizi. Ad esempio, sappiamo che un bambino alla nascita non pu pesare 450 grammi, n 45 kg.
Il contesto fa s che il numero contenga informazione.
7
Durante la visita clinica di un animale, alcuni dei dati raccolti non sono esprimibili in forma
numerica. Ad esempio, impossibile (o molto difficile) misurare e rappresentare con precisione
attraverso un numero fenomeni come l'entit di una zoppicatura o il dolore provocato da una
manovra di palpazione addominale.
In altri casi, invece, i dati sono esprimibili in forma numerica; ad esempio, il numero di pulsazioni
cardiache al minuto.
I dati purtroppo non parlano da soli, ma vanno interpretati. L'interpretazione, per, non deve essere
lasciata al buon senso soggettivo dello sperimentatore. necessario definire una serie di metodi
formali, accettati dal mondo degli scienziati; questi metodi devono essere usati per l'analisi dei dati,
allo scopo di trarre conclusioni il pi possibili veritiere. La statistica comprende appunto questi
metodi.
Attraverso procedimenti statistici di "analisi", i dati possono essere convertiti dalla forma grezza
iniziale (poco o nulla interpretabile) ad una forma pi comprensibile. Il fatto che, per tutte le
discipline scientifiche che studiano gli organismi viventi, i dati ottenuti attraverso gli esperimenti
oppure raccolti in campo (ossia in natura) non consentono mai di giungere ad una conclusione
con una certezza del 100%. La statistica ci aiuta in maniera oggettiva, numericamente, ad analizzare
8
le diverse ipotesi ed a valutare il grado di incertezza delle conclusioni cui siamo giunti. Ci
significa che lo studio e l'interpretazione dei fenomeni biologici dipendono imprescindibilmente
dalla statistica.
Non devi pensare, per, che il processo di raccolta-elaborazione-interpretazione dei dati sia
puramente meccanico o possa essere in qualche modo automatizzato in tutte le sue fasi. Infatti, sia
nella raccolta che nell'elaborazione che - soprattutto - nell'interpretazione dei dati necessario
ingegno, acume e discernimento, associati ad una profonda conoscenza della storia naturale
della malattia (cio come essa si manifesta e decorre in natura, senza intervento del medico) nonch
di tutte le altre discipline mediche di base (anatomia, fisiologia, patologia generale ecc.). Ed forse
anche per questo che i sistemi di diagnosi computerizzata - ossia i cosiddetti sistemi esperti che
certo costituiscono un utilissimo ausilio diagnostico per casi particolari, come ad esempio gli
avvelenamenti - non possono (ancora?) competere con un buon clinico.
A questo punto potresti chiederti quali sono gli obiettivi pratici ottenibili attraverso la raccolta,
l'elaborazione e l'interpretazione dei dati. La risposta a questa domanda racchiude l'essenza stessa di
tutta l'attivit epidemiologica, e quindi non pu essere esaurita in poche righe. In seguito, verr
accennato ai compiti specifici ed agli scopi pratici della disciplina. Tuttavia, possiamo gi
anticipare che le informazioni sullo stato sanitario di popolazioni animali sono utili ad una ampia
gamma di soggetti, a partire dai semplici proprietari degli animali o allevatori, fino alle Autorit
9
identificare la causa e l'origine delle malattie, soprattutto (ma non soltanto) di quelle
diffusibili;
identificare la presenza di determinate malattie in un territorio;
accertare l'assenza di determinate malattie; questo spesso richiesto dai partner commerciali
(che non intendono correre il rischio di importare nuove malattie in territori indenni
attraverso l'acquisto di animali o di loro prodotti) e vale soprattutto per le malattie
trasmissibili;
individuare la frequenza, o la localizzazione geografica, o l'andamento nel tempo delle
malattie;
valutare l'importanza (sanitaria, economica, zoonosica ecc.) delle malattie esistenti in un
territorio;
determinare le priorit di intervento, tenuto conto delle risorse disponibili;
pianificare ed implementare piani di controllo e sorvegliarne l'andamento;
soddisfare le richieste di informazioni provenienti da organismi internazionali (es. Office
International des pizooties, OIE).
10
Cap. 1.
Introduzione allo studio dell'epidemiologia
2.1 Eventi-chiave nella storia dell'epidemiologia
OBIETTIVO
a scopo di cultura generale, conoscere alcuni eventi e personaggi celebri fra i tanti che hanno
caratterizzato la scienza medica ed hanno gettato le basi della epidemiologia moderna.
mortality"), in cui i dati dei certificati di morte stilati dai ministri del culto vengono riassunti
sotto forma di tavole, percentuali e probabilit. Da esse si evince, ad esempio, l'alta
frequenza di morte nei bambini (1/3 di essi moriva in et <5 anni). E' curioso osservare che,
nonostante gli enormi mutamenti nel modo di vivere, allora come oggi i maschi erano
soggetti a mortalit pi elevata ed a pi bassa morbosit rispetto alle femmine.
Nel 1775 Percival Pott, chirurgo inglese noto per i suoi studi sulla
tubercolosi nonch sulla colonna vertebrale, effettu quello che viene
ritenuto il primo studio di "epidemiologia occupazionale" o di "medicina
del lavoro" riguardante l'alta frequenza di cancro dello scroto negli
spazzacamini.
In precedenza, le malattie legate alle condizioni di lavoro in 50 diversi
mestieri erano stati studiate da Bernardo Ramazzini (1633-1714)
(laureato in medicina a Parma nel 1659) e pubblicate nella sua opera
fondamentale, il De morbis artificum diatriba.
enzootica del bovino ecc.. Inoltre, compaiono nuove malattie o infezioni degli animali,
spesso con caratteri zoonosici (es. infezioni da Salmonella enteritidis del pollame,
encefalite spongiforme del bovino); in qualche caso si assiste alla ricomparsa di malattie
diffusibili ben note e che da anni erano state eradicate da intere nazioni (es. epidemia di afta
epizootica in Gran Bretagna nel 2001).
soprattutto grazie all'applicazione di metodi epidemiologici che le suddette malattie sono
state studiate e controllate con la massima tempestivit possibile, in rapporto alle diverse
situazioni ed alle risorse disponibili.
In tempi recenti si registra la nascita della epidemiologia molecolare che - attraverso
l'interazione con la biologia molecolare - opera soprattutto nel campo delle malattie
croniche, neoplastiche ed infettive; per queste ultime, identifica la sorgente degli agenti di
malattia, le loro relazioni biologiche, i geni responsabili della virulenza, gli antigeni
importanti per la profilassi vaccinale, ed i fenomeni di antibiotico-resistenza.
Cap. 1.
Introduzione allo studio dell'epidemiologia
2.2 Uno studio epidemiologico storico: le epidemie di Colera a Londra nel 1849 e
1853
OBIETTIVI
ESEMPIO. I recenti episodi di quella nuova malattia indicata dai mass-media con la brutta
denominazione di "mucca pazza" (la denominazione corretta : encefalopatia spongiforme del
bovino) sono stati circoscritti tempestivamente e con efficacia - ancor prima di conoscerne l'agente
causale - attraverso misure di controllo scaturite da studi epidemiologici.
Anche se non mancano esempi di studi epidemiologici compiuti in un passato ormai lontano,
l'epidemiologia pu essere senz'altro ritenuta scienza medica giovane. Nel campo della medicina
umana l'epidemiologia considerata scienza a s stante da alcuni decenni; ancor pi recente
l'acquisizione di una mentalit epidemiologica in medicina veterinaria. Si parla qui di mentalit
o di approccio epidemiologico poich non facile stabilire la vera natura dell'epidemiologia, cio
si tratti di disciplina o teoria o di metodologia o addirittura di ideologia. In effetti, come si vedr in
seguito, l'epidemiologia spazia in diversi campi dello scibile umano, adottando anche schemi
derivati dal settore logico-filosofico (per esempio le regole del filosofo John Stuart Mill riguardo
alle cause di malattia).
15
Il colera a Londra
Il momento storico corrisponde alla met del XIX secolo, prima del "periodo d'oro" della
Microbiologia (1879-1900), prima che i batteri venissero riconosciuti come agenti di malattia e
prima della "scoperta" dell'agente del colera dell'uomo (un batterio oggi denominato Vibrio
cholerae). In quel periodo il colera compariva regolarmente in Europa, causando elevata mortalit
oltre a drammatici problemi sociali. Nonostante le conoscenze mediche a quel tempo fossero assai
pi limitate di quelle odierne, era tuttavia noto che:
Dopo una violenta epidemia nel 1832, lo spettro del colera ricomparve a Londra nel 1848,
provocando oltre 15.000 morti. Vennero colpite soprattutto le persone che abitavano nelle povere
case situate al di sotto del livello del Tamigi, lungo le banchine del fiume. La malattia colp con
violenza i quartieri londinesi situati a sud del Tamigi, ed in particolare - cos not Snow - quelli
serviti da due Societ di approvvigionamento idrico: la "Southwark & Vauxhall Water Company"
e la "Lambeth Water Company". L'acqua distribuita da entrambe le societ veniva prelevata
direttamente dal fiume, in una zona prossima al centro della citt.
Vale la pena di ricordare che in quel periodo erano gi relativamente diffusi nella citt i servizi
igienici dotati di acqua corrente, e che fin dal 1830 erano stati messi in funzione i primi impianti
fognari. L'acqua veniva portata alle abitazioni attraverso una fitta rete gestita da alcune aziende
private. Ogni azienda ampliava a propria discrezione la propria rete, anche in concorrenza con altre
aziende, e quindi si era venuta a creare una sovrapposizione di reti idriche tale che lo stesso
quartiere, od anche lo stesso edificio, era sovente servito da due o pi societ.
16
Snow anticipava di 32 anni la "scoperta" del batterio agente del colera (Vibrio cholerae) e di un
decennio la dimostrazione, avvenuta ad opera di Pasteur, che organismi viventi microscopici sono
causa di epidemie. Inoltre, la teoria di Snow contrastava con quella corrente all'epoca, secondo la
quale le malattie venivano trasmesse dall'inalazione di esalazioni (miasmi). Ecco perch le ipotesi
di Snow vennero accolte freddamente dal mondo scientifico e caddero nel vuoto, alla stregua della
miriade di idee disparate, e per lo pi prive di fondamento scientifico, che a quel tempo si
propagavano in occasione di ogni epidemia di colera.
Fra il 1849 ed il 1853 a Londra non vennero segnalati casi di colera. In questo periodo, una delle
due societ dell'acqua (la Lambeth) ristruttur gli impianti, spostando a monte della citt il punto
di rifornimento dell'acqua. L'altra societ (Southwark & Vauxhall) continu a prelevare l'acqua
dal tratto di fiume nella City.
Nell'estate del 1853 il colera riesplose; anche questa volta, la maggiore frequenza di casi di malattia
si ebbe a sud del Tamigi.
Snow si mise nuovamente all'opera, raccogliendo ancora i dati riguardanti la mortalit in rapporto
alla Societ fornitrice dell'acqua. Lo studio venne ampliato attraverso l'ottenimento - dal "General
Registar Office" - dei dati sul numero di abitazioni servite da una o l'altra delle societ dell'acqua.
La situazione risultava la seguente:
17
I suddetti dati, insieme ad altri (come, ad esempio, quelli riguardanti il numero di persone servite
dalle Societ fornitrici di acqua e la relativa mortalit per colera), e pur tenuto conto delle
sovrapposizioni degli acquedotti, dimostravano con sufficiente chiarezza - secondo Snow - che
l'acqua Southwark & Vauxhall era una causa importante della malattia. Questa ipotesi era confortata
anche dal fatto che la mortalit nelle abitazioni servite dalla Lambeth, a motivo dello spostamento a
monte del punto di raccolta dell'acqua, era diminuita rispetto alla precedente epidemia.
Nella tarda estate dello stesso anno il colera continuava a colpire con durezza, ed in particolare si
verific una grave epidemia fra Broad Street e Cambridge Street, proprio nella zona ove Snow
risiedeva (corrispondente all'odierno, centralissimo quartiere di Soho). Questa epidemia, la cui
storia divenuta leggendaria, venne studiata da Snow ancor pi meticolosamente, e venne anche
preparata una mappa della zona, in cui erano riportati graficamente sia i decessi che la
localizzazione delle pompe pubbliche per l'acqua.
sgorgava acqua della Southwark & Vauxhall. Snow, di fronte ad una assemblea di increduli ma
preoccupati ufficiali governativi, chiese ed ottenne che la maniglia della pompa di Broad Street
fosse rimossa. A partire da quel giorno, i casi di malattia in quella zona continuarono a diminuire,
ed in pochi giorni la malattia si esaur.
Oggi Broad St. si chiama Broadwick St., e nelle vicinanze del luogo dove era collocata la pompa si
trova un pub ("John Snow Pub") nel quale conservata la maniglia originale (o almeno cos si dice)
della pompa. [fai una passeggiata in Broadwick St]
Un elemento importante nel lavoro sistematico di Snow rappresentato dalla applicazione del
principio di falsificazione dell'ipotesi proprio del metodo scientifico moderno. Infatti, egli attu
una minuziosa e sistematica ricerca ed analisi di casi che sembravano contraddire la teoria
dell'origine idrica della malattia. Ecco alcuni esempi emblematici, tratti dal lavoro originale di
Snow:
... I minatori della Gran Bretagna sono stati colpiti dal colera pi degli addetti ad altri mestieri [...].
I minatori differiscono per molti ed importanti particolari da tutte le altre classi di lavoratori. Non vi
sono servizi igienici nelle miniere di carbone cos come - credo - nelle miniere di altro tipo. I
lavoratori soggiornano cos a lungo nelle miniere che sono costretti a portare con s il cibo, che
consumano sempre senza lavarsi le mani, e senza usare n forchetta n coltello. Ad una mia
domanda rivolta al personale di una miniera di carbone presso Leeds, ho ottenuto la seguente
risposta: "I nostri minatori scendono alle 5 del mattino, per essere pronti ad iniziare il lavoro alle 6,
e lasciano la miniera alle 15:30. In media, rimangono nella miniera 8-9 ore. Tutti i minatori portano
con s una riserva di cibo, solitamente focaccia con l'aggiunta, talvolta, di carne. Tutti hanno anche
una bottiglia contenente una bevanda. Temo che i nostri minatori non siano migliori degli altri
riguardo a pulizia. La miniera da considerare una enorme latrina, e naturalmente gli uomini l
consumano il loro pasto senza lavarsi le mani". E' evidente che, se un minatore viene attaccato dal
colera sul luogo di lavoro, la malattia ha la possibilit di trasmettersi ai colleghi di lavoro pi che in
ogni altro tipo di occupazione...
...C' una distilleria [brewery, vedi mappa] di birra in Broad St., vicino alla pompa, e dopo aver
appreso che nessuno di quei lavoranti era morto di colera, ho convocato il proprietario, Mr.
Huggins. Egli mi ha informato di avere impiegato nella distilleria circa 70 persone, e che nessuna di
esse ha contratto il colera - per lo meno in forma grave - e che soltanto due hanno accusato un lieve
malessere nel periodo in cui il morbo era prevalente. Agli impiegati permesso bere una certa
quantit di mosto di malto; Mr. Huggins ritiene che essi non bevano affatto acqua ed
assolutamente certo che non si sono mai riforniti di acqua dalla pompa della strada. Infatti,
all'interno della fabbrica esiste un profondo pozzo...
...Il dott. Fraser ha richiamato la mia attenzione sulle seguenti circostanze, che forse provano
definitivamente la connessione fra la pompa di Broad Street e l'epidemia di colera. [...] Nel West
End, il 2 settembre la vedova di un fabbricante di cartucce, dell'et di 59 anni, stata colpita dal
colera. Sono stato informato dal figlio della vedova che ella da mesi non si recava nelle vicinanze di
Broad Street. Tuttavia, ogni giorno da Broad Street a West End veniva un carretto, e la vedova era
solita farsi portare una grossa bottiglia di acqua della pompa di Broad Street, che lei preferiva.
L'acqua venne prelevata gioved 31 agosto, e la vedova ne bevve alla sera dello stesso giorno, ed
anche il venerd. Una nipote della donna, recatasi in visita alla vedova, bevve la stessa acqua e,
ritornata a casa nel quartiere di Islington (ove il colera era assente), mor poco dopo di colera.
Anche la vedova contrasse il colera alla sera del venerd e mor sabato. In quel tempo il colera non
era presente n nel West End n nei quartieri adiacenti. E' vero che molte persone che bevvero
l'acqua della pompa di Broad Street al tempo dell'epidemia, senza ammalarsi. Tuttavia, ci non
19
diminuisce la validit delle prove riguardanti l'influenza dell'acqua, come gi chiaramente indicato
in altra parte del presente lavoro...
Ancor prima di "scoprire" l'esistenza del batterio che causa il colera, l'acqua era stata
individuata come fattore importante nella trasmissione della malattia. Su questa base, lo stesso
Snow fiss alcune regole di comportamento che, nelle epidemie successive, si rivelarono efficaci
nel ridurre il contagio e che, nella loro semplicit, sono ancor oggi valide. Nelle parole originali di
Snow, le regole dettavano che:
tutti coloro che si occupano degli ammalati devono osservare le pi strette norme di pulizia; nella
stanza dove presente un paziente, dovrebbe essere disponibile un catino, acqua ed asciugamani,
da usare con frequenza e soprattutto prima di toccare il cibo;
in attesa di essere lavati, gli indumenti del malato dovrebbero tenuti essere immersi in acqua per
evitare l'essiccamento delle feci ed il loro dissolvimento in polvere. Il materasso e tutto ci che non
pu essere lavato dovrebbe essere esposto per un certo tempo ad una temperatura superiore a
212 gradi Fahrenheit [100 gradi centigradi] o superiore;
occorre fare attenzione all'acqua da bere o utilizzata per la preparazione dei cibi; essa non deve
essere contaminata da scarichi o fogne; l'acqua di provenienza sospetta dovrebbe essere bollita e,
se possibile, filtrata;
quando il colera presente nelle vicinanze, tutte le provviste portate in casa dovrebbero essere
lavate con acqua e portate a temperatura di 212 F;
se compare un caso di colera o di altra malattia trasmissibile fra le persone che vivono nella stessa
stanza, il malato dovrebbe essere portato in un altro luogo ed accudito soltanto dalle persone
indispensabili;
poich impossibile effettuare una pulizia delle miniere, o installarvi servizi igienici e mezzi per
consumare il pasto in buone condizioni igieniche, il tempo di lavoro dovrebbe essere suddiviso in
periodi di 4 ore anzich di 8, in modo che i minatori possano consumare il pasto a casa;
la gente non dovrebbe essere tenuta all'oscuro della trasmissibilit del colera nell'intento di evitare
il panico o l'abbandono dei malati (...);
alloggi adeguati dovrebbero essere messi a disposizione dei senza-casa e dei poveri;
le persone, e specialmente le navi, provenienti da localit infette dovrebbero essere sottoposti ad
un periodo di isolamento; nel caso del colera, non necessario che questo periodo sia di lunga
durata.
venne azzerato anche il fattore "altezza sul fiume" che alcuni ritenevano associato alla causa del
colera.
Altri elementi che giocarono a favore di Snow sono da ricercare nei caratteri clinici della malattia: il
colera di facile diagnosi (quindi tutti i casi vennero individuati facilmente), ed induce sintomi cos
evidenti che altamente improbabile che si potesse nascondere un caso (il colera era - ed -
malattia soggetta a denuncia obbligatoria alle Autorit).
Inoltre, l'associazione fra acqua e colera nell'epidemia del 1854 risult molte forte, nel senso che il
rischio di morire per colera nelle abitazioni servite dalla Southwark & Vauxhall era 8.4 volte
superiore rispetto alle abitazioni servite dalla Lambeth.
La "reversibilit" (vedi punto 5 dei Postulati di Evans), che oggi riconosciuta come importante
criterio per verificare l'esistenza di un rapporto causa-effetto, venne dimostrata da Snow mettendo a
raffronto l'epidemia del 1849 con quella del 1854. Nel tempo intercorrente fra le due epidemie, la
Lambeth spost a monte il punto di prelievo dell'acqua, e ci permise a Snow di verificare il logico
principio secondo cui "l'eliminazione di una causa induce una diminuzione dei casi di malattia".
Infine, la rimozione della leva della pompa di Broad Street deve essere visto pi come un aneddoto
storico che come un provvedimento risolutivo. Infatti, quando la leva venne rimossa, l'epidemia si
stava gi esaurendo spontaneamente (vedi grafico sottostante) perch la popolazione si era
allontanata ed erano rimasti pochi individui suscettibili, e ci aveva portato alla riduzione della
contaminazione ambientale da parte del bacillo del colera.
[Per la monografia originale di John Snow si veda: "On the mode of communication of cholera".
Documento pubblicato da U.C.L.A., School of Public Health, Department of Epidemiology].
21
3. Definizione di
epidemiologia e concetti di base
3.1 Epidemiologia: qualche definizione
OBIETTIVO:
ora il momento di rispondere alla classica domanda che ci si pone quando si affronta una nuova
disciplina dal nome non molto esplicativo:
Dal punto di vista etimologico, epidemiologia una parola composita (epi-demio-logia) di origine
greca, che letteralmente significa discorso riguardo alla popolazione
Ovviamente queste dimensioni di studio non devono essere viste come disgiunte e fra loro separate;
al contrario, esse sono fortemente complementari: infatti, una comprensione approfondita di una
malattia si ha soltanto adottando un approccio integrato delle quattro suddette dimensioni.
Dire pi esattamente cosa sia l'epidemiologia non compito facile; prova indiretta ne l'esistenza di
moltissime definizioni.
Il fatto che l'epidemiologia, pi che un corpo di conoscenze autonomo e a s stante, una
metodologia, una tecnica di approccio ai problemi, una filosofia. L'epidemiologia un modo
diverso per studiare la salute e le malattie, ed scienza trasversale, in quanto, sovrapponendosi a
molte altre discipline, le aiuta a trarre conclusioni dai fatti.
campo della scienza medica che si interessa delle relazioni tra i fattori che condizionano la
frequenza e la distribuzione di una malattia o di uno stato fisiologico in una popolazione
umana.(Maxcy)
studio della distribuzione e dei determinanti di salute o di stati correlati con la salute in
determinate popolazioni, e applicazione di questo studio al controllo dei problemi sanitari.
(Last)
strategia di studio dei fattori riguardanti: (a) l'eziologia, la prevenzione ed il controllo delle
malattie; (b) l'allocazione efficiente delle risorse per promuovere e mantenere uno stato di
salute in popolazioni umane. (Detels)
Nelle tre definizioni si fa riferimento esplicito all'uomo o alla medicina umana; tuttavia, come gi
detto, l'epidemiologia una metodologia di studio, e perci non esistono differenze sostanziali tra
epidemiologia medica ed epidemiologia veterinaria, se non quelle legate al soggetto di studio:
l'uomo in un caso, l'animale nell'altro.
Bisogna ammettere che le tre definizioni ora fornite sono complete ed autorevoli, ma certo non del
tutto comprensibili per chi si avvicina per la prima volta alla materia.
Esiste un'altra definizione pi semplice e quindi pi adatta a scopo didattico:
23
Il fatto che vengano studiate le malattie non nel singolo individuo ma collettivamente, ossia a
livello di popolazione, non deve far pensare che l'epidemiologia si occupi soltanto delle malattie
infettive o di quelle contagiose, che tipicamente (ma non sempre!) coinvolgono molti individui di
una popolazione (ma quasi mai tutti). Infatti, l'epidemiologia si occupa di TUTTE le malattie ma,
diversamente da altre discipline, se ne occupa esclusivamente a livello di popolazione piuttosto
che di individuo. Questo concetto verr ampliato e risulter pi chiaro in seguito. Gi fin d'ora
bene, comunque, ricordare che, in epidemiologia, la malattia nel SINGOLO animale non assume
alcun significato. Il singolo importante solo in quanto parte di una collettivit.
frequenza
distribuzione
determinanti
salute-malattia
popolazioni
3. Definizione di
epidemiologia e concetti di base
3.2 Definizione di epidemiologia: le cinque parole-chiave
OBIETTIVO:
Abbiamo gi visto nell'Unit precedente che, parlando in generale, l'epidemiologia si occupa delle
malattie, e degli eventi e fenomeni correlati alle malattie.
Ora prendiamo in considerazione di nuovo la definizione che, per la sua semplicit, pi efficace a
scopo didattico, e introduciamo in maniera schematica il significato delle cinque parole-chiave che
la compongono. Tieni presente che tutte queste parole chiave verranno chiarite pi o meno
dettagliatamente sia nelle prossime Unit di questo Capitolo, che in altre di Capitoli successivi.
1. frequenza: con questo termine si indica sia quanto spesso ('QUANTO') la malattia compare,
che il 'pattern temporale' ('QUANDO');
2. distribuzione: indica sia il pattern geografico ('DOVE') di comparsa o presenza della
malattia che le caratteristiche della popolazione ospite (per esempio se pi frequente negli
animali liberi o in cattivit, giovani o vecchi ecc.);
25
3. Definizione di
epidemiologia e concetti di base
3.3 Differenze tra epidemiologia e clinica
OBIETTIVI:
1. il clinico si occupa della diagnosi e terapia di malattie nel singolo individuo; per
l'epidemiologo, invece, il singolo non ha alcun valore (se non in quanto parte di una
popolazione);
2. il compito del clinico quello di curare (e, se possibile, guarire) un animale ammalato; il
compito dell'epidemiologo invece quello di studiare (e prevenire) le malattie in
popolazioni confrontando gruppi (o sottopopolazioni) di animali sani con gruppi di animali
ammalati.
La seguente metafora, che raffronta la medicina clinica all'epidemiologia, famosa fra gli "addetti
ai lavori" nel campo della salute pubblica dell'uomo ma pu essere senz'altro adattata anche al
settore veterinario.
Immaginiamo che una grande valanga d'acqua, derivante da un malfunzionamento del sistema di
dighe di un invaso, stia minacciando la vita di un gran numero di persone. In questa circostanza, il
compito del clinico quello di fornire un salvagente alle persone minacciate o che gi sono state
travolte dall'acqua. Sull'altro versante, l'epidemiologo cerca di individuare il guasto nel sistema di
dighe, per bloccare l'inondazione e prevenirne delle nuove.
La metafora pu essere completata dal seguente corollario: la riparazione del guasto compito della
"salute pubblica".
Quanto finora esposto non deve per far ritenere che l'epidemiologia non sia utile al veterinario
clinico. Anzi, esiste un intero ed attualissimo settore di studio che riguarda l'applicazione dei
principi epidemiologici proprio alla pratica clinica sui singoli animali. Si tratta della cosiddetta
27
EBM (Evidence Based Medicine). In italiano la EBM viene detta, con una traduzione letterale
impropria, medicina basata sull'evidenza, dove per evidenza deve intendersi prova dei fatti.
Nello schema che segue vi sono alcune importanti domande che aiutano a capire perch anche ad un
veterinario clinico, ad esempio che si occupa di animali da compagnia, l'EBM e l'epidemiologia
possono risultare utili.
3. Definizione di
epidemiologia e concetti di base
3.4 Il concetto di determinante di malattia
OBIETTIVO:
Durante il corso di studi potresti aver assunto una visione delle malattie secondo cui:
Quasi sempre, infatti, la malattia la conseguenza di una interazione (idealizzata, nel grafico in
basso, dalle frecce verdi e rosse) estremamente complessa di fattori diversi (esterni o interni
all'organismo), che agiscono contemporaneamente o in successione sull'organismo, in sinergismo
o in antagonismo gli uni con gli altri. Queste malattie sono dette "multifattoriali" o "ad eziologia
multifattoriale".
Anche le malattie infettive, che classicamente si ritengono dovute ad una sola causa (un batterio o
un virus), sono quasi sempre soggette al principio ora enunciato. Puoi riflettere sulla semplice
osservazione che non tutti gli individui di una popolazione esposta ad un virus vanno incontro a
malattia: infatti, quella popolazione sar presumibilmente composta, oltre da individui pienamente
recettivi (che quindi ammaleranno), anche da individui che non ammaleranno perch - ad
29
esempio - immuni, oppure scarsamente recettivi su base genetica, oppure di et non compatibile con
l'evoluzione dell'infezione ecc.
ESEMPIO 1. Le colibacillosi del pollo sono indotte da una associazione tra un batterio (Escherichia
coli) ed alcuni fattori ambientali (sovraffollamento, cattiva qualit dell'aria ecc.). Si usa il plurale
("le" colibacillosi) e non il singolare ("la" colibacillosi) in quanto si tratta di un complesso di
malattie diverse per sintomatologia, localizzazione nell'ospite ecc.
ESEMPIO 2. L'adenomatosi polmonare della pecora una malattia contagiosa sostenuta da un virus
e caratterizzata dalla comparsa di lesioni simil-tumorali al polmone. Sono recettive le pecore di ogni
razza. Tuttavia in Islanda, dove la malattia stata ampiamente studiata ed eradicata nel 1952,
erano colpite molto pi frequentemente le pecore di razza gottorp rispetto ad altre razze.
Tutti i fattori che sono in grado di influenzare la comparsa o l'andamento di una malattia, non
potendo essere ritenuti causa di malattia in senso stretto, vengono detti DETERMINANTI.
In altre parole, in epidemiologia...
Anche nel caso delle malattie non-infettive i fattori causali sono riconducibili alla stessa classica
triade epidemiologica ospite-agente-ambiente gi vista, tenendo presente che, in questo caso,
l'agente non sar pi rappresentato da un microrganismo ma da altri fattori (chimici o fisici).
3. Definizione di
epidemiologia e concetti di base
3.5 Il concetto di 'determinante' applicato alla vita quotidiana
OBIETTIVO:
verificare come il concetto di 'determinante' possa essere applicato ad eventi della vita quotidiana
Questa unit pu essere considerata un intermezzo divertente (ed anche una pausa di riflessione)
sul concetto di determinante. In effetti, questo concetto di tale complessit da trovare radici e
trattazione in molte speculazioni filosofiche. Si veda, ad esempio, l'enunciazione dei Canoni di
John Stuart Mill.
Nella figura sottostante, un problema purtroppo frequente nelle nostre citt (il furto di automobili)
viene illustrato attraverso l'evidenziazione di alcuni possibili determinanti. Si noti l'analogia con i
determinanti di malattia, e si noti come, anche in questo caso, sia probabile l'evenienza di
sinergismo o antagonismo fra determinanti.
33
molto difficile rispondere alla domanda Perch hanno rubato proprio la mia automobile?. Anzi,
una risposta semplice ed univoca non esiste. Ad esempio, le probabilit che venga rubata una
vecchia automobile di marca poco diffusa e di grossa cilindrata sono molto basse, diminuiscono
ulteriormente se la vettura parcheggiata all'interno di un garage, e si abbassano ancor di pi se il
garage si trova nelle vicinanze di una stazione dei Carabinieri.
Se assimiliamo il furto alla malattia (ed in effetti non forse il furto uno dei tanti mali che
affliggono la nostra societ?), allora i fattori elencati costituiscono determinanti di salute.
Prova ad immaginare altri determinanti di furto d'auto, diversi da quelli elencati; prova anche a
trovare altre situazioni comuni cui applicabile il concetto di determinante.
34
3. Definizione di
epidemiologia e concetti di base
3.6 I determinanti primari
OBIETTIVO:
In questa Unit, ed in quella che segue, viene proposto un altro schema di classificazione (v. figura
sottostante), questa volta basato sull'importanza del determinante nella genesi della malattia. I
determinanti importanti vengono definiti primari, mentre quelli meno importanti sono
secondari. Come verr ripetuto anche nella prossima Unit, ti prego di notare che una
classificazione di questo tipo utile soprattutto a scopo didattico, per aiutarti a costruire un ordine
mentale nella prima fase di approccio allo studio delle cause delle malattie. In effetti, nella realt,
spesso difficile stabilire se un certo determinante abbia avuto un ruolo primario o secondario, ed
anzi, nella rete delle cause, lo stesso determinante pu assumemere di volta in volta un ruolo
primario o secondario, in dipendenza di una variet di circostanze.
35
I determinanti primari sono rappresentati dai fattori la cui variazione esercita un effetto maggiore
nella genesi della malattia. In altre parole, essi sono di importanza fondamentale per la comparsa
della malattia.
Spesso (ma non sempre), i determinanti primari sono fattori indispensabili per la comparsa della
malattia. Nello schema viene proposta una classificazione dei determinanti primari in 'intrinseci' (o
endogeni, ossia interni all'ospite) ed estrinseci (o esogeni); questi ultimi possono essere animati o
inanimati.
ESEMPIO. La pseudopeste del pollo una malattia che assume generalmente decorso acuto e
che riconosce come determinante primario estrinseco un virus appartenente alla famiglia
Paramyxoviridae.
36
3. Definizione di
epidemiologia e concetti di base
3.7 I determinanti secondari
OBIETTIVO:
I determinanti secondari sono rappresentati dai fattori la cui variazione esercita un effetto minore
nella genesi della malattia. In altre parole, essi non sono indispensabili n di importanza
fondamentale per la comparsa della malattia. In molti casi essi corrispondono ai cosiddetti fattori
"predisponenti" o "favorenti".
ESEMPIO. La polmonite enzootica del suino una malattia cronica, diffusa in tutto il mondo, che
provoca gravi danni economici negli allevamenti intensivi. Il determinante primario un batterio:
Mycoplasma hyopneumoniae. Tuttavia, la malattia si manifesta pi spesso, e con caratteri di
maggiore gravit, se sono presenti alcuni fattori (determinanti secondari), fra i quali:
sovraffollamento, scarsa ventilazione, sbalzi di temperatura, stress diversi (svezzamento,
37
Come nel caso dei determinanti primari, nello schema viene proposto un esempio di determinanti
secondari, suddivisi in intrinseci (o endogeni, ossia interni all'ospite) ed estrinseci (o esogeni).
Vale la pena di sottolineare che la classificazione proposta, in base alla quale i determinanti
vengono suddivisi in "primari" e "secondari", utile soprattutto a scopo didattico, ma pu non
risultare altrettanto valida nella pratica. La suddivisione, infatti, non deve essere ritenuta fissa e
nitida: in alcune situazioni, un determinante classificato come "secondario" pu viceversa agire
come determinante "primario".
ESEMPIO.
La costituzione genetica rappresenta certamente un determinante secondario riguardo alla malattia
di Marek (una malattia tumorale del pollo sostenuta da un herpesvirus). Infatti, la costituzione
genetica pu ostacolare la comparsa di malattia, essendo note "linee genetiche" di polli
relativamente resistenti, che si ammalano meno frequentemente o nelle quali la malattia meno
grave.
Per altre malattie (es. emofilia dell'uomo) la costituzione genetica rappresenta invece un
determinante primario.
38
3. Definizione di
epidemiologia e concetti di base
3.8 Salute e malattia
OBIETTIVI:
apprendere che il confine fra salute e malattia non sempre ben definito;
imparare che negli allevamenti le malattie gravi o mortali possono risultare meno dannose delle
malattie lievi.
Proseguiamo nell'esame dettagliato delle parole chiave della definizione di epidemiologia che
abbiamo adottato (epidemiologia = studio della frequenza, distribuzione e determinanti di
salute/malattia in popolazioni), ed in particolare consideriamo il binomio salute/malattia.
Forse potresti pensare che l'utilizzo delle due parole salute e malattia sia una inutile
ridondanza, e che quindi sarebbe stato sufficiente parlare pi semplicemente di determinanti di
malattia.
Tuttavia, devi ricordare che, negli studi epidemiologici, sono sempre compresi sia animali
ammalati che sani; d'altra parte, un animale pu essere considerato ammalato solo se
confrontato ad uno sano. Inoltre, lo studio del perch alcuni animali rimangono sani pu essere
utile a comprendere i motivi per cui altri animali si ammalano. Questo approccio , in un certo
senso, opposto a quello della medicina classica, che sostanzialmente studia soprattutto il perch
l'animale si ammala.
In altre parole, l'epidemiologia studia le cause di salute e le cause di malattia, mentre altre
discipline si limitano a studiare le sole cause di malattia. Ecco quindi giustificato l'impiego del
doppio termine salute/malattia.
I termini "salute" e "malattia" hanno un significato piuttosto vago e impreciso; in effetti, difficile
stabilire un confine netto fra salute e malattia. Secondo l'Organizzazione Mondiale della
Sanit, per salute si intende (nell'uomo) uno stato di completo benessere fisico, mentale e sociale,
e non la semplice assenza di malattia o di infermit; ovviamente molto difficile stabilire quando
un individuo si trova in completo benessere. Questo vale per gli essere umani e, forse ancor pi,
per gli animali. D'altra parte, piccole alterazioni di questo stato di benessere non possono essere
certo sufficienti a proclamare l'individuo ammalato.
L'accordo sullo stato di "salute" e "malattia" pu dipendere anche da fattori ambientali o sociali. Ad
esempio, oggi una persona che ha febbre a 38C senz'altro ritenuta ammalata. Per i medici dei
lager nazisti, invece, un detenuto era dichiarato "ammalato" soltanto quando la temperatura
superava i 39C.
Sempre allo scopo di sottolineare quanto possano essere imprecisi i confini tra salute e malattia,
consideriamo la storia naturale di una malattia. La storia naturale comprende l'evoluzione naturale
di una malattia nel tempo, ossia come essa si comporta, in assenza di qualsiasi intervento, sia nelle
popolazioni che nei singoli animali.
Ogni malattia prevede il verificarsi di diversi momenti che segnano il passaggio dallo stato di salute
39
allo stato di malattia. Questi momenti sono riassunti nello schema che segue, in cui l'evento
"diagnosi" contrassegnato da una linea tratteggiata, ad indicare che esso estraneo, a rigore, alla
storia naturale della malattia.
ESEMPIO. Gli allevatori di piccioni viaggiatori consultano il veterinario perch i propri animali
hanno un basso rendimento nelle competizioni, pur apparendo in eccellente salute e perfettamente
sani per quanto riguarda l'aspetto, la conformazione e le funzioni organiche.
Negli animali da reddito, l'accertamento dello stato di salute pi semplice: in questa categoria di
animali, la produttivit considerata un buon indicatore dello stato di salute, in base al
ragionrvole principio che un animale
sano produce molto.
ESEMPIO. La mastite subclinica della bovina da latte ad alta produzione una malattia
virtualmente presente in tutti gli allevamenti intensivi ed praticamente impossibile da eliminare;
tuttavia, importante mantenere bassa la frequenza di animali colpiti affinch l'allevamento risulti
economicamente conveniente.
Bisogna infine considerare che esistono molti altri fattori (management, tecniche di allevamento,
alimentazione ecc.) che possono esercitare un grande impatto sulle produzioni animali, anche se, in
s, non sono capaci di provocare malattia. Come gi visto, tutti questi fattori sono determinanti di
salute o malattia.
Nello schema che segue sono riassunti i principali concetti esposti in questa Unit.
41
Nella figura a
lato riassunta
schematicamen
te l'evoluzione
che nel tempo
ha subto il
concetto di "salute".
In passato, la linea di demarcazione tra lo stato di salute e quello di non-salute era collocata in
corrispondenza della comparsa di chiari segni clinici di una patologia.
Attualmente la linea di demarcazione fra salute e malattia viene collocata molto pi precocemente.
Anche una semplice condizione di esposizione a fattori di rischio (cio fattori che potenzialmente
inducono malattie), rappresenta gi, di per s, uno stato di non-salute. Ad esempio, nelle nostre citt
l'innalzamento delle polveri sottili oltre una soglia prefissata configura una condizione di rischio e
fa scattare provvedimenti di restrizione del traffico.
L'approccio ora esposto si integra alla perfezione con il concetto di "prevenzione".
42
3. Definizione di
epidemiologia e concetti di base
3.9 Il concetto di "popolazione"
OBIETTIVO:
acquisire un concetto esteso del termine 'popolazione', cos come utilizzato in epidemiologia
Nel linguaggio comune, per popolazione si intende generalmente indicare l'insieme delle persone
(o degli animali) abitanti un luogo.
Si possono studiare anche popolazioni indeterminate, cio composte da elementi non esistenti
fisicamente. Ad esempio, nello studio sull'efficacia di un vaccino per il cane, potrebbe interessare la
popolazione indeterminata di tutti i cani che verranno vaccinati in futuro con quel vaccino.
Come gi detto, molto spesso le unit che compongono la popolazione in studio sono rappresentate
da animali. In altri casi l'attenzione pu essere rivolta, piuttosto che ad un insieme di animali, ad un
insieme di altre "unit di interesse", come ad esempio cellule, batteri, ecc. Quindi, si potr studiare
una "popolazione di cellule" oppure una "popolazione di batteri" od ancora una "popolazione di
allevamenti" e cos via.
Non indispensabile che una popolazione sia uniforme (cio composta da unit dello stesso tipo).
ESEMPIO. L'afta epizootica una malattia virale che colpisce i mammiferi ungulati domestici, in
particolare bovini, ovini, caprini e suini, ma pu colpire anche gli erbivori selvatici, quali bisonti,
43
cervi, antilopi, renne, giraffe ecc. In uno studio sull'afta epizootica nell'Africa sub-sahariana la
popolazione di interesse potrebbe essere rappresentata da un insieme di animali appartenenti ad
alcune delle suddette specie.
In molti casi non possibile esaminare tutta la popolazione di interesse, ma ci si deve accontentare
dell'esame di un campione. Questo argomento verr trattato estensivamente nel Cap. 9
(Campionamento). Per utile anticipare fin d'ora che, negli studi epidemiologici eseguiti su un
campione estratto da una popolazione, spesso si desidera generalizzare i risultati ottenuti.
ESEMPIO. Hai sottoposto ad un trattamento con un antibiotico 10 cani affetti da una certa malattia,
e ne sono guariti 9. Hai ottenuto un buon risultato sui 10 cani che rappresentano la tua popolazione
in studio; certamente sarai portato a generalizzare il risultato, ed a ritenere che il trattamento con
quell'antibiotico indurr la guarigione del 90% dei cani in altre popolazioni; ad esempio, sulla
popolazione indeterminata costituita tutti i cani che, in futuro, verranno colpiti da quella malattia e
verranno trattati con quell'antibiotico.
Insomma, in molti casi non ci interessano i risultati ottenuti proprio sul campione esaminato:
invece, i risultati interessano perch sono (o potrebbero essere essere) generalizzabili a popolazioni
pi ampie. Questo processo logico di generalizzazione viene detto inferenza.
Il significato generale del termine inferenza "processo logico per il quale, data una o pi
premesse, possibile trarre una conclusione". In statistica ed in epidemiologia il termine inferenza
44
assume un significato un po' diverso, ossia quello di generalizzazione di una conclusione cui si
pervenuti attraverso lo studio di una popolazione limitata.
L'inferenza fa parte di una branca della Statistica che si chiama appunto "statistica inferenziale".
Non farti intimorire dalla terminologia complicata... in effetti tutti noi facciamo
pi o meno inconsciamente processi di inferenza, quando "universalizziamo" il
contenuto di un certo numero (di solito limitato) di osservazioni. Ad esempio, se
il cielo nuvoloso usciamo con l'ombrello: infatti abbiamo imparato (abbiamo
fatto esperienza), dalle giornate nuvolose che si sono succedute nella nostra vita,
un principio generale: al cielo nuvoloso segue spesso una giornata di pioggia. In questo caso,
inferenza vuol dire anche previsione. In fondo, ci che chiamiamo esperienza largamente basato
sull'inferenza, che non altro che un procedimento di generalizzazione dei risultati ottenuti
esaminando un campione.
3. Definizione di
epidemiologia e concetti di base
3.10 Livelli organizzativi di popolazioni
OBIETTIVO:
Nel linguaggio comune, quando si parla di popolazioni si intende generalmente l'insieme delle
persone che abitano un luogo (es. popolazione di una citt) oppure l'insieme di animali o cose che
caratterizzano un luogo (es. la popolazione marina ecc.). In un significato molto restrittivo, con il
termine popolazione si indica soltanto la popolazione umana.
In medicina umana o nel caso degli animali da compagnia l'unit di analisi pi spesso l'individuo;
nel caso degli animali da reddito, e soprattutto delle piccole specie allevate in gruppi numerosi
(polli, pesci ecc.), l'unit di analisi rappresentata invece, in molti casi, dal gruppo stesso o
dall'intero allevamento.
In tempi recenti, diventato normale considerare dal punto di vista epidemiologico anche le
popolazioni di microrganismi (batteri, miceti ecc.).
ESEMPIO 1. Vuoi conoscere la frequenza della malattia vaiolo ovino. L'obiettivo dello studio
quello di individuare la prevalenza della malattia nelle pecore allevate in una determinata regione.
La popolazione di interesse : tutte le pecore della regione; l'unit di interesse il singolo animale
(pecora).
ESEMPIO 4. Stai studiando di nuovo i rapporti fra mastite bovina e produzione di formaggio
47
(caseificazione). Anche in questo caso, vuoi individuare l'esistenza di una associazione fra
contenuto in leucociti nel latte e qualit della caseificazione. La popolazione di interesse : tutte le
partite di latte conferite ad un certo caseificio in un dato periodo di tempo; l'unit di interesse la
singola partita di latte.
ESEMPIO 5. Lavori in una industria farmaceutica in cui stato sintetizzato un nuovo antibiotico.
Hai il compito di saggiarne l'attivit. L'obiettivo : valutare l'efficacia in vitro dell'antibiotico nei
confronti di una data specie batterica. La popolazione di interesse : tutti i ceppi di quella specie
batterica isolati da animali ammalati in un dato periodo di tempo; l'unit di interesse il singolo
ceppo batterico.
48
4. Compiti e
scopi dell'epidemiologia
4.1 Compiti specifici e scopi pratici della epidemiologia
OBIETTIVO:
apprendere i compiti e gli scopi dell'epidemiologia e rendersi conto che l'epidemiologia anche
disciplina diagnostico-pratica
In una precedente unit sono state fornite alcune definizioni che identificano il campo d'azione
dell'epidemiologia. Ora venuto il momento di precisare quali sono i principali scopi che possono
essere raggiunti attraverso i metodi epidemiologici.
Lo scopo ultimo dell'epidemiologia veterinaria quello di acquisire dati su cui basare decisioni
razionali per la prevenzione ed il controllo delle malattie in popolazioni animali; a ci segue
l'ottimizzazione dello stato di salute e quindi della produttivit.
Altre discipline mediche hanno uno scopo pressoch simile, anche se si occupano prevalentemente
di singoli individui e non di popolazioni. Negli studi epidemiologici e nell'attivit degli
epidemiologi possono tuttavia essere individuati elementi peculiari, quali:
Gli obiettivi ora descritti si traducono in pratica nelle seguenti attivit pratiche:
4. Compiti e
scopi dell'epidemiologia
4.2 Prevenzione - Controllo - Eradicazione
OBIETTIVO:
gi stato accennato ad uno dei compiti basilari della epidemiologia, e cio quello di identificare
i fattori che influenzano la comparsa e l'andamento nella popolazione. Si detto anche che la
raccolta e la conoscenza di queste informazioni pu essere utile, soprattutto nel caso delle malattie
infettive, per l'impostazione di azioni di profilassi, di prevenzione, di controllo, e di eradicazione.
Questi quattro termini non sono sinonimi, ma ciascuno di essi assume un suo significato, che viene
brevemente illustrato qui di seguito.
Profilassi
il complesso delle misure utili a prevenire la comparsa e la diffusione delle malattie, soprattutto
trasmissibili. Essa pu essere applicata al singolo individuo oppure su intere popolazioni e
comprende misure di tipo "medico" (es. vaccini o farmaci) o "sanitario" (es. quarantena,
disinfezione). L'azione di profilassi pu essere applicata anche a condizioni diverse dalle malattie
trasmissibili. Ad esempio, una buona razione alimentare costituisce una forma di profilassi nei
confronti di malattie metaboliche, nutrizionali o da carenza.
Il termine quarantena deriva dai 40 giorni di isolamento delle navi prima dell'accesso al porto,
richiesti come misura contro la peste nera nel XIV secolo.
Per tutti i cani ed altri animali in ingresso nel Regno Unito era richiesto un periodo di sei mesi di
quarantena; tale provvedimento era giustificato dal rischio di importazione della rabbia. Questa
norma stata abolita alcuni anni or sono, e sostituita dal sistema del Pet Passport: gli animali
possono evitare la quarantena se esiste la documentazione che essi sono appropriatamente vaccinati.
I primi astronauti di ritorno dalla Luna furono messi in quarantena al momento del loro ritorno in un
laboratorio appositamente costruito.
52
Prevenzione
Per prevenzione si intende l'insieme di misure di profilassi (non solo mediche ma anche di tipo
sociale o economico) rivolte ad evitare l'insorgenza di una malattia in una popolazione esente da
quella malattia. Secondo alcuni, il concetto di prevenzione pu essere ampliato fino a comprendere
le misure che limitano la progressione e la gravit della malattia, adottate allo scopo finale di
eliminarla.
In questa ottica, il principale ente sanitario internazionale, cio la "Organizzazione Mondiale della
Sanit" (World Health Organization, WHO), ha definito 3 livelli di prevenzione della malattia
dell'uomo:
prevenzione primaria (volta a ridurre la incidenza (comparsa di nuovi casi) della malattia)
prevenzione secondaria (volta a ridurre la prevalenza (frequenza di casi esistenti) della
malattia)
prevenzione terziaria (volta a ridurre la gravit e le complicazione di malattie inguaribili).
Controllo
Il controllo di una malattia si attua riducendo la sua frequenza nella popolazione fino ad un livello
tale da rendere la malattia non classificabile fra i problemi sanitari o economici importanti.
Il controllo della malattia compatibile con l'esistenza di un limitato numero di casi o focolai. Il
livello di frequenza della malattia accettabile al fine di dichiarare quella malattia sotto controllo
varia in rapporto alle caratteristiche della malattia stessa. Per esempio, tale livello basso nel caso
dell'afta epizootica, pi alto nel caso della tubercolosi bovina. Contrariamente all'eradicazione, il
controllo non implica l'eliminazione della malattia e del relativo agente causale. Ad esempio, in
Italia nel 1997 la tubercolosi bovina era sotto controllo, ma non eradicata.
Eradicazione
L'eradicazione di una malattia comporta l'eliminazione della malattia in seguito alla eliminazione
del relativo agente da una regione, nazione o continente. L'eradicazione deve essere differenziata
dalla semplice eliminazione di una malattia: quest'ultima, infatti, corrisponde alla scomparsa di
tutti i casi clinici in una popolazione, il che non implica necessariamente la scomparsa dell'agente
eziologico.
ESEMPIO 1. In Norvegia stato attivato un piano di eradicazione di una malattia da virus del
bovino: la diarrea virale/malattia delle mucose. Il piano prevede l'identificazione degli
allevamenti infetti attraverso lo screening degli allevamenti di bovini da latte. In una prima fase
viene ricercata la presenza di anticorpi nel latte di massa; in caso di positivit viene esaminato il
latte delle primipare e quindi il siero di sangue. Agli allevamenti positivi viene impedita la
vendita di animali e l'utilizzo di pascoli in comune con animali di
altri allevamenti.
4. Compiti e
scopi dell'epidemiologia
4.3 Obiettivi di uno studio epidemiologico
OBIETTIVO:
E' necessario premettere che non esiste una classificazione univoca delle tipologie di studi
epidemiologici. Esistono schemi di classificazione molto complicati, ed una loro esposizione
esauriente va al di l degli scopi del Quaderno. L'argomento reso ancor pi difficile dal fatto che,
in letteratura, c' qualche divergenza sulla terminologia.
In questa unit, ed in una successiva, viene fornito uno schema di base semplificato, e quindi
impreciso, ma efficace a scopo didattico per chi si avvicina per la prima volta all'Epidemiologia
Lo schema, gi accennato nelle Unit precedenti, prevede che gli obiettivi degli studi
epidemiologici possano essere riassunti in due grandi settori principali:
In altri casi, l'epidemiologia descrittiva pu servire a dimostrare che una regione indenne da una
determinata malattia; questa conoscenza quasi sempre richiesta nello scambio o commercio di
animali o loro prodotti.
In genere, gli studi descrittivi (detti anche "studi ecologici") rappresentano un substrato prezioso
per gli studi analitici, e quindi li precedono.
Il secondo settore raccoglie tutte quelle attivit che hanno lo scopo di verificare una ipotesi; le
ipotesi pi frequenti riguardano l'effetto di uno o pi (presunti) determinanti di malattia. In altre
parole, si studia perch una malattia si sviluppa. Indagini di questo tipo rientrano nella cosiddetta
epidemiologia analitica. L'attributo "analitica" indica che ci si basa su procedimenti propri
dell'analisi. In questo tipo di studi si interferisce attivamente con la malattia in studio, manipolando
una o pi delle variabili in causa.
57
4. Compiti e
scopi dell'epidemiologia
4.4 Obiettivi di 3 discipline diagnostiche
OBIETTIVO:
esaminare i campi di azione dell'epidemiologia e metterli a raffronto con quelli della clinica e
della patologia. Capire perch tutte le discipline sono importanti.
Nello schema sottostante vengono riassunti gli obiettivi di 3 discipline diagnostiche: la clinica, la
patologia (anatomia patologica) e l'epidemiologia. Agli specialisti di ciascuna delle 3 discipline
considerate, lo schema potrebbe sembrer criticabile sotto molti aspetti; tuttavia lo ritengo
didatticamente molto utile, soprattutto nella fase iniziale del corso di studi. Infatti, lo schema
fornisce una buona idea dei diversi approcci diagnostici di tre importanti discipline che affronterai
(o forse hai gi affrontato), discipline che si intersecano e si integrano l'una con l'altra nella attivit
professionale del medico veterinario.
La clinica si occupa eminentemente del singolo animale; anche quando in gioco la salute di un
gruppo (es. i bovini di un allevamento da carne), si pone l'importanza sui singoli, per poi estrapolare
diagnosi e terapia a tutti gli animali interessati. L'attivit del clinico pu essere effettuata in
58
campo (nel caso degli animali da reddito); sempre pi spesso, tuttavia, il clinico coinvolto nella
visita di animali da compagnia, attivit che avviene in ambulatorio e quindi lontano dal luogo dove
l'animale (o gli animali) vive. Il fine ultimo dell'attivit del clinico quello di curare e guarire
l'animale (o gli animali) ammalati.
La patologia e l'anatomia patologica mirano ad una diagnosi generalmente "a posteriori", cio
effettuata sull'animale morto, al fine di conoscere la causa della malattia o della morte. Gli elementi
raccolti dalla patologia sono utili soprattutto a comprendere gli eventi patogenetici e l'evoluzione
della malattia nel singolo individuo. In sostanza, si mira a meglio comprendere la malattia per
meglio diagnosticarla e curarla in futuro.
Per quanto riguarda l'epidemiologia, si deve sottolineare ancora una volta come essa sia scienza che
si occupa di popolazioni. Il lavoro della raccolta dei dati deve avvenire in campo, cio dove vive la
popolazione stessa. Ovviamente, i dati (riguardanti sia gli ammalati che i sani) verranno poi
elaborati ed interpretati "a tavolino", probabilmente con l'utilizzo di un computer. Il fine ultimo
quello di ...
59
4. Compiti e
scopi dell'epidemiologia
4.5 Valutazione dell'ipotesi: studi osservazionali, sperimentali, teorici
OBIETTIVI:
E' gi stato ripetuto pi volte nelle precedenti unit che uno dei compiti dell'epidemiologia quello
di accertare delle ipotesi; pi in particolare, una delle ipotesi pi frequenti riguarda i determinanti di
malattia, e pu essere espressa con il seguente enunciato generale:
L'approccio epidemiologico ad ipotesi di questo tipo pu essere effettuato con tre criteri diversi,
riassunti nello schema che segue:
60
Gli studi osservazionali (detti anche "ecologici"), sono quelli nei quali le variabili in studio (cio,
nel caso pi semplice, la variabile malattia e la variabile presunta causa) vengono monitorate, ma su
di esse non si effettua alcun tipo di intervento. Ci si limita a trarre informazioni sull'esistenza di un
rapporto causa-effetto dalla semplice osservazione dei fatti.
Un esempio storico di studio di questo tipo quello sul ruolo dell'acqua nella diffusione del
colera dell'uomo eseguito nella met del XIX secolo;
Negli studi in laboratorio si lavora in genere su animali da laboratorio (topo, cavia ecc.), o su altri
substrati viventi (es. colture cellulari, colture d'organo ecc.), oppure, quando possibile, direttamente
sulla specie animale di interesse. Lo sperimentatore interferisce con entrambe le variabili in studio.
Negli studi in campo si lavora non su animali da laboratorio, ma direttamente sulla specie animal
di interesse, e si agisce, in genere, una sola variabile.
Gli studi di laboratorio sono pi precisi rispetto a quelli di campo. Nota che qui il termine
precisione viene usato come sinonimo di ripetibilit; cio, un nuovo studio fornir risultati molto
simili al precedente se eseguito di nuovo nelle stesse condizioni. La precisione un grande
vantaggio degli studi di laboratorio, e dipende dal fatto che in laboratorio sono assenti i fattori
esterni (noti ed ignoti), che possono interferire con i risultati e che invece sono sempre presenti
negli studi di campo.
61
Gli studi teorici utilizzano modelli o simulazioni computerizzate. Nella maggior parte delle
situazioni in cui si ricercano i determinanti delle malattie, gli studi teorici si rivelano sicuramente
meno adatti dei precedenti. Essi comunque, pur essendo utilizzati pi spesso per altri scopi, possono
essere utili ad individuare potenziali determinanti, la cui effettiva attivit andr per
successivamente verificata in altro modo.
LE VARIABILI
Una variabile una caratteristica misurabile o un attributo che differisce nei soggetti considerati.
Per esempio, se viene misurato il peso di 300 suini, allora il "peso" rappresenta una "variabile".
Le variabili possono essere quantitative o qualitative. Queste ultime possono anche esser dette
categoriche.
Nell'esempio precedente, il "peso" dei suini una variabile quantitativa, in quanto misura una
quantit; se il gruppo dei 300 suini costituito da animali di razza diversa, allora la "razza" una
variabile qualitativa, in quanto definisce una qualit di ciascun animale.
62
Cap. 5. Dalla
associazione alla causalit
5.1 Il procedimento logico verso la causalit
OBIETTIVO:
1. la presunta causa
2. la malattia.
Il procedimento logico che conduce alla dimostrazione di un rapporto causa-effetto fra variabile
indipendente e variabile dipendente pu essere schematizzato nei tre stadi riassunti nel seguente
schema:
63
Lo schema pu risultare non molto esplicativo, soprattutto perch - probabilmente - non ti chiaro
il significato di alcuni termini. Ad esempio, senz'altro ti chiederai: che cosa vuol dire
statisticamente? E causalmente? E cosa significa associato? Cosa vuol dire causalit?
Ebbene, ti prego di avere un po' di pazienza... nelle prossime unit verr spiegato tutto.
Ti consiglio di considerare lo schema come una specie di scatola grigia di cui in seguito
apprenderai il funzionamento. Gi fin d'ora, per, devi tenere presente che per arrivare alla
conclusione che qualcosa causa qualcos'altro devi percorrere nell'ordine i tre stadi indicati nello
schema.
Riassumendo:
II stadio. Soltanto nel caso in cui le variabili siano statisticamente associate, necessario
accertare, mediante una serie di criteri accettati, che le due variabili siano causalmente
associate;
III stadio. la fase finale in cui, sulla base del rapporto causale tra le due variabili
dimostrato nelle due fasi precedenti, possono essere effettuate elaborazioni sulla natura e
sulle conseguenze dell'associazione, utilizzando modelli teorici, simulazioni, esperimenti in
laboratorio o in campo ecc.
Quando i ricercatori possono agire attivamente sulla variabile indipendente (cosa che non avviene
negli studi osservazionali ma in quelli sperimentali), e osservare le conseguenti modificazioni
64
sulla variabile dipendente, essi possono trarre valide conclusioni su quanto tali modificazioni nella
variabile dipendente siano causate da quelle verificatesi nella variabile indipendente.
Al contrario, quando i ricercatori possono soltanto osservare la contemporanea variazione delle due
variabili (come negli studi osservazionali), allora essi possono solo definire una associazione tra
di esse, dimostrata dal fatto che al modificarsi dell'una si modifica anche l'altra. In questo caso,
per, non si pu escludere l'eventualit che entrambe le variabili siano, in maniera indipendente
l'una dall'altra, influenzate da una terza variabile. In questo caso, tra le due variabili considerate non
esiste un nesso causale, e l'apparente (ma inesistente!) relazione causa-effetto dovuta ad un effetto
detto di confondimento. Questo argomento verr sviluppato successivamente.
Cap. 5. Dalla
associazione alla causalit
5.2 Associazione, causalit e casualit
OBIETTIVO:
Come promesso nell'unit precedente, comincio a spiegare il significato del termine associazione.
A questo scopo, inizialmente ti presento un esempio-domanda su cui ragionare usando il tuo buon
senso:
L'uomo comune osserva che in una buona parte (pi di un terzo!) dei casi di polmonite presente
anche il batterio, e quindi tende senz'altro a rispondere di s. Con un piccolo passo avanti, l'uomo
comune (... e forse anche tu!), sar probabilmente portato a concludere che il batterio la causa
della polmonite. Invece, di fronte ad un quesito di questo tipo, l'epidemiologia (ed il ragionamento
scientifico in genere) risponde non so: i dati forniti sono insufficienti.
Le motivazioni logiche che stanno alla base di questa risposta vengono esposte nella prossima
Unit.
66
Cap. 5. Dalla
associazione alla causalit
5.3 Associazione di eventi in epidemiologia
OBIETTIVI
Questa unit risponde ad un quesito che era stato formulato in precedenza, e che riguardava
l'esistenza o meno di associazione tra isolamento di Pasteurella multocida e polmonite del suino.
La risposta viene precisata nello schema soprastante. Essa chiama in causa il CASO, ed basata su
un procedimento logico che prevede un confronto fra la popolazione con la condizione in studio
(nell'esempio: polmonite) ed una popolazione di controllo, il pi possibile simile alla precedente
per quanto riguarda tutti gli altri fattori ma non affetta dalla malattia.
67
Supponiamo ora che il confronto NON evidenzi alcuna differenza: allora concluderemo
sicuramente che i due eventi non sono associati. Tuttavia, in pratica, molto difficile che i dati dei
due gruppi siano perfettamente corrispondenti; in altre parole, una differenza (in un senso o
nell'altro!) verr sempre evidenziata.
Supponiamo quindi che, pi verosimilmente, sia stata evidenziata una differenza fra i due gruppi e
che, per esempio, dai polmoni con polmonite si sia isolato il batterio con una frequenza superiore
a quella dei polmoni provenienti dalla popolazione sana di controllo. Ci non ancora sufficiente
per concludere che i due eventi (presenza del batterio e polmonite) sono associati. Infatti, la
differenza osservata potrebbe essere stata generata dal CASO!
se vero che il caso pu influenzare i risultati, come posso dimostrare l'esistenza di associazioni ed
essere ragionevolmente sicuro che le differenze osservate non sono dovute al caso?
La risposta deriva dalla scienza statistica che, attraverso metodi che verranno accennati in
seguito, consente di escludere (con un certo grado di probabilit, ma mai con assoluta certezza) che
una eventuale associazione sia dovuta appunto al caso (vedi schema seguente).
68
Infine bisogna sottolineare che, anche quando la statistica afferma che l'associazione fra due eventi
NON casuale (ed allora si dice che esiste una differenza significativa), resta ancora da
dimostrare che i due eventi siano legati da un rapporto causa-effetto. In altre parole,
associazione non sinonimo di causalit. Questo argomento verr trattato in seguito. In
particolare, il passaggio dalla dimostrazione dell'esistenza di una associazione (che stiamo trattando
ora) alla verifica se tale associazione di tipo causale verr illustrato nel Capitolo 6 (L'approccio
epidemiologico alle cause di malattia).
Non farti confondere dalla grande somiglianza fonetica ed ortografica fra i termini casuale e
causale, ed anche casualit e causalit. I due termini hanno un significato assolutamente
diverso!
Casuale = dovuto al caso;
Causale = legato da un rapporto di causa-effetto.
Foglio di calcolo per Microsoft Excel che simula l'estrazione di numeri da tombola.
69
Cap. 5. Dalla
associazione alla causalit
5.4 Significativit statistica e causalit
OBIETTIVI:
Attraverso un semplice esempio, in questa Unit ti prospetto i rischi che si corrono quando si
effettuano confronti, ed introduco il concetto di significativit statistica. una Unit preparatoria,
in quanto si accenna ad argomenti che verranno trattati pi in dettaglio nelle Unit successive in
questo stesso Capitolo.
Immagina di aver effettuato un esperimento su due piccoli gruppi di animali (ossia due campioni)
allo scopo di mettere a confronto l'efficacia di due farmaci nella terapia di una certa malattia.
In pratica, hai reperito un certo numero di animali ammalati, e ne hai trattati alcuni con il farmaco A
ed altri con il farmaco B. I dati che hai ottenuto depongono per una maggiore attivit di A:
70
Ora, prima di concludere che A davvero migliore di B (dove davvero significa che A migliore
di B non solo sul tuo campione, ma anche sulla tua popolazione di interesse, ossia su tutti gli
animali che sono e saranno affetti da quella malattia), devi riconsiderare criticamente il tuo
esperimento. Infatti, A pu essere apparso migliore di B nel tuo esperimento, anche se in realt non
lo .
In particolare, l'ipotesi (1), se verificata, frutto di una "colpa" dello sperimentatore, che ha
selezionato un campione NON rappresentativo della popolazione oggetto dello studio. Un
campione non rappresentativo si dice distorto (o affetto da bias, dall'inglese bias=distorsione).
Ovviamente un campione distorto fornisce risultati non affidabili.
71
ESEMPIO 1. Nel tuo esperimento, i cani trattati con A potevano essere pi giovani ed in migliori
condizioni generali (quindi pi portati a guarire, magari anche spontaneamente) rispetto a quelli
trattati con il farmaco B.
ESEMPIO 2. In uno studio sullo stato vaccinale dei cani di una certa regione, esamini un campione
costituito dai cani presentati per una visita in ambulatorio; tuttavia, questo campione non
rappresentativo della popolazione canina, in quanto non comprende i randagi o quelli male accuditi
dal proprietario e che quindi non vengono mai n vaccinati n sottoposti a visita veterinaria.
L'ipotesi (2) chiama in causa il caso e la variabilit biologica (che viene trattata altrove). Pensa di
eseguire di nuovo, per su altri animali, l'esperimento sull'efficacia dei due farmaci gi fatto: sei
sicuro che otterresti gli stessi risultati? No, appunto perch nell'andamento dell'esperimento si
inseriscono fattori diversi, noto e ignoti, dovuti appunto al caso.
Per isolare l'effetto del caso, e quindi per escludere l'ipotesi (2), devi ricorrere alla statistica,
applicando un test che ti permetta di verificare la significativit dei tuoi risultati.
72
Cap. 5. Dalla
associazione alla causalit
5.5 Confrontare due proporzioni o due percentuali: il test chi-quadrato
OBIETTIVO:
In questa unit ti presento un esempio di applicazione di uno dei test pi comuni e pi semplici, il
chi-quadrato.
L'esempio riguarda il confronto di due percentuali ottenute in un esperimento, allo scopo di
verificare se la differenza fra tali percentuali dovuta al caso oppure no. Se riuscirai a dimostrare
che la differenza non dovuta al caso, allora potrai affermare che essa statisticamente
significativa.
Ti ho gi spiegato lo schema logico da seguire . Lo schema molto semplice, in sostanza si tratta
di partire con una sorta di pregiudizio: qualsiasi sia la differenza esistente tra le due percentuali da
confrontare, inizialmente devi ritenere valida l'ipotesi zero. L'ipotesi zero (detta anche ipotesi
nulla) afferma semplicemente che la differenza osservata - di qualsiasi entit essa sia - dovuta al
caso. Questa ipotesi (che pu essere vera o falsa) verr accettata oppure rifiutata sulla base del
risultato di un appropriato test statistico. Nel confronto di due percentuali o di due proporzioni il
test appropriato , appunto, il test del chi-quadrato. In sintesi:
solo, con le tue forze, ore di dura salita, una piccola sfida con te stesso. Dimenticherai facilmente la
prima esperienza, mentre la seconda ti rester, forse, nel cuore per sempre.
Analogamente, puoi fare il test chi-quadrato usando il computer (... la funivia!), ed in questo caso
troverai in internet tanti strumenti adatti (ce n' uno anche alla fine di questa unit). Oppure puoi
leggere qui di seguito (la sfida: lacrime e sangue!) una spiegazione passo-passo del funzionamento
del test.
A te la scelta.
Vale la pena di commentare in dettaglio la struttura della Tabella 1, considerato che tabelle di
questo tipo verranno usate sia in questo Capitolo che, molto pi estensivamente nel Cap. 11 (Test di
screening e test diagnostici).
Si tratta di una tabella 2x2 (due righe per due colonne), detta anche tabella di contingenza.
Non farti trarre in inganno dal fatto che, in effetti, ci sono tre righe e tre colonne: infatti la vera
tabella contenente i tuoi dati occupa soltanto nelle quattro celle gialle a, b, c, d. Le altre sono
derivate da queste, e non sono altro che i totali di riga e di colonna.
Nella cella a sono indicati i soggetti che sono stati trattati con xmicina e che sono guariti; nella cella
b i trattati con xmicina non guariti; nella cella c i trattati con streptomicina guariti; nella cella d i
trattati con streptomicina non guariti. I due totali di colonna indicano rispettivamente il numero
complessivo di guariti e di non guariti, mentre i totali di riga indicano rispettivamente il numero di
trattati con xmicina e con streptomicina.
Nota che, con gli stessi dati, avresti potuto compilare una
tabella analoga alla Tabella 1, ma ruotata di 90 gradi,
ossia ponendo il trattamento sulle colonne e l'esito sulla
righe, come quella a lato. Questa impostazione sarebbe
stata ugualmente corretta. Per lo standard per tabelle di questo tipo quello di disporre la
variabile indipendente (nel nostro caso: il trattamento xmicina/steptomicina) sulle righe e la
74
variabile dipendente (nel nostro caso: guarito/non guarito) sulle colonne. Noi adotteremo sempre
questo standard.
Torniamo alla tabella 1. Puoi notare che, su un totale di 123 cani, 62 sono stati sottoposti a
trattamento con xmicina e, fra questi, si sono registrati 52 casi di guarigione (84%). Fra i restanti 61
animali, trattati con streptomicina, ne sono guariti 40 (66%).
evidente che i dati grezzi indicano che la xmicina pi efficace della streptomicina. Per la
superiorit di xmicina potrebbe essere dovutra al caso... Allora, prima di giungere ad una
conclusione affrettata, occorre rispondere alla seguente domanda:
Supponi che, in realt, NON esistano differenze nell'efficacia dei due trattamenti. Che
probabilit c' di osservare - in uno studio di dimensioni simili a questo - differenze nell'efficacia
dei due antibiotici uguali o superiori a quelle che hai osservato?
La risposta a questa domanda dipende da quanto i dati ottenuti si discostano dai dati che sarebbe
lecito attendersi se i trattamenti avessero la stessa efficacia e se i dati fossero influenzati soltanto
dalla variazione casuale.
Rileggi ancora con attenzione la frase precedente: la chiave per comprendere il background
razionale di un test statistico. Riformulo la stessa frase in modo leggermente diverso, e ti pongo la
seguente domanda: se xmicina = streptomicina (ipotesi zero!), possibile ottenere risultati simili a
quelli che hai osservato? La risposta s, perch i tuoi dati potrebbero essere stati influenzati dal
caso. Facciamo un altro passo avanti, e chiediamoci: qual la probabilit di osservare una
differenza uguale o superiore a quella che hai ottenuto nel tuo esperimento?
Guarda ancora la Tabella 1. I tuoi dati dimostrano che complessivamente (cio indipendentemente
dal tipo di antibiotico) il trattamento risultato efficace nel 74.8% dei casi. Infatti sono guariti,
sempre complessivamente ed indipendentemente dall'antibiotico utilizzato, 52+40=92 animali (a+c)
su 123 trattati.
Applicando questa percentuale di successo (74.8%) a ciascuno dei due gruppi di cani in esame
(gruppo xmicina e gruppo streptomicina), puoi ricavare i dati della sottostante Tabella 2, che illustra
la situazione che ti saresti aspettato se i due antibiotici avessero avuto la stessa efficacia.
75
Nella Tabella 2, hai calcolato il valore a=46 assumendo una percentuale di guarigione del 74.8% nei
62 cani trattati con xmicina: 62*74.8/100=46.37, cio, approssimando all'unit, a=46.
Analogamente, ti saresti aspettato la guarigione del 74.8% dei 61 cani trattati con streptomicina
ossia di 45.63 soggetti.
I valori delle celle b e d possono poi essere facilmente ottenuti per differenza:
b = 62-46.37 = 15.63
d = 61-45.63 = 15.37
Il valore del chi-quadrato quantifica la differenza fra i dati osservati e quelli attesi, ed la somma
delle quattro celle a, b, c e d, per ciascuna delle quali si calcola il valore della frazione:
La magnitudine del chi-quadrato determinata dalla differenza fra i numeri osservati ed i numeri
attesi nel caso in cui i due trattamenti avessero avuto lo stesso effetto. La differenza al numeratore
della frazione viene elevata al quadrato; ci elimina i numeri negativi che possono comparire
quando il numero osservato minore di quello atteso. Poi il quadrato della differenza viene diviso
per il numero atteso; in questo modo la differenza per ogni cella viene aggiustata in rapporto al
numero di individui della stessa cella.
Pertanto, calcoliamo il chi-quadrato come segue:
evidente che il chi-quadrato aumenta con l'aumentare della differenza dei dati posti a raffronto. Se
esso supera certi valori prefissati (vedi tabella Valori di chi-quadrato), la differenza viene ritenuta
significativa; in caso contrario, non si pu affermare l'esistenza di una significativa differenza tra i
due eventi considerati.
Non ti resta quindi che confrontare il valore ottenuto con la Tabella dei valori di chi-quadrato
(reperibile via Internet o in qualsiasi libro di statistica e di una porzione viene riportata qui sotto).
76
Nel tuo caso, il valore ottenuto un chi-quadrato con 1 grado di libert; infatti, per tabelle come
quella che stiamo studiando, il grado di libert uguale a (numero di righe-1)*(numero di colonne-
1). Quindi: (2-1) * (2.1) = 1 grado di libert. ci significa che ti interessa soltanto la prima riga della
tabella (celle in verde).
Ora, confrontando il tuo valore di chi-quadrato (5.46) con quelli tabulati, noti che esso >3.841 e
<6.635. Ci consente di ritenere che la differenza fra i due gruppi sia significativa al livello di
probabilit 5% ma non al livello di probabilit 1%.
Puoi concludere che la differenza tra animali trattati con xmicina e quelli trattati con streptomicina
statisticamente significativa al livello di probabilit 5%.
In altre parole: ammettendo che i due antibiotici abbiano pari efficacia e ripetendo l'esperimento
infinite volte, potremo osservare piuttosto raramente (ossia 5 volte su 100 o meno!) dati simili a
quelli ottenuti oppure ancor pi favorevoli a xmicina.
In sostanza: in base ai risultati del test del chi-quadrato, l'affermazione xmicina pi efficace di
streptomicina ha il 95% di probabilit di essere vera (e quindi ha il 5% di probabilit di essere
falsa).
Se tu dovessi stilare una relazione con i risultati del tuo lavoro, potresti concludere pi o meno
come segue: In base ai risultati ottenuti, xmicina risultata pi attiva di streptomicina (P<0.05)
dove il valore P indica la probabilit di respingere una ipotesi zero vera.
Il metodo del chi-quadrato utilizzabile quando il valore contenuto in ogni cella (celle a, b, c, d
nella precedente Tabella 1) >5, ed il numero totale di osservazioni >30; in caso contrario,
occorre usare altri test (ad esempio, il test di Fisher, detto anche test esatto di Fisher o test delle
probabilit esatte di Fisher).
Il test del chi-quadrato uno dei tanti test di significativit statistica esistenti. Nella prossima Unit
ne verr trattato un altro: il test "t", che serve per confrontare due medie.
Ricordati comunque un principio generale valido sempre: qualsiasi test di significativit non pu
mai provare con certezza che una ipotesi zero vera o falsa; esso pu solo fornire una indicazione
della forza con cui i dati contrastano l'ipotesi zero.
77
Il sistema di calcolo del chi-quadrato ora fornito piuttosto complicato, e costringe a generare -
come abbiamo fatto nell'esempio - una nuova tabella con i valori attesi. Esiste un altro tipo di
calcolo, pi semplice, che consente di ottenere il chi-quadrato direttamente dai valori osservati.
Tale calcolo basato sulla seguente formula:
Quando le frequenze attese sono basse (ma sempre >5) consigliabile utilizzare una formula del
chi-quadrato modificata secondo quanto proposto da F. Yates nel 1934:
I dati utilizzati nell'esempio sono fittizi ed utilizzati esclusivamente a scopo didattico per il calcolo
del chi-quadrato.
Il fatto che la differenza fra i due gruppi in studio sia risultata statisticamente significativa non
implica necessariamente che, nella pratica clinica, la xmicina avrebbe sostituito la streptomicina
nella terapia della leptospirosi del cane. Ad esempio, la xmicina potrebbe essere molto pi tossica,
oppure dotata di gravi effetti collaterali, oppure molto pi costosa ecc.
Infine, ti ricordo che il test chi-quadrato si pu estendere al confronto di pi di due gruppi, con
tabelle n x n. Per in tal caso il calcolo diverso da quello dell'esempio.
Foglio di calcolo per Microsoft Excel con un esempio di calcolo del chi-quadrato
78
Il mio consiglio: consolida quanto hai appreso risolvendo questo problema (si apre in una nuova
finestra)
Cap. 5. Dalla
associazione alla causalit
5.6 Confrontare due medie: il test t di Student
OBIETTIVO:
Nella unit precedente hai imparato come stabilire (attraverso il test del chi-quadrato) se due
proporzioni (o due percentuali) sono significativamente diverse fra loro.
Vi sono molte altre situazioni in cui devi risolvere un problema concettualmente simile: quello di
confrontare due (o pi) valori ottenuti studiando due (o pi) gruppi, ma avendo a disposizione,
invece di due percentuali, dati di altro tipo. Ad esempio, potresti confrontare una variabile
qualitativa con una variabile quantitativa, oppure una qualitativa con un'altra pure qualitativa, od
ancora pi variabili quantitative con una o pi variabili numeriche ecc. ecc. Ciascuno di questi casi
richiede un test statistico adatto.
Una circostanza frequente quella in cui si sono esaminati due (o pi) campioni di animali; sugli
animali di ciascun campione stata misurata una variabile numerica (es. altezza, peso, frequenza
cardiaca, produzione di latte ecc.), di cui stata poi calcolata la media.
Ti chiedi: la differenza fra le medie dei due campioni significativa?
Ossia: puoi affermare che la differenza osservata non dovuta al caso ma che, invece, esiste
veramente una diversit tra le medie delle due popolazioni da cui i campioni stessi derivano?
Oppure, esprimendoci in altro modo: puoi affermare che i due campioni appartengono a popolazioni
diverse riguardo alla variabile considerata?
80
Come vedi la questione, in buona sostanza, analoga a quella della unit precedente in cui hai
utilizzato il test del chi-quadrato per confrontare due proporzioni. Il fatto che la ricetta del chi-
quadrato va bene per confrontare due proporzioni, ma non utilizzabile se devi confrontare due
medie. Allora, devi ricorrere ad un altro test: ad esempio il test t (detto anche t di Student).
Lo schema di ragionamento da fare quello gi visto:
I calcoli da eseguire per effettuare il test t sono un po' pi complicati rispetto a quelli del chi-
quadrato, e perci non entreremo nei dettagli. Solo a titolo di curiosit, ecco la formula di calcolo
del valore t:
... e per i pi interessati (o masochisti?) dir che s la deviazione standard media delle deviazioni
standard dei due campioni, cio la radice quadrata della varianza che si ottiene sommando le
devianze dei due campioni e dividendo per la somma dei gradi di libert.
Una volta trovato il valore t, esso va confrontato con quelli tabulati in apposite Tabelle, che si
trovano in tutti i libri di statistica. Dal confronto fra il valore ottenuto e quello tabulato si potr
stabilire se la differenza fra le due medie dovuta al caso o no.
Ora che ti ho esposto brevemente il principio che "sta dietro" al calcolo del test t di Student, ti
81
consiglio di non preoccuparti pi di tanto di calcoli e tabelle di raffronto (che, fra l'altro, sono pi
complesse di quanti ti aspetteresti, vedi un esempio qui). Oggi, infatti, il test t si esegue al computer
con l'aiuto di apposito software, incluso in pacchetti statistici oppure reperibile in rete. Ad esempio,
alla fine di questa unit troverai un foglio di calcolo con cui calcolare il valore t su una serie di dati
che tu stesso puoi inserire.
In conclusione: importante che tu conosca non tanto il metodo di calcolo (difficile da ricordare),
quanto l'esistenza del test t ed il contesto in cui esso si applica. Ancora pi importante che tu sia
convinto che, anche nel confronto fra due medie, non si possono trarre conclusioni soggettive ad
occhio, ma indispensabile ricorrere ad un test statistico.
Stai sperimentando l'effetto sul suino dell'aggiunta alla razione di una miscela probiotica
costituita da batteri normalmente presenti nella flora intestinale del suino. L'ipotesi da verificare
che il probiotico favorisca l'accrescimento degli animali.
Allo scopo di verificare l'ipotesi, hai disegnato uno studio sperimentale preliminare su due piccoli
gruppi di suini. I gruppi sono fra loro omogenei (stessa razza, et, provenienza ecc.) e sono
mantenuti nelle stesse condizioni di allevamento (alimentazione, temperatura ambiente ecc.).
L'unica differenza che alla razione del Gruppo 1 (10 suini) viene aggiunto il probiotico, mentre al
gruppo 2 (11 suini) no.
All'inizio dell'esperimento ciascun suino viene pesato; dopo 21 giorni di trattamento i suini vengono
pesati di nuovo e per ogni animale si calcola l'incremento giornaliero medio. I dati (fittizi) sono
riportati nella tabella che segue.
82
Confrontando le medie degli accrescimenti, puoi notare che il valore del Gruppo 1 superiore a
quello del Gruppo 2 (643.8 g/giorno contro 637.0 g/giorno). La domanda : questa differenza
dovuta al probiotico oppure al caso?
L'ipotesi zero dice che la differenza dovuta al caso... accetti o rifiuti questa ipotesi? Per
rispondere, puoi applicare ai tuoi dati il test t.
Tieni presente, per, che il test t test va bene soltanto se i dati hanno una distribuzione Normale (se
ti serve un rapido ripasso di questo argomento, dai un'occhiata al Cap. 7). La trattazione dei
metodi per verificare la Normalit di un set di dati va oltre gli scopi del Quaderno. In linea di
massima, si utilizza un software statistico (tutti i pacchetti statistici hanno funzioni adatte a questo
scopo). In Excel, si possono utilizzare le formule ASIMMETRIA e CURTOSI.
I dati dell'esempio, sottoposti ad analisi, risultano avere una distribuzione normale. Se lo desideri,
puoi avviare una breve presentazione animata che illustra l'analisi dei tuoi dati con un software
statistico.
Infine, per i pi interessati, aggiungo che, se i dati non hanno una distribuzione normale,
necessario normalizzarli (con metodi sui quali non mi dilungo) oppure ricorrere ad test diversi dal t
di Student (es. il Test Mann-Whitney o il Test di Wilcoxon).
Una volta verificata la Normalit dei tuoi dati, puoi tranquillamente applicare il test t, magari
utilizzando questo foglio di calcolo.
Se non hai installato Excel sul tuo PC, puoi vedere una immagine di output del programma.
Nel foglio di calcolo dovrebbero essere gi presenti i dati corretti (in caso contrario, li puoi inserire
tu).
Come vedi dall'output di Excel, con i tuoi dati ottieni un valore t pari a 2.2796.
Che farne, di questo valore? Il procedimento di base abbastanza simile a quello che hai gi
appreso nel caso del test Chi-quadrato. In pratica, devi confrontare il valore t che hai ottenuto
(2.2796) con quelli presenti nella Tabella dei valori t, per 19 gradi di libert (gradi di
libert=numero osservazioni-numero gruppi; nel nostro esempio 21-2=19). Il tuo valore superiore
a quello della colonna p=5% (ma inferiore a quello della colonna p=1%). Perci puoi rifiutare
l'ipotesi zero e concludere che la differenza significativa per p<0.05 (ma non per p<0.01).
Ci significa che c' una probabilit inferiore al 5% (ma non all'1%) che la differenza di
accrescimento tra il gruppo trattato e quello di controllo sia dovuta al caso.
Nota che i due valori p (0.05 e 0.01) sono valori convenzionalmente utilizzati nel modo scientifico
(questo concetto viene spiegato meglio nella prossima unit).
Se hai utilizzato il mio foglio di calcolo (oppure un software statistico), il passaggio test descritto
(ossia quello di confrontare il tuo valore t con i valori della Tabella per 'n' gradi di libert) inutile:
infatti il programma restituisce direttamente il valore p.
83
I risultati di un test statistico vanno interpretati correttamente. Vale la pena di ripetere qui quanto
gi detto nella Unit precedente a proposito del test del chi-quadrato: qualsiasi test di significativit
non pu mai provare con assoluta certezza che una ipotesi zero vera o falsa; esso pu solo fornire
una indicazione della forza con cui i dati contrastano l'ipotesi zero.
Per consolidare quanto appreso in questa unit ti consiglio di leggere subito la successiva, che
tratta i concetti di livello di significativit e di ipotesi zero.
Il mio consiglio: consolida quanto hai appreso risolvendo questo problema (si apre in una nuova
finestra)
84
Cap. 5. Dalla
associazione alla causalit
5.7 Prove di significativit
OBIETTIVO:
Ovviamente l'ipotesi zero pu essere vera o falsa. Ora tu devi decidere: accetti o rifiuti l'ipotesi
zero?
Per decidere devi analizzare i tuoi dati con un test statistico. Se il test ti consiglia di rifiutare
l'ipotesi zero, allora la differenza osservata viene dichiarata statisticamente significativa. Se invece
il test ti consiglia di accettare l'ipotesi zero, allora la differenza statisticamente non
significativa.
Come sempre avviene, i risultati di un test statistico non hanno un valore di assoluta e matematica
certezza, ma soltanto di probabilit. Pertanto, una decisione di respingere l'ipotesi zero (presa
sulla base del consiglio del test statistico) probabilmente giusta, ma potrebbe essere errata. La
misura di questo rischio di cadere in errore si chiama livello di significativit del test.
Il livello di significativit di una prova pu essere scelto a piacere dallo sperimentatore. Tuttavia, di
solito si sceglie un livello di probabilit di 0.05 (5%) o di 0.01 (1%). Questa probabilit (detta
valore P) rappresenta una stima quantitativa della probabilit che le differenze osservate siano
dovute al caso.
85
ESEMPIO. Hai effettuato una sperimentazione su due gruppi di animali affetti da una malattia. Un
gruppo stato trattato con il farmaco A, e l'altro con il farmaco B. Hai notato che gli animali trattati
con A guariscono di pi rispetto a quelli trattati con B. Per questo effetto potrebbe essere dovuto al
caso... sei sicuro che, ripetendo l'esperimento, otterresti ancora dati che indicano che A migliore di
B? Ovviamente no!
Allora, a partire dai tuoi dati, devi calcolare il valore P: in questo modo ottieni una stima
quantitativa della probabilit che le differenze osservate siano dovute al caso. In altre parole, P la
risposta alla seguente domanda: se in realt non ci fossero differenze fra A e B, e se la
sperimentazione fossa eseguita molte volte, quale proporzione di sperimentazioni condurrebbe alla
conclusione che A migliore di B?
se l'ipotesi zero viene respinta al livello di significativit 1%, allora abbiamo l'1% di
probabilit di respingere un'ipotesi zero che - in effetti - era vera;
pi in generale, se l'ipotesi zero viene respinta al livello di significativit n%, allora abbiamo
n% di probabilit di respingere un'ipotesi zero che - in effetti - era vera.
Numerosi test statistici vengono usati per determinare con un certo grado di probabilit l'esistenza
(o l'assenza) di differenze significative nei dati in esame o meglio, pi in generale, di accettare o
rigettare una ipotesi zero. Il test del chi-quadrato ed il test t sono gi stati brevemente illustrati.
Nella tabella che segue vengono elencati alcuni dei test pi comunemente impiegati nella ricerca
medica, ed il loro campo di applicazione. Ulteriori dettagli riguardo a questi test, ed ad altri non
indicati nella Tabella, possono essere reperiti in tutti i libri statistica.
87
Cap. 5. Dalla
associazione alla causalit
5.8 Associazione e causalit: tipi di associazione
OBIETTIVO:
Gli studi epidemiologici spesso sono rivolti a stabilire l'esistenza di un'associazione statistica tra due
variabili in studio: la prima variabile di solito costituita da un presunto determinante (oppure
dalla esposizione ad un certo fattore), mentre la seconda variabile la comparsa della malattia.
L'accertamento dell'esistenza di una associazione fra le due suddette variabili soltanto il primo
passo sulla strada che conduce alla dimostrazione di una relazione causa-effetto fra le due variabili.
Una volta dimostrato che l'associazione esiste, necessario eseguire un secondo passo,
rappresentato dalla interpretazione del significato dell'associazione.
Questo secondo passo consiste, in sostanza, in una revisione critica del lavoro svolto, al fine di
verificare se sono stati evitati alcuni tranelli frequenti in studi di questo tipo. Infatti, esistono
anche associazioni non legate all'esistenza di una rapporto causa-effetto: sono le associazioni spurie
e le associazioni non causali.
Un'associazione spuria quella dovuta alla presenza di errori sistematici. L'errore sistematico
un errore che prevedibilmente causa, durante le osservazioni di raccolta dei dati, lo stesso tipo di
errore oppure un errore che va sempre nella stessa direzione. Esso dovuto a vizi nella
impostazione o nella esecuzione di uno studio.
89
Gli errori sistematici possono conseguire a svariati fattori (es. errato campionamento, imprecisione
nella diagnosi ecc.) e, in definitiva, conducono ad una stima errata (per difetto o per eccesso)
della forza dell'associazione.
ESEMPIO 1. L'utilizzo di una bilancia mal tarata, (che, per esempio, indica il 10% in pi del peso
effettivo) per stimare il peso di un gruppo di suini provoca un errore sistematico.
ESEMPIO 2. Nello studio dell'immunit nei confronti del virus della rabbia in una popolazione di
cani, l'esame di un campione di animali scelti fra quelli portati in un ambulatorio veterinario
probabilmente causa di un errore sistematico.
Una associazione non causale pu essere la conseguenza di una confusione fra causa ed effetto.
Questo argomento viene accennato in una Unit successiva.
Pi frequentemente, una associazione non causale deriva dal fatto che la malattia e l'esposizione
sono entrambe associate ad un altro fattore x, il quale il vero responsabile dell'associazione; in
questo caso si dice che l'associazione mediata dal fattore x. Una interazione di questo tipo prende
il nome di confondimento. Il confondimento viene trattato in una Unit successiva.
90
Cap. 5. Dalla
associazione alla causalit
5.9 Modello generale di associazioni causali e non causali
OBIETTIVO:
gi stato detto che una associazione statistica pu indicare l'esistenza di una correlazione causale
tra la variabile in studio ed il fenomeno osservato. Tuttavia, la semplice esistenza di una
associazione non dimostra necessariamente l'esistenza di un rapporto causa-effetto fra le due
variabili risultate associate. Per giustificare questa osservazione, ti propongo un esempio (v. schema
sottostante) tratto dalla vita quotidiana, in cui i fattori consumo e rumore risultano associati pur
non essendo legati da una relazione causa-effetto. evidente, infatti, che un consumo elevato di
carburante non causa di alta rumorosit n, viceversa, una elevata rumorosit provoca un aumento
del consumo.
La variabile A la vera causa della malattia; le due variabili di risposta, B e C, sono due
manifestazioni della malattia. Nel modello le frecce nere mostrano l'esistenza di una associazione
statistica causale tra A e B e tra A e C. In altre parole,
Tuttavia, pu essere dimostrata anche una associazione statistica (non causale, freccia rossa
tratteggiata) tra B e C, derivante proprio dal fatto che B e C sono entrambe (ma separatamente)
associate allo stesso fattore A. Cio:
ESEMPIO. Nello schema sottostante mostrato un esempio una correlazione di questo tipo.
L'esempio riguarda l' infestazione da Haemonchus contortus. Questo parassita un nematode
ematofago del bovino, pecora e capra che si localizza nell'abomaso provocando lesioni localizzate
alla mucosa (edema, emorragie
puntiformi, iperplasia, erosioni
ecc.). Esso si nutre di sangue e
quindi, quando presente in gran
numero, provoca anche anemia.
Supponiamo di effettuare uno studio
epidemiologico su questa malattia, al
fine di dimostrare l'esistenza di
associazioni tra le seguenti variabili:
92
Cap. 5. Dalla
associazione alla causalit
5.10Esempio di associazioni causali e non causali
OBIETTIVO:
evidente che i proprietari premurosi nei confronti del loro animale effettuano il trattamento
preventivo. Ne consegue che i cani con filariosi pi frequentemente appartengono a proprietari che
poco si curano della salute dei loro animali. Proprio per questo stesso motivo, sar probabile che i
cani con filariosi abbiano anche una una infestazione da pulci.
In base a quanto detto finora, attraverso uno studio epidemiologico potresti certamente dimostrare
una associazione statistica tra filariosi e infestazione da pulci, e magari su questa base saresti tentato
di avanzare ipotesi errate come, ad esempio, che la pulce sia importante nel ciclo biologico della
filaria.
Invece, l'associazione osservata di tipo non causale, come illustrato nello schema sottostante.
94
bene ripetere che associazione non sinonimo di causa. ovvio che, per dimostrare l'esistenza
di un rapporto causa-effetto, non sufficiente raccogliere ed analizzare dati e dimostrare l'esistenza
di una associazione, ma necessario anche conoscere in maniera approfondita il problema che si
affronta.
Le regole per dichiarare l'esistenza di una relazione causa-effetto variano in rapporto ai settori di
studio. Probabilmente le scienze fisiche sono privilegiate, in quanto consentono di disegnare
esperimenti nei quali un singolo componente pu essere isolato e studiato.
Grandissime difficolt emergono invece in altri settori, come ad esempio quello della storia: qui,
non solo gli esperimenti sono impossibili, ma i dati provengono dal passato e non possono essere
facilmente verificati. Secondo alcuni studiosi, un certo numero di affermazioni sorprendenti su
cause-effetti nella storia non erano basate su fondamenti di logica e dovevano essere respinte. Fra
gli esempi pi clamorosi: (1) Non sono mai state dichiarate guerre tra nazioni in cui erano diffusi
ristoranti McDonald e (2) Prima della televisione: due guerre mondiali; dopo la televisione, nessuna
guerra mondiale.
95
Cap. 5. Dalla
associazione alla causalit
Associazione e causalit: esempio di confusione causa-effetto
OBIETTIVO:
per mezzo di un esempio, mostrare come si possa incorrere in un errore grossolano: scambiare la
causa per l'effetto.
Talvolta, nello studio delle cause di un fenomeno, pu accadere di confondere la causa con l'effetto.
In questa Unit ti presento un esempio di questo
grossolano errore.
La salmonellosi del pollame una importante malattia sostenuta dal batterio Salmonella enterica. Il
ciclo di diffusione di questo agente molto complesso e prevede un intreccio di passaggi tra
animali, ambiente e uomo, tenendo presente che la salmonella viene eliminata nell'ambiente
attraverso le feci. La contaminazione degli ambienti e l'infezione degli animali possono diventare
persistenti, anche a causa della notevole resistenza del batterio nell'ambiente (molti mesi in assenza
di disinfezioni).
La lettiera, come avrai modo di imparare durante il corso degli studi, un elemento di importanza
fondamentale nell'allevamento dei broiler. E' costituita da materiali diversi (di solito paglia o
trucioli), ed ha lo scopo di isolare i polli dal pavimento, di assorbire l'umidit delle deiezioni, di
ridurre il contatto con le deiezioni e, attraverso le sue fermentazioni, di produrre calore e contrastare
o inibire lo sviluppo di agenti patogeni. La lettiera deve rimanere sempre asciutta (umidit <50%).
Una lettiera bagnata favorisce la comparsa di malattie diverse, oltre a provocare una riduzione
delle prestazioni degli animali.
Come vedi, la frequenza di isolamento di Salmonella dalle lettiere bagnate (47.4%) risultata
superiore a quella da lettiere normali (16.9). Questa differenza statisticamente significativa
(P=0.013, test Chi-quadrato).
A questo punto, potresti essere tentato di concludere (avventatamente) che un eccesso di umidit
della lettiera un determinante della salmonellosi dei broiler. Per, la tua ipotesi di causalit
risulterebbe infondata per aver confuso la causa con l'effetto!
Infatti, la presenza di salmonellosi pu causare una enterite cronica, accompagnata da diarrea.
L'emissione di feci liquide provoca sovraccarico della lettiera che non pi in grado di mantenersi
al giusto grado di umidit. Pertanto, l'infezione che causa un aumento dell'umidit, e non
viceversa.
Esiste un secondo motivo per cui la tua ipotesi di relazione causa-effetto infondata. Tale motivo
riguarda riguarda la mancata verifica di rispondenza ai criteri di causalit (che verranno trattati in
Unit successive: postulati di Evans, regole di J. S. Mill, criteri di causalit). Ricordati che la
dimostrazione dell'esistenza di un'associazione, anche se statisticamente significativa, soltanto il
primo passo sulla strada della causalit. A questo primo passo deve necessariamente seguirne un
altro: l'interpretazione del significato dell'associazione.
97
Cap. 5. Dalla
associazione alla causalit
5.12 Associazioni non causali e fattori di confondimento
OBIETTIVO:
Abbandoniamo per un attimo la scienza veterinaria per illustrare un ipotetico studio epidemiologico
eseguito sull'uomo; l'esempio particolarmente interessante in quanto, oltre ad essere altamente
dimostrativo, considera una malattia dell'uomo frequente nei paesi progrediti ( l'infarto
miocardico), e due presunti fattori causali legati ad abitudini molto diffuse: l'assunzione di caff ed
il fumo di sigaretta.
Immaginiamo che lo studio sia stato eseguito su una popolazione costituita da individui di sesso
maschile di et compresa fra 39 e 59 anni. La popolazione stata cos definita in quanto comprende
soggetti pi "a rischio" per la patologia considerata. Lo scopo dello studio quello di verificare
se il consumo di caff pu essere ritenuto un determinante dell'infarto alle coronarie.
Per lo studio stato reclutato un campione di 2600 persone, di cui 1300 erano forti bevitori di caff
e 1300 invece non consumavano questa bevanda. Definiamo i primi "C+" ed i secondi "C-". Tutte le
persone all'inizio dello studio erano in salute. Esse sono state seguite per 8 anni (periodo di "follow-
up"), registrando i casi di infarto avvenuti nei due gruppi. Il disegno dello studio illustrato nello
schema che segue.
98
Come si vedr in una unit successiva, un disegno dello studio di questo tipo tipico dei
cosiddetti "studi prospettivi", detti anche "studi di coorte".
Alla fine dello studio, risulteranno noti i dati rappresentati dai punti interrogativi nello schema
precedente. Ovviamente i valori che useremo sono fittizi, e sono stati scelti allo scopo di rendere
l'esempio didatticamente pi semplice.
Tali valori sono riassunti nella Tabella 1, da cui puoi subito notare come nel campione si siano
complessivamente verificati, nel periodo considerato, 295 casi di infarto su 2600 individui. Quindi
la proporzione di individui colpiti 295/2600 = 0.113 = 11.3%. In una prossima unit verr
spiegato come questa proporzione rappresenti una delle pi importanti misure di frequenza delle
malattie. Per ora basta dire che essa detta "incidenza" e che non una pura e semplice
proporzione, ma un tasso, in quanto prende in considerazione la variabile nel tempo (il periodo di
osservazione di 8 anni).
I dati in Tabella 1 dimostrano che l'incidenza nei bevitori di caff (C+) nettamente superiore
rispetto ai non-bevitori (C-):
Per verificare che la suddetta differenza non sia da attribuire al caso, devi sottoporre i dati ad un test
statistico. Come gi hai appreso in precedenza, il test da utilizzare per confrontare due
proporzioni il test chi-quadrato.
Se sul tuo computer installato MS Excel o un programma compatibile, puoi verificarlo tu stesso
trascrivendo gli appropriati valori nelle celle a sfondo verde azzurre del foglio di calcolo .
Se non hai installato MS Excel, puoi vedere la schermata che si ottiene).
Il valore del chi-quadrato ottenuto molto elevato (69.7); a ci corrisponde una probabilit
estremamente bassa (P<0.0001) che la differenza fra i due gruppi sia dovuta al caso. Quindi, tale
differenza "statisticamente significativa".
Pertanto, puoi concludere che esiste una associazione statistica positiva tra incidenza di infarto
e assunzione di caff (per inciso, ricordati che le associazioni possono essere anche negative,
come quando il fattore provoca una riduzione della frequenza dell'effetto considerato). Nell'esempio
che stai esaminando, hai rilevato una associazione "positiva": in parole povere: "pi caff si beve,
pi probabile essere colpiti da infarto".
99
A questo punto per pu sorgere il dubbio che la differenza osservata non sia dovuta al caff,
ma a qualche altro elemento legato al consumo di caff e non tenuto in considerazione nello studio.
Ad esempio, si pu supporre ragionevolmente che i C+ conducano una vita pi sregolata e
stressante rispetto ai C-, e che siano anche pi dediti al vizio del fumo. Gi: il fumo di sigaretta
notoriamente un determinante di infarto, e in questo studio esso potrebbe aver rappresentato quello
che viene detto un "confondente" (in inglese: confounder) o "fattore di confondimento".
Il confondimento una situazione in cui un fattore (o una combinazione di fattori) diverso da quello
in studio responsabile, almeno in parte, dell'associazione che abbiamo osservato. Quando
presente un fattore di confondimento, i dati grezzi mostrano un quadro sbagliato della correlazione
tra causa ed effetto.
Vediamo adesso se, nel nostro campione, il fattore fumo associato all'infarto. A questo scopo,
attraverso le schede anamnestiche dei 2600 individui studiati, risaliamo allo stato di fumatore-s
(F+) o fumatore-no (F-) di ciascuno. Poi tabuliamo i dati delle due nuove sottopopolazioni (F+ e F-)
riguardo all'insorgenza di infarto. Con un linguaggio pi propriamente epidemiologico potremmo
dire: stratifichiamo la popolazione in base al fattore fumo.
Otteniamo i dati della Tabella 2:
Anche in questo caso, il test chi-quadrato (ormai puoi eseguirlo da solo!) dimostra che la differenza
fra la frequenza di infarto nei fumatori e la frequenza di infarto nei non fumatori statisticamente
significativa (P<0.0001), e quindi non pu essere attribuita al caso.
Per isolare l'effetto dell'assunzione di caff da quella del fumo, necessario approfondire l'analisi,
calcolando i tassi di incidenza per ambedue le variabili.
100
Notare che i dati in Tabella 3 sono conformi a quelli delle tabelle 1 e 2, cosa che pu essere
facilmente verificata calcolando, ad esempio: il totale dei bevitori di caff 1085+215 = 1300; il
totale dei non-bevitori di caff 80+1220 = 1300; l'incidenza nei fumatori [(20+200)/1100)]= 0.20;
l'incidenza nei bevitori di caff [(215/1300 = 0.165)]; ecc..
I dati della Tabella 3 forniscono nuove, importanti informazioni. Proviamo a controllare come varia
l'incidenza nei C+ e nei C- tenendo fissa la variabile fumo:
Nei fumatori:
Incidenza in F+C+ = 200/(200+800) = 0.20
Incidenza in F+C- = 20/(20+80) = 0.20
Nei non-fumatori
Incidenza in F-C+ = 15/(15+285) = 0.05
Incidenza in F-C- = 60/(60+1140) = 0.05
Verifichiamo ora come varia l'incidenza negli F+ e F- tenendo fissa la variabile caff:
Nei bevitori:
Incidenza in C+F+ = 200/(20+800) = 0.20
Incidenza in C+F- = 15/(15+285) = 0.05
Nei non-bevitori
Incidenza in C-F+ = 20/(20+80) = 0.20
Incidenza in C-F- = 60/(60+1140) = 0.05
Come vedi, l'associazione fra infarto e consumo di caff non reale, ma mediata dal fumo di
sigaretta. La variabile-fumo ha agito come fattore di confondimento perch non era distribuita
uniformemente all'interno dei due gruppi C+ e C- (guarda i due sottostanti diagrammi a torta) ed
101
inoltre era in grado di influenzare l'effetto studiato (l'infarto). Se essa fosse stata distribuita
uniformemente, l'effetto di confondimento non avrebbe potuto essere evidenziato. In sostanza,
l'eccesso di casi di infarto riscontrato nei C+ dovuto alla pi alta proporzione di fumatori in questo
stesso gruppo rispetto al gruppo C-.
L'argomento trattato in questa unit concettualmente molto vicino a quanto si dir nell'unit
"Standardizzazione delle misure" (Capitolo 10: Misure di frequenza delle malattie).
P.S. Nonostante i dati utilizzati in questo esempio siano immaginari, si ritiene che il caff non incrementi
il rischio di infarto cardiaco. invece provato al di l di ogni ragionevole dubbio che che il fumo di
sigaretta una delle cause pi importanti di questa grave malattia. Perci, sia questo esempio occasione
per un utile consiglio: se fumi, smetti!
102
6. L'approccio
epidemiologico alle cause di malattia
6.1 Postulati di Henle-Koch
OBIETTIVO:
porre l'attenzione sugli storici postulati che, alla fine XIX secolo, hanno gettato le basi per una
moderna visione della causalit delle malattie
Lo stesso Koch si rese conto che il suo schema aveva alcune limitazioni. Per esempio, l'agente del
colera dell'uomo, Vibrio cholerae, poteva essere isolato sia da individui ammalati che sani,
invalidando il punto 2 dei postulati. Ciononostante, i postulati di Henle-Koch hanno contribuito in
modo determinante allo sviluppo del concetto di causa in medicina. Infatti, fin verso la fine del
XIX secolo le posizioni della scienza al riguardo erano molto confuse; si credeva spesso che una
data malattia infettiva potesse essere provocata da batteri di diversa specie. In questo panorama
103
incerto, il lavoro di Koch port ordine nel caos. Sotto alcuni punti di vista, il fondamento dei suoi
postulati valido ancora oggi: ad esempio, la regola secondo la quale un dato microrganismo causa
una sola e ben determinata malattia alla base della dimostrazione (avvenuta nel 1977) che la
"malattia dei legionari" provocata da un batterio o che l'AIDS provocata da un virus (anni '80).
La sagacia del postulati di Henle-Koch risiede nella loro logica semplice: in sostanza, essi
richiedono che, prima di dichiarare che un dato microrganismo causa una data malattia, sia
necessario (a) associarlo ad una sindrome clinica, (b) isolarlo in coltura pura, (c) riprodurre la
malattia re-inoculandolo in un animale recettivo e (d) reisolare lo stesso agente da quest'ultimo
animale (v. schema seguente).
Come gi detto, i postulati portavano finalmente ordine in un settore della medicina in cui ancora
regnavano largamente empirismo e superstizione. La loro adozione consent all'epoca di ottenere
insperati successi nella prevenzione e nel controllo di numerose malattie batteriche.
Dopo oltre un secolo di progressi della medicina, l'impostazione dei postulati di Koch non pu pi
essere ritenuta valida ed stata soggetta a profonda revisione critica. In particolare, si pu osservare
che, ancora oggi, indiscutibile che un microrganismo che risponde ai postulati la causa della
malattia in questione. Tuttavia, la domanda importante : questo microrganismo la sola e
completa causa?
In effetti, oggi esistono molte malattie infettive che non soddisfano lo schema rigido di Koch, che
ignora i fattori ambientali e associa una sola causa ad una malattia e una sola malattia ad una
causa. Il principale limite dei postulati proprio quello di non considerare la possibilit di una
eziologia multipla (una malattia, molte cause - o meglio: determinanti) n l'eventualit che una
stessa causa possa indurre malattie differenti.
Recentemente stato effettuato un tentativo di riformulare i postulati di Koch alla luce delle attuali
conoscenze di biologia molecolare, a partire dal principio di base che una sequenza di acido
104
nucleico appartenente ad un ipotetico patogeno (e non pi l'agente stesso) dovrebbe essere presente
in molti casi della malattia in studio. (Per una trattazione approfondita di questo argomento si rimanda a Fredericks DN, & Relman
DA (1996). Sequence-based identification of microbial pathogens: a reconsideration of Koch's postulates. Clinical microbiology reviews, 9 (1), 18-33.
6. L'approccio
epidemiologico alle cause di malattia
6.2 Postulati di Evans
OBIETTIVO:
prendere visione di una moderna impostazione della causalit delle malattie, cos come proposta
da Evans nel 1976
da notare come in tutti i postulati venga usato il verbo condizionale; ci indica che i 7 postulati
qui riassunti non rappresentano regole assolute da rispettare tutti insieme e ad ogni costo. Essi
devono piuttosto essere considerati come linee-guida dei ragionamenti di causalit nello studio
sulle cause di malattia.
106
L'ultimo postulato, non mostrato nello schema, vuole che All findings should make biological and
epidemiological sense. Ci significa che l'associazione tra l'ipotetico fattore causale e la malattia
deve essere biologicamente plausibile. Inoltre, l'epidemiological sense chiama in causa la
significativit statistica, concetto gi espresso pi volte nelle precedenti unit, che implica che lo
studio di raffronto debba essere condotto gruppi (o popolazioni) di animali, piuttosto che sul singolo
individuo.
Per la versione originale dei postulati, vedi: Evans A.S. (1976) Causation and disease: the Henle-
Koch postulates revisited. Yale J. Biol.Med., 49, 175-195. Evans A.S. (1978) Causation and
disease: a chronological journey. Am. J. Epid., 108:249-58.
107
6. L'approccio
epidemiologico alle cause di malattia
6.3 Prove di colpevolezza: criminalit e causalit
OBIETTIVO:
verificare come le cause di malattia trovino corrispondenza in un ambito ben diverso da quello
della medicina!
Nella Tabella soprastante sono elencati, nella parte destra, alcuni principi generali di causalit di
malattia che ricalcano largamente i postulati di Evans; questi principi sono stati posti a raffronto,
dallo stesso Evans, con i principi generali che muovono un ben diverso settore delle attivit umane:
il crimine.
108
In particolare, uno dei punti pi significativi il n. 3 che, invocando il ruolo dei cofattori (cio
fattori accessori di malattia o determinanti), porta un taglio netto alla vecchia impostazione di
Koch.
Il punto 5 precisa che il ruolo della presenta causa deve essere biologicamente credibile; cio, il
fattore in gioco deve disporsi agevolmente nel mosaico delle conoscenze consolidate riguardo alla
malattia.
Il punto 6 sembra un piccolo passo indietro rispetto alla concezione della causalit multipla; in
effetti, non sono rari gli esempi della possibilit che una stessa malattia venga indotta da cause
diverse; tuttavia, la precisazione nelle date circostanze chiarisce il concetto: si deve intendere,
infatti, che a parit di altri elementi (cio nella stesso punto della rete delle cause) solo il fattore
in gioco pu indurre la malattia in questione.
Infine, il punto 7 afferma che la causalit deve essere provata al di l di ogni ragionevole dubbio.
Questa affermazione porta in s il concetto di probabilit; in altre parole, non necessario
ricercare una prova di causalit matematicamente certa, ma occorre tuttavia che la prova sia provata
con un alto grado di probabilit; ci possibile soltanto ricorrendo alla statistica.
109
6. L'approccio
epidemiologico alle cause di malattia
6.4 Cause di malattia: regole di John Stuart Mill
OBIETTIVO:
adattare alle cause di malattia i cinque principi generali ( o canoni) elaborati dal filosofo J.S.
Mill
6. L'approccio
epidemiologico alle cause di malattia
6.5 Dimostrazione della causalit
OBIETTIVO:
Nelle Unit precedenti abbiamo preso in considerazione alcuni test statistici da utilizzare per
verificare l'esistenza di una associazione. Tuttavia, nessun test statistico pu dimostrare, di per s, la
prova della causalit di una associazione, ossia la prova dell'esistenza di una relazione causa-effetto
fra il fattore studiato e la malattia. Il test statistico soltanto uno strumento per superare il primo
passaggio, ossia quello della dimostrazione dell'esistenza una associazione. Il passaggio successivo
consiste nel verificare la causalit della associazione.
In sostanza, al fine di dimostrare l'esistenza di una relazione causa-effetto tra due fenomeni,
occorre
6. L'approccio
epidemiologico alle cause di malattia
6.6 I cinque criteri di causalit
OBIETTIVO:
Qualsiasi metodo statistico non pu costituire, di per s, la prova che un'associazione tra due
fenomeni sia basata su una relazione causa-effetto. Infatti, la prova deve avvenire seguendo una
metodica accettata nel mondo scientifico, e cio verificando la rispondenza a precisi criteri di
causalit.
Sono gi stati descritti i postulati di Henle-Koch, i postulati di Evans, e le regole di J.S. Mill,
che possono essere considerati veri e propri criteri di causalit. Per ai fini didattici, credo sia pi
utile riassumere i criteri di causalit in soli cinque punti facilmente comprensibili. Questi cinque
criteri derivano dalla proposta dello statistico inglese Sir Austin Bradford Hill (1965) e da quella del
Comitato Consultivo per la Salute Pubblica degli U.S.A. (1964). I cinque criteri, elaborati in un
ampio studio riguardante l'effetto del fumo nell'uomo, sono accettati nella comunit scientifica e
sono adattabili anche alle malattie degli animali:
113
Consistenza
La consistenza di un'associazione richiede che studi diversi, eseguiti in tempi diversi ed in diverse
condizioni sperimentali, evidenzino la stessa associazione.
"E questa sperienza si faccia pi volte, acci che qualche accidente non impedissi o falsassi tal prova, che le sperienzia
fussi falsa, e ch'ella ingannassi o no il suo speculatore" [Leonardo da Vinci].
Forza
Anche l'odds ratio costituisce un sistema per valutare la forza di una associazione.
Specificit
La specificit misura la costanza con cui una specifica esposizione produce una determinata
malattia; ovviamente, pi la risposta biologica alla presunta causa costante, e pi probabile che
quest'ultima sia una causa effettiva. Questo criterio applicabile soprattutto alle malattie infettive,
nelle quali - generalmente - l'esposizione ad un particolare agente di malattia provoca la comparsa
di quella stessa malattia. invece difficilmente applicabile a molte malattie cronico-degenerative
114
ove un singolo determinante (es. fumo di sigaretta) pu provocare effetti molto diversi (bronchiti,
tumori, malattia cardiovascolari ecc.).
Temporalit
La temporalit dell'associazione basata sul semplice ed inoppugnabile principio che ogni causa
deve precedere il relativo effetto. Questo criterio sembra cos evidente da risultare quasi banale.
Devi per considerare che, soprattutto per le malattie croniche, la successione temporale degli
eventi pu essere difficile da stabilire, anche perch l'inizio dell'effetto non sempre facilmente
evidenziabile. Ad esempio: quando inizia un tumore?
In alcune condizioni possibile addirittura incorrere nell'errore di assumere che una variabile abbia
preceduto temporalmente un'altra variabile quando invece si verificato l'opposto.
ESEMPIO. E' stato notato che, nell'uomo, le persone sovrappeso sono soggette ad un rischio pi
elevato di morte per cause cardiovascolari rispetto alle persone di peso normale. Quindi, sarebbe
logico prevedere che una perdita di peso in individui sovrappeso rappresenti un fattore protettivo.
Tuttavia, stato dimostrato che la mortalit, al contrario, aumenta in coloro che diminuiscono di
peso. La contraddittoriet dei dati viene giustificata se si tiene presente che, in molti casi, la perdita
di peso un segno precoce di alcune gravi malattie ad esito letale. Quindi, le condizioni che
causeranno la morte possono precedere e causare la perdita di peso, e non viceversa.
Coerenza
La coerenza pu venire definita anche plausibilit biologica. Essa richiede che la presunta causa
sia verosimilmente inquadrabile nel contesto delle conoscenze sull'argomento e sulla patogenesi.
Pu essere stabilita, per esempio, su modelli animali o su cellule viventi o su colture d'organo.
da sottolineare che ci che viene considerato biologicamente plausibile dipende dallo stato
delle conoscenze mediche in quel momento. Ad esempio, nel XVIII secolo il concetto di malattia
contagiosa era ritenuto non plausibile. D'altra parte, il meccanismo attraverso cui la agopuntura
induce anestesia poco chiaro e, quindi, per molti scienziati occidentali il fenomeno appare
biologicamente non plausibile.
In sostanza, la plausibilit biologica non da ritenere un criterio indispensabile: se essa presente,
allora la causalit pi probabile; se invece assente, allora devono essere ricercate altre prove di
causalit. Se queste esistono e sono forti, allora la mancanza di plausibilit biologica pu derivare
dalla pochezza delle conoscenze mediche piuttosto che dall'assenza di associazione causale.
115
6. L'approccio
epidemiologico alle cause di malattia
6.6 Studi retrospettivi e studi prospettivi per la dimostrazione di causalit
OBIETTIVO:
Nella sequenza delle ricerche sulla eziologia di una malattia, spesso il veterinario clinico effettua
osservazioni di eventi che lo inducono a formulare ipotesi. Tali ipotesi, proprio proprio perch
derivanti da osservazioni limitate ed avvenute soltanto per caso, vanno verificate in modo obiettivo.
Le ipotesi eziologiche basate su osservazioni cliniche sono spesso riassumibili in una semplice
ipotesi del tipo:
Le affermazioni di questo tipo vengono verificate, in genere, prima con studi di tipo retrospettivo e
successivamente, se questi confermano l'ipotesi, con studi prospettivi (detti anche studi di
coorte).
L'impostazione di entrambi questi studi pu essere descritta con una tabella a doppia entrata, detta
anche tabella di contingenza perch viene usata per determinare se la distribuzione di una variabile
dipende in maniera condizionata (o contingente) dall'altra variabile. Tipicamente, negli studi
prospettivi o retrospettivi pi semplici, le due variabili tabulate sono rappresentate dalla
"esposizione" e dalla "malattia".
La tabella di contingenza ha il seguente aspetto:
La tabella molto semplice, ma ti consiglio di osservarla con attenzione, perch la chiave per
comprendere tutto quello che segue. Nella tabella si possono aggiungere i totali marginali (ossia i
116
totali di riga ed i totali di colonna), ottenendo due modalit di lettura (in verticale per colonne,
oppure in in orizzontale per righe), come nei due schemi che seguono.
Torniamo agli studi retrospettivi ed agli studi prospettivi, e vediamo ora qual l'impianto logico di
ciascuno di essi.
Negli studi retrospettivi, lo sperimentatore inizia raccogliendo i cosiddetti casi, ossia gli individui
che presentano la malattia in studio. Nella tabella i casi sono rappresentati dal totale degli individui
(a+c). Viene anche scelto un adatto gruppo di paragone (o di controllo) che comprender individui
sani (b+d). A questo punto, attraverso una accurata anamnesi su tutti i soggetti in studio, si
stabilisce come gli ammalati (a+c) debbano essere assegnati alle celle a e c. Analogamente si
stabilisce quanti, fra i controlli, debbano essere assegnati alle celle b e d.
La tabella risulta ora completata, e si pu impostare l'analisi, confrontando gli odds di esposizione
nei casi (a/c) con gli odds di esposizione nei controlli (b/d) (confronto fra colonne) (quest'ultimo
passaggio verr spiegato nelle due Unit sucessive).
Come gi detto, gli studi retrospettivi sono basati su gruppi costituiti da individui che, gi all'inizio
dell'esperimento, sono noti come casi o controlli; per questo gli studi di questo tipo sono detti
anche studi caso/controllo.
per da notare che, proprio per la loro stessa natura, gli studi retrospettivi forniscono - in linea di
massima - risultati meno affidabili rispetto agli studi prospettivi. Si pensi ad esempio alla quota
aleatoria connessa con l'accertamento dell'avvenuta esposizione attraverso una anamnesi basata
sulla memoria degli addetti alla cura degli animali: si tratta evidentemente di un processo che porta
con s una certa dose di imprecisione.
Un altro elemento a sfavore degli studi retrospettivi riguarda l'eventualit che si voglia studiare una
malattia di breve durata e ad esito generalmente letale. In questa situazione, il "bias" potrebbe
derivare dalla selezione dei casi, i quali sarebbero costituiti dai pochi animali sopravvissuti,
certamente non rappresentativi della popolazione dei malati. Si potrebbe addirittura verificare il
paradosso di considerare come causa di una malattia un fattore che in realt protettivo: proprio
quello stesso fattore che ha consentito la sopravvivenza dei casi e che senz'altro risulter fortemente
associato ad essi.
Uno studio prospettivo inizia selezionando due gruppi, entrambi costituiti da animali sani: un
gruppo comprende soggetti che sono stati esposti alla presunta causa (o lo saranno in futuro), e
l'altro soggetti che non sono stati esposti (e non lo saranno).
Quindi, gli animali vengono seguiti nel tempo e andranno a distribuirsi nelle colonne degli
ammalati o dei sani.
In questo modo, alla fine dell'esperimento, la tabella risulter completata con i valori a, b, c, e d.
Si prosegue effettuando la analisi dei dati, confrontando la proporzione di malati tra gli
esposti [a/(a+b)] con la proporzione di malati tra i non esposti [c/(c+d)] (confronto fra righe).
119
sistematici, in quanto essi non dipendono da dati raccolti in precedenza magari con modalit poco
affidabili. Infatti, il ricercatore in grado di valutare personalmente la qualit dei dati raccolti,
soprattutto per quanto riguarda l'esposizione, cosa che invece sempre un po' aleatoria negli studi
retrospettivi.
Un altro punto a favore degli studi prospettivi che essi possono fornire una stima della incidenza
(ossia del numero di nuovi casi che compaiono in un dato tempo) della malattia e possono essere
utilizzati per studiare l'effetto di determinanti rari.
forse opportuno ricordare di nuovo che gli errori sistematici sono vizi di impostazione di un
esperimento che possono influenzarne i risultati, pregiudicandone l'interpretazione. Le principali
fonti di errori sistematici negli studi retrospettivi riguardano l'accertamento della esposizione che,
dovendo essere effettuato con una inchiesta anamnestica, per sua natura impreciso e prono ad
interpretazioni soggettive. Anche la selezione dei controlli pu essere fonte importante di errori
sistematici. Infatti, non sufficiente scegliere animali sani a caso, ma occorre che essi siano il pi
possibile simili agli ammalati; inoltre, se i risultati dello studio dovranno essere estesi alla
popolazione, i controlli dovranno presentare una distribuzione dell'esposizione simile a quella della
popolazione stessa.
Infine, nella figura seguente illustrata schematicamente la differenza fra studi prospettivi e
retrospettivi; in particolare, viene evidenziato il diverso momento di inizio dell'osservazione della
popolazione in rapporto alla comparsa di malattia.
121
6. L'approccio
epidemiologico alle cause di malattia
6.8 Esempio di verifica dell'ipotesi in uno studio retrospettivo
OBIETTIVO:
A questo scopo esamini le cartelle cliniche dei cani visitati negli ultimi 5 anni nell'Ospedale. Nel
periodo considerato, il numero di "casi" (ossia cani affetti da calcolosi, CU+) risultato pari a 1014.
Dalle stesse cartelle cliniche, accerti che 383 di questi animali erano obesi (OB+), mentre i restanti
631 erano non-obesi (OB-).
Ora procedi a selezionare un campione di cani "di controllo" (CU-) ossia di cani non affetti dalla
malattia (il metodo per selezionare un campione verr spiegato in un prossimo Capitolo). In
totale, il campione di cani di controllo costituito da 1487 animali. In base alle cartelle cliniche,
322 di questi erano OB+ e 1165 OB-.
Per rispondere, devi confrontare la proporzione di OB+ nei CU+ con la proporzione di OB+ nei
CU-.
Attento a non confonderti nel passaggio ora descritto: magari ti era venuta l'idea (sbagliata!) di
calcolare la proporzione di CU+ negli OB+, e la proporzione di CU+ negli OB-.
Perch questa idea sbagliata? semplice: ricordi il disegno del tuo studio retrospettivo? Hai
selezionato un campione di CU+ ed uno di CU-, ed su questi campioni che devi effettuare i tuoi
calcoli!
Se ti poco chiaro, ti consiglio di rileggere l' Unit precedente.
Ora procedi a calcolare la proporzione di OB+ nei CU+ e la proporzione di OB+ nei CU-:
La proporzione di obesi nei malati superiore rispetto ai non malati. Tuttavia, come hai gi
imparato, questa differenza potrebbe essere dovuta al caso. Per ora, devi accettare l'ipotesi zero,
secondo cui la differenza osservata dovuta al caso.
Naturalmente, l'ipotesi zero pu essere vera o falsa. Come puoi sapere se, in base ai tuoi dati,
l'ipotesi zero da accettare o da rifiutare? La risposta facile: devi applicare un test statistico!
Un test statistico adatto al confronto di due proporzioni o di due percentuali il test del chi-
quadrato, gi visto nei dettagli in una Unit precedente.
Il calcolo manuale il seguente:
123
Invece di fare i calcoli a mano, puoi inserire i tuoi dati nel Foglio di calcolo (se non hai
installato Excel, puoi vedere qui la schermata che si ottiene).
Il foglio ti restituisce direttamente il valore P, e quindi il confronto con i valori di chi-quadrato
tabulati inutile. Il valore P 0.0000. Ci dovuto al fatto che vengono mostrati soltanto 4 decimali,
che sono pi che sufficienti per trarre la conclusione riguardo alla significativit statistica. Per
curiosit il valore P ottenuto con i tuoi dati 0.0000000000000000021.
(1) Quanto hai ottenuto finora nella presen te simulazione non rappresenta ancora la dimostrazione
dell'esistenza di una relazione causa-effetto fra obesit e calcolosi, ma il primo ed indispensabile
passo in questa direzione. La dimostrazione della relazione causa-effetto si ottiene con la verifica
dei criteri di causalit (gi visti in precedenza).
(2) Con i dati ottenuti, opportunamente tabulati nella tabella 2x2, puoi calcolare il valore dell'odds
ratio. L'odds ratio fondamentale per l'interpretazione dei risultati di uno studio retrospettivo (come
quello di cui stiamo parlando). L'odds ratio rappresenta una misura della forza di una associazione,
e viene trattato pi dettagliatamente nella prossima unit didattica.
Dati tratti da: Lekcharoensuk C. e coll. (2000) Patient and environmental factors associated with
calcium oxalate urolithiasis in dogs. JAVMA, 217, 515-519 ed utilizzati con il consenso degli
Autori.
stato dimostrato che l'obesit aumenta il rischio di urolitiasi anche nel gatto e nella specie umana.
Per giustificare l'esistenza della associazione tra obesit e urolitiasi, stato ipotizzato che il cane
obeso ingerisca con la dieta un eccesso di minerali capaci di favorire la formazione di calcoli (nel
caso dei calcoli di ossalato di calcio, i minerali importanti sono il calcio e l'acido ossalico). Tali
minerali vengono eliminati primariamente per via renale, e quindi la loro concentrazione nelle urine
aumenta. Ci favorisce la precipitazione (ri-cristallizzazione) dei minerali nelle vie urinarie e quindi
la formazione di calcoli.
124
6. L'approccio
epidemiologico alle cause di malattia
6.9 Misura del rischio: odds ratio e rischio relativo
OBIETTIVO:
Come gi visto, l'esistenza di una associazione pu essere accertata attraverso studi retrospettivi
(o studi caso-controllo) o studi prospettivi (o studi di coorte). Negli studi retrospettivi si confronta
la frequenza di esposizione nei malati (casi) con quella nei non-malati ((controlli). Negli studi
prospettivi si confronta la frequenza di malattia negli esposti con quella nei non-esposti:
125
Il termine "esposto" viene usato per motivi storici e talvolta impropriamente: infatti, la variabile
indipendente pu essere anche un fattore interno all'ospite, ed in tal caso non avrebbe senso parlare
di "esposizione". Allora, vale la pena di chiarire che, nel linguaggio epidemiologico per
"esposizione" si intende la presenza di qualsiasi variabile che, in linea di ipotesi, pu causare un
certo effetto.
Proseguiamo l'esempio dell'unit precedente riguardante l'associazione fra obesit e urolitiasi del
cane, ricordando che in uno studio retrospettivo si inizia selezionando i casi e i controlli e poi
andando ad accertare quanti fra i casi (e quanti fra i controlli) sono stati esposti alla presunta causa.
Lo studio ha fornito i seguenti risultati:
Per comprendere questa misura, occorre introdurre il concetto di "odds" (termine che non ha un
corrispondente in italiano; pu essere reso con "probabilit a favore"). Gli odds sono rappresentati
dal il rapporto fra il numero di volte in cui l'evento si verifica (o si verificato) ed il numero di
volte in cui l'evento non si verifica ( o si verificato).
Gli odds si utilizzano nel mondo delle scommesse, perch consentono allo
scommettitore di calcolare facilmente la somma da incassare in caso di vittoria.
Ad esempio, la vittoria della nazionale italiana di calcio nella semifinale Italia-
Francia ai mondiali del 1998 era data dai bookmakers a 4:1 "a sfavore". Questo
equivale a dire che, su una scala da 1 a 5, le probabilit di sconfitta (p) dell'Italia
erano considerate 4 volte pi alte di quelle di una sua vittoria (1-p), e quindi la vittoria dell'Italia
sarebbe stata pagata 4 volte la cifra scommessa [per i curiosi: vinse la Francia 4-3 ai rigori].
Ovviamente, gli odds si possono trasformare in probabilit: secondo i bookmakers, l'Italia aveva 1
probabilit su 5 (p=0.2) di vincere e 4 probabilit su 5 di perdere (p=0.8). Nota che (p di perdere) =
(1-p di vincere) e viceversa.
L'"odds ratio" si calcola attraverso i semplici rapporti (odds) fra le frequenze osservate e non
attraverso le proporzioni. Nel nostro esempio sulla urolitiasi del cane, calcoliamo gli odds
(ricordati: odds = p a favore / p contro) di esposizione nel gruppo dei casi e gli odds di esposizione
nel gruppo dei controlli, e poi ne facciamo il rapporto.
Notare che si utilizzano i semplici rapporti tra le frequenze osservate (a/c, b/d) e non le proporzioni
(a/a+c e b/b+d). Notare anche che, applicando le propriet delle frazioni, l'odds ratio pu venire pi
facilmente calcolato attraverso i prodotti delle celle incrociate della tabella (a*d e b*c); perci viene
anche detto, in italiano, "rapporto incrociato".
Ritorniamo all'esempio dell'obesit-urolitiasi e calcoliamo l'odds ratio (per tua comodit, i dati dello
studio sono riprodotti nella tabella qui sotto).
127
In termini matematici, non importante se l'OR viene calcolato come (a/c)/(b/d) oppure come
(a/b)/(c/d), perch in entrambi i casi si ottiene lo stesso rapporto incrociato: ad/bc. Tuttavia, in
termini razionali non ha senso usare la seconda formula. Infatti in uno studio retrospettivo, il
rapporto a/b (cos come il rapporto c/d), non dipende dalla malattia n dall'esposizione, ma bens
soltanto dallo sperimentatore stesso che ha avuto libert di reclutare un numero di casi e di controlli
a suo piacimento.
A questo punto, sorge la domanda: qual il significato del valore ottenuto? Ossia: come si
interpreta l'OR?
poich l'interpretazione identica a quella del rischio relativo, necessario pazientare un poco... la
risposta verr data nella parte finale di questa stessa unit.
Supponiamo di intraprendere un nuovo studio per verificare se esiste una associazione fra
allevamento dei vitelli in ricoveri chiusi (esposizione, o variabile indipendente) e la comparsa di
polmonite (variabile dipendente). A questo scopo effettuiamo uno studio prospettivo, seguendo nel
tempo gruppi di vitelli allevati al chiuso oppure all'aperto e contando i casi di polmonite che si
verificano nei due gruppi.
Alla fine dello studio i risultati ottenuti [dati fittizi] vengono tabulati nella solita tabella di
contingenza:
128
Questa volta si tratta di uno studio prospettivo, e quindi si pu calcolare il rischio relativo (RR),
denominato in inglese risk ratio ossia rapporto fra i rischi. Infatti, il rischio relativo il rapporto
fra il rischio nel gruppo degli esposti e il rischio nel gruppo dei non esposti. Forse pi efficace e
pi precisa la seguente definizione: il rischio relativo il rapporto tra l'incidenza negli esposti e
l'incidenza nei non esposti (dove incidenza significa proporzione di nuovi casi; l'incidenza ed
altre misure di frequenza verranno trattate successivamente).
In base a quest'ultima definizione si comprende perch il rischio relativo viene detto anche
rapporto di incidenza.
Utilizzando i dati dello studio sulla polmonite dei vitelli (riprodotti nella tabella qui sotto), abbiamo:
129
L'interpretazione identica sia che si tratti di valori di OR che di valori di RR. Dapprima occorre
sottolineare entrambi possono assumere valori teorici compresi fra 0 e +infinito.
intuitivo che un valore =1 indica assenza di associazione tra malattia ed esposizione, in quanto
testimonia che:
per il rischio relativo: l'incidenza negli esposti uguale all'incidenza nei non esposti;
oppure
per l'odds ratio: l'odds di esposizione nei casi uguale all'odds di esposizione nei controlli.
Un valore <1 indica una associazione negativa (cio il fattore pu proteggere dalla malattia) mentre
un rapporto >1 indica l'esistenza di una associazione positiva (il fattore pu causare la malattia).
Pi i valori si discostano da 1, in un senso o nell'altro, pi l'associazione forte.
Ricordati per che, prima di dichiarare l'esistenza di un rapporto causa-effetto tra l'esposizione e la
malattia, devi eseguire un test di significativit statistica (per escludere che la differenza sia dovuta
al caso) e poi devi verificare i criteri di causalit.
A rigore, l'odds ratio non una autentica misura del rischio in quanto si riferisce alla probabilit di
avere gi una malattia, mentre nel termine "rischio" implicita l'idea di un evento che si verificher
in futuro. Tuttavia, se si suppone che la durata media della malattia negli esposti sia simile a quella
nei non-esposti (e che la malattia non influenzi lo stato di esposizione), allora l'odds ratio
rappresenta una buona misura del rischio relativo.
In sintesi, l'interpretazione dell'odds ratio o del rischio relativo viene effettuata in base allo schema
che segue:
130
Rischio attribuibile
Un altro importante indice di una associazione, da utilizzare negli studi prospettivi, il rischio
attribuibile (RA), che indica la quantit di rischio supplementare da ascrivere al fattore
considerato. Esso corrisponde alla differenza fra (incidenza negli esposti) e (incidenza nei non
esposti); pertanto, rappresenta la quota di malati tra gli esposti che potrebbe essere evitata se
venisse completamente rimosso il fattore di rischio in esame.
Nell'esempio dei vitelli con polmonite, RA=0.38. Ci indica che rimuovendo il fattore "cattiva
ventilazione" ci si aspetta di osservare una diminuzione del 38% dell'incidenza della malattia
(ammesso che tale fattore sia l'unico responsabile della polmonite).
Attenzione a non confondere il rischio relativo con il rischio attribuibile. Le due misure hanno scopi diversi. Infatti, il
RR costituisce misura della forza della associazione tra il fattore di malattia e la malattia medesima, ed un indice
utilissimo sulla strada della dimostrazione che il fattore causa della malattia.
Il RA rappresenta invece una misura dell'impatto che il fattore in esame ha sulla popolazione in studio.
Foglio di calcolo per Microsoft Excel per il calcolo dell'odds ratio e del rischio relativo.
131
6. L'approccio
epidemiologico alle cause di malattia
6.10 Dimostrazione dell'esistenza di una correlazione dose-effetto: la regressione
lineare
OBIETTIVO:
apprendere come verificare l'esistenza di una correlazione fra due variabili; in particolare,
apprendere la base del procedimento logico, ed un metodo statistico idoneo.
In molti casi, un tale approccio strettamente "qualitativo" rappresenta una limitazione dei dati
ottenibili in studi epidemiologici sulle cause di malattia. Basti pensare che, in molti casi, la
classificazione di un animale nella categoria "esposti" o in quella "non esposti" in larga misura
arbitraria e rappresenta, in una certa misura, una forzatura della realt.
Ad esempio, animali che hanno avuto un'unica, lieve e transitoria esposizione ad una presunta causa
potrebbero essere (indebitamente?) classificati come "esposti" ed essere assimilati ad altri animali
che, invece, hanno subto una esposizione intensa e prolungata nel tempo. Insomma: spesso
l'esposizione non un fenomeno tutto-o-niente, ma avviene secondo un gradiente misurabile.
Anche la classificazione nelle due classi "malati" e "non malati" talvolta non soddisfacente, in
quanto la stessa malattia pu manifestarsi con gravit molto variabile e con segni clinici misurabili
e rappresentabili numericamente.
Per riassumere: ci sono casi in cui sia l'esposizione che la malattia si misurano quantitativamente, e
tali misure sono esprimibili attraverso numeri.
ESEMPIO. Una partita di mangime contaminata da un fungo che produce una potente tossina
(micotossina) che provoca emolisi (distruzione dei globuli rossi), e quindi anemia. L'intensit della
esposizione potrebbe essere misurata attraverso la dose di micotossina ingerita/giorno; la gravit
della malattia essere misurata potrebbe essere misurata attraverso il conteggio degli eritrociti nel
sangue.
132
Ecco quindi sorgere la necessit di disporre di altri metodi di studio, diversi dalla "solita" tabella 2 x
2, per verificare l'esistenza di un rapporto causa-effetto quando i dati sono quantitativi.
Per rafforzare quanto finora esposto, ti ricordo che - sempre riguardo alla dimostrazione della
causalit - hai gi imparato un principio generale abbastanza intuitivo: "se fra fattore ed una
malattia si individua una correlazione dose-effetto, allora quel fattore pu essere una delle cause
della malattia" ( regole di John Stuart Mill). Infatti, ragionevole pensare che quanto pi intensa
la causa, tanto pi grave (o frequente) sar la malattia. Analogamente, uno dei cinque criteri di
causalit afferma che la forza di una associazione aumenta se si dimostra l'esistenza di una
correlazione dose-effetto. evidente che quando si parla di correlazione dose-effetto si parla di
dati quantitativi, per i quali necessario un approccio diverso da quello che hai imparato finora.
In questa Unit, attraverso un esempio, esaminerai uno dei metodi pi usati come per studiare e
descrivere una relazione quantitativa tra due variabili: la regressione lineare.
La regressione lineare serve per descrivere la relazione tra due variabili quantitative
Supponiamo di sospettare che, fra gli effetti indesiderati di un certo farmaco, si annoveri quello di
innalzare la pressione arteriosa.
Verifichiamo questa ipotesi attraverso un esperimento: somministriamo dosi crescenti del farmaco
ad alcuni ratti da esperimento, e misuriamo la variazione della pressione diastolica che si verifica
dopo la somministrazione.
In dettaglio, vengono utilizzati 16 ratti, suddivisi in 8 gruppi di 2 animali ciascuno. Il primo gruppo
di controllo e non viene trattato; al secondo gruppo il farmaco viene somministrato in dose di 1
mg/kg, al terzo gruppo in dose di 2 mg/kg e cos via. I risultati sono riassunti nella seguente tabella.
Osserva bene i dati della tabella: anche "a occhio" si nota che la variabile dipendente (ossia l'effetto:
innalzamento della pressione) correlata alla variabile indipendente (ossia la presunta causa: il
farmaco). In altre parole: l'entit dell'aumento della pressione sembra essere associata alla dose.
Esiste un modo per visualizzare graficamente l'andamento del fenomeno: basta utilizzare i dati delle
due variabili per costruire un diagramma a nuvola di punti (detto anche diagramma a dispersione, o
diagramma xy; in inglese: scatterplot): in un sistema di assi cartesiani si pone: asse x=variabile
indipendente e asse y=variabile dipendente. Con i dati dell'esempio, sull'asse x poniamo il farmaco
e sull'asse y la variazione della pressione, ottenendo il seguente diagramma:
133
Per interpretare un diagramma a dispersione occorre valutarne l'aspetto globale, che rivela (1) la
direzione, (2) la forma e (3) la forza della relazione che lega le due variabili. Vediamo brevemente
queste tre caratteristiche.
DIREZIONE. L'aspetto del Diagramma 1 dimostra l'esistenza di una associazione positiva. Infatti,
due variabili (ti ricordo che nell'esempio le variabili sono: x= la dose del farmaco, y= l'aumento
della pressione) si dicono associate positivamente quando i valori alti di una variabile tendono a
presentarsi insieme ai valori alti dell'altra variabile, ed analogamente i valori bassi dell'una tendono
a presentarsi insieme ai valori bassi dell'altra. Viceversa, due variabili sono associate negativamente
quando ai valori alti dell'una tendono ad associarsi valori bassi dell'altra variabile. Nei casi in cui le
variabili non sono associate, la direzione non pu essere individuata.
FORMA. La forma viene desunta dalla disposizione dei punti nel diagramma. Parleremo soltanto
della regressione lineare, ossia del caso in cui i punti si dispongono approssimativamente su una
linea retta. Esistono anche altri tipi di relazioni, non lineari e quindi pi complesse, ma le relazioni
lineari sono particolarmente importanti per un buon motivo: la linea retta quella su cui tende a
disporsi molto frequentemente il "pattern" dei punti ottenuti in molti studi biologici.
134
FORZA. La forza si pu desumere dal grado di disseminazione dei punti nel diagramma. Se i punti
sono molto disseminati, (ma sempre con tendenza a disporsi su una retta), la relazione tra le due
variabili debole; se invece i punti sono raggruppati attorno ad una retta, allora la relazione forte.
Anche l'inclinazione della retta importante: tanto pi la retta inclinata, quanto pi la relazione
forte.
Esiste un metodo per formalizzare direzione, forma e forza di una relazione lineare fra due variabili.
Questo metodo viene trattato nella prossima Unit.
135
6. L'approccio
epidemiologico alle cause di malattia
6.11 Il coefficiente di correlazione e la retta di regressione
OBIETTIVO:
Tuttavia, l'occhio umano non uno strumento adatto per misurare con precisione, osservando la
nuvola di punti, direzione, forma e forza di una relazione lineare. Abbiamo bisogno di una strategia
di analisi dei dati oggettiva, svincolata dal giudizio personale dell'osservatore e possibilmente che ci
fornisca una misura numerica. Questa misura detta correlazione, e contiene informazioni sulla
forza e sulla direzione di una relazione lineare tra due variabili. Per quanto riguarda la forma,
esistono senz'altro metodi adatti, che per sono troppo complessi per venire trattati qui.
La correlazione
Per indicare la correlazione si usa di solito la lettera "r". r viene detto "coefficiente di correlazione"
e si calcola con l'aiuto di un software statistico.
136
A rigore, il coefficiente di correlazione non dovrebbe essere utilizzato per due variabili legate da
una relazione causa-effetto; esso infatti descrive una semplice relazione tra due variabili.
Commettiamo una piccola inesattezza in omaggio alla semplificazione.
Nel caso della regressione, il coefficiente di correlazione viene talvolta detto coefficiente di
regressione.
Non possono essere date regole fisse per l'interpretazione del coefficiente di correlazione, che
dipende da una serie di considerazioni. Possiamo dire che in genere, nel settore biomedico ed in
epidemiologia, vengono considerati "buoni" valori attorno a 0.7 (nel caso di una correlazione
positiva) oppure a -0.7 (per una correlazione negativa).
Torniamo all'esempio dei ratti trattati con un farmaco nell'unit precedente. Per tua comodit, nella
figura sottostante sono riportati i dati ottenuti ed il grafico a dispersione:
137
Immettendo i dati ottenuti in un apposito software (va bene anche Excel), puoi calcolare il valore r,
che risulta pari a di 0.862:
Perci, ammettendo che il farmaco sia causalmente legato alla variazione di pressione (ossia, pi
in generale, ammettendo che x sia causalmente legato a y), allora il 75% circa di tale variazione
giustificata dall'effetto del farmaco.
Ricorda che il coefficiente di correlazione r descrive soltanto l'esistenza di una correlazione, ma non
dimostra nulla riguardo alla causalit di tale associazione. Lo stesso dicasi per r2. Per dimostrare la
138
causalit dovranno essere sviluppati altri ragionamenti, come ad esempio quelli connessi alla
applicazione dei criteri di causalit.
La retta di regressione
Hai gi imparato che la regressione lineare si usa quando le variabili in studio hanno fra loro una
relazione lineare, e quindi i punti del diagramma a dispersione tendono a disporsi secondo una linea
retta. Hai anche utilizzato l'occhio come strumento per individuare (appunto "ad occhio e croce") la
retta corrispondente. Tuttavia, come gi
detto, l'occhio non un buono strumento a
questo scopo; entrano in gioco fattori
soggettivi, e a partire dallo stesso
diagramma ciascuno di noi potrebbe
individuare rette diverse rappresentative
della nuvola di punti. Ad esempio, nel
diagramma a sinistra, qual la retta
"giusta"?. Potremmo litigare a lungo senza
venirne a capo. Ecco quindi che serve un
sistema obiettivo e ben codificato che
consenta di tracciare la retta che meglio
rappresenta l'andamento della nuvola di
punti.
Infine, una volta trovata la retta di regressione, si pu trovare l'equazione della retta medesima. Dai
ricordi delle scuole superiori, sai che l'equazione di una retta ha la forma:
Anche in questo caso, per ricavare l'equazione partendo dai dati sperimentali si ricorre al
calcolatore, che con i dati del nostro esempio genera la seguente:
y= 1.13 + 1.63x
L'equazione rappresenta un sistema semplice e molto elegante per descrivere il fenomeno che hai
osservato; inoltre, rappresenta anche uno strumento per fare previsioni. Ad esempio, potresti
domandarti quale sar l'incremento di pressione somministrando 5.5 mg del farmaco. Basta
sostituire, nell'equazione, il valore x con 5.5. Ottieni:
Usare cautela nel prevedere valori al di fuori del range dei dati sperimentali della variabile
indipendente. Nel tuo caso il range va da 0 a 7 mg, ma potresti essere tentato di utilizzare
l'equazione della retta per prevedere che, ad esempio, 30 mg del farmaco provocano un aumento di
pressione di 50 mm Hg... Un tale utilizzo della retta pu condurre a conclusioni poco affidabili e
quindi da evitare.
Lo schema che segue riassume tutti risultati che hai trovato a partire dai dati dell'esempio dell'Unit
precedente:
esiste una correlazione fra la dose del farmaco e l'innalzamento della pressione diastolica;
la correlazione positiva (ad un aumento del farmaco corrisponde un aumento della pressione)
come dimostrato dal fatto che il coefficiente di correlazione r >0;
140
la correlazione abbastanza forte, come dimostrato (a) dal valore piuttosto elevato (0.862)
raggiunto da r e (b) dal valore piuttosto elevato (1.63) del parametro che determina la pendenza
della retta;
il 74% circa dell'innalzamento della pressione pu essere spiegato dal farmaco;
in assenza del farmaco, la variazione di pressione prossima a zero, come dimostrato dal valore
dell'intercetta.
In altre situazioni, sarebbe stato opportuno, prima di concludere per un rapporto dose-effetto,
controllare la presenza di eventuali fattori di confondimento e poi verificare i criteri di
causalit.
Foglio di calcolo per Microsoft Excel per calcolare il coefficiente di correlazione e l'equazione
della retta.
141
7. Variabilit
biologica: concetti minimi
7.1 Variabilit biologica e distribuzione di frequenze
OBIETTIVO:
Tutti i dati che derivano da osservazioni sperimentali e le misurazioni di qualsiasi grandezza fisica
comportano delle variazioni. Inoltre, poich la variabilit individuale una propriet intrinseca di
tutti gli esseri viventi, le misure biologiche, pi delle misure di altre grandezze fisiche, sono
soggette a inevitabili variazioni.
Queste variazioni, oltre a derivare dall'imprecisione dello strumento di misura di volta in volta
utilizzato, sono dovute alla diversit del parametro considerato fra individui ed anche, nell'ambito
dello stesso individuo, da un'occasione all'altra, da un osservatore all'altro ecc.
Tutti sanno che i valori della pressione arteriosa che cambiano da una persona all'altra e, nella
stessa persona, cambiano nel tempo a seconda dello stato emozionale ecc.
I motivi che rendono ogni individuo diverso da ogni altro sono praticamente infiniti. La genetica,
l'et il sesso, le condizioni di vita o di allevamento, l'alimentazione, il clima e un'infinit di altre
variabili esercitano tutte sull'individuo un effetto grande o piccolo. Ovviamente, alcune di queste
variabili sono pi importanti di altre; tuttavia, sempre la somma degli effetti di molte cause
diverse che rende ogni individuo diverso dall'altro. L'insieme di tutte queste variabili (o fattori o
cause) che interferiscono imprevedibilmente su un fenomeno prende il nome di caso.
Per i motivi ora esposti, la valutazione dei dati biologici necessita di tecniche statistiche utili ad
ovviare agli inconvenienti che potrebbero derivare dalla variabilit dei dati stessi. Prima di
esaminare i principi di base di alcune tecniche statistiche di comune impiego, utile una breve
introduzione sulle modalit di presentazione dei dati.
Supponiamo che tu sia in possesso di una serie di dati, rappresentati dalle altezze al garrese di 659
cani di razza Bracco italiano. In pratica, si tratta di una serie di 659 valori che hai immesso, uno
per ogni riga, in un foglio di calcolo come questo:
142
Come vedi, si tratta di un database molto semplice, con una sola variabile (l'altezza al garrese) che
stata collocata nella colonna A, mentre in ogni riga c' una osservazione. Avresti potuto disporre,
per ciascun animale, di osservazioni di altre variabili (es. sesso, et ecc.); allora, avresti dovuto
utilizzare altre colonne (sesso in colonna B, et in colonna C ecc.).
Se vuoi, puoi dare un'occhiata al foglio di calcolo con il database completo. Nota che si tratta di dati
fittizi (ossia generati a tavolino): Tuttavia questi dati sono abbastanza verosimili, in quanto
rispettano lo standarddi razza, che prevede una altezza da 55 a 67 cm.
evidente che i dati grezzi del database sono difficilmente interpretabili se non vengono
organizzati in qualche modo o sottoposti a elaborazioni. A questo scopo esiste una intera branca
della statistica, detta statistica descrittiva che aiuta appunto a descrivere i dati, e di cui qui
imparerai soltanto i principi di base.
Distribuzione di frequenze
Con questa denominazione si indica un sistema di raggruppamento di serie di dati in modo da poter
individuare facilmente quali valori sono pi frequenti e quali pi rari.
Nella Tabella che segue sono riportati i dati del database con l'altezza al garrese dei 659 esemplari
di cani Bracco italiano.
143
La forma tabulare facilmente comprensibile: nella colonna di sinistra sono indicate le classi
utilizzate per raggruppare i dati riguardanti l'altezza del campione di cani. Nell'esempio ogni classe
ha ampiezza di 1 cm. La seconda colonna la colonna delle frequenze, in cui viene presentato il
numero di osservazioni (cio di animali) che rientra nella corrispondente classe. Quindi, le prime
due colonne contengono, da sole, tutti i dati derivanti dalle misurazioni effettuate.
Dividendo il numero di osservazioni di ciascuna classe per il numero totale di osservazioni (nel
nostro caso: 659) e moltiplicando il risultato per 100, otteniamo la frequenza percentuale, riportata
nella terza colonna.
Ad esempio, il valore 0.6 presente nella prima riga della terza colonna stato ottenuto come segue:
4/659*100. Il valore successivo (1.1) deriva da: 7/659*100, e cos via.
La frequenza percentuale una frequenza relativa standardizzata. Rispetto alla frequenza assoluta
della seconda colonna, la frequenza percentuale offre il vantaggio di facilitare il confronto con altri
dati derivanti da altre indagini o da altre casistiche nelle quali stato esaminato un diverso numero
di animali.
Nell'ultima colonna vengono riportate le percentuali cumulative; queste si ottengono, per ogni
144
classe, sommando la frequenza percentuale di quella stessa classe con tutte classi che la precedono.
Questo tipo di espressione dei dati utile per valutazioni quantitative di ogni classe di frequenza.
Ad esempio, possiamo rilevare che il 68% circa dei nostri ipotetici bracchi pi basso di 62 cm. In
quest'ultima affermazione insito il concetto di percentile (o centile) (vedi Unit
successiva).
Le distribuzioni di frequenze possono essere rappresentate anche in forma grafica; una delle forme
di espressione pi utilizzate a questo scopo l'istogramma. E' evidente che la presentazione dei dati
in forma grafica (vedi sotto) molto pi accattivante e immediata; nell'esempio si pu osservare
come la distribuzione dei dati segua un andamento particolare, in quanto le barre disegnano una
sorta di 'campana' approssimativamente simmetrica attorno alla classe di maggiore frequenza.
Quest'ultima, che nell'esempio corrisponde alla classe 61.00-61.99 cm (con valore centrale 61.5),
viene detta moda. La curva a campana, tipica di molti fenomeni biologici, viene detta curva di
distribuzione Normale o gaussiana.
L'istogramma diverso dal diagramma a barre (vedi sotto), anche se ad una prima occhiata i due
tipi di grafico sembrano uguali.
L'istogramma si usa per rappresentare dati di tipo continuo, ossia che possono assumere un qualsiasi
valore entro un certo intervallo. Il peso e l'altezza sono esempi di dati continui. Nell'istogramma le
barre devono essere contigue, per rappresentare la continuit delle misure effettuate.
Il diagramma a barre si usa invece per rappresentare dati di tipo nominale (ad esempio il colore del
mantello). Nel diagramma a barre consigliabile che le barre siano separate da spazi.
145
146
7. Variabilit
biologica: concetti minimi
7.7 Frequenze cumulative, mediana e centili
OBIETTIVO:
Il grafico sottostante comprende un tracciato della distribuzione cumulativa delle frequenze dei dati
esposti nella precedente unit. Questo tracciato utile per determinare graficamente i centili (o
percentili) di una distribuzione.
La curva stata costruita utilizzando un sistema di assi cartesiani in cui sull'asse delle ascisse sono
state riportate le classi di frequenza e sull'asse delle ordinate le percentuali cumulative. Quindi,
nel quadrante sono stati individuati i punti corrispondenti ad ogni classe di frequenza; questi punti
sono stati infine uniti tra loro da una linea, che rappresenta appunto il tracciato della distribuzione
cumulativa delle frequenze.
Per mezzo di questo grafico si possono calcolare in modo approssimativo i percentili (o centili)
come segue: sull'asse delle ordinate devi scegliere il punto corrispondente alla precentuale
desiderata. Ad esempio, il valore che divide il 10% delle osservazioni (nel grafico corrisponde a
circa 57 cm) detto decimo centile, e cos via.
147
Poich i percentili pi utili e comunemente usati sono il 25, il 50 ed il 75, nel grafico sono stati
evidenziati sull'asse delle ordinate i punti corrispondenti a 25%, 50% e 75%. Da questi punti stata
tracciata una linea orizzontale fino ad intersecare il tracciato e poi dal punto di intersezione stata
abbassata una perpendicolare all'asse delle x. In questo modo, sono stati individuati graficamente (e
con una certa approssimazione) in ascissa i percentili prescelti. (ovviamente i percentili si possono
calcolare con precisione con metodi statistici).
Nell'esempio illustrato nel grafico, il 25 percentile corrisponde a 58.8 cm circa, il 50 a poco meno
di 61 cm ed il 75 a 63.3 cm circa. Ci significa che il 25% dei nostri bracchi era pi basso di 58.8
cm, il 50% era pi basso di 61 cm ecc. Significa anche che, dato un bracco di altezza A, possiamo
calcolare come esso si colloca nella popolazione da cui deriva. Per esempio, il 90% dei bracchi
pi basso di 65 cm, e quindi un cane alto 65 cm cadr nel "90esimo percentile".
Il 25 percentile detto anche "primo quartile" in quanto raccoglie il primo quarto della
popolazione; analogamente, il 75 percentile detto anche "terzo quartile".
Il 50 percentile, detto anche mediana, un indice di tendenza centrale fra i pi importanti, e la sua
applicazione pratica verr accennata in seguito.
Se i dati sono ordinati in senso crescente (o decrescente), calcolare la mediana molto facile.
Infatti, tenendo presente che la mediana quel valore che lascia alla sua sinistra e alla sua destra un
numero uguale di unit, allora:
Usando lo stesso sistema si possono calcolare anche i quartili ed i centili. Come gi detto, i quartili
sono i 3 valori che separano i dati in 4 gruppi di uguale grandezza, e cio il 25esimo, il 50esimo ed
il 75esimo percentile. La differenza tra il 25 ed il 75 percentile comprende il 50% centrale delle
osservazioni ed chiamata distanza interquartile.
Un buon sistema per rappresentare graficamente i dati la cosiddetta "Tecnica dei 5 numeri" o "Box
and wiskers plot" (letteralmente: diagramma a scatola e baffi), in cui la "scatola" comprende la
mediana ed delimitata dal 25 e dal 75 percentile, mentre i "baffi" limitano i valori minimo e
massimo. Nel diagramma sottostante vengono rappresentati i dati riguardanti l'altezza del bracchi
della unit precedente.
148
Dal diagramma salta all'occhio che la distribuzione della popolazione simmetrica: infatti la parte
del box a destra della mediana ed il suo wisker sono molto simili a quelli della parte sinistra. Prova
a confrontare questo diagramma con il seguente, che rappresenta le altezze ottenute misurando una
popolazione di cani razza Segugio italiano a pelo forte.
Si osserva che i valori minimi e massimi (ossia i wisker di sinistra e di destra) sono diminuiti entrambi, e che la distanza
fra i wisker pi piccola; anche la dimensione del box ridotta, mentre la distribuzione rimasta simmetrica. A colpo
d'occhio si pu dedurre che i segugi sono pi piccoli dei bracchi, e che la loro altezza pi uniforme.
Facciamo un altro esempio di confronto fra due popolazioni, sempre utilizzando il box and wisker plot. Immagina di
confrontare la popolazione di bracchi gi vista con un'altra ipotetica popolazione di cani della stessa razza. Ottieni i plot
sottostanti, dai quali si deduce che la seconda popolazione (colore viola) , nel complesso, pi piccola della precedente
e che in essa sono presenti pochi individui di taglia molto grande. aumentata anche la distanza tra il 25 ed il 75
percentile (il box pi grande), e quindi vi pi dispersione fra le altezze comprese nel 50% centrale delle
osservazioni.
149
7. Variabilit
biologica: concetti minimi
7.3 Variabilit biologica: indici di tendenza centrale
OBIETTIVO:
Quando i dati riportati in una tabella statistica o in una distribuzione di frequenze sono molto
numerosi, il loro uso e la loro interpretazione sono difficili. Nel caso di caratteri con modalit
quantitative (cio "misurabili" e non semplicemente qualitativi come, ad esempio, i caratteri
pari/dispari, bianco/nero, acceso/spento ecc.), possibile calcolare dei valori singoli (o indici)
rappresentativi dell'intera tabella e che riassumono i caratteri principali dei dati stessi.
In particolare, sono utilizzati spesso i cosiddetti indici di tendenza centrale, cos denominati
perch individuano il centro della distribuzione delle frequenze.
La media, la moda e la mediana sono i 3 principali indici di tendenza centrale, e vengono definiti
come segue:
media aritmetica: quel numero che, sostituito ad ognuno degli elementi dell'insieme di partenza,
ne conserva inalterata la somma. La media si calcola facilmente dividendo la somma di tutti i valori
per il numero di osservazioni;
moda: il dato che presenta la maggior frequenza. Il termine ha una forte affinit con quello usato
nel linguaggio comune, nel quale si dice, per esempio, che un oggetto "di moda" quando usato
dalla maggioranza di un gruppo di persone;
150
mediana: il valore che occupa il posto centrale in una successione di dati ordinati in modo non
decrescente.
La moda l'unico indice di tendenza centrale che pu essere utilizzato con dati di tipo qualitativo.
151
7. Variabilit
biologica: concetti minimi
7.4 Indici di tendenza centrale per distribuzioni simmetriche e deformate
OBIETTIVO:
Riportando in un sistema di assi cartesiani i risultati di misurazioni di caratteri biologici (es. numero
di eritrociti/mm3, et al primo parto, durata della gestazione ecc.) effettuati su una serie di individui
diversi, si ottiene spesso una curva particolare con una forma a campana, simile a quella rossa del
Grafico 1.
Questo tipo di curva ha un solo picco, che corrisponde alla classe di massima frequenza o moda;
si tratta quindi di una curva unimodale), che viene detta curva gaussiana o cruva Normale.
Essa simmetrica, nel senso che si pu dividere in due parti, specularmente uguali, tracciando una
linea verticale in corrispondenza del valore di massima frequenza.
Questa curva ha molte propriet interessanti, alcune delle quali verranno accennate in una
prossima unit. In particolare, importante ricordare che nelle distribuzioni Normali la moda, la
media e la mediana assumono lo stesso valore.
Non sempre i dati sperimentali danno origine a curve simmetriche; talvolta possono essere generate
curve pi o meno asimmetriche (eventualmente con andamento bimodale o trimodale ecc.). Fra le
152
Un esempio di deformazione asimmetrica, con coda deformata positivamente, viene fornito dal
seguente grafico a barre, che mostra la distribuzione del numero di vacche adulte negli allevamenti
di bovine da latte in Norvegia [da Paisley et al., Prev. Vet. Med. 44, 141-151, 2000].
importante notare che, nelle distribuzioni asimmetriche, moda, media e mediana non
coincidono, ma assumono la disposizione indicata nel grafico 1 dove, come si vede, la media
l'indice che pi viene influenzato dall'esistenza di dati estremi.
153
7. Variabilit
biologica: concetti minimi
7.5 Indici di tendenza centrale: caratteristiche
OBIETTIVO:
Nella Tavola che segue sono riassunte le caratteristiche principali degli indici di tendenza centrale.
La media certamente l'indice pi utilizzato, sia in ambito scientifico che nelle necessit della vita
comune. Esso ha il vantaggio di essere adatta a manipolazioni matematiche (e statistiche); il
principale difetto dovuto al fatto che la media assume significato soltanto quando si riferisce a
distribuzioni di frequenze con andamento Normale (gaussiano). In caso contrario, essa
fortemente influenzata dai dati estremi e quindi non rappresenta pi adeguatamente la centralit.
La moda, infine, ha il vantaggio di avere un significato facilmente intuibile; tuttavia essa non pu
essere utilizzata nel caso di distribuzioni
bi- o pluri-modali.
7. Variabilit
biologica: concetti minimi
7.6 Variabilit biologica: indici di variazione (o di dispersione)
OBIETTIVO:
definire alcuni indici di variazione (o indici di dispersione) e fra essi, in particolare, la deviazione
standard
gi stato accennato ad alcune caratteristiche dei pi comuni indici di tendenza centrale (media,
moda, mediana).
Oltre alla tendenza centrale, spesso auspicabile individuare l'entit delle variazioni presenti in
una serie di dati. Esistono numerosi indici utilizzabili come misure di variabilit. Quelli di pi
comune impiego sono: l'intervallo di variazione, i percentili, la deviazione standard.
Intervallo di variazione
Esempio. La misurazione dell'altezza al garrese di 8 bracchi italiani ha fornito i seguenti valori (in
cm):
54, 57, 57, 58, 59, 60, 60, 61, 66.
L'intervallo di variazione di 66-54 = 12 cm.
156
Percentili
Deviazione standard
Molto spesso, negli studi bio-medici, i dati vengono riassunti attraverso il pi comune indice di
tendenza centrale: la media. In questo caso, per descrivere compiutamente la popolazione,
sempre necessario dichiarare anche, come indice di variazione, il valore della deviazione standard.
La deviazione standard (o scarto quadratico medio) rappresenta la distanza media dei dati dalla
loro media. Essa si indica con il simbolo (leggi: sigma, ossia la lettera sigma minuscola
dell'alfabeto greco) se ci si riferisce alla deviazione standard di una popolazione, oppure con la
lettera s se si indica quella di un campione.
La deviazione standard un ottimo indice di variazione dei dati quando essi sono distribuiti
normalmente e rappresenta probabilmente l'indice di variazione usato pi comunemente. Tuttavia
bene ripetere ancora una volta che esso deve essere utilizzato soltanto quando i dati hanno una
distribuzione normale.
La deviazione standard si calcola facendo la radice quadrata della varianza (vedi l'Appendice in
questa stessa Unit).
Notare che in questo modo si fornisce l'indicazione del fatto che CAMP.B era molto omogeneo,
contrariamente a CAMP.A.
A questo punto potresti chiederti se, per riassumere le caratteristiche di una serie di dati, meglio
utilizzare media e deviazione standard oppure mediana e percentili.. La risposta molto semplice ed
riassunta nello schema che segue.
valore
individuale x
--------------
19
21
24
21
17
-------------
somma = 102
media = 102/5 = 20.4
valore
individuale x scarto scarto quadr.
--------------
19 19-20.4 = -1.4 1.96
21 21-20.4 = 0.6 0.36
24 24-20.4 = 3.6 12.96
21 21-20.4 = 0.6 0.36
17 17-20.4 = -3.4 11.56
-----
27.20
Nel calcolo della varianza perch dividere per n-1 anzich per n?
La risposta a questa domanda non semplice; esiste senz'altro una spiegazione teorica della
formula, che per troppo complicata per i nostri scopi. Baster sottolineare che la statistica
sanitaria e biologica spesso si basa su un numero di osservazioni piuttosto piccolo; ci consiglia di
ottenere una particolare affidabilit dei risultati. Dividendo per n-1 si ottiene una varianza (e quindi
una deviazione standard) lievemente superiore rispetto a quanto si otterrebbe dividendo
semplicemente per n. Una deviazione standard un po' pi elevata rappresenta un approccio
"conservativo" all'analisi dei dati, nel senso che la dispersione potr forse essere sovrastimata, ma
non si cadr mai nell'errore opposto. Ci particolarmente importante quando i dati vengono
utilizzati per eseguire un processo di inferenza.
.
159
OBIETTIVO:
Nella figura che segue sono riassunti schematicamente pregi e difetti dei 3 indici di variazione che
hai conosciuto nelle Unit prededenti.
Il range o intervallo di variazione rappresentato dalla distanza fra il dato con il valore minimo e
quello con il valore massimo. Presenta l'inconveniente di essere influenzato dai valori estremi; in
effetti, basta un solo valore eccezionalmente al di sopra (o al di sotto) degli altri dati per far
aumentare il range. Inoltre, esso non agevolmente utilizzabile nel calcolo statistico.
I percentili sono validi sia per distribuzioni Normali (si ricorda che, in tal caso, il 50 percentile
uguale alla media) che non Normali. Ti ricordo che, al fine di fornire un'idea della variabilit dei
dati, bene indicare sempre non soltanto il 50 percentile (ossia la mediana) ma anche - ed almeno -
il 25 ed il 75 percentile. I percentili hanno l'inconveniente di non essere utilizzabili per ulteriori
manipolazioni statistiche.
161
7. Variabilit
biologica: concetti minimi
7.8 Variabilit biologica, deviazione standard e normalit
OBIETTIVO:
Giustificare ed analizzare criticamente l'utilizzo della media la deviazione standard per stabilire
il range di normalit
gi stato detto che fonti di variazione sono presenti in ogni misurazione di un carattere biologico.
Tale variabilit non tuttavia del tutto imprevedibile: infatti, molti fenomeni naturali seguono un
modello teorico definito curva di distribuzione Normale o gaussiana.
Quanto detto finora utile per trovare la risposta ad una frequente domanda che sorge spontanea
quando si effettua una misura di un carattere biologico su uno (o pi) individui. La domanda
ESEMPI. Sono stati ottenuti i seguenti valori. Possono essere considerati "normali"?
- 240 pulsazioni cardiache/minuto in un pappagallino ondulato;
- 150.000 linfociti per mm cubo nel sangue di un bovino;
- 45 atti respiratori/minuto in un cane boxer adulto.
In pratica, per rispondere devi gi conoscere quelli che sono ritenuti i valori normali oppure, se
non li ricordi, devi consultare qualche apposita tabella.
Tutti sanno che il numero normale di globuli rossi nell'uonmo maschio compreso fra 4.8 e 5.6
milioni per mm cubo.
A questo punto una buona domanda la seguente; come sono stati stabiliti i valori normali? La
definizione dei limiti della normalit un processo complicato. A motivo dalla variabilit biologica,
teoricamente qualsiasi valore potrebbe essere normale. La complessit del problema, anzi
l'impossibilit a risolverlo in maniera definitiva, dimostrata indirettamente dal fatto che sono stati
proposti diversi criteri per stabilire la normalit, e che nessuno di essi immune da critiche.
Tuttavia il criterio che va per la maggiore il seguente:
163
Come abbiamo gi detto, spesso in biologia si osservano distribuzioni Normali; perci in base alla
propriet della curva di distribuzione Normale, i limiti della normalit si ottengono con
l'espressione [media 1.96 deviazioni standard].
Nel caso in cui la distribuzione sia asimmetrica, pur valendo sempre il principio del 2.5 e 97.5
percentile, il range di normalit non potr essere calcolato semplicemente come [media 1.96
dev.st.], ma dovr essere accertato in altro modo (ad esempio individuando i percentili in un
tracciato cumulativo di frequenze).
Una semplice critica che si pu avanzare riguardo alla definizione di normalit ora esposta la
seguente: se vengono considerati anormali tutti gli individui che si trovano al di sotto del 2.5
percentile ed al di sopra del 97.5 percentile, allora la prevalenza (ossia la frequenza) di ogni
malattia dovrebbe essere esattamente pari al 5%; cio, in una popolazione sar sempre ammalato il
5% degli individui. Ci evidentemente non compatibile con il comune modo di intendere la
frequenza di una malattia.
Attenzione, una critica alla critica: nell'obiezione ora esposta si assume (erroneamente!!!) che
anormale sia sinonimo di ammalato.
164
8. Probabilit
8.1 Probabilit: definizione ed eventi complessi
OBIETTIVO:
La maggior parte dei fenomeni che interessano la medicina soggetta a variazioni casuali: ad
esempio, il fattore di rischio (o determinante) R pu indurre la malattia M1 oppure la malattia M2
oppure nessuna malattia. Pertanto, impossibile stabilire una relazione se R allora M1; bisogna
invece affermare se R, allora probabile M1.
Il caso interviene in due tempi nelle osservazioni che si effettuano su una popolazione. Esso infatti
dapprima responsabile della variabilit fra gli individui (nessun individuo uguale a nessun altro);
in un secondo tempo, il caso agisce nuovamente quando si selezionano, per un determinato studio,
alcune osservazioni dalla massa delle possibili osservazioni (cio si esamina un campione).
Anche se l'effetto del caso si manifesta con una estrema complessit, il caso obbedisce tuttavia a
leggi piuttosto semplici. La conoscenza di queste leggi pone il ricercatore in una condizione di
superiorit rispetto all'osservatore empirico; in particolare, la conoscenza delle leggi del caso
consente di valutare i fenomeni in base alla loro probabilit.
Uno di punti di forza dell'epidemiologia la capacit di fare previsioni. Per esempio, spesso si
definisce il rischio relativo, cio il rischio di contrarre malattia di animali con un determinato
fattore (razza, o tipo di allevamento ecc.) rispetto al rischio corso da un gruppo di controllo non
soggetto a quello stesso fattore. Pi in generale, si pu affermare che una delle pi importanti
attivit di un epidemiologo quella di calcolare la probabilit che si verifichi l'evento-malattia (o
pi in generale: un qualsiasi evento) in rapporto a particolari situazioni o fattori.
ESEMPI.
in corso una epidemia di una data malattia. Che probabilit c' che un allevamento venga
coinvolto?
Un allevatore ha acquistato un animale proveniente da un allevamento in cui presente una certa
malattia. Che probabilit c' che l'animale sia affetto da quella malattia?
Stai trattando un gatto con una data terapia. Che probabilit c' che il gatto guarisca? Che
probabilit c' che il gatto muoia?
Una bovina risultata positiva ad un test per la diagnosi della tubercolosi. Che probabilit c' che
il test "dica la verit", ossia che quella bovina sia veramente ammalata?
Un cane affetto da displasia dell'anca. Che probabilit c' che riacquisti la completa funzionalit
dopo l'intervento operatorio?
La probabilit di un evento non altro che l'espressione quantitativa della frequenza con cui esso
si verifica.
Pi propriamente, bene parlare di frequenza relativa: infatti la probabilit (Pr) che si verifichi
un evento aleatorio A data dal rapporto tra il numero di casi favorevoli (quelli in cui A si verifica)
ed il numero di casi possibili (cio il numero di volte che A pu verificarsi). Da un punto di vista
strettamente statistico, la probabilit viene definita come la frequenza relativa di un evento, i cui
valori sono compresi nell'intervallo [0;1] ove 0 indica un evento impossibile e 1 un evento certo.
165
ESEMPIO 1. Lanciando una moneta l'evento testa si verifica una volta ogni due lanci, quindi la
probabilit di tale evento 1/2, cio 0.5.
ESEMPIO 2. Qual la probabilit che una carta da gioco estratta a caso da un mazzo di 52 sia un
asso? Poich nel mazzo vi sono 4 assi, la probabilit di 4/52. In questo il numero di casi
favorevoli pari a 4 (asso di cuori, quadri, fiori, picche), mentre ognuna delle 52 carte del mazzo
rappresenta un potenziale evento favorevole.
Dagli esempi si nota che la probabilit pu venire espressa attraverso una frazione, un numero
decimale o una percentuale. Il numero decimale assume sempre un valore compreso fra 1 (quando
l'evento si verifica sempre, e quindi il numeratore uguale al denominatore) e 0 (quando l'evento
non si verifica mai, e quindi il numeratore uguale a 0).
intuitivo che:
166
Questo concetto ti sar molto utile nel prossimo Capitolo, in cui imparerai le basi del Campionamento.
Ad esempio, se il 75% dei ceppi di Enterococcus resistente alla tetraciclina, allora avremo una probabilit pari a 0.75 (75%) che un ceppo di
Enterococcus preso a caso sia resistente.
In alcuni casi necessario calcolare la probabilit di eventi complessi, definiti come combinazioni specifiche (A e B) oppure alternative specifiche (A
o B). Le regole che permettono di affrontare i pi semplici problemi di probabilit di eventi complessi sono enunciate nella prossima unit.
Foglio di calcolo per Microsoft Excel con una simulazione dei risultati (testa/croce) ottenibili
lanciando una moneta.
167
8. Probabilit
8.2 Probabilit di eventi complessi
OBIETTIVO:
Vi sono situazioni in cui occorre valutare la probabilit di eventi che si esprimono come
combinazioni specifiche (es. evento A e evento B) oppure come alternative specifiche (es. eventi A
o evento B). In questi casi si parla di "eventi complessi".
La regola della moltiplicazione si applica ad una combinazione di eventi; essa stabilisce che la
probabilit (Pr) che si verifichino contemporaneamente l'evento A e l'evento B equivale al prodotto
delle probabilit di ciascun evento:
e cos via.
Questa regola vale soltanto se A e B sono indipendenti, cio nel caso in cui il verificarsi di A non
influenzi il verificarsi di B e viceversa.
168
ESEMPIO. Supponi di studiare la resistenza dei batteri agli antibiotici. In particolare, hai osservato
che il 70% dei ceppi di Enterococcus resistente alla tetraciclina ed il 30% alla ciprofloxacina. Si
tratta di due antibiotici appartenenti a classi diverse ed a diverso meccanismo d'azione, e quindi
probabilmente le resistenze sono indipendenti. Preso a caso un ceppo di Enterococcus, c'
probabilit 0.7 che esso sia resistente alla tetraciclina, 0.3 che sia resistente alla ciprofloxacina. La
probabilit che il ceppo sia resistente contemporaneamente a tetraciclina e ciprofloxacina
0.7x0.3=0.21, ossia 21%.
La regola dell'addizione si applica, invece, ad una alternativa di eventi; essa stabilisce che la
probabilit che si verifichi A oppure B oppure entrambi equivale alla somma delle probabilit dei
singoli eventi. E' necessario per considerare se i due eventi si escludono reciprocamente (ossia il
verificarsi di uno inibisce la possibilit del verificarsi dell'altro) oppure no.
Un farmaco induce nel cane, come effetto collaterale, aumento della produzione di saliva
(ipersalivazione) nel 10% dei trattati. Il farmaco viene somministrato a 2 cani. Qual la probabilit
che almeno uno manifesti ipersalivazione? I due eventi non si escludono reciprocamente, quindi:
Pr(A o B) = 0.1 + 0.1 - (0.1*0.1)= 0.19 = 19%
170
8. Probabilit
8.3 Probabilit e statistica
OBIETTIVO:
apprendere l'enunciato della "Legge dei grandi numeri" e l'esistenza di una probabilit "a
posteriori"
Chiunque, con un minimo di ragionamento e di buon senso, pu arrivare alla conclusione che,
lanciando una moneta, la probabilit teorica che esca una delle due facce pari a 1/2. Se vuoi
verificare se-e-quanto la teoria corrisponde alla pratica, non devi far altro che armarti di molta
pazienza e lanciare la moneta pi volte, registrando i risultati e poi studiarli da un punto di vista
statistico.
Supponiamo che tu abbia effettuato tre serie di 10, 100, e 1000 lanci, ottenendo i risultati riassunti
nella tabella che segue.
Puoi osservare che, aumentando il numero dei lanci, le frequenze percentuali tendono ad avvicinarsi
al valore 50, che la probabilit teorica che esca ognuna delle due facce.
A questo punto bisogna sottolineare che, in epidemiologia, molto spesso si studiano eventi aleatori
per i quali non possibile calcolare la probabilit teorica a priori. In questi casi torna utile la legge
dei grandi numeri: infatti accettiamo come probabilit, che chiamiamo "probabilit statistica", la
frequenza relativa di un evento che si ottiene da un numero abbastanza elevato di prove o di
osservazioni, tutte effettuate nelle stesse condizioni.
171
Ad esempio, non possibile sapere la probabilit che esca "testa" lanciando una moneta truccata.
L'unico modo per conoscere tale probabilit di lanciare un gran numero di volte la moneta
registrando i risultati. Ad esempio, su 1000 lanci otteniamo 612 volte testa. Allora puoi stimare che
la probabilit di ottenere testa con quella moneta sia pari a 0.612. Questa probabilit ottenuta
empiricamente pu essere soltanto stimata, ma non calcolata con precisione. Quasi certamente se tu
facessi un'altra serie di 1000 lanci otterresti un risultato lievemente diverso! Ovviamente, pi alto
il numero di prove e maggiore la precisione della stima.
base dei dati contenuti nella tabella si possono calcolare sia le probabilit di morte che di vita per
una persona appartenente ad ogni classe di et.
Per esempio, per trovare la probabilit che un maschio di 45 anni muoia nei 5 anni successivi
occorre considerare che nel periodo sono morti 1308 individui (ossia 96089-94781) su 96089 in vita
all'inizio del periodo stesso. La probabilit di morte si ottiene calcolando il rapporto fra il numero di
morti nel quinquennio considerato ed il numero di vivi a 40 anni:
Confrontando i dati delle tavole di mortalit di anni diversi si pu monitorare indirettamente lo stato
di salute complessivo di una popolazione ed i progressi dell'assistenza medica. Ad esempio,
nell'anno 1987 la probabilit di morte nei 5 anni successivi per un maschio di 45 anni era
dell'1.84%, mentre nel 2000 tale probabilit era scesa a 1.36%.
Nota che la somma (probabilit di essere in vita)+(probabilit di morire) deve essere pari a 1.
Quindi, una volta nota la probabilit di morte, la probabilit di sopravvivenza si pu ottenere anche
facendone il complemento a 1: probabilit di sopravvivere = 1 - probabilit di morire.
Quantificare la prognosi
9.
Campionamento
9.1 Scopi del campionamento
OBIETTIVI:
Raramente in uno studio epidemiologico possibile esaminare ogni singolo animale della
popolazione. Infatti spesso si limitati dalle risorse disponibili (economiche, di personale, di
laboratori, di tempo ecc.); in altre occasioni, anche supponendo di disporre di risorse illimitate,
l'intera popolazione da studiare non fisicamente raggiungibile oppure non del tutto nota . Pensa,
ad esempio, ad una indagine epidemiologica da effettuare su animali selvatici di una certa specie
(es. camosci) in un parco: probabilmente non sar conosciuto con esattezza il numero degli animali
presenti, n il rapporto maschi/femmine n la distribuzione per et ecc..
In altri casi, il numero di individui che compongono la popolazione da studiare talmente elevato
che lo studio di ognuno di essi fattibile solo teoricamente. Pensa, ad esempio, alle api di un
alveare o ai pesci presenti un laghetto di allevamento. Infine, possibile trovarsi di fronte ad una
combinazione delle suddette difficolt, come ad esempio nel caso si volessero studiare gli insetti
vettori di una determinata malattia in una determinata zona.
Talvolta, soprattutto nel lavoro di ricerca medica, la popolazione addirittura infinita o, meglio,
indeterminata in quanto non conoscibile in modo esaustivo, neppure virtualmente.
ESEMPIO. Una popolazione indeterminata rappresentata da tutti gli animali che, oggi e in futuro,
necessiteranno di una particolare terapia, oppure dall'insieme delle concentrazioni di mercurio
misurabili in tempi diversi in un lago).
Non sempre per popolazione si intende un aggregato di animali; talvolta si pu lavorare su una
popolazione di batteri, o di virus, o di cellule in coltura, o di campioni di latte ecc. Anche in questi
casi evidente che sar spesso impossibile esaminare l'intera popolazione.
Per una serie di motivi, raramente possono essere studiate tutte le unit che compongono una
popolazione. Pertanto, si studia soltanto una parte pi o meno grande della popolazione, per poi
generalizzare all'intera popolazione i risultati ottenuti. Questo processo di generalizzazione dei
risultati ottenuti studiando un campione detto inferenza:
Quando si effettua uno studio per mezzo di un campione, necessario tener presente che non si
otterranno mai risultati del tutto affidabili. Come si vedr in seguito, per valutare la "bont" di uno
studio campionario indispensabile tener conto di vari fattori, fra i quali i pi importanti sono: i
175
criteri di scelta della popolazione in studio, il metodo con cui si selezionato il campione, il periodo
di osservazione, i metodi adottati per identificare i casi di malattia, le tecniche di analisi, la
precisione delle misure effettuate.
176
9.
Campionamento
9.2 Caratteri del campione
OBIETTIVO:
analizzare i caratteri del campione e spiegare perch non esiste il campione perfetto
intuitivo che da una popolazione possono essere estratti moltissimi campioni, che probabilmente
saranno tutti diversi fra loro:
altrettanto intuitivo che le caratteristiche di un campione non saranno mai perfettamente identiche
a quelle della popolazione. Il campione non sar mai la fotocopia precisa della popolazione di
origine. Quindi, se studi un campione allo scopo di effettuare una inferenza sulla popolazione,
giungerai inevitabilmente a conclusioni non del tutto veritiere. In questa unit, e nelle successive,
imparerai come ovviare a questo inconveniente.
Immagina di aver effettuato una indagine su un campione; in pratica, hai misurato un certo
carattere in ciascuna delle unit del campione. Ora vuoi utilizzarev i tuoi dati per trarre delle
conclusioni. Ti devi porre due domande fondamentali:
177
La risposta a queste due domande genera i concetti di validit interna e di validit esterna di uno
studio epidemiologico eseguito su un campione (studio campionario).
Validit interna
La validit interna misura quanto i risultati di uno studio sono corretti per il campione di individui
che sono stati studiati. Essa viene detta interna perch si applica al campione, e non
necessariamente agli altri individui della popolazione. Forse questo concetto ti potr sembrare una
sottigliezza inutile. Per devi pensare che non sempre si tratta di fare misurazioni facili, semplici ed
affidabili (come ad esempio pesare ratti da laboratorio). In molti casi, le cose sono pi complicate:
negli studi clinici, la validit interna dipende dalla correttezza di impostazione dello studio stesso,
dalla scelta di buone tecniche diagnostiche e da un loro corretto utilizzo, da una buona elaborazione
dei dati ecc. Nel caso dei dati ottenuti attraverso questionari, un fattore che contribuisce ad
abbassare la validit interna rappresentato dalla propensione degli intervistati a mentire
sistematicamente su determinate domande, come illustrato nell'esempio che segue.
La validit interna viene diminuita sia dalla variazione casuale che da ogni elemento di bias.
La validit interna condizione necessaria ma non sufficiente perch uno studio sia utile.
Validit esterna
Per semplicit, assumiamo ora che lo studio sia provvisto di ottima validit interna; ci significa che
conosciamo con esattezza le caratteristiche del campione che abbiamo esaminato. Le conclusioni
che ne abbiamo tratto sono certamente valide per gli individui del campione, ma non possiamo dire
se e quanto tali conclusioni siano generalizzabili alla popolazione da cui il campione stato estratto.
La soluzione a questo problema verr accennata nelle unit successive ( metodi di
campionamento, limiti fiduciali, ecc.).
Ovviamente, le conclusioni ottenute attraverso uno studio campionario sono valide soltanto se esiste
una buona validit interna ed esterna. Nella figura seguente viene schematizzato il flusso del
ragionamento riguardo alla validit interna ed esterna di un campione, al fine di giungere a
conclusioni affidabili.
178
intuitivo che::
ESEMPIO 2. Abbiamo il compito di effettuare un'indagine sui rapporti fra mastite della bovina e
179
produzione di latte. Nel territorio sono presenti, in pianura, 14 grandi allevamenti, per un totale di
2900 bovine adulte da latte; nella zona montagnosa, vi sono invece 36 piccoli allevamenti (300
animali in totale). La popolazione di interesse : tutte le bovine da latte. L' unit di analisi la
singola bovina da latte. Le nostre risorse ci consentono di esaminare un campione di 300 animali.
Se tutti gli animali verranno selezionati dagli allevamenti della pianura, avremo un campione non
rappresentativo. Un campione pi rappresentativo sar invece rappresentato dal 90% circa di bovine
degli allevamenti di pianura e dal 10% di vacche di montagna.
In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei
risultati che quasi certamente si discostano (poco o tanto) dalla vera misura della popolazione.
ben vero che il campione dovrebbe rappresentare una immagine della popolazione ridotta dal punto
di vista numerico ma fedele dal punto di vista qualitativo. Tuttavia, non possiamo mai essere sicuri
che il campione rappresenti una copia perfetta della popolazione da cui esso stato estratto, a meno
di non esaminare... l'intera popolazione!
Infatti, posto [n=numero di individui che compongono una popolazione], supponiamo di analizzare
il pi ampio campione possibile costituito da [n-1] individui. Ebbene, intuitivo che, anche in
questo caso, il campione non sar perfettamente rappresentativo della popolazione, in quanto
l'unico individuo non esaminato potrebbe possedere caratteri molto diversi da quelli di tutti gli altri
[n-1] individui.
L'errore di campionamento rappresentato dalla differenza tra i risultati ottenuti dal campione e
la vera caratteristica della popolazione che vogliamo stimare.
L'errore di campionamento non pu mai essere determinato con esattezza, in quanto la vera
caratteristica della popolazione (e rester!) ignota. Esso tuttavia pu essere contenuto entro limiti
pi o meno ristretti adottando appropriati metodi di campionamento. Inoltre, esso pu essere
stimato; ci significa che, con adatti metodi statistici, si possono determinare i limiti probabili
della sua entit.
180
9.
Campionamento
9.3 Errore di campionamento
OBIETTIVO:
Abbiamo gi visto che un campione non mai perfettamente rappresentativo della popolazione da
cui stato estratto. Ci implica che, ogni qual volta studiamo un campione, otteniamo dati che non
rispecchiano la realt: dobbiamo tener conto di un errore di campionamento.
La variazione casuale
La variazione casuale dovuta al caso, cio a quell'insieme di fattori o cause, piccole o grandi,
che agiscono su un fenomeno senza che noi possiamo o vogliamo controllarli esattamente e
prevederne quindi l'azione (Cavalli-Sforza). La variazione casuale ha portato alla nostra
osservazione proprio quegli individui che costituiscono quel campione, nei quali la misura che
vogliamo studiare assume un valore pi alto o pi basso, senza una regola precisa.
La variazione casuale fa s che una misura effettuata su un campione non fornisca un valore identico
a quello ottenibile misurando l'intera popolazione: c' sempre - un certo errore, che viene detto
errore campionario. Questo errore deriva semplicemente dal fatto che stiamo osservando soltanto
una parte della popolazione.
guariscono il 50% dei pazienti trattati. Supponiamo di fare un esperimento per studiare l'effetto dei
due farmaci; supponiamo che, in questo esperimento, non sia presente alcun bias (vedi oltre in
questa stessa unit), e quindi che i dati ottenuti siano assolutamente affidabili. Tuttavia, soprattutto
se l'esperimento viene eseguito su un numero limitato di soggetti, facilmente osserveremo che il
farmaco A induce guarigione con maggior frequenza rispetto al farmaco B (o viceversa). Questo
effetto dovuto, appunto, alla variazione casuale,
La selezione viziata
La selezione viziata quella che viene effettuata su un segmento non rappresentativo della
popolazione. Questo avviene quando la scelta delle unit che costituiranno il campione viene
effettuata con regole non rigorosamente causali. Talvolta, lo stesso sperimentatore che, definendo
delle regole estemporanee volte a neutralizzare - nelle intenzioni - gli effetti del caso e di ottenere
un campione pi aderente alla popolazione, commette un errore che rende i dati inutilizzabili.
Infatti, un campione che non stato ottenuto correttamente fornisce misurazioni e risultati per i
quali impossibile calcolare il cosiddetto errore di campionamento. La selezione viziata fa s che
all'errore campionario si sommi un altro tipo di errore, detto errore non campionario o bias.
ESEMPIO 2. Il frammento prelevato con una biopsia epatica rappresenta circa 1/50000
dell'organo. Essendo il campione cos piccolo rispetto all'intero organo, esiste la possibilit di ampie
variazioni da un campione all'altro. Inoltre, poich il frammento viene esaminato, in genere, allo
scopo di diagnosticare una malattia dell'intero fegato, esiste la possibilit che il processo di
inferenza sia viziato. Ad esempio, si preleva un campione di tessuto sano in un organo ammalato.
182
In conclusione, si pu affermare che soltanto quando la scelta degli individui che compongono il
campione stata dettata dal puro e semplice caso, possibile prevedere e calcolare l'entit della
differenza tra campione e popolazione.
In caso contrario, il campione si dice distorto. Con un campione distorto, non possibile
calcolare l'errore di campionamento ed i dati ottenuti saranno difficilmente utilizzabili.
Pi precisamente, per bias si intende "un processo, effettuato in qualsiasi stadio della
inferenza, che tende a fornire risultati che si discostano sistematicamente (ossia sempre nella stessa
direzione) dai valori veri".
A differenza del bias (che influenza i dati sistematicamente in una direzione o nell'altra), la
variazione casuale fornisce dati che possono essere parimenti al di sopra o al di sotto del valore
vero. Di conseguenza, la media di molte osservazioni non-distorte si avvicina al valore vero della
popolazione, anche se i singoli dati utilizzati per ottenere la media possono discostarsi di molto dal
valore vero.
183
Ragionevolmente collocherai i bersagli come indicato nello schema C: con il campione di colpi di
sinistra (C1) (cio quello del fucile preciso) l'inferenza sar attendibile, come dimostra la corretta
collocazione del centro del bersaglio rispetto alla realt (cos come raffigurato in A1). Al contrario,
utilizzando il campione distorto (C2), sarai indotto a ritenere che il centro del bersaglio sia spostato
rispetto al reale e non riuscirai a posizionarlo correttamente. In quest'ultimo caso, fuor di metafora,
non sarai in grado di stimare correttamente la vera caratteristica della popolazione.
184
9.
Campionamento
9.4 Metodi di campionamento
OBIETTIVO:
Immagina di avere una lista di 100000 animali, e che una met di questi siano maschi e l'altra met
siano femmine. La teoria statistica delle probabilit dice in anticipo che, se estrarrai in modo
casuale mille soggetti dalla lista, otterrai un campione composto per met da maschi e per met da
femmine, con un livello di approssimazione prevedibile a priori.
Analogamente, supponi di ripetere molte volte il lancio di una moneta. L'evento "testa" o "croce"
condizionato soltanto dal caso: le prime volte potr uscire sempre "testa" (oppure sempre "croce"),
ma alla lunga la proporzione di teste e croci nella "popolazione" di lanci tender ad equilibrarsi.
Nelle unit successive verranno illustrati brevemente cinque fra i pi comuni metodi di
campionamento. Di essi, uno un metodo non probabilistico, mentre i restanti 4 sono basati sulla
randomizzazione:
9.
Campionamento
9.5 Campionamento con metodo non probabilistico
OBIETTIVO:
Il campionamento di convenienza viene effettuato con un metodo non probabilistico che non offre a
tutte le unit della popolazione la stessa possibilit di entrere a far parte del campione. In pratica,
alcuni gruppi o individui hanno maggiore probabilit di essere scelti rispetto agli altri. Il
campionamento non probabilistico considerare un cattivo metodo di campionamento.
Esso prevede la selezione del campione in base a criteri di comodo o di praticit, per esempio
perch gli animali sono pi facilmente accessibili, o per ragioni di costo, o perch in una certa zona
sono disponibili volontari ecc.
Anche una scelta soggettivamente ritenuta "casuale" dall'operatore (con le classiche parole ...
scelgo io a caso!) non assicura l'ottenimento di un buon campione, perch l'intervento umano
sempre portatore di distorsioni derivanti da pregiudizi o scelte pi o meno inconsapevoli.
convenienza (vuoi risparmiare tempo e denaro!), scegli di effettuare la raccolta dei campioni da
animali che si trovano soprattutto nel tragitto che va dal paese dove abiti a Parma, la citt dove
studi. Alla termine della raccolta, il tuo campione geograficamente distribuito come indicato nella
mappa a lato, in cui ogni puntino rosso rappresenta un prelievo. E' evidente che questo campione
non rappresentativo della popolazione-oggetto prevista nella tua tesi. Quindi, il tuo campione
distorto.
9.
Campionamento
9.6 Campionamento per randomizzazione semplice
OBIETTIVO:
La randomizzazione semplice (come altri metodi basati sul caso) un metodo valido per il
campionamento perch ha le seguenti caratteristiche:
Tuttavia, bisogna osservare che vi sono situazioni in cui questo metodo risulta poco pratico se non
addirittura inapplicabile. Il principale svantaggio quello di richiedere la preventiva numerazione di
tutti gli animali (o una loro facile numerabilit); poi, una volta estratti i numeri, necessario
individuare nella popolazione i soggetti corrispondenti. La scarsa applicabilit di questo metodo
viene illustrata nell'esempio che segue.
Foglio di calcolo per Microsoft Excel che genera numeri casuali (con ripetizione) compresi fra 0 e
un numero n a scelta .
Foglio di calcolo per Microsoft Excel che genera n numeri casuali (senza ripetizione) compresi fra
due numeri interi a scelta .
191
9.
Campionamento
9.7 Campionamento per randomizzazione sistematica
OBIETTIVO:
Questo metodo pi pratico rispetto alla randomizzazione semplice, ed assicura anche che le
singole unit del campione siano distribuite uniformemente all'interno della popolazione.
Occorre tuttavia porre attenzione che l'intervallo di campionamento prescelto non sia influenzato da
qualche variabile esterna che ha la stessa ciclicit del campionamento (v. successivo ESEMPIO 3).
ESEMPIO 1. Nel corso di una indagine sulle ulcere gastriche del maiale, devi ottenere un campione
costituito da 40 stomaci suini prelevati dai 450 suini che vengono macellati quotidianamente in un
macello. La lista di campionamento rappresentata dai 450 suini, numerati in base in base all'ordine
di macellazione. Preleverai uno stomaco ogni 11 animali macellati.
Nella figura che segue viene schematizzato un esempio di campionamento per randomizzazione
sistematica, ipotizzando di dover estrarre 5 animali da una popolazione di 24. Per evitare di iniziare
sempre dell'animale n. 1, l'animale da cui iniziare (nell'esempio: il numero 3) viene scelto a caso.
Nota che il campionamento sistematico non pu essere considerato una forma di randomizzazione
"a pieno titolo", in quanto garantisce una casualit di selezione molto pi limitata rispetto al
campionamento casuale semplice.
Ad esempio, mediante la la randomizzazione semplice si possono estrarre, da una popolazione di
100 animali, ben 1013 campioni diversi costituiti 10 animali ciascuno. Nello stesso scenario, il
campionamento sistematico consente invece di ottenere soltanto 10 differenti campioni.
193
9.
Campionamento
9.9 Campionamento per randomizzazione stratificata
OBIETTIVO:
Nello schema che segue viene riassunto il procedimento di selezione del campione, in cui si ipotizza
che la razza degli animali sia un fattore che influenza il fattore che dovr essere studiato.
194
Ovviamente lo stato di tutte le unit della lista di campionamento riguardo ai fattori su cui basata
la stratificazione, deve essere noto prima di scegliere il campione. Ci costituisce una limitazione
operativa del campionamento stratificato
Non indispensabile che il numero di animali che compongono il campione all'interno di ciascuno
strato sia proporzionale alla dimensione dello strato nella popolazione. Cio, in altre parole, si pu
effettuare un campionamento "non proporzionale". Naturalmente, con un campionamento non
proporzionale, le inferenze sulla
popolazione andranno debitamente
aggiustate.
9.
Campionamento
9.9 Campionamento a grappolo
OBIETTIVO:
Nello schema che segue viene riassunto un procedimento di selezione del campione mediante
campionamento a grappolo.
9.
Campionamento
9.10 Variabilit di una stima
OBIETTIVO:
Finora abbiamo descritto alcuni metodi che consentono di estrarre da una popolazione un campione
affidabile. In questa Unit (es in quelle successive) vediamo come si utilizzano i dati che si
ottengono dallo studio del campione.
Dopo aver selezionato un campione, procederai a misurare il parametro che ti interessa su tutte le
unit) del campione stesso. Alla fine del tuo lavoro, conoscerai lo stato degli animali che
compongono il campione. Per, in realt, questo dato non ti interessa molto: infatti, a te interessa
conoscere lo stato degli animali dell'intera popolazione!
L'uguaglianza dello schema non una vera uguaglianza matematica. Tornando all'esempio: puoi
essere sicuro che siano protette proprio 900 galline su 1000? Ovviamente no, potrebbero essere, per
esempio, 870 o 815, o 945 ecc.. In sostanza, il problema che stiamo affrontando quello di fare un
corretto processo di inferenza. In altre parole, dobbiamo passare dal particolare (il campione) al
generale (la popolazione) senza commettere un errore troppo grande. Ci non pu essere ottenuto
ricorrendo al semplice buon senso. Il problema va risolto, invece, con un metodo oggettivo,
ricorrendo alla statistica inferenziale (non farti spaventare da questa terminologia... vedrai che pi
facile di quel che pensi!).
Sar quello che faremo nelle prossime Unit di questo Capitolo.
In base a quanto detto finora, dovresti essere convinto che l'uguaglianza dello schema precedente va
sostituita con questa:
Il processo di inferenza porta sempre con s una certa quota di errore. Ci inevitabile, perch il
campione non potr mai essere perfettamente rappresentativo della popolazione da cui proviene.
Pertanto, attraverso la misura ottenuta su un campione, potremo soltanto ottenere una stima della
200
vera caratteristica della popolazione. Questa stima, come vedrai nelle prossime Unit, pu essere
calcolata facilmente.
Per ora baster dire che la precisione della stima influenzata da alcuni fattori, dei quali ne conosci
gi uno: il metodo di campionamento. Infatti, se il campionamento non stato fatto correttamente, il
campione distorto, non rappresentativo della popolazione, e quindi la stima inaffidabile.
Un altro fattore molto importante che influisce sulla precisione della stima il numero di
animali che compongono il campione (numerosit del campione). Anche questo un concetto
facilmente intuibile: campioni grandi sono pi affidabili, e permettono stime pi precise
Riassumendo: stima significa valutazione approssimativa. La stima, per sua stessa natura, non
pu essere esatta ma, se il campione stato selezionato con una metodica corretta
(randomizzazione), ne potremo stabilire la variabilit, ossia i limiti probabili di oscillazione.
201
9.
Campionamento
9.11 Esempio di calcolo della variabilit di una stima
OBIETTIVO:
analizzare un esempio di calcolo della stima di prevalenza di una malattia in una popolazione in
base ai risultati di un campione randomizzato
constatare che la variabilit di una misura effettuata su un campione non dipende dalla
numerosit della popolazione
Un esempio esplicativo
Nota. Il campionamento a grappolo stato scelto perch, nello scenario ipotizzato, quello pi
conveniente sul piano pratico. Ai fini dell'esempio, per, avresti potuto utilizzare un altro tipo di
campionamento, purch randomizzato (es. randomizzazione semplice, o randomizzazione
sistematica, o sttatificata).
Sottoponi al test i 40 animali del campione; 14 di essi risultano test-positivi. Quindi, nel campione
la proporzione di positivi pari a 14/40=0.35. Quindi: p=0.35, ossia 35%. Poich il campione
randomizzato, non sono presenti fonti di distorsione (bias) e, quindi, esso rappresentativo della
popolazione di interesse (i 500 suini).
Allora, inizialmente, ragionevole assumere che anche nella popolazione la positivit sia all'incirca
pari a 0.35. La situazione viene riassunta nello schema che segue:
202
Come gi detto, la composizione del campione influenzata soltanto dal caso (non ci sono errori
sistematici). Pertanto, il valore statistico che hai calcolato (0.35) influenzato soltanto dall' errore
campionario, di cui possiamo calcolare i limiti.
In altre parole, possiamo stimare quale sar la vera proporzione di test-positivi nella popolazione.
A questo scopo, a partire dalla proporzione p ottenuta (0.35), dobbiamo calcolare dapprima la
varianza e poi, da questa, l'errore standard. Quest'ultimo rappresenta l'indice della variabilit
della nostra statistica. Il calcolo si esegue come segue:
La variabilit della proporzione di animali test-positivi ottenuta dallo studio del campione pu
essere stimata come segue:
Ecco espresso qui sopra il concetto di stima: essa ti dice che puoi essere abbastanza sicuro che la
vera percentuale di test-positivi nella popolazione sia compresa fra 27.5 e 42.5%. Questa stessa
affermazione pu essere espressa meglio cos: esiste una certa probabilit che la vera percentuale
di test-positivi nella popolazione sia compresa fra 27.5 e 42.5 %.
Naturalmente non possiamo accontentarci di affermare genericamente che esiste una certa
probabilit: questa certa probabilit vogliamo conoscerla! quello che faremo nella prossima
Unit, in cui porteremo a termine l'esempio qui iniziato.
Dalla formula per il calcolo della varianza puoi dedurre che la grandezza dell'errore standard in
relazione inversa con la numerosit del campione, Ci conferma quanto detto nell'Unit precedente:
pi il campione, pi la stima precisa.
Invece, contrariamente a quanto si pensa comunemente, la precisione della stima non dipende dalla
numerosit della popolazione da cui il campione stato estratto (a patto che il campione sia
"abbastanza" piccolo - diciamo almeno 10 volte pi piccolo - rispetto alla popolazione).
Nell'esempio ora concluso, l'errore standard assume lo stesso valore nel caso in cui il campione di
40 animali provenga da una popolazione di 500 o, per esempio, di 5000 o di 50000 ecc. Infatti,
come puoi verificare dando un'occhiata ai calcoli, la numerosit della popolazione non compare nel
procedimento di calcolo dell'errore standard.
Supponiamo di aver estratto, dalla stessa popolazione di 500 suini dell'esempio precedente, un
campione di 100 animali, e di aver ottenuto la stessa proporzione di animali positivi (35%). Si tratta
di un campione relativamente grande, pari a 1/5 della popolazione, e quindi nel calcolo dell'errore
standard necessario considerare il fattore di correzione per una popolazione finita. Perci, il
calcolo dell'errore standard diventa:
A rigore, il fattore di correzione dovrebbe essere utilizzato anche nel caso di campioni piccoli
rispetto alla popolazione. Tuttavia quando il campione piccolo il valore del fattore di correzione si
approssima ad 1, e quindi diviene ininfluente nel calcolo dell'errore standard. Per questo motivo
esso viene generalmente omesso.
Foglio di calcolo per Microsoft Excel che visualizza, con un diagramma a torta, i limiti fiduciali in
un campione a scelta.
205
9.
Campionamento
9.12 Errore standard e limiti fiduciali
OBIETTIVI:
Proseguiamo l'esempio lasciato in sospeso nella Unit precedente (se non l'hai letta, ti consiglio di
farlo ora). Riassumendo: avevi studiato un campione di 40 suini, avevi calcolato un semplice valore
statistico: la proporzione di animali positivi per una certa malattia. I suini positivi erano 14, quindi
la proporzione era risultata pari a 14/40=0.35 (35%); l'errore standard di questa proporzione era di
0.0754 (7.54%).
L'errore standard rappresenta un indice della variabilit della proporzione; possiamo anche dire
una misura l'affidabilit della proporzione: pi esso piccolo, pi la proporzione che hai calcolato
nel campione si avvicina alla vera proporzione della popolazione.
Nella pratica, l'errore standard serve per calcolare l'intervallo fiduciale o intervallo di confidenza
(sinonimo: limiti fiduciali) della proporzione. L'intervallo di confidenza l'intervallo di valori entro
i quali si stima che cada, con un livello di probabilit scelto a piacere, il valore vero della
popolazione. In realt si sceglie quasi sempre un livello di probabilit di 0.95 o, pi raramente, 0.99,
ottenendo rispettivamente l'intervallo di confidenza al 95% o al 99%.
Certamente ti chiederai da dove vengono i valori scritti in blu nello schema soprastante. Per quanto
riguarda i moltiplicatori dell'errore standard, la risposta presuppone nonzioni di statistica un po'
avanzate; quindi sarebbe troppo complicata ed al di fuori dello scopo di questo Quaderno. Quindi ti
consiglio di prendere questi due valori (1.96 e 2.58) come numeri magici da utilizzare senza porti
troppe domande.
L'intervallo di confidenza calcolato come: valore statistico 1 volta l'errore standard fornisce una
confidenza del 68% circa, troppo bassa per essere di una qualche utilit pratica.
Per quanto riguarda i due livelli (0.95 e 0.99, oppure in percentuale 95% e 99%) di probabilit, si
pu dire che essi sono adottati per convenzione, e rappresentano uno standard nel campo bio-
medico. Essi consentono di avere una probabilit abbastanza alta (appunto 95% o 99%) di
individuare l'intervallo giusto senza per ampliarlo eccessivamente. Infatti evidente, dalle
formule dello schema soprastante, che l'ampiezza dell'intervallo cresce con l'aumentare della
probabilit.
Torniamo al nostro esempio. Con i dati che hai a disposizione, l'intervallo di confidenza 95% si
calcola come segue:
Nello schema che segue visualizzato il raffronto fra l'ampiezza dei due intervalli di confidenza.
207
con confidenza 95% che la percentuale di positivit nella popolazione compresa fra 20% e 50%
circa;
con confidenza 99% che la percentuale di positivit nella popolazione compresa fra 15% e 55%
circa;
Ripetiamo ancora il significato dell'espressione confidenza 95%: c' una probabilit del 95%
che l'intervallo trovato includa la vera caratteristica della popolazione.
Questa definizione non del tutto corretta, e certamente uno statistico puro potrebbe storcere il
naso... ma in questa sede giustificata dal Teorema di Saki che recita: una piccola inesattezza a
volte risparmia tonnellate di spiegazioni :-))
Ecco una definizione migliore (ma anche un po' pi difficile da assimilare): confidenza 95%
significa che se ripetessimo la stessa indagine per 100 volte con gli stessi metodi (ma su 100
campioni diversi), probabilmente otterremmo ogni volta una stima diversa; tuttavia, il vero valore
della popolazione sarebbe all'interno del nostro intervallo di confidenza 95 volte su 100. In altre
parole, l'intervallo di confidenza fornisce un risultato aderente alla realt nel 95% dei casi.
Prima di trattare questo argomento, vale la pena di fare un po' di chiarezza riguardo a due statistiche
sulle quali molto spesso c' confusione: la deviazione standard e l'errore standard.
La deviazione standard indica variabilit di una misura effettuata sul campione; invece, l'errore
standard indica la variabilit di un valore statistico (es. una percentuale, una media ecc.). Devi fare
attenzione a non confondere l'errore standard con la deviazione standard! Si tratta di due cose molto
diverse. Ripetiamo di nuovo:
la deviazione standard descrive la variabilit di una serie di misure effettuate su un campione o una
popolazione.
l'errore standard descrive l'incertezza nella stima di un valore statistico (es. media, proporzione
ecc.);
208
ESEMPIO. Sono stati pesati singolarmente 100 suini, ottenendo alttrettanti valori (es. 94.0, 92.2.,
97.9 ecc.). Il peso medio risultato pari a 95.2 kg. Sui 100 valori del peso di ciascun suino puoi
calcolare la deviazione standard (come gi descritto altrove). Sulla media ottenuta puoi invece
calcolare l'errore standard.
Abbiamo visto come si calcola l'errore standard di una proporzione (o percentuale). Ma come si fa a
calcolare l'errore standard di una media? molto semplice: basta dividere la deviazione standard
per la radice quadrata della numerosit del campione (n):
Nota che, ancora una volta, l'errore standard dipende dalla numerosit del campione: pi grande il
campione, pi piccolo sar l'errore standard, e quindi pi attendibilit la media calcolata.
L'errore standard della media pu essere utilizzato per calcolare l'intervallo di confidenza, cos
come gi visto per le proporzioni. Il calcolo molto simile:
dove t un coefficiente desumibile dalla Tabella dei valori t per la distribuzione di Student (ne
trovi qui una semplificata). Nell'uso della tabella, devi tener conto che i gradi di libert si calcolano
come: numerosit del campione - 1.
Puoi concludere, con confidenza 95%, che il peso medio dei suini del gruppo compreso fra 81.17
e 83.83kg.
209
9.
Campionamento
9.13 Dimensione o numerosit del campione
OBIETTIVO:
acquisire informazioni sui criteri che regolano la scelta del numero di unit che compongono il
campione da studiare ("numerosit del campione");
Secondo l'opinione comune, la bont dei risultati ottenibili da un campione (ad esempio i risultati di
un sondaggio) dipende unicamente dal numero degli individui che compongono il campione stesso
e non dal modo con cui essi sono stati selezionati. La debolezza di questo assunto gi stata
dimostrata nelle unit precedenti.
Un'altra opinione comune prevede che la dimensione del campione debba essere proporzionata alla
dimensione della popolazione in studio. Le leggi della statistica dimostrano invece che questo
assunto completamente falso. Ad esempio, il fatto di voler fare un sondaggio sugli abitanti di un
capoluogo di provincia, su quelli di una grande citt o addirittura su tutta la popolazione italiana
non ha nessuna influenza sul numero di persone necessario per ottenere un campione
rappresentativo. Insomma, contrariamente a quello che l'intuito potrebbe suggerire, un campione di
1000 persone pu, se scelto con un metodo appropriato, rappresentare con la stessa attendibilit e
gli stessi limiti la popolazione di Parma, oppure quella dell'Emilia, oppure quella dell'intera Italia,
nel senso che il margine di errore dovuto al campionamento sar sempre pari al 3% circa. Ci a
patto che la popolazione sia sufficientemente grande, ossia composta da almeno 10000 unit.
D'altra parte, a questa stessa conclusione si pu giungere in base a quanto contenuto nella unit
precedente, in cui si spiega che l'errore standard di una proporzione in relazione inversa con la
dimensione del campione, ma non dipende affatto dalla numerosit della popolazione in studio.
Infatti - come gi visto - nel calcolo dell'intervallo di confidenza 95% di una proporzione, la
numerosit della popolazione da cui il campione proviene non viene considerata:
Ci nel caso in cui la varianza nella popolazione sia massima (p=0.5); negli altri casi, il margine di
errore risulta ancora pi basso. Ad esempio, con p=0.25, l'I.C.95% 25% 2.7%.
La varianza
La varianza una misura del grado di variazioni o oscillazioni presenti, relativamente al parametro
che vogliamo stimare, nella popolazione. L'entit di queste variazioni pu essere derivata, almeno
approssimativamente, dall'esperienza, o dai risultati di altre analoghe indagini effettuate in
precedenza, o dalla conoscenza della storia naturale della malattia, o da altri fattori.
Una popolazione in cui il parametro da misurare presenta ampie oscillazioni ha una varianza
elevata; una popolazione in cui le oscillazioni sono scarse ha una varianza bassa. intuitivo che la
precisione di un campione maggiore quando la popolazione da cui stato estratto
tendenzialmente omogenea, mentre minore quando la popolazione eterogenea.
La varianza un fattore importante nel calcolo della numerosit del campione. In popolazioni a
bassa varianza, lo studio di pochi animali fornisce comunque un buon quadro della vera
caratteristica di popolazione.
211
In una popolazione teorica composta da n individui tutti identici fra loro, lo studio di 1 solo
individuo sufficiente per ottenere una indicazione precisa riguardo alla intera popolazione.
Al contrario, se la varianza alta, sono necessari molti animali, poich ciascuno degli animali
prescelti pu essere molto diverso dalla media della popolazione.
Il livello di confidenza
L'intervallo di confidenza rappresenta una misura della bont di una stima. Un intervallo di
confidenza molto ampio suggerisce che non siamo molto sicuri del punto in cui si trova il vero
valore. Viceversa, un intervallo ristretto indica che siamo abbastanza sicuri che il valore trovato
piuttosto vicino al valore vero della popolazione; in questo caso la stima sar, quindi, pi precisa.
Il livello di confidenza una misura della sicurezza della stima: ad esempio, con un livello di
confidenza 95% siamo sicuri al 95% che il valore vero cade nell'intervallo trovato. Cio, se
ripetessimo lo studio 20 volte, in media sbaglieremmo 1 volta ma saremmo nel giusto 19 volte.
Per convenzione si utilizza generalmente il livello di confidenza 95%; talvolta si impiegano anche i
livelli 90% o 99% o 99.9%. La scelta del livello di confidenza spesso dettata da considerazioni
pratiche (quantit di risorse e di tempo disponibili ecc.) pi che dalla teoria. chiaro che, se
desideri raggiungere un livello di confidenza elevato, dovrai esaminare un campione pi grande.
Anche la performance del test che verr utilizzato gioca un ruolo importante nel calcolo della
numerosit del campione. Se il test poco affidabile (cio a bassa sensibilit e/o specificit),
allora la numerosit del campione dovr essere alta. Questo argomento viene trattato
estensivamente nel (cio a bassa Capitolo 11.
All'atto pratico, la determinazione della numerosit del campione dipende da considerazioni di tipo
non-statistico;
statistico.
studiati se la stima derivante dal campione deve cadere entro 7 punti percentuali rispetto alla vera
prevalenza, con confidenza 95%?
La formula
Supponi di voler stimare la prevalenza di una malattia (o di un altro carattere) in una popolazione.
Come gi detto, attraverso lo studio del campione vuoi una stima della prevalenza con una
determinata precisione ed a un prescelto livello di confidenza. La dimensione pu essere calcolata,
con un livello di confidenza 95%, attraverso la seguente formula:
Se desideri una confidenza del 99%, sostituisci il valore 1.96 con 2.58.
Ora, per mezzo di un esempio, calcolerai la dimensione del campione necessaria in una indagine.
Sospetti che la prevalenza di una malattia in una popolazione sia pari a 0.3. Vuoi studiare un
campione per stimare la prevalenza della malattia nella popolazione con precisione 0.07 (ossia 7%).
Ci significa che, ammesso che il tuo pronostico di prevalenza 0.3 sia abbastanza giusto, ti aspetti
che i limiti dell'intervallo di confidenza della stima siano compresi fra 0.23 e 0.37. Vuoi calcolare la
dimensione del campione necessaria.
Puoi verificare a ritroso, come descritto di seguito ed utilizzando conoscenze che hai gi acquisito,
che un tal campione risponda alle tue aspettative:
hai estratto un campione di 165 animali;
supponi che, fra questi, ne siano risultati ammalati 44 (prevalenza = 44/165= 0.26, valore
abbastanza vicino alla tua previsione);
il valore 0.26 una stima, ne puoi calcolare la variabilit attraverso l'errore standard (magari con
l'aiuto del foglio di calcolo);
l'errore standard risulta pari a 0.034;
213
conoscendo l'errore standard puoi calcolare i limiti fiduciali 95% (o intervallo di confidenza
95%);
ottieni un limite fiduciale inferiore di 0.19 ed un limite superiore di 0.33
la precisione della tua stima , come desiderato, del 7%. Infatti: 0.26-0.19=0.07 ed anche 0.26-
0.33=-0.07.
Infine, resta da aggiungere che se il campione piuttosto grande (circa 1/20 o pi) rispetto alla
popolazione da cui stato estratto, se ne pu ridurre la numerosit con la formula che segue:
Se, nell'esempio precedente, i 165 animali dovessero essere estratti da una popolazione di 740,
allora il campione potrebbe essere ridotto a (165*740)/(165+740)=135.
Foglio di calcolo per Microsoft Excel per calcolare la numerosit del campione.
214
9.
Campionamento
9.9 Campionamento mirato al rilevamento della presenza di malattia
OBIETTIVO:
In alcuni casi, lo scopo del campionamento non quello di stimare un parametro quantitativo della
popolazione o di valutare la frequenza di un fenomeno, bens, pi semplicemente, quello di stabilire
qualitativamente se una malattia presente (o no) in una determinata popolazione.
Questa necessit si verifica spesso in occasione di epidemie per verificare l'eventuale diffusione sul
territorio di una malattia infettiva. La stessa necessit emerge anche in corso programmi di
monitoraggio o controllo o eradicazione di una malattia.
nei programmi di controllo delle malattie diffusibili negli allevamenti intensivi di diverse specie
animali, si pu adottare lo schema dell'allevamento accreditato. Questo schema utile
soprattutto negli allevamento di riproduzione che forniscono animali ad altri allevatori.
L'accreditamento prevede che l'allevamento venga sottoposto a test che consentono di dichiararlo
indenne da determinate malattie. Ci significa che gli acquirenti possono acquistare con
maggiore tranquillit e, d'altra parte, gli animali provenienti da allevamenti accreditati spuntano
prezzi pi elevati rispetto agli animali convenzionali.
i piani di profilassi su scala nazionale tendono, in genere, a ottenere una popolazione indenne da
una particolare malattia, attraverso un processo (es. abbattimento oppure vaccinazione seguita da
abbattimento ecc.) che conduce alla eradicazione della malattia. Alla fine del piano di
eradicazione, le Autorit sanitarie devono avere la certezza che la malattia stata eradicata. In
seguito, sono necessarie azioni di monitoraggio per accertare il mantenimento dello stato di
indennit.
l'esportazione di animali vivi o di loro prodotti uno strumento importante per il progresso
dell'agricoltura, soprattutto dei paesi meno sviluppati; tuttavia, ad un Paese esportatore viene
sempre richiesto, da parte del Paese importatore, di dimostrare che lo scambio non comporta rischi
di diffusione di malattie trasmissibili.
Il problema principale legato al fatto che molto difficile - se non impossibile - dimostrare con
certezza matematica che una popolazione di animali esente da una determinata malattia. Le
difficolt derivano da 2 fattori principali:
1. Il primo fattore legato al fatto che, per dichiarare indenne la popolazione, si deve saggiare ogni
animale che fa parte della popolazione stessa. Ci comporta, soprattutto nel caso di popolazioni
costituite da un ingente numero di individui, l'impiego di risorse ingenti (e non sempre disponibili).
2. Il secondo fattore legato al test che si utilizza per il rilevamento dello stato di malattia o di
infezione. Nessun test perfetto; molti test possono fornire, anche se in piccola percentuale,
215
risultati falsi-negativi. Ossia, il test pu classificare come sano un animale che in realt
ammalato
Tenuto conto delle difficolt ora esposte, si pu aggirare il problema considerando che una malattia,
se presente nella popolazione, probabilmente colpir un certo numero di individui e non uno solo..
Su questa base, potrebbe essere molto interessante rispondere alla seguente domanda:
ESEMPIO. Possiamo prevedere che la salmonellosi del suino, che una malattia contagiosa,
difficilmente colpir meno del 5% dei soggetti appartenenti ad un gruppo. Possiamo calcolare la
numerosit del campione tale che si possa identificare con una certa sicurezza (confidenza!) la
presenza della malattia, se essa presente nel gruppo. In altre parole, possiamo estrarre dal gruppo
un numero di animali tale che da avere nel campione almeno 1 soggetto positivo.
La risposta si trova nella formula che segue, utile per risolvere il problema impegnando il minimo
di risorse, ed ottenendo un risultato affidabile ad un livello di confidenza prescelto. Questo livello di
confidenza misura la probabilit che la popolazione sia esente dalla malattia se tutti gli n individui
del campione esaminato risultano negativi; in genere si adotta un livello di confidenza 0.95 (95%) o
0.99 (99%).
216
Formula tratta da: Cannon R.M., Roe R.T. (1982). Livestock Disease Surveys: a Field Manual for
Veterinarians. Australian Government Publishing Service, Canberra.
Nel caso in cui la popolazione oggetto dell'indagine sia di numerosit infinita (o composta da un
numero elevato di unit, dell'ordine di migliaia), si pu adottare la seguente formula, pi semplice,
che fornisce all'incirca gli stessi risultati della precedente a patto che la prevalenza presunta sia >5%
circa:
Concludendo: anche se non possiamo provare con certezza che una popolazione esente da una
malattia, possiamo per ottenere una stima, con precisione a nostra scelta, saggiando un numero
adeguato di animali. In altre parole, potremo dimostrare con un certo grado di probabilit che la
malattia non presente nella popolazione.
da sottolineare che per l'applicazione della formula richiesta la conoscenza presuntiva di D, cio
del numero di animali positivi nella popolazione ( prevalenza). Questa stima presuntiva pu
essere effettuata in base alla conoscenza dei caratteri generali della malattia in studio, della sua
storia naturale, dei meccanismi di trasmissione, della situazione ambientale e geografica e di altri
fattori contingenti.
Foglio di calcolo per Microsoft Excel che visualizza, con un diagramma a torta, la dimensione del
campione in rapporto alla prevalenza della malattia ed al livello di confidenza.
217
9.
Campionamento
9.15 Esempio di campionamento mirato al rilevamento di malattia
OBIETTIVO:
verificare, tramite un esempio, l'utilizzo della formula che fornisce la numerosit del campione
qualora si voglia rilevare la presenza di una malattia.
Nella Unit precedente stato descritto un metodo di determinazione della numerosit del
campione nel caso si voglia determinare qualitativamente la presenza/assenza di una malattia in una
popolazione. Ora mettiamo alla prova il metodo attraverso un esempio.
Pertanto, esaminerai 258 suini; se tutti risulteranno negativi, concluderai - con confidenza 95% -
che il gruppo esente da quella malattia.
Il vantaggio di un approccio di questo tipo diventa ancor pi evidente nel caso in cui la prevalenza
presunta sia pi elevata: con gli stessi dati dell'esempio, ipotizzando per che il numero di animali
ammalati sia pari o superiore a 50, la dimensione del campione scende a 57 animali.
Guarda la Tabella che segue: comprenderai meglio l'estrema l'utilit della formula nel caso in cui
sia necessario stabilire se in una popolazione presente o no una malattia. Nella Tabella sono
riportati alcuni esempi di numerosit del campione in funzione della dimensione della dimensione
218
della popolazione, della frequenza (prevalenza) della malattia nella popolazione stessa e del livello
di confidenza prescelto (95 o 99%).
Proviamo ad usare la Tabella: supponi, ad esempio, di dover esaminare una popolazione composta
da 300 animali al fine di escludere la presenza di una determinata malattia, ipotizzando che il
numero di animali "positivi" in questa popolazione non sia inferiore a 15, ossia che la prevalenza
non sia inferiore a 0.05.
Nella Tabella, ti devi collocare sulla riga popolazione=300 e nella cella di intersezione con la
colonna prevalenza=0.05. Qui leggi i valori 54 e 78. Ci significa che, esaminando un campione
randomizzato di 54 animali senza trovare alcun positivo, potrai affermare con confidenza 95% che
quella popolazione esente dalla malattia. Per ottenere un livello di confidenza 99% dovresti
esaminare 78 animali.
Dai dati in Tabella puoi notare che la numerosit del campione fortemente influenzata dalla
prevalenza della malattia; quando la prevalenza molto elevata, il fattore numerosit della
popolazione diventa ininfluente.
Alla fine di questa Unit trovi un foglio di calcolo che ti permette di calcolare e visualizzare, con un
diagramma a torta, la numerosit del campione in rapporto alla prevalenza della malattia ed al
livello di confidenza prescelto.
Al quesito si risponde applicando la stessa formula vista nell'Unit precedente, ma che con un po' di
manipolazione algebrica stata risolta per D come segue:
Foglio di calcolo per Microsoft Excel che visualizza, con un diagramma a torta, la dimensione del
campione in rapporto alla prevalenza della malattia ed un livello di confidenza a scelta.
220
10. Misure di
frequenza delle malattie
10.1 Misure di frequenza delle malattie: espressione generale
OBIETTIVI:
apprendere i principi di base da utilizzare per la misura della frequenza di fenomeni morbosi
Per, la semplice enumerazione dei casi di malattia e la loro espressione come valore assoluto,
senza fornire alcun significativo riferimento, raramente utile. Per ottenere dei dati utilizzabili ed
interpretabili, dobbiamo esprimere i risultati delle nostre misure sotto forma di proporzioni o
rapporti, o tassi.
Le misure di frequenza delle malattie possono riferirsi ad una vasta gamma di eventi o di fenomeni.
Considera, ad esempio, lo schema seguente in cui vengono mostrate alcune componenti che
contribuiscono, come evento finale, alla morte degli animali per una malattia infettiva.
221
Dallo schema puoi notare che, in una popolazione, una certa quota di animali sono recettivi a quella
malattia infettiva; di questi, solo alcuni sono esposti all'agente causale; fra gli esposti, alcuni si
infettano e, fra gli infetti, alcuni si ammalano. Infine, alcuni degli ammalati muoiono. evidente
che, a seconda degli eventi considerati, si possono calcolare frequenze diverse. Ad esempio, potresti
calcolare la proporzione di:
- esposti sulla popolazione totale
- malati sugli esposti
- morti sulla popolazione totale
- morti sugli infetti
- di morti sugli ammalati
- eccetera
Potresti studiare anche la probabilit futura di eventi, cercando di prevedere, ad esempio, quanti
individui (o allevamenti ecc.) si infetteranno o si ammaleranno o verranno a morte in un
determinato periodo di tempo all'interno di popolazioni di dimensioni e con caratteristiche diverse.
Tutte queste misure (o previsioni) vengono espresse attraverso una frazione in cui al denominatore
si pone un valore appropriato a seconda della misura che si sta compiendo e dell'evento in studio.
Molto spesso, quando si studia l'evento malattia in una popolazione, al denominatore si pone il
numero di animali biologicamente capaci di esprimere l'evento-malattia, ossia tutti gli animali
che, in quella popolazione, possono ammalarsi, ossia presentare sintomi clinici della malattia. Ai
fini del calcolo, non verranno quindi considerati come facenti parte della popolazione quegli
animali che, per et, sesso, razza o altri fattori, non possono contrarre la malattia in oggetto.
ESEMPIO 1. Vuoi indagare sulla frequenza di oviduttite (flogosi dell'ovidotto) in un gruppo di polli
da riproduzione in cui sono presenti 4560 animali (570 galli e 3990 galline). La popolazione sar
rappresentata soltanto dalle 3990 femmine, in quanto i maschi non sono biologicamente capaci di
esprimere l'evento studiato.
ESEMPIO 2. La frequenza di cancro della cervice nella cagna verrebbe sottostimata se nella
popolazione venissero compresi anche i soggetti che sono stati sottoposti a isterectomia.
L'insieme degli individui biologicamente capaci di esprimere l'evento viene detto popolazione a
rischio. Gli individui della popolazione a rischio che sono soggetti ad uno o pi "fattori di rischio"
222
Vale la pena di sottolineare di nuovo anche che le misure di frequenza delle malattie, per avere un
senso, devono essere indipendenti dalle dimensioni della popolazione. Perci assurdo esprimere il
numero dei soggetti che presentano un certo carattere in una popolazione utilizzando semplicemente
un un valore assoluto.
ESEMPIO. Considera la seguente affermazione: Nell'allevamento di suini del sig. X oggi vi sono
15 animali ammalati.. Questa affermazione non chiarisce affatto la situazione dell'allevamento:
infatti i 15 ammalati potrebbero far parte di un piccolo allevamento di 100 animali oppure di un
grande complesso di 10000.
In conclusione, per esprimere la frequenza di un fenomeno (es. malattia), non puoi utilizzare non un
valore assoluto, ma devi ricorrere ad una frazione la cui forma generale indicata in questo schema:
Come vedi, si tratta di una frazione un po' particolare, in quanto il numeratore compreso nel
denominatore! Essa assume sempre un valore compreso fra 0 e 1, e viende detta proporzione.
Per rapporto si intende invece una frazione in cui il numeratore non compreso nel
223
denominatore. Ben difficilmente in epidemiologia si ha a che fare con numeri negativi; perci
possiamo ritenere che un rapporto assuma un valore compreso fra 0 e +infinito..
Perch meglio utilizzare una proporzione piuttosto che un rapporto? Il principale motivo legato
alla mancanza di simmetria del rapporto. Considera il rapporto A/B. Se A pi grande di B, il
rapporto pu variare in un intervallo (range) compreso fra 1 ed infinito. Se invece A assume un
valore inferiore a B, allora il range del rapporto ristretto a valori fra 0 e 1.
In altre parole, se modifichiamo il modo con cui definiamo il rapporto (passando da A/B a B/A o
viceversa) i valori nel range 1...infinito passano nel range 0...1 e viceversa.
Rapporti e proporzioni sono misure statiche, che si intendono effettuate in un determinato istante e
nelle quali non viene considerata la variabile tempo. I tassi sono invece misure dinamiche, che
rappresentano la variazione di una quantit per la variazione unitaria di un'altra quantit
(generalmente il tempo). Pensa all'utilizzo del termine tasso applicato ai depositi bancario: es.
tasso di interesse annuo, mensile ecc..
Un elemento di confusione dovuto al fatto che, in medicina, il termine tasso viene usato talvolta
come sinonimo di rapporto o proporzione, in quanto non si considera la variabile tempo. Ad
esempio, si parla di tasso di glicemia per indicare la quantit di glucosio presente per unit di
volume di un campione di sangue.
10. Misure di
frequenza delle malattie
20.2 Morbosit e mortalit
OBIETTIVO:
Morbosit
bene precisare che per animale ammalato si intende un animale che manifesta sintomi clinici
di malattia, e che quindi la morbosit una misurazione di un fenomeno clinico. Quando si intende
indicare, invece, la frequenza di un fenomeno non propriamente definibile come malattia o non
rilevabile clinicamente (es. infezione), si deve impiegare il
termine prevalenza.
I 152 animali apparentemente sani vengono sottoposti ad un test diagnostico (es. "la prova della
tubercolina"). Risultano positivi 15 animali; puoi calcolare la prevalenza della infezione
subclinica: 15/152 = 0.10 = 10%.
Mortalit
La mortalit il rapporto tra il numero di animali morti in una popolazione, durante un periodo di
tempo, ed il numero di animali che compongono la popolazione stessa. Per ora possiamo dire,
semplificando, che la mortalit si calcola come illustrato nello schema che segue. Per vedrai, nella
prossima Unit, che le cose non sono sempre cos facili, e che il calcolo pu essere un po' diverso.
Ti prego di considerare che la malattia ha una certa durata, mentre la morte un evento che, in
pratica, avviene in un istante. Pertanto, ha senso misurare la morbosit in un determinato istante,
mentre lo stesso non si pu dire per la mortalit che deve essere sempre calcolata in rapporto al
tempo. Ecco perch la mortalit si misura attraverso un tasso (tasso di mortalit) e non
attraverso una proporzione.
Bisogna aggiungere un chiarimento riguardo agli animali a rischio del denominatore nel grafico
soprastante. Come gi sai, per animali a rischio intendiamo quelli biologicamente capaci di
esprimere l'evento. Per tutti gli animali sono capaci di esprimere l'evento-morte! Quindi in effetti
al denominatore puoi porre tutti gli animali della popolazione. In questo modo, calcolerai il
cosiddetto tasso grezzo di mortalit. Nella prossima Unit vedrai che si possono calcolare
anche altri tipi di mortalit, usando denominatori pi selettivi.
Mortalit cumulativa
Si dice mortalit cumulativa la somma delle mortalit rilevate in una popolazione attraverso
una serie di osservazioni nel tempo, generalmente su lunghi periodi. Essa pu essere rappresentata
per mezzo di una curva, come nel grafico di esempio, ove viene mostrato un esempio di andamento
della mortalit cumulativa in un gruppo di broiler. Il grafico contiene anche la curva della
mortalit cumulativa attesa, cio la mortalit standard prevista per quel tipo di allevamento.
Foglio di calcolo per Microsoft Excel che visualizza l'andamento della mortalit cumulativa in una
227
10. Misure di
frequenza delle malattie
10.3 Tassi di mortalit
OBIETTIVI:
Definire alcuni tassi di mortalit (tasso grezzo, tasso specifico e tasso proporzionale)
Nella Unit precedente stato accennato ad una semplice misura della mortalit in una
popolazione. In sintesi, stato detto che il tasso grezzo di mortalit si ottiene calcolando la
proporzione di morti in una popolazione rispetto al totale di animali a rischio, in un periodo di
tempo. A questo proposito, era stato presentato un semplice esempio di calcolo del tasso mortalit
in un acquario tropicale, contenente 90 pesci, in cui nell'arco di 24 ore ne erano morti 12: tasso di
mortalit: 12/90 = 0.133 in 24 ore. Per, con questo approccio, pu sorgere un problema: quello di
calcolare il denominatore. Infatti, le cose sono facili ed il numero di animali a rischio pu essere
determinato agevolmente se la popolazione chiusa (ossia non si verificano entrate o uscite di
animali, come nell'esempio dell'acquario), ma si complicano se la popolazione aperta.
In questa unit vediamo come si calcola il tasso grezzo di mortalit in popolazioni aperte, ed anche
anche qualche altra misura pi selettiva del tasso grezzo.
Nel caso di popolazioni aperte, il tasso di mortalit si misura pi ponendo al denominatore la media
della popolazione a rischio:
228
Ovviamente nel campo della medicina veterinaria, a motivo della durata variabile della vita delle
specie animali, dell'ampia diversificazione delle specie allevate e dei tipi di allevamento, non
avrebbe alcun senso utilizzare la popolazione a met anno. invece necessario calcolare la media
della popolazione a rischio in periodi variabili (che potr essere di 1 settimana o 1 mese ecc. a
seconda della situazione da descrivere), calcolando la media del numero di animali presenti in un
determinato lasso di tempo.
A questo punto ti chiederai sicuramente come si fa a calcolare la media della popolazione a rischio.
Il calcolo viene impostato come nell'esempio seguente.
ESEMPIO. Supponi di voler calcolare il tasso di mortalit verificatosi nell'arco di una settimana in
un gruppo di suini aperto e composto inizialmente da 100 animali. Nel gruppo si sono osservati i
seguenti eventi:
Nela seconda colonna riportato il numero di animali presenti (a rischio) in ciascun giorno,
tenendo conto dei movimenti (morti ed uscite); nel periodo considerato il totale cumulativo ha
raggiunto 537 presenze. Quindi, possiano calcolare che, in media, ogni giorno della nel gruppo
erano presenti 537 / 7 = 76.7. Questa la popolazione media nel periodo considerato. Ora puoi
facilmente calcolare il tasso di mortalit nella settimana, come segue: 11 / 76.7 = 0.143 = 14.3%
Come si visto finora, i tassi grezzi si applicano all'intera popolazione, senza specificare alcuna
caratteristica (es. et, razza ecc.) degli individui che la compongono. I tassi grezzi sono validi
soprattutto nei gruppi di allevamenti intensivi, composti quasi sempre da animali con caratteristiche
uniformi.
229
Ricordati che, nel caso di popolazioni aperte, al denominatore dovrai utilizzare la media della
popolazione a rischio provvista dell'attributo, cos come gi visto in precedenza
per il tasso grezzo.
Un altro tipo di tasso di mortalit usato di frequente prevede la misurazione selettiva in base alla
causa della morte, e viene detto tasso di mortalit causa-specifico. Esso rappresenta l'indice della
mortalit dovuta ad una certa causa. Pu essere calcolato sull'intera popolazione, oppure per
sottogruppi scelti in base ad un carattere importante riguardo alla malattia considerata (es. et,
razza, provenienza ecc.), ottenendo tassi di mortalit causa- e attributo-specifici.
Anche in questo caso, se la popolazione aperta, al denominatore dovrai utilizzare la media della
popolazione a rischio.
230
ESEMPIO. Nell'esempio precedente erano morti per cause ignote 6 vitelli su 28 in una settimana.
Ora accerti che 4 di essi sono morti per colibacillosi. Il tasso di mortalit nei vitelli per
colibacillosi nella settimana considerata 4/28 = 0.143 = 14.3%. Nota che, se riferito all'intero
allevamento di bovine da latte, questo un tasso causa- e attributo-specifico.
Viene detto anche rapporto proporzionale di mortalit (RPM). Esprime la proporzione della
mortalit da ascrivere ad una determinata causa per il periodo considerato. Si calcola dividendo il
numero di morti per una causa X per il numero di morti per tutte le cause. Viene usato per valutare
il contributo di una causa alla mortalit complessiva.
da notare che questo tipo di espressione non fornisce alcuna indicazione sul tasso
effettivamente rilevato (v. i due esempi che seguono), ma pu essere utile per stilare una sorta di
classifica delle cause di morte in una popolazione.
Nota che al denominatore non si pongono i soggetti della popolazione a rischio, ma il numero totale
di soggetti morti per qualsiasi causa nel periodo considerato.
10. Misure di
frequenza delle malattie
10.4 Sopravvivenza e letalit
OBIETTIVO:
Tasso di sopravvivenza
Bisogna premettere che questo argomento molto complesso, soprattutto sul piano metodologico,
ed assume una importanza soprattutto in medicina umana. In questa sede si accenner soltanto ai
principi di base.
Il tasso di sopravvivenza la proporzione di individui con una certa malattia che sopravvivono per
un dato tempo.
Il calcolo del tasso di sopravvivenza si basa sulle informazioni raccolte su casi di malattia, spesso in
numero di centinaia o migliaia, sempre molto complicato e necessita di elaborazioni statistiche ad
hoc (es. analisi di Kaplan-Meier).
Tralasciando le problematiche operative che si presentano in questo tipo di analisi, nello schema
sottostante viene indicata una semplice base razionale per il calcolo, in cui la sopravvivenza
espressa come probabilit per un animale di restare in vita per un determinato periodo di tempo.
In pratica, gli studi di sopravvivenza relativi ad una singola malattia si eseguono arruolando nel
gruppo in esame (coorte) gli individui mano a mano che essi contraggono quella malattia. Ecco
perch, nello schema soprastante, per animali ammalati si devono intendere i nuovi casi di
malattia; poi, fra questi, vengono contati, nel tempo, i morti.
Dai dati ottenuti attraverso studi sulla sopravvivenza, possono essere ottenute le curve di
sopravvivenza, utili per rispondere alla domanda che probabilit ha un individuo con una certa
malattia di sopravvivere per un dato tempo?
232
I tempi di sopravvivenza, dipendono, oltre che dal tipo di malattia, anche dal cosiddetto tempo
zero, cio dallo stadio di evoluzione della malattia utilizzato per rilevare il "nuovo caso". Il tempo
zero pu essere fissato arbitrariamente in corrispondenza di qualsiasi evento nell'evoluzione della
malattia (comparsa di anticorpi; comparsa di marcatori tumorali; comparsa di sintomi; inizio del
trattamento ecc.). Per questo motivo, i tassi di sopravvivenza riportati dalla letteratura possono
variare ampiamente anche quando si riferiscono ad una stessa malattia.
Negli animali domestici spesso la sopravvivenza dipende, oltre che dai caratteri intrinseci della
malattia, anche da altri fattori artificiosi o soggettivi (ad esempio: eutanasia negli animali da
compagnia o fattori economici negli animali da reddito). Talvolta, soprattutto negli allevamenti
intensivi, la misura della sopravvivenza non assume alcun interesse pratico: ad esempio, nel caso di
una malattia a lento decorso in broiler, in cui i soggetti ammalati vengono eliminati
dall'allevatore in quanto il loro allevamento risulta antieconomico.
Tasso di letalit
Il tasso di letalit la proporzione di animali morti per una certa malattia in un periodo sul totale di
casi della malattia osservati nello stesso periodo di tempo.
233
Il tasso di letalit viene impiegata per indicare la probabilit, per un ammalato, di venire a morte per
quella malattia in un dato periodo di tempo. Esso rappresenta una misura della capacit che ha una
malattia di portare a morte l'animale colpito. Nel settore veterinario questo parametro utile
soprattutto nel caso di malattie acute, e particolarmente delle malattie infettive.
Nota che il tasso di letalit il complemento ad 1 del tasso di sopravvivenza, cio [letalit = 1 -
sopravvivenza]. Ci intuitivo, se pensi che, in ogni istante, la somma della letalit e della
sopravvivenza deve essere uguale ad 1 (100%).
Infine, nella figura che segue viene schematizzato il calcolo del tasso di sopravvivenza e di letalit
per una malattia.
234
10. Misure di
frequenza delle malattie
10.5 Prevalenza e incidenza: definizioni
OBIETTIVI:
A questo scopo si usano quindi due misure fondamentali: la prevalenza e l'incidenza. Queste due
misure sono molto diverse fra loro: con una metafora, possiamo dire che la prevalenza la
fotografia di un fenomeno, mentre l'incidenza ne il film..
Prevalenza
Abbiamo gi detto che, spesso, l'evento studiato rappresentato dallo stato di malattia (evento
malattia). Allora, la prevalenza di animali ammalati si calcola come M + / (M + + M - ) dove M +
rappresenta il numero di ammalati e M - il numero di animali "a rischio".
Ricordati che gli "animali a rischio" NON sono quelli sottoposti ad uno o pi determinanti di
malattia (fattori di rischio), bens - pi semplicemente - quelli non ancora ammalati ma
"suscettibili" di ammalarsi, ossia che possono contrarre la malattia in studio. Animali a rischio =
animali a rischio di ammalarsi.
In pratica, misurare la prevalenza di animali ammalati corrisponde a misurare la morbosit. In altre
parole, la morbosit un caso particolare di prevalenza, in cui l'evento studiato rappresentato dalla
presenza di malattia clinica (questo argomento gi stato trattato in una precedente Unit).
Riassumendo:
236
La prevalenza ora descritta una delle pi importanti misure di frequenza ed detta anche
prevalenza "puntuale" misura la frequenza di malattia in un dato momento. Esiste anche una
prevalenza cosiddetta "di periodo", che si calcola con il seguente rapporto: (animali che sono
risultati ammalati in un determinato periodo di tempo) / (popolazione a rischio nel periodo). In altre
parole, la prevalenza di periodo si ottiene addizionando la prevalenza all'inizio dell'osservazione
con l'incidenza durante l'intervallo di osservazione. Attenzione a non confondere la prevalenza di
periodo con l'incidenza!
In termini generali, l'incidenza misura la proporzione di "nuovi eventi" che si verificano in una
popolazione in un dato lasso di tempo. Anche in questo caso, per "evento" si pu intendere la
237
comparsa di un qualsiasi carattere. Tuttavia, quasi sempre l'incidenza si utilizza per misurare la
comparsa di nuovi casi di malattia.
Per questo motivo, possiamo dire che l'incidenza rappresenta la proporzione di individui che
vengono colpiti dalla malattia in un determinato periodo di tempo.
L'incidenza, bene sottolinearlo, misura il numero di nuovi casi nel periodo di tempo ed individua
il rischio (cio la probabilit) che ha un animale di contrarre la malattia in quel periodo di tempo.
L'incidenza pu essere vista come un modo per misurare la velocit di transizione dallo stato di
salute (assenza di malattia) allo stato di malattia in una popolazione.
L'incidenza rappresenta la variazione di una quantit (i nuovi ammalati) rispetto alla variazione di
un'altra quantit (il tempo); essa quindi una misura dinamica e costituisce un vero tasso.
ESEMPIO. Dopo 9 mesi ritorni nello stesso allevamento dell'esempio precedente, allo scopo di
calcolare l'incidenza della malattia. Pertanto, sottoponi nuovamente al test della tubercolina soltanto
i 105 animali che erano risultati negativi. Alla lettura dopo 72 ore, ne risultano positivi 17, mentre i
restanti 88 sono negativi. Quindi, l'incidenza in 9 mesi 17/(17+88) = 0.162 = 16.2%.
Nel calcolo dell'incidenza, la durata del lasso di tempo in cui effettuare l'osservazione
discrezionale. Essa viene fissata soprattutto in base ai caratteri della malattia: per le malattie a
rapida diffusione o evoluzione si considera generalmente un periodo di una durata inferiore rispetto
alle malattie che diffondono lentamente o che sono di lunga durata.
Riassumendo:
L'incidenza importante nello studio delle cause di malattia e del loro effetto a livello di
popolazione: infatti, una variazione dell'incidenza testimonia una modificazione dell'equilibrio dei
determinanti di malattia, o una modificazione dello stato di recettivit della popolazione ecc. In
aggiunta alla prevalenza, la valutazione dell'incidenza risulta utile nella valutazione dell'efficacia di
un programma di prevenzione.
Predire il futuro
Come gi detto, l'incidenza una misura del tasso di diffusione di una
malattia all'interno di un gruppo con caratteristiche note ed
inizialmente esente da quella malattia; perci l'incidenza viene usata
238
anche per prevedere (cio misurare la probabilit) la comparsa di quella malattia in individui con
caratteristiche simili a quelli studiati.
Cliccando sull'immagine sottostante, puoi avviare uno schema animato che illustra un esempio di
calcolo della incidenza.
Ricordati:
Resta da sottolineare che il metodo di misurazione dell'incidenza fin qui descritto riguarda il calcolo
dell'incidenza tout court, detta anche incidenza cumulativa: si tratta della proporzione di animali
di una popolazione chiusa (cio in cui non si verificano nascite, introduzioni di animali o perdite di
soggetti per qualsiasi motivo) che presenta la malattia in un determinato periodo di tempo. Essa,
come gi detto, equivale alla probabilit per ciascun individuo di aver contratto la malattia nel
periodo considerato.
ESEMPIO.
Supponi di aver osservato un gruppo di 100
suini per un periodo di 10 giorni. In questo
periodo, si sono verificati casi di malattia come
illustrato nella tabella e nel grafico a lato.
Supponi che i 100 suini rappresentino
popolazione "chiusa" (ossia: nel periodo
considerato non sono avvenuti ingressi o uscite
di animali) e che la malattia non abbia provocato
la morte di nessun animale. All'esaurirsi della
malattia (giorno 7) l'incidenza cumulativa stata
pari a 0.20 circa (20%). Infatti,
complessivamente si sono osservati 20 nuovi
casi su 100 animali presenti.
Densit di incidenza
Talvolta, nella misurazione dell'incidenza, il calcolo del denominatore (ossia degli animali a rischio
nel periodo) impossibile. questo il caso delle popolazioni aperte, ossia quando si verificano
239
La densit di incidenza si calcola ponendo al numeratore i nuovi casi di malattia, cos come gi
fatto per il calcolo della densit di incidenza. Al denominatore si pone, invece, la somma di tutte le
unit di tempo di osservazione di tutti gli animali prima che l'evento-malattia si sia verificato; per
questo motivo, il denominatore viene misurato in tempo/animali (es. bovino-anno, suino-mese ecc.).
La densit di incidenza utilizzata raramente in medicina veterinaria, e perci non verr trattata
esaurientemente in questa sede.
240
Limitiamoci a completare
l'esempio precedente, in cui
otterremo una insolita unit di
misura della densit di incidenza:
il... canarino-giorno!
Calcoliamo la densit di incidenza
sui dati dell'esempio. A scopo
didattico, supponiamo
convenzionalmente che
l'osservazione quotidiana inizi alle
ore 0:00 e termini alle 24:00, e
che che ogni evento (morte, nuovo
caso ecc.) sia avvenuto a
mezzogiorno.
Ovviamente ci serve un numeratore ed un denominatore. Il calcolo del numeratore molto
facile: indiscutibile che si sono verificati 8 nuovi casi di malattia. Pi difficile trovare il
denominatore: ti consiglio di osservare la Tabella 2. Essa identica alla precedente Tabella 1, con la
sola differenza che stata aggiunta la colonna a bordo rosso in cui viene riportato il numero di
animali a rischio rimasti nella voliera in ciascuno dei giorni considerati. Ad esempio, il valore 16.5
del marted deriva dal fatto che in questo giorno 7 animali (i 2 ammalati ed i 5 rimossi) su 20 sono
rimasti a rischio solo per 1/2 giornata ciascuno, e quindi in totale contano 3.5 giorni.
Se ancora hai dubbi in proposito, ti consiglio di guardare uno schema auto-esplicativo degli eventi
che si sono succeduti nella voliera: clicca sull'icona a lato!.
Le insidie nascoste...
Nello schema, sull'asse orizzontale viene rappresentato il tempo. Ogni riga orizzontale blu,
numerata da 1 a 8, rappresenta un animale: quando la riga sottile, l'animale in salute, mentre le
barre rosa indicano la presenza della malattia.
Quindi, nello schema rappresentato lo stato sanitario di 8 animali che compongono una
241
popolazione chiusa (nel periodo di osservazione non ci sono state uscite di animali n nuovi arrivi).
Ecco qualche calcolo esplicativo:
prevalenza puntuale al tempo T0 = 2/8 = 0.25 (si tratta degli animali n. 5 e n.7);
prevalenza puntuale al tempo T1 = 3/8 = 0.375 (animali n. 3, 6 e 7);
incidenza cumulativa nel tempo T0-T1 = 4/6 = 0.67 (animali n. 1, 3, 4, 6) - notare che gli animali 5 e
7 sono stati esclusi dalla popolazione in esame, che non conta pi 8 animali bens 6. Infatti gli
animali 5 e 7 erano gi ammalati all'inizio del periodo di osservazione, e quindi non devono entrare
nel conteggio dei nuovi casi;
possibile che la popolazione non sia stata monitorata continuamente durante il periodo T0-T1, ma
che sia stata semplicemente confrontata la situazione sanitaria esistente al tempo T0 con quella
esistente al tempo T1. In tal caso, l'incidenza cumulativa T0-T1 corrisponde a 2/6 =0.33 (animali n. 3
e 6, che erano sani in T0 e malati in T1). Gli animali n. 1 e 4 si sono ammalati e sono guariti durante
il periodo e quindi sono sfuggiti all'osservazione! Ovviamente questo tipo di calcolo meno preciso
di quello visto al punto precedente.
Infine...
nella seguente tabella vengono riassunte le caratteristiche salienti dell'incidenza e della prevalenza.
... mentre, nella prossima tabella, incidenza e prevalenza vengono messe a raffronto fra loro.
242
243
10. Misure di
frequenza delle malattie
10.6 Prevalenza, incidenza e utilizzo degli intervalli di confidenza
OBIETTIVI:
Come gi illustrato nella precedente unit didattica, le misure pi frequentemente utilizzate per
stimare la frequenza di una malattia in una popolazione sono l'incidenza e la prevalenza.
Molto spesso, queste misure non vengono effettuate sull'intera popolazione di interesse, ma su un
campione di numerosit pi o meno elevata. Ci significa che, una volta concluso lo studio, i dati
ottenuti non sono utili soltanto a conoscere la frequenza di malattia nel campione (cosa che in
genere interessa poco), bens, con un processo di inferenza, a stimare la frequenza di quella
malattia nell'intera popolazione.
L'intervallo di confidenza fornisce informazioni riguardo alla precisione dei valori ottenuti
attraverso lo studio di un campione.
Ad esempio, un intervallo di confidenza 95% comprende un intervallo di valori che tiene conto
della variabilit del campione, in modo tale che si pu confidare - con un margine di certezza
ragionevole (appunto il 95%) - che quell'intervallo contenga il valore vero dell'intera popolazione
che non hai avuto modo di esaminare. Ovviamente, ci vero solo se nello studio non sono presenti
errori sistematici.
Per i pi curiosi, dir che, per calcolare l'intervallo di confidenza, necessario un modello di
probabilit che tenga conto dei diversi possibili risultati di uno studio. Di tali modelli ne esistono, in
statistica, molti tipi (ad es. basati sulla distribuzione binomiale o su quella di Poisson oppure su
quella gaussiana). In genere, quando il numero di osservazioni abbastanza ampio, si utilizza
proprio quest'ultimo modello di distribuzione gaussiana (detta anche "normale"). Comunque, non
lasciarti intimorire da questi argomenti statistici un po' tecnici: per fortuna il calcolo dell'intervallo
di confidenza , come vedrai, molto semplice.
Data una certa prevalenza P, l'intervallo di confidenza 95% si ottiene con il calcolo della formula
qui sotto, dove il segno +/- permette il calcolo di due valori: il limite superiore dell'intervallo (che si
ottiene utilizzando il +) ed il limite inferiore (che si ottiene utilizzando il -):
244
Analogamente, dato un certo valore di incidenza I, l'intervallo di confidenza 95% si ottiene nel
modo seguente:
A questo punto. avrai di certo capito che la formula per il calcolo dell'intervallo di confidenza una
sorta di utilissimo coltellino svizzero che funziona in tutti i casi in cui hai calcolato una qualsiasi
proporzione (o una percentuale):
245
ESEMPIO. Supponiamo che in uno studio sulla displasia dell'anca di cani di razza "pastore
tedesco" siano risultati affetti dalla malattia 18 cani su un campione di 180 cani esaminati. La
prevalenza nel campione : 18/180 = 0.1, cio 10%.
Calcoliamo l'intervallo di confidenza 95%:
Pertanto, il limite inferiore dell'intervallo di confidenza 95% 0.056 (5.6%) ed il limite superiore
0.145 (14.5%). Ci significa che, in media, il 95% di tali intervalli derivanti da studi privi di errori
sistematici contiene il parametro vero della popolazione. In altre parole, possiamo essere abbastanza
sicuri che la percentuale di cani con displasia dell'anca nella intera popolazione da cui stato tratto
il campione di 180 cani sia compresa fra 5.6 e 14.5%.
Infine, resta da ricordare che se vuoi ottenere un intervallo di confidenza 99% (invece che 95%),
non devi far altro che sostituire il coefficiente 1.97 con 2.57.
ESEMPIO. Nello stesso studio sulla displasia dell'anca di cui sopra, calcolerai l'intervallo di
confidenza 99% come segue:
10. Misure di
frequenza delle malattie
10.7 Tasso di attacco
OBIETTIVO:
Il tasso di attacco (attack rate) pu essere considerato un caso particolare di incidenza, che trova
applicazione quando l'esposizione al determinante (o ai determinanti) di malattia avvenuta per
breve durata, e di solito su popolazioni chiuse, o ben definite ed a numerosit limitata.
Si tratta quasi sempre di focolai di malattia a sorgente comune, ossia nei quali tutti i casi di
malattia hanno avuto origine da un'unica esposizione (es. avvelenamenti, esposizione a radiazioni,
somministrazione di una razione contaminata da salmonelle ecc.).
In medicina umana, l'utilizzo tipico del tasso di attacco si ha nei casi di tossinfezione alimentare.
Poich - come gi detto - l'esposizione di breve durata, il tasso di attacco rappresenta una sorta di
incidenza cumulativa: infatti, una volta esauritosi il focolaio, non vengono pi osservati nuovi
casi derivanti da quella esposizione, anche se il periodo di osservazione viene prolungato
indefinitamente.
Anche per le malattie neonatali (ossia quelle che si verificano entro pochi giorni dalla nascita)
potrebbe essere pi indicato parlare di tasso di attacco piuttosto che di incidenza.
Il tasso di attacco si calcola come D/(D+N), dove D indica il numero di casi di malattia che si
verificano in un determinato lasso di tempo, mentre N indica gli animali a rischio rimasti sani nel
periodo:
durata di 16 ore, una diminuzione di 12 gradi (16 C rispetto ai 28 C previsti). Prima del guasto i
pesci erano in buona salute. Nelle 48 ore dopo il guasto, lo shock termico ha provocato la morte di
12 esemplari. Il tasso di attacco risulta quindi:
12/(12+31) = 0.28 = 28% in 48 ore.
Si tratta di un tasso di attacco, e non di una incidenza, in quanto la causa ha agito su tutti i soggetti
per un tempo definito e limitato. Anche se si prolungasse il periodo di osservazione anche ben oltre
le 48 ore dell'esempio, non si osserverebbe pi alcun nuovo caso.
Nell'uomo i casi secondari sono spesso rappresentati dai familiari, oppure dai compagni di scuola, o
dai colleghi di lavoro. In medicina veterinaria, i casi secondari sono quasi sempre gli animali
appartenenti allo stesso gruppo o allo stesso allevamento.
I casi che si verificano in tempi successivi al periodo di incubazione del caso primario derivano
verosimilmente dal contatto con i casi secondari, e sono quindi detti casi terziari.
evidente che anche il tasso di attacco secondario un tipo particolare di incidenza. Esso
rappresenta una buona misura della contagiosit della malattia nelle circostanze in questione, ossia
della sua capacit di trasmettersi da un ospite all'altro.
Nello schema che segue viene illustrato un esempio di andamento di un focolaio di una malattia
trasmissibile originato da un singolo caso-indice, che ha dato origine a casi secondari ed a casi
terziari.
248
249
10. Misure di
frequenza delle malattie
10.8 Relazioni tra incidenza e prevalenza
OBIETTIVO:
gi stato accennato a come l'incidenza dipenda soltanto dal tasso di comparsa della malattia.
Al contrario, la prevalenza dipende soprattutto da due variabili: l'incidenza e la durata della
malattia. Nella figura viene rappresentato un modello che riproduce,attraverso una metafora visiva,
alcuni dei fattori che agiscono sul livello della prevalenza.
Nel modello, il livello della prevalenza direttamente correlato all'apertura della valvola
dell'incidenza, cio al numero di nuovi casi di malattia. D'altra parte, la prevalenza influenzata
negativamente da due dispositivi che tendono a ridurne il livello: la valvola della letalit, che sottrae
individui ammalati al totale della popolazione, e la pompa della guarigione, che li restituisce alla
popolazione sana di partenza.
250
Lo scopo del modello quello di sottolineare come una variazione di prevalenza di una malattia
possa derivare da una variazione dell'incidenza e/o del decorso della malattia. Attenzione: il
modello non tiene conto di un eventuale stato di immunit che, come nel caso di molte malattie
infettive, si pu instaurare negli animali guariti.
Mettiamo alla prova il modello simulando alcune situazioni. Per esempio, i miglioramenti nella
terapia di alcune malattie inguaribili (es. AIDS dell'uomo) corrispondono ad una riduzione del
flusso attraverso la valvola della letalit e quindi hanno l'effetto (apparentemente irragionevole) di
indurre un aumento della prevalenza.
D'altra parte, per altre malattie (guaribili) la prevalenza pu ridursi per effetto dell'accorciamento
del decorso per una pi rapida guarigione in seguito alla somministrazione di un farmaco molto
attivo; questo effetto, nel modello, corrisponde ad un aumento della portata della pompa della
guarigione. Oppure, all'opposto, la prevalenza pu diminuire perch la malattia porta a morte i
colpiti pi rapidamente (apertura della valvola della letalit).
ESEMPIO 1. Sei interessato allo studio della infestazione da ascaridi negli allevamenti di polli
rurali. L'infestazione si instaura nella la maggior parte degli animali in giovane et e, in assenza di
trattamento dura virtualmente tutta la vita dell'animale. Per questo, nel tuo studio hai ottenuto una
prevalenza molto elevata (48%), mentre l'incidenza di periodo (es. 1 mese) risultata bassa.
ESEMPIO 2. Vuoi valutare incidenza e prevalenza della bursite infettiva in un allevamento
industriale di polli nel quale non si vaccina nei confronti di questa malattia. La malattia, altamente
contagiosa, colpisce i polli di 3-8 settimane di et, con un quadro clinico molto evidente e decorso
molto breve (4-5 giorni). La malattia comparsa nel gruppo quando gli animali avevano 5 settimane
di et, e si esaurita a 6.5 settimane. Allora, l'incidenza nel periodo considerato (3-8 settimane) sar
molto elevata, mentre la prevalenza, in un determinato istante (es. al 50 giorno) potr essere pari a
zero.
Nella tabella che segue sono riassunti i fattori principali che influenzano il livello della prevalenza
di una malattia in una popolazione.
251
I fattori pi importanti sono senz'altro l'incidenza e la durata della malattia. Se l'incidenza rimane
pi o meno costante nel tempo, allora la prevalenza funzione dell'incidenza e della durata della
malattia:
252
10. Misure di
frequenza delle malattie
10.9 Malattia epidemica, endemica, sporadica
OBIETTIVO:
Epidemia
Nel discorso comune, si parla di epidemia quando si osserva l'improvvisa insorgenza di una malattia
(o l'espansione di una malattia gi esistente), con tendenza ad interessare un gran numero di
individui. Questa definizione non sbagliata, ma non coglie il significato pi importante insito nel
termine: quello di un evento inaspettato. Ecco quindi che appare molto pi appropriata la
definizione che segue.
Una epidemia (o malattia epidemica o epizoozia) una malattia che colpisce un numero di
individui (casi) significativamente superiore a quanto ci si sarebbe atteso in quella zona ed in quel
periodo di tempo.
Quando una epidemia geograficamente molto estesa interessando intere Nazioni o continenti, si
parla di pandemia.
253
Ovviamente, perch si possa parlare di epidemia si deve verificare un certo incremento, ossia
necessario che compaia un certo numero di casi. Ti chiederai quanti casi sono necessari. A questa
domanda non c' una risposta univoca: il numero di casi dipende da numerose variabili, fra cui le
pi importanti sono: il tipo di agente, il tipo di popolazione, il periodo di tempo (es. stagione)
considerato. per da sottolineare che, in base alla definizione ora esposta, non indispensabile un
numero rilevante di casi per dar luogo ad una epidemia.
ESEMPIO 1. In Emilia Romagna da anni non si osservano casi di rabbia n negli animali n
nell'uomo. Pertanto, la comparsa di un numero anche limitatissimo di casi (es. 3 o 4) definibile
epidemia. Tuttavia, secondo alcuni autori, un evento di questo tipo potrebbe essere definito anche
come focolaio, anche se meglio riservare questo termine ai casi di malattia fra loro correlati e
che si verificano in una area geografica molto limitata.
ESEMPIO 2. Nel 1995 si verificata in Colombia la prima epidemia, dopo 22 anni, di una grave
malattia virale trasmissibile dall'animale all'uomo: l'encefalite equina venezuelana. Vi furono 75000
casi di malattia nell'uomo, con 300 decessi; inoltre, si stima che, fra i 50000 equini della regione La
Guajira, si sia verificata una mortalit superiore al 7%. Uno dei determinanti dell'epidemia stato
attribuito alla stagione eccezionalmente piovosa, che ha provocato un aumento della densit della
zanzara-vettore Aedes taeniorhynchus
Nelle zone dove una malattia costantemente presente (malattia enzootica, vedi oltre), non
sempre facile stabilire quale numero di nuovi casi debba essere raggiunto al fine di dichiarare
l'esistenza di una epidemia.
Per le malattie dell'uomo stato proposto di calcolare la incidenza attesa in base ai dati esistenti e
riguardanti la situazione endemica nel passato; quindi, si calcola la soglia epidemica aggiungendo
all'incidenza attesa un valore pari ad (errore standard * 1.65). Se il numero di casi rilevato supera la
soglia epidemica cos calcolata, allora si in presenza di una epidemia.
Endemia
Malattia endemica (o endemia o enzoozia) una forma morbosa che costantemente presente
in una popolazione o in una determinata area geografica. Se la prevalenza della malattia bassa,
si tratta di malattia ipoendemica; se, invece, la prevalenza alta la malattia iperendemica.
254
ESEMPIO. Il colera dell'uomo in alcune regioni (es. India); l'encefalomielite equina venezuelana.
Malattia sporadica
Infine, si dice sporadica una malattia che si presenta irregolarmente ed imprevedibilmente nello
spazio e nel tempo, generalmente con bassa frequenza.
ESEMPIO 1. Una forma particolare di leucosi del bovino, la leucosi cutanea, colpisce pi spesso
bovini di 2-3 anni di et e si manifesta in forma sporadica.
ESEMPIO 2. L'aspergillosi dei volatili (malattia che colpisce numerose specie, localizzata
prevalentemente a polmoni sacchi aerei), i cui focolai si manifestano in forma sporadica.
Nel Grafico 1 vengono illustrati esempi di andamento nel tempo di una malattia epidemica,
endemica e sporadica.
molto facile individuare una epidemia quando una malattia infettiva e altamente contagiosa
penetra in una popolazione o in un territorio indenne, colpendo in breve tempo un numero molto
elevato di animali.
Non sempre per le cose sono cos evidenti, e talvolta pu non essere facile stabilire se un certo
incremento di casi di malattia costituisca o no una epidemia.
255
Nel Grafico 2 viene esemplificato l'andamento di una certa malattia in una popolazione per
un intero anno, dal 1 gennaio al 31 dicembre (clicca sull'icona a fianco per vedere la tabella
dei dati). Per semplicit supponiamo che la popolazione sia "chiusa", ossia il numero di
animali non abbia subito variazioni nel periodo considerato. Osserva il grafico sottostante in cui,
come al solito, in ascissa abbiamo posto il tempo ed in ordinata il numero di nuovi casi.
Il picco evidenziato rappresenta una epidemia? Fornire una risposta a problemi come questo pu
essere piuttosto complicato. Tuttavia, semplificando il problema, si pu trovare almeno una linea-
guida (derivante dalla definizione stessa di epidemia) che conduce ad una risposta ragionevole.
Si gi detto che una epidemia si ha in presenza di un numero imprevisto di casi, ossia superiore al
normale; quindi, la domanda : "il picco rappresenta una situazione anormale?" Per rispondere ti
puoi basare sulla definizione di normalit gi fornita nel capitolo riguardante la variabilit
biologica: supponi che le frequenze di nuovi casi rilevate nel tempo precedente il picco considerato
abbiano una distribuzione approssimativamente gaussiana; allora, in questo caso puoi adottare il
criterio secondo cui anormale un valore al di fuori dell'intervallo media 2 volte la deviazione
standard. Nel grafico sottostante, questo intervallo evidenziato dalla la fascia gialla. Come vedi,
il picco osservato in settembre si trova al di sopra della fascia gialla, e quindi fuori dai limiti della
normalit; ci rappresenta un indizio che depone a favore dell'ipotesi che si tratti di una epidemia.
256
Per l'approccio statistico che abbiamo utilizzato ha molte limitazioni, non applicabile in tutte le
condizioni ed ha soltanto uno scopo orientativo. Nella pratica non ci si pu basare soltanto sul
calcolo di una semplice media e deviazione standard dei dati storici, ma necessario ricorrere ad
analisi statistiche pi specifiche. Inoltre, bisogna anche tener conto di altri elementi, dipendenti sia
dalla storia naturale della malattia che dalle caratteristiche popolazione in studio (es. distribuzione
spaziale, eventuali relazione tra i diversi casi di malattia ecc.).
A titolo di esempio, nella figura che segue viene fornito l'output completo di un test statistico
specificamente dedicato a evidenziare le variazioni stagionali di una malattia, generato con il
software WINPEPI - PEPI-for-Windows (Abramson JH, 2007, www.brixtonhealth.com). L'analisi
stata condotta sugli stessi dati dell'esempio precedente. Ti consiglio esaminare attentamente il
grafico ed i dati nell'ovale rosso sottostante; puoi tranquillamente trascurare il restante output, che
viene riportato per completezza.
257
Nel grafico, il triangolo rosso denota l'esistenza di un picco epidemico nel mese di agosto. Inoltre, il
test statistico di Freedman fornisce un valore P<0.05. Ci significa che la probabilit che
l'incremento dei casi in agosto sia dovuto al caso inferiore al 5%. Pertanto il picco osservato in
agosto pu essere considerato una epidemia.
258
10. Misure di
frequenza delle malattie
10.10 Altri parametri di frequenza di malattia
OBIETTIVO:
Finora abbiamo descritto alcune misure di frequenza di malattia classiche (morbosit e mortalit,
incidenza e prevalenza ecc.). Vi sono altre misure di frequenza che possono essere calcolate;
alcune di esse si riferiscono al caso in cui si voglia studiare l'effetto di una esposizione, con lo scopo
al fine di verificarne l'importanza nella genesi di una malattia.
Il punto di partenza rappresentato, ancora una volta, dalla Tabella a due entrate, che gi ben
conosci, in cui gli animali vengono raggruppati in 4 categorie in basa all'esposizione ed alla
comparsa o meno della malattia:
Se non ti chiaro come stata generata la Tabella 2x2, puoi dare un'occhiata ad una
presentazione animata.
10. Misure di
frequenza delle malattie
10.11 Standardizzazione delle misure
OBIETTIVO:
constatare come il raffronto di alcune misure possa aver significato soltanto quando effettuato su
popolazioni standardizzate
Molti dei tassi o proporzioni finora descritti (es. morbosit, mortalit ecc.) possono essere utilizzati
per confrontare due (o pi) popolazioni soltanto se le popolazioni sono abbastanza simili riguardo
alle caratteristiche che potrebbero influenzare il parametro misurato.
Un esempio di standardizzazione
Il primo elemento da verificare la mortalit. In base ai dati raccolti dall'allevatore, di cui non
abbiamo motivo di dubitare, si registrato quanto segue:
262
Dall'esame della tabella si vede facilmente che in Loc-2 la mortalit stata quasi doppia rispetto a
Loc-1. Tuttavia sappiamo che questa osservazione, in s, non sufficiente a dichiarare che la
mortalit in Loc-1 significativamente superiore rispetto a Loc-2. Infatti, la differenza osservata
potrebbe essere dovuta al semplice caso. Come gi hai appreso (v. Capitolo 5), per escludere
questa ipotesi necessario applicare un test statistico. Si tratta di effettuare un confronto fra due
percentuali, quindi adatto il test del chi-quadrato. Puoi farlo tu stesso utilizzando questo foglo
di calcolo. Il test fornisce un valore P=0.0007: esistono soltanto 7 probabilit su 10000 che la
differenza nella mortalit osservata nei due locali di allevamento sia dovuta al caso. Puoi affermare
che la differenza osservata statisticamente significativa;
Sembra proprio che l'allevatore abbia ragione. Tuttavia, non sei ancora del tutto convinto. Decidi di
fare un sopralluogo in allevamento (l'epidemiologia non si fa solo a tavolino...), e ti rendi conto che,
in entrambi i locali, vengono allevate 3 diverse specie di pesci: Tanichthys, Rasbora e Barbus.
Chiedi all'allevatore se sono stati registrati i dati di mortalit separati per specie; la risposta
positiva. Quindi, compili una nuova tabella della mortalit per ciascun locale, usando con i dati
disaggregati per ciascuna delle tre specie, come segue:
263
Come vedi, i dati aggiuntivi dimostrano che la mortalit osservata in ciascun specie (caselle verdi)
all'incirca la stessa nei due gruppi e quindi non dipende dal locale di allevamento (e quindi
nemmeno dall'alimentazione).
La differenza fra i tassi grezzi di mortalit, che ha tratto in inganno l'allevatore (caselle rosa), era da
attribuire soltanto alla diversa distribuzione delle specie di pesci nelle vasche dei due locali e non ad
altri fattori.
Questi dati sono dovuti al fatto che il confronto viziato dalla differente composizione delle due
popolazioni rispetto all'et. Infatti, notoriamente (ed ovviamente) nelle popolazioni umane l'et
rappresenta il principale fattore che influenza la mortalit.
In Italia la popolazione mediamente pi vecchia che in Algeria (et mediana 43.5 vs 27.6), perch
la struttura della popolazione diversa: in Italia vi sono meno giovani e pi anziani, come
dimostrano i seguenti dati: da 0-14 anni: 13.8% vs 24.2%; da 15-64 anni 65.9% vs 70.6%; 65 anni
ed oltre 20.3% vs 5.2%) [Fonte dei dati: The World Factbook, www.cia.gov].
In questi casi, il raffronto dei tassi grezzi non ha alcun valore. necessario un raffronto
265
11. Test di
screening e diagnostici
11.1Utilizzo di un test per lo screening di popolazioni
OBIETTIVO:
Molti pensano che un test sia una specifica procedura di laboratorio (es. test della glicemia,
colesterolo ecc.) o una procedura che viene valutata attraverso uno strumento e che pertanto meno
dipendente dal giudizio soggettivo dell'esaminatore.
Questa opinione non certamente sbagliata, ma per i nostri scopi piuttosto limitativa: infatti in
questo capitolo tratteremo dei test in una accezione pi ampia, intendendo per test qualsiasi ben
definita procedura, oggettiva e possibilmente standardizzata, che viene utilizzata al fine di
raccogliere una ben definita informazione.
In questa ottica, possono essere tranquillamente considerati test anche la auscultazione cardiaca
o la percussione polmonare o l'esame della mucosa congiuntivale ecc.. Anche le domande di un
questionario possono essere viste come un test.
Negli animali, le azioni di screening vengono effettuate nei confronti di malattie di notevole gravit
(sul piano sanitario o economico) oppure di malattie trasmissibili all'uomo.
In medicina umana, lo screening viene indirizzato preferenzialmente a quelle condizioni morbose in
cui una diagnosi precoce ed il conseguente intervento terapeutico siano in grado di ridurre
l'incidenza o la mortalit.
ESEMPIO 1. In Italia, cos come in molti altri Stati, la profilassi nei confronti della tubercolosi
bovina basata sull'utilizzo di una prova di ipersensibilit cutanea (il test della tubercolina); la
prova si effettua su tutti i bovini di et superiore a 7 settimane.
ESEMPIO 2. La brucellosi dei bovini e degli ovi-caprini anch'essa soggetta a profilassi
obbligatoria in molti Stati; in Italia, previsto l'impiego di test sierologici (test al rosa bengala e
fissazione del complemento).
ESEMPIO 3. Nel settore avicolo, da tempo in atto un piano di controllo nei confronti della
pullorosi (malattia trasmissibile sostenuta da Salmonella pullorum e Salmonella gallinarum),
anch'esso da effettuarsi con l'impiego di un test sierologico: l'agglutinazione rapida su sangue in
toto. Vengono saggiati, in operazioni di screening, tutti gli animali da riproduzione.
Lo screening pu essere effettuato per individuare la presenza di malattia in singoli animali oppure
gruppi di animali (es. gregge, mandria di bovini ecc.). In quest'ultimo caso, l'individuazione anche
di un solo animale infetto sufficiente a dichiarare infetto l'intero gruppo (anche se non tutti gli
individui sono necessariamente infetti). Questo approccio particolarmente utile quando si utilizza
un test di screening che non particolarmente efficiente nell'individuare gli animali infetti (cio
provvisto di bassa sensibilit).
Lo screening ed il procedimento diagnostico possono essere attuate per mezzo dello stesso test,
tuttavia lo screening differisce dalla diagnosi. Questa affermazione viene giustificata con i 2 punti
che seguono (la comprensione completa del secondo punto richiede concetti che verranno spiegati
pi avanti):
1. nel procedimento diagnostico il test viene eseguito su animali ammalati, cio che mostrano
sintomi clinici che, in una qualche misura, fanno sospettare la presenza di quella malattia; lo
screening, invece, preve l'applicazione del test su tutti gli individui della popolazione,
indipendentemente dal loro stato di salute;
2. poich il valore predittivo di un test dipende dalla prevalenza della malattia, ne consegue che
la performance del test sar meno soddisfacente in caso di screening rispetto al caso in cui lo
267
stesso test venga utilizzato a scopo diagnostico. Infatti, evidente che la prevalenza della malattia
fra gli individui che mostrano segni clinici sar superiore rispetto alla prevalenza considerata nella
popolazione nel suo complesso.
11. Test di
screening e diagnostici
11.2 Lo screening alla prova dei fatti
OBIETTIVO:
simulare l'esecuzione di uno screening e ricordare che i test non sono infallibili
Prima di iniziare una azione di screening, tutti gli animali della popolazione di interesse ti sembrano
apparentemente sani. Simuliamo uno screening su una popolazione si composta da 32 cani,
rappresentati nello schema seguente:
Se tu fossi... dotato di ultravista come Superman, potresti vedere che in realt alcuni animali sono
ammalati. Fai scorrere il puntatore del mouse sullo schema!
Purtruppo tu non sei dotato di ultravista, e per individuare gli ammalati devi sottoporre tutti gli
animali ad un test. Per, un test non fornisce quasi mai risultati perfettamente rispondenti alla realt.
C' sempre un certo rischio - o meglio, una certa probabilit - che il test risulti positivo in un
animale che in realt sano. Esiste anche il rischio inverso, cio che il test risulti negativo in un
animale ammalato. Insomma: non si pu essere del tutto sicuri che un test... dica il vero. Vedrai
nelle prossime Unit la complessit di problemi che derivano da tale situazione.
Continuiamo la simulazione sulla popolazione di 32 cani, ipotizzando che 24 siano risultati test-
negativi e 8 test-positivi. Nella pratica, in effetti i dati che otterrai dallo screening sono proprio solo
e soltanto questi: 24 test-negativi e 8 test-positivi.
Quando eseguirai un test nella pratica, ti chiederai: fra i test-positivi, quanti sono davvero malati
(positivi veri)?. Ed anche: fra i test-negativi, quanti sono davvero sani (negativi veri?). Troverai
269
nelle Unit che seguono la risposta a queste domande. Per ora, sufficiente che tu ti renda conto
soltanto dell'esistenza del problema, che viene illustrato in questo schema:
Se tu fossi Superman (fai scorrere il puntatore sullo schema soprastante!), vedresti che:
a) 6 cani ammalati (colore fucsia) sono risultati test-positivi (positivi veri)
b) 2 cani sani sono risultati test-positivi (positivi falsi, cerchi verdi)
c) 1 cane ammalato risultato test-negativo (negativo falso, cerchio azzurro)
d) i restanti cani sani sono risultati test-negativi (negativi veri)
Riassumendo:
Gli innumerevoli test disponibili in medicina veterinaria possono essere suddivisi, in base
all'affidabilit dei risultati da essi forniti, in due categorie: test patognomonici e non
patognomonici.
270
Analogamente un test patognomonico un test che, quando fornisce esito positivo, indica con
certezza la presenza del carattere ricercato.
Quasi tutti i test impiegati in medicina sono non-patognomonici; in altre parole, essi - siano positivi
o negativi - non forniscono un risultato certo, ma soltanto probabile. Pertanto, alcuni dei risultati
positivi forniti da un test non patognomonico saranno positivi-falsi, cos come alcuni negativi
saranno negativi-falsi.
Al contrario, un test patognomonico non genera mai risultati positivi-falsi, ma pu fornire risultati
negativi-falsi.
Supponiamo ora di perseguire lo stesso scopo (individuazione delle bovine infette) utilizzando un
altro test: l'esame colturale del latte delle bovine allo scopo di dimostrare la presenza di Brucella. In
caso di positivit, la bovina non potr essere che infetta, non essendo il batterio ubiquitario n
commensale; in altre parole, una bovina che elimina Brucella con il latte sicuramente affetta da
brucellosi.
Se invece l'esame colturale del latte risulta negativo, non potremo essere sicuri dell'assenza di
infezione: infatti gli animali infetti eliminano le brucelle con il latte in maniera intermittente.
Pertanto, l'esame colturale del latte per la diagnosi di brucellosi un test patognomonico.
271
Da quanto finora esposto, si potrebbe trarre la conclusione che i test patognomonici sono migliori di
quelli non patognomonici. Questo non sempre vero. Infatti, nel giudicare un test migliore di un
altro, occorre tenere presente una serie di fattori e considerazioni, che verranno discussi - almeno in
parte - nelle prossime unit. Baster qui sottolineare come, nell'esempio precedente, il test
patognomonico abbia i seguenti svantaggi su quello non patognomonico: costo molto pi elevato;
frequenza molto pi elevata di falsi-negativi; necessit che l'animale sia in lattazione ecc.
272
11. Test di
screening e diagnostici
11.3 Valutazione della performance di un test
OBIETTIVO:
disegnare uno schema logico che permetta di valutare la bont (performance) di un test
diagnostico
Nell'unit precedente, abbiamo visto che non esistono test capaci di accertare il reale stato
(malato/sano) di un animale in tutte le situazioni e nel 100% dei casi. In altre parole: non esistono
test infallibili. L'esito del test (sia esso positivo, cio deponga a favore dell'esistenza della
malattia, o negativo) deve essere visto come una indicazione di probabilit.
Inoltre, facile comprendere come la probabilit di ottenere risultati veritieri (cio aderenti alla
realt) sia soprattutto legata al tipo di test, all'intimo meccanismo del suo funzionamento, ed a cosa
esso misura . Da ci deriva che la performance varia da test a test.
Immagina di voler valutare la performance di un test, che chiameremo test X. Per semplicit,
supponiamo che questo test fornisca un risultato dicotomico del tipo vero/falso (sano/malato). Il
procedimento per valutare la performance del test X prevede che tu abbia a disposizione animali -
sia ammalati che sani - dei quali noto con certezza - o con la massima attendibilit - il reale stato
malato/sano. Ci si pu ottenere con metodi diversi a secondo delle circostanze; spesso ci si serve
del miglior test disponibile, che viene detto golden test (test aureo). Si assume che i risultati del
golden test siano completamente veritieri; in altre parole, si assume che il golden test non sbagli
mai.
Il golden test deve essere biologicamente diverso dal test X, ossia deve basarsi su un meccanismo
differente.
Procedi quindi a saggiare gli animali sia con il test X che con il golden test, e ad inserire i dati
ottenuti nelle quattro celle (a, b, c, d) di una Tabella a doppia entrata:
273
Evidentemente, la performance del test dipende dai valori ottenuti nelle quattro celle, e soprattutto
alla proporzione di misclassificazioni (classificazioni errate), rappresentate dai falsi-positivi (cella
b) e falsi-negativi (cella c). Con un test infallibile, le misclassificazioni non esistono, quindi b=0 e
c=0. Per i test infallibili sono davvero molto rari. I test di comune impiego restituiscono sempre
una certa quota di risultati non veritieri e ci genera una serie di problemi che andremo a
considerare in questa Unit e nelle successive.
Tieni presente stiamo considerando una simulazione a scopo didattico. Nella pratica, la popolazione
in esame di norma si esamina con un solo test, che ti consente di suddividere gli animali in due
gruppi: i test-positivi (a+b) ed i test-negativi (c+d).
Attraverso i quattro valori (a, b, c, d) della Tabella, puoi procedere alla valutazione della
performance del test X (sensibilit, specificit valori predittivi ecc.), come vedrai nelle Unit che
seguono.
Abbiamo detto - e ripetuto - che un test diagnostico fornisce quasi sempre una certa quota di
risultati falsi-positivi e falsi-negativi. Di conseguenza, il calcolo della prevalenza di una malattia in
274
una popolazione in base al risultato di un test non fornisce il valore della prevalenza reale, bens la
cosiddetta prevalenza apparente.
Vedrai in una prossima Unit come, attraverso il Teorema di Bayes, sia possibile calcolare la
prevalenza reale conoscendo la prevalenza apparente e due caratteristiche del test utilizzato: la
sensibilit e la specificit.
275
11. Test di
screening e diagnostici
11.4 Sensibilit e specificit di un test
OBIETTIVI:
La sensibilit e la specificit sono due misure che vengono impiegate per valutare la capacit di
individuare, fra le unit di una popolazione, quelle provvisti del carattere ricercato e quelli che
invece ne sono privi. Quasi sempre, quando si esegue un test su un animale, il carattere ricercato
rappresentato dalla presenza di una malattia; quindi, negli esempi, far riferimento a questo tipo di
utilizzo del test.
Per farti meglio comprendere il concetto sensibilit e specificit di un test, ti consiglio di partire
dalla tabella a due entrate gi descritta nell'Unit precedente, e che, per tua comodit, viene qui
riprodotta di nuovo:
276
Memorizza la disposizione delle righe e colonne della tabella, sarai facilitato nell'apprendimento
delle prossime unit didattiche!
Ricordati:
colonne=realt (malato/sano);
righe=esito test:
(positivo/negativo);
a=malati test-positivi;
b=sani test-positivi;
c=malati test-negativi;
d=sani test-negativi.
Questa disposizione delle righe
e delle colonne nella Tabella non obbligatoria, ma quella adottata pi comunemente e
rappresenta quasi uno "standard".
Sensibilit
Abbiamo gi visto che non tutti gli animali malati, sottoposti ad un test, risultano positivi:
La sensibilit risponde alla domanda: quanti, degli animali malati sottoposti al test, sono risultati
positivi?.
Pertanto, la sensibilit di un test la sua capacit di identificare correttamente gli animali malati. In
termini di probabilit, la sensibilit la probabilit che un animale malato risulti positivo al test.
Possiamo anche dire che la sensibilit la proporzione di animali malati che risultano positivi al
test.
.
277
La seconda definizione la migliore allo scopo di intuire il calcolo della la sensibilit: nella tabella,
i malati sono rappresentati da (a+c) e, fra questi, i test-positivi sono rappresentati da (a);
quindi, la sensibilit si calcola con la proporzione a/(a+c):
Ad un esame superficiale, potresti pensare che una altissima sensibilit l'unica qualit desiderabile
in un test: infatti, il poter identificare correttamente, attraverso un test, tutti gli animali ammalati
tutto quello che ti serve.
Tuttavia, se esamini meglio la questione, ti rendi conto che le cose non stanno proprio cos: un'alta
sensibilit non sufficiente. Infatti, necessario anche un altro requisito: un buon test deve
identificare come positivi soltanto gli animali che hanno la malattia; cio, necessario che fra i test-
positivi non siano inclusi anche animali sani. Da questa osservazione discende il concetto di
specificit.
Specificit
La specificit risponde alla domanda: quanti, degli animali sani sottoposti al test, sono risultati
negativi?.
Pertanto, la specificit di un test la sua capacit di identificare correttamente gli animali sani. In
termini di probabilit, la specificit la probabilit che un animale sano risulti negativo al test.
Possiamo anche dire che la specificit la proporzione di animali sani che risultano negativi al test
Ancora una volta, quest'ultima definizione la migliore per di intuire il calcolo della la specificit:
nella tabella i sani sono rappresentati da (b+d) e, fra questi, i test-negativi sono rappresentati
da (d); quindi, la specificit si calcola con la proporzione d/(b+d):
279
Nota che anche la specificit, come la sensibilit, definita attraverso una proporzione e quindi
assume un valore compreso fra 0 e 1.
Nelle operazioni di screening su larga scala, che coinvolgono un elevato numero di individui, la
specificit del test di grande importanza. Ad esempio, nel 2002 in Italia sono stati effettuati
746.678 test per la BSE (encefalopatia spongiforme bovina); di essi, 34 sono risultati positivi.
Questi dati indicano che il test utilizzato era dotato di specificit straordinariamente elevata. Se si
fosse utilizzato un test con specificit pari a 0.99 (ossia 99%), l'1% dei bovini SANI saggiati
sarebbe risultato positivo: ossia ben 7467 animali!
L'intervallo di confidenza di una percentuale (o di una proporzione) stato trattato in una unit
precedente. Qui di seguito c' un esempio a scopo di... ripasso.
Per il calcolo dell'intervallo di confidenza 95% di un dato valore di sensibilit, si utilizza la formula
seguente:
Per calcolare l'intervallo di confidenza 99% basta sostituire il coefficiente 1.96 con 2.53.
ESEMPIO. Hai applicato un test in un campione di 95 animali. Quarantadue animali sono risultati
test-positivi e 53 test-negativi. I risultati riassunti nella sottostante Tabella.
280
Qui di seguito, il calcolo della sensibilit e della specificit e dei relativi intervalli di confidenza
95%.
L'ampiezza dell'intervallo di confidenza dipende dal numero n di animali che hai esaminato: pi
grande questo numero, pi ristretto l'intervallo di confidenza. Ci viene illustrato nel grafico
sottostante, che mostra la precisione di una stima di sensibilit di un test in rapporto al numero di
animali esaminati. Si tratta di un grafico di esempio, in cui vengono riportati gli intervalli fiduciali
assumendo che il test abbia Se=0.75. Gli intervalli fiduciali 95% (area azzurra), sono stati calcolati
applicando la suddetta formula, sostituendo p con 0.75.
Per concludere
Infine, per sottolineare nuovamente i risvolti pratici legati alle caratteristiche di sensibilit ed alla
specificit di un test, si pu ricordare che...
281
282
11. Test di
screening e diagnostici
11.5 Sensibilit e specificit: influenza del valore di soglia (cut-off)
OBIETTIVO:
apprendere i motivi per cui molto difficile che esista un test con sensibilit e specificit 100%
comprendere come si possa far variare la sensibilit e la specificit di un test, ma solo a prezzo di
compromessi
Finora abbiamo illustrato le caratteristiche di un ipotetico test che forniva risultati del tipo
positivo/negativo oppure sano/malato oppure si/no. Un test di questo tipo, con output binario (in
due sole categorie), viene detto nominale dicotomico; si tratta di un test qualitativo in quanto
misura l'esistenza (qualit) di un fenomeno e non la sua ampiezza (quantit).
Esistono anche test semi-quantitativi che generano risultati classificabili in pi di due categorie. Ad
esempio, attraverso un test si pu classificare come segue lo stato di un paziente dopo un
trattamento: molto peggiorato, peggiorato, stazionario, poco migliorato, migliorato, molto
migliorato. Le variabili di questo tipo, costituite da dati qualitativi suddivisi in pi categorie con una
direzione chiaramente implicita (es. migliorepeggiore o viceversa), vengono dette ordinali.
Ancora, i test possono essere di tipo quantitativo, fornendo risultati numerici misurabili su una scala
numerica (variabili continue), come ad esempio i valori di densit ottica (D.O.) di un test ELISA
misurati con lo spettrofotometro.
Il test ELISA (Enzyme-Linked ImmunoSorbent Assay) test quantitativo che impiega un enzima
coniugato ad un anticorpo per identificare e quantificare la presenza di anticorpi (o di antigeni) nel
siero di sangue o in altri materiali. In caso di positivit, l'enzima induce una variazione di colore
tanto pu intensa quanto pi elevata la presenza di anticorpi (o di antigeni) nel campione. La
variazione di colore viene rilevata attraverso uno strumento (spettrofotometro) e si esprime con un
valore numerico attraverso una unit di misura detta assorbanza (o densit ottica).
Per i test quantitativi (ed anche per quelli semi-quantitativi), sorge un problema di interpretazione:
occorre stabilire un valore critico o soglia o cut-off, che rappresenta il limite di separazione tra
positivit e negativit del test. Ci corrisponde generalmente alla separazione ammalato/sano.
283
La scelta del cut-off di estrema importanza: sarai forse sorpreso nell'apprendere che la sensibilit
e la specificit possono essere fatte variare a piacimento variando il cut-off. Ora, attraverso un
esempio-simulazione, giustifichiamo questa affermazione, e ne discutiamone le implicazioni.
Il mio consiglio: prima di proseguire con questa Unit, assicurati di aver ben saldi i concetti di
sensibilit e specificit spiegati nell'unit precedente!
Un esempio-simulazione
Nel grafico 1 sono riportate delle curve teoriche ottenute supponendo di saggiare con un test
ELISA quantitativo, sieri di sangue prelevato da un campione di animali sicuramente ammalati e da
un campione di animali sicuramente sani.
Sull'asse delle ordinate (verticale) riportata la frequenza di osservazioni, cio il numero di animali
che hanno evidenziato il titolo corrispondente in ascissa. Si nota che gli animali sani hanno fatto
registrare valori di D.O. mediamente pi bassi rispetto agli animali malati: la curva verde infatti
pi a sinistra rispetto alla rossa. Si nota anche che le due curve si sovrappongono parzialmente, ed
proprio questa area di sovrapposizione che verr presa in considerazione nella discussione che
segue.
sempre inferiori rispetto agli ammalati (v. grafico a sinistra). In questi casi, il test sarebbe perfetto
ed infallibile, e non ci sarebbero problemi di interpretazione.
Purtroppo nella pratica ci non si verifica, e non devi stupirti che in una certa quota di animali sani
possa evocare una risposta positiva ad un test, e viceversa: questo fenomeno pu essere dovuto ad
una variet di cause che non possibile trattare in questa sede.
Torniamo al Grafico 1. Il problema quello di stabilire un limite di separazione fra e sani e malati,
ossia di stabilire il valore di D.O. al di sopra del quale l'animale viene ritenuto malato e al di sotto
del quale viene ritenuto sano. Per essere pi chiari: guarda l'asse delle ascisse e rispondi alla
seguente domanda: a partire da quale valore di D.O. classifichi come ammalato un animale?
Supponi di adottare come cut-off il valore di 1.0. Ci significa che dichiarerai come sano ogni
animale con D.O. 1.0, e dichiarerai malato ogni animale con D.O. >1.0.
Considera il sottostante Grafico 2: con un cut-off=1, suddividi gli animali in due classi: test-positivi
e test-negativi. Nota che, in realt, fra quelli classificati come test-negativi sono compresi animali
negativi veri (area verde) ed animali negativi falsi (area tratteggiata viola). Analogamente, fra i test-
positivi sono compresi animali positivi veri (area rosa) ed animali positivi falsi (area tratteggiata
gialla).
Riassumendo: adottando un cut-off=1, si ottengono quattro classi di animali: (a) positivi veri, (b)
positivi falsi, (c) negativi falsi, (d) negativi veri. Sicuramente ricordi che queste quattro classi
corrispondono a quelle gi viste nell'Unit precedente in cui, attraverso la tabella di contingenza,
stata definita la sensibilit e la specificit di un test:
285
Finora abbiamo simulato l'ipotesi di adottare un cut-off=1. Ma che cosa succede adottiamo un cut-
off diverso? Osserva ancora il Grafico 2, ed immagina di aumentare il cut-off (spostando verso
destra la linea blu) o di diminuirlo (spostando la linea verso sinistra).
Nel primo caso (Sensibilit=1) il cut-off stato abbassato a circa 0.8: sotto questa nuova ipotesi, il
test riesce ad individuare tutti i soggetti ammalati essendo il valore dell'area c=zero. Per, come
contropartita, hai un aumento dell'area b (positivi falsi). Poich c=0, la sensibilit massima, ossia
pari a 1; questo effetto favorevole bilanciato da una diminuzione della specificit.
Nel secondo caso (Sensibilit=1) il cut-off stato alzato a circa 1.3: sotto questa nuova ipotesi, il
test riesce ad individuare tutti i soggetti sani, essendo il valore dell'area b=zero. Per, come
contropartita, hai un aumento dell'area b (negativi falsi). Poich b=0, la specificit raggiunge il
valore massimo di 1; questo effetto favorevole bilanciato da una diminuzione della sensibilit.
286
In genere conveniente scegliere un cut-off di compromesso (es. del Grafico 1): sia la sensibilit
che la specificit hanno un valore <1, e perci si otterr una quota di risultati positivi falsi e di
negativi falsi. Questo inconveniente inevitabile, e deriva dalla parziale sovrapposizione delle due
curve di distribuzione (sani e malati).
Per riassumere:
ESEMPIO. Langenbach e coll. (2001) hanno calcolato sensibilit e specificit del test "Esame
clinico dei linfonodi" di cani e gatti al fine di diagnosticare metastasi di tumori solidi. L'esame
clinico stato posto a raffronto con un test di riferimento (golden test) rappresentato dall'esame
istologico dei linfonodi.
noto che, durante le malattia neoplastiche, si possono verificare tumefazioni ed ingrossamenti dei
linfonodi regionali, e l'ingrossamento rilevabile mediante una semplice palpazione. Uno dei
problemi connessi con questa tecnica rappresentato dalla valutazione dell'entit
dell'ingrossamento e dalla sua interpretazione. In particolare: sufficiente un modico ingrossamento
oppure l'aumento di volume del linfonodo deve essere notevole?
Gli Autori hanno classificato la modificazione del volume in 3 categorie: (1) no ingrossamento; (2)
ingrossamento lieve; (3) ingrossamento notevole. Questo tipo di classificazione ha fatto sorgere il
quesito se gli animali appartenenti la categoria (2) (ingrossamento moderato) fossero da assegnare
alla categoria degli ammalati o dei non ammalati. Gli Autori hanno applicato due criteri di
interpretazione: interpretazione permissiva e interpretazione severa. Nel primo caso gli animali con
linfonodi lievemente ingrossati venivano classificati come "sani", nel secondo come "malati". Ci
corrisponde proprio ad una variazione del cut-off.
In sintesi, sono stati ottenuti i seguenti risultati:
287
Purtroppo a questa domanda non pu essere data una risposta univoca. Come abbiamo ora
dimostrato, il valore di cut-off influenza sia la sensibilit che la specificit del test. Esso viene scelto
in base ad una serie di considerazioni: ad esempio, deve essere ben nota la storia naturale della
malattia, nonch le conseguenze sanitarie ed economiche dei negativi falsi e dei positivi falsi. Nel
caso di alcune malattie infettive, talvolta anche un solo animale falso negativo pu risultare
particolarmente pericoloso, in quanto escretore dell'agente di malattia e quindi disseminatore del
contagio
ESEMPIO. Nello screening effettuato sulle persone donatrici di sangue necessario adottare test
provvisti della massima sensibilit. Infatti, assolutamente indispensabile tutelare chi riceve la
donazione e quindi non si pu correre il rischio di trasfondere sangue infetto (risultato falsamente
negativo ai test di sicurezza). Su questa base, diventa tollerabile la distruzione di una certa quota di
campioni non infetti (risultati falsamente positivi ai test di sicurezza).
Nel caso di malattie rare, conviene utilizzare un test ad alta sensibilit, altrimenti si rischia di non
individuare i pochi casi presenti; al contrario, se la prevalenza della malattia elevata,
generalmente pi utile un test altamente specifico: infatti vanno assolutamente contenuti i positivi
falsi al fine di non esaurire rapidamente le risorse per le richieste diagnostiche o terapeutiche del
gran numero di animali positivi (veri e falsi).
Un test specifico particolarmente utile per confermare una diagnosi gi effettuata con altri mezzi.
Infatti, un test specifico raramente positivo in assenza della malattia. I test altamente specifici
sono particolarmente utili quando un risultato falso positivo risulta particolarmente dannoso (sotto
l'aspetto organico, emotivo per il proprietario, finanziario ecc.). In sostanza, un test molto specifico
di maggior aiuto al clinico quando fornisce un risultato positivo.
288
11. Test di
screening e diagnostici
11.6 Valori predittivi di un test
OBIETTIVO:
Anche per la comprensione del valore predittivo di in test conviene, come gi avvenuto a proposito
della sensibilit e della specificit, tenere presente la ormai ben nota (v. Unit precedente) Tabella
di contingenza a due entrate, in cui le colonne indicano lo stato reale dell'animale (M+, malato; M-,
sano) e le righe l'esito del test (T+, positivo, T-, negativo):
Il mio consiglio: prima di proseguire con questa Unit, assicurati di aver ben saldi i concetti di (v.
sensibilit e specificit!
importante tenere ben separati i concetti di sensibilit (Se) e specificit (Sp) dal valore predittivo.
La Se e la Sp sono caratteri propri del test e legati al suo intimo funzionamento. In genere essi sono
dichiarati dal produttore e sono (o dovrebbero essere) noti prima dell'applicazione del test sulla
popolazione: Se e Sp sono probabilit pre-test.
Tuttavia, una volta eseguito il test, Se e Sp perdono importanza. Infatti, dopo uno screening di
popolazione, o nell'attivit diagnostica ambulatoriale, oppure - pi in generale - quando si deve
interpretare il risultato di un test, diventano importanti due probabilit post-test. Infatti,
auspicabile avere un'idea della quota di soggetti realmente ammalati (positivi veri, cella a) sul totale
degli animali risultati positivi al test (celle a+b). Analogamente, bene conoscere la quota di
soggetti realmente sani, (negativi veri, cella d) sul totale dei negativi al test (celle c+d).
Non tutti gli animali positivi ad un test sono realmente ammalati. Quindi, in presenza di un animale
positivo ad un test, occorre rispondere alla seguente domanda:
La risposta a questa domanda pu essere data solo in termini di probabilit, calcolando il valore
predittivo positivo (VPP) che indica la probabilit che un animale test-positivo sia davvero
ammalato. Esso rappresenta la proporzione di animali test-positivi che sono ammalati. A partire
dalla tabella di contingenza, il VPP si calcola cos: a/(a+b).
Non tutti gli animali negativi ad un test sono realmente sani. Ecco quindi che, in presenza di un
animale negativo ad un test, occorre rispondere alla seguente domanda:
290
Anche in questo caso, la risposta pu essere data solo in termini di probabilit, calcolando il valore
predittivo negativo (VPN) che indica la probabilit che un animale test-negativo sia davvero sano.
Esso rappresenta la proporzione di animali test-negativi che sono sani. A partire dalla tabella di
contingenza, il VPN si calcola cos: c/(c+d).
Il valore predittivo positivo viene da alcuni detto valore predittivo di un risultato positivo oppure
valore predittivo di un test positivo. Analogamente dicasi per il valore predittivo negativo:
valore predittivo di un risultato negativo o valore predittivo di un test negativo.
In questa Unit ti ho spiegato come si calcolano i valori predittivi, assumendo di possedere... poteri
soprannaturali attraverso i quali si conosce non solo il risultato del test, ma anche lo stato reale
(malato/sano) degli animali. A scopo didattico questa assunzione stata necessaria, ma siamo
rimasti su un piano teorico, un po' avulso dalla pratica. Infatti, ti chiederai senz'altro come sia
possibile calcolare il valore predittivo di un test nella attivit professionale di campo.
291
Questo problema pu essere risolto per mezzo dell'inferenza bayesiana, basata sul Teorema di
Bayes, uno studioso del XVIII secolo. L'inferenza bayesiana una branca della statistica
inferenziale, in cui le probabilit non sono intese come frequenze o proporzioni, bens come livelli
di fiducia nel verificarsi di un dato evento. La base teorica del Teorema complessa, e coinvolge
argomenti di probabilit e statistica che travalicano le competenze di un medico veterinario.
Tuttavia, puoi vedere il Teorema pu come una utile scatola nera che consente di acquisire
conoscenze non raggiungibili in altro modo.
Nel caso che ci interessa, l'utilizzo del Teorema di Bayes abbastanza semplice: basta applicare la
formula appropriata, ossia quella che consente di ottenere, conoscendo Se e Sp del test, la
prevalenza reale a partire dalla prevalenza apparente. Una volta nota la prevalenza reale, sar facile
risalire al valore predittivo positivo e negativo.
Per una spiegazione pi dettagliata puoi fare riferimento ad una presentazione animata con un
esempio pratico.
Come gi detto a proposito della sensibilit e della specificit, anche per i valori predittivi si
possono calcolare gli intervalli di confidenza, che rappresentano un buon indice della precisione dei
valori ottenuti
Per il calcolo degli intervalli di confidenza 95% di un dato valore predittivo positivo, si utilizza la
formula seguente, in cui n corrisponde al totale degli animali risultati test-positivi:
Ovviamente la suddetta formula pu, con le opportune variazioni, essere utilizzata anche per il
calcolo dell'intervallo di confidenza del valore predittivo negativo: basta sostituire VPP con VPN e
n con il totale degli animali test-negativi.
Se vuoi ottenere l'IC99% (anzich 95%), basta sostituire il coefficiente 1.96 con 2.54.
L'interpretazione ed il significato dell'intervallo di confidenza sono gi stati spiegati in una unit
precedente.
292
Il valore predittivo positivo dipende, come lecito attendersi, dalla Se e dalla Sp del test; in
particolare, esso aumenta con l'aumentare di questi due parametri.
per importante sottolineare un altro aspetto pi sorprendente, e particolarmente importante nella
pratica: il valore predittivo positivo dipende anche da un fattore indipendente dal test: la prevalenza
della malattia nella popolazione sottoposta a screening. Questo aspetto come viene illustrato
attraverso un apposito esempio nella prossima unit.
11. Test di
screening e diagnostici
11.7 Relazione tra valori predittivi e prevalenza
OBIETTIVO:
valutare la relazione esistente fra i valori predittivi di un test di screening e la prevalenza della
malattia
Fra il valore predittivo (VPP) e negativo (VPN) di un test e la prevalenza della malattia nella
popolazione che viene sottoposta a screening esiste una relazione molto importante. La
comprensione di questa relazione facilitata ricorrendo ad un esempio-simulazione.
Supponi di effettuare uno screening nei confronti della brucellosi bovina in 3 diverse aree
geografiche (Area1, Area2, Area3), usando un test con sensibilit e specificit note. In ciascuna
area sono presenti 30000 animali da sottoporre a screening. Ancora una volta, come gi fatto nelle
Unit precedenti, supponiamo di avere... poteri soprannaturali, e di conoscere la prevalenza reale in
ciascuna area:
Lo screening viene effettuato con test di Agglutinazione rapida al Rosa bengala(Rose Bengale
Test, con Se=0.620 e Sp=0.995 [Gall D. & Nielsen K., Rev. sci. tech. Off. int Epiz., 2004, 23 (3), 989-1002].
Come vedi, il valore predittivo positivo (VPP) diminuisce con il diminuire della prevalenza della
malattia. Questo accade perch la diminuzione della prevalenza comporta l'incremento degli
animali sani; ci, a sua volta, fa s che aumenti il numero di esiti positivi falsi.
Nella Area1, con prevalenza elevata, il VPP di 0.932, ci significa che su 100 bovini positivi al
test, 93 sono ammalati, mentre 7 sono positivi falsi. Considera che la profilassi della brucellosi
avviene per eradicazione, ed i bovini che risultano infetti devono essere abbattuti; se ci si basasse
soltanto sull'esito di questo test di screening, nello scenario in questione si pagherebbe una sorta di
tassa a fondo perduto del 7%, rappresentata dai bovini sani da abbattere erroneamente in quanto
considerati infetti. L'entit (7%) di questo effetto collaterale sembra accettabile, considerando anche
il beneficio rappresentato dal fatto che, dopo l'abbattimento, la prevalenza registra un notevole calo
(da 0.1 a 0.039).
Consideriamo l'Area2 e l'Area3, nelle quali il VPP rispettivamente 0.556 e 0.110. Ci comporta
che il 44.4% e l'89.0% degli abbattimenti sarebbe ingiustificato, riguardando animali sani ma test-
positivi. Questa situazione risulterebbe inaccettabile nella pratica per una serie di motivi, che
possono essere riassunti in uno solo fonfamentale: un eccessivo rapporto costi / benefici (ossia il
rapporto fra il costo delle azioni di profilassi ed i benefici indotti da tali azioni). Pertanto, in questi
295
casi dovranno essere adottate misure correttive per migliorare il VPP. Ad esempio, si potranno
utilizzare due test invece di uno solo.
Il grafico sottostante illustra l'andamento del valore predittivo positivo in rapporto alla prevalenza,
per tre test di esempio a diversa sensibilit e specificit. evidente che, quando la prevalenza della
malattia nella popolazione elevata, la performance di tutti i test buona. Invece, per valori di
prevalenza molto bassi il valore predittivo di tutti i test si avvicina a zero; in queste condizioni,
qualsiasi test diagnostico diventa virtualmente inutile a scopo diagnostico. Puoi notare,
confrontando l'andamento delle 3 curve, che l'effetto della prevalenza sul valore predittivo
proporzionale al decrescere della sensibilit e specificit del test.
Il fatto che il valore predittivo positivo dipenda dalla prevalenza sconsiglia l'effettuazione di azioni
di screening per malattie rare. Infatti, uno screening per una malattia rara presenta i seguenti
inconvenienti: (1) pochi individui ne trarranno beneficio (proprio in quanto malattia rara); (2) molti
individui (i falsi-positivi) ne trarranno un danno, in quanto verranno ingiustamente considerati
ammalati.
Analogamente al VPP, anche il VPN dipende dalla prevalenza della malattia nella popolazione. La
relazione va in senso opposto rispetto a quanto hai visto per il VPP. Infatti, il VPN aumenta con il
diminuire della prevalenza, come schematizzato nel grafico sottostante.
296
Quando si acquista un animale (o un prodotto di origine animale), buona norma accertarsi che
esso non sia affetto da malattie trasmissibili o contaminazioni che, in tal modo, potrebbero essere
introdotte in un allevamento indenne (ossia nel quale l'agente della malattia non presente). Di
solito prima dell'acquisto l'animale viene sottoposto ad un test. Tuttavia, hai imparato che i test non
sono infallibili. Perci sorge legittima la domanda dell'allevatore:
"se l'animale da acquistare test-negativo, che probabilit ci sono che esso sia ammalato?"
ESEMPIO. Un bovino appartenente ad un gruppo in cui si stima che la prevalenza della brucellosi
sia pari a 0.20 viene sottoposto con esito negativo al test di agglutinazione rapida al Rosa bengala
297
Foglio di calcolo per Microsoft Excel che simula l'applicazione di un test in una popolazione e
calcola Se, Sp, VPP e VPN.
Foglio di calcolo per Microsoft Excel per calcolare, conoscendo P, Se e Sp, la probabilit che un
animale test-negativo sia ammalato.
Foglio di calcolo per Microsoft Excel per visualizzare l'andamento di VPP e VPN in rapporto a P,
Se e Sp.
298
11. Test di
screening e diagnostici
11.8 Metodi per migliorare il valore predittivo di un test di screening
OBIETTIVO:
individuare i metodi per migliorare il valore predittivo positivo (VPP) di un test da utilizzare per
lo screening di popolazioni
Abbiamo visto nell'Unit precedente che il valore predittivo positivo (VPP) un elemento di
fondamentale importanza per la riuscita delle operazioni di screening. Abbiamo visto anche che il
VPP correlato alla prevalenza: esso decresce al diminuire della prevalenza, potendo raggiungere
livelli inaccettabilmente bassi e tali da compromettere l'efficienza dell'azione di screening.
Il primo metodo per ottenere un accettabile VPP quello di operare su popolazioni ad alto rischio,
nelle quali la prevalenza si presume assuma valori elevati. Se questa opzione non praticabile,
allora si pu cercare di individuare, nella popolazione, sottogruppi ad alto rischio sui quali
concentrare il programma di screening.
Fra gli interventi di diagnosi precoce dei tumori dell'uomo previsti dal Sistema Sanitario Nazionale,
si annovera la mammografia. Il test viene effettuato allo scopo di individuare tempestivamente i
tumori della mammella e prevede l'esame biennale delle donne di et compresa fra 50 e 69 anni.
Questa fascia di et pi a rischio rispetto alle altre ed in essa l'incidenza maggiore. Perci il
valore predittivo del test pi elevato rispetto a quanto si avrebbe esaminando indiscriminatamente
tutte le donne.
Il secondo metodo per migliorare il VPP quello di utilizzare due (o, raramente, pi di due) test.
Operativamente, ci pu avvenire con due diverse modalit (che verranno prese in considerazione
nelle prossime Unit):
(1) in serie, cio prima un test e poi, su quelli risultati positivi, l'altro;
L'interpretazione dei risultati di test in serie ovvia: si considerano ammalati gli animali risultati
positivi al primo ed al secondo test.
Pi complicata l'interpretazione dei test in parallelo, per i quali si pu adottare la strategia di
interpretazione con modalit OR oppure con modalit AND. Questo argomento viene affrontato in
una successiva unit.
Riassumendo:
299
300
11. Test di
screening e diagnostici
11.9 Test multipli: utilizzo di 2 test in serie
OBIETTIVO:
verificare, per mezzo di un esempio, il miglioramento del valore predittivo ottenibile utilizzando
due test in serie
Sottoponi al TEST1 tutti gli 8000 soggetti della popolazione, e poi applichi il TEST2solo su quelli
risultati positivi al TEST1.
Se vuoi, puoi fare il seguente breve "ripasso" verificando che i risultati tabulati soddisfano i dati
forniti:
301
Come vedi, alla fine del procedimento di applicazione in serie del TEST1 e del TEST2, gli 8000
animali sono stati classificati come segue:
- 103 positivi (di cui 102 positivi veri e 1 positivo falso)
- 7897 negativi (7796 negativi al TEST1 + 101 negativi al TEST2). Fra questi 7987 negativi, 7888
sono negativi veri e 7+2 negativi falsi.
Ora puoi calcolare Se, Sp e VPP complessive, ossia quelle ottenute utilizzando i due test in serie:
Nella Tabella che segue sono evidenziati in colore gli animali classificati incorrettamente (mis-
classificati). Puoi vedere che:
- al TEST1 hai classificato come sani 7 animali che in realt sono malati; questi 7 animali non
verranno pi testati;
- al TEST1 hai classificato come malati 100 animali in realt sani, che per verranno poi saggiati
con il TEST2;
- al TEST2 hai classificato come malato 1 animale che in realt sano;
- al TEST1 hai classificato come sani 2 animali che in realt sono malati.
302
Rispetto agli esiti del TEST1, al TEST2 sono stati dichiarati sani 2 animali che in realt sono
malati. Questo effetto negativo derivante dall'applicazione del TEST2 largamente compensato dal
fatto che con il secondo test si sono quasi annullati i positivi falsi, che passano da 100 a 1.
Proviamo a fare qualche conto sui benefici della strategia Due test in serie utilizzando i dati dello
scenario che hai appena visto, ed ipotizzando che un esame di laboratorio con il TEST1 costi 1 e
con TEST2 costi 10:
(a) se utilizzi soltanto TEST1, spendi 8000 ed ottieni 107 mis-classificazioni: 100 positivi falsi e 7
negativi falsi);
(b) se utilizzi soltanto TEST2, spendi 80000 ed ottieni 81 mis-classificazioni: 79 positivi falsi e 2
negativi falsi (dati non mostrati nelle tabelle);
(c) se utilizzi i due test in serie, spendi 10040 ed ottieni 10 mis-classificazioni: 1 positivo falso e 9
negativi falsi.
Ricordati che ti puoi attendere risultati simili a quelli dell'esempio soltanto se i due test sono
biologicamente indipendenti l'uno dall'altro. Per biologicamente indipendenti si intende che i
test sono basati su meccanismi diversi o, meglio, che misurano grandezze diverse (es. differenti
classi di anticorpi).
L'utilizzo di due test in serie previsto, ad esempio, nell'ambito del piano di profilassi di Stato della
brucellosi bovina, con l'impiego di due test sierologici: il test al rosa-bengala in prima istanza e
quindi, sui positivi, la fissazione del complemento. Questi due test possono essere ritenuti
biologicamente indipendenti, in quanto misurano classi diverse di anticorpi, e quindi il loro
impiego in serie risulta efficace.
Se i due test sono biologicamente dipendenti, allora si otterranno probabilmente risultati meno
brillanti di quelli dell'esempio. Infatti, in test biologicamente simili i risultati tendono ad essere
correlati, nel senso che aumenta la probabilit che essi forniscano lo stesso risultato quando
applicati allo stesso animale.
303
Attenzione a non commettere l'errore di confrontare il valore predittivo positivo del primo test con
quello del secondo. Infatti nel nostro esempio:
La scelta dell'ordine di serie dei due test (prima TEST1 poi TEST2, oppure viceversa prima TEST2
poi TEST1) viene effettuata tenendo conto soprattutto dei costi e della praticit di esecuzione dei
test. Infatti, evidentemente preferibile che il primo test (quello applicato su un numero maggiore
di individui) sia il meno costoso e/o quello di pi facile esecuzione oppure meno invasivo per il
paziente.
304
11. Test di
screening e diagnostici
11.10 Test multipli: utilizzo di 2 test in parallelo
OBIETTIVO:
Oltre all'utilizzo di test multipli in serie, gi visto in precedenza, un altra modalit di impiego di
test multipli quella di applicare 2 (o pi) test contemporaneamente agli animali della
popolazione da saggiare.
La sensibilit e la specificit della combinazione di test dipendono dalla modalit di interpretazione
dei risultati. Infatti, potranno ottenere le seguenti combinazioni di risultati:
Applicando due test contemporaneamente sorge un problema di interpretazione dei risultati. Infatti,
pacifico che gli animali T1+/T2+ siano considerati ammalati. Analogamente, pacifico che gli
animali T1-/T2- siano considerati sani. Ma come interpretare gli animali T1+/T2- e quelli T1-/T2+?
Vi sono due possibilit: l'interpretazione OR e l'interpretazione AND.
Nota che, ai fini della sensibilit e della specificit globali, l'utilizzo di due test in parallelo
modalit AND sovrapponibile all'utilizzo degli stessi due test in serie (v. unit precedente).
Per, nella pratica, fra le due strategie (serie/parallelo) vi una differenza importante: nel caso dei
test in serie il numero complessivo di test da effettuare inferiore rispetto a quanto ai test in
parallelo. Infatti, nel caso della strategia in serie si effettua il primo test su tutti gli animali, ed il
secondo test solo su quelli risultati positivi. Invece, con la strategia in parallelo si saggiano tutti
gli animali sia con il primo che con il secondo test. Per questo motivo la strategia test in parallelo
modalit AND normalmente non viene utilizzata.
11. Test di
screening e diagnostici
11.11 Test in parallelo: interpretazione con modalit OR o AND
OBIETTIVO:
apprendere, per mezzo di un esempio, gli effetti su sensibilit e specificit quanto due test
applicati in parallelo vengono interpretati con modalit OR o AND
In questa simulazione, esamini una popolazione di 6000 bovini, applicando su ciascuno di essi due
test (TEST1 e TEST2). Per rendere efficace l'esempio, supponiamo che tu conoscsa gi lo stato
reale di ciascuno dei 6000 animali (cosa che non avviene mai nella pratica!). In particolare, sai che
300 di essi sono ammalati, ed i restanti 5700 sono sani.
Una volta effettuati i test, ordini i dati ottenuti in un database in un foglio di calcolo, di cui viene
riportato qui sotto u estratto (se lo desideri, disponibile anche il foglio di calcolo completo). Come
vedi, nel database ogni riga rappresenta un animale, mentre ogni colonna contiene una variabile.
Nota che i dati sono stati codificati secondo un metodo di uso comune, ossia utilizzando il codice
0 (che significa 0 oppure negativo, o pi in generale assenza del fenomeno) oppure
viceversa il codice 1.
Ora, sempre utilizzando i dati del database, puoi allestire le tabelle di contingenza separatamente
per ciascuno dei due test, e calcolarne la sensibilit e la specificit, come segue:
308
A questo punto puoi tabulare, sempre a partire dal database, i risultati combinati dei due test in
parallelo, come nella Tabella sottostante. Per chiarire la lettura della Tabella, aggiungo che:
- il valore 80 indica che 80 animali ammalati sono risultati +/-, ossia positivi al TEST1 e negativi
al TEST2;
- il valore 200 indica che 200 animali sani sono risultati +/-, ossia positivi al TEST1 e negativi al
TEST2;
- il valore 40 indica che 40 animali ammalati sono risultati -/+, ossia negativi al TEST1 e positivi
al TEST2;
... e cos via.
Infine, puoi calcolare la sensibilit e la specificit dei due test in parallelo, sia con intepretazione in
modalit AND che in modalit OR. Il calcolo illustrato graficamente, con l'aiuto dei colori,
nella Tabella che segue.
309
In sintesi:
Infine, per riassumere il tutto, nella figura seguente vengono schematizzate le differenze fra
l'interpretazione OR e quella AND.
310
Nel caso dell'interpretazione AND, pi facile che sfuggano alla diagnosi animali infetti, per
diminuisce la probabilit che un animale sano sia classificato come ammalato. La specificit
aumenta, a scapito della sensibilit.
311
11. Test di
screening e diagnostici
11.12 Validit di un test e concordanza fra test
OBIETTIVO:
apprendere un semplice criterio di valutazione della concordanza fra due test (o della efficienza
di un test)
Validit di un test
Abbiamo visto, nelle Unit precedenti, che dopo aver applicato un test su una popolazione
assumono importanza due indici: il valore predittivo positivo ed il valore predittivo negativo, che
misurano quanto i risultati ottenuti si avvicinano alla realt. Ci, per, pu essere riassunto in un
solo indice, detto validit (o efficienza, o accuratezza).
La validit di un test la sua capacit di classificare correttamente sia gli animali malati che quelli
sani. La validit tanto pi alta quanto pi il test classifica come positivi gli animali realmente
malati e come negativi quelli realmente sani. In altri termini, la validit la capacit di generare
risultati rispondenti al vero sia negli individui ammalati che in quelli sani.
La validit pu essere calcolata facilmente qualora si conosca il vero stato degli individui che sono
stati sottoposti al test. In tal caso, utilizzando la ben nota Tabella di contingenza, la validit si
esprime con la proporzione: (a+d)/(a+b+c+d).
ESEMPIO. Abbiamo sottoposto 300 bovini al test della tubercolina per la diagnosi di tubercolosi;
successivamente, i bovini sono stati macellati, e su di essi stata effettuato un minuzioso esame
anatomo-patologico di visceri e linfonodi per evidenziare le lesioni tipiche della tubercolosi. Hai
312
La concordanza pu riguardare non solo il grado di accordo che si osserva fra due test, ma anche
quello fra due (o pi) operatori che interpretano l'esito di uno stesso test (es. radiografie,
elettrocardiogramma, auscultazione cardiaca ecc.), oppure fra due letture effettuate da uno stesso
operatore in tempi diversi. Non si vuole stabilire quale classificazione sia pi corretta, bens
stabilire se i criteri utilizzati per l'interpretazione del test siano efficienti, e se classificazione sia
riproducibile.
Il calcolo della concordanza analogo a quello della validit. Supponendo quindi di confrontare due
test (TestA e TestB), si ha quanto segue:
ESEMPIO. Hai saggiato 134 sieri suini con due test (TestA e TestB) allo scopo di verificare la
presenza di paratubercolosi nel bovino, ottenendo i seguenti risultati: 18 positivi a entrambi i test;
102 negativi ad entrambi i test; 8 positivi a TestA e negativi a TestB; 6 negativi a TestA e positivi a
TestB. La concordanza fra i due test : (18+102)/(18+102+8+6) = 0.896.
313
La concordanza calcolata come sopra descritto criticabile in quanto non tiene conto della quota di
concordanza dovuta al caso.
Come vedi, una classificazione puramente casuale, come quella ottenuta attraverso il lancio di una
moneta, restituisce valori di concordanza prossimi a 50%, che sono ovviamente ingannevoli. Per
calcolare la quota di concordanza vera occorre stabilire quanta parte della concordanza totale
osservata dovuta al caso, e quanta invece dovuta al reale accordo tra gli osservatori o i test
utilizzati. Ci si ottiene attraverso un metodo statistico che, a partire dai dati della tabella di
contingenza, consente di calcolare il Kappa di Cohen.
L'interpretazione dei valori Kappa si esegue secondo le seguenti linee-guida: k<0.2= concordanza
scarsa; k compreso fra 0.2 e 0.4 = concordanza modesta; fra 0.41 e 0.61 = moderata; fra 0.61 e 0.80
= buona; >0.80 = eccellente.
Per maggiori informazioni sul Kappa di Cohen e per le modalit di calcolo, ti consiglio di
consultare il Libro oppure questa presentazione animata.
Foglio di calcolo per Microsoft Excel che calcola il Kappa di Cohen a partire da una tabella di
contingenza 2x2.
314
12. Trasmissione
e mantenimento delle infezioni
12.1 Malattie trasmissibili
OBIETTIVO:
definire il concetto di "malattia trasmissibile" e mostrare come esistano malattie trasmissibili non
contagiose
Per "malattia trasmissibile" si intende una malattia il cui agente causale pu essere trasferito da
un individuo ad un altro.
Le malattie trasmissibili possono essere suddivise in infettive o non infettive. Ciascuna di queste due
categorie comprende malattie contagiose o non contagiose:
Alcune malattie trasmissibili infettive non contagiose richiedono l'intervento di un vettore (questo
punto di vista non condiviso da tutti). Il vettore serve a propagare l'agente da un individuo
all'altro.
ESEMPIO. La anemia infettiva del cavallo una malattia che si trasmette agli animali recettivi
quasi esclusivamente attraverso l'intervento di insetti ematofagi (tafani, zanzare ecc.) che si
comportano esclusivamente come vettori meccanici. Altre vie di trasmissione, non naturali e
molto meno comuni, sono rappresentate da aghi di siringhe o altri strumenti contaminati da
sangue proveniente da un animale infetto.
315
Esistono per anche malattie trasmissibili infettive non contagiose che non necessitano
dell'intervento di un vettore, quali quelle sostenute da clostridi (es. tetano, botulismo, carbonchio
ecc.).
Le malattie trasmissibili non infettive e contagiose sono tipicamente quelle sostenute da parassiti.
Infine, da ricordare che le malattie trasmissibili non infettive e non contagiose comprendono
alcune malattie genetiche (tipiche, nell'uomo, il daltonismo e l'emofilia) che si trasmettono per via
verticale.
Per notizie pi esaurienti: A. Mantovani. Appunti sullo sviluppo del concetto di zoonosi. Atti III Convegno
Nazionale di Storia della Medicina Veterinaria. Lastra a Signa (FI), 23-24 settembre 2000, pag. 119-129.
316
12. Trasmissione
e mantenimento delle infezioni
12.2 Ciclo di una malattia trasmissibile
OBIETTIVO
Il ciclo di una malattia comprende collettivamente i diversi stadi che si succedono nel corso di un
evento morboso. La conoscenza del ciclo della malattia importante, sia nel singolo animale
(medicina clinica)che in popolazioni (epidemiologia), per la messa a punto di strategie di terapia
e di profilassi.
Il ciclo-tipo di una malattia pu essere suddiviso in diverse fasi, alcune delle quali possono
sovrapporsi. La figura soprastante rappresenta soltanto una schematizzazione estremamente
semplificata degli eventi che si verificano in un animale ammalato in funzione del tempo.
esposizione: l'evento iniziale che, nel caso delle malattie infettive, d origine alla infezione;
periodo di incubazione: il tempo che intercorre tra l'esposizione e la comparsa di sintomi clinici.
Per le malattie non trasmissibili esso detto periodo di latenza. Questo periodo varia ampiamente
variabile in rapporto al tipo di agente, all'ospite ed a numerosi altri fattori;
periodo prodromico: il periodo di transizione tra lo stato di salute e quello di malattia,
caratterizzato dai primi sintomi (spesso non specifici della malattia);
malattia clinica (o subclinica): in questo periodo i sintomi della malattia raggiungono la loro
massima evidenza. Se i sintomi sono molto marcati, la malattia in "forma acuta"; se sono di
minore intensit, allora la malattia in "forma subacuta". Non sempre i sintomi sono presenti; nel
caso in cui manchino, si parla di "malattia subclinica" o asintomatica.
Se la malattia grave, pu verificarsi la morte dell'animale ammalato
regressione: il periodo in cui i sintomi si fanno meno intensi; spesso la regressione dovuta alla
reazione dell'ospite (es. produzione di anticorpi). Tuttavia, possibile che l'ospite non riesca a
317
guarire completamente, e quindi la malattia entra in una lunga fase detta di cronicizzazione, cio
acquisisce i caratteri della malattia cronica;
convalescenza e guarigione: in questa fase si ha il ristabilimento completo delle funzioni
dell'organismo, che ritorna in stato di salute. Notare che alcune malattie provocano lesioni
permanenti e quindi inibiscono una guarigione perfetta;
stato di portatore: ovviamente pu realizzarsi soltanto nel caso delle malattie infettive: in questa
fase, che in molti casi NON si verifica, l'animale alberga l'agente (ed capace di trasmetterlo ad
animali recettivi), senza manifestare alcun segno di malattia. L'animale portatore in stato di
infezione subclinica o di infezione latente.
Per le malattie infettive, il periodo di trasmissibilit o di contagiosit (cio il lasso di tempo durante
il quale l'animale pu trasmettere l'infezione ad altri animali) dipende da molti fattori (tipo di
malattia, tipo di ospite, ecc.). Come regola generale, questo periodo (evidenziato in arancio nello
schema) inizia poco dopo l'infezione, persiste negli animali portatori ma si esaurisce dopo la
guarigione.
318
12. Trasmissione
e mantenimento delle infezioni
12.3 Infezione latente e stato di portatore
OBIETTIVO
Per infezione latente (o, impropriamente, malattia latente) si intende una situazione in cui un agente
patogeno presente allo stato quiescente in un ospite. L'infezione o la malattia rimangono
inapparenti per un periodo di tempo molto superiore rispetto al periodo di incubazione "normale"
per quella malattia.
Durante il periodo di infezione latente, la presenza dell'agente nell'ospite non pu essere dimostrata
con mezzi convenzionali. L'infezione latente ha durata indefinita, ma pu essere riattivata (e
quindi passare allo stato di malattia) per effetto di fattori diversi o eventi stressanti.
ESEMPIO. Talvolta i suini adulti, dopo infezione da parte del virus della pseudorabbia (Suid
Herpesvirus 1, SHV1), detta anche Malattia di Aujeszky, rimangono clinicamente sani e non
presentano mai segni clinici, oppure li presentano a distanza di mesi; tuttavia, normalmente, la
malattia si manifesta dopo un periodo di incubazione di pochi giorni.
12. Trasmissione
e mantenimento delle infezioni
12.4 Trasmissione orizzontale e verticale
OBIETTIVO:
Le malattie diffusibili (infettive o parassitarie) conseguono alla penetrazione (o, pi raramente, alla
colonizzazione superficiale) nell'organismo da parte di agenti patogeni (virus, batteri, miceti,
protozoi, elminti ecc.).
Molto spesso l'agente patogeno non in grado di replicare al di fuori dell'ospite; questo sempre
vero per i virus, i quali sono parassiti endocellulari obbligati e quindi necessitano assolutamente, per
la loro vita, di esseri viventi. Tutt'al pi l'agente pu sopravvivere (cio resistere, ossia
rimanere vitale, ma senza moltiplicarsi) al di fuori dell'ospite per un tempo pi o meno lungo.
allora evidente che la sopravvivenza continuativa di un agente, sia essa associata o meno
all'induzione di malattia nell'ospite, pu avvenire soltanto se avviene la trasmissione a nuovi ospiti
sensibili, nei quali l'agente replica. Oltre a replicare (o moltiplicarsi) nell'ospite, l'agente deve avere
l'opportunit di essere trasmesso ad un altro ospite recettivo, in modo da dar luogo al cosiddetto
ciclo vitale. Tipicamente, la trasmissione avviene da un ospite ammalato ad uno sano recettivo:
La trasmissione pu avvenire per via orizzontale (detta anche laterale) oppure per via verticale. La
trasmissione orizzontale pu essere di tipo diretto o indiretto; la trasmissione verticale pu avvenire
in utero (mammiferi) o in ovo (uccelli, pesci ecc.).
321
Trasmissione orizzontale
La trasmissione orizzontale diretta si verifica quando un ospite recettivo si infetta per contatto
fisico con un ospite infetto oppure con suoi escreti.
La trasmissione di agenti infettanti a lunga distanza attraverso l'aria, viene talvolta impropriamente
ritenuta indiretta, sebbene sia pi corretto classificarla come diretta in quanto non coinvolto
alcun veicolo intermedio.
Trasmissione verticale
La trasmissione per via verticale avviene da una generazione dell'ospite alla successiva attraverso
l'infezione dell'embrione o del feto in utero (mammiferi) o in ovo (uccelli, rettili, pesci, artropodi).
Secondo alcuni anche la trasmissione alla progenie attraverso il latte da considerarsi verticale.
ESEMPIO. La leucosi enzootica del bovino dovuta ad un virus appartenente alla famiglia
Retroviridae, genere HTLV-BLV (Human T-cell Lymphotropic Virus - Bovine Leukemia Virus).
Una delle vie di trasmissione di questa malattia quella verticale: il feto si infetta per via
diaplacentare. possibile, anche se non frequente, l'infezione del neonato per ingestione di latte o
colostro.
323
12. Trasmissione
e mantenimento delle infezioni
12.5 Tipi di ospite
OBIETTIVO:
descrivere i diversi significati del termine ospite in base alle possibili interazioni agente-
animale
In biologia Con il termine di ospite si designa la specie al cui interno (o sulla cui superficie)
presente un altro essere vivente, in situazione di commensalismo, parassitismo o simbiosi
mutualistica. L'attributo ospite viene usato anche per la cellula (cellula ospite) nella quale si
riproduce un parassita intracellulare (es. un virus).La specie ospite deve essere intesa in senso
lato, e quindi e comprende anche gli artropodi, che talvolta svolgono un ruolo importante nella
diffusione delle malattie. Di solito, nell'ospite avviene la moltiplicazione o lo sviluppo dell'agente.
Esiste una variet di termini che descrivono le interazioni ospite-parassita; si tratta di termini usati
da microbiologi, parassitologi, epidemiologi, infettivisti ecc. Ognuno di questi termini pu
assumere un significato specifico all'interno di ogni disciplina. In questa sede verr fatto un breve
cenno soltanto agli aspetti che riguardano l'epidemiologia.
Ospite definitivo
Ospite definitivo un termine usato in parassitologia per indicare l'ospite in cui un parassita
compie la fase di riproduzione sessuata.
Ospite primario (o ospite naturale). Si tratta di una specie animale che mantiene un'infezione
nella zona occupata dalla popolazione della specie animale stessa. Poich un agente infettante
324
spesso dipende dall'ospite primario per la sopravvivenza a lungo termine, l'ospite primario spesso
detto anche ospite di mantenimento.
Ospite secondario una specie addizionale (in aggiunta a quella dell'ospite primario) coinvolta
nel ciclo vitale di un agente, specialmente al di fuori della zona endemica.
Talvolta questa distinzione non molto netta, ed anche un ospite secondario pu agire come ospite
di mantenimento.
ESEMPIO. La pseudorabbia (o malattia di Aujeszky) una malattia virale che riconosce come
ospite primario il maiale. In questa specie compaiono i diversi quadri di malattia, oppure infezioni
asintomatiche o, ancora, infezioni latenti. La stessa malattia pu colpire anche molte altre specie di
animali domestici o selvatici; diversamente da quanto avviene nel maiale, in questi la malattia ha
esito quasi costantemente letale.
Ospite intermedio: ospite in cui un agente va incontro ad un qualche tipo di sviluppo. Il termine
viene impiegato in parassitologia, e si riferisce pi spesso ad una riproduzione di tipo asessuato.
ESEMPIO. Railletina cesticillus un cestode (verme piatto) che vive, allo stadio adulto,
nell'intestino tenue del pollo, del fagiano e di altri volatili. Le proglottidi gravide, o parti di esse,
emesse con le feci vengono ingerite da un ospite intermedio rappresentato da un insetto dell'ordine
Coleoptera. Nell'ospite intermedio l'embrione si sviluppa, trasformandosi in larva cisticercoide.
L'ospite definitivo si infesta ingerendo un ospite intermedio parassitato.
Ospite accidentale (o incidentale, a fondo cieco, o dead-end): un ospite che generalmente non
trasmette la malattia e nel quale, quindi, l'agente non pu completare il suo ciclo biologico. La
definizione di "ospite accidentale" si applica soltanto ad una combinazione ospite-agente. Lo stesso
ospite pu essere definitivo, intermedio, accidentale ecc. per un diverso agente.
ESEMPIO. Nella pseudorabbia (vedi sopra), l'infezione di specie diverse dal maiale poco o nulla
diffusibile (perch il virus non viene escreto da parte dell'ospite), e porta costantemente a morte gli
325
animali colpiti. Quindi le specie diverse da quella suina sono da considerare, nell'epidemiologia
della pseudorabbia, come a fondo cieco.
Ospite di amplificazione: con questa denominazione si indica una specie animale che, per un
cambiamento temporaneo nella dinamica della popolazione accompagnato da un incremento di
numero degli individui, pu improvvisamente consentire un aumento della concentrazione
dell'agente.
326
12. Trasmissione
e mantenimento delle infezioni
12.6 Tipi di vettore
OBIETTIVO
Etimologicamente vettore deriva dal latino vector, che significa "colui che porta". Questo termine
pu essere impiegato in senso lato o ristretto.
In senso lato, per vettore si intende qualsiasi cosa, o essere vivente, che permette il trasporto o la
trasmissione di un agente patogeno.
Nel significato ristretto, un vettore un essere vivente (quasi sempre un invertebrato, e pi spesso
un artropode) che, in virt del suo comportamento ecologico, capace di trasmettere un agente di
malattia.
Nell'ambito dei vettori (intesi in senso ristretto) possono essere riconosciute due categorie. I vettori
meccanici sono quelli nei quali l'agente patogeno veicolato non compie alcuno sviluppo. I vettori
biologici sono, invece, quelli in cui l'agente si moltiplica oppure deve compiere una parte
importante del proprio ciclo vitale.
Talvolta i vettori biologici attivi, ed i vettori meccanici sono detti passivi .
12. Trasmissione
e mantenimento delle infezioni
12.7 Fattori associati alla diffusione delle infezioni
OBIETTIVO
Fra le diverse variabili che intervengono nel processo di diffusione delle malattie trasmissibili, le
pi importanti sono legate alle caratteristiche dell'ospite, alle caratteristiche dell'agente ed
alla efficienza del contatto.
Pi in dettaglio (v. schema), l'ospite favorisce (o ostacola) la diffusione di una malattia a seconda di
due caratteri principali: la recettivit e la contagiosit. A sua volta, l'agente responsabile della
malattia possiede almeno 3 caratteri importanti ai fini della trasmissione: l'infettivit, la virulenza e
la stabilit.
I suddetti caratteri vengono brevemente sviluppati nelle due Unit che seguono.
330
12. Trasmissione
e mantenimento delle infezioni
12.8 Diffusione delle infezioni e caratteristiche dell'ospite: recettivit e contagiosit
OBIETTIVO
fornire i concetti di base su alcuni attributi dell'ospite che sono implicati nella diffusione delle
malattie trasmissibili all'interno di una popolazione o fra popolazioni diverse
La capacit di un ospite a trasmettere una malattia condizionata da numerosi fattori, tra i quali i
pi importanti sono la recettivit (o suscettibilit) e la contagiosit.
Un fattore importante che condiziona la recettivit la specie animale. Infatti, a seconda della
malattia, la recettivit pu essere molto ampia, oppure limitata ad una sola specie o a gruppi di
specie. La gamma di specie animali recettive ad una malattia viene detta, nel suo complesso,
spettro d'ospite
ESEMPIO. La malattia di Marek una malattia virale che colpisce esclusivamente il pollo; quindi,
si dice che il virus della malattia di Marek ha uno spettro d'ospite molto ristretto.
Al contrario, il virus della rabbia pu infettare una vasta gamma di specie animali, e quindi esso ha
uno spettro d'ospite allargato.
Un altro fattore importante che influisce sulla recettivit l'immunit derivante da una pregressa
infezione o da una vaccinazione.
Vi sono anche altri fattori che influenzano la contagiosit. Ad esempio, un animale non diventa
infettante subito dopo l'avvenuta infezione. Il tempo che intercorre tra l'infezione e la escrezione
dell'agente un altro fra i tanti elementi che contribuiscono a determinare la contagiosit di una
malattia. Questo periodo di tempo assume denominazioni diverse a seconda del tipo di agente
implicato. In particolare, esso viene denominato:
Nel caso delle malattie non infettive, il periodo di latenza indica l'intervallo di tempo compreso
tra l'esposizione alla causa e la comparsa della malattia.
332
12. Trasmissione
e mantenimento delle infezioni
12.9 Diffusione delle infezioni e caratteristiche dell'agente
OBIETTIVO
illustrare alcuni caratteri dell'agente patogeno importanti ai fini della trasmissione della malattia
Fra le pi importanti caratteristiche che influenzano la trasmissione degli agenti infettivi sono da
annoverare: (1) infettivit, (2) virulenza, (3) stabilit.
L'infettivit un attributo dell'agente che misura con quanta facilit esso in grado di infettare
l'ospite. L'infettivit inversamente proporzionale al numero di organismi necessari per l'instaurarsi
dell'infezione in un determinato ospite.
L'infettivit varia ampiamente in rapporto ad i diversi agenti.
ESEMPIO. I virus che infettano i batteri (batteriofagi) hanno un'infettivit molto elevata: 1 solo
batteriofago pu indurre infezione in un batterio. Al contrario, nel caso dei virus animali, l'infezione
si instaura soltanto con quote di virus molto pi elevate (es. 1000 o 100000 particelle infettanti).
L'infettivit pu variare in rapporto ai differenti ceppi dello stesso agente e dipende anche da altri
fattori quali la via di infezione, l'et dell'ospite, il suo stato di resistenza innata o acquisita ecc.
Quando un agente capace di infettare pi di una specie animale, la sua infettivit varia in rapporto
alla specie ospite. In sostanza, l'infettivit di un agente non un parametro assoluto, ma deve essere
specificata in correlazione con altre variabili.
ESEMPIO. La dose infettante di Campylobacter jejuni isolato da pollo di 500 batteri per il pollo e
di 107 per il gabbiano.
Il virus dell'encefalomielite aviare riproduce la malattia se somministrato in bassa dose a pulcini
recettivi di 1 giorno di et; se si utilizzano pulcini di et superiore, sono necessarie dosi via via pi
elevate. Quindi, l'infettivit del virus dell'encefalomielite aviare strettamente correlata all'et.
La virulenza misura la patogenicit (o potere patogeno) di un agente, ossia quanto esso capace di
provocare una malattia e di indurre lesioni nei tessuti colpiti.
La stabilit di un agente la sua capacit a sopravvivere per tempi pi o meno lunghi al di fuori
dell'ospite. Talvolta viene detta anche resistenza. Gli agenti poco stabili nell'ambiente vengono
detti labili. Ovviamente la stabilit di un agente dipende molto dalle condizioni ambientali
(temperatura, umidit radiazioni UV ecc.) in cui esso si viene a trovare.
Le spore batteriche sono fra le forme di vita pi pi stabili conosciute, potendo rimanere vitali per
anni. Al contrario, alcuni virus (es. alcuni coronavirus dell'uomo) resistono soltanto poche ore.
Riassumendo:
333
da notare qui sopra sono state esposte le "classiche" definizioni di infettivit, virulenza e stabilit,
mutuate dalla microbiologia e che si riferiscono pi all'interazione tra un agente ed un; singolo
animale che a una popolazione.
Attenzione a non confondere l'infettivit con il concetto di morbosit, la quale invece misura la
proporzione di ammalati sul totale di animali che possono contrarre quella malattia.
Per un dato agente, la virulenza viene definita come la capacit di moltiplicarsi nell'ospite e di
indurre malattia e lesioni. Anche in questo caso si tratta di una definizione riferita al singolo
334
ESEMPIO. Il virus della rabbia provvisto di alta infettivit, alta patogenicit ed alta virulenza.
Infatti, gli individui che vengono esposti al virus (es. morsicati da un cane rabido [nota la
terminologia: rabido, NON rabbioso!]) quasi certamente si infettano; inoltre, tutti quelli che si
infettano vanno incontro a malattia e tutti gli ammalati muoiono.
da notare che una elevata virulenza non necessariamente associata ad una maggiore diffusibilit
dell'agente nella popolazione: infatti, un agente molto virulento provoca la morte dell'ospite un
breve tempo, e questo riduce la probabilit che l'agente si trasmetta ad altri ospiti recettivi.
ESEMPIO. Le leptospire, agenti di malattia in diverse specie animali, sono poco stabili in ambiente
secco. Il virus del vaiolo molto stabile e, al riparo dalla luce solare diretta, pu conservare
l'infettivit per anni. Le forme vegetative di Bacillus anthracis (l'agente del carbonchio ematico)
sono relativamente labili, mentre le spore dello stesso batterio (e le spore batteriche in genere) sono
fra le pi resistenti forme di vita note.
335
12. Trasmissione
e mantenimento delle infezioni
12.10 Diffusione delle infezioni ed efficienza del contatto
OBIETTIVO
sottolineare il ruolo di alcune variabili riguardo al contatto tra animali infetti ed animali sani
L'efficienza del contatto descrive le condizioni che facilitano l'instaurarsi dell'infezione nel singolo
animale e la sua diffusione a livello di popolazione.
Per una particolare infezione, l'efficienza dipende dalla stabilit dell'agente, dalle vie di escrezione
da parte dell'ospite infetto e dalla via di penetrazione nell'ospite suscettibile.
Riguardo alla durata, il contatto pu essere assai breve oppure prolungato. La durata della
contagiosit determina il numero dei suscettibili che vengono infettati da un singolo soggetto
infetto. Quindi, ad esempio, le infezioni virali dell'apparato respiratorio superiore hanno in genere
una contagiosit breve (giorni) mentre bovine affette da TBC possono essere escretrici del bacillo
col latte per anni.
Anche il comportamento degli animali pu condizionare l'efficienza del contatto. Esempio tipico
quello della rabbia, nel senso che animali per natura timidi e schivi, quando sono colpiti da rabbia
tendono ad avvicinarsi all'uomo ed appaiono addirittura mansueti. Ci incrementa la possibilit di
contatto dell'uomo con il virus.
12. Trasmissione
e mantenimento delle infezioni
12.11 Vie di infezione
OBIETTIVO
La sede o le sedi attraverso le quali un agente penetra nell'ospite sono dette vie di infezione e
sono riassunte schematicamente nella seguente figura. In essa l'organismo rappresentato come un
modello di forma sferica nel quale vengono evidenziate le possibili vie di penetrazione di un agente.
Notare che le mucose dell'apparato respiratorio, digerente e genitale vengono considerate come
superfici corporee, in quanto sono tutte a contatto pi o meno diretto con l'ambiente esterno.
Fra le vie riportate nel modello, quelle pi frequentemente utilizzate da agenti infettivi o parassitari
sono: la via respiratoria, la via digerente, la via cutanea.
337
VIA ORALE
La via orale una delle pi comuni, specialmente in relazione ai microrganismi con habitat
intestinale che spesso vengono eliminati dall'ospite infetto con le feci. Agenti quali rotavirus,
salmonelle e molti parassiti gastrointestinali possono contaminare acqua ed alimenti, che agiscono
quindi come fomiti.
Nel caso in cui gli agenti ingeriti vengano escreti con le feci, si parla di ciclo oro-fecale.
Gli agenti che penetrano per via orale possono essere disseminati dall'ospite infetto attraverso una
variet di vie, oltre a quella fecale.
ESEMPIO. L'infezione da Brucella abortus nel bovino avviene pi spesso per via orale, ma l'agente
viene poi escreto col latte o con le secrezioni uterine al momento del parto o dell'aborto.
I bassi valori di pH gastrico rappresentano una efficiente barriera alla trasmissione di questo tipo
per numerosi agenti.
VIA RESPIRATORIA
E' un altro frequente metodo di trasmissione per molti agenti infettivi. Gli agenti raramente si
presentano come singole particelle in sospensione nell'aria, ma sono invece inglobati in materiale
organico sotto forma di goccioline o polvere. La natura e le dimensioni di queste particelle
influenzano la loro dispersione e stabilit. Negli animali l'aria inspirata viene sottoposta a filtrazione
(seni nasali, turbinati ecc.) e, se questo sistema ben funzionante, raramente le particelle sono in
grado di raggiungere le vie respiratorie profonde (alveoli polmonari). Pertanto, almeno inizialmente,
l'infezione si instaura a carico delle vie aeree superiori.
Le infezioni che si trasmettono per via respiratoria si verificano con maggiore probabilit in
presenza di un'elevata densit di popolazione e di scarsa ventilazione. Queste condizioni si
riscontrano frequentemente nell'allevamento intensivo di diverse specie animali.
ESEMPIO. Escherichia coli nel pollo pu provocare una vasta gamma di malattie (artrite, sinovite,
oviduttite, onfalite ecc.). Tuttavia, nell'allevamento intensivo del broiler, la forma pi comune
quella respiratoria
338
In condizioni ambientali estreme, possono venire trasmesse per via respiratoria malattie che assai
raramente lo sono in condizioni normali.
ESEMPIO. Il virus della rabbia si trasmette normalmente attraverso il morso di animali infetti.
Tuttavia, stata dimostrata la possibilit acquisizione della malattia per via respiratoria dopo
permanenza in caverne nelle quali si erano insediate colonie di pipistrelli.
La cute integra una efficace barriera per la maggior parte degli agenti infettanti; fra i
microrganismi, soltanto pochi (es. leptospire) possono oltrepassare la cute integra o macerata da una
lunga permanenza in acqua. Alcuni parassiti, e particolarmente gli stadi immaturi di alcuni
nematodi e trematodi, possono penetrare attraverso la cute intatta (es. Schistosoma e Ancylostoma).
Al contrario, sulla cute lesionata da tagli o abrasioni possono instaurarsi numerose infezioni che
rimangono localizzate (es. infezioni da Staphylococcus aureus). Altri agenti, possono indurre una
infezione generalizzata, con o senza localizzazione al punto di ingresso.
Un'altra importante forma di infezione percutanea quella derivante dal morso di vertebrati o dalla
puntura di artropodi.
Agenti che sono presenti nella saliva (virus della rabbia) possono essere trasmessi attraverso
morsicature. Non sono da dimenticare le numerose malattie infettive o parassitarie trasmesse dalla
puntura di artropodi.
Nonostante poche malattie possano essere trasmesse attraverso la cute integra, numerosi agenti
possono invece infettare le mucose integre. Ci vale, in particolare, per gli agenti che sono labili
nell'ambiente esterno e che richiedono, ad esempio, un contatto sessuale diretto (Tripanosoma
equiperdum nel cavallo).
339
12. Trasmissione
e mantenimento delle infezioni
12.12 Modalit di trasmissione
OBIETTIVO
INGESTIONE
Pu verificarsi attraverso veicoli meccanici (fomiti), per esempio acqua contaminata, o ingestione
di ospiti intermedi (cisti di cestodi nella carne).
Gli agenti ingeriti, dopo la replicazione e lo sviluppo, vengono solitamente escreti con le feci,
originando un cosiddetto ciclo fecale-orale. Per alcuni agenti, l'escrezione avviene
esclusivamente per via fecale, in quanto l'infezione localizzata al solo tratto intestinale (es.
paratubercolosi del bovino).
Altri agenti, una volta assunti per ingestione, possono invadere il torrente circolatorio ed essere
escreti, oltre che per via fecale, anche per vie addizionali come l'urina o le secrezioni respiratorie
(es. virus della peste bovina).
INALAZIONE
immediate vicinanze dell'individuo infetto. Questa zona viene detta cono espiratorio.
Molto diversa trasmissione per aerosol, che comporta la formazione di particelle molto piccole e
che, quindi, sedimentano molto lentamente e sono facilmente veicolate dalle correnti d'aria. In
questo caso, possibile la trasmissione a lunga distanza.
Propriamente, per aerosol si intende una sospensione colloidale di particelle molto piccole (1-
1000 nanometri o nm) liquide o solide (fase dispersa) in un gas (fase disperdente). Pertanto, con il
termine aerosol si pu anche indicare una sospensione di particelle virali, mentre i batteri non
possono formare aerosol in quanto hanno dimensioni maggiori (>1000 nm) rispetto a quelle
colloidali.
Le dimensioni delle particelle e la distribuzione dei flussi nelle vie aeree consentono di prevedere in
quale regione anatomica avverr il deposito. In linea di massima ed a titolo di esempio, si pu
affermare che, nell'uomo:
le particelle di diametro superiore a 10 micrometri sono intercettate a livello delle vie aeree alte
quelle comprese fra 5 e 10 micrometri si depositano preferibilmente fra la faringe e la V/VI
diramazione bronchiale
quelle di 1-5 micrometri raggiungono e si depositano a livello delle diramazioni bronchiali pi
periferiche
quelle di diametro <1 micrometro tendono ad essere riespirate
CONTATTO
La trasmissione per contatto quella che si verifica senza l'intervento di vettori o di elementi
esterni. E' particolarmente importante nel caso degli agenti che vengono eliminati attraverso le
superfici corporee (es. virus della malattia vescicolare o del vaiolo) e che penetrano nell'ospite
recettivo per via cutanea. Pochissimi agenti vengono trasmessi per autentico 'contatto'; in genere
necessario che sulla cute del ricevente ci siano delle soluzioni di continuo, anche microscopiche. La
trasmissione per contatto pu verificarsi anche attraverso morsicatura (rabbia) o graffio (es.
malattia da graffio del gatto).
INOCULAZIONE
l'introduzione dell'agente nell'organismo ospite attraverso puntura della cute o attraverso una
ferita.
La forma pi tipica di trasmissione per inoculazione avviene ad opera di artropodi che inoculano
l'agente per puntura della cute. (es. mosca tsetse per Tripanosoma, che si sviluppa nelle ghiandole
salivari ed intestino della mosca stessa). L'inoculazione talvolta rappresenta un caso particolare di
trasmissione per contatto (es. morsicatura di cane rabido, ossia affetto da rabbia).
TRASMISSIONE IATROGENA
ACCOPPIAMENTO
Esistono agenti che possono essere trasmessi durante il coito; alcuni si trasmettono soltanto in
questo modo e sono responsabili delle cosiddette malattie veneree, oggi pi comunemente
definite come malattie a trasmissione sessuale.
La trasmissione sessuale pu avvenire anche negli artropodi (es. virus della peste suina africana
che pu essere trasmesso dal maschio alla femmina di zecche del genere Ornithodoros).
342
12. Trasmissione
e mantenimento delle infezioni
12.13 Trasmissione a lunga distanza di agenti di malattia
OBIETTIVO
Attraverso i metodi schematizzati nella figura, le malattie infettive o parassitarie possono essere
trasmesse a lunga distanza per movimenti di animali, vettori e fomiti.
Fino a tempi non molto lontani, il trasporto di persone, animali o cose avveniva per vie terrestri
(carri, carovane) o marine. I viaggi a lunga distanza richiedevano settimane o mesi e ci
rappresentava, di per s, un buon provvedimento di quarantena. Infatti, durante il viaggio,
eventuali malattie in incubazione avevano modo di manifestarsi attraverso la comparsa di sintomi
clinici; in tal modo, esse venivano individuate e ci consentiva di adottare adeguati provvedimenti
sanitari.
L'incremento nell'uso del trasporto aereo ha incrementato la probabilit che animali con malattia
in incubazione possano giungere a destinazione in breve tempo e prima della comparsa dei sintomi.
Lo stesso problema ovviamente si verifica anche nel caso dell'uomo, i cui frequenti viaggi
rappresentano un rischio per la diffusione di malattie esotiche.
Non da dimenticare l'importanza delle migrazioni di intere popolazioni animali. Tipico esempio
quello di numerose specie di uccelli, che migrano stagionalmente in direzione nord-sud e viceversa.
Un altro sistema di trasmissione di malattie a lunga distanza quello che prevede l'intervento di
aerosol contenenti particelle solide molto piccole (2-1000 nm) dette nuclei essiccati, assai stabili
343
e capaci di essere veicolate a lunga distanza dalle correnti aeree. La formazione di questi nuclei
dipende in larga misura dalle condizioni ambientali (temperatura e umidit relativa). La pioggia
provoca la sedimentazione dei nuclei.
da sottolineare che anche i vettori (artropodi ecc.) possono essere veicolati accidentalmente a
lunga distanza con gli stessi mezzi di trasporto (aerei compresi) utilizzati per la movimentazione di
uomini o cose.
Infine, da citare la possibilit (remota ma temibile) che agenti di malattia vengano disseminati
attraverso somministrazione di prodotti (farmaci o vaccini) accidentalmente contaminati da un
agente patogeno.
ESEMPIO. Negli anni '70 comparve negli allevamenti di galline una malattia che provoca calo
dell'ovodeposizione (perci detta Egg Drop Syndrome '76) sostenuta da un Adenovirus. Si ritiene
che la malattia sia stata disseminata su scala mondiale dall'impiego di un vaccino nei confronti di
un'altra malattia aviare (malattia di Marek) accidentalmente contaminato dall'adenovirus in
questione che, a quel tempo - non era ancora noto.
344
12. Trasmissione
e mantenimento delle infezioni
12.14 Trasmissione delle malattie per via verticale
OBIETTIVO
Le malattie a trasmissione ereditaria sono legate al genoma di uno dei due genitori. Per esempio,
alcuni retrovirus (virus che hanno la capacit di integrarsi con il genoma dell'ospite) possono essere
trasmessi ereditariamente.
La trasmissione pu avvenire a vari stadi dello sviluppo embrionale o fetale oppure si pu avere
l'infezione del nascituro durante l'attraversamento del canale del parto.
L'infezione dell'embrione o del feto pu indurre aborto (se incompatibile con la vita) oppure
comparsa di deformazioni o mostruosit. Alternativamente, il neonato pu presentare una infezione
inapparente e continuativa (infezione innata), non accompagnata da alcun sintomo clinico.
Alcuni artropodi (soprattutto zecche ed acari) trasmettono batteri, virus e protozoi da una
generazione all'altra attraverso le uova (trasmissione transovarica).
ESEMPIO. Anaplasmosi bovina (malattia protozoaria, frequente nelle zone tropicali e sub-tropicali,
trasmessa da diverse specie di zecche). Babesiosi del cane (trasmessa da zecche del genere
Dermatocentor e Haemaphysalis).
345
Alcuni artropodi trasmettono l'infezione soltanto per via trans-stadiale, cio da uno stadio di
sviluppo all'altro.
ESEMPIO. Theileriosi, causata da protozoi del genere Theileria che infettano bovino, pecora e
capra e che sono trasmessi da zecche del genere Rhipicephalus.
346
12. Trasmissione
e mantenimento delle infezioni
12.15 Strategie di mantenimento dell'agente
OBIETTIVO
La trasmissione di un agente prevede momenti in cui l'agente nell'ospite, altri in cui l'agente si
trova nell'ambiente esterno o in un vettore. Dal punto di vista dell'agente, sia l'ambiente interno che
quello esterno all'ospite presentano dei rischi per la sopravvivenza.
L'ospite possiede una vasta gamma di meccanismi di difesa naturali: agenti chimici di superficie,
cellule difensive specifiche, fagociti, immunit umorale. Perch l'infezione abbia successo, l'agente
deve essere capace di sfuggire - almeno in parte - a questi meccanismi, ma deve anche superare la
competizione da parte di altri agenti che possono contemporaneamente competere per la stessa
nicchia.
Gli agenti hanno elaborato strategie diverse per resistere alle difese dell'ospite.
ESEMPI. Cuticola acido-resistente degli elminti, utile per resistere all'acido gastrico; localizzazione
intracellulare di virus e batteri per sfuggire all'immunit umorale; capsula, che protegge dalla
fagocitosi i batteri che la possiedono; mutazione della struttura antigene, per eludere le difese
immunitarie.
AMBIENTE ESTERNO
L'essiccamento non sempre letale, ma spesso inibisce la moltiplicazione dei batteri; stesso effetto
hanno le basse temperature.
Le alte temperature che si raggiungono nei climi temperati non sono - in genere - letali per gli
agenti, ma possono esserle nei climi tropicali.
Molti agenti sono parzialmente protetti dall'essiccamento in quanto sono eliminati con le urine o le
feci; essi possono persistere a lungo se pervengono in ambienti adatti. Ad es., le leptospire che
sopravvivono molto pi a lungo in terreni paludosi che in zone aride. Alcuni agenti sono
straordinariamente resistenti all'essiccamento (es. poxvirus del diftero-vaiolo aviare, che pu
sopravvivere per mesi nelle croste essiccate). Molti altri agenti possono resistere a lungo in
materiali inanimati nell'ambiente (fomiti) (es. salmonelle nei mangimi).
347
STRATEGIE DI MANTENIMENTO
Possono essere classificate nelle 5 categorie schematizzate nella figura soprastante e che vengono
brevemente descritte di seguito.
2) FORME DI RESISTENZA
Alcuni batteri (es. Clostridium e Bacillus) formano spore che resistono a lungo anche a temperature
superiori a 100 C e che possono "sopravvivere" nell'ambiente per decenni.
Una particolare forma di resistenza quella nei confronti degli antibiotici, basata su una
modificazione genetica del batterio. Questa resistenza rappresenta un grave problema terapeutico,
soprattutto delle malattie sostenute da alcuni generi batterici (Salmonella, Escherichia,
Staphylococcus) che pi spesso di altri presentano antibiotico-resistenza.
Alcuni elminti e protozoi (es. coccidi) originano forme di resistenza (cisti) che possono anche
proteggere l'agente dai meccanismi di difesa dell'ospite. Ad es., il protozoo Toxoplasma gondii pu
sopravvivere per anni in forma cistica all'interno dell'ospite.
348
3) RAPIDLY-IN, RAPIDLY-OUT
Alcuni agenti penetrano nell'ospite, replicano e lo abbandonano molto rapidamente, prima che esso
abbia avuto il tempo di attuare una risposta immune (o morire). Molti virus dell'apparato
respiratorio compiono un ciclo di questo tipo in sole 24 ore. Questa strategia condizionata dalla
disponibilit continua di ospiti recettivi. Ci potrebbe giustificare l'assenza di tali infezioni
(enteriche o respiratorie, come ad esempio quella sostenuta dal virus del raffreddore) in popolazioni
a bassa densit. Si ritiene anche che queste infezioni non fossero presenti nelle popolazioni
preistoriche.
4) PERSISTENZA NELL'OSPITE
Alcuni agenti possono persistere per lungo tempo nell'ospite, anche per tutta la vita. La persistenza
si verifica perch le difese dell'ospite non sono in grado di eliminare l'agente. Ci pu essere la
conseguenza del fatto che l'agente si "adattato" ai fagociti o ha sviluppato altre strategie per
sfuggire ai meccanismi immunitari. Fra questi meccanismi sono importanti l'immunodepressione e
la tolleranza.
con episodi intermittenti di malattia clinica o subclinica, durante i quali si ha escrezione del batterio.
In alcune infezioni l'escrezione pu essere continua (es. Leptospira hardjo nel bovino, escreta per
12-24 mesi). Il lungo periodo di contagiosit dell'ospite assicura all'agente la disponibilit di una
popolazione recettiva (dovuta alle nuove nascite).
Oltre che nell'ospite vertebrato, gli agenti possono persistere anche nel vettore artropode. Per es. il
virus della peste suina africana persiste nelle zecche fino ad 8 mesi. Inoltre, alcuni agenti possono
essere escreti dal vettore per lunghi periodi.
Molti agenti possono infettare pi di una specie. Ad esempio, l'80% dei microrganismi che infettano
l'uomo riconoscono anche altre specie ospiti. Un importante ruolo del veterinario proprio quello di
controllare queste malattie (zoonosi). Alcune infezioni sono inapparenti in alcuni ospiti, e ci
ne rende difficile il controllo. Es. Borrelia burgdorferi, l'agente trasmesso da zecche e che provoca
la malattia di Lyme nell'uomo ed in altri animali, provoca infezione inapparente anche in numerosi
mammiferi domestici e selvatici ed in uccelli.
350
13. Pattern di
malattia
13.1 Curve epidemiche e distribuzione spaziale delle malattie
OBIETTIVO:
apprendere come l'andamento di una malattia nel tempo possa essere rappresentato graficamente;
Abbiano detto pi volte che l'epidemiologia si occupa delle malattie in popolazioni. In questa ottica,
importante, pi che occuparsi della malattia nei singoli casi, osservarne l'andamento nelle
popolazioni, seguendone l'evoluzione sia nel tempo che nello spazio.
Le curve epidemiche
Una delle pi comuni forme di visualizzazione dell'andamento nel tempo di una malattia in una
popolazione rappresentazione attraverso un grafico, in cui il numero di nuovi casi ( incidenza) si
pone in ordinata ed il tempo in ascissa:
Il grafico che si ottiene dai dati raccolti durante una epidemia genera una curva epidemica (pi
correttamente rappresentata da un diagramma a barre). La curva epidemica fornisce indicazioni
preziose riguardo all'andamento di una epidemia, e pu contribuire a rispondere ad importanti
domande quali: qual stata la via di diffusione della malattia? quando si verificata l'esposizione
all'agente della malattia? quale stato il periodo di incubazione? si sono verificati dei casi
secondari?
L'andamento nel tempo della malattia, riprodotto dalle barre o dalla forma della curva, pu essere
utile anche per sviluppare ipotesi riguardo alla causa della malattia e alle sue caratteristiche
epidemiologiche, e per fare previsioni sull'andamento futuro.
Nella figura che segue rappresentato un esempio di andamento tipico di una curva epidemica di
una malattia trasmissibile (nella pratica non sempre la curva epidemica ha questo aspetto).
351
Si pu notare un andamento bi-modale: infatti la curva ha due picchi che testimoniano che la
malattia diffusiva. I primi casi formano la curva pi piccola (detta curva primaria);
successivamente essi contagiano altri individui della popolazione, che vanno a formare la curva
secondaria. Ovviamente si tratta di una rappresentazione schematica, e non sempre in natura pu
essere evidenziato un andamento simile a questo. Infatti, l'aspetto della curva dipende da numerose
variabili fra cui le pi importanti sono: via di escrezione e velocit di propagazione dell'agente
eziologico, densit della popolazione, proporzione di animali recettivi. Il lasso di tempo che separa
la curva primaria dalla secondaria corrisponde approssimativamente al periodo di incubazione
della malattia.
Fra le tante variabili che condizionano l'andamento di una malattia in una popolazione, alcune fra
le pi importanti verranno descritte in una prossima unit.
Sia chiaro fin d'ora, tuttavia, che una epidemia pu verificarsi ed estendersi soltanto in presenza di
una determinata densit minima di animali recettivi nel territorio. Questa densit minima detta
livello di soglia ed stata definita matematicamente nel Teorema della Soglia di Kendall.
La distribuzione spaziale
La rappresentazione spaziale di una malattia pu avere anche un altro scopo, e cio quello di
facilitare l'identificazione di concentramenti (cluster) di casi in determinate aree, con lo scopo di
identificare una causa di malattia. Una mappa di questo tipo gi stata descritta a proposito dello
studio delle epidemie di colera compiuto a Londra da John Snow nel 1849-53.
13. Pattern di
malattia
13.2 Il teorema della soglia di Kendall
OBIETTIVO:
La propagazione di una epidemia di una malattia che si trasmette per contatto condizionata
dall'esistenza di una densit minima di animali.
Il livello minimo di densit (livello di soglia) stato definito in un modello matematico detto
Teorema della Soglia di Kendall.
Nella figura illustrato il teorema con un esempio che si riferisce alla rabbia in una popolazione di
volpi. Al di sopra una certa densit di animali recettivi, una volpe ammalata pu infettare, in media,
pi di una volpe recettiva. Ci provoca un aumento progressivo del numero di volpi colpite dalla
malattia, e quindi ha origine una epidemia.
Pi elevata la densit degli animali, maggiore la probabilit, per una volpe ammalata, di riuscire
ad infettarne altre; quindi, pi ripida sar la fase di progressione della curva epidemica.
Al contrario, nel caso in cui ogni volpe rabida riesca a contagiare, in media, meno di 1 volpe
recettiva, si assister all'estinzione spontanea dell'epidemia. In uno scenario di questo tipo, il
numero di nuovi casi decresce col passare del tempo; inoltre, gli animali colpiti vengono a morte, e
quindi la malattia si esaurir in un tempo pi o meno lungo.
354
Il modello, cos come illustrato qui, molto schematizzato e non tiene conto di numerosi altri fattori
che, in alcune situazioni, possono influenzare la trasmissione della malattia all'interno di una
popolazione. Tuttavia, in casi particolari come quello della rabbia ora esemplificato, esso si
rivelato adeguato nel predire l'andamento della diffusione della malattia.
Purtroppo, pochi valori di soglia sono noti riguardo alle malattie degli animali; ad esempio, stato
calcolato che una densit minima di 12 cani/km2 necessaria perch possa comparire una epidemia
di una malattia virale del cane: la parvovirosi.
355
13. Pattern di
malattia
13.3 Andamento delle epidemie
OBIETTIVO:
illustrare un esempio di andamento tipico della diffusione di una malattia in una popolazione
Nello schema soprastante illustrato l'andamento di una tipica epidemia che si verifica quando un
agente infetta una popolazione costituita da animali pienamente recettivi.
Ogni cerchio rappresenta un animale infetto; le linee nere indicano l'avvenuto trasferimento
dell'infezione da un animale all'altro. I cerchi rossi rappresentano gli animali che riescono a
trasmettere il contagio ad altri animali. I cerchi blu simboleggiano gli animali che non sono riusciti
ad infettarne altri.
Durante il I periodo, la maggior parte della popolazione suscettibile (curva rossa), e quindi la
malattia ha modo di diffondersi facilmente negli individui della popolazione. Contemporaneamente,
si assiste ad un lieve incremento dell'immunit di popolazione, dovuta ai soggetti che si sono
infettati e successivamente si sono immunizzati; l'andamento dell'immunit di popolazione nel
tempo rappresentata dalla curva blu sull'asse cartesiano.
356
Nel grafico, le curve della immunit di popolazione e della recettivit di popolazione indicano la
proporzione di animali della popolazione che, in rapporto al tempo, risultano rispettivamente
immuni o suscettibili alla malattia.
In altre parole, la curva blu rappresenta il tasso di immuni e la curva rossa il tasso di recettivi.
Nel III periodo l'immunit di popolazione raggiunge il massimo livello. Il numero di contagianti si
fa via via pi basso, il numero di immuni pi, e quindi l'epidemia si esaurisce spontaneamente.
Il modello ora utilizzato semplicistico, in quanto presuppone una popolazione inizialmente del
tutto recettiva e tiene conto - in sostanza - soltanto della variabile immunit di popolazione.
Tuttavia, necessario ricordare che i fattori associati alla diffusione delle infezioni sono numerosi
ed interagiscono fra loro e con altre variabili ambientali, per somma o sinergismo, formando un
mosaico di grande complessit.
Fra i pi rilevanti, sono da ricordare alcuni fattori legati all'ospite ( recettivit, contagiosit, vie di
escrezione, periodo di incubazione), altri legati all'agente ( infettivit, virulenza, stabilit) ed,
infine, altri legati alla efficienza del contatto.
In alcuni casi, la frequenza della malattia ha un andamento temporale particolare, con fluttuazioni
abbastanza prevedibili. Nota che, in questi casi, non si tratta di epidemie, in quanto nel concetto di
epidemia insita la imprevedibilit dell'evento.
Le malattie che vengono trasmesse da punture di vettori (insetti e artropodi) hanno una forte
predilezione per i mesi caldi (estate ed inizio autunno) in corrispondenza con la maggiore attivit
dei vettori.
Anche malattie non trasmesse da artropodi o insetti possono manifestare un andamento stagionale,
come la leptospirosi nell'uomo in alcune aree geografiche: la frequenza della malattia subisce un
aumento in corrispondenza delle stagioni calde (estate-autunno). Ci dipende dalle caratteristiche
dell'agente e da motivi legati al comportamento dell'uomo, che durante la buona stagione buone
trascorre pi tempo all'aperto ed ha maggiori probabilit di infettarsi per contatto con animali
357
portatori.
Anche la malattia di Lyme, una malattia dell'uomo trasmessa da una zecca, viene di solito contratta
d'estate, quando le zecche sono pi attive e le persone trascorrono molto tempo all'aperto e senza
indumenti protettivi.
Nel diagramma che segue illustrato l'andamento stagionale della leptospirosi negli U.S.A.
In altri casi, le fluttuazioni avvengono in tempi pi lunghi. In tal caso si parla di andamento
secolare.
La registrazione della frequenza di casi di malattia in una popolazione per un lungo periodo (anni)
utile, oltre che conoscere meglio la storia naturale della malattia, anche per prevederne la probabile
incidenza futura e per pianificare i pi appropriati
programmi di controllo o prevenzione.
ESEMPIO.
Nell'uomo la epatite virale si manifestata fino al 1968
con cicli della durata di circa 7 anni.
Una spiegazione di questo fenomeno che la popolazione
va incontro a modificazioni della suscettibilit, e che
l'incremento della frequenza corrisponde ad un aumento
della recettivit. Poi, quando molti individui sono stati
infettati, si instaura una immunit di popolazione che
provoca un regresso della frequenza delle infezioni.
358
13. Pattern di
malattia
13.4 Epidemie a sorgente comune e a propagazione
OBIETTIVO:
In alcune situazioni, tutti i casi (intendendo per caso il singolo animale ammalato) hanno
origine da una stessa causa (es. un animale infetto o un alimento contenente un agente patogeno).
Una epidemia di questo tipo viene detta epidemia a sorgente comune.
Se il periodo di esposizione breve, allora l'epidemia con sorgente comune detta epidemia
puntiforme o, meno bene, puntuale (in inglese: point source), e tutti i casi si verificano,
all'incirca, entro un lasso di tempo corrispondente al periodo di incubazione. Tipiche epidemie a
sorgente comune e con breve periodo di incubazione sono le tossinfezioni o intossicazioni
alimentari che derivano dall'assunzione, da parte di una collettivit, di alimenti contaminati da
patogeni. Nell'uomo questo evento si pu verificare, ad esempio, in occasione di pranzi di nozze
oppure attraverso un alimento distribuito in una mensa.
Nel grafico viene appunto illustrato l'andamento di una epidemia originata da una tossinfezione
alimentare, in cui il periodo di esposizione alla causa breve (e corrisponde alla durata del pasto);
nell'esempio si vede come il periodo di incubazione corrisponda sia compreso fra 10 e 18 ore circa.
Tipicamente, tutti i casi di una epidemia puntiforme si verificano entro un lasso di tempo
corrispondente al periodo di incubazione dell'agente in causa.
359
Una epidemia a propagazione , invece, quella causata da un agente che viene escreto
inizialmente da uno o pi casi primari, e quindi si propaga nel tempo ad individui recettivi che
costituiscono casi secondari. Uno dei casi primari spesso il caso-indice, cio il primo che stato
notato dagli investigatori.
L'intervallo di tempo fra picchi di successivi picchi o grappoli (cluster) temporali di casi, che
separa i casi primari da quelli secondari, riflette il periodo di incubazione della malattia.
L'andamento delle curve epidemiche, all'interno di una popolazione definita e soggetta a variabili
note, pu essere descritto attraverso modelli matematici. Uno dei modelli di base pi noto quello
di Reed e Frost.
360
13. Pattern di
malattia
13.5 Il sistema informativo WAHID
OBIETTIVO:
Nella tua futura attivit professionale di medico veterinario, ti capiter sicuramente di dover
rispondere ad interrogativi riguardo:
alla presenza o all'assenza di una determinata malattia in una data regione o area geografica;
all'esistenza di eventi epidemiologici eccezionali;
al numero di casi di zoonosi osservati;
ai nominativi laboratori di referenza per la diagnosi di una specifica malattia;
ai focolai di malattia in corso;
alle misure di controllo adottate dagli Organismi preposti;
al confronto - a scopo commerciale - della situazione sanitaria di Paesi diversi;
ecc. ecc.
Le domande ora esposte interessano non soltanto i veterinari che si occupano di sanit pubblica o
quelli inquadrati nelle ASL oppure negli Istituti Zooprofilattici ecc., ma anche i professionisti
esercitano la clinica dei grandi o piccoli animali.
Ad esempio, il proprietario di un cane presentato per un controllo nel tuo ambulatorio, e che dovr
compiere un viaggio in Grecia e Turchia, potrebbe chiederti se in questi Stati presente la rabbia.
Dove trovare una risposta attendibile, come quella mostrata nella figura che segue? Lo apprenderai
in questa stessa unit!
.
361
Oggi possibile rispondere a tutte le domande elencate sopra (ed a molte altre riguardanti lo stato
sanitario delle popolazioni animali) ed ottenere le informazioni desiderate, aggiornate in tempo
reale e riguardanti tutto il mondo. Ci avviene attraverso l'interrogazione di un database dell'OIE.
Questa sigla deriva dalla denominazione "Office International des Epizooties" (www.oie.int): fin
dai primi anni del secolo scorso era emersa la necessit di combattere le malattie degli animali a
livello mondiale, e ci condusse alla creazione dell'OIE attraverso un accordo internazionale
firmato nel 1924. Nel 2003 l'"Office" ha cambiato la sua denominazione in quella attuale "World
organisation for animal health" (Organizzazione mondiale per la Salute Animale), mantenendo per
la storica sigla OIE.
L'OIE l'organizzazione intergovernativa responsabile del miglioramento della salute degli animali
in tutto il mondo, riconosciuta come organizzazione di riferimento da parte dell'Organizzazione
Mondiale del Commercio (OMC). Nel 2010 contava 177 Paesi membri.
A partire dal 2007, l'OIE ha reso disponibile l'interfaccia WAHID (World Animal Health
Information Database), che permette di interrogare un database mondiale di informazione
zoosanitaria, liberamente accessibile a partire dal sito dell'OIE oppure all'indirizzo
www.oie.int/wahid.
L'interfaccia WAHID consente di accedere a tutte le informazioni disponibili sulle malattie animali,
zoonosi comprese, segnalate da Paesi, suddivise per regioni, per mese e per anno. L'interfaccia
permette di ottenere anche moltissime altre informazioni, come ad esempio quelle sulla consistenza
delle popolazioni animali a livello nazionale o regionale, oppure mappe epidemiologiche che
descrivono la distribuzione delle malattie animali nel mondo, o ancora strumenti per comparare la
situazione sanitaria di Paesi diversi ecc..
E' impossibile descrivere a parole tutti i contenuti e le potenzialit di WAHID. Oltre tutto,
dilungarsi sulle potenzialit di WAHID sarebbe molto noioso. Ti consiglio di visitare il sito
WAHID: in una decina di minuti potrai renderti di persona che la quantit e la qualit delle di
informazioni disponibili sono davvero straordinarie.
Qui di seguito, soltanto a titolo di esempio, inserisco la sintesi dei risultati di qualche semplice
interrogazione.
362
14. Modelli
matematici
14.1 I modelli in epidemiologia
OBIETTIVO:
Proprio perch si tratta di una rappresentazione, il modello non pu includere ogni aspetto della
realt. Prima di creare un modello, necessario fare alcune assunzioni sulla struttura essenziale e le
correlazioni fra gli eventi (o gli oggetti) nel mondo reale.
Per esempio, uno studioso del comportamento potrebbe voler costruire
un modello riguardo al tempo necessario ad un topo per attraversare
un labirinto alla ricerca del cibo. Nella costruzione del modello si
potrebbero includere fattori diversi, come ad esempio il tipo di cibo
offerto, la preventiva conoscenza del labirinto da parte dell'animale, il
tempo trascorso dall'ultimo pasto. Altri fattori, ritenuti poco importanti
o ininfluenti ai fini della "struttura essenziale" del fenomeno da
studiare (es. il sesso del topo, l'ora del giorno in cui viene eseguito
l'esperimento ecc.) potrebbero invece essere esclusi dal modello.
I fattori, noti o ignoti, che non vengono inclusi nel modello (perch non sono presi in
considerazione, oppure sono ritenuti poco influenti o secondari) possono ridurre la capacit
predittiva del modello stesso, nel caso essi esercitino invece un influsso sul fenomeno in studio.
(modelli matematici) ancora pi facile: molto spesso sufficiente modificare il valore di una
variabile o di una costante, o ritoccare un'equazione, oppure modificare i dati di input ecc.
La creazione di un modello inizia con una attenta osservazione del fenomeno in studio e poi,
eventualmente, anche sulla sua manipolazione, osservandone gli effetti ed anche utilizzando il
metodo scientifico di falsificazione dell'ipotesi. Tutte le osservazioni vengono interpretate per
cogliere gli aspetti pi importanti del fenomeno, tralasciando quelli ritenuti marginali. Poi, si
costruisce il modello, lo si fa "funzionare" e si controlla se-e-quanto i risultati ottenuti
corrispondono con la realt. Infine, il modello viene riconsiderato e modificato per renderlo ancor
pi efficiente, e cos di seguito.
In epidemiologia i modelli fisici, ossia che riproducono in scala un qualche oggetto fisico (es. il
modellino di una scuderia o di una stalla) non vengono utilizzati. Ci si avvale invece dei cosiddetti
"modelli matematici". Un modello matematico un modello simbolico costituito da una equazione
(o una serie di equazioni) che prende in considerazione i diversi parametri che sono sono
coinvolti nella genesi e nella evoluzione del fenomeno studiato (in genere: la malattia).
Per mezzo del modello possiamo prevedere la diffusione nel tempo della malattia all'interno della
popolazione:
Ora perfezioniamo il modello, supponendo che la malattia sia capace di provocare la morte del 30%
degli animali colpiti entro 1 unit di tempo dopo l'infezione. Allora si verificher la seguente
situazione:
Adesso il numero di animali ammalati presenti in un dato istante t n all'interno della nostra
popolazione-modello pu venire calcolato come:
In epidemiologia i modelli sono costruiti per scopi diversi: ad esempio, prevedere l'andamento di
una malattia in determinate condizioni oppure prevedere l'effetto sulla prevalenza o
sull'incidenza qualora vengano adottare determinate misure di controllo. Un buon modello permette
di simulare "a tavolino" (o meglio: davanti al display di un computer) ci che avverr in natura (o
nell'allevamento) e quindi pu rappresentare un utilissimo strumento nello studio delle malattie.
369
In tempi recenti, modelli matematici sono stati utilizzati frequentemente per analizzare i rapporti
costi/benefici di azioni di profilassi di molte malattie degli animali.
Il rapporto costi/benefici deve essere sempre tenuto presente quando si effettuano azioni di
profilassi, controllo, eradicazione ecc. a tutti i livelli (dal singolo allevamento fino alle grandi
profilassi su scala nazionale).
Un intervento sanitario su popolazioni pu essere
efficace oppure
efficiente
Attenzione a non confondere questi due attributi, che non sono sinonimi. Infatti, dato un certo
intervento sanitario con un dato obiettivo, si dice che l'intervento "efficace" quando esso
"funziona", cio consente di raggiungere il risultato voluto. Un intervento "efficiente" invece
qualcosa di pi: esso consente di raggiungere il risultato voluto, ma utilizzando un dispendio
minimo di risorse.
Una azione sanitaria efficiente (e quindi "buona" sotto tutti gli aspetti), quando la somma dei costi
delle risorse impiegate (personale, laboratori, attrezzature, vaccini, farmaci, indennizzi agli
allevatori, restrizioni nel commercio ecc. ecc.) inferiore alla somma dei benefici ottenuti
(abbassamento della mortalit, aumento della produttivit, tutela della salute dell'uomo ecc. ecc.).
Insomma, efficienza significa ...massima resa, minimo sforzo!
Naturalmente, il rapporto costi/benefici dovr sempre essere inferiore ad 1; ci particolarmente
vero per i grandi piani su scala nazionale (es. brucellosi, tubercolosi ecc.) che assorbono risorse
ingenti e quindi comportano costi ingenti a carico della collettivit.
il modello costruito con "buon senso", ossia rispettoso delle conoscenze sulla storia naturale
della malattia?
il modello prende in considerazione tutti i determinanti che sono associati alla malattia?
a ciascuno dei determinanti considerati viene assegnata una importanza relativa adeguata? Il
valore di ciascun determinante gi noto, oppure pu essere stimato precisione accettabile?
previsioni fornite dai modelli. Tuttavia, essi possono essere molto preziosi se usati in aggiunta ai
metodi epidemiologici pi tradizionali (v. epidemiologia descrittiva e epidemiologia analitica).
I modelli matematici possono essere classificati in diversi modi. Una classificazione prevede la
suddivisione dei modelli in descrittivi o prescrittivi.
I modelli descrittivi sono quelli che forniscono una descrizione (o anche una previsione) del
funzionamento attuale (o futuro) di un fenomeno.
I modelli prescrittivi offrono informazioni utili per prendere decisioni al fine di influenzare
l'andamento di un fenomeno.
Dunque, un modello descrittivo descrive i meccanismi che sottostanno ad un fenomeno, mentre un
modello prescrittivo aiuta ad assumere una decisione (il minor costo, i migliori benefici ecc.).
logico supporre che nello studio di un fenomeno (es. una malattia) vengano dapprima messi a punto
modelli di tipo descrittivo e soltanto in un secondo tempo modelli di tipo prescrittivo.
Un altro tipo di classificazione, pi interessante ed attuale, riguarda la capacit dei modelli di tener
conto dell'effetto del caso e della variabilit dei dati di input. Su questa base i modelli possono
essere classificati come "deterministici" o "stocastici". Questo argomento viene trattato nella
prossima unit.
371
14. Modelli
matematici
14.2 Modelli deterministici e modelli stocastici
OBIETTIVO:
Una delle classificazioni pi attuali dei modelli matematici utilizzati nei diversi settori delle
Scienze, compreso quello dell'epidemiologia, prevede l'inquadramento nelle seguenti due tipologie:
1. modelli deterministici
2. modelli stocastici
I modelli deterministici sono i pi semplici; in essi, le variabili di input assumono valori fissi. E'
vero che i risultati (output) generati da questi modelli possono tener conto, entro certi limiti, della
variabilit e dell'effetto del caso (ad esempio, con appropriati metodi statistici possono essere
calcolati gli intervalli di confidenza); tuttavia, si tratta sempre di elaborazioni di tipo
deterministico, in quanto non si tiene in considerazione l'incertezza associata alle variabili di input.
L'ideale deterministico, tipico della cultura dell'era newtoniana, prevede che i fenomeni naturali
possano essere considerati in una logica basata sul presupposto che ogni evento sia ricollegabile ad
una causa che lo provoca. Sulla base di questo principio, formalizzato inizialmente da Laplace
(1749-1827), molti scienziati ritennero che, una volta noto lo stato iniziale di un sistema e le forze
agenti su di esso, fosse possibile individuare con precisione pressoch assoluta l'evolversi del
sistema applicando le leggi della meccanica newtoniana. Pertanto, si riteneva che fosse possibile,
almeno in via di principio, ottenere metodi di misura cos precisi da eliminare ogni
indeterminazione sui valori misurati.
Attualmente questo approccio stato abbandonato, in quanto incompatibile con il "principio di
indeterminazione di Heisenberg", a favore della concezione probabilistica introdotta dalla
meccanica quantistica.
Ovviamente i modelli stocastici sono anche pi affidabili in quanto, proprio perch tengono conto
del caso, sono capaci di fornire risultati pi aderenti alla realt.
372
Purtroppo non conosciamo con esattezza il valore di v 1 e v 2 , anche perch nel "mondo reale" questi
valori sono soggetti a variazioni. Abbiamo per elementi che testimoniano che v 1 pu oscillare fra
0.2 e 0.3 e che v 2 pu oscillare fra 0.4 e 0.6.
L'approccio deterministico molto semplice. Ad esempio, la cosa pi ragionevole potrebbe essere
quella di utilizzare come input del modello i valori medi di v 1 e v 2 per calcolare uno scenario
"medio"; alternativamente si potrebbero scegliere i valori estremi per calcolare il migliore o il
peggiore scenario. Si otterrebbero rispettivamente i seguenti valori di incidenza:
scenario medio: i 1 = 0.25 * 0.5 = 0.125 = 12.5%
scenario migliore: i 2 = 0.2 * 0.4 = 0.08 = 8%
scenario peggiore: i 3 = 0.3 * 0.6 = 0.18 = 18 %
Il limite del modello che fra le possibilit calcolate (migliore e peggiore) ve ne sono infinite altre
che, per quanto possiamo dedurre dal modello, sono tutte egualmente probabili.
L'approccio stocastico tiene invece conto della variabilit delle due variabili di input, i cui valori
potrebbero assumere - ad esempio - una distribuzione simile a quella indicata nei due grafici
sottostanti (generati con @Risk) ove le barre orizzontali sotto agli istogrammi indicano il 5 ed il
95 percentile.
373
Successivamente, il calcolo dell'incidenza viene effettuato attraverso una simulazione con il metodo
"Montecarlo". In pratica, il programma ha estratto a caso, tenendo conto delle suddette distribuzioni
di frequenza, un valore per v 1 ed un valore per v 2 . I due valori sono stati moltiplicati fra loro,
ottenendo un valore di incidenza. Questo processo di estrazione e moltiplicazione di coppie di
valori stato ripetuto per centinaia di volte, ottenendo centinaia di valori diversi di incidenza, che
sono stati utilizzati per generare la seguente distribuzione di frequenza.
Nota che il valore medio dell'incidenza (0.124) analogo a quello medio ottenuto con il modello
deterministico. Con il modello stocastico, si ha l'incomparabile vantaggio di poter prevedere - su
base probabilistica - l'intera gamma di possibilit di andamento del fenomeno in studio. Ad
esempio, dall'istogramma della distribuzione per incidenza si pu desumere che: (1) la probabilit
che l'incidenza sia <0.1023 del 5%; (2) la probabilit che l'incidenza sia >a 0.1488 del 5%; (3) la
probabilit che l'incidenza sia compresa sia compresa fra 0.1023 e 0.1488 del 90%.
374
14. Modelli
matematici
14.3 Il modello di Reed e Frost
OBIETTIVO:
acquisire una conoscenza di base del classico modello deterministico di Reed e Frost e
verificarne l'efficienza attraverso lo studio di una serie di esempi
L'aspetto di una curva epidemica in una epidemia a propagazione - all'interno di una data
popolazione - pu essere definito su base matematica, attraverso l'impiego di modelli. Uno dei
modelli di base pi famosi quello di Reed e Frost. Si tratta di un modello deterministico che oggi
assume un'importanza soltanto storica, via via che vengono messi a punto modelli pi sofisticati,
ma ha il pregio di essere facilmente comprensibile e quindi molto utile a scopo didattico per la
comprensione della intima "essenza" di un modello.
Il modello di Reed e Frost stato soggetto ad ampiamenti, affinamenti e modifiche.
Nella sua forma originaria pi semplice, che viene proposta qui a scopo didattico, prevede una
suddivisione della popolazione in 3 gruppi, comprendenti animali (1) infetti, (2) recettivi e (3)
immuni. Inoltre, previsto che ogni animale infettato si ammali (cio diventi un caso) e poi
guarisca e diventi immune (cio resistente ad una reinfezione). Perci questo modello rientra fra i
modelli detti "SIR" (Susceptible, Infected, Resistant).
Inoltre, il modello assume che: la malattia si trasmette con un'unica modalit; il periodo di
incubazione fisso; tutti gli animali si distribuiscono a caso nella popolazione e quindi sono
soggetti alla stessa probabilit di venire a contatto con animali ammalati; la popolazione chiusa
(non c' ingresso di animali dall'esterno); le condizioni rimangono costanti per tutta la durata
dell'osservazione.
Secondo il modello, l'andamento della curva epidemica e l'immunit di popolazione dipendono (a)
dal numero complessivo di individui che costituiscono la popolazione, (b) dal loro stato
(contagianti, recettivi ed immuni) e (c) dalla capacit della malattia di trasmettersi da un individuo
all'altro.
375
La durata dell'unit di tempo t viene di solito fatta coincidere con il periodo di incubazione o di
latenza.
Il valore q corrisponde a (1-p) dove p=probabilit, per un dato individuo, di avere un contatto
efficiente con un altro individuo, in modo che si verifichi infezione se l'uno era recettivo e l'altro
infettante. Il valore di p esprime una probabilit; esso quindi compreso fra 0 e 1. poich p la
probabilit di contrarre infezione, q (ossia (1-p)) la probabilit di non contrarre infezione.
Naturalmente il valore di p dipende da una variet di fattori e non facile da determinare. Di solito
p viene stimato empiricamente mediante osservazione di epidemie reali.
Supponiamo che inizialmente (tempo 0) la nostra popolazione sia costituita da 199 animali recettivi,
1 caso e 0 immuni. Pertanto
S t0 =199
C t0 =1
Supponiamo che la probabilit di avere un contatto efficiente sia pari a 0.06. Quindi
p=0.06
q=1-0.06=0.94
Al tempo t+1:
C t1 = 199(1-0.941)=12
S t1 =199-12=187
Al tempo t+2
C t2 =187(1-0.9412)=98
376
S t2 =187-98=89
e cos via.
Il numero di animali immuni a ciascun tempo il totale cumulativo degli animali infetti durante il
periodo precedente. Quindi al tempo t+1 il numero di animali immuni :
I t1 =1
al tempo t+2
I t2 =12+1=13
e cos via.
Nella figura sottostante sono riportati i dati ottenuti dal modello di Reed e Frost con i parametri in
esempio, per l'intera durata dell'epidemia.
Dall'esame del modello si evince che la probabilit che si verifichi un'epidemia e l'aspetto della
curva epidemica sono funzioni del contatto efficiente e del numero di animali recettivi.
La proporzione di una popolazione che risulta recettiva viene usata spesso come guida generale
della probabilit di diffusione di un'infezione. Si ritiene che - in genere e con larga approssimazione
- almeno il 20-30% della popolazione debba essere recettiva perch abbia luogo una epidemia. Ne
consegue che l'infezione non diffonder se il 70-80% della popolazione immune.
Questo utile a prevenire epidemie di grandi dimensioni, tuttavia, da notare che l'infezione potr
diffondere ugualmente, anche in presenza di una elevata immunit di popolazione, se il numero di
animali recettivi tale che
(p * St) > 1
Negli esempi che seguono sono riportate alcune curve epidemiche simulate su popolazioni
numericamente diverse ed utilizzando parametri diversi per il rapporto immuni/recettivi e per la
probabilit di contatto efficiente.
Foglio di calcolo per Microsoft Excel che fornisce una rappresentazione grafica di un modello di
Reed e Frost, con parametri che possono essere variati a piacere.
378
14. Modelli
matematici
14.4 Infezione da Neospora caninum nel bovino: un modello matematico
OBIETTIVO:
Per una migliore comprensione del modello, consigliabile conoscere gli elementi essenziali
dell'infezione. Vedi: L'infezione da Neospora caninum nel bovino: una breve sintesi
La presente unit didattica basata sul seguente lavoro: N. P. French, D. Clancy, H. C. Davison
and A. J. Trees - Mathematical models of Neospora caninum infection in dairy cattle: transmission
and options for control. International Journal for Parasitology, 1999, 29, 1671-1704.
Il documento full-text accessibile [solo per gli utenti dell'Universit di Parma - dominio: unipr.it]
in Internet via ScienceDirect nel formato HTML o nel formato PDF.
[Equazioni e dati utilizzati con il permesso degli Autori].
Il modello usa un sistema di equazioni differenziali per descrivere la trasmissione del parassita in
un allevamento di bovini da latte. Secondo quanto finora noto, l'infezione da Neospora canis nel
bovino possiede le seguenti caratteristiche peculiari:
Nella realt i fattori ora accennati semplificano l'andamento dell'infezione nella popolazione; perci
anche il modello pu essere semplice ed al tempo stesso efficiente. In questa unit didattica viene
illustrata soltanto una parte del modello deterministico descritto dagli Autori, i quali hanno creato
anche un pi complesso modello stocastico.
ro = tasso di natalit
In effetti, nel modello non si utilizza il vero tasso di natalit, ma bens il tasso con cui le manze
vengono aggiunte al gruppo delle bovine in lattazione (ro1 = manze infette; ro2 = manze non
infette). In UK i dati demografici degli allevamenti bovini da latte indicano che ro=0.2. Per
semplicit nel modello non si tiene conto del periodo intercorrente tra nascita e prima lattazione
(2-3 anni); ci consente di mantenere semplice il modello senza influenzarne apprezzabilmente
l'output.
mu = tasso di mortalit/riforma
Rappresenta il tasso annuo con cui le bovine vengono rimosse dal gruppo (mu1= bovine infette;
mu2= bovine non infette) perch muoiono spontaneamente (mortalit) oppure, molto pi
frequentemente, perch non pi produttive (riforma). In UK i dati demografici indicano che
mu=0.3.
In base ai dati disponibili, questa probabilit pari a 0.95 (si ritiene che da 100 vacche infette
nascano in media 95 vitelli infetti e 5 vitelli sani).
Anche questa poco conosciuta, e chiama in causa verosimilmente ospiti diversi dal bovino, come
ad esempio il cane.
Nel modello i parametri di natalit e di mortalit/riforma per gli animali infetti possono essere scelti
a piacere; poi, nella elaborazione dei dati, tali parametri vengono mantenuti fissi. Il tasso di
mortalit/riforma deve essere sempre superiore al tasso di natalit (mu1 > ro1), cos come avviene
in realt. Inoltre, per semplicit, si assume che la numerosit del gruppo resti costante; ci si ottiene
lasciando variare liberamente la crescita netta della popolazione non infetta:
ro2-mu2 = ((mu1-ro1)Y)/X
In termini matematici, lo schema sopra riportato viene espresso nella seguente forma:
viene aumentato per: (1) nascita di vitelli sani da vacche infette (per i quali la trasmissione verticale
non avvenuta) e (2) nascita di vitelli da vacche non infette
viene diminuito per (1) tasso di mortalit o riforma di animali sani e (2) avvenuta infezione per via
orizzontale
381
viene aumentato per (1) nascita di vitelli infetti da vacche infette e (2) infezione di animali sani per
via orizzontale
viene diminuito per mortalit o riforma di animali infetti
Il funzionamento e le previsioni che si possono trarre dal modello vengono meglio apprezzate
utilizzando il Foglio di calcolo per Microsoft Excel allegato a questa unit didattica. Qui di seguito
vengono riportati alcuni esempi di grafici (brevemente commentati) dell'andamento della
prevalenza in un allevamento in presenza di valori diversi dei parametri. I grafici sono stati generati
con il predetto foglio di calcolo.
382
383
384
Foglio di calcolo per Microsoft Excel che fornisce una rappresentazione grafica di alcuni aspetti
del modello di French e coll., con parametri che possono essere variati a piacere.