Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Alessandra Marinoni
Simona Villani
1
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
2
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
CAPITOLO I
3
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
4
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Uno dei principali contributi della statistica medica alla conoscenza dei fenomeni
biologici è quello di fornirci i metodi per analizzare la variabilità, scomponendola
nelle sue componenti di tipo:
- sistematico ossia quella parte di variabilità che possiamo attribuire ad una
causa (età, sesso, comorbidità, etc.), detta anche variabilità spiegata o
prevedibile;
- casuale ossia quella parte di variabilità che non riusciamo ad attribuire ad una
causa (è detta anche variabilità non spiegata, imprevedibile, e genericamente
“biologica”). Il fatto che due fratelli gemelli, apparentemente uguali possano
avere valori di altezza diversi, o che rilevazioni successive della pressione
arteriosa sistolica sullo stesso soggetto in tempi ravvicinati diano valori
diversi, etc. sembra logicamente inspiegabile.
In base alle sue funzioni, la statistica si può distinguere in:
a) statistica descrittiva il cui obiettivo è quello di riassumere i dati sanitari raccolti
calcolando le opportune statistiche descrittive e/o indicatori che in modo sintetico
descrivano il fenomeno studiato. La statistica descrittiva rappresenta sempre la
prima fase di qualsiasi ricerca, o può essere lo scopo di uno studio conoscitivo
esplorativo;
b) statistica inferenziale il cui obiettivo è quello di ricavare dallo studio condotto
leggi generali che si intendono estendere alla popolazione e/o ad altre situazioni
simili. I due momenti fondamentali sono:
- la stima dei parametri. Ad esempio lo studio antropometrico di un campione
di bambini maschi dai 6 ai 14 anni può consentire di stimare gli intervalli di
altezza entro cui dovrebbero collocarsi le altezze dei bambini della stessa
fascia di età e della stessa popolazione con un certo livello di probabilità
(intervallo di confidenza attorno alla media);
- la verifica di ipotesi. Lo scopo della statistica inferenziale è quello di stimare
la probabilità che le differenze osservate nei dati di gruppi diversi siano
interamente dovute a variabilità casuale piuttosto che a differenze della
sottostante popolazione di riferimento. Per capire la statistica inferenziale è
necessario introdurre il concetto di popolazione e campione.
5
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
CAPITOLO II
6
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
2.1.3 Il campione
Non potendo per ragioni pratiche condurre uno studio su tutti i soggetti della base di
campionamento (per ragioni di costi, di tempi ed anche etici), la statistica offre i
metodi per selezionare un sottoinsieme di tale popolazione, di numerosità limitata,
ma adeguata su cui si condurrà in pratica lo studio. Il processo di selezione si chiama
campionamento.
Selezionato il campione, ed effettuata la raccolta dei dati, prima di sottoporli alla
analisi occorre controllarne la qualità con gli opportuni metodi e quindi i dati validati
vengono sottoposti alle usuali elaborazioni di statistica descrittiva.
La fase successiva di stima dei parametri ed inferenza sulla popolazione sono molto
più ambiziose in quanto dall’analisi di un gruppo limitato di soggetti si ha la pretesa
di trarre conclusioni su tutta la popolazione. Tale processo è corretto solo se vengono
rispettate in modo rigoroso le regole di campionamento che la metodologia statistica
indica, e che si basano sulle leggi della probabilità (teoria del campionamento), la cui
trattazione esula dal livello di questo corso ma di cui è bene essere consapevoli. Il
processo si conclude con la estensione dei risultati trovati alla popolazione
campionata e da questa alla popolazione obiettivo.
In ciascuno di questi processi inferenziali si possono condurre errori di tipo logico
(bias) e pertanto occorre procedere con estrema prudenza e senso critico.
Se ad esempio i SERT di Pavia non offrissero alcune prestazioni (metadone, etc.)
alcuni tossicodipendenti potrebbero recarsi in altri servizi e quindi alcune tipologie di
soggetti sarebbero assenti dal nostro campione (errore di selezione o bias di
selezione).
8
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
9
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
10
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
11
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Per alcuni studi interessa conoscere l’opinione dei personaggi chiave, che si
ritiene in grado di fornirmi informazioni interessanti sull’argomento. La scelta
del campione è allora “ragionata” nel senso che è il gruppo di ricercatori che
decide chi scegliere per lo studio. A tale approccio si ricorre spesso negli studi
valutativi e di accreditamento dei servizi.
d) Campionamento accidentale.
Per studi esplorativi si ricorre a campioni occasionali su pochi casi: l’obiettivo è
spesso quello di messa a punto di metodologie di indagine.
Va sottolineato che i campioni non probabilistici non consentono la generalizzazione
come indicato nella figura a pagina 9.
13
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
CAPITOLO III
14
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
15
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
16
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Tale tasso tiene cioè conto del periodo di osservazione specifico per ogni
individuo della coorte. Va sempre specificato il periodo di follow-up
(anno, mese, etc.).
b) tasso di incidenza cumulato (IC): è una misura più semplice, che valuta
i nuovi casi di malattia sulla popolazione a rischio all’inizio dello
studio:
IC negli esposti
RR =
IC nei non esposti
17
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
MALATTIA
Sì No
Sì 15 285 300
FUMO
No 4 696 700
20 980 1000
18
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Casi Controlli
CASCO
Sì 30 80 110
No 70 20 90
100 100 200
19
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
tra i casi i soggetti senza casco sono il 70% mentre tra i sopravvissuti sono
solo il 20%. La misura di associazione appropriata è l’Odds Ratio (OR)
cioè il rapporto delle probabilità di esposizione tra i casi e la probabilità di
esposizione tra i controlli. Nell’esempio considerato l’esposizione è il ‘non
usare il casco’:
70 30 70 × 80
OR = = = 9,3
20 80 30 × 20
cioè il rischio di morire in un grave incidente è 9,3 volte più elevato in chi
non ha il casco rispetto a chi lo porta. L’Odds Ratio è una buona stima del
Rischio Relativo, soprattutto se la patologia è rara, perché i casi ed i
controlli siano tratti dalla stessa popolazione.
20
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
21
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
1) Osservazionali
a) descrittivi soggetti statistiche descrittive indici - studi pilota altissimo nessuna
comunità mortalità correlazioni - studi esplorativi (talora generazione
morbosità etc. di ipotesi)
b) analitici
b1) ecologici popolazioni correlazione ecologica - patologie rare alto generazione di ipotesi
gruppi - rend
2) Sperimentali
1) RCT (sperimentazioni soggetti trattamento-esito - valutazione efficacia trattamenti basso buona
cliniche controllate)
2) Trial sul campo soggetti intervento-comparsa di - valutazione efficacia interventi basso buona
malattia preventivi
3) Trial in comunità comunità intervento-comparsa di - valutazione efficacia interventi medio medio
malattia preventivi
22
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
CAPITOLO IV
23
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
24
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Così facendo altro non si determina che la distribuzione di frequenza assoluta di una
variabile, da cui si può ricavare quella relativa rapportando il conteggio di ogni
modalità al totale delle osservazioni fatte, e moltiplicando quest’ultima per 100 si
ottiene quella percentuale:
25
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
La frequenza cumulata percentuale alla classe [160-180) è pari al 15% e ci dice qual
è la percentuale di soggetti che presentano un valore di colesterolo ematico ‘fino a
180 mg/100ml’: infatti, si determina sommando la frequenza percentuale per la
classe [140-160) con la frequenza percentuale per la classe [160-180).
∑x i
x= i =1
26
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
e con la lettera greca µ (si legge mi) quando si tratta di una popolazione e in tal caso
si parla di parametro.
La mediana è il valore della variabile che divide esattamente a metà la serie ordinata
(in senso crescente o decrescente) delle osservazioni.
I percentili dividono la serie ordinata delle osservazioni in 100 parti, contenenti
ciascuna l’1% delle osservazioni. I più noti sono: il 25° percentile che lascia prima di
sé il 25% delle osservazioni e il 75% dopo, il 50° percentile che lascia il 50% prima e
il 50% dopo, il 75° percentile che lascia il 75% prima e il 25% dopo. Come si può
facilmente dedurre da quanto sopra detto il 50° percentile coincide con la mediana.
La moda è il valore che la variabile assume con maggior frequenza. Può esserci più
di una moda.
Il range è la differenza tra il valori massimo e il valore minimo osservati per una
certa variabile. Tale misura di variabilità tende però a diventare più grande
aumentando il numero di osservazioni e comunque non ci dice quanto siano
‘dispersi’ tra il massimo e il minimo i valori della variabile esaminata. Più utile
sarebbe allora determinare la distanza o scarto di ogni (i-esima) osservazione dalla
media e poi fare la media di queste distanze, così da determinare la distanza media:
∑ (x i − x)
n
Purtroppo però il numeratore di questo rapporto, cioè la somma degli scarti delle
osservazioni dalla media, è 0. Per ovviare a questo problema una delle possibilità è
l’elevamento a quadrato di ogni scarto, che porta sempre a valori positivi. La somma
di tali scarti elevati al quadrato è detta anche devianza. A questo punto sarà possibile
calcolare la media dei quadrati degli scarti intorno alla media che è la misura di
sintesi nota come
∑ (x − x)
2
i
Varianza =
(n − 1)
indicata solitamente con s2, nel caso di un campione, o con σ2 (si legge sigma), se si
tratta di popolazione. Al denominatore anziché n si può mettere (n − 1) ossia i gradi
libertà, ricordando così un solo modo per calcolare la varianza. I gradi di libertà è “il
numero di quantità indipendenti tra tutte quelle osservate, dove per quantità si
27
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
intendono gli scarti dalla media di tutte le n osservazioni”: tenuto conto il vincolo
che la somma degli scarti delle osservazioni dalla media è uguale a zero, noti (n − 1)
scarti si trova per differenza l’nsimo valore.
Come si deduce dalla stessa definizione, la varianza esprime i valori della
dispersione elevati al quadrato. Il modo per ritornare ad esprimere la dispersione
nella stessa unità di misura della media è estrarre la radice quadrata della varianza,
ossia:
s = 2 ∑ (x i − x)
2
(n − 1)
Così facendo si determina la cosiddetta deviazione standard, indicata con s o DS per
un campione, o σ se si tratta di popolazione.
Per meglio capire quanto sopra spiegato, consideriamo il seguente esempio: si
supponga avere un campione di 8 studenti di medicina da cui è raccolta
l’informazione sull’altezza 171, 168, 174, 172, 180, 175, 176, 177 (in cm). La media
dell’altezza è pari a 174,125 cm. Calcolando gli scarti di ogni osservazione dalla
media e sommandoli (seconda colonna), si otterrebbe zero.
xi x ( xi − x ) ( xi − x ) 2
168 − 174,125 = −6,125 37,516
171 − 174,125 = −3,125 9,766
172 − 174,125 = −2,125 4,516
174 − 174,125 = −0,125 0,016
175 − 174,125 = +0,875 0,766
176 − 174,125 = +1,875 3,516
177 − 174,125 = +2,875 8,266
180 − 174,125 = +5,875 34,516
0,000 98,878
Elevando al quadrato gli scarti tale problema si elimina (terza colonna), quindi la
varianza è
∑ (x i − x)
2
=
98,878
= 14,125429 cm2
n −1 7
e la deviazione standard sarà la sua radice quadrata pari a 3,76 cm.
Tornando al caso dell’esempio iniziale, nel campione esaminato di 500 individui per
la variabile colesterolo si avrebbe:
x = 203,56 µg/100ml; mediana=175 µg/100ml;
28
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Statura
fk
cm
[170.5-175.5) 10
[175.5-180.5) 12
[180.5-185.5) 19
[185.5-190.5) 10
[190.5-195.5) 6
57
29
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
[xj − xj+1) fk xk xk fk ( xk − x ) ( xk − x ) 2 ( xk − x ) 2 f k
[170.5-175.5) 10 173 173×10 − 9.12 83.1744 831.7440
[175.5-180.5) 12 178 178×12 − 4.12 16.9744 203.6928
[180.5-185.5) 19 183 183×19 0.88 0.7744 14.7136
[185.5-190.5) 10 188 188×10 5.88 35.5744 345.7440
[190.5-195.5) 6 193 193×6 10.88 118.3744 710.2464
Σ 57 2106.1408
173 ⋅10 + 178 ⋅12 + 183 ⋅19 + 188 ⋅10 + 193 ⋅ 6 10381
x= = = 182.12 cm
57 57
s2 =
∑ [( x k − x )2 ⋅ f k ]
=
2106.1408
= 37.6097 cm 2
n −1 56
s=
∑ [( x k − x)2 ⋅ fk ]
= 6.1327 cm
n −1
Risulta quindi una statura media di 182.12 cm, con una variabilità di 6.13 cm.
30
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Ciò significa che se in una ricerca si sono raccolti 100 valori di peso per un gruppo di
soggetti maschi di 18 anni di età, e la media è 71 Kg con una deviazione standard di
6 Kg, ho l’informazione che circa il 68% dei soggetti del campione ha un peso
compreso tra 65 e 77 chilogrammi, il 95% circa ha un peso compreso tra 59 e 83
chilogrammi, dato che la variabile peso è distribuita normalmente quando raccolta su
gruppi omogenei.
In Appendice A sono riportate le tavole della distribuzione o Curva Normale
Standardizzata.
31
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
5%
95%
3,84
Dalla figura sopra riportata si evince che, sotto l’ipotesi nulla vera, la statistica χ2
può assumere tutti i valori da 0 a +∞, ma la probabilità di trovare valori elevati è più
piccola che quella di trovarne di piccoli. È necessaria allora una regola di decisione,
che consenta di rendere operativo l’uso del test.
La comunità scientifica è d’accordo nel ritenere che valori del χ2 che hanno
complessivamente una probabilità di verificarsi di almeno il 95%, sono più
compatibili con H0 vera e quindi portano ad accettare H0. Valori del test che hanno
32
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
solo una probabilità di verificarsi del 5% o inferiore sono considerati troppo rari e
quindi meno compatibili con H0 vera: tali valori porteranno a rifiutare H0. È chiaro
che la decisione di rifiutare H0 non è scevra di rischi di errore, ma si è in grado di
quantificarlo in un p-value o P<0,05: pertanto la probabilità di errore che noi
commettiamo rifiutando H0 è inferiore al 5%. L’errore commesso quando si rifiuta
H0 è comunemente chiamato errore α o di I tipo. Ed ora qualche esempio.
33
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
dove O sono le frequenze osservate ed E quelle attese sotto H0 vera. Queste ultime si
ottengono semplicemente moltiplicando il totale di riga per quello di colonna e
dividendo per il totale generale. La frequenza dei pazienti vivi in trattamento sarà:
22 × 17
E1 = = 8,5
44
per differenza si possono facilmente ricavare tutte le altre frequenze attese e si
costruisce la tabella degli attesi:
χ =
2 (11 − 8,5)
2
+
(6 − 8,5)
2
+
(11 − 13,5)
2
+
(16 − 13,5)
2
=
8,5 8,5 13,5 13,5
= 0,74 + 0,74 + 0,46 + 0,46 = 2,4
4.3.3 Esempio di applicazione del test t di Student per confrontare due campioni
(test t per dati indipendenti)
Alcuni ricercatori sono interessati a conoscere se il livello medio di acido urico
serico di soggetti con Sindrome di Prader-Willi (gruppo 1) sia diverso da quello di
individui normali. Sono stati esaminati 12 soggetti con la sindrome e 15 senza
ottenendo i seguenti dati:
34
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
n x s
Gruppo 1 12 4,5 mg/100 ml 1 mg/100 ml
Gruppo 2 15 3,4 mg/100 ml 1,22 mg/100 ml
I due valori medi suggerirebbero che livelli di acido urico serico sono diversi tra i
soggetti con e senza Sindrome di Prader-Willi. Come visto per il caso precedente,
l’interesse è rivolto non solo ai 27 soggetti con la Sindrome, ma a tutti quelli che
presentano la stessa Sindrome (popolazione campionata). Di conseguenza, si deve
oggettivamente verificare se quanto osservato su un campione di individui sia
generalizzabile a tutta la popolazione (campionata) da cui esso è stato estratto.
Pertanto si formula l’ipotesi statistica:
H0 il livello medio di acido urico serico è uguale nei soggetti con e senza
Sindrome di Prader-Willi
e si individua il test statistico da utilizzare. Essendo l’outcome di interesse (livello di
acido urico serico) una variabile di tipo quantitativo, utilizziamo il test t di Student
per dati indipendenti (supponendo che le varianze siano uguali):
(x1 − x2 )
t=
1 1
s 2p +
n1 n 2
dove
(n1 − 1) s12 + (n2 − 1) s 22
s =
2
n1 + n 2 − 2
p
è la varianza pooled, ossia una stima congiunta delle varianze nei due campioni.
Con i dati rilevati nel campione esaminato, risulterebbe:
t=
(4,5 − 3,4) = 2,52
1 1
1,273504 +
12 15
Controllando sulle tavole della distribuzione t (Appendice C) nella colonna relativa a
α=0,05 per numero di gradi di libertà pari a n1+n2−2=25 si trova un valore pari a
2,06.
35
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
36
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
37
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
Sembrerebbe che non esista una buona associazione tra le due variabili dal momento
che la nuvola dei punti non si dispone idealmente come lungo una retta, ma tende a
disperdersi nel piano in modo disordinato. Infatti, calcolando il coefficiente di
correlazione con la seguente formula:
r=
∑ ( x − x )( y − y )
i i
∑ (x − x) ∑ ( y − y)
i
2
i
2
si ottiene un valore pari a 0,13 che indica una debole associazione diretta, essendo di
segno positivo. Il coefficiente di correlazione può assumere valore compreso tra –1 e
38
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
+1: valori negativi indicano associazione inversa o indiretta, ossia al crescere dei valori
della variabile sull’asse delle ascisse diminuiscono quelli della variabile sull’asse delle
ordinate. Quanto più il valore del coefficiente è prossimo allo zero, tanto più debole o
inesistente (=0) è la relazione, mentre più il valore del coefficiente è vicino a 1 (in
termine assoluto) maggiore sarà la relazione.
Qualora si volesse indagare una
dipendenza si dovrebbe calcolare la
regressione semplice usando
l’equazione:
Y = a + bx
dove a dicesi intercetta e b pendenza
della retta. Quindi si costruisce la
cosiddetta interpolata o linea di
tendenza:
39
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
APPENDICE
Le sperimentazioni cliniche
L’obiettivo di questi studi epidemiologici è quello di valutare l’efficacia di un
intervento terapeutico. Rappresentano il disegno di studio scientificamente più valido e
potente per la verifica di ipotesi, cioè per verificare la relazione tra trattamento e
modificazione dello stato di malattia. Schematizzando, si articola in 4 fasi:
− I° Fase: farmacologia clinica.
L’obiettivo è valutare sull’uomo un nuovo farmaco (di cui si è già provata la non
tossicità e l’efficacia in sperimentazione di laboratorio e su animali). In tale fase si
studia il metabolismo, la biotollerabilità, si stabilisce il dosaggio, etc. Viene
condotto su pochi soggetti (20-30 volontari sani).
− II° Fase: sperimentazione clinica iniziale dell’effetto del trattamento.
L’obiettivo è quello di verificare l’efficacia terapeutica e la tollerabilità, nonché le
modalità di somministrazione. Anche in questo caso lo studio è effettuato su pochi
casi (30-100 pazienti volontari).
− III° Fase: sperimentazione clinica randomizzata controllata.
L’obiettivo è quello di valutare l’efficacia del nuovo trattamento in modo
conclusivo, evidenziandone gli eventuali effetti collaterali. Si effettua su pazienti
secondo precise regole, che vedremo nel prossimo capitolo.
− IV° Fase: farmaco-vigilanza
Si tratta di studi post-marketing, che si effettuano dopo che il farmaco è entrato in
commercio per monitorizzare la sua efficacia a lungo termine, e la eventuale
comparsa di effetti collaterali.
40
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
41
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
42
Università degli Studi di Pavia
Dipartimento di Scienze Sanitarie Applicate e Psicocomportamentali
SEZ. DI EPIDEMIOLOGIA E STATISTICA MEDICA
valutazione dei fattori prognostici e dei confondenti, come trattare i punti di vista
(approccio pragmatico o approccio esplicativo), i problemi etici e come informare in
modo corretto il paziente, e così via, che sono spiegati nel protocollo della ricerca. La
trattazione di tali argomenti esula dal livello di questo corso.
43