Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Gabriele Manzi
Azienda U.S.L. di Bologna
GIMBE®
The Evolution of Health Care
Quality
Efficiency Effectiveness Improvement
GIMBE®
Evidence Based Medicine
David Sackett
GIMBE®
Evidence Based Medicine
What it is and what it isn’t
Research Patient
evidence preferences
Clinical
expertise
GIMBE®
Evidence Based Medicine
What it is and what it isn’t
Clinical
expertise
Health Care
Clinical state and
Resurces
circumstances
Clinical Governance
GIMBE®
ANATOMIA DELL’INFORMAZIONE
BIOMEDICA
RICERCA RICERCA FONTI
PRIMARIA SECONDARIA TERZIARIE
• Studi • Revisioni • Revisioni
Osservazionali Sistematiche tradizionali
• Studi • Linee Guida • Trattati
Sperimentali • Analisi • Editoriali
economiche • Parere degli
• Analisi decisionali esperti
GIMBE®
PREREQUISITI
GIMBE®
Come prendiamo le decisioni nella pratica
professionale?
• Scegliere tra due interventi assistenziali (quale
medicazione posizionare),
• Decidere la tipologia di paziente su cui
intraprendere un intervento (su quali pazienti
applico le strategie di prevenzione delle lesioni
da decubito),
• La tempistica delle prestazioni (ogni quanto
realizzare la medicazione di un CVC)
• Cosa e come comunicare con i pazienti e le loro
famiglie (comunicare il rischio di caduta),
• Come organizzare l’assistenza (modalità di
consegna)
• …
GIMBE®
Come prendiamo le decisioni nella pratica
professionale?
• Insegnamento scolastico
• Tradizioni/abitudini di reparto
• Esperienza
• Autoreferenzialità
• Prescrizioni di …
• Libri, riviste, …
• …
GIMBE®
Le conseguenze di ciò
GIMBE®
Un esempio:
da “Le basi scientifiche dell’assistenza infermieristica” di Paola di Giulio
GIMBE®
…una considerazione
“Meno del 20 % di ciò che i medici fanno ogni
giorno possiede almeno uno studio clinico ben
disegnato a sostegno della sua utilità.”
Cochrane A.L. ” Effectiveness and Efficiency. Random reflection on Health.
Service” Nuffield Provincial hospital trust, London, 1972.
GIMBE®
Le origini dell’evidence
based practice
GIMBE®
Archibald L. Cochrane
(1909-1988)
GIMBE®
Evidence-based Medicine: la storia 1972
GIMBE®
Evidence-based Medicine: la storia 1986
David Sackett
GIMBE®
Evidence Based Nursing
GIMBE®
Evidence = Evidenza ?
In Italiano
– È evidenza qualsiasi cosa che sia palese e
chiara, per la quale non è necessaria
qualsiasi ulteriore dimostrazione.
In Inglese
– È evidenza qualsiasi cosa che ha provato la
propria validità mediante il metodo scientifico.
È evidenza ciò che è stato dimostrato.
GIMBE®
Evidence-Based Nursing (EBN)
GIMBE®
Perché la ricerca
A
t • Individuare gli ambiti dove c’è variabilità
t
i • Dove c’è variabilità, c’è incertezza
v
i • Incertezza = area dove è necessario
t fare chiarezza
à
• Per fare chiarezza bisogna attivare la
c
l ricerca
i
n
• La ricerca è il motore che produce
i conoscenza quale riferimento per
c
a guidare la pratica professionale
Paolo Chiari - Centro Studi EBN
S.Orsola-Malpighi - Bologna
GIMBE®
Quando la ricerca e quando l’EBN
GIMBE®
Il processo dell’EBN
Avere chiaro rispetto ad un problema
assistenziale cosa voglio cercare, perché, e
quali risultati devo andare a misurare (aree
di incertezza)
Porre le proprie domande alle banche dati,
ricercando quelle che sono le conoscenze
scientifiche disponibili
Valutare criticamente i risultati
Applicazione delle conoscenze acquisite al
problema originario
GIMBE®
EBN – Strumento & Processo
GIMBE®
I limiti della EBM
GIMBE®
Le “aree grigie”: lo spazio dell’opinion based
RICERCA
Interventi Interventi
efficaci Area grigia inefficaci
PRATICA CLINICA
EBP
GIMBE®
I limiti dell’EBP nella realtà italiana
Necessità di acquisire nuove competenze
Mancanza di tempo
Scarsa attitudine a mettere in discussione le proprie
conoscenze e a generare quesiti clinico-
assistenziali.
Barriere linguistiche
Limitata diffusione/accesso agli strumenti informatici
(computer, internet)
Scarsa familiarità informatica
Resistenza al cambiamento
Scarsa disponibilità di riviste
GIMBE®
Le caratteristiche della
letteratura biomedica
GIMBE®
The Ascent of Evidence
(and the exhaustion of man)
GIMBE®
Le caratteristiche dell’informazione
biomedica
Crescita esponenziale:
circa 2.000.000 di articoli pubblicati ogni
anno in oltre 20.000 riviste
sino a 400.000 citazioni aggiunte
annualmente au MEDLINE
GIMBE®
Le caratteristiche dell’informazione
biomedica
Obsolescenza:
Progresso scientifico e tecnologico.
Ritardo nella disseminazione ed utilizzazione delle
conoscenze.
Frammentazione:
Articoli che trattano lo stesso argomento sono
pubblicati in riviste ed annate diverse.
Basso rapporto segnale/rumore:
La maggior parte della produzione scientifica è
irrilevante per la pratica clinica.
GIMBE®
WARNING !!!
Trials are conducted and published without a systematic
review of existing evidence, meaning that trials are
conducted unnecessarily or don't address the most
important questions
Results are selectively published with positive results
emphasised or published more than once, and negative
results are ignored
Trials favourable to sponsors are published in major
journals, and unfavourable trials are not published at all
or are published in minor journals
Smith R, Roberts I. Patient Safety Requires a New Way to Publish Clinical Trials. PLoS Clinical Trials (2006)1(1)
GIMBE®
WARNING !!!
Una ricerca effettuata su 3.600 ricercatori e 4.000
borsisti ha dimostrato che:
0,3% ha inventato o falsificato dati
6% non ha pubblicato dati che erano in contrasto con le
sue ricerche precedenti
15,5% ha cambiato il disegno della ricerca per
accontentare lo sponsor
4,7% ha pubblicato più volte gli stessi risultati
15,3% non ha utilizzato tutti i risultati ottenuti
Nature 2005; 435: 718-9
GIMBE®
EBN
Fasi del processo:
; Conversione del bisogno di informazione in
quesiti clinici ben definiti.
; Ricerca con la massima efficienza delle migliori
evidenze disponibili.
; Valutazione della loro validità ed applicabilità
clinica.
; Integrazione delle evidenze nella pratica clinica.
GIMBE®
Approcci di ricerca
GIMBE®
Gestione dell’informazione
SCANNING
cerco ciò che
sorveglianza
mi serve
SEARCHING
GIMBE®
SCANNING
Seleziono alcune riviste e le leggo in modo
regolare
•che cosa trovo?
– abstract
– full text
•problemi
– time consuming
– aspecificità
GIMBE®
SEARCHING
• Risorse primarie
– B.D. generali: Medline, Embase, …
– B.D. specialistiche: Cinhal, Pedro,
Joanna Briggs, …
• Risorse secondarie:informazioni predigerite
– B.D. revisione sistematiche: Cochrane
library, Joanna Briggs, …
– B.D. linee guida: New Zeland guideline
group, Sign, National Guideline
Clearinghouse, …
GIMBE®
IL QUESITO
ovvero
GIMBE®
Focalizzando la domanda si:
GIMBE®
FORMULARE DOMANDE PERTINENTI
ALLE QUALI SIA POSSIBILE
RISPONDERE
GIMBE®
I quesiti clinico-assistenziali
appartengono a due categorie principali
Background
Foreground
Conoscenza, esperienza
Modificato da: Guyatt GH, et al. AMA Press, 2001
GIMBE®
Perché ci interessa questa distinzione?
Per orientare diversamente la ricerca
Background questions
Sono i quesiti di base che vengono formulati nelle situazioni in cui
l'argomento è poco, o per nulla, conosciuto.
E' un "bisogno di informazione" caratteristico del giovane professionista.
Il professionista esperto, peraltro, formula quesiti di base quando la
malattia/condizione/tecnologia è:
– estranea al proprio settore professionale/specialistico
– di recente introduzione (tecnologia) o descrizione (malattia)
– rara
GIMBE®
Perché ci interessa questa distinzione?
Per orientare diversamente la ricerca
Foreground questions
Sono quesiti specifici, generalmente formulati dal
professionista esperto.
GIMBE®
Quando nasce un quesito di
foreground?
Categoria Quesito ed esempio
Qual'è la responsabilità eziologica del fattore di rischio X nell'insorgenza della malattia Y?
Eziologia/Rischio
L'utilizzo del telefono cellulare aumenta il rischio di neoplasia cerebrale?
Qual'è l’accuratezza del test diagnostico X (rispetto al gold-standard Y) nella diagnosi
della malattia Z?
Diagnosi
Qual'è l'accuratezza diagnostica della risonanza magnetica nucleare nei pazienti con
sospetta lesione del menisco?
Qual'è la storia naturale della malattia X e la potenza dei fattori prognostici?
Prognosi In un paziente con neurite ottica, quali sotto i fattori prognostici (favorevoli e sfavorevoli)
che condizionano l'evoluzione in sclerosi multipla?
GIMBE®
Quesito di foreground
formulare il quesito in modo preciso ed
articolato (es PICOM)
P patient
I intervention
C comparison
O outcome
M metodology
GIMBE®
Esempio di ricerca
GIMBE®
Trasformazione con PICOM
GIMBE®
PER OGNI DOMANDA UN DISEGNO
QUESITO DISEGNO DELLO STUDIO
• COORTE
EZIOLOGIA • CASO CONTROLLO
• REVISIONI SISTEMATICHE
• RCT
TRATTAMENTO
• REVISIONI SISTEMATICHE
GIMBE®
Quesito di foreground
Chiedersi:
Paziente “come descriverei un gruppo di pazienti
o simili al mio?”
problema
Bilanciare la precisione con la brevità
GIMBE®
Quesito di foreground
Intervento
Chiedersi
o
“Quale intervento principale/fattore di
esposizione
rischio sto prendendo in
(una causa, un considerazione?”
fattore prognostico,
un trattamento)
Essere specifici
GIMBE®
Quesito di foreground
Chiedersi
Intervento di “Qual’è la principale alternativa da
controllo comparare all’intervento prescelto?”
(se necessario
e/o possibile)
Essere specifici
GIMBE®
Quesito di foreground
Chiedersi
“Che cosa spero di ottenere?”
Outcome o
“Che cosa questo intervento può
realmente produrre?”
Essere specifici
GIMBE®
Quesito di foreground
Chiedersi
Metodology “Quale disegno di studio costituisce
il gold standard per il mio quesito?”
GIMBE®
Perché è importante chiarire bene il
quesito?
Per due motivi fondamentali:
– dal quesito vengono estratte le parole chiave
che useremo nella ricerca.
– dalla chiara espressione del quesito possiamo
definire i criteri di inclusione o di esclusione,
tra i quali capire quale tipo di studio dobbiamo
cercare.
GIMBE®
Esercitazione del quesito: diagnosi
Lavori come infermiere all’interno di un ambulatorio
di assistenza di base. Usi abitualmente diversi
strumenti validati per la diagnosi di depressione.
Una collega ti parla di uno strumento analogo, ma
composto da due sole domande, che secondo lei è
efficace per la individuazione della depressione
maggiore ed il cui uso, essendo così semplice,
permetterebbe di risparmiare molto tempo. Decidi
quindi di compiere una ricerca su diversi strumenti
per la diagnosi di depressione e sulle loro proprietà.
GIMBE®
Esercitazione del quesito
GIMBE®
Esercitazione del quesito: prognosi
GIMBE®
Esercitazione del quesito: prognosi
GIMBE®
Esercitazione del quesito: terapia
GIMBE®
Esercitazione del quesito: terapia
GIMBE®
Esercitazione del quesito: eziologia
Sei un infermiere territoriale. Una tua paziente è
una donna di 29 anni che ha assunto contraccettivi
orali negli ultimi 6 anni. Ti telefona per chiederti un
consiglio: è molto in ansia dopo avere letto che
l’assunzione degli estroprogestinici aumenta il
rischio di malattie cardiovascolari. Lei non ha mai
fumato, è in buona salute e non ci sono casi di
malattie cardiache nella sua famiglia. Chiede di
vederti per discutere se è il caso di sospendere
l’assunzione della pillola e passare all’uso di un altro
metodo anticoncezionale. Nel prepararti all’incontro
decidi di eseguire una ricerca.
GIMBE®
Esercitazione del quesito: eziologia
GIMBE®
GIMBE
®
THE END
GIMBE®
Evidence Based Practice
Gabriele Manzi
Azienda U.S.L. di Bologna
GIMBE®
Architettura della
ricerca clinica
Studi Epidemiologici
GIMBE®
ANATOMIA DELL’INFORMAZIONE
BIOMEDICA
RICERCA RICERCA FONTI
PRIMARIA SECONDARIA TERZIARIE
• Studi • Revisioni • Revisioni
Osservazionali Sistematiche tradizionali
• Studi • Linee Guida • Trattati
Sperimentali • Analisi • Editoriali
economiche • Parere degli
• Analisi decisionali esperti
Systematic reviews
Evidence Randomized
Controlled Mega Trial
Studies
Cohort Studies
Case Control Studies
Case Series
Case Reports
Ideas, Editorials, Opinions
• Studi osservazionali
–descrittivi
• case report
• case series
GIMBE®
Architettura della ricerca clinica
• Studi osservazionali
– Analitici
• Studi caso controllo
• Studi di coorte
–Con coorte parallela
»Prospettici
–Senza coorte parallela
»Prospettici retrospettivi
• Studi trasversali/cross sectional
GIMBE®
Quali sono?
QUESITO DISEGNO DELLO STUDIO
COORTE
STUDILONGITUDINALI DI COORTE
PROGNOSI
(SENZA COORTE CONCORRENTE)
STUDI TRASVERSALI DI CONFRONTO
INDIPENDENTE E CIECO CON IL GOLD
DIAGNOSI
STANDARD DIAGNOSTICO
REVISIONI SISTEMATICHE
RCT
TRATTAMENTO
REVISIONI SISTEMATICHE
GIMBE®
Come posso rispondere a questa
domanda?
Attraverso tre disegni di studio:
studi trasvesrale/cross sectional
studi caso controllo
studi di coorte
GIMBE®
Studio Cross Sectional
GIMBE®
Studio Cross Sectional
GIMBE®
Studio Caso-Controllo
GIMBE®
Studio di Coorte
Fattori di
rischio sì
End point
Fattori di
rischio no
GIMBE®
Studi osservazionali analitici
esposti outcome +
CASI ESPOSTI
non esposti outcome -
Soggetti
dello studio
esposti outcome +
CONTROLLI NON ESPOSTI
non esposti outcome -
direzione dell’osservazione
GIMBE®
Individuare i bias
In uno studio il termine bias si riferisce a
qualsiasi errore sistematico che porti ad
una stima errata dell’associazione tra
l’esposizione e l’esito.
In uno studio osservazionale i puù
frequenti bias che possiamo incontrare
sono:
– Information bias
– Recall bias (studi caso controllo)
– Selection bias
– Fattori di confondimento
GIMBE®
Information bias
GIMBE®
Information bias
GIMBE®
Recall bias
GIMBE®
Esempio :
confronto tra
quanto riferito dai
pazienti e quanto
rilevato dalla
documentazione
clinica.
GIMBE®
Esempio:
confronto tra
quanto riferito dai
pazienti e quanto
rilevato dalla
documentazione
clinica.
GIMBE®
Selection bias
I soggetti selezionati devono essere identici ad
eccezione dell’esposizione all’agente eziologico.
Quando questo non si realizza siamo in presenza
del SELECTION BIAS.
In uno studio caso controllo, in cui si parte da due
gruppi con e senza l’esito, cosa accadrebbe se si
fossero scelte solo persone non esposte al reale
agente eziologico?
In uno studio di coorte, l’allocazione alla condizione
di esposizione si riferisce allo sviluppo dell’esito (o
nei due gruppi ci sono altre differenze non
considerate)?
GIMBE®
Follow up
GIMBE®
Se nel compimento di uno studio è stato
effettuato un bias i suoi risultati possono
essere definitivamente compromessi.
Gli studi di coorte da questo punto di vista
sono più sicuri per qul che riguarda
l’information bias o il recall bias, ma non
sempre sono realizzabili (condizioni rare o
a lentissimo decorso).
GIMBE®
Errors in epidemiological studies
Error
GIMBE®
Fattori di confondimento
GIMBE®
Fattori di confondimento
Esposizione Esito
Fattore di
confondimento
GIMBE®
Fattori di confondimento
GIMBE®
Fattori di confondimento
GIMBE®
Accorgimenti in fase di
campionamento
GIMBE®
Accorgimenti in fase di analisi
Regressione.
Si tratta di un’elaborazione statistica che
ricalcola le associazioni tenendo conto
dell’effetto delle variabili di
confondimento.
®®
GIMBE
GIMBE Centro Studi EBN - Bologna
Esempio
Esiste una relazione tra il sesso maschile
e l’insorgenza delle lesioni da decubito?
Lo studio di Margolis e al, rispetto al
genere maschile e le lesioni da decubito,
presenta un rischio relativo non adattato
pari a 0,78, (CI 95% 0,70-0,88), quindi per
gli uomini esisterebbe il 22% in meno di
rischio di sviluppare lesioni da decubito.
GIMBE®
Esempio
Tuttavia, considerando i fattori potenziali
di confondimento, quali l’età e le
patologie concomitanti, il rischio relativo
diventa 1,01 (CI 95% 0,89-1,15).
Quindi, cosa si può concludere?
GIMBE®
Misure di associazione
GIMBE®
Tabellare i dati
Evento Sì Evento No
Gruppo E a b a+b
Gruppo C c d c+d
a+c b+d
GIMBE®
Esempio ipotetico
GIMBE®
Esempio ipotetico
GIMBE®
Misure di associazione
GIMBE®
Interpretazione
GIMBE®
Intervallo di confidenza (IC)
GIMBE®
Ipotesi nulla
GIMBE®
I risultati sono validi?
GIMBE®
Significatività statistica
GIMBE®
Per ogni quesito un disegno di
studio ideale
QUESITO DISEGNO DELLO STUDIO
COORTE
EZIOLOGIA CASO CONTROLLO
REVISIONI SISTEMATICHE
STUDI LONGITUDINALI DI COORTE
PROGNOSI (SENZA COORTE CONCORRENTE)
GIMBE®
Ricerca sanitaria
Systematic Review
Evidence Randomized
Controlled Mega Trial
Studies
Cohort Studies
Case Control Studies
Case Series
Case Reports
Ideas, Editorials, Opinions
• Studi sperimentali
– Non controllati
– Controllati
• Non randomizzati
• Randomizzati
GIMBE®
Popolazione e campione
GIMBE®
Campione
GIMBE®
Campione
Un campione statisticamente
rappresentativo deve essere
sufficientemente numeroso, omogeneo e
scelto a caso.
GIMBE®
Campionamento casuale
Per ottenere delle informazioni attendibili su una
popolazione utilizzando un campione, è
necessario che il campione sia ottenuto in modo
casuale.
Perché un campione possa essere considerato
casuale, è indispensabile che ogni membro della
popolazione in oggetto abbia la stessa
probabilità di essere selezionato.
Un campione non casuale non dà alcun
affidamento: in altre parole tutte le inferenze da
esso tratte non sono da prendersi sul serio.
GIMBE®
Campionamento casuale
Al fine di realizzare un campionamento
casuale occorre ricorrere alla
randomizzazione.
Essa può essere realizzata in diversi modi:
– Randomizzazione semplice
– Randomizzazione stratificata
– Randomizzazione a grappolo
– Randomizzazione sistematica
GIMBE®
Architettura della ricerca clinica
• Studi sperimentali
– Non controllati
– Controllati
• Non randomizzati
• Randomizzati
GIMBE®
Trial Randomizzati Controllati
Esposizione
Outcome
Gruppo
sperimentale
No outcome
Campione
di Randomizzazione
popolazione
Outcome
Gruppo
controllo
No outcome
Esposizione Outcome
GIMBE®
Anatomia Outcome
dell’RCT
No
Gruppo Sperimentale Outcome
Outcome
No
Gruppo di Controllo Outcome
GIMBE®
La cecità per vedere bene
Singolo cieco: solo il soggetto sotto sperimentazione non
sa quale trattamento sta ricevendo
Doppio cieco: sia il soggetto sotto sperimentazione che
gli sperimentatori non sanno quale trattamento si
assume/somministra
Doppio simulato: metodica utilizzata per mantenere la
cecità quando si confrontano farmaci somministrati per
vie diverse tra di loro
In aperto: sperimentazione senza cecità. Accettabile
quando si confrontano terapie diverse e/o complesse
GIMBE®
La cecità per vedere bene
GIMBE®
Trial Randomizzati Controllati
I RCTs rappresentano lo standard sperimentale per valutare
l'efficacia dei trattamenti, grazie alla loro capacità di
minimizzare i bias rispetto ad altri disegni sperimentali
Questa assicura che tutti i fattori prognostici - sia noti che non
conosciuti - vengono equamente distribuiti nei due gruppi di
pazienti, tra i quali l’unica differenza risulta essere l’intervento
terapeutico in studio.
GIMBE®
Trial Randomizzati Controllati
Se lo studio è condotto ed analizzato in maniera adeguata,
l’eventuale differenza di esiti tra i due gruppi può essere
attribuita all’effetto del trattamento in studio.
GIMBE®
Fasi degli studi sui
farmaci
Da dove nascono gli RCTs
GIMBE®
Fasi degli studi farmacologici
GIMBE®
Fasi degli studi farmacologici
GIMBE®
Necessità di ricorrere
agli RCTs
Ma è proprio indispensabile
confrontare i risultati di due
gruppi?
GIMBE®
Trial non controllati
GIMBE®
Trial non controllati
Esposizione:
Pazienti eleggibili Intervento Outcome
sperimentale Follow up
GIMBE®
Trial non controllati
GIMBE®
L’effetto totale del trattamento è la somma
del miglioramento spontaneo, delle risposte
aspecifiche e della risposta specifica
Effetto placebo
Aspettative ottimistiche
Effetto Hawthorne
Miglioramento spontaneo
GIMBE®
Effetto placebo
GIMBE®
Apettative ottimistiche
GIMBE®
Effetto Hawthorne
GIMBE®
Trial non controllati
GIMBE®
Parachutes reduce the risk of injury
after gravitational challenge, but their
effectiveness has not been proved
with randomized contolled trials.
As with many interventions intended to prevent ill
health, the effectiveness of parachutes has not been
subjected to rigorous evaluation by using randomised
controlled trials.
Advocates of evidence based medicine have criticised
the adoption of interventions evaluated by using only
observational data.
We think that everyone might benefit if the most
radical protagonists of evidence based medicine
organised and participated in a double blind,
randomised, placebo controlled, crossover trial of the
parachute.
GIMBE®
Mega-Trial
GIMBE®
Dai trial clinici ai mega-trial
Magnesio nell’infarto miocardico
Razionale: variazione nell’andamento di patologie cardiache in funzione
della quantità di magnesio nell’acqua
Studi su animali hanno mostrato l’attività antiaritmica, antiaggregante e
coronarodilatatrice del magnesio
Piccoli trials positivi sull’uso del magnesio nell’infarto
Una review informale dei risultati ha mostrato una riduzione della
mortalità da IMA (infarto acuto del miocardio)
Una meta-analisi formale su 1300 pazienti con un totale di 78 decessi
ha mostrato una riduzione del 55% nel rischio di morte (p=0.001)
Studio LIMIT-1 su 100 paz. - diminuzione delle aritmie (1986)
Studio LIMIT-2 su 2300 paz. - diminuzione dell’incidenza di insuff.
ventricolare sinistra (1994)
GIMBE®
Il mega-trial ISIS-4 (1995)
Risultati
Il captopril previene 5 morti su 1000, i nitroderivati e il
magnesio sono inefficaci
GIMBE®
Lancet, 1995 Mar 18;345(8951):669-85.
GIMBE®
Trial controllati non randomizzati
Sono caratterizzati dalla presenza di un gruppo
di pazienti di controllo, i cui esiti vengono
confrontati con quelli del gruppo dei pazienti
trattati
L'assegnazione dei pazienti all'uno o all'altro
gruppo avviene con una delle seguenti
procedure:
‐ controlli paralleli (contemporanei)
‐ controlli storici
‐ controlli da banche dati
GIMBE®
I limiti comuni a tutti i CCTs sono:
• lo sbilanciamento dei fattori prognostici tra i due
gruppi di pazienti
• la tendenza ad assegnare al trattamento
sperimentale i pazienti a prognosi più favorevole
• la sovrastima dell'efficacia del trattamento
sperimentale, accentuata nelle CCTs con controlli
storici dal miglioramento delle condizioni assistenziali
Per tali ragioni le CCTs, non dovrebbero più occupare
alcun ruolo nella moderna ricerca clinica (vedi Consort
Statement II)
Costituiscono a tutti gli effetti una frode scientifica
Copyright © - GIMBE®
Cosa dobbiamo sapere
quando leggiamo gli
RCT
Dove può essere
l’imbroglio?
GIMBE®
Bias negli RCTs
• Benchè costituiscano gli studi più rigorosi,
in essi la presenza di errori sistematici
(bias), compromette la credibilità e
l’autorevolezza dei risultati.
• I più comuni bias possono essere:
– bias di selezione
– bias di accertamento
– bias di violazione del protocollo
– bias di pubblicazione
– bias temporali
GIMBE®
Selection bias
• Accade quando gli outcome di uno studio
sono influenzati dalle differenze
sistematiche (reali e non casuali) dei due
gruppi di studio, che dipendono dalle
modalità con cui le persone sono state
selezionate a partecipare al trial o con cui
sono state assegnate ai due gruppi.
• La prevenzione di questo tipo di bias si
realizza con una corretta
randomizzazione.
GIMBE®
Selection bias
• Se uno studio è realmente randomizzato,
l’allocazione ai gruppi non può essere
influenzata dai ricercatori o dai
partecipanti allo studio.
• Con la randomizzazione a tutti i
partecipanti dello studio sono date le
stesse opportunità di essere assegnati ad
ognuno dei gruppi di studio.
GIMBE®
Ascertainment bias
• Questo tipo di bias accade quando i risultati o le
conclusioni di un trial sono distorte dalla conoscenza
relativa all’intervento a cui ogni partecipante è stato
sottoposto. Questo tipo di errore può essere
determinato da chi eroga l’intervento, dai soggetti
studiati, dai ricercatori che valutano o analizzano gli
outcome e coloro che scrivono l’articolo descrivente
il trial.
• Il miglior modo per evitare questo bias è mantenere
le persone, coinvolte nello studio, non a conoscenza
dell’identità dell’intervento il più a lungo possibile,
realizzando quella che è detta CECITA’.
GIMBE®
Bias di violazione di protocollo
Lost to follow‐up (persi al follow up)
Withdrawal (sospendono il trattamento)
Crossover (passano all’altro gruppo)
GIMBE®
Bias di violazione di protocollo
GIMBE®
Follow up
GIMBE®
Follow up
• Dato che studiare solo coloro che sono rimasti
nello studio può portare a sovrastimare
l’efficacia del trattamento, gli autori dello studio
devono riportare nelle conclusioni tutti coloro
che erano stati reclutati, assegnando ai
soggetti persi del gruppo di trattamento l’esito
peggiore ed ai soggetti persi del gruppo di
controllo l’esito migliore.
• In questo caso il rischio è di sottostimare
l’efficacia del trattamento, il che è sicuramente
più accettabile del contrario.
GIMBE®
Follow up
GIMBE®
Publication bias
• Alcune evidenze dimostrano la probabilità
di trovare pubblicato uno studio, non è
casuale ma dipende dalla direzione e dalla
forza dei risultati della ricerca, per cui i
lavori con risultati statisticamente
significativi (positivi) sono pubblicati con
maggiore facilità rispetto a quelli con
risultati non significativi.
• Questa tendenza, che appare favorire i
trials con risultati positivi, è stata chiamata
pubblication bias.
GIMBE®
Publication bias
Uno studio randomizzato sulla lorcainide
(antiaritmico di classe I), dove si osservava un
aumento di morti fra i pazienti trattati, non
venne pubblicato per 13 anni.
Negli anni 80 questi farmaci causarono fra
20.000 e 70.000 morti premature negli USA
GIMBE®
Publication bias
Lo studio VIGOR che ha promosso il VIOXX è
stato pubblicato nel novembre 2000 sul New
England Journal of Medicine
Bombardier C. et al. “Comparison of upper gastrointestinal toxicity of rofecoxib and naproxen in patients with
rheumatoid arthritis.” VIGOR Study Group. N Engl J Med. 2000 Nov 23;343(21):1520-8
GIMBE®
Publication bias
GIMBE®
Publication bias
GIMBE®
Publication bias
Nel maggio del 2006 il Wall Street Journal
informa che l’editore del NEJM era già a
conoscenza nell’agosto 2001 della
manipolazione.
La ditta produttrice del VIOXX (Merck) aveva
acquistato nel novembre 2000 per la campagna
pubblicitaria 900.000 ristampe dell’articolo del
NEJM per circa 700-830.000 $
Il profitto per il NEJM si aggirava intorno ai
500.000$
Smith R. “Lapses at the new England journal of medicine.” J R Soc Med. 2006 Aug;99(8):380-2
GIMBE®
Bias temporali – Time lag bias
• Questo tipo di errore accade in quanto la velocità di
pubblicazione dipende dalla direzione e dalla forza
dei risultati del trial. In generale sembra che uno
studio con risultati negativi impieghi il doppio del
tempo per essere pubblicato rispetto ad uno con
risultati positivi.
• Inoltre possono passare anni dal momento in cui lo
studio è stato completato a quello in cui è
pubblicato, tanto che il tempo per realizzalo sembra
uguale a quello necessario per pubblicarlo e ciò
riguarda allo stesso modo gli studi grandi e gli studi
piccoli.
GIMBE®
Possiamo quindi fidarci della
generalizzabilità degli RCTs?
In letteratura sono segnalati alcuni aspetti che
devono portarci a considerare gli RCTs
sempre con spirito critico. In particolare
sono segnalati:
– Popolazioni estremanente selezionate
(Gurwitz JH. Jama 1992).
– Competenza, motivazioni e condizioni
organizzativo-assistenziali ideali (Grilli R. Et
al, Il Pensiero Scientifico Editore,1995).
GIMBE®
Possiamo quindi fidarci della
generalizzabilità degli RCTs?
GIMBE®
End point
End point
Trattamento End point surrogato
rilevante
Encainide, Flecainide,
Moricizina: extrasistolia extrasistolia mortalità
ventricolare post-IMA (1)
Milrinone: insufficienza
portata circolatoria mortalità
eardiaca (2)
GIMBE®
Misure di efficacia negli
RCTs
GIMBE®
Misure di efficacia
GIMBE®
Esempi
o
Cullen l, et al. Nebulized lidocaine decrease the discomfort of nasogastric
tube insertion: a randomized, doubleblind trial. Ann Emerg Med 2004; 44:
131-7.
La somministrazione di lidocaina nebulizzata prima dell’inserimento
del sondino naso gastrico riduce il disagio del paziente?
P: Adulti da sottoporre a posizionamento del SNG in pronto
soccorso.
I: nebulizzazione di lidocaina nella narice da utilizzare.
C: nebulizzazione di soluzione fisiologica.
O: disagio misurato attraverso una scala visuale analogica (misura
continua), difficoltà di inserimento del sondino (misura continua),
complicanze (sanguinamento, vomito, impossibilità di passaggio,
dispnea – misure discrete).
GIMBE®
Esempi
o Differenza
Outcome Lidocaina Placebo
(IC 95%)
Disagio riferito
(media dei
punteggi della 37.7 59.3 26.6 (5.3 a 38.0)
scala visuale
analogica)
Difficoltà
percepita
dall’infermiere 2 2 0 (-1 a 1)
nell’inserimento
del SNG
Sanguinamento
nasale
17% 0 17% (3,5-31)
GIMBE®
Misure di efficacia per gli esisti discreti
Evento Sì Evento No
Gruppo S a b a+b
Gruppo C c d c+d
a+c b+d
GIMBE®
Misure di efficacia per gli esisti discreti
GIMBE®
Misure di efficacia per gli esisti discreti
GIMBE®
Misure di efficacia per gli esisti discreti
GIMBE®
Il difetto di RR e OR
GIMBE®
Misure di efficacia per gli esisti discreti
GIMBE®
I difetti di RRR e ARR
La RRR è di nuovo una misura relativa,
che non ci dà idea della frequenza, e
quindi dell’importanza, dell’evento
negativo.
Al contrario ARR è proprio espressione di
questa misura, ma essendo un numero
decimale non è facile da ricordare.
Per questo motivo la misura che rende al
meglio l’importanza clinica
dell’associazione tra trattamento ed
outcome è il NNT.
GIMBE®
Misure di efficacia per gli esisti discreti
GIMBE®
Un esempio reale
Trivedi DP, Doll R, Khaw KT. Effect of four montly oral
vitamin D3 supplementation on fracutres and mortality in
men and women living in the community: randomised
double blind controlled trial. BMJ 2003; 326:469-72.
La somministrazione di un integratore di Vitamina D3 per
via orale riduce l’incidenza di fratture negli anziani (65-
85) residenti al domicilio?
P: anziani residenti al domicilio.
I: somministrazione di un integratore di Vit D3.
C: somministrazione di un placebo.
O: Incidenza di fratture e mortalità da tutte le cause.
GIMBE®
Gruppo Frattura Non N. Tot. Riduzione relativa del
intervento frattura rischio = di quanto si
Trattamento riduce il rischio nel gruppo
sperimentale 119 1226 1345 sperimentale?
Riduzione assoluta del
Trattamento
controllo 149 1192 1341 rischio = differenza (%) fra
controllo e sperimentale
GIMBE®
Un esempio reale
HELSINKI HEART STUDY
New England Journal of Medicine 1987;
317:1237-45
RCT a doppio cieco della durata di 5 anni sulla riduzione del rischio di
malattie coronariche con la somministrazione di gemfibrozil.
GIMBE®
Studio A: 10.000 pazienti per gruppo; EER= 0,1 (10%); CER=0,2
(20%); RRR= 0,5 (50%)
Studio B: 10.000 pazienti per gruppo; EER= 0,01 (1%); CER=0,02
(2%); RRR= 0,5 (50%)
Studio C: 10.000 pazienti per gruppo; EER= 0,001 (0,1%); CER=0,002
(0,2%); RRR= 0,5 (50%)
ARR
Studio A: 0,1 (10%); Studio B: 0,01 (1%); Studio C: 0,001 (0,1%)
NNT
Studio A: 10 soggetti; Studio B: 100 soggetti; Studio C: 1000
soggetti
GIMBE®
La curva gaussiana
GIMBE®
Intervallo di confidenza (IC)
GIMBE®
Intervallo di confidenza (IC)
L’intervallo di confidenza (IC) fornisce la
misura della precisione dei risultati di una
ricerca, così da poter trarre deduzioni sulla
popolazione da cui sono tratti quei pazienti.
Per convenzione si è stabilito che la
precisione dell’intervallo di confidenza sia al
95%, lasciando sempre un piccolo - 5% -
margine di errore dovuto al caso.
GIMBE®
Intervallo di confidenza (IC)
GIMBE®
Intervallo di confidenza (IC)
GIMBE®
Ipotesi nulla
GIMBE®
Ipotesi nulla
GIMBE®
Ipotesi nulla nei parametri discreti
Se questo valore
è 1, il rischio o la
Parametro Valore nullo probabilità di
incorrere
RRR, RR, OR 1 nell’evento
avverso sono
ARR 0 Uguali, sia che
si faccia il
NNT Infinito trattamento o meno
GIMBE®
Ipotesi nulla nei parametri continui
GIMBE®
Significatività statistica
GIMBE®
Significatività statistica
GIMBE®
Significatività statistica
Viene deciso dei ricercatori che indicano il
livello di significatività statistica stabilito.
Il livello di significatività per convenzione è
0,05. Si conclude cioè che una differenza non
è dovuta al caso se “p” è uguale o inferiore a
0,05.
Nel caso i ricercatori vogliano darsi una
maggiore rigorosità statistica possono portare
tale valore soglia a 0,01.
GIMBE®
Significatività statistica
GIMBE®
Significatività statistica
La significatività statistica non è l’unico criterio utile per
decidere se utilizzare i risultati di uno studio. La
significatività statistica dipende dalla numerosità del
campione e dall’entità dell’efficacia del trattamento
(differenze degli esiti). Differenze clinicamente
irrilevanti possono divenire statisticamente significative
se le dimensioni dei campioni sono sufficientemente
grandi. Al contrario, differenze clinicamente rilevanti
possono essere statisticamente non significative se i
campioni sono troppo piccoli (in gergo statistico, se lo
studio manca di potenza statistica).
GIMBE®
Randomized Controlled
Trials - Critical Appraisal
GIMBE®
Critical appraisal
GIMBE®
Critical appraisal
1. Validità interna
2. Rilevanza clinica
3. Applicabilità
4. Consistenza
GIMBE®
Validità interna
E’ diretta funzione del rigore metodologico seguito dai
ricercatori nelle fasi di:
pianificazione e conduzione dello studio
analisi dei risultati
GIMBE®
Validità interna
A. I risultati dello studio sono validi?
Domande preliminari
Lo studio si basa su una domanda di ricerca
chiaramente formulata?
– Una domanda di ricerca è chiaramente formulata se sono
indicati la popolazione studiata, l’intervento erogato,
l’outcome considerato
Gli autori hanno utilizzato il tipo giusto di
studio?
– Deve esserci coerenza tra il disegno dello studio ed il
quesito.
GIMBE®
Validità interna
GIMBE®
Validità interna
GIMBE®
Critical appraisal
1. Validità interna
2. Rilevanza clinica
3. Applicabilità
4. Consistenza
GIMBE®
Rilevanza clinica
Misura, oltre la significatività statistica, l’entità e la
precisione dei risultati dello studio
Corrisponde alla fase di analisi dei risultati
Gli elementi che influenzano la rilevanza clinica sono
diversi per gli studi di:
• trattamento
• diagnosi
• eziologia e prognosi
GIMBE®
Rilevanza clinica
Studi di eziologia e prognosi
‐ Rilevanza clinica del danno o fattore prognostico
‐ RR (studi di coorte), OR (studi caso‐controllo)
‐ Ampiezza limiti di confidenza
Copyright © - GIMBE®
Rilevanza clinica
Studi su trattamenti
‐ Rilevanza clinica dell’end‐point (surrogato vs
significativo)
‐ NNT
‐ Ampiezza limiti di confidenza
GIMBE®
Rilevanza clinica
GIMBE®
Critical appraisal
1. Validità interna
2. Rilevanza clinica
3. Applicabilità
4. Consistenza
GIMBE®
Applicabilità
E’ il grado con cui i risultati dello studio possono essere
applicati al paziente individuale
Sinonimi: validità esterna, generalizzabilità
E’ condizionata da:
criteri di selezione dei pazienti: inclusione, esclusione
setting assistenziale: aspetti strutturali‐organizzativi,
tecnologie, “competence” professionale
descrizione accurata e completa delle modalità di
erogazione degli interventi sanitari
GIMBE®
Applicabilità
GIMBE®
Internal validity
(efficacy)
Explanatory Pragmatic
RCTs RCTs
Generalizzability
(effectiveness)
Ideal Routine
condition clinical practice
GIMBE®
Critical appraisal
1. Validità interna
2. Rilevanza clinica
3. Applicabilità
4. Consistenza
GIMBE®
Consistenza
Si riferisce al fatto che i risultati di uno studio vengano
confermati da altri studi
Sinonimi: riproducibilità della ricerca
Lo strumento ideale per verificare la consistenza della
ricerca è rappresentato dalle revisioni sistematiche con
meta‐analisi di più studi
I risultati dello studio sono Risultati validi, ma irrilevanti: end
points surrogati, NNT elevato, ampi
clinicamente rilevanti? no
limiti di confidenza
sì
I risultati dello studio sono Risultati validi e clinicamente
no rilevanti, ma non applicabili nel mio
applicabili? contesto assistenziale
sì
Best evidence for patients
GIMBE®
GIMBE
®
THE END
GIMBE®
Evidence Based Practice
Gabriele Manzi
Azienda U.S.L. di Bologna
GIMBE®
Clinical state, setting Patient
and circumstances preferences
Clinical
expertise
GIMBE®
“…E’ causa di grande preoccupazione constatare
come la professione medica non abbia saputo
organizzare un sistema in grado di rendere
disponibili e costantemente aggiornate, revisioni
critiche sugli effetti dell’assistenza sanitaria”
GIMBE®
ANATOMIA DELL’INFORMAZIONE
BIOMEDICA
RICERCA RICERCA FONTI
PRIMARIA SECONDARIA TERZIARIE
• Studi • Revisioni • Revisioni
Osservazionali Sistematiche tradizionali
• Studi • Linee Guida • Trattati
Sperimentali • Analisi • Editoriali
economiche • Parere degli
• Analisi decisionali esperti
• revisioni tradizionali
• revisioni sistematiche
GIMBE®
Narrative reviews vs Systematic reviews
GIMBE®
Narrative reviews
GIMBE®
Systematic reviews
GIMBE®
Narrative vs Systematic Review
Caratteristica Revisione Revisione
narrativa sistematica
Focalizzate su problemi
Domande Molto vasta
clinici
Qualitativa/quantitativa
Sistesi Qualitativa
*meta-analisis
GIMBE®
Systematic reviews
GIMBE®
Systematic reviews
Processo di sviluppo delle RS
GIMBE®
Systematic reviews
Componenti essenziali del processo
Definizione del quesito
Strategia di ricerca
Definizione dei criteri di
inclusione/esclusione
Valutazione qualità degli studi
Estrapolazione dei dati
Analisi dei dati
GIMBE®
GIMBE®
Quesito
GIMBE®
GIMBE®
Definizione dei criteri di
inclusione/esclusione
Database
Ricerca manuale
Ricerca bibliografica
Contatti con i ricercatori
Ricerca di letteratura non pubblicata
GIMBE®
Elementi per la strategia di ricerca
GIMBE®
GIMBE®
Valutazione della qualità degli studi
GIMBE®
GIMBE®
Sintesi dei dati
GIMBE®
Sintesi dei dati
GIMBE®
GIMBE®
Systematic reviews critical appraisal
GIMBE®
Systematic reviews critical appraisal
GIMBE®
Meta-analisi
GIMBE®
Systematic review Æ analisi metodologica
GIMBE®
***
Revisioni sistematiche
(quantitative)
GIMBE®
Meta-analisi
GIMBE®
Antmann EM, et al. JAMA 1992
GIMBE®
GIMBE®
The
Cochrane Library
GIMBE®
Cochrane Collaboration
GIMBE®
Cochrane Library
• Rappresenta la prima fonte di consultazione se il
“bisogno d’informazione” riguarda l’efficacia dei
trattamenti
• Tuttavia:
- il n° totale di revisioni sistematiche (RS) è
ancora modesto (poco più di 1.800 ripetto alle
30-35 mila previste)
- la maggior parte di RS riguarda 5-6 specialità
cliniche
- molte RS non sono conclusive (aree grigie)
GIMBE®
Cochrane Library
GIMBE®
Cochrane Database of Systematic Reviews
(CDRS)
È il database principale:
GIMBE®
Database of Abstract of Reviews of
Effectiveness - (DARE)
GIMBE®
Cochrane Controlled Trial Register
(CCTR)
GIMBE®
altre risorse
GIMBE®
www.evidencebasednursing.it
GIMBE®
Mappa della ricerca
QUESITO
FOREGROUND - PICO
BACKGROUND
TESTO o E’ meglio posizionare il
Cos’è il TIA o come E-BOOK! paziente con Braden <13 su
si assiste il paziente materasso a cessione d’aria
con TIA o a pressione alternata?
RS Studi Primari
LG
ESPERIENZA - RICERCA
GIMBE®
Mappa della ricerca
Studi Primari
Revisioni sistematiche
QUESITO
THE END
GIMBE®
Evidence Based Practice
Gabriele Manzi
Azienda U.S.L. di Bologna
GIMBE®
Cosa sono le evidenze
scientifiche?
Conoscenze che derivano dalle prove di efficacia,
ossia dalle sperimentazioni cliniche.
Esse permettono l’acquisizione di nuove
informazioni partendo dal dato empirico derivante
da esse.
GIMBE®
Obiettivi di un sistema sanitario
impossibilitato a soddisfare tutte le
domande di salute
Garantire un livello omogeneo di assistenza su obiettivi
prioritari di prevenzione, diagnosi, terapia, riabilitazione
GIMBE®
Come è arrivata l’EBHC
in Italia?
•PSN 1998-2000
•DLGs 229/99
GIMBE®
Il PSN 1998-2000
GIMBE®
Principi ispiratori del SSN
Principio dell'efficacia e
dell'appropriatezza degli
interventi:
le risorse devono essere indirizzate verso le
prestazioni la cui efficacia é riconosciuta in
base alle evidenze scientifiche e verso i
soggetti che maggiormente ne possono trarre
beneficio.
GIMBE®
Appropriatezza
Appropriatezza clinica
Misura in cui un particolare intervento è sia
efficace sia indicato per la persona che lo
riceve.
- benefici > effetti negativi e disagi
- benefici/danni > con = costi
- è relativa solo alla fase decisionale
GIMBE®
Appropriatezza
Appropriatezza organizzativa
o generica
Misura in cui un intervento viene erogato al
livello più gradito all’utente e/o meno costoso
(ad es. domicilio, ambulatorio, day-hospital,
ricovero)
PSN 1998-2000
appropriatezza = efficacia
GIMBE®
Coordinato dall’Istituto Superiore di Sanità in
collaborazione con l’ASL 6 di Livorno, l'Agenzia di sanità
pubblica della regione Lazio, CeVEAS di Modena
e il Centro Cochrane Italiano.
http://www.snlg-iss.it/
GIMBE®
Linee Guida
GIMBE®
Contesto Locale
GIMBE®
Percorso Assistenziale*
• Strumento finalizzato all’implementazione delle LG
• In relazione al contesto locale il PA:
- adatta le raccomandazioni delle LG
- definisce:
- procedure (how)
- professionisti (who)
- setting (where)
- tempistiche (when)
GIMBE®
Processo (assistenziale)
• Rappresenta l’unità elementare del PA (costituito
da N processi)
• In funzione del numero di strutture e di
professionisti coinvolti nella sua erogazione il
processo può essere:
- molto semplice, talora sino ad identificarsi con
la procedura (vedi)
- estremamente complesso
• L’appropriatezza dei processi è correlata al
grado di aderenza alle raccomandazioni cliniche.
GIMBE®
Procedura (operativa)
• Sequenza di azioni tecnico-operative attraverso cui il
professionista eroga gli interventi assistenziali.
• Rappresenta l’unità elementare del processo (costituito
da N procedure)
• Può essere molto semplice (cateterismo vescicale) o
estremamente complessa (chirurgia dell’aorta
addominale).
• La conformità della procedura dovrebbe essere
definita da standard di competence professionale
(accreditamento?)
• Sinomini: istruzione operativa
GIMBE®
A B C D
Percorso assistenziale
Processo
Procedura operativa
GIMBE®
Protocollo
GIMBE®
Linee Guida
GIMBE®
Le non evidence based guide line erano diffuse
soprattutto qualche anno fa, erano fatte in casa
(senza l’ausilio di revisioni sistematiche) ed avevano
come risultato quello di validare i comportamenti già
in atto.
GIMBE®
Le evidence based guide line si caratterizzano per:
la multidisciplinarietà del gruppo responsabile
della produzione della linea guida
la valutazione sistematica delle prove scientifiche
disponibili quale base per le raccomandazioni
formulate
la classificazione delle raccomandazioni in base
alla qualità delle prove scientifiche che le
sostengono
Grilli et al, Lancet 2000
GIMBE®
Requisiti per lo sviluppo e
l’applicabilità di una EBGL
• Deve dichiarare la qualità delle informazioni
utilizzate (livello di evidenza)
evidenza e
l’importanza/rilevanza/fattibilità/priorità della loro
implementazione (forza delle
raccomandazioni).
raccomandazioni
• Deve essere prodotta attraverso un processo
multidisciplinare (cittadini/pazienti): ciò migliora
la qualità delle linee guida e favorisce la sua
adozione nella pratica.
GIMBE®
Requisiti per lo sviluppo e
l’applicabilità di una EBGL
• Deve esplicitare le alternative di trattamento e
i loro effetti sugli esiti.
• Deve essere flessibile e adattabile alle
mutevoli condizioni locali.
• Nel produrre una linea guida dovrebbero essere
esplicitati i possibili indicatori di monitoraggio
utili a valutarne l’effettiva applicazione.
GIMBE®
Requisiti per lo sviluppo e
l’applicabilità di una EBGL
• Una linea guida dovrebbe essere aggiornata
con regolarità per evitare che le
raccomandazioni divengano obsolete.
• Una linea guida deve essere chiara,
chiara dotata di
una struttura semplice e di un linguaggio
comprensibile, esplicitando in modo
inequivocabile i punti ritenuti fondamentali e le
aree di incertezza.
GIMBE®
Technology Assessment
GIMBE®
Technology Assessment
GIMBE®
GIMBE®
Chi produce linee guida?
• Agenzie internazionali
• Agenzie nazionali
• Agenzie governative
• Agenzie regionali
• Aziende sanitarie
GIMBE®
Perché?
GIMBE®
Aspetti legali
®
®
GIMBE
GIMBE
Aspetti legali
GIMBE®
Aspetti legali
GIMBE®
Aspetti legali
In definitiva il professionista nella sua pratica
clinica deve confrontarsi con il contenuto di una
linea guida che, se correttamente elaborata e
aggiornata, può contenere le “regole dell’arte”
astrattamente applicabili. Peraltro la
responsabilità della scelta del trattamento da
praticare compete al professionista che ha in
cura il paziente e, quindi, spetta al sanitario
verificare se nel caso di specie si deve seguire
l’indicazione contenuta nella linea guida ovvero è
opportuno discostarsene a ragion veduta.
GIMBE®
Aspetti legali
GIMBE®
Aspetti legali
GIMBE®
GIMBE®
Livello delle prove
GIMBE®
Livello delle prove
Complessivamente, quindi, si può affermare che
l’LdP dipende da:
appropriatezza del disegno di studio utilizzato
(qualità metodologica a priori);
rigore e qualità di conduzione e analisi dello studio
(controllo dell’errore sistematico);
dimensione dell’effetto clinico/epidemiologico
misurato (controllo dell’errore casuale);
appropriatezza e rilevanza degli indicatori di esito
utilizzati (rilevanza clinico-epidemiologica).
GIMBE®
Forza delle raccomandazioni
GIMBE®
Forza delle raccomandazioni
GIMBE®
GIMBE®
GIMBE®
Ceveas
GIMBE®
Ceveas
GIMBE®
Come nasce una LG
GIMBE®
Questo processo presenta molti limiti:
GIMBE®
Consenso informale
Gli esperti si confrontano nel corso di una o più
discussioni non strutturate e infine arrivano a un
consenso sulle raccomandazioni.
Questo tipo di consenso viene definito informale in
quanto i criteri di scelta non sono fissati a priori e
le raccomandazioni espresse possono riflettere
l’opinione dei più esperti o di coloro che hanno
maggiore autorevolezza o potere.
E’ il metodo più semplice, pratico e utilizzato, ma è
anche quello scientificamente meno valido.
GIMBE®
Consenso formale
Il confronto in questo caso è più strutturato, in
modo che tutte le posizioni espresse all’interno del
gruppo possano essere rappresentate e discusse.
Il metodo più noto è il Metodo” Delphi”: a tutti i
partecipanti viene inviato un questionario con le
domande principali sulle quali si vuole trovare un
consenso.
I partecipanti rispondono e si arriva via via a
discutere le risposte-comportamenti più
raccomandati.
GIMBE®
Metodo Rand
Ideato dalla Rand Corporation negli anni Ottanta,
prevede gruppi di 10-11 esperti che vengono chiamati
a definire i criteri di utilizzo appropriato di una
procedura o di un trattamento, avendo come
riferimento non il paziente medio, ma specifiche
categorie di pazienti.
Il suo limite è che nonostante si combinino le opinioni
degli esperti con le indicazioni della letteratura, la
valutazione resta sempre soggettiva.
E’ difficile coinvolgere più figure professionali, con
diverso potere.
GIMBE®
Consensus Conference
GIMBE®
NICE
National Institute of Clinical Excellence
http://www.nice.org.uk
Organizzazione creata dal governo inglese
all’interno del suo servizio sanitario nazionale
Valuta l’efficacia degli interventi medici,
rappresentati da farmaci, dispositivi medici,
procedure fisioterapiche e chirurgiche allo scopo
di orientare una corretta utilizzazione delle
risorse da parte del National Health Service
inglese
Produce linee guida cliniche e rapporti di
valutazione tecnologica
GIMBE®
GIMBE
®
THE END
GIMBE®
Stomach
HVPG measurement
After an overnight fast, HVPG measurement was performed as
previously described.27 HVPG was measured and repeated after
1 year in both groups. In patients who presented with GV
bleeding, HVPG was measured within 24 h. Patients were cate-
gorised into responders ($20% reduction in HVPG or HVPG
<12 mm Hg) and non-responders (<20% reduction in HVPG),
and the primary end points were calculated.
Statistical analyses
The rebleeding rates following cyanoacrylate injection have been
reported to be in the range of 15e25%.13e18 We hypothesised
that the rate of GV rebleeding would be more in the b-blocker
group (50%) in comparison with the cyanoacrylate group (15%).
Thus, to achieve a statistical power of 80% with an error of 5%
and drop-out rate of 20%, a sample size of 32 patients in each
group was calculated.
Fisher exact test was used to compare categorical groups.
Student t test and ManneWhitney U test were used for the
parametric and non-parametric data, respectively. For compar-
ison of pretreatment and post-treatment parameters, paired
Student t test was used. The KaplaneMeier analyses and log-
rank test were applied to compare the cumulative probability of
rebleeding from the GV, and death. Each patient was analysed in
an intention to treat manner. A p value of <0.05 was considered
significant. Statistical analysis was done using SPSS, version 15.0
(SPSS, Chicago, Illinois, USA). Figure 2 Trial profile.
treatment. Upper gastrointestinal endoscopy performed after the b-blocker group (55%) (p¼0.004, log rank 8.466, figure 3A).
a median period of 7 (4e15) days showed maroon-black spots The difference was also significant in the frequency of bleeding
(n¼26), a nipple (n¼9) on GVs and only large GVs (n¼14) over a median follow-up period of 26 months from GOV2
without other obvious source of bleeding. between the two groups (p¼0.005) (table 2). Of 34 patients in
Baseline characteristics of both groups of patients were the b-blocker group 15 had rebleed, and cyanoacrylate injection
comparable (table 1). The median follow-up period was 26 was used to control rebleeding in 13 patients. In two patients,
(range 3e34) months in both the groups. The most common bleeding from GVs was torrential and cyanoacrylate injection
aetiology of cirrhosis was alcohol or cryptogenic (table 1). Four could not be performed, and they were subjected to surgery. Of
patients in the b-blocker and six patients in the cyanoacrylate 33 patients in the cyanoacrylate group, two patients had
group had IGV1; the rest of the patients had GOV2. The size, a rebleed and were managed by surgery.
colour of GVs and PHG between the two groups were similar
(table 1). MR portovenography and Doppler ultrasound Size of gastric varix
demonstrated spontaneous lienorenal shunt in the cyanoacrylate Over a median follow-up period of 26 (3e34) months in the
group (n¼8) and in the b-blocker group (n¼11). cyanoacrylate group all patients had a decrease in GV size
(table 2) and the median size of GVs decreased from w25
Gastric variceal obturation (10e35) to w5 (0e10) mm (p<0.01). In the b-blocker group, 15
Endoscopic intervention could be performed with 100% tech- of 34 (44%) patients had an increase in size of GVs and the size
nical success. Complete obturation of GVs was achieved in all. of GVs increased from a median of 25 (10e35) to 30 (15e40)
The mean number of sessions required to achieve obliteration mm (p<0.01). All patients bleeding from GVs in the b-blocker
was 1.760.4 (range 1e2). The mean volume of cyanoacrylate group had an increase in size of at least 5 mm.
required was 6.061.7 (range 3e9) ml. Mean time to obturation
was 2.060.6 (range 1e3) days. Appearance of oesophageal varices and PHG
Over a median follow-up period of 26 (3e34) months in the
b-Blocker treatment cyanoacrylate group, 7 of 33 (21%) and in b-blocker group 4 of
All patients were compliant to b-blocker treatment. The mean 34 (11%) patients developed oesophageal varices on follow-up
daily dose was 160 (range 80e320) mg. The median time (p¼0.302). All patients had small oesophageal varices and did
interval to achieve the desired heart rate was 15 (range 5e20) not bleed. No significant difference was noted between the
days, and during this period no patient bled from GVs. cyanoacrylate group (24%) and the b-blocker (21%) group
regarding appearance or worsening of PHG (table 2).
Gastric variceal rebleeding
Over a median follow-up period of 26 (3e34) months, in the Hepatic venous pressure gradient
cyanoacrylate group 3 (9%) (GOV2 (n¼2), IGV1 (n¼1)) patients Baseline HVPG was measured in 27 patients in the cyanoacry-
bled, in contrast to 15 (44%) (GOV2 (n¼12), IGV1 (n¼3)) in the late group (three patients refused and, in another two patients,
b-blocker group. The probability of GV rebleeding was signifi- the hepatic vein could not be cannulated) and in 28 patients in
cantly lower in the cyanoacrylate group (15%) compared with the b-blocker group (three patients refused and in another one
cyanoacrylate and 2 (6%) patients in the b-blocker group The median baseline HVPG was 14.5 (10e24) mm Hg. Of 55
developed spontaneous bacterial peritonitis, and improved on patients with bleeding from gastric varices, 16% had baseline
treatment (table 2). Four patients in the b-blocker group devel- HVPG <12 mm Hg. Patients with gastric variceal bleed have
oped headache and generalised weakness which was controlled been shown to have lower HVPG than patients with bleeding
with dose reduction, and after 2e3 weeks the desired dose was from oesophageal varices.29 In addition, w35% of patients with
achieved. No serious adverse effects were noticed which required gastric variceal bleed have portal pressure <12 mm Hg.29
stoppage of b-blocker. Spontaneous splenorenal or gastrorenal shunts commonly
develop between the splenic vein (splenorenal shunt) and gastric
Mortality varices, respectively, and connect via the inferior phrenic or
Over a median follow-up period of 26 (3e34) months, a significant suprarenal vein to the left renal vein.30 These shunts are seen in
difference in the overall mortality was observed between the up to 60% of patients with GVs.30 31 We found spontaneous
cyanoacrylate (n¼1, 3%) and the b-blocker (n¼8, 25%) group shunts in 33% of our patients. Median HVPG in patients with
(p¼0.016, log rank¼5.808, figure 3B). Of 15 patients with spontaneous shunts was lower in comparison with those
rebleeding in the b-blocker group, treated with cyanoacrylate without shunts (13 vs 18 mm Hg). In fact, HVPG was high in
injection, 6 (19%) patients died in comparison with none in three patients with both GOV2 and IGV1 types of varices. Of the 15
of 33 patients in the cyanoacrylate group (p¼0.024) who were patients who bled, 20% had HVPG of <12 mm Hg.
managed with surgery at the time of rebleeding. In the b-blocker There are limited data on the efficacy of b-blockers in reduc-
group, one patient died of hepatic encephalopathy and one patient tion of portal pressure in patients with GVs. Keeping this in
died of spontaneous bacterial peritonitis and hepatorenal view, HVPG was measured to assess the response to b-blocker
syndrome. In the cyanoacrylate group, one patient died of hepatic treatment in all our patients with GVs. The median HVPG was
encephalopathy. The cumulative 2-year survival rate was 90% in significantly reduced on follow-up; however, this could not
the cyanoacrylate group and 52% in the b-blocker group. In the prevent GV rebleeding or mortality. Of the 12 responders to b-
b-blocker group, only one patient died among responders blocker, five patients who rebled had a median decrease in HVPG
compared with seven patients among non-responders (p¼0.077). of 22% compared with 30% in seven patients who did not
rebleed. This raises the question of whether a 20% reduction in
Predictors of GV rebleed and mortality HVPG is adequate to define a response to b-blocker in patients
On univariate analysis, the variables which influenced GV with GVs, or whether it should be a >25% reduction. In the
rebleeding were size of the GV >20 mm, a red or black spot over cyanoacrylate group, HVPG increased on follow-up, however
the GV, blue colour of the GV, presence of PHG, international without an increase in the frequency of rebleeding. This increase
normalised ratio (INR) $1.6, serum creatinine >1 mg/dl, CTP in HVPG could be attributed to redistribution of blood flow in
score $9, MELD score $17 and the treatment method. On the portal system and indirectly suggests adequacy of GV
multivariate analysis, the treatment method (p¼0.006), PHG obturation. Whether addition of a b-blocker to prevent the rise
(p¼0.029) and size of the GV >20 mm (p¼0.002) independently in HVPG by cyanoacrylate injection will be helpful needs further
correlated with GV rebleeding. Variables which influence studies.
survival on univariate analysis included GV rebleeding, presence BRTO and balloon-occluded endoscopic injection scle-
of PHG, CTP $9, MELD score $17 and the treatment method. rotherapy have shown good results for prophylaxis of high risk
On multivariate analysis, GV rebleeding (p¼0.003) indepen- fundal variceal bleed.31 32 In a prospective trial, Hong et al showed
dently correlated with mortality. that the therapeutic efficacies of glue and BRTO for the treatment
of active gastric variceal haemorrhage and/or high-risk GV
appeared to be similar. However, glue might be associated with
DISCUSSION a higher rebleeding rate than BRTO, and BRTO could be an
The results of this large prospective randomised controlled effective rescue treatment for patients with gastric variceal
clinical trial comparing the efficacy of cyanoacrylate and haemorrhage after initial treatment with glue.32 TIPS has been
b-blocker treatmjent clearly demonstrate that endoscopic injec- found to be quite effective in the prevention of GV rebleeding, not
tion of cyanoacrylate is significantly more effective than b- only by reducing the portal pressure, but also by allowing the
blocker treatment for the prevention of rebleeding from GVs. possibility of obliterating gastric variceal channels. In a rando-
Small studies have reported that drug treatment is effective in mised controlled trial (patients with both oesophageal varices and
the prevention of GV rebleeding after successful endoscopic GVs), Lo et al showed that TIPS was more effective than glue
injection of the bleeding varix with tissue adhesives.12 28 A small injection in preventing rebleeding from GVs, with similar survival
open-label trial of b-blocker and nitrate treatment reported no and frequency of complications.33 However, all these procedures
significant benefit in terms of risk of rebleeding or survival.12 are quite expensive, need expertise and are associated with
This study had several limitations such as a small sample size, complications over time.18 29 32e35 Cyanoacrylate injection, on
retrospective analysis, fixed and low doses of drug and lack of the other hand, is easily available, rapid, cost-effective, requires
haemodynamic monitoring. In another study, Evrard et al less expertise, is less invasive and has been shown to be very
randomised patients to receive 160 mg/day of propranolol effective in preventing GV rebleeding.13 16 19e21 34
(n¼20) or histoacryl injection (n¼21) for secondary prophylaxis Endoscopic variceal sclerotherapy is inappropriate for patients
of gastro-oesophageal variceal bleed.28 The rebleeding and with fundal varices.5 19 The randomised trials by Tan et al and Lo
mortality rates were similar in the b-blocker and endoscopic et al compared histoacryl injection and variceal band ligation and
treatment groups, with a higher complication rate in the latter reported a rebleeding rate almost twice higher with ligation for
(10% vs 47%). This study had limitations of early termination secondary prevention of bleeding from GVs.13 36
due to increased complications in the histoacryl arm, no Generally not more than 2 ml of cyanoacrylate should be
haemodynamic monitoring and inclusion of patients with co- injected at a single site to prevent embolic and thrombotic
existing oesophageal varices. In fact, all patients had oesophageal complications.37 38 Precautions to prevent damage to the endo-
varices, and 17 had GVs (12 with GOV1 and 5 with GOV2). scope must be taken during cyanoacrylate injection. By avoiding
lipiodol use, limiting the total volume per injection and by 10. Ideo G, Bellati G, Fesce E, et al. Nadolol can prevent the first gastrointestinal
proper monitoring, no embolic complication was observed in our bleeding in cirrhotics: a prospective, randomized study. Hepatology 1988;8:6e9.
11. The Italian Multicenter Project for Propranolol in Prevention of Bleeding.
study population. Dilution of cyanoacrylate with lipiodol delays Propranolol prevents first gastrointestinal bleeding in non-ascitic cirrhotic patients.
solidification by 15e20 s, thus increasing the chances of distal Final report of a multicenter randomized trial. J Hepatol 1989;9:75e83.
embolisation. In the undiluted form, it solidifies within 5e7 s, 12. Wu CY, Yeh HZ, Chen GH. Pharmacologic efficacy in gastric variceal
rebleeding and survival: including multivariate analysis. J Clin Gastroenterol
and thus the chances of distal embolisation become almost 2002;35:127e32.
negligible. However, with undiluted cyanoacrylate injection, 13. Lo GH, Lai KH, Cheng JS, et al. A prospective, randomized trial of butyl
there is a risk of needle impaction in GVs at the time of cyanoacrylate injection versus band ligation in the management of bleeding gastric
varices. Hepatology 2001;33:1060e4.
injection.39 14. Soehendra N, Nam VC, Grimm H, et al. Endoscopic obliteration of large
b-Blocker treatment was well tolerated and none of our esophagogastric varices with bucrylate. Endoscopy 1986;18:25e6.
patients required withdrawal of treatment. In the cyanoacrylate 15. Ramond MJ, Valla D, Mosnier JF, et al. Successful endoscopic obliteration of
group, 21% of patients had appearance of new oesophageal gastric varices with butyl cyanoacrylate. Hepatology 1989;10:488e93.
16. Huang YH, Yeh HZ, Chen GH, et al. Endoscopic treatment of bleeding gastric varices
varices in comparison with 11% in the b-blocker group, although by N-butyl-2-cyanoacrylate (Histoacryl) injection: long-term efficacy and safety.
none of the patients bled from oesophageal varices. The Gastrointest Endosc 2000;52:160e7.
frequency of PHG in both the groups was similar (24% vs 21%). 17. Binmoeller KF, Soehendra N. “Superglue”: the answer to variceal bleeding and
fundal varices? Endoscopy 1995;27:392e6.
Survival in the cyanoacrylate group was better because of 18. Ryan BM, Stockbrugger RW, Ryan JM. A pathophysiologic, gastroenterologic, and
a low frequency of rebleeding compared with the b-blocker radiologic approach to the management of gastric varices. Gastroenterology
group. In both the groups, differences in mortality were due to 2004;126:1175e89.
rebleed-related deaths. However, mortality due to other causes 19. Sarin SK, Jain AK, Jain M, et al. A randomized controlled trial of cyanoacrylate
versus alcohol injection in patients with isolated fundic varices. Am J Gastroenterol
(not rebleed related) was similar in both the groups. More 2002;97:1010e15.
favourable survival in our patients could be due to close follow- 20. Akahoshi T, Hashizume M, Shimabukuro R, et al. Long-term results of endoscopic
up during the study period and the fact that w50% of the histoacryl injection sclerotherapy for gastric variceal bleeding: a 10-year experience.
Surgery 2002;131:S176e81.
patients with cirrhosis in both the groups were Child A and B. 21. Kim JW, Baik SK, Kim KH, et al. Effect of endoscopic sclerotherapy using N-butyl-
The stronger aspects of our trial are that it was a randomised 2-cyanoacrylate in patients with gastric variceal bleeding. Korean J Hepatol
controlled study and had a large sample size, a longer follow-up 2006;12:394e403.
22. de Franchis R. Evolving consensus in portal hypertension report of the Baveno
period and a minimal drop-out rate. The weaker aspect of this IV consensus workshop on methodology of diagnosis and therapy in portal
study is inclusion of only a selective patient group with IGV1 hypertension. J Hepatol 2005;43:167e76.
and GOV2 types of GVs. The applicability of the present study 23. Ramesh J, Limdi JK, Sharma V, et al. The use of thrombin injections in the
is related only to patients with bleeding GVs of GOV2 and IGV1 management of bleeding gastric varices: a single center experience. Gastrointest
Endosc 2008;68:877e82.
types. GVs of GOV2 and IGV1 types are more common, and 24. Yang WL, Tripathi D, Therapondos G, et al. Endoscopic use of human thrombin in
associated with more frequent and more severe bleeds with bleeding gastric varices. Am J Gastroenterol 2002;97:1381e5.
higher mortality rates as compared with other types of gastric 25. Datta D, Vlavianos P, Alisa A, et al. Use of fibrin glue (beriplast) in the management
of bleeding gastric varices. Endoscopy 2003;35:675e8.
varices.1 26. Tripathi D, Hayes PC. Endoscopic therapy for bleeding gastric varices: to clot or
In conclusion, the results of our study clearly demonstrate glue? Gastrointest Endosc 2008;68:883e6.
that cyanoacrylate injection is more effective in the prevention 27. Wadhawan M, Dubey S, Sharma BC, et al. Hepatic venous pressure gradient in
of rebleeding from GVs and improving patient survival as cirrhosis: correlation with the size of varices, bleeding, ascites, and Child’s status.
Dig Dis Sci 2006;51:2264e9.
compared with b-blocker treatment. Propranolol is not effective 28. Evrard S, Dumonceau JM, Delhaye M, et al. Endoscopic histoacryl obliteration vs.
in preventing gastric variceal rebleeding despite reduction in propranolol in the prevention of esophagogastric variceal rebleeding: a randomized
HVPG. trial. Endoscopy 2003;35:729e35.
29. Tripathi D, Therapondos G, Jackson E, et al. The role of the transjugular intrahepatic
Competing interests None. portosystemic stent shunt (TIPSS) in the management of bleeding gastric varices:
clinical and haemodynamic correlations. Gut 2002;51:270e4.
Patient consent Obtained. 30. Watanabe K, Kimura K, Matsutani S, et al. Portal hemodynamics in patients with
Ethics approval This study was conducted with the approval of the MAMC Ethical gastric varices. A study in 230 patients with esophageal and/or gastric varices using
Committee, New Delhi. portal vein catheterization. Gastroenterology 1988;95:434e40.
31. Matsumoto A, Hamamoto N, Nomura T, et al. Balloon-occluded retrograde
Provenance and peer review Not commissioned; externally peer reviewed. transvenous obliteration of high-risk gastric fundal varices. Am J Gastroenterol
1999;94:643e9.
32. Hong CH, Kim HJ, Park JH. Treatment of patients with gastric variceal hemorrhage:
REFERENCES endoscopic N-butyl-2-cyanoacrylate injection versus balloon-occluded retrograde
1. Sarin SK, Lahoti D, Saxena SP, et al. Prevalence, classification and natural history of transvenous obliteration. J Gastroenterol Hepatol 2009;24:372e8.
gastric varices: a long-term follow-up study in 568 portal hypertension patients. 33. Lo GH, Liang HL, Chen WC, et al. A prospective, randomized controlled trial of
Hepatology 1992;16:1343e9. transjugular intrahepatic portosystemic shunt vs. cyanoacrylate injection in the
2. Trudeau W, Prindiville T. Endoscopic injection sclerosis in bleeding gastric varices. prevention of gastric variceal rebleeding. Endoscopy 2007;39:679e85.
Gastrointest Endosc 1986;32:264e8. 34. Marques P, Maluf-Filho F, Kumar A, et al. Long-term outcomes of acute gastric
3. Thakeb F, Salem SA, Abdallah M, et al. Endoscopic diagnosis of gastric varices. variceal bleeding in 48 patients following treatment with cyanoacrylate. Dig Dis Sci
Endoscopy 1994;26:287e91. 2008;53:544e50.
4. Bretagne JF, Dudicourt JC, Morisot D, et al. Is endoscopic variceal sclerotherapy 35. Tripathi D, Ferguson JW, Therapondos G, et al. Review article: recent advances
effective for the treatment of gastric varices? [abstract]. Dig Dis Sci 1986;31:505S. in the management of bleeding gastric varices. Aliment Pharmacol Ther
5. Sarin SK. Long-term follow-up of gastric variceal sclerotherapy: an eleven-year 2006;24:1e17.
experience. Gastrointest Endosc 1997;46:8e14. 36. Tan PC, Hou MC, Lin HC, et al. A randomized trial of endoscopic treatment of acute
6. Lebrec D. Pharmacological treatment of portal hypertension: hemodynamic effects gastric variceal hemorrhage: N-butyl-2-cyanoacrylate injection versus band ligation.
and prevention of bleeding. Pharmacol Ther 1994;61:65e107. Hepatology 2006;43:690e7.
7. Hayes PC, Davis JM, Lewis JA, et al. Meta-analysis of value of propranolol in 37. Hwang SS, Kim HH, Park SH, et al. N-butyl-2-cyanoacrylate pulmonary embolism
prevention of variceal haemorrhage. Lancet 1990;336:153e6. after endoscopic injection sclerotherapy for gastric variceal bleeding. J Comput Assist
8. Lin HC, Soubrane O, Lebrec O. Prevention of portal hypertension and portosystemic Tomogr 2001;25:16e22.
shunts by early chronic administration of clonidine in conscious portal vein-stenosed 38. Yoshida H, Onda M, Tajiri T, et al. Endoscopic findings of bleeding esophagogastric
rats. Hepatology 1991;14:325e30. varices. Hepatogastroenterology 2002;49:1287e9.
9. Sarin SK, Groszmann RJ, Mosca PG, et al. Propranolol ameliorates the development 39. Bhasin DK, Sharma BC, Prasad H, et al. Endoscopic removal of sclerotherapy needle
of portal-systemic shunting in a chronic murine schistosomiasis model of portal from gastric varix after N-butyl-2-cyanoacrylate injection. Gastrointest Endosc
hypertension. J Clin Invest 1991;87:1032e6. 2000;51:497e8.
This is a reprint of a Cochrane review, prepared and maintained by The Cochrane Collaboration and published in The Cochrane Library
2008, Issue 4
http://www.thecochranelibrary.com
Contact address: Robert D Herbert, The George Institute for International Health, PO Box M201, Missendown Road, Camperdown,
New South Wales, 2050, Australia. rherbert@george.org.au.
Citation: Herbert RD, de Noronha M. Stretching to prevent or reduce muscle soreness after exercise. Cochrane Database of Systematic
Reviews 2007, Issue 4. Art. No.: CD004577. DOI: 10.1002/14651858.CD004577.pub2.
Copyright © 2008 The Cochrane Collaboration. Published by John Wiley & Sons, Ltd.
ABSTRACT
Background
Many people stretch before or after (or both) engaging in athletic activity. Usually the purpose is to reduce risk of injury, reduce soreness
after exercise, or enhance athletic performance.
Objectives
The aim of this review was to determine effects of stretching before or after exercise on the development of post-exercise muscle soreness.
Search strategy
We searched the Cochrane Bone, Joint and Muscle Trauma Group Specialised Register (to April 2006), the Cochrane Central Register
of Controlled Trials (The Cochrane Library 2006, Issue 2), MEDLINE (1966 to May 2006), EMBASE (1988 to May 2006), CINAHL
(1982 to May 2006), SPORTDiscus (1949 to May 2006), PEDro (to May 2006) and reference lists of articles.
Selection criteria
Eligible studies were randomised or quasi-randomised studies of any pre-or post-exercise stretching technique designed to prevent or
treat delayed-onset muscle soreness (DOMS), provided the stretching was conducted soon before or soon after exercise. To be eligible
studies must have assessed muscle soreness or tenderness.
Data collection and analysis
Methodological quality of the studies was assessed using the Cochrane Bone, Joint and Muscle Trauma Group’s methodological quality
assessment tool. Estimates of effects of stretching were converted to a common 100-point scale. Outcomes were pooled in a fixed-effect
meta-analysis.
Main results
Of the 10 included studies, nine were carried out in laboratory settings using standardised exercise protocols and one involved post-
exercise stretching in footballers. All participants were young healthy adults. Three studies examined the effects of stretching before
exercise and seven studies investigated the effects of stretching after exercise. Two studies, both of stretching after exercise, involved
Stretching to prevent or reduce muscle soreness after exercise (Review) 1
Copyright © 2008 The Cochrane Collaboration. Published by John Wiley & Sons, Ltd.
repeated stretching sessions at intervals of greater than two hours. The duration of stretching applied in a single session ranged from
40 to 600 seconds.
All studies were small (between 10 and 30 participants received the stretch condition) and of questionable quality.
The effects of stretching reported in individual studies were very small and there was a high degree of consistency of results across
studies. The pooled estimate showed that pre-exercise stretching reduced soreness one day after exercise by, on average, 0.5 points on a
100-point scale (95% CI -11.3 to 10.3; 3 studies). Post-exercise stretching reduced soreness one day after exercise by, on average, 1.0
points on a 100-point scale (95% CI -6.9 to 4.8; 4 studies). Similar effects were evident between half a day and three days after exercise.
Authors’ conclusions
The evidence derived from mainly laboratory-based studies of stretching indicate that muscle stretching does not reduce delayed-onset
muscle soreness in young healthy adults.
Many people stretch prior to or after engaging in physical activities such as sport. Usually the purpose is to reduce the risk of injury,
reduce soreness after exercise, or enhance athletic performance.
The review located 10 relevant randomised trials looking at the effect of stretching before or after physical activity on muscle soreness.
The trials were mostly small and of questionable quality. Nine were conducted in laboratories using standardised exercises. Only one
study examined the effect of stretching on muscle soreness after sport. Three of the studies examined the effects of stretching before
physical activity and seven examined effects of stretching after physical activity.
The 10 studies produced very consistent findings. They showed there was minimal or no effect on the muscle soreness experienced
between half a day and three days after the physical activity. Effects of stretching on effect on other outcomes such as injury and
performance were not examined in this review.
BACKGROUND
ferred to simply as muscle soreness) is usually caused by unaccus-
Many people stretch before or after (or before and after) engaging
tomed exercise, particularly exercise that requires primarily eccen-
in athletic activity. Usually the purpose is to reduce the risk of
tric muscle contraction. Eccentric contractions occur when the
injury, reduce soreness after exercise, or enhance athletic perfor-
muscle lengthens as it contracts. Typically the soreness arises within
mance (Cross 1999; de Vries 1961; Gleim 1990; Gleim 1997).
the first day after exercise and peaks in intensity at around 48
This review focuses on the effects of muscle stretching on muscle
hours (Balnave 1993; Bobbert 1986; Wessel 1994). The soreness
soreness. Another Cochrane review (Yeung 2003) has examined
is usually associated with tenderness and may be associated with
whether stretching prevents injury, and several non-Cochrane sys-
swelling (Bobbert 1986; Wessel 1994).
tematic reviews have examined whether stretching prevents mus-
cle soreness or injury, or enhances performance (Herbert 2002;
The series of events that ultimately cause muscle soreness are only
Shrier 2004; Thacker 2004; Weldon 2003).
partly understood. The initial event is probably mechanical disrup-
The muscle soreness that is the focus of this review is sometimes tion of sarcomeres (contractile units within muscle fibres; Proske
called delayed-onset muscle soreness to differentiate it from sore- 2001). This causes swelling of damaged muscle fibres and initiates
ness that occurs as muscle fatigue, or immediately after muscles an inflammatory response, which could excite nociceptors (recep-
have been fatigued. Delayed-onset muscle soreness (hereafter re- tors capable of transmitting information about pain; Lieber 2002).
Stretching to prevent or reduce muscle soreness after exercise (Review) 2
Copyright © 2008 The Cochrane Collaboration. Published by John Wiley & Sons, Ltd.
Muscle soreness is usually only experienced when the muscle con- clinical trials of pre-or post-exercise stretching techniques designed
tracts or is stretched. This indicates that, while swelling of muscle to prevent or treat delayed-onset muscle soreness.
fibres and inflammation may be necessary for muscle soreness to
occur, swelling and inflammation are not sufficient to cause sore-
Types of participants
ness on their own. Muscle soreness is exacerbated by vibration over
the belly of the muscle, and pressure thresholds increase when large Trials involving participants of any age group, and of either sex.
diameter afferents are blocked (large diameter afferents are nerve
cells that conduct information about touch and limb position),
Types of interventions
indicating that excitation of large diameter muscle afferents, prob-
ably primary spindle afferents from stretch receptors in muscles, Any pre-or post-exercise stretching technique designed to prevent
is involved in generating the sensation of soreness (Weerakkody or treat delayed-onset muscle soreness, provided the stretching was
2001). conducted soon before or soon after exercise of any type.
Table 1. Bone, Joint and Muscle Trauma Group methodological quality assessment tool
Item Criterion
B Were the outcomes of patients/participants who withdrew described and included in the analysis (intention to treat)?
2 = withdrawals well described and accounted for in analysis.
1 = withdrawals described and analysis not possible.
0 = no mention, inadequate mention, or obvious differences and no adjustment.
K Were diagnostic tests used in outcome assessment clinically useful? (by outcome)
2 = optimal.
1 = adequate.
0 = not defined, not adequate.
Data extraction Pain and tenderness data were typically reported on 100 mm visual
analogue scales or 10 point scales. To facilitate pooling, data were
Soreness or tenderness data from stretch and comparison groups
converted to a common 100-point scale. The effect of stretch-
were extracted from study reports using a pro forma. This was
ing was estimated from each study using the difference between
done by the authors; again, disagreements were resolved by dis-
mean pain levels in stretch and comparison groups. Where there
cussion or a third person. It was expected that some studies would
was apparent qualitative homogeneity in participants, interven-
report soreness data and some would report tenderness data. Some
tions and outcome measures, meta-analysis was considered. Meta-
studies reported raw scores, whereas others report change scores
analysis was conducted using the RevMan Analysis program in
or covariance-adjusted scores. It was also expected that outcomes
Review Manager (RevMan 2003). The effects of stretching was
would usually be measured at a series of times following exercise.
described as a weighted mean difference. Data were inspected for
Where available, data were extracted for each of a series of 12-hour
statistical heterogeneity. As there was no evidence of heterogeneity
intervals following exercise (6-17 hours, 18-29 hours, 30-41 hours,
of effect (Cochran Q, P < 0.1; Fleiss 1993), a fixed-effect model
etc). Only one outcome was recorded from each study for each
was used to pool findings across studies. Effects of pre- and post-
time. Where multiple outcomes were available, soreness data was
exercise stretching were initially estimated separately but, as there
preferred to tenderness data. Covariate-adjusted data were most
was no evidence of heterogeneity, they were combined in a sec-
preferred, then change scores, then raw scores. Where within-sub-
ondary analysis. A post-hoc analysis was conducted to obtain sepa-
ject studies (studies in which participants’ limbs were allocated to
rate estimates from laboratory-based studies and the one commu-
stretch and control conditions) or cross-over studies (studies in
nity-based study. An additional post-hoc analysis was conducted
which each participant was sequentially exposed to both stretch
to obtain separate estimates from studies of static stretch and the
and control conditions) did not provide estimates of the variance
one study that used another method of stretching.
of differences between conditions or of the correlations between
outcomes under the two conditions being compared (Elbourne
2002) the variance of the difference between conditions was esti-
mated by assuming the data were independent.
Analysis RESULTS
Buroker Dawson Gulick High Johansson Maxwell McGlynn Terry Wessel Wessel
1989 2005 1996 1989 1999 1988 1979 1985 1994a 1994b
1 0 1 1 1 1 1 1 1 1
0 0 0 0 No 0 0 0 0 0
consensus
0 0 0 0 0 0 0 0 0 0
0 2 0 0 0 0 0 0 2 2
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
2 2 2 2 2 2 2 2 2 2
2 0 No 1 2 0 2 2 0 0
consensus
2 1 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2
References to studies included in this review Abraham 1977 {published data only}
Abraham WM. Factors in delayed muscle soreness. Medicine and
Buroker 1989 {published data only} Science in Sports 1997;9(1):11–20.
Buroker KC, Schwane JA. Does postexercise static stretching
alleviate delayed muscle soreness?. Physician and Sportsmedicine Bale 1991 {published data only}
1989;17(6):65–83. Bale P, James H. Massage, warmdown and rest as recuperative
measures after short term intense exercise. Physiotherapy in Sport
Dawson 2005 {published data only}
1991;13(2):4–7.
Dawson B, Gow S, Modra S, Bishop D, Stewart G. Effects of
immediate post-game recovery procedures on muscle soreness, de Vries 1966 {published data only}
power and flexibility levels over the next 48 hours. Journal of de Vries HA. Quantitative electromyographic investigation of the
Science and Medicine in Sport 2005;8(2):210–21. spasm theory of muscle pain. American Journal of Physical Medicine
1966;45(3):119–34.
Gulick 1996 {published data only}
Gulick DT, Kimura IF, Sitler M, Paolone A, Kelly JD. Various Jayaraman 2004 {published data only}
treatment techniques on signs and symptoms of delayed onset Jayaraman RC, Reid RW, Foley JM, Prior BM, Dudley GA,
muscle soreness. Journal of Athletic Training 1996;31(2):145–52. Weingand KW, et al.MRI evaluation of topical heat and static
stretching as therapeutic modalities for the treatment of eccentric
High 1989 {published data only}
exercise-induced muscle damage. European Journal of Applied
High DM, Howley ET, Franks BD. The effects of static stretching Physiology 2004;93(1-2):30–8.
and warm-up on prevention of delayed-onset muscle soreness.
Research Quarterly for Exercise and Sport 1989;60(4):357–61. Lightfoot 1997 {published data only}
Lightfoot JT, Char D, McDermott J, Goya C. Immediate
Johansson 1999 {published data only}
postexercise massage does not attenuate delayed onset muscle
Johansson PH, Lindström L, Sundelin G, Lindström B. The effects
soreness. Journal of Strength and Conditioning Research 1997;11:
of preexercise stretching on muscular soreness, tenderness and force
119–24.
loss following heavy eccentric exercise. Scandinavian Journal of
Medicine and Science in Sports 1999;9(4):219–25. Lund 1998 {published data only}
Lund H, Vestergaard-Poulsen, Kanstrup I-L, Sejrsen P. The effect of
Maxwell 1988 {published data only} passive stretching on delayed onset muscle soreness, and other
Maxwell S, Kohn S, Watson A, Balnave RJ. Is stretching effective in detrimental effects following exercise. Scandinavian Journal of
the prevention of or amelioration of delayed-onset muscle soreness?. Medicine and Science in Sports 1998;8:216–21.
In: Torode M editor(s). The athlete maximising participation and
minimising risk. Sydney: Cumberland College of Health Sciences, Prentice 1982 {published data only}
1988:109–18. Prentice WE. Electromyographic analysis of the effectiveness of
heat or cold and stretching for inducing relaxation in injured
McGlynn 1979 {published data only}
muscle. Journal of Orthopaedic and Sports Physical Therapy 1982;3
McGlynn GH, Laughlin NT, Rowe V. Effect of electromyographic
(3):133–40.
feedback and static stretching on artificially induced muscle
soreness. American Journal of Physical Medicine 1979;58(3):139–48. Rahnama 2005 {published data only}
Rahnama N. Rahmani-Nia F. Ebrahim K. The isolated and
Terry 1985 {published data only}
combined effects of selected physical activity and ibuprofen on
∗
Terry L. Stretching and muscle soreness. An investigation into the
delayed-onset muscle soreness. Journal of Sports Sciences 2005;23
effects of hold-relax stretch on delayed post-exercise soreness in the
(8):843–850.
quadriceps muscle - a pilot study [thesis]. Adelaide (Australia): South
Australian Institute of Technology, 1985. Reilly 2002 {published data only}
Terry L. Stretching and muscle soreness: an investigation into the Reilly T, Rigby M. Effect of an active warm-down following
effects of a hold-relax stretch on delayed post-exercise soreness in competitive soccer. In: Spinks W, Reilly T, Murphy A editor(s).
the quadriceps muscle: a pilot study [abstract]. Australian Journal of Science and Football IV. Proceedings of the 4th World Congress of
Physiotherapy Australian Journal of Physiotherapy 1987;33(1):69. Science and Football; 1999 Feb 22-26; Sydney, NSW. London:
Routledge, 2002:226–9.
Wessel 1994a {published data only}
Wessel J, Wan A. Effect of stretching on the intensity of delayed- Rodenburg 1994 {published data only}
onset muscle soreness. Clinical Journal of Sport Medicine 1994;4(2): Rodenburg JB, Steenbeek, Schiereck P, Bar PR. Warm-up,
83–7. stretching and massage diminish harmful effects of eccentric
Wessel 1994b {published data only} exercise. International Journal of Sports Medicine 1994;15(7):414–9.
Wessel J, Wan A. Effect of stretching on the intensity of delayed- Smith 1993 {published data only}
onset muscle soreness. Clinical Journal of Sport Medicine 1994;4(2): Smith LL, Brunetz MH, Chenier TC, McCammon MR, Houmard
83–7. JA, Franklin ME, et al.The effects of static and ballistic stretching
on delayed onset muscle soreness. Research Quarterly for Exercise
References to studies excluded from this review
and Sport 1993;1:103–7.
Stretching to prevent or reduce muscle soreness after exercise (Review) 9
Copyright © 2008 The Cochrane Collaboration. Published by John Wiley & Sons, Ltd.
References to studies awaiting assessment Elbourne 2002
Elbourne DR, Altman DG, Higgins JPT, Curtin F, Worthington
Buckenmeyer 1998 {published data only} HV, Vail A. Meta-analyses involving cross-over trials:
Buckenmeyer P, Kokkinidis E. Machairidou M, Tsamourtas A. The methodological issues. International Journal of Epidemiology 2002;
effect of static stretching and cryotherapy on the recovery of 31(1):140–9.
delayed muscle soreness [Greek]. Exercise & Society Journal of Sport Feland 2001
Science (Komotini) 1998;(19):45–53. Feland JB, Myrer JW, Merrill RM. Acute changes in hamstring
Costa 1997 {published data only} flexibility: PNF versus static stretch in senior athletes. Physical
Costa MC, Cabral JG, Muniz GMA, Silva EF, Silva MG, Duarte Therapy in Sport 2001;2(4):186–93.
JAR, et al.Effects of stretching after exercise on some indirect Fleiss 1993
markers muscle damage. 9th European Congress on Sports Fleiss JL. The statistical basis of meta-analysis. Statistical Methods in
Medicine; 1997 Sept 23-26; Porto, Portugal. 1997:1. Medical Research 1993;2:121–45.
Lin 1999 {published data only} Gleim 1990
Lin WH. The effects of massage, stretch and meloxicam on delayed Gleim GW, Stachenfeld NS, Nicholas JA. The influence of
onset muscle soreness [Masters thesis]. Taiwan: National College of flexibility on the economy of walking and jogging. Journal of
Physical Education and Sports Taoyuan, 1999. Orthopedic Research 1990;8:814–23.
Lu 1992 {published data only} Gleim 1997
∗
Lu D, Fan JY, Qu Z. An immuno-electron microscopic study of Gleim GW, McHugh MP. Flexibility and its effects on sports injury
the effect of acupuncture and static stretch on contractile structural and performance. Sports Medicine 1997;24:289–99.
alteration of skeletal muscle after strenuous exercise. Sport Science
(Beijing) 1992;12(6):47–51. Lieber 2002
Lu D, Fan JY, Qu Z. An immuno-electron microscopic study of the Lieber RL, Friden J. Morphologic and mechanical basis of delayed-
effect of acupuncture and static stretch on ultrastructural alteration onset muscle soreness. Journal of the American Academy of
of M-line of skeletal muscle after strenuous exercise. Sports Science Orthopaedic Surgeons 2002;10(1):67–73.
(Beijing) 1992;12(6):52–9. Moher 1998
Lu D, Fan JY, Qu Z. An immuno-electron microscopic study of the Moher D, Pham B, Jones A, Cook DJ, Jadad AR, Moher M, et
effect of acupuncture and static stretch on ultrastructural alteration al.Does quality of reports of randomised trials affect estimates of
of Z-band in human skeletal muscle after strenuous exercise. Sports intervention efficacy reported in meta-analyses?. Lancet 1995;352
Science (Beijing) 1992;12(6):60–5. (9128):609–13.
Herbert 2002
Herbert RD, Gabriel M. Effects of pre- and post-exercise stretching
on muscle soreness, risk of injury and athletic performance: a
systematic review. BMJ 2002;325(7362):468–72.
∗
Indicates the major publication for the study
Buroker 1989
Participants 23 participants (16 men and 7 women) aged 18-33 years with no known contraindications to exercise.
None was highly physically trained and none were extremely active in the six weeks preceding the study.
Risk of bias
Dawson 2005
Interventions Stretch condition: 15 minutes of supervised gentle stretching of the legs and back. This involved “2-3
repeats of 30 s held stretches across several muscle groups and joints”.
Control condition: no recovery procedures.
Notes Part of a larger study in which each subject was exposed on 12 occasions, each separated by one week, to
one of four interventions (control, stretch, pool walking, hot-cold regimen).
Initial condition was allocated randomly and subsequent conditions by alternation. Stretch was before
exercise.
Soreness was induced by playing football.
All participants underwent a “pool recovery program” on the two days following exercise.
Risk of bias
Gulick 1996
Participants ~22 untrained participants randomly drawn from a larger sample of 35 men and 38 women aged 21 to
40 years.
Interventions Stretch group (N ~ 11): static stretches of the wrist extensor muscles to “end range” for 10 minutes soon
after exercise.
Control group (N ~ 11): two placebo tablets after exercise and one further placebo tablet 24 hours later.
Outcomes The following measures were taken 24, 48 and 72 hours after exercise:
1. On a 10 cm visual analogue scale anchored at “no soreness at all” and “soreness as bad as it could be”
2. Force required to invoke tenderness (sum of measures at 9 sites).
Notes Part of a larger study in which subjects were randomised to seven interventions (control, stretch, anti-
inflammatory drug, intense exercise, ice massage, herbal ointment).
Stretch was after exercise.
Soreness was induced by 15 sets of 15 isokinetic eccentric wrist extensor contractions.
Risk of bias
High 1989
Participants 30 untrained participants (stretch group, 7 men and 7 women, mean age 19.4 years; control group, 8
men and 8 women, mean age 20.4 years)
Interventions Stretch group: stretched the quadriceps muscles (5 stretches, twice each on each leg for 50 seconds) of
both legs prior to exercise. Control group: did not stretch.
Outcomes The following measures were taken at 24 hour intervals for 5 days:
1. Soreness on a 0-6 scale (0 = “absence of soreness”, 6 = “most severe pain possible from soreness”.
Notes Part of a larger study in which subjects were randomised to four interventions (control, stretch, warm-up,
warm-up and stretch).
Stretch was before exercise.
Soreness was induced by 80 up to minutes of step-down exercise.
Risk of bias
Johansson 1999
Participants 10 health female physiotherapy students (24 (SD 3) years, 62 (SD 3) kg, 169 (SD 5) cm), not taking anti-
inflammatory medication, with no lower limb musculoskeletal symptoms, had not participated in weight
training for more than 3 hours per week, and were not experiencing DOMS at the time of testing.
Interventions Stretch leg: four 20-second “hamstring hurdle” stretches, with 20 second rests between stretches. Stretch
intensity was sufficient to induce a strong feeling of stretch but not pain.
Control leg: the hamstring muscles on the other side of the body were not stretched.
Outcomes The following measures were taken 24, 48 and 96 hours after exercise:
1. Hamstring muscle soreness on a 100 mm visual analogue scale (0 = “no soreness”, 100 = “worst possible
soreness”).
2. Tenderness measured with an algometer at 5 locations.
Risk of bias
Participants ~14 female first-year college students randomly drawn from a larger sample of 20 participants aged 18-
25 years (mean 19.4) and with varying histories of physical activity
Interventions Stretch group (N ~ 6): participants lay in prone with the hips in a neutral position. A static stretch was
applied to the quadriceps to the point of discomfort and held for 15 seconds.
Control group (N ~ 6): participants did not stretch.
Outcomes The following measures were taken 24, 48 and 72 hours after exercise:
1. Pain experienced in the quadriceps muscle whilst descending a flight of stairs rated on a 10 cm visual
analogue scale anchored at 0 (“no pain”) and 10 (“severe pain”).
Risk of bias
McGlynn 1979
Participants 24 men aged 18-26 years who had not engaged in any systematic activity with their non-dominant arms
in the past 30 days
Interventions Stretch group (N ~ 12): participants “hyperextended” the “forearm” for two minutes before releasing the
stretch for one minute. This sequence was repeated four times each at 6, 25, 30, 49 and 54 hours after
exercise.
Control group (N ~12): participants did not stretch.
Outcomes The following measures were taken 24, 48 and 72 hours after exercise:
1. Pain rated on a 30-point scale, where 0-10 was “mild” pain, 11-20 was “moderate” pain, and 21-30
was “severe” pain.
Notes Part of a larger study in which subjects were randomised to three interventions (control, stretch, biofeed-
back).
Strech was after exercise.
Soreness was induced with eccentric elbow flexor exercises perfomed to failure.
Risk of bias
Terry 1985
Participants 30 healthy participants, 15 men and 15 women, aged between 18 and 35 years. The modal level of exercise
was three times per week.
Interventions Stretch (hold-relax)leg: participants lay prone with a wedge under the thigh and the knee was actively
flexed as far as possible. Then the participant performed an isometric contraction against manual resistance
for 4-6 seconds. This was followed by two seconds of relaxation and then an 8 second passive stretch. This
was repeated 5 times.
Control leg: the other leg was not stretched.
Risk of bias
Wessel 1994a
Participants 10 sedentary adults (5 women and 5 men) with no history of back or lower limb injury or disease, mean
age 24.2 (SD 5.37), mean height 175.5 cm (SD 7.6) and mean mass 66.3 kg (8.9)
Interventions Stretch leg: ten 60-second stretches of the hamstring muscles prior to exercise.
Control leg: not stretched.
Outcomes The following measures were taken at 12 hour intervals to 72 hours after exercise:
1. Pain on a 10 cm visual analogue scale while walking on an “even” surface.
Risk of bias
Wessel 1994b
Participants 10 sedentary adults (2 women and 8 men) with no history of back or lower limb injury or disease, mean
age 25.2 (SD 3.36), mean height 171.2 cm (SD 7.29) and mean mass 61.3 kg (7.12)
Interventions Stretch leg: ten 60-second stretches of the hamstring muscles after exercise.
Control leg: not stretched.
Outcomes The following measures were taken at 12 hour intervals to 72 hours after exercise:
1. Pain on a 10 cm visual analogue scale while walking on an “even” surface.
Risk of bias
Abraham 1977 Stretching occurred 24 hours after exercise; not clear if conditions (stretch/flex) were randomised.
Jayaraman 2004 Stretching did not begin until 36 hours after exercise.
Lightfoot 1997 Plantarflexors were sore, but quadriceps and hamstring muscles were stretched (fails criterion of “stretching
technique designed to prevent or treat delayed-onset muscle soreness”).
Prentice 1982 Stretch combined with heat or cold; interventions 24 hours after exercise; did not measure soreness.
Rahnama 2005 Stretching combined with jogging and walking and submaximal concentric contractions.
Reilly 2002 Not clearly randomised; stretch combined with jogging and “shake-down”.
No. of No. of
Outcome or subgroup title studies participants Statistical method Effect size
1 Soreness on day 0.5 (assessed 6- 1 Mean Difference (IV, Fixed, 95% CI) Totals not selected
17 hours post-exercise)
2 Soreness on day 1 (assessed 18- 3 70 Mean Difference (IV, Fixed, 95% CI) -0.52 [-11.30,
29 hours post-exercise) 10.26]
3 Soreness on day 1.5 (assessed 30- 1 Mean Difference (IV, Fixed, 95% CI) Totals not selected
41 hours post-exercise)
4 Soreness on day 2 (assessed 42- 2 40 Mean Difference (IV, Fixed, 95% CI) 0.72 [-11.20, 12.64]
53 hours post-exercise)
5 Soreness on day 2.5 (assessed 54- 1 Mean Difference (IV, Fixed, 95% CI) Totals not selected
65 hours post-exercise)
6 Soreness on day 3 (assessed 66- 2 40 Mean Difference (IV, Fixed, 95% CI) -2.50 [-15.82,
77 hours post-exercise) 10.82]
No. of No. of
Outcome or subgroup title studies participants Statistical method Effect size
1 Soreness on day 0.5 (assessed 6- 2 51 Mean Difference (IV, Fixed, 95% CI) -0.47 [-6.05, 5.12]
17 hours post-exercise)
2 Soreness on day 1 (assessed 18- 4 127 Mean Difference (IV, Fixed, 95% CI) -1.04 [-6.88, 4.79]
29 hours post-exercise)
3 Soreness on day 1.5 (assessed 30- 1 Mean Difference (IV, Fixed, 95% CI) Totals not selected
41 hours post-exercise)
4 Soreness on day 2 (assessed 42- 5 158 Mean Difference (IV, Fixed, 95% CI) 1.12 [-4.63, 6.87]
53 hours post-exercise)
5 Soreness on day 2.5 (assessed 54- 1 Mean Difference (IV, Fixed, 95% CI) Totals not selected
65 hours post-exercise)
6 Soreness on day 3 (assessed 66- 3 67 Mean Difference (IV, Fixed, 95% CI) -0.03 [-7.49, 7.43]
77 hours post-exercise)
No. of No. of
Outcome or subgroup title studies participants Statistical method Effect size
1 Soreness on day 0.5 (assessed 6- 3 71 Mean Difference (IV, Fixed, 95% CI) -0.97 [-6.24, 4.29]
17 hours post-exercise)
2 Soreness on day 1 (assessed 18- 7 197 Mean Difference (IV, Fixed, 95% CI) -0.93 [-6.05, 4.20]
29 hours post-exercise)
3 Soreness on day 1.5 (assessed 30- 2 40 Mean Difference (IV, Fixed, 95% CI) 1.0 [-14.37, 16.37]
41 hours post-exercise)
4 Soreness on day 2 (assessed 42- 7 198 Mean Difference (IV, Fixed, 95% CI) 1.04 [-4.14, 6.22]
53 hours post-exercise)
5 Soreness on day 2.5 (assessed 54- 2 40 Mean Difference (IV, Fixed, 95% CI) -0.75 [-13.25,
65 hours post-exercise) 11.76]
6 Soreness on day 3 (assessed 66- 5 107 Mean Difference (IV, Fixed, 95% CI) -0.28 [-6.79, 6.22]
77 hours post-exercise)
Analysis 1.1. Comparison 1 Pre-exercise stretching, Outcome 1 Soreness on day 0.5 (assessed 6-17 hours
post-exercise).
High 1989 14 63.2 (37.5) 16 66.9 (37.5) 16.1 % -3.70 [ -30.60, 23.20 ]
Analysis 1.3. Comparison 1 Pre-exercise stretching, Outcome 3 Soreness on day 1.5 (assessed 30-41 hours
post-exercise).
Johansson 1999 10 70.5 (16.6) 10 69.4 (17.1) 65.1 % 1.10 [ -13.67, 15.87 ]
Analysis 1.5. Comparison 1 Pre-exercise stretching, Outcome 5 Soreness on day 2.5 (assessed 54-65 hours
post-exercise).
Johansson 1999 10 39.4 (23.8) 10 38.2 (24.1) 40.3 % 1.20 [ -19.79, 22.19 ]
Analysis 2.1. Comparison 2 Post-exercise stretching, Outcome 1 Soreness on day 0.5 (assessed 6-17 hours
post-exercise).
McGlynn 1979 12 29.4 (20) 12 27.5 (19.5) 13.6 % 1.90 [ -13.90, 17.70 ]
Terry 1985 30 23.6 (23.6) 30 24.7 (23.6) 23.8 % -1.10 [ -13.04, 10.84 ]
Analysis 2.3. Comparison 2 Post-exercise stretching, Outcome 3 Soreness on day 1.5 (assessed 30-41 hours
post-exercise).
Buroker 1989 15 65.2 (23.1) 8 68.5 (13.7) 14.6 % -3.30 [ -18.36, 11.76 ]
McGlynn 1979 12 29.4 (20) 12 27.2 (20.4) 12.7 % 2.20 [ -13.96, 18.36 ]
Terry 1985 30 23.3 (24) 30 24.4 (24) 22.4 % -1.10 [ -13.25, 11.05 ]
Analysis 2.5. Comparison 2 Post-exercise stretching, Outcome 5 Soreness on day 2.5 (assessed 54-65 hours
post-exercise).
Buroker 1989 15 51.8 (20.2) 8 50.3 (26.5) 12.6 % 1.50 [ -19.52, 22.52 ]
McGlynn 1979 12 11.4 (9.9) 12 11.4 (13) 65.1 % 0.0 [ -9.25, 9.25 ]
Analysis 3.1. Comparison 3 Either pre- or post-exercise stretching, Outcome 1 Soreness on day 0.5
(assessed 6-17 hours post-exercise).
High 1989 14 63.2 (37.5) 16 66.9 (37.5) 3.6 % -3.70 [ -30.60, 23.20 ]
McGlynn 1979 12 29.4 (20) 12 27.5 (19.5) 10.5 % 1.90 [ -13.90, 17.70 ]
Terry 1985 30 23.6 (23.6) 30 24.7 (23.6) 18.4 % -1.10 [ -13.04, 10.84 ]
Analysis 3.3. Comparison 3 Either pre- or post-exercise stretching, Outcome 3 Soreness on day 1.5
(assessed 30-41 hours post-exercise).
Buroker 1989 15 65.2 (23.1) 8 68.5 (13.7) 11.8 % -3.30 [ -18.36, 11.76 ]
Johansson 1999 10 70.5 (16.6) 10 69.4 (17.1) 12.3 % 1.10 [ -13.67, 15.87 ]
McGlynn 1979 12 29.4 (20) 12 27.2 (20.4) 10.3 % 2.20 [ -13.96, 18.36 ]
Terry 1985 30 23.3 (24) 30 24.4 (24) 18.2 % -1.10 [ -13.25, 11.05 ]
Analysis 3.6. Comparison 3 Either pre- or post-exercise stretching, Outcome 6 Soreness on day 3 (assessed
66-77 hours post-exercise).
Buroker 1989 15 51.8 (20.2) 8 50.3 (26.5) 9.6 % 1.50 [ -19.52, 22.52 ]
Johansson 1999 10 39.4 (23.8) 10 38.2 (24.1) 9.6 % 1.20 [ -19.79, 22.19 ]
McGlynn 1979 12 11.4 (9.9) 12 11.4 (13) 49.6 % 0.0 [ -9.25, 9.25 ]
HISTORY
Protocol first published: Issue 1, 2004
Review first published: Issue 4, 2007
CONTRIBUTIONS OF AUTHORS
The protocol for the current review was written by Rob Herbert. Data collection, data extraction, quality assessment, data analysis
and interpretation were carried out by Marcos de Noronha and Rob Herbert. Rob Herbert wrote the review. Marcos de Noronha
commented on drafts and approved the final version. Rob Herbert is guarantor for the review.
DECLARATIONS OF INTEREST
None known.
SOURCES OF SUPPORT
Internal sources
External sources
INDEX TERMS