com
Reclutar
Lumbalgia y ciática:
manejo de la lumbalgia
inespecífica y la ciática
Valoración y tratamientos no invasivos
febrero 2016
Contenido
Miembros del Grupo de Desarrollo de Directrices ............................................... .......................................... 11
6.3 Pregunta de revisión 2: ¿Cuál es la eficacia clínica y económica de estratificar el tratamiento del dolor lumbar
inespecífico o la ciática de acuerdo con el resultado de una herramienta/cuestionario de evaluación de
riesgos? ............... .................................................... ........................ 62
13.3.1 Resumen de los estudios incluidos: intervenciones únicas .................................. ... 458
patricio colina Psicólogo consultor honorario, Servicios del dolor Royal United Hospitals Bath NHS
Foundation Trust y Taunton and Somerset NHS Foundation Trust
marca mason representante del paciente
Neil O'Connell Profesor Titular, Departamento de Ciencias Clínicas, Facultad de Ciencias de la Salud y
la Vida; Instituto de Medio Ambiente, Salud y Sociedades, Universidad Brunel de
Londres
Felipe Vender Cirujano ortopédico consultor, University Hospitals of Leicester NHS Trust y
Nottingham University Hospitals NHS Trust
Simón Somerville Médico general con interés especial en medicina musculoesquelética, Park
Medical Center, Leek, Staffordshire
helen taylor Enfermera Especialista, Soluciones para el Manejo del Dolor (hasta septiembre de 2014)
chris pozos Consultor en Medicina del Dolor, Liverpool y Presidente, Federación Europea
del Dolor (EFIC)
Nombre Role
kim arquero Project Manager (hasta mayo de 2014)
kate ashmore Editor de documentos/Asistente de procesos (desde abril de 2015 hasta junio de 2015)
ella peluquero Research Fellow (desde octubre de 2014 hasta febrero de 2015)
Nombre Role
rey betania Editora de documentos/Asistente de procesos (desde julio de 2014 hasta abril de 2015)
Rachel O'Mahony Senior Research Fellow (desde octubre de 2014 hasta noviembre de 2015)
2cooptados
1Agradecimientos
2 El desarrollo de esta guía contó con la gran ayuda de las siguientes personas:
3 Neil Askew, Katie Broomfield, Saskia Cheyne, Jill Cobb, Emily Davies, Caroline Farmer, Francesca Fasesin,
4 Jessica Flynn, Jessica Glen, Katie Jones, Jacoby Patterson, Joshua Ruegger, Josh South, Nancy Turnbull, Ruth
5 Wong y Giulia Zuodar.
11Resumen de la guía
2
1.11Algoritmo
Brindar a las personas asesoramiento e información, adaptados a sus necesidades y capacidades, para ayudarlos a
controlar por sí mismos su dolor lumbar inespecífico con o sin ciática, que incluye:
-información sobre la naturaleza del dolor lumbar y la ciática inespecíficos Y
¿El paciente
-estímulo para continuar con las actividades normales en la medida de lo posible.
tener predominante
Y SI APROPIA ¿ciática?
Ofrecer antiinflamatorios no esteroideos orales (AINE) para el tratamiento del dolor lumbar inespecífico teniendo
en cuenta las posibles diferencias en la toxicidad gastrointestinal, hepática y cardiorrenal y; los factores de riesgo Sí
de la persona, incluida la edad.
Use AINE orales a la dosis efectiva más baja durante el período de tiempo más corto posible.
Considere los opioides débiles (con o sin paracetamol) para controlar el dolor lumbar agudo inespecífico solo
cuando un AINE esté contraindicado, no se tolere o haya sido ineficaz.
Cuando prescriba AINE orales para el dolor lumbar inespecífico, piense en la evaluación clínica adecuada,
el control continuo de los factores de riesgo y el uso de un tratamiento gastroprotector.
Y
B Además de las recomendaciones en el
recuadro (A) y (B)
Considere un programa de ejercicio grupal (biomecánico, aeróbico, mente-cuerpo o una combinación de enfoques)
dentro del NHS para personas con un episodio específico o brote de dolor lumbar con o sin ciática. Tener en cuenta las [Para obtener recomendaciones sobre
necesidades, capacidades y preferencias específicas de las personas a la hora de elegir el tipo de ejercicio. farmacología para el tratamiento de la
ciática, consulte el
Guía de dolor neuropático CG173.]
Considere técnicas de manipulación, movilización o tejidos blandos (por ejemplo, masajes) para controlar el dolor
lumbar inespecífico con o sin ciática, pero solo como parte de paquetes de tratamiento multimodal. Considere las inyecciones epidurales de
anestésico local y esteroides en personas
O
con ciática aguda.
Considere las terapias psicológicas para controlar el dolor lumbar inespecífico con o sin ciática, pero solo como
parte de paquetes de tratamiento multimodal.
Considere un programa físico y psicológico combinado (preferiblemente en un contexto grupal, que tenga en cuenta
las necesidades y capacidades específicas de una persona) para personas con dolor lumbar persistente no específico o
ciática:
-cuando tienen obstáculos psicosociales significativos para la recuperación, o
si es inapropiado
Considere los riesgos y beneficios del NOTA: Para obtener recomendaciones sobre la
tratamiento en curso. estimulación de la médula espinal, consulte la evaluación
de la tecnología de estimulación de la médula espinal para
el dolor crónico de origen neuropático o isquémico TA159.
Tratamiento adicional
poco probable que sea de beneficio
8 3. Explique a las personas con lumbalgia con o sin ciática que si se las deriva para la
9 opinión de un especialista, es posible que no necesiten imágenes.
25 8. No ofrezca cinturones o corsés para el manejo del dolor lumbar inespecífico con
26 o sin ciática.
27 9. No ofrezca aparatos ortopédicos para los pies para controlar el dolor lumbar inespecífico
28 con o sin ciática.
29 10. No ofrezca zapatos con suela basculante para controlar el dolor lumbar inespecífico
30 con o sin ciática.
31 11. No ofrezca tracción para controlar el dolor lumbar inespecífico con o sin
32 ciática.
33 12. Considerar técnicas de manipulación, movilización o tejidos blandos (por ejemplo,
34 masajes) para controlar el dolor lumbar inespecífico con o sin ciática.
35 pero solo como parte de paquetes de tratamiento multimodal.
36 13. No ofrezca acupuntura para el tratamiento del dolor lumbar inespecífico con o
37 sin ciática
38 14. No ofrezca ultrasonido para el manejo del dolor bajo inespecífico con o sin
39 ciática.
40 15. No ofrezca PENS para controlar el dolor lumbar inespecífico con o sin
41 ciática.
42 16. No ofrezca TENS para controlar el dolor lumbar inespecífico con o sin
43 ciática.
6 20. Cuando prescriba AINE orales para el dolor lumbar inespecífico, piense en la evaluación
7 adecuada, el seguimiento continuo de los factores de riesgo y el uso de un
8 tratamiento gastroprotector.
9 21. Use AINE orales a la dosis efectiva más baja durante el período de tiempo más corto
10 posible.
13 24. Considere los opioides débiles (con o sin paracetamol) para controlar el dolor
14 lumbar agudo inespecífico solo cuando un AINE esté contraindicado, no se
15 tolere o haya sido ineficaz.
dieciséis 25. No ofrecer opioides para el manejo del dolor lumbar crónico inespecífico.
25 o
26 - cuando los tratamientos previos no han sido efectivos.
30 31. Considerar la derivación para evaluación de denervación por radiofrecuencia para personas con dolor
31 lumbar crónico inespecífico con sospecha de dolor en las articulaciones facetarias cuando:
35 32. Solo realice denervación por radiofrecuencia después de una respuesta positiva a un bloqueo de rama medial
36 de diagnóstico para personas con dolor lumbar crónico inespecífico con sospecha de dolor en las
37 articulaciones facetarias.
38 33. Considere las inyecciones epidurales de anestésicos locales y esteroides en personas con
39 ciática aguda.
40 34. No use inyecciones epidurales para la claudicación neurogénica en personas que tienen
41 estenosis del canal espinal central.
4 38. Considere la descompresión espinal para personas con ciática cuando no sea quirúrgica
5 el tratamiento no ha mejorado el dolor o la función. (Para obtener recomendaciones sobre el
6 manejo farmacológico de la ciática, consulte la guía NICE sobre el dolor neuropático en
7 adultos)
20 6. ¿Cuál es la rentabilidad clínica y económica de las inyecciones epidurales guiadas por imágenes en comparación
21 con las inyecciones epidurales no guiadas por imágenes para personas con ciática aguda?
22 7. ¿Se debe ofrecer la fusión espinal como opción quirúrgica a las personas con dolor lumbar
23 inespecífico?
24
21Introducción
2 Esta guía cubre la evaluación y el tratamiento del dolor lumbar inespecífico y la ciática en
3 adultos mayores de 16 años.
4 El dolor lumbar inespecífico es un término comúnmente utilizado en la literatura para describir el dolor en la espalda entre
5 la parte inferior de la caja torácica y los pliegues de los glúteos.
6 Un diagnóstico de dolor lumbar inespecífico simplemente significa que es muy poco probable que el dolor de espalda
7 sea causado por una patología grave como cáncer, infección, fractura o como parte de un proceso inflamatorio más
8 generalizado.
9 Las causas graves de dolor lumbar son raras (por ejemplo, menos del 1 % de los pacientes que presentan dolor lumbar en la
10 atención primaria tendrán cáncer como causa subyacente).(1)y los médicos generalmente son alertados sobre la posibilidad de
11 una patología grave mediante el uso de herramientas de detección clínica ("detección de bandera roja").
12 Todos los médicos involucrados en el tratamiento del dolor lumbar deben ser conscientes de los síntomas y
13 signos comunes de "bandera roja" y saber cuándo derivar a los pacientes para realizar más pruebas. Esta guía
14 excluye la evaluación y el manejo de patología espinal grave (infección, malignidad y fracturas), las causas
15 inflamatorias del dolor lumbar y las secuelas neurológicas potencialmente graves de la ciática (déficit
dieciséis neurológico progresivo y síndrome de cauda equina), ni cubre el manejo posterior. de pacientes con sospecha
17 de patología grave. Las señales de alerta comunes del dolor lumbar se han incluido en el apéndice P.
18
19 Varias estructuras de la columna están inervadas por nervios sensoriales y, por lo tanto, son capaces de generar dolor. A pesar
20 de esto, no existen características clínicas confiables o hallazgos de imágenes que nos permitan identificar estas causas
21 específicas con confianza. Capturamos esta incertidumbre diagnóstica mediante el uso del término ahora ampliamente
22 aceptado "dolor lumbar no específico", pero reconocemos que la terminología es imperfecta. A lo largo del texto de la guía,
23 hemos utilizado "dolor lumbar" en el sentido de "dolor lumbar no específico", a menos que se indique lo contrario.
24
25 Si bien el término "dolor lumbar inespecífico" puede ser útil para los médicos en términos de describir una afección que es muy
26 poco probable que sea causada por un proceso de enfermedad grave, no implica la ausencia de una causa subyacente. Existe el
27 riesgo de que, al utilizar el término "no específico", se interprete erróneamente como "no orgánico" o como manifestación de
28 una psicología o un comportamiento anormales. El término simplemente refleja nuestra dificultad para identificar con precisión
29 la causa del dolor de espalda discreto y la incapacidad para definir con precisión qué características podrían ayudar a identificar
30 causas específicas.
31 El dolor lumbar causa más discapacidad, en todo el mundo, que cualquier otra condición. Los episodios de dolor de espalda suelen ser
32 transitorios y se observan mejoras rápidas en el dolor y la discapacidad en unas pocas semanas o unos pocos meses. Si bien la mayoría
33 de los episodios de dolor de espalda se resuelven espontáneamente, hasta un tercio de los pacientes informan dolor de espalda
34 persistente de al menos una intensidad moderada un año después de un episodio agudo que requiere atención y los episodios de dolor
35 de espalda suelen reaparecer.
36 Uno de los mayores desafíos sigue siendo la identificación de los factores de riesgo que pueden predecir la progresión de un
37 único episodio de dolor de espalda a una condición de dolor persistente a largo plazo donde la calidad de vida suele ser muy
38 baja y el uso de recursos de atención médica es alto.
39 Una interacción compleja y variable entre factores biológicos, psicológicos y sociales sin duda influye en esta
40 progresión y es la modificación de estos factores lo que se ha convertido en uno de los pilares de la investigación y el
41 tratamiento del dolor de espalda durante la última década más o menos.
4 Hemos revisado la evidencia para la estratificación del tratamiento y la efectividad de adaptar los tratamientos a estos
5 grupos estratificados con la esperanza de que los médicos sepan qué pacientes probablemente necesiten un
6 tratamiento más enfocado e intensivo y qué pacientes probablemente mejoren espontáneamente sin intervención.
7
8 Además de evaluar la evidencia de los tratamientos para el dolor lumbar, hemos revisado los tratamientos disponibles
9 para la ciática. "Ciática" es un término que los pacientes y los médicos entienden y que se usa ampliamente en la
10 literatura para describir el dolor neuropático en las piernas secundario a una patología compresiva de la columna.
11
12 El pronóstico para los pacientes con ciática es extremadamente bueno y la mayoría de los pacientes encontrarán que el dolor
13 y la discapacidad asociada mejoran rápidamente sin tratamiento.
14 Esta guía no cubre la evaluación o el cuidado de pacientes que presentan ciática con déficit neurológico
15 progresivo o síndrome de cauda equina. Todos los médicos involucrados en el manejo de pacientes con
dieciséis ciática deben ser conscientes de estas posibles emergencias neurológicas y saber cuándo derivar a un
17 especialista apropiado.
18 En contraste con la guía anterior de NICE sobre el manejo del dolor lumbar persistente entre 6 semanas y
19 12 meses para adultos mayores de 18 años (NICE CG88), este documento brinda orientación sobre la
20 evaluación y el manejo del dolor lumbar y la ciática desde primera presentación en adelante en una
21 población adulta mayor de 16 años.
22 Con este alcance ampliado y utilizando la metodología NICE actualizada para examinar la evidencia de
23 investigación más reciente, esperamos abordar la provisión e implementación inconsistentes de las
24 recomendaciones de CG88 y proporcionar a los pacientes, cuidadores y profesionales de la salud un marco
25 sensato, práctico y basado en evidencia para el manejo. de este importante y común problema.200
26
27
31Desarrollo de la guía
3.12¿Qué es una guía clínica NICE?
3 Las guías clínicas NICE son recomendaciones para el cuidado de personas en condiciones o circunstancias clínicas
4 específicas dentro del NHS, desde la prevención y el autocuidado hasta la atención primaria y secundaria hasta servicios
5 más especializados. Basamos nuestras guías clínicas en la mejor evidencia científica disponible, con el objetivo de
6 mejorar la calidad de la atención sanitaria. Usamos métodos predeterminados y sistemáticos para identificar y evaluar la
7 evidencia relacionada con preguntas de revisión específicas.
9 - Proporcionar recomendaciones para el tratamiento y la atención de las personas por parte de los profesionales de la salud.
10 - Ser utilizados para desarrollar estándares para evaluar la práctica clínica de los profesionales de la salud individuales. Ser
14 Si bien las guías ayudan en la práctica de los profesionales de la salud, no reemplazan sus conocimientos y
15 habilidades.
18 - las partes interesadas registran un interés en la guía y son consultadas a lo largo del proceso de
19 desarrollo
20 - el alcance es preparado por el Centro Nacional de Directrices Clínicas (NCGC) el
22 - se produce un borrador de la guía después de que el grupo evalúa la evidencia disponible y hace
23 recomendaciones
24 - hay una consulta sobre el borrador de la
25 - directriz Se produce la directriz final.
33 Esta versión es la versión completa. Las otras versiones se pueden descargar desde NICE en www.nice.org.uk.
3.234Remitir
35 NICE recibió el mandato de esta guía del NHS de Inglaterra. NICE encargó al NCGC que
36 produjera la guía.
1 Esta es una actualización de Dolor lumbar: manejo temprano del dolor lumbar inespecífico persistente (directriz
2 clínica NICE 88).
3 - El punto de corte temporal de 12 meses y la restricción al dolor que ha persistido durante 6 semanas
4 especificado en la guía clínica NICE 88 se ha eliminado para la actualización de la guía. No habrá
5 restricción en la duración del dolor lumbar.
6 - La población se ha ampliado para incluir personas con ciática.
7 - La edad de las personas cubiertas por la actualización de la guía se ha ampliado para incluir a personas de 16
8 años o más. Esta es una población adicional no incluida en la guía clínica NICE 88.
3.39Epidemiología
10Lumbalgia
11 El dolor lumbar causa más discapacidad, en todo el mundo, que cualquier otra condición. La prevalencia y la carga
12 aumentan con la edad hasta alrededor de la sexta década, y se ha informado que la prevalencia mundial es más alta en
13 Europa occidental.214En una gran encuesta en toda Europa, Breivik informó una prevalencia de dolor persistente e
14 intrusivo del 19 %.48De ellos, el 42% informó dolor de espalda, con mucho, el sitio regional más común. La prevalencia del
15 dolor de espalda es (al igual que la mayoría de los dolores regionales) más común en mujeres que en hombres, y
dieciséis aumenta con la edad alcanzando un máximo alrededor de los 7 años.eldécada.
17 La exposición a una serie de factores físicos y psicosociales modificables aumenta el riesgo de un 18 episodio. Los
desencadenantes físicos de un episodio de dolor lumbar incluyen levantar cargas pesadas, posiciones incómodas y
actividad física. Los desencadenantes psicosociales del episodio pueden incluir distracción mientras 20
emprender una tarea y fatiga.213,443Altos niveles de angustia psicológica se han asociado con la aparición de dolor de
21 espalda al igual que factores de estilo de vida como el sobrepeso y el tabaquismo.140,348Los factores laborales, incluidas
22 las altas demandas laborales, los bajos niveles de apoyo de los colegas y la insatisfacción laboral, se han evaluado.
23 encontró que aumenta el riesgo de aparición de dolor de espalda. Estos riesgos asociados con exposiciones físicas, 24
Se ha encontrado que los factores psicosociales y el estilo de vida explican en parte por qué el dolor de espalda es más común
25 entre las personas de nivel socioeconómico más bajo.297
26 De manera similar, la persistencia de un episodio de dolor de espalda está relacionada con factores clínicos, estilo de vida y
27 factores psicosociales, incluidas la angustia y las creencias de evitación del miedo.251,386
28Ciática
29 La ciática es una afección relativamente común con una incidencia de por vida que oscila entre el 13 y el 40 %. La incidencia anual
30 correspondiente de un episodio de ciática oscila entre el 1 y el 5%. La incidencia de la ciática está relacionada con la edad: rara
31 vez se observa antes de los 20 años, la incidencia alcanza su punto máximo en la quinta década y luego disminuye. Los factores
32 modificables asociados con una primera aparición de ciática incluyen el tabaquismo, la obesidad, los factores ocupacionales y el
33 estado general de salud.89
38 El Instituto Nacional para la Excelencia en Salud y Atención (NICE) financia el Centro Nacional de Pautas
39 Clínicas (NCGC) y, por lo tanto, apoyó el desarrollo de esta guía. El GDG fue convocado por el NCGC y
40 presidido por Stephen Ward de acuerdo con la orientación de NICE.
1 El grupo se reunió aproximadamente cada 4 semanas durante el desarrollo de la guía. Al comienzo del proceso de
2 desarrollo de la guía, todos los miembros del GDG declararon intereses que incluían consultorías, trabajo remunerado,
3 participaciones accionarias, becas y apoyo de la industria de la salud. En todas las reuniones posteriores del GDG, los
4 miembros declararon que surgían conflictos de intereses.
5 Los miembros estaban obligados a retirarse total o parcialmente de la discusión si su interés declarado lo hacía
6 apropiado. Los detalles de los intereses declarados y las acciones tomadas se muestran en el Apéndice B.
7
8 El personal del NCGC brindó apoyo metodológico y orientación para el proceso de desarrollo. El equipo
9 que trabajó en la guía incluyó un director de proyecto, un editor de documentos, revisores sistemáticos
10 (becarios de investigación), economistas de la salud y científicos de la información. Realizaron
11 búsquedas sistemáticas de la literatura, evaluaron la evidencia, realizaron metanálisis y análisis de
12 costo-efectividad cuando fue apropiado y redactaron la guía en colaboración con el GDG.
23 - relajantes musculares
24 - antidepresivos
25 - anticonvulsivos
26 - antibióticos a largo plazo.
27 Tenga en cuenta que las recomendaciones de las guías normalmente estarán dentro de las indicaciones autorizadas;
28 excepcionalmente, y solo si está claramente respaldado por evidencia, se puede recomendar el uso fuera de una indicación
29 autorizada ('uso fuera de etiqueta'). La guía supondrá que los prescriptores utilizarán un resumen de las características del producto
30 de un fármaco para informar las decisiones tomadas con pacientes individuales.
31 4. Intervenciones no farmacológicas. Estos incluirán pero no se limitan a:
32 - terapias de ejercicios (por ejemplo, ejercicios generales para controlar el dolor lumbar inespecífico, ejercicios
33 específicos para la parte inferior de la espalda; yoga, programas de ejercicios grupales e individualizados)
1 7. Cirugía:
2 - Indicaciones de derivación a cirugía.
3 - intervenciones quirúrgicas (por ejemplo, fusión y reemplazo de disco para el dolor lumbar y discectomía o
4 laminectomía y cirugía de descompresión para la ciática).
5 Para obtener más detalles, consulte el alcance en el Apéndice A y las preguntas de revisión en la Sección 4.1.
12 - trastornos neurológicos (incluido el síndrome de cauda equina), patología espinal grave (por ejemplo,
13 neoplasias, infecciones o colapso osteoporótico).
14 2. Cuidados postoperatorios.
15 3. Estimulación de la médula espinal.
dieciséis 4. Tratamientos farmacológicos de la ciática.
26 - Inserción de un implante de disco anular discectomía lumbar. Guía de procedimiento intervencionista NICE (2014).
27
28 - Estimulación del campo nervioso periférico para el dolor lumbar crónico. Guía de procedimientos de
29 intervención NICE 451 (2013).
30 - Fusión lumbosacra intersomática transaxial. Guía de procedimientos de intervención NICE 387 (2011).
31 - Técnicas de estabilización no rígidas para el tratamiento del dolor lumbar. Guía de procedimientos
32 de intervención NICE 366 (2010).
33 - Procedimientos de distracción interespinosa para la estenosis espinal lumbar que causa claudicación
34 neurogénica. Guía de procedimientos de intervención NICE 365 (2010).
39 - Fusión intersomática lateral (incluyendo extrema, extra y lateral directa) en la columna lumbar. Guía de
40 procedimientos de intervención NICE 321 (2009).
5 - Discectomía lumbar percutánea endoscópica con láser. Guía de procedimientos de intervención NICE 300
6 (2009).
7 - Descompresión percutánea del disco mediante coblación para el dolor lumbar. Guía de procedimientos de
8 intervención NICE 173 (2006).
24 - Enfermedad de larga duración e incapacidad para el trabajo. NICE guía de salud pública 19 (2009).
31 - Artropatías seronegativas. Guía clínica NICE. Publicación prevista para diciembre de 2016.
41Métodos
2 Este capítulo establece en detalle los métodos utilizados para revisar la evidencia y desarrollar las
3 recomendaciones que se presentan en los capítulos siguientes de esta guía. Esta guía se
4 desarrolló de acuerdo con los métodos descritos en el manual de pautas NICE, 2012.356
5 Las Secciones 4.1 a 4.3 describen el proceso utilizado para identificar y revisar la evidencia clínica (resumida en la Figura
6 2), las Secciones 4.2 y 4.4 describen el proceso utilizado para identificar y revisar la evidencia económica en salud, y la
7 Sección 4.5 describe el proceso utilizado para desarrollar recomendaciones.
9 Las preguntas de revisión se desarrollaron utilizando un marco PICO (paciente, intervención, comparación y resultado) para las
10 revisiones de intervención; usar un marco de población, pruebas de índice, estándar de referencia y condición objetivo para
11 revisiones de herramientas de diagnóstico de riesgo; usar la población, la prueba y el tratamiento índice, la prueba y el
12 tratamiento de comparación para las revisiones de prueba y tratamiento; y usar población, presencia o ausencia de factores bajo
13 investigación (por ejemplo, factores pronósticos) y resultados para revisiones de pronósticos.
14 Este uso de un marco guió el proceso de búsqueda de literatura, evaluación crítica y síntesis de evidencia,
15 y facilitó el desarrollo de recomendaciones por parte del GDG. Las preguntas de revisión fueron
dieciséis redactadas por el equipo técnico del NCGC y refinadas y validadas por el GDG. Las preguntas se basaron
17 en las áreas clínicas clave identificadas en el alcance (Apéndice A).
2 Se realizaron búsquedas bibliográficas completas, evaluaciones críticas y revisiones de evidencia para todas las preguntas de revisión
3 especificadas.
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
6 Riesgo pronóstico ¿Qué herramientas validadas de evaluación -Área bajo la curva ROC
instrumentos de riesgos son las más precisas para (cindex, c-statistic).
identificar a las personas con dolor lumbar -Sensibilidad, especificidad, valores
con o sin ciática en riesgo de mala predictivos, razón de verosimilitud.
evolución/mejoría tardía?
-Reclasificación
6 Intervención ¿Cuál es la eficacia clínica y económica de Resultados críticos:
estratificar el tratamiento del dolor lumbar -Calidad de vida relacionada con la
inespecífico con o sin ciática según el salud (por ejemplo, SF-12, SF-36 o
resultado de una herramienta/cuestionario EQ-5D).
de evaluación de riesgos?
-Severidad del dolor (por ejemplo,
escala analógica visual [VAS] o escala
de calificación numérica [NRS]).
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la atención médica
(prescripción, investigaciones,
hospitalización o visita de un
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
2. Mortalidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
2. Mortalidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Mortalidad
2. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Mortalidad
2. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
cuestionario o el índice de
discapacidad de Oswestry).
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
2. Mortalidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Volver al trabajo
18 Intervención ¿Cuál es la efectividad clínica y económica Resultados críticos:
de los programas de regreso al trabajo en el -Calidad de vida relacionada con la
tratamiento del dolor lumbar inespecífico salud (por ejemplo, SF-12, SF-36 o
con o sin ciática? EQ-5D).
Resultados importantes:
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Mortalidad
2. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Mortalidad
2. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
2. Morbilidad
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
2. Morbilidad
3. Tasa de reoperación
Importante
2. Morbilidad
3. Tasa de reoperación
Importante
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Mortalidad
2. Morbilidad
-Tasa de revisión
-Tasa de fracaso
-Eventos adversos:
1. Complicaciones postoperatorias (p.
ej., infección)
-Tasa de revisión
-Tasa de fracaso
-Criterios de respondedor (
≥30% de mejora en el dolor o
la función)
-Eventos adversos:
1. Morbilidad
2. Mortalidad
-Tasa de revisión
-Tasa de fracaso
-Utilización de la asistencia sanitaria
(prescripción, investigaciones,
hospitalización o visita del
profesional de la salud)
4.21Buscando evidencia
3 Se realizaron búsquedas bibliográficas sistemáticas para identificar todas las pruebas clínicas publicadas relevantes para las
4 preguntas de la revisión. Las búsquedas se realizaron de acuerdo con los parámetros estipulados en el manual de directrices
5 NICE.356Se realizaron búsquedas en las bases de datos utilizando encabezados de temas médicos relevantes, términos de texto
6 libre y filtros de tipo de estudio cuando correspondía. Siempre que fue posible, las búsquedas se restringieron a artículos
7 publicados en inglés. No se revisaron los estudios publicados en idiomas distintos del inglés. Todas las búsquedas se realizaron
8 en Medline, Embase y The Cochrane Library. Se utilizaron bases de datos específicas de temas adicionales para algunas
9 preguntas: CINAHL (intervenciones de estilo de vida, combinaciones de intervenciones, intervenciones no invasivas); PsycINFO
10 (combinaciones de intervenciones e intervenciones psicológicas); y AMED (intervenciones no invasivas). Todas las búsquedas se
11 actualizaron el 15 de diciembre de 2010. No se consideraron artículos publicados después de esta fecha.
12
13 La calidad de las estrategias de búsqueda se aseguró mediante la verificación cruzada de las listas de referencias de artículos muy
14 relevantes, el análisis de las estrategias de búsqueda en otras revisiones sistemáticas y la solicitud a los miembros del GDG de que
15 destacaran cualquier estudio adicional. Un segundo científico de la información aseguró la calidad de las búsquedas antes de ejecutarlas.
dieciséis Las preguntas, los tipos de estudio aplicados, las bases de datos buscadas y los años cubiertos se pueden encontrar en el Apéndice G.
17
18 Los títulos y resúmenes de los registros recuperados por las búsquedas se tamizaron por relevancia, y las publicaciones
19 potencialmente significativas se obtuvieron en texto completo. Éstos se evaluaron según los criterios de inclusión.
20
1 Se consideraron todas las referencias enviadas por los interesados. No se realizó la búsqueda de literatura no
2 publicada. El NCGC y el NICE no tienen acceso a los resultados de los ensayos clínicos no publicados de los fabricantes
3 de medicamentos, por lo que la evidencia clínica considerada por el GDG para las intervenciones farmacéuticas puede
4 ser diferente de la considerada por la MHRA y la Agencia Europea de Medicamentos a los fines de la regulación de
5 licencias y seguridad.
7 También se realizaron búsquedas bibliográficas sistemáticas para identificar evidencia económica de la salud dentro de la
8 bibliografía publicada relevante para las preguntas de la revisión. La evidencia se identificó realizando una búsqueda amplia
9 relacionada con el dolor lumbar en Medline (OVID), Embase (OVID), la base de datos de evaluaciones económicas del NHS (NHS
10 EED), la base de datos de evaluación de tecnologías de la salud (HTA) y la base de datos de evaluación económica de la salud
11 ( HEED) sin restricciones de fecha (NHS EED dejó de actualizarse después de marzo de 2015; HEED se utilizó para búsquedas
12 hasta el 29 de octubre de 2013 pero posteriormente dejó de estar disponible a partir de enero de 2015). Además, la búsqueda se
13 realizó en Medline y Embase utilizando un filtro de economía de la salud, desde 2013, para garantizar la identificación de
14 publicaciones recientes que aún no habían sido indexadas por las bases de datos económicas. Esto se complementó con
15 búsquedas adicionales que buscaron documentos económicos relacionados específicamente con la calidad de vida en Medline y
dieciséis Embase, ya que se hizo evidente que algunos documentos en esta área no habían sido identificados en la primera búsqueda.
17 Siempre que fue posible, las búsquedas se restringieron a artículos publicados en inglés. No se revisaron los estudios publicados
18 en idiomas distintos del inglés.
19
20 Las estrategias de búsqueda de economía de la salud se incluyen en el Apéndice G. Todas las búsquedas se actualizaron el 21
21 de diciembre de 2015. No se consideraron artículos publicados después de esta fecha.
25 - Se identificaron estudios potencialmente relevantes para cada pregunta de la revisión a partir de los resultados de búsqueda relevantes
27 - Se revisaron los artículos completos contra los criterios de inclusión y exclusión preespecificados para identificar los
28 estudios que abordaron la pregunta de revisión en la población apropiada y se informaron los resultados de interés (los
29 protocolos de revisión se incluyen en el Apéndice C).
30 - Estudios relevantes evaluados críticamente utilizando la lista de verificación de diseño de estudio apropiada como se especifica en el
31 manual de pautas NICE.356Los estudios de pronóstico se evaluaron críticamente utilizando listas de verificación del NCGC.
32 - Información clave extraída sobre métodos y resultados de estudios de intervención utilizando 'Evibase', el software
33 especialmente diseñado de NCGC. Evibase produce tablas de resumen de evidencia, incluidas calificaciones de evaluación
34 crítica. La información clave sobre los métodos y resultados de estudios no intervencionistas se extrajo manualmente en
35 tablas de evidencia estándar y se evaluó críticamente por separado (las tablas de evidencia se incluyen en el Apéndice H).
36
37 - Resúmenes generados de la evidencia por resultado. Los datos de resultado se combinaron, analizaron e
38 informaron según el diseño del estudio:
39 o Los datos aleatorios se metanalizaron cuando fue apropiado y se informaron en las tablas de perfil
40 GRADE.
41 o Los datos de observación se presentaron como un rango de valores en las tablas de perfil GRADE o se
42 metanalizaron si correspondía.
43 o Los datos pronósticos se metanalizaron cuando fue apropiado y se informaron en las tablas de perfil GRADE. No
44 o se identificaron estudios de diagnóstico para su inclusión.
1 - Una muestra de un mínimo del 10 % de las listas de resúmenes de los primeros 3 cribados realizados por revisores nuevos
2 y aquellas para preguntas de revisión complejas (por ejemplo, revisiones de pronóstico) fueron examinadas dos veces por
3 un investigador senior y se rectificaron las discrepancias. La calidad de todas las revisiones de la evidencia estuvo a cargo
4 de un investigador sénior. Esto incluyó verificar:
10 La inclusión y exclusión de estudios se basó en los criterios definidos en los protocolos de revisión, que se pueden
11 encontrar en el Apéndice C. Los estudios excluidos por pregunta de revisión (con las razones de su exclusión) se
12 enumeran en el Apéndice L. Se consultó al GDG sobre cualquier la incertidumbre con respecto a la inclusión o exclusión
13 y las decisiones específicas tomadas por el GDG se enumeran en 4.3.1.1.
15 -Personas de 16 años o más con dolor lumbar inespecífico con o sin ciática.
24 Los resúmenes de congresos no se incluyeron en ninguna de las revisiones. Se excluyeron revisiones de literatura, carteles,
25 cartas, editoriales, artículos de comentarios, estudios no publicados y estudios que no estaban en inglés.
4.3.1.1.127 Población
28 Las poblaciones incluidas deben tener dolor lumbar con o sin ciática (o según lo especificado por el protocolo de revisión) en la
29 actualidad, especificado de la siguiente manera:
30 - Dolor lumbar inespecífico
31 o dolor discogénico
32 o Enfermedad degenerativa del disco
33 o Estenosis espinal
34 o Hernia de disco lumbar
35 o Secundaria a enfermedad degenerativa lumbar.
36 - Ciática
37 o Ciática/lumbago
38 o Dolor radicular/Radiculopatía Dolor
39 o irradiado a la pierna Claudicación
40 o neurógena Compresión/irritación de la
41 o raíz nerviosa.
1 Aparte de las poblaciones excluidas enumeradas en el alcance (4.3.1), el GDG acordó las siguientes
2 exclusiones:
3 - Poblaciones mixtas, p.ej. personas con dolor lumbar y dolor de cuello (a menos que los resultados presentados en los estudios estén
4 divididos, de modo que solo se puedan extraer los datos de las personas con dolor lumbar). Dolor de espalda relacionado con el
5 - embarazo
9 - Espondilolistesis
10 - espondilosis
11 - Osteoartritis.
12 Se acordó dividir la evidencia presentada en las revisiones sobre la base de los siguientes tres estratos:
dieciséis Cuando los estudios primarios no mencionan la ciática ni en los criterios de inclusión ni en los criterios de
17 exclusión, estos se han considerado bajo los estratos de dolor lumbar con o sin ciática. Los estudios que
18 tienen una población de ciática con o sin dolor lumbar se han analizado bajo los estratos de dolor lumbar
19 con ciática.
4.3.1.1.20Intervenciones y comparaciones
21comparaciones falsas
22 El GDG estuvo de acuerdo en que cuando las intervenciones se compararon con el simulacro, el simulacro debe ser
23 para la intervención de interés, p. ej., se aceptaría una comparación entre la acupuntura y la acupuntura simulada, sin
24 embargo, no se aceptaría la acupuntura comparada con el masaje simulado.
25Cuidado usual
26 La atención habitual se consideró en esta guía como "atención estándar no invasiva en el NHS". Las comparaciones de
27 control de la lista de espera también se agruparon con el cuidado habitual cuando fue posible, en cuyo caso se insertó una
28 nota al pie que indicaba qué estudio tenía qué comparación debajo del diagrama de bosque.
29 Debido a la superposición entre la atención habitual y algunas de las intervenciones no invasivas que se consideran en esta
30 guía (p. ej., ejercicio no supervisado, analgésicos), también se acordó lo siguiente para una comparación de la atención habitual:
31
32 - Si se proporciona una intervención que podría considerarse atención no invasiva estándar en el NHS a ambos grupos y
33 un grupo recibe una intervención adicional, esto se consideraría una comparación de atención habitual. Por ejemplo,
34 los antibióticos más el asesoramiento para mantenerse activo versus el asesoramiento para mantenerse activo se
35 considerarían antibióticos versus atención habitual.
36 - Si la intervención que se administró a ambos grupos estuvo por encima de la atención estándar no invasiva en
37 el NHS (acordada por el GDG), p.ej., inyecciones epidurales más AINE versus inyecciones epidurales, esto se
38 consideraría una intervención combinada versus una sola intervención.
39Intervenciones de ejercicio
40 El GDG acordó que las intervenciones de ejercicio supervisado se revisarían bajo terapias de ejercicio
41 (capítulo 9) y las intervenciones de ejercicio no supervisado bajo estrategias de autocontrol (capítulo 8).
3Intervenciones excluidas
4 Se excluyeron los estudios si no había una descripción suficiente para ellos o si no todos los pacientes
5 recibieron la misma intervención, p. ej., si la descripción de la intervención era solo "ejercicio",
6 "fisioterapia", "terapia manual" o el grupo recibió "ejercicio aeróbico, TENS, AINE'. Estas intervenciones
7 quedarían excluidas ya que el GDG no podría formular recomendaciones basadas en ellas.
11 - electroestimulación muscular
12 - Kinesotaping
14 - Reflexoterapia/Neurorreflexoterapia.
15 El GDG acordó que se excluyeran los siguientes comparadores:
dieciséis - Intervención simulada distinta de la intervención asignada al azar a (como se mencionó anteriormente) Terapia de
17 - relajación como control de atención (si la terapia consiste en tensar y luego relajar los músculos) Intervención fuera
19 - Una intervención combinada administrada a ambos grupos si se considera más allá de la "atención estándar no
20 invasiva en el NHS" (por lo tanto, no puede clasificarse como atención habitual).
21
4.3.1.1.322 Resultados
23 El GDG acordó que los datos presentados en las revisiones se estratificarían de acuerdo con dos puntos de
24 tiempo; igual o inferior a 4 meses y superior a 4 meses. Para cada punto temporal, cuando corresponda, los datos
25 se agruparían. Cuando los estudios informaron un resultado en puntos temporales múltiples dentro del punto
26 temporal de 4 meses, por ejemplo, la intensidad del dolor a los 2 y 4 meses, se extrajo el resultado más cercano a
27 los 4 meses. Cuando los estudios informaron puntos temporales múltiples a más de 4 meses, se informaría el
28 resultado más cercano a los 12 meses, por ejemplo, entre los 6 y los 10 meses, se extraerían los datos de los 10
29 meses. Sin embargo, en los casos en que se informan los resultados de más de 12 meses, por ejemplo, 6 meses y
30 18 meses, se extraerían los datos de 18 meses, ya que este es el final de los datos del ensayo y, por lo tanto, es
31 más informativo para el GDG.
32 El GDG acordó que además de agrupar los mismos resultados entre los estudios, los resultados que miden la gravedad del dolor
33 podrían agruparse si estuvieran en la misma escala, es decir, escala de calificación numérica (NRS) y escala analógica visual (VAS)
34 (ambos informados en un rango de 0-10). Si la EVA se informó en una escala de 0 a 100, se convirtió a 0 a 10. El GDG estuvo de
35 acuerdo en que la puntuación de dolor de McGill no debe combinarse con las escalas de dolor anteriores (informadas en una
36 escala de 0 a 78).
37 El GDG acordó que el cuestionario de discapacidad de Roland Morris (RMDQ) en una escala de 0 a 24 y el índice
38 de discapacidad de Oswestry (ODI) en una escala de 0 a 100 deben combinarse y presentarse como diferencia
39 de medias estandarizada. Para determinar la imprecisión y la importancia clínica, el tamaño del efecto se volvió
40 a convertir a la escala RMDQ 0-24.
41
1 La encuesta de salud SF-36 se califica de tal manera que se dan 8 puntajes de escala: funcionamiento físico, rol
2 físico, dolor corporal, percepciones generales de salud, vitalidad, funcionamiento social, rol emocional y salud
3 mental. Se pueden calcular dos medidas de resumen a partir de estas escalas; puntuación del componente
4 físico y la puntuación del componente mental. Se acordó que, cuando fuera posible, se extraerían todos los
5 dominios para las pruebas. Si no se informaron los dominios individuales, solo se extrajeron las dos medidas de
6 resumen. No se extraerá una sola puntuación global ya que no es apropiado combinar los dominios físico y
7 mental. Se acordó que las encuestas de salud SF-36, RAND-36 y SF-12 podrían combinarse ya que están en la
8 misma escala.
9 El GDG acordó que el 'regreso al trabajo' debe considerarse un resultado crítico para la revisión de la evidencia de las
10 intervenciones de regreso al trabajo (consulte el capítulo 18). También se consideró un resultado importante para la
11 revisión de la evidencia de los programas multidisciplinarios de rehabilitación biopsicosocial debido a la probabilidad de
12 que dichos programas complejos incorporen un elemento de regreso al trabajo.
13
15 Los ensayos aleatorios, los ensayos no aleatorios y los estudios observacionales (incluidos los estudios de
dieciséis diagnóstico o pronóstico) se incluyeron en las revisiones de evidencia según corresponda.
17 Para la mayoría de las revisiones de intervenciones en esta guía, se incluyeron ensayos controlados
18 aleatorios (ECA) paralelos porque se consideran el tipo de diseño de estudio más sólido que puede
19 producir una estimación imparcial de los efectos de la intervención. Se excluyeron los ECA cruzados, a
20 menos que los datos posteriores a la intervención se informaran antes del punto de cruzamiento, en
21 cuyo caso solo se extrajeron estos datos. Si los estudios no aleatorios eran apropiados para su
22 inclusión (por ejemplo, en revisiones de pronóstico), el GDG estableció a priori en el protocolo que el
23 análisis debía ajustarse a ciertas variables. Si el estudio no cumplía con este criterio, se excluía, a
24 menos que no hubiera otra evidencia disponible. Los estudios no aleatorios también se incluyeron en
25 algunas revisiones si no había suficiente evidencia de ECA, esto se describió a priori en los protocolos.
26
27 Para la pregunta de revisión de diagnóstico, se consideraron para la inclusión los ECA de diagnóstico y los estudios de cohortes.
28 Para las preguntas de revisión de pronósticos, se incluyeron estudios de cohortes prospectivos y retrospectivos. No se
29 incluyeron estudios de casos y controles ni estudios transversales.
30 Cuando se incluyeron datos de estudios observacionales, los resultados de cada resultado se presentaron por
31 separado de las pruebas de los ECA y, cuando fue posible, se realizó un metanálisis.
34 Siempre que fue posible, se realizaron metanálisis utilizando Cochrane Review Manager (RevMan5)2
35 software para combinar los datos proporcionados en todos los estudios para cada uno de los resultados de interés para la pregunta de
36 revisión.
37 Todos los análisis se estratificaron por población (es decir, personas con dolor lumbar, dolor lumbar con o sin
38 ciática o ciática), lo que significó que diferentes estudios con grupos de población predominantes en diferentes
39 estratos de población no se combinaron ni analizaron juntos.
2Resultados dicotómicos
3 Se utilizaron técnicas de efectos fijos (Mantel-Haenszel) (usando un método de varianza inversa para el agrupamiento) para
4 calcular los cocientes de riesgo (riesgo relativo, RR) para los resultados binarios, que incluyeron:
6 - de atención médica
7 - volver al trabajo
8 - tasa de reoperación
9 - eventos adversos
10 o morbosidad
11 o mortalidad
12 o tasa de reoperación
13 o complicaciones postoperatorias
14 o mayor riesgo de requerir cirugía en segmentos adyacentes
15 - tasa de conversión quirúrgica
18 La diferencia de riesgo absoluto también se calculó utilizando GRADEpro163software, usando la mediana de la tasa de eventos en
19 el brazo de control de los resultados agrupados.
20 Para las variables binarias en las que hubo cero eventos en cualquiera de los brazos o una tasa de eventos inferior al 1 %, se calcularon las
21 razones de probabilidades de Peto, en lugar de las razones de riesgo. Las razones de probabilidades de Peto son más apropiadas para datos con
23Resultados continuos
24 Los resultados continuos se analizaron mediante un método de varianza inversa para agrupar las diferencias de medias
25 ponderadas. Estos resultados incluyeron:
28 - función
29 - malestar psicológico (evaluado por HADS, GHQ, BPI, BDI, STAI).
30 Cuando los estudios dentro de un solo metanálisis tenían diferentes escalas de medición, se usaron las diferencias de
31 medias estandarizadas (siempre que todos los estudios informaran cambios desde el valor inicial o final en lugar de
32 una combinación de ambos); cada medida diferente en cada estudio se "normalizó" al valor de desviación estándar
33 agrupado entre los grupos de intervención y de comparación en ese mismo estudio.
34
35 Se requieren las medias y las desviaciones estándar de los resultados continuos para el metanálisis. Sin
36 embargo, en los casos en que no se informaron las desviaciones estándar, la desviación estándar se calculó
37 mediante el EE, o se calculó el error estándar si se informaron los valores de p o los intervalos de confianza del
38 95% (IC del 95%) y luego se convirtieron en desviación estándar. Cuando los valores de p se informaron como
39 "menores que", se realizó un enfoque conservador. Por ejemplo, si el valor de p se informó como 'p≤0,001', los
40 cálculos de las desviaciones estándar se basaron en un valor de p de 0,001. Si
1 estas medidas estadísticas no estaban disponibles, entonces se aplicaron los métodos descritos en la Sección
2 16.1.3 del Manual Cochrane (versión 5.1.0, actualizada en marzo de 2011).
4 Si un estudio informó solo la estadística de resumen y el IC del 95 %, el método de la varianza inversa genérica en
5 Cochrane Review Manager2Se usó el software para ingresar datos en RevMan5.2Si se informó la tasa de eventos de
6 control, se usó para generar la diferencia de riesgo absoluta en GRADEpro.163Si se utilizó un análisis multivariado para
7 derivar la estadística de resumen, pero no se informó una tasa de eventos de control ajustada, no se calculó la diferencia
8 de riesgo absoluta.
10 Cuando los resultados se informaron de forma incompleta, es decir, sólo se informaron las medias o las medianas,
11 estos resultados se informaron en tablas como datos que no se pueden metanalizar. Estos resultados fueron tenidos en
12 cuenta por el GDG al revisar la evidencia.
4.3.3.1.413Heterogeneidad
19 Si el análisis de subgrupos resolvió la heterogeneidad dentro de todos los subgrupos derivados, entonces cada uno de
20 los subgrupos derivados se adoptó como resultados separados (siempre que al menos 1 estudio permaneciera en cada
21 subgrupo. Por ejemplo, en lugar del resultado único de 'dolor severidad del dolor lumbar, esto se separó en 2
22 resultados 'severidad del dolor para el dolor lumbar agudo'y 'severidad del dolor para el dolor lumbar crónico'. Las
23 evaluaciones de las posibles diferencias en el efecto entre los subgrupos se basaron en las pruebas de ji cuadrado para
24 las estadísticas de heterogeneidad entre los subgrupos. Cualquier diferencia de subgrupos se interpretó con
25 precaución, ya que la separación de los grupos rompe la asignación al azar del estudio y, como tal, está sujeta a factores
26 de confusión no controlados.
27 Si todas las estrategias predefinidas de subagrupación no pudieron explicar la heterogeneidad estadística dentro de
28 cada subgrupo derivado, entonces se empleó un modelo de efectos aleatorios (DerSimonian y Laird) para todo el
29 grupo de estudios en el metanálisis. Un modelo de efectos aleatorios asume una distribución de poblaciones, en lugar
30 de una sola población. Esto conduce a una ampliación del intervalo de confianza en torno a la estimación general, lo
31 que proporciona una interpretación más realista de la distribución real de los efectos en más de una población. Estos
32 resultados también se redujeron aún más en calidad mediante GRADEpro.
33
36 Se extrajeron de los estudios los odds ratios (OR), los cocientes de riesgos (RR) o los cocientes de riesgos
37 instantáneos (HR), con sus IC del 95%, para el efecto de los factores pronósticos preespecificados. Los estudios solo
38 se incluyeron si los factores de confusión preespecificados por el GDG se emparejaron al inicio o se ajustaron en el
39 análisis multivariado. Si no había pruebas suficientes que cumplieran con este criterio, se incluyeron los estudios con
40 análisis univariado.
41 Se prefirieron los estudios de menor riesgo de sesgo, teniendo en cuenta el análisis y el diseño del estudio. En particular,
42 se prefirieron los estudios de cohortes si informaron análisis multivariables que se ajustaron a los factores de confusión
43 clave identificados por el GDG en la etapa de protocolo para ese resultado.
1 Los datos se combinaron en metanálisis para estudios de pronóstico cuando fue posible.
3 Se deseaba saber cuán precisas eran las herramientas de estratificación del riesgo al predecir la cronicidad del dolor en
4 pacientes con dolor lumbar inespecífico y ciática. La herramienta de estratificación de riesgo se considera como la
5 “prueba del índice”; y el resultado (riesgo de mal resultado/mejoría retrasada) como la “condición objetivo”.
6
7 Se investigaron la discriminación y la calibración para cada herramienta. La calibración mide qué tan bien se
8 comparan los riesgos pronosticados con los riesgos observados. La discriminación se refiere a la capacidad del
9 modelo de predicción para distinguir entre quienes experimentan o no el evento de interés. La discriminación
10 normalmente se evalúa calculando el área bajo la curva característica operativa del receptor (cestadística). En esta
11 guía se han utilizado los siguientes puntos de corte:
12 - 90%-100% indica discriminación perfecta
13 - 70%-89% indica discriminación moderada
14 - 50-69% indica discriminación deficiente <50%
15 - no discrimina en absoluto.
dieciséis Para esta revisión se consideraron ECA y estudios de cohortes. Área bajo la curva ROC, sensibilidad, especificidad,
17 valores predictivos, cocientes de probabilidad, riesgo previsto versus riesgo observado (calibración), reclasificación y
18 otras métricas/pruebas/análisis como estadística D, R2la estadística y la puntuación de Brier se extrajeron de los
19 estudios.
21 Los ECA de diagnóstico (a veces denominados ensayos de prueba y tratamiento) son una comparación aleatoria
22 de 2 pruebas de diagnóstico, y los resultados del estudio son consecuencias clínicamente importantes del
23 diagnóstico (medidas de resultado relacionadas con el paciente similares a las de los ensayos de intervención,
24 como la mortalidad). Los pacientes se aleatorizan para recibir la prueba A o la prueba B, seguidas de
25 intervenciones terapéuticas idénticas según los resultados de la prueba (por lo que alguien con un resultado
26 positivo recibiría el mismo tratamiento independientemente de si se le diagnosticó mediante la prueba A o la
27 prueba B). Luego se comparan los resultados de los pacientes aguas abajo entre los 2 grupos. Como el
28 tratamiento es el mismo en ambos brazos del ensayo, cualquier diferencia en los resultados de los pacientes
29 reflejará la precisión de las pruebas para establecer correctamente quién tiene y quién no tiene la afección.
30
33 La evidencia de los resultados de los ECA incluidos y, en su caso, los estudios observacionales se evaluaron y
34 presentaron mediante una adaptación de la 'caja de herramientas de evaluación, desarrollo y evaluación de
35 calificaciones de recomendaciones (GRADE)' desarrollada por el grupo de trabajo internacional GRADE (http://
36 www.gradeworkinggroup.org/). El software (GRADEpro163) desarrollado por el grupo de trabajo GRADE se utilizó
37 para evaluar la calidad de cada resultado, teniendo en cuenta la calidad del estudio individual y los resultados del
38 metanálisis.
39 Cada resultado se examinó primero para cada uno de los elementos de calidad enumerados y definidos en la Tabla 2.
Riesgo de sesgo Las limitaciones en el diseño y la implementación del estudio pueden sesgar las estimaciones del efecto del
tratamiento. Las principales limitaciones de los estudios disminuyen la confianza en la estimación del efecto.
Ejemplos de tales limitaciones son el sesgo de selección (a menudo debido a un ocultamiento deficiente de la
asignación), el sesgo de realización y detección (a menudo debido a la falta de cegamiento del paciente, el
profesional de la salud o el evaluador) y el sesgo de deserción (debido a la falta de datos que causa un sesgo
sistemático en el análisis).
Inconsecuencia La inconsistencia se refiere a una heterogeneidad inexplicada de las estimaciones del efecto entre los
estudios en el mismo metanálisis.
imprecisión Los resultados son imprecisos cuando los estudios incluyen relativamente pocos pacientes y pocos eventos (o
medidas muy variables) y, por lo tanto, tienen amplios intervalos de confianza en torno a la estimación del efecto en
relación con los umbrales clínicamente importantes. Los intervalos de confianza del 95 % indican el rango posible de
ubicaciones del efecto real de la población con una probabilidad del 95 %, por lo que los intervalos de confianza
amplios pueden indicar un resultado que es consistente con interpretaciones contradictorias (por ejemplo, un
resultado puede ser consistente tanto con el beneficio clínico como con el resultado clínico). daño) y por lo tanto ser
impreciso.
El sesgo de publicación El sesgo de publicación es una subestimación o sobreestimación sistemática del efecto beneficioso o
perjudicial subyacente debido a la publicación selectiva de estudios. Un fenómeno estrechamente
relacionado es cuando algunos artículos no informan un resultado que no es concluyente, lo que
conduce a una sobreestimación de la eficacia de ese resultado.
Otros asuntos A veces, la asignación al azar puede no conducir adecuadamente a la equivalencia de grupo de los factores
de confusión y, de ser así, esto puede generar sesgo, que debe tenerse en cuenta. También deben tenerse
en cuenta los posibles conflictos de intereses, a menudo provocados por una participación excesiva de las
empresas farmacéuticas en la publicación de un estudio.
1 A continuación se proporcionan detalles de cómo se evaluaron los 4 elementos principales de calidad (riesgo de sesgo,
2 falta de direccionalidad, inconsistencia e imprecisión) para cada resultado. La publicación u otro sesgo solo se tuvo en
3 cuenta en la evaluación de la calidad si era evidente.
4.3.4.1.14Riesgo de sesgo
5 Los principales dominios de sesgo para los ECA se enumeran en la Tabla 3. Cada resultado tuvo su riesgo de sesgo
6 evaluado primero dentro de cada estudio. Para cada estudio, si no había riesgos de sesgo en ningún dominio, el riesgo
7 de sesgo recibió una calificación de 0. Si hubo riesgo de sesgo en solo 1 dominio, el riesgo de sesgo recibió una
8 calificación de "grave" de − 1, pero si había riesgo de sesgo en 2 o más dominios, el riesgo de sesgo se calificaba como
9 "muy grave" de -2. A continuación, se calculó una puntuación media ponderada de todos los estudios que
10 contribuyeron al resultado, teniendo en cuenta la ponderación de los estudios según la precisión del estudio. Por
11 ejemplo, si los estudios más precisos tendían a tener una puntuación de −1 para ese resultado, la puntuación general
12 de ese resultado tendería a −1.
Sesgo de selección Si aquellos que inscriben a los pacientes conocen el grupo al que se asignará el próximo paciente
(secuencia inscrito, ya sea debido a una secuencia no aleatoria que es predecible o porque no se ocultó una
generación y secuencia verdaderamente aleatoria al investigador, esto puede traducirse en una selección
asignación sistemática. parcialidad. Esto puede ocurrir si el investigador elige no reclutar a un participante
ocultación) en ese grupo específico debido a:
-conocimiento de las características pronósticas probables de ese participante, y
Rendimiento y Pacientes, cuidadores, aquellos que adjudican o registran resultados y analistas de datos
Limitación Explicación
sesgo de detección (falta no debe ser consciente del brazo al que se asignan los pacientes. El conocimiento del grupo
de cegamiento de puede influir en:
pacientes y -la experiencia del efecto placebo
cuidado de la salud
-rendimiento en medidas de resultado
profesionales)
-el nivel de cuidado y atención recibidos, y
-los métodos de medición o análisis, todos los
cuales pueden contribuir al sesgo sistemático.
sesgo de deserción El sesgo de deserción resulta de una pérdida no contabilizada de datos más allá de cierto nivel (un
diferencial del 10% entre grupos). La pérdida de datos puede ocurrir cuando los investigadores retiran
obligatoriamente a los participantes de un grupo (por ejemplo, cuando se utiliza un enfoque por
protocolo) o cuando los participantes no asisten a las sesiones de evaluación. Si es probable que los datos
faltantes sean diferentes de los datos de los que permanecen en los grupos, y existe una tasa diferencial
de dichos datos faltantes de los grupos, puede resultar en un sesgo de desgaste sistemático.
resultado selectivo El informe de algunos resultados y no de otros sobre la base de los resultados también puede generar
reportando sesgo, ya que esto puede distorsionar la impresión general de eficacia.
-Falta de períodos de lavado para evitar efectos de arrastre en los ensayos cruzados.
4.3.4.1.21indirecta
2 La indirecta se refiere al grado en que las poblaciones, las intervenciones, las comparaciones y las medidas de resultado
3 son diferentes a las definidas en los criterios de inclusión para las revisiones. La indirecta es importante cuando se
4 espera que estas diferencias contribuyan a una diferencia en el tamaño del efecto, o pueden afectar el equilibrio de
5 daños y beneficios considerados para una intervención. En cuanto al riesgo de sesgo, primero se evaluó la falta de
6 direccionalidad de cada resultado dentro de cada estudio. Para cada estudio, si no había fuentes de direccionalidad, la
7 direccionalidad recibió una calificación de 0. Si hubo direccionalidad solo en 1 fuente (por ejemplo, en términos de
8 población), la direccionalidad recibió una calificación de "grave" de -1, pero si había direccionamiento indirecto en 2 o
9 más fuentes (por ejemplo, en términos de población y tratamiento), el direccionamiento indirecto recibió una
10 calificación de "muy grave" de -2. Luego se calculó una puntuación promedio ponderada en todos los estudios que
11 contribuyeron al resultado teniendo en cuenta la precisión del estudio. Por ejemplo, si los estudios más precisos
12 tendieran a tener una puntuación de indireccionalidad de −1 cada uno para ese resultado, la puntuación general de ese
13 resultado tendería a −1.
4.3.4.1.314Inconsecuencia
15 La inconsistencia se refiere a una heterogeneidad inexplicable de resultados para un resultado en diferentes estudios.
dieciséis Cuando las estimaciones del efecto del tratamiento entre los estudios difieren ampliamente, esto sugiere diferencias
17 reales en el efecto del tratamiento subyacente, que pueden deberse a diferencias en las poblaciones, los entornos o las
18 dosis. Cuando existió heterogeneidad dentro de un resultado (chi-cuadrado p<0.1, o I2>50%), pero no se pudo encontrar
19 una explicación plausible, se disminuyó la calidad de la evidencia para ese resultado. La inconsistencia para ese
20 resultado recibió una puntuación "grave" de -1 si el I2fue del 50% al 74%, y una puntuación "muy grave" de -2 si el I2fue
21 del 75% o más.
22 Si la inconsistencia pudiera explicarse en base a un análisis de subgrupos especificado previamente (es decir,
23 cada subgrupo tenía un I2<50 %), el GDG tuvo esto en cuenta y consideró si hacer recomendaciones separadas
24 sobre nuevos resultados en función de los subgrupos definidos por el supuesto explicativo.
3 Dado que la puntuación de inconsistencia se basó en los resultados del metanálisis, la puntuación representó el resultado
4 total y, por lo tanto, no fue necesario realizar un promedio ponderado entre los estudios.
4.3.4.1.45imprecisión
6 Los criterios aplicados para la imprecisión se basaron en los IC del 95% para la estimación
7 combinada del efecto y las diferencias mínimas importantes (MID) para el resultado. Los MID
8 son el umbral para beneficios y daños apreciables, separados por una zona a cada lado de la
9 línea de ningún efecto donde se supone que no hay un efecto clínicamente importante. Si
10 cualquiera de los extremos del IC del 95% de la estimación general del efecto cruzaba 1 de las
11 líneas MID, la imprecisión se consideraba grave y se otorgaba una puntuación "grave" de -1.
12 Esto se debió a que el resultado general, representado por el intervalo de confianza, fue
13 consistente con 2 interpretaciones definidas por la MID (por ejemplo, tanto ningún efecto
14 clínicamente importante como el beneficio clínico fueron interpretaciones posibles).
15 − 2 fue dado. Esto se debió a que el resultado general fue consistente con las 3 interpretaciones definidas por la MID
dieciséis (ningún efecto clínicamente importante, beneficio clínico y daño clínico). Esto se ilustra en la Figura 3. En cuanto a la
17 inconsistencia, dado que la puntuación de imprecisión se basó en los resultados del metanálisis, la puntuación
18 representaba el resultado total y, por lo tanto, no fue necesario el promedio ponderado entre los estudios.
19 La posición de las líneas MID está idealmente determinada por los valores informados en la literatura.
20 Los métodos "basados en el ancla" tienen como objetivo establecer cambios clínicamente
21 significativos en una variable de resultado continua relacionándolos o "anclándolos" a medidas de
22 eficacia clínica centradas en el paciente que podrían considerarse estándares de oro con un alto nivel
23 de validez aparente. Por ejemplo, una MID para un resultado podría definirse por la cantidad mínima
24 de cambio en ese resultado necesaria para que los pacientes sientan que su calidad de vida ha
25 "mejorado significativamente". Las MID en la literatura también pueden basarse en la opinión de un
26 médico experto o de un consenso sobre la cantidad mínima de cambio en una variable que se
27 considera que afecta la calidad de vida o la salud. Para variables binarias, cualquier MID informado en
28 la literatura se basará inevitablemente en el consenso de expertos,
29 En ausencia de valores identificados en la literatura, el enfoque alternativo para decidir sobre los niveles MID es el método
30 'predeterminado', de la siguiente manera:
31 - Para los resultados categóricos, las MID se tomaron como RR de 0,75 y 1,25. Para resultados 'positivos' como
32 'satisfacción del paciente', el RR de 0,75 se toma como la línea que indica el límite entre ningún efecto clínicamente
33 importante y un daño clínicamente significativo, mientras que el RR de 1,25 se toma como la línea que indica el límite
34 entre ningún efecto efecto clínicamente importante y un beneficio clínicamente significativo. Para resultados
35 "negativos" como "sangrado", ocurre lo contrario, por lo que el RR de 0,75 se toma como la línea que indica el límite
36 entre ningún efecto clínicamente importante y un beneficio clínicamente significativo, mientras que el RR de 1,25 se
37 toma como la línea que indica el límite entre ningún efecto clínicamente importante y un daño clínicamente
38 significativo.
39 - Para la mortalidad, se consideró que cualquier cambio era clínicamente importante y la imprecisión se evaluó
40 sobre la base de si los intervalos de confianza cruzaron la línea de ningún efecto, es decir, si el resultado fue
41 consistente tanto con el beneficio como con el daño.
42 - Para las variables de resultado continuas, la MID se tomó como la mitad de la mediana de la desviación estándar inicial de
43 esa variable, en todos los estudios del metanálisis. Por lo tanto, la MID que denota el beneficio clínicamente significativo
44 mínimo fue positiva para un resultado "positivo" (por ejemplo, una medida de calidad de vida en la que una puntuación más
45 alta indica una mejor salud) y negativa para un resultado "negativo" (por ejemplo, un resultado análogo visual). puntuación
46 del dolor en la escala [EVA]). Los daños clínicamente significativos serán
1 lo contrario de estos. Si los valores de referencia no están disponibles, la mitad de la desviación estándar del grupo de
2 comparación de la mediana de esa variable se tomará como la MID.
3 - Si se han utilizado diferencias de medias estandarizadas, la MID se establecerá en el valor absoluto de +0,5. Esto se
4 debe a que las diferencias de medias estandarizadas son diferencias de medias normalizadas a la desviación
5 estándar combinada de los 2 grupos y, por lo tanto, se expresan efectivamente en unidades de 'números de
6 desviaciones estándar'. Por lo tanto, el valor MID de 0,5 en este contexto indica media desviación estándar, la
7 misma definición de MID que se usa para las diferencias de medias no estandarizadas.
8 El valor MID predeterminado estaba sujeto a enmienda después de discutirlo con el GDG. Si el GDG decidía que
9 el nivel de MID debía modificarse, después de considerar los efectos absolutos y relativos, esto estaba
10 permitido, siempre que dicha decisión no estuviera influenciada por ningún sesgo hacia recomendaciones más
11 fuertes o más débiles para resultados específicos.
12 Para esta guía, se encontraron MID en la literatura para el resultado continuo de calidad de vida relacionada con la salud
13 SF-36311que se utilizaron para evaluar la imprecisión y la importancia clínica (ver la sección 4.3.5 a continuación). Cuando
14 el GDG no definió una MID, se usaron los valores predeterminados como se describió anteriormente por imprecisión, y
15 la importancia clínica se determinó considerando la estimación puntual, la tasa de eventos de control y el efecto
dieciséis absoluto.
Figura 3: Ilustración de resultados precisos e imprecisos basados en el IC del 95 % de los resultados dicotómicos en un
diagrama de bosque (tenga en cuenta que los 3 resultados serían estimaciones agrupadas y, en la práctica, no
se colocarían en el mismo diagrama de bosque)
preciso
serio
imprecisión
muy serio
imprecisión
0.5 1 2
Razón de riesgo (RR)
18 Una vez que se había evaluado un resultado para los principales elementos de calidad, como se indicó anteriormente, se
19 calculó una calificación de calidad general para ese resultado. Las puntuaciones (0, −1 o −2) de cada uno de los principales
20 elementos de calidad se sumaron para dar una puntuación que podía ser desde 0 (la mejor posible) hasta −8 (la peor posible).
21 Sin embargo, las puntuaciones se limitaron a -3. Esta puntuación final se aplicó luego a la calificación inicial que se había
22 aplicado originalmente al resultado de forma predeterminada, según el diseño del estudio. Todos los ECA comenzaron como
23 Alta y la calidad general pasó a ser Moderada, Baja o Muy baja si la puntuación general era
3 Los estudios de intervención observacional comenzaron en Bajo, por lo que una puntuación de -1 sería suficiente
4 para llevar la calificación al nivel más bajo de Muy bajo. Sin embargo, los estudios observacionales podrían
5 mejorarse si hubiera: una gran magnitud del efecto, un gradiente de dosis-respuesta y si todos los factores de
6 confusión plausibles redujeran el efecto demostrado.
Alto Es muy poco probable que la investigación adicional cambie nuestra confianza en la estimación del efecto.
Moderado Es probable que la investigación adicional tenga un impacto importante en nuestra confianza en la
estimación del efecto y puede cambiar la estimación.
Bajo Es muy probable que la investigación adicional tenga un impacto importante en nuestra confianza en la
estimación del efecto y es probable que cambie la estimación.
4.3.4.28Revisiones de pronóstico
9 La calidad de la evidencia para los estudios de pronóstico se evaluó de acuerdo con los criterios proporcionados en la
10 Tabla 5. Si los datos se metanalizaron, se presentó la calidad de los estudios agrupados. Si los datos no se agruparon,
11 se presentó una calificación de calidad para cada estudio.
Diseño del estudio Estudios de casos y controles en lugar de estudios prospectivos de cohortes
Validez de las medidas de los factores de riesgo Si no está validado y no tiene una validez aparente razonable
Validez de la medida de resultado Si no está validado y no tiene una validez aparente razonable
Cegador Si los evaluadores del resultado no están cegados a la medición de los factores de riesgo (o
viceversa)
Duración adecuada del seguimiento Si el período de seguimiento (o retrospectivo) es inadecuado para permitir que ocurran los
(o duración retrospectiva) eventos, o el período retrospectivo es tan corto que la causalidad está en duda porque el
resultado puede haber precedido al factor de riesgo
4.3.4.2.13Inconsecuencia
4.3.4.2.215 imprecisión
dieciséis En los resultados metaanalizados, o para los resultados no agrupados, la imprecisión se determinó siguiendo los métodos
17 predeterminados descritos en 4.3.4.1.4.
4.3.4.2.31calificación general
2 Debido a que las revisiones de pronóstico generalmente no se basaron en múltiples resultados por estudio, la
3 calificación de calidad se asignó por estudio. Sin embargo, si hubo más de un resultado involucrado en un
4 estudio, la calificación de calidad de las declaraciones de evidencia para cada resultado se ajustó en
5 consecuencia. Por ejemplo, si un resultado se basó en un método de medición invalidado, pero otro resultado en
6 el mismo estudio no lo fue, el segundo resultado se calificaría 1 grado más que el primer resultado.
7 La calificación de calidad comenzó en Alta para los estudios prospectivos, y cada limitación importante redujo la
8 calificación en 1 incremento hasta una calificación mínima de Muy baja, como se explica para las revisiones de
9 intervención. Para las revisiones de pronóstico, los estudios de cohortes prospectivos con un análisis multivariado se
10 consideran el estándar de oro porque los ECA generalmente no son apropiados para este tipo de revisión por razones
11 éticas o pragmáticas. Además, si el estudio analiza más de un factor de riesgo de interés, la aleatorización sería
12 inapropiada, ya que solo se puede aplicar a uno de los factores de riesgo.
14 El GDG evaluó la evidencia por resultado para determinar si hubo, o potencialmente hubo, un beneficio clínicamente
15 importante a favor de la intervención o el comparador, o ninguna diferencia clínicamente importante entre las
dieciséis intervenciones. Para facilitar esto, los resultados binarios se convirtieron en diferencias de riesgo absoluto (ARD) usando
17 GRADEpro163software: se utilizó la mediana del riesgo del grupo de control entre los estudios para calcular la ARD y su IC
18 del 95 % a partir del cociente de riesgos agrupado.
19 La evaluación del beneficio clínico a favor de la intervención o el comparador, o ningún beneficio, se basó en la
20 estimación puntual del efecto absoluto para los estudios de intervención, que se estandarizó entre las revisiones. El GDG
21 utilizó MID para determinar la importancia clínica. Donde no había MID publicado en la literatura, el GDG acordó MID de
22 consenso para evaluar la importancia clínica basada en una mejora del 10% para la mayoría de los resultados como una
23 medida de beneficio clínico, por ejemplo, una disminución de 1 punto en una escala de 0 a 10 para la intensidad del
24 dolor. Se acordó que para la escala EQ-5D, se debe usar un valor de 0.03 para ser consistente con la medida SF-36
25 publicada. Consulte la Tabla 6 para ver las MID utilizadas para determinar la importancia clínica.
26
Rol físico: 3
Dolor corporal: 3
Salud general: 2
Vitalidad: 2
Funcionamiento social: 3
Rol-emocional: 4
Salud mental: 3
EQ5D Defecto 0.03 Consenso del GDG
(escala 0.0-1.0)
3 Esta evaluación fue realizada por el GDG para cada resultado crítico, y se elaboró una tabla de resumen de
4 evidencia para recopilar las evaluaciones de importancia clínica por resultado del GDG, junto con la calidad de la
5 evidencia y la incertidumbre en la estimación del efecto (imprecisión).
7 Las declaraciones de evidencia clínica son declaraciones resumidas que se incluyen en cada capítulo de revisión
8 y que resumen las características clave de la evidencia de efectividad clínica presentada. La redacción de las
9 declaraciones de evidencia refleja la certeza o incertidumbre en la estimación del efecto. Las declaraciones de
10 evidencia se presentan por resultado y abarcan las siguientes características clave de la evidencia:
22 Se buscó evidencia económica de la salud en relación con los problemas clínicos clave que se abordan en la guía.
23 Economistas de la salud:
28 - Se identificaron estudios potencialmente relevantes para cada pregunta de la revisión a partir de los resultados de la búsqueda económica de
29 la salud mediante la revisión de títulos y resúmenes. Luego se obtuvieron los artículos completos.
30 - Se revisaron los artículos completos contra los criterios de inclusión y exclusión preespecificados para identificar los estudios relevantes
32 - Estudios relevantes evaluados críticamente utilizando listas de verificación de evaluaciones económicas como se especifica en el
33 manual de pautas NICE.356
34 - Información clave extraída sobre los métodos y resultados de los estudios en tablas de evidencia económica
35 (incluidas en el Apéndice I).
36 - Resúmenes generados de la evidencia en las tablas de perfiles de evidencia económica de NICE (incluidos en el capítulo
37 correspondiente para cada pregunta de revisión); consulte los detalles a continuación.
2 Las evaluaciones económicas completas (estudios que comparan los costos y las consecuencias para la salud de los cursos de
3 acción alternativos: análisis de costo-utilidad, costo-efectividad, costo-beneficio y costo-consecuencias) y los estudios de costos
4 comparativos que abordaron la pregunta de revisión en la población relevante se consideraron potencialmente incluidos.
5 como evidencia económica.
6 Se excluyeron los estudios que solo informaron el costo por hospital (no por paciente) o que solo informaron el costo-
7 efectividad promedio sin costos y efectos desagregados. Se excluyeron revisiones de literatura, resúmenes, carteles, cartas,
8 editoriales, artículos de comentarios, estudios no publicados y estudios que no estaban en inglés. También se excluyeron los
9 estudios publicados antes de 1999 y los estudios de países no pertenecientes a la OCDE, sobre la base de que es probable que
10 la aplicabilidad de dichos estudios al contexto actual del NHS del Reino Unido sea demasiado baja para que sean útiles para la
11 toma de decisiones.
12 Se priorizó la inclusión de los estudios económicos de la salud restantes en función de su aplicabilidad relativa al
13 desarrollo de esta guía y las limitaciones del estudio. Por ejemplo, si se disponía de un análisis del Reino Unido
14 directamente aplicable y de alta calidad, es posible que no se hayan incluido otros estudios menos relevantes. Cuando
15 se produjeron exclusiones sobre esta base, esto se indica en la sección correspondiente.
dieciséis Para obtener más detalles sobre la evaluación de la aplicabilidad y la calidad metodológica, consulte la Tabla 7 a continuación y
17 la lista de verificación de evaluación económica (Apéndice G del manual de pautas NICE de 2012).356) y el protocolo de revisión
18 de la economía de la salud en el Apéndice D.
19 Cuando no se encontraron estudios económicos de salud relevantes de la revisión de la literatura económica, los costos unitarios
20 relevantes del NHS del Reino Unido relacionados con las intervenciones comparadas se presentaron al GDG para informar las
21 posibles implicaciones económicas de las recomendaciones.
23 Se utilizaron tablas de perfil de evidencia económica NICE para resumir las estimaciones de costo y rentabilidad de los
24 estudios económicos de salud incluidos en cada capítulo de revisión. El perfil de evidencia económica muestra una
25 evaluación de la aplicabilidad y la calidad metodológica de cada estudio económico, con notas a pie de página que
26 indican los motivos de la evaluación. Estas evaluaciones fueron realizadas por el economista de la salud utilizando la lista
27 de verificación de evaluación económica del manual de pautas NICE.356También muestra los costos incrementales, los
28 efectos incrementales (por ejemplo, años de vida ajustados por calidad [QALY]) y la relación costo-efectividad
29 incremental (ICER) para el análisis del caso base en el estudio, así como información sobre la evaluación de la
30 incertidumbre en el analisis. Consulte la Tabla 7 para obtener más detalles.
31 Cuando se incluyó en el perfil un estudio fuera del Reino Unido, los resultados se convirtieron a libras esterlinas
32 utilizando la paridad de poder adquisitivo adecuada.374
Estudiar Apellido del primer autor, fecha de publicación del estudio y perspectiva del país con
referencia a la información completa del estudio.
Aplicabilidad Una evaluación de la aplicabilidad del estudio a esta guía, la situación actual del
NHS y la toma de decisiones de NICE:(a)
-Directamente aplicable: el estudio cumple con todos los criterios de aplicabilidad, o no cumple con 1 o
más criterios de aplicabilidad, pero es poco probable que esto cambie las conclusiones sobre la
rentabilidad.
Artículo Descripción
es probable que esto cambie las conclusiones sobre la rentabilidad. Por lo general,
dichos estudios se excluirían de la revisión.
Limitaciones Una evaluación de la calidad metodológica del estudio:(a)
-Limitaciones menores: el estudio cumple con todos los criterios de calidad o no cumple con 1 o más
criterios de calidad, pero es poco probable que esto cambie las conclusiones sobre la rentabilidad.
Efectos incrementales Los AVAC medios (u otra medida seleccionada de resultado de salud) asociados con una
estrategia menos los AVAC medios de una estrategia de comparación.
Rentabilidad Razón de costo-efectividad incremental (ICER): el costo incremental dividido por los efectos
incrementales (generalmente en £ por QALY ganado).
Incertidumbre Un resumen del grado de incertidumbre sobre la ICER que refleje los resultados de los análisis de
sensibilidad determinísticos o probabilísticos, o los análisis estocásticos de los datos del ensayo, según
corresponda.
1 (a) La aplicabilidad y las limitaciones se evaluaron utilizando la lista de verificación de evaluación económica en el Apéndice G del manual de
2 pautas NICE de 2012356
4 Además de revisar la literatura económica de la salud publicada para cada pregunta de revisión, como se describió
5 anteriormente, el economista de la salud realizó un nuevo análisis económico de la salud en áreas seleccionadas. Las áreas
6 prioritarias para nuevos análisis fueron acordadas por el GDG después de la formación de las preguntas de revisión y la
7 consideración de la evidencia económica de salud existente.
8 El GDG identificó la denervación por radiofrecuencia como el área de mayor prioridad para el modelado
9 económico de la salud original. La revisión clínica mostró que la denervación por radiofrecuencia es
10 clínicamente eficaz para mejorar el resultado de la puntuación del dolor en las personas que tienen dolor
11 lumbar intenso. Por lo tanto, se priorizó un modelo económico para evaluar si el aumento de efectividad
12 asociado a esta intervención justifica sus costos adicionales.
dieciséis - El GDG estuvo involucrado en el diseño del modelo, selección de insumos e interpretación de los
17 resultados.
18 - Las entradas del modelo se basaron en la revisión sistemática de la literatura clínica complementada con otras
19 fuentes de datos publicadas cuando fue posible.
20 - Cuando los datos publicados no estaban disponibles, se utilizó la opinión de expertos del GDG para completar el modelo. Los datos de
23 - El modelo fue revisado por pares por otro economista de la salud en el NCGC.
1 Los métodos completos para el análisis de rentabilidad de la denervación por radiofrecuencia se describen en el
2 Apéndice N.
4.4.33Criterios de rentabilidad
4 El informe de NICE 'Juicios de valor social: principios para el desarrollo de la guía de NICE' establece los
5 principios que los GDG deben considerar al juzgar si una intervención ofrece una buena relación calidad-
6 precio.355En general, una intervención se consideró rentable (dado que la estimación se consideró
7 plausible) si se aplicaba alguno de los siguientes criterios:
8 - la intervención dominó otras estrategias relevantes (es decir, fue menos costosa en términos de uso de
9 recursos y más efectiva clínicamente en comparación con todas las demás estrategias alternativas
10 relevantes), o
11 - la intervención costó menos de £20 000 por QALY ganado en comparación con la siguiente mejor estrategia.
12 Si el GDG recomendó una intervención que se estimó costaría más de £20 000 por QALY ganado, o no
13 recomendó una que se estimó costar menos de £20 000 por QALY ganado, las razones de esta decisión se
14 analizan explícitamente en las 'Recomendaciones y enlace a la sección de evidencia del capítulo
15 correspondiente, con referencia a cuestiones relacionadas con la plausibilidad de la estimación o a los
dieciséis factores establecidos en 'Juicios de valor social: principios para el desarrollo de la guía NICE'.355
17
18 Cuando los QALY o los años de vida ganados no se utilizan en el análisis, los resultados son difíciles de interpretar a menos
19 que una estrategia domine a las demás con respecto a todos los resultados y costos de salud relevantes.
25 Los costos del NHS del Reino Unido informados en la guía son los que se presentaron al GDG y eran correctos en el momento en
26 que se redactaron las recomendaciones. Es posible que hayan cambiado posteriormente antes del momento de la publicación.
27 Sin embargo, no tenemos ninguna razón para creer que han cambiado sustancialmente.
4.528Desarrollo de recomendaciones
29 En el transcurso del proceso de desarrollo de la guía, se le presentó al GDG:
30 - Tablas de evidencia de la evidencia clínica y económica revisada de la literatura. Todas las tablas de evidencia se
31 encuentran en los Apéndices H e I.
32 - Resúmenes de evidencia y calidad clínica y económica (como se presenta en los Capítulos 5-25). Diagramas
34 - Una descripción de los métodos y resultados del análisis de costo-efectividad realizado para la
35 guía (Apéndice N).
36 Las recomendaciones se redactaron sobre la base de la interpretación del GDG de la evidencia disponible,
37 teniendo en cuenta el equilibrio del beneficio clínico a favor de la intervención o el comparador y los costos entre
38 los diferentes cursos de acción. Esto se hizo formalmente en un modelo económico o informalmente. En primer
39 lugar, se consideró el beneficio clínico neto de la intervención sobre el comparador (efectividad clínica),
40 centrándose en los resultados críticos. Cuando esto se hizo de manera informal, el GDG tuvo en cuenta la
41 efectividad clínica cuando se comparó una intervención con otra. los
1 la evaluación del beneficio clínico neto estuvo moderada por la importancia otorgada a los resultados (los
2 valores y preferencias del GDG) y la confianza que el GDG tenía en la evidencia (calidad de la evidencia). En
3 segundo lugar, el GDG evaluó si el beneficio clínico neto justificaba alguna diferencia en los costos entre las
4 intervenciones alternativas.
5 Cuando la evidencia clínica y económica era de mala calidad, contradictoria o inexistente, el GDG redactó
6 recomendaciones basadas en su opinión de expertos. Las consideraciones para hacer recomendaciones basadas en el
7 consenso incluyen el equilibrio entre los daños y beneficios potenciales, los costos económicos en comparación con
8 los beneficios económicos, las prácticas actuales, las recomendaciones hechas en otras guías relevantes, las
9 preferencias de los pacientes y las cuestiones de igualdad. Las recomendaciones de consenso fueron acordadas a
10 través de discusiones en el GDG. El GDG también consideró si la incertidumbre era suficiente para justificar la demora
11 en hacer una recomendación a la espera de más investigación, teniendo en cuenta el daño potencial de no hacer una
12 recomendación clara (consulte la Sección 4.5.1 a continuación).
13 El GDG consideró la 'fuerza' apropiada de cada recomendación. Esto tiene en cuenta la calidad de la
14 evidencia, pero es conceptualmente diferente. Algunas recomendaciones son "fuertes" en el sentido de
15 que el GDG cree que la gran mayoría de los profesionales de la salud y otros profesionales y los pacientes
dieciséis elegirían una intervención en particular si consideraran la evidencia de la misma manera que lo ha hecho
17 el GDG. Este suele ser el caso si los beneficios superan claramente los daños para la mayoría de las
18 personas y es probable que la intervención sea rentable. Sin embargo, a menudo hay un equilibrio más
19 estrecho entre los beneficios y los daños, y algunos pacientes no elegirían una intervención mientras que
20 otros sí lo harían. Esto puede suceder, por ejemplo, si algunos pacientes son particularmente reacios a
21 algún efecto secundario y otros no. En estas circunstancias, la recomendación es generalmente más débil,
22
29 - Coherencia con el asesoramiento estándar de NICE sobre recomendaciones sobre medicamentos, tiempos de espera e
30 intervenciones ineficaces (consulte la Sección 9.2 en el manual de directrices de NICE de 2014).354).
4.5.133Recomendaciones de investigación
34 Cuando se identificaron áreas para las que faltaba buena evidencia, el GDG consideró hacer recomendaciones para
35 futuras investigaciones. Las decisiones sobre la inclusión de una recomendación de investigación se basaron en
36 factores tales como:
38 - prioridades nacionales
4.5.21Proceso de validacion
2 Esta guía está sujeta a una consulta pública y comentarios de 6 semanas como parte de la garantía de calidad y la
3 revisión por pares del documento. Todos los comentarios recibidos de las partes interesadas registradas se responden a
4 su vez y se publican en el sitio web de NICE.
4.5.35Actualización de la guía
6 Después de la publicación, y de acuerdo con el manual de pautas de NICE, NICE realizará una revisión para
7 determinar si la base de evidencia ha progresado significativamente para modificar las recomendaciones de las
8 pautas y justificar una actualización.
4.5.49Descargo de responsabilidad
10 Los proveedores de atención médica deben usar el juicio clínico, el conocimiento y la experiencia al decidir si es
11 apropiado aplicar las pautas. Las recomendaciones citadas aquí son una guía y pueden no ser apropiadas para su uso
12 en todas las situaciones. La decisión de adoptar cualquiera de las recomendaciones citadas aquí debe ser tomada por
13 los médicos a la luz de las circunstancias individuales del paciente, los deseos del paciente, la experiencia clínica y los
14 recursos.
15 El Centro Nacional de Directrices Clínicas se exime de cualquier responsabilidad por los daños que surjan
dieciséis del uso o no uso de esta guía y la literatura utilizada en apoyo de esta guía.
4.5.517Fondos
18 El Centro Nacional de Directrices Clínicas fue comisionado por el Instituto Nacional para la Excelencia en Salud y
19 Atención para llevar a cabo el trabajo sobre esta directriz.
51Exámen clinico
5.12Introducción
3 El examen clínico de las personas con dolor de espalda o ciática lo realizan habitualmente profesionales de
4 atención primaria de la salud, terapeutas, médicos especialistas y cirujanos. El examen clínico cumple una serie
5 de funciones, como corroborar o fortalecer el diagnóstico realizado al tomar un historial detallado. También
6 puede ser importante para llegar a un diagnóstico, por ejemplo, cuando la historia no está clara o cuando no se
7 espera que las imágenes aclaren un diagnóstico. El examen clínico también puede ser importante para
8 respaldar un plan de manejo, evaluar el pronóstico y evaluar la respuesta al tratamiento.
9
10 Las personas que consultan a los profesionales de la salud pueden esperar un examen como parte de la
11 consulta, y esto contribuye a la satisfacción con la consulta. Se piensa que las repercusiones de no
12 realizar un examen conducirían a la insatisfacción y la demanda injustificada de pruebas o derivaciones
13 adicionales.313
14 El examen clínico es una habilidad que necesita ser aprendida y practicada. Los profesionales de la salud aprenderán sus
15 habilidades de examen dentro de diversos conceptos de atención, relevantes para la terapia o rama de la medicina que
dieciséis practican. Por lo tanto, no se esperaría un acuerdo en los hallazgos clínicos o su importancia entre estos diferentes
17 paradigmas de atención. Dentro de un modelo dado, existe una variación considerable en la variabilidad interobservador
18 e intraobservador. Sin embargo, esta variación se puede mejorar tanto con capacitación, como calibración entre
19 observadores y práctica de habilidades, como con experiencia.
20 Existe incertidumbre sobre si alguna de las pruebas clínicas que se usan comúnmente en el examen
21 de personas con sospecha de ciática es más beneficiosa que otras, o si se compara con la obtención de
22 un historial completo. Esta revisión de evidencia pretende investigar si hay alguna evidencia para
23 abordar esta incertidumbre.
6. deterioro reflejo
7. prueba de asentamiento
8. combinación de arriba
Resultados Crítico
-calidad de vida relacionada con la salud (por ejemplo, SF-12, SF-36 o EQ-5D)
-gravedad del dolor (por ejemplo, escala analógica visual [VAS] o escala de calificación numérica [NRS])
5.31Evidencia Clínica
2 Una búsqueda de ensayos aleatorizados de diagnóstico (estudios de prueba y tratamiento) que comparen la
3 efectividad del examen clínico versus el historial solo o el historial con imágenes, o en comparación con otras
4 técnicas de examen clínico cuando cada una es seguida por un tratamiento para la ciática, para mejorar los
5 resultados de los pacientes con se llevó a cabo con sospecha (o bajo investigación) de ciática.
6 No se identificaron estudios clínicos relevantes que comparen diferentes tipos de examen clínico entre sí o con
7 la historia clínica sola o con la historia clínica (cuando cada uno es seguido por un tratamiento para la ciática).
8
9 Esta búsqueda no se amplió a los estudios de precisión diagnóstica ya que el GDG acordó que no existe un
10 estándar de referencia acordado para el diagnóstico de la ciática y, por lo tanto, dicha revisión no sería
11 informativa para establecer recomendaciones de guías.
5.412Evidencia económica
13 Literatura publicada
5.5dieciséisDeclaraciones de evidencia
5.5.17Clínico
18 - No se identificaron estudios clínicos relevantes.
5.5.219 Económico
20 -No se identificaron evaluaciones económicas relevantes.
Como no se identificaron estudios clínicos relevantes, no hubo evidencia disponible para ninguno de
estos resultados.
Intercambio entre No se identificaron estudios clínicos relevantes para la revisión que buscara estudios de prueba y
beneficios clínicos y tratamiento. Se eligió este tipo de revisión en lugar de una revisión de precisión diagnóstica, porque
daña actualmente no existe un estándar de referencia acordado y porque no se ha realizado ninguna
investigación que analice los resultados de los pacientes en función de los hallazgos del examen clínico.
Intercambio entre No se identificaron estudios económicos relevantes. El GDG consideró que dejar de
efectos clínicos netos realizar exámenes clínicos podría reducir los costos, pero como no había evidencia
y costos clínica disponible, no se pudo determinar si esto sería rentable.
Otras Consideraciones El GDG discutió la revisión Cochrane sobre el examen clínico.480Sin embargo, se señaló que se trataba
de una revisión de precisión diagnóstica, que utilizó una combinación de diferentes estándares de
referencia, incluidas las imágenes y los hallazgos en la cirugía, en lugar de los resultados de los
pacientes.
El GDG acordó que no era posible hacer una recomendación debido a la falta de evidencia. Los
únicos otros estudios de los que el GDG tenía conocimiento sobre este tema se basaron en la
opinión clínica utilizando el consenso de Delphi. El GDG consideró que no había pruebas
suficientes para recomendar un cambio sustancial en la práctica clínica normal y, por lo tanto,
acordó no hacer una recomendación.
El GDG discutió la posibilidad de hacer una recomendación para futuras investigaciones, debido
a la falta de evidencia en esta área. Estuvieron de acuerdo en que la viabilidad de dicho ensayo
sería un problema y, por lo tanto, es poco probable que se financie, que cambie la práctica o
agregue valor a la vía de tratamiento. El grupo también estaba al tanto de un estudio de cohorte
clínica que se publicaría en un futuro cercano y concluyó que era sensato esperar los resultados
de este en lugar de hacer una recomendación para futuras investigaciones.
62.1. Introducción
3 Existen factores de riesgo reconocidos o características de pronóstico que pueden hacer que una persona sea más propensa a
4 sufrir dolor de espalda crónico e incapacitante. Estos incluyen factores demográficos/físicos, por ejemplo, edad avanzada, ser
5 mujer, dolor en las piernas, factores psicológicos como creencias y comportamientos negativos, actitud pasiva hacia el
6 tratamiento, depresión y ansiedad, y factores sociales como ambiente de trabajo deficiente, insatisfacción laboral y social poco
7 servicial. apoyo. Es posible que estos factores de riesgo no siempre sean evidentes para un profesional de la salud al evaluar a
8 una persona con dolor de espalda. Por ello, han surgido herramientas de estratificación de riesgo que ayudan a apoyar la toma
9 de decisiones clínicas. Hay una serie de herramientas de evaluación de riesgos disponibles, incluidas las siguientes:
10
11 Cuestionario de detección del dolor musculoesquelético de Örebro (ÖMSPQ)está destinado a ser utilizado en un entorno
12 de salud ocupacional con personas cuyo dolor de espalda está afectando su capacidad para trabajar. Consta de 21 preguntas
13 que evalúan el estado de ánimo, actitud hacia el trabajo, pensamientos, creencias y comportamientos.
14 La herramienta de evaluación de la espalda STARTes un cuestionario de 9 ítems diseñado para ser utilizado en atención primaria.
15 Genera una puntuación general y una subpuntuación psicosocial que divide a las personas en riesgo bajo, medio y alto de discapacidad
dieciséis relacionada con el dolor de espalda persistente. De igual importancia para la herramienta son los diferentes paquetes de tratamiento que
17 están dirigidos a los 3 grupos de riesgo.
18 El método de evaluación de peligros y riesgos (DRAM)es un método de detección de primera etapa que ayuda a alertar a un
19 médico sobre el hecho de que una persona con dolor lumbar podría ya tener angustia psicológica o estar en riesgo de sufrirla.
20 Utiliza el Índice de depresión de Zung modificado y el Cuestionario de percepciones somáticas modificado para generar una
21 puntuación combinada para subdividir a las personas.
22 El deseo de alejarse de un enfoque de "talla única" ha generado un interés considerable en las estrategias de atención
23 estratificada. Hay muchos métodos diferentes de estratificación propuestos, pero en general dividen a los pacientes en
24 uno de 3 grupos. Sin embargo, es importante tener en cuenta que es probable que se superpongan entre estos grupos:
25 137
26 Estratificación por riesgo de discapacidad permanentese utiliza para dividir a los pacientes en diferentes grupos en función
27 de si tienen factores de riesgo únicos o múltiples para el dolor de espalda persistente e incapacitante. Los ejemplos incluyen
28 OMPSQ y STarT Back.
29 Estratificación por mecanismo subyacente para el dolor de espaldautiliza muchos enfoques, ya sea que se basen en la
30 anatomía, la patología, los mecanismos del dolor o los factores psicosociales, con el propósito de dirigir el tratamiento al
31 mecanismo del dolor propuesto. Un ejemplo es el enfoque de la terapia funcional cognitiva basada en la clasificación, que
32 combina el historial del paciente, los resultados de los exámenes, la evaluación psicológica y los resultados de la
33 investigación para clasificar a los pacientes y, por lo tanto, dirigir el tratamiento.372
34 Estratificación por probabilidad de respuesta al tratamientoa menudo se logra utilizando una regla de predicción
35 clínica. Ejemplos comunes son aquellos pacientes que podrían responder a la manipulación espinal oa la estabilización
36 espinal.75,203
37 Este capítulo pretende abordar dos áreas; qué herramienta predice mejor la mejora retrasada o el mal resultado y,
38 en segundo lugar, si la gestión estratificada según la herramienta es eficaz. Estas preguntas están inherentemente
39 interrelacionadas y, por lo tanto, los resultados de cada una se presentan conjuntamente a continuación.
-Retroceder
-DRACMA
-Örebro
Condición objetivo Riesgo de mal resultado/mejoría retrasada (según lo informado por el estudio)
o referencia
estándar
Resultados (en -Área bajo la curva (estadística c)
términos de -Sensibilidad, especificidad, valores predictivos (definir umbrales)
prueba predictiva
-Riesgo previsto versus riesgo observado (calibración)
precisión,
-Otros resultados, p. ej., estadística D, R2estadística y puntuación de Brier
calibración)
-Reclasificación
Tipos de estudio Estudios de cohortes, ECA, revisiones sistemáticas.
riesgo)
Resultados Crítico
-Calidad de vida relacionada con la salud (por ejemplo, SF-12, SF-36 o EQ-5D).
-Severidad del dolor (por ejemplo, escala analógica visual [VAS] o escala de calificación numérica [NRS]).
Diseño del estudio Se incluirán ECA y RS en primera instancia. Si se encuentran pruebas de ECA insuficientes para
formar una recomendación, se incluirán estudios no aleatorios.
6.41Evidencia Clínica
9 En la revisión se incluyeron seis estudios (publicados en ocho artículos).18,35 143 205 138,484,502,503Como solo se identificó un ensayo
10 aleatorio para la mayoría de las pruebas índice, también se buscaron estudios de cohortes. Sin embargo, ninguno de los
11 estudios de cohortes identificados cumplió con los criterios de inclusión especificados en el protocolo. Los 6 estudios incluidos se
12 resumen en la Tabla 12 a continuación. La evidencia de estos estudios se resume en el perfil de evidencia clínica GRADE
13 (diagrama de flujo de acción) en el Apéndice E, las tablas de evidencia del estudio en el Apéndice H, los diagramas de bosque en
14 el Apéndice K, las tablas GRADE en el Apéndice J y la lista de estudios excluidos en el Apéndice L.
15
beneficio Evitación del miedo adultos entre los Recuperación (RMDQ) No reportado
201333 cuestionario de creencias edades de 18 y 65 a los 6 meses
escala de actividad fisica años buscan Dolor a los 6 meses
fisioterapia para
Catástrofe del dolor lumbalgia
escala síntoma mediano
duración (RIC): 90
días (30-365).
Versión de once elementos
Aguda (≤14 días):
de la escala tempa
kinesofobia 11,8%
Subaguda (15-90
d): 39,2%
Salud del paciente
Crónico (≥91 días):
cuestionario – 9
(PHQ-9) 49%
n = 146
Retroceder:
subescala psicosocial
puntaje
beneficio INICIO DE VUELTA: cambio en la adultos entre los Recuperación (ODI) en No reportado
201434 puntuación general (0-4 edades de 18 y 65 6 meses
semanas) años buscan Dolor a los 6 meses
fisioterapia para
lumbalgia
Duración de los síntomas
n = 123
niños manipulación espinal Adultos de 18 a 60 años Recuperación (50% No reportado.
200475 predicción clínica años con dolor mejora en
regla lumbar; mediana el ODI) a 1 semana
duración de la corriente probabilidad positiva
episodio = 27 días; relación
Participantes
reclutados como parte
de un ECA. Pronóstico
los datos de precisión fueron
n = 70
n = 131
Dagfinrud Örebro Adultos ≥ 18 años Funcional No reportado
201398 dolor musculoesquelético (media = 45,3) con mejora
cuestionario dolor lumbar; (cambio de >10 en el
(ÖMSPQ) ODI medio (DE) ODI) a las 8 semanas
puntuación = 35,9 (16,5)
Crónico (3-12
meses) 10,7%
Crónico (> 1 año)
38,7%
n = 76
Gabel Örebro Adultos con Columna vertebral funcional 6% de los pacientes
2011148 Dolor musculoesquelético agudo/subagudo índice (SFI) a los 6 reportó baja crónica
cuestionario lumbalgia meses dolor de espalda al final del
n = 106
Heneweer traducción holandesa de Adultos (21-60) Recuperación a las 12 31/56 reportado
2007199 la prueba de detección del consultando a sus semanas recuperado a las 12 semanas
dolor lumbar agudo fisioterapeuta
Cuestionario por primera vez con un
primer o un nuevo
episodio de no-
(nombre alternativo para
espalda baja específica
ÖMSPQ)
dolor.
Duración de la corriente
queja:
<4 semanas 52%
n = 56
colina 2008204 Retroceder Adultos con no Función (RMDQ 58/74 en el grupo de alto
Duración de
síntomas:
17% <1 mes
34% 1-6 meses
25% 7 meses -3
años
22% >3 años
n = 500 (muestra de
validación externa)
norte = 298
1-2 semana 7%
2-3 semana 9%
12 semanas 7%
n = 230
Morso COMENZAR ATRÁS – Adultos con no RMDQ >30 a las 3 Grupo de bajo riesgo
2013339 traducido al espalda baja específica meses (pobre Dinamarca 24 %, Reino Unido
n = 1200
Morso Retroceder Adultos con baja Recuperación (RMDQ) El 69% de los pacientes en
2014340 dolor de espalda en a los 6 meses atención secundaria y
atención secundaria Dolor a los 6 meses El 40,2 % de los pacientes
n=960; primario en atención primaria tuvo
cuidado un mal resultado en el
n=749
Duración de los síntomas
≤3 meses: 53%
Página 2015376 Retroceder Adultos de 16 a 80 años Dolor, función y No reportado
años sin miedo al movimiento
bajo crónico específico a los 6 y 12 meses
dolor de espalda. Crónico
n=53
Duración de
síntomas: 130,7
(SD 112.0) meses
Von Korff Conjunto de elementos de riesgo de dolor Adultos de 18 a 64 años que Dolor a los 4 meses No reportado
2014489 crónico realizaron una visita de
de espalda y no tuvieron
en el año anterior.
Dolor de base
estado: 40,8%
agudo, 41,1%
intermedio, 18%
crónico.
Número medio de
días con dolor de espalda
en los últimos 6 meses
66,1 (64,2)
n = 571
Williams RCP de Hancock (clínica) Adultos con primaria Dolor a las 12 semanas No reportado
2014510 regla de predicción) queja de baja
dolor de espalda menos de
6 semanas en
duración, con o
sin dolor de piernas,
con al menos
Intensidad moderada
dolor durante el
n = 937
Intervención y
Estudiar comparación Población Resultados Comentarios
Apeldoorn Clasificación basada Dolor lumbar con Dolor (NRS) Ensayo multicéntrico.
201218 terapia física o sin ciática Función (ODI) Pacientes asignados a
(n=74) usando un Calidad de Vida el grupo basado en la
versión actualizada de (SF-36, Física clasificación fue tratado
N=156
el algoritmo de fritz Puntaje del componente, De acuerdo a sus
et al.145 PC) clasificación primaria
1 año de seguimiento
(Hicks/Delito categoría para un
Calidad de Vida
Clasificación mínimo de 4 semanas.
(SF-36, Mental
sistema), modificado para Los países bajos Después de este período,
Puntaje del componente,
encajar en el sistema el fisioterapeuta fue
MCS)
de salud holandés. permitido cambiar
Criterios de respuesta
Intervenciones estrategia de tratamiento
(Dolor y Función)
incluido de acuerdo con la
intervenciones: espinales Pautas holandesas actuales
manipulación, para el dolor lumbar
ejercicios de estabilización
o dirección específica
sin concurrente
ejercicios para un
tratamiento informado.
mínimo de 4 semanas.
Pautas de dolor.
beneficio Retroceder Dolor lumbar con Dolor (NRS, 0-10: secuencial de 2 fases
201535 estratificación (n=108) o sin ciática los pacientes calificaron su estudio evaluando
Intervención y
Estudiar comparación Población Resultados Comentarios
Físico mínimo
intervención de terapia
enfoque (1-2
sesiones por semana)
y adherencia a la
APTA Orthopaedic
Sección GPC's
Aumento físico
intervención de terapia
enfoque (2-3
sesiones por semana)
y adherencia a la
APTA Orthopaedic
Sección GPC's y
psicológicamente-
práctica informada
principios
PT en el grupo de atención
estándar fueron
Intervención y
Estudiar comparación Población Resultados Comentarios
tratamiento para
pacientes con baja
dolor de espalda como lo
harían normalmente
si no participa en
este estudio
Alentar 12 meses de Dolor lumbar con Dolor (NRS) Estudio de IMPACTO para
2014138,502
atención estratificada o sin ciática Función (RMDQ) probar la implementación de
A TRAVÉS DE INICIAR ATRÁS atención estratificada para el
Calidad de Vida
dolor lumbar dentro de un
herramienta de riesgo (n=554)
N=922 (EQ-5D)
seguido de una de las 3 médico de atención primaria
Calidad de Vida
vías de tratamiento ajuste. Los resultados
seguimiento de 6 meses (SF-12, Física
basado en el riesgo como se amplían los hallazgos del
Puntaje del componente,
ensayo STarT Back.
describe a continuación:
PC)
Reino Unido
Calidad de Vida
Grupo de bajo riesgo
(SF-12, Mental Estudiar prospectivamente
sobre su bien
pronóstico
medio y alto
grupo de riesgo:medicos
fueron alentados a
remitir a los pacientes a
fisioterapia y
abordar su espalda-
preocupaciones relacionadas
destacado por el
herramienta de estratificación
Atención habitual
familia involucrada
médico
administración
involucrando la evaluación,
consejos, medicamentos,
certificado de enfermedad
y referencia para
investigaciones o
tratamiento adicional como
físico comunitario
terapia o secundaria
especialistas en atención).
Intervención y
Estudiar comparación Población Resultados Comentarios
PT basado en la comunidad
pacientes manejados
uso clínico
juicio a
determina el
número y contenido
de sesiones de tratamiento
Fritz 2003143 Clasificación basada Dolor lumbar con Función (ODI) Ensayo multicéntrico
terapia física o sin ciática Calidad de Vida
descrito por Delito (SF-36, Física No se informaron resultados
et al.103 N=78 Puntaje del componente, para el resultado dolor
(N=41).Intervenciones PC) a pesar de una medida
junta incluida Calidad de Vida autoinformada para el
1 año de seguimiento
movilización, (SF-36, Mental dolor descrita en el
manipulación Puntaje del componente, metodos de estudio
técnicas, espinal EE.UU
MCS)
rango activo de
ejercicios de movimiento,
Cuidado de la salud
la clasificación
utilización se permitió que el grupo
extensión lumbar
fuera reevaluado y el
ejercicios, tronco
tratamiento ajustado en
fortalecimiento y
la base de los cambios
mecanico o auto-
en los signos y
tracción
síntomas de la
paciente, en comparación
grupo de control con
con consistencia,
herramienta sin riesgo
basado en pautas
(n=37): física habitual
enfoque en el
terapia basada en el cuidado
grupo de control
sobre las pautas para el
dolor lumbar.
sin concurrente
Intervenciones
tratamiento informado.
bajo estrés incluido
ejercicio aerobico
(caminar en cinta o
ciclismo estacionario y
músculo general
reacondicionamiento
ejercicios despues de 2
Intervención y
Estudiar comparación Población Resultados Comentarios
sesión.
referido para
psicológicamente-
informado
fisioterapia
sesiones para tratar
síntomas y
función y también
psicosocial
obstáculos para
recuperación.
Intervención y
Estudiar comparación Población Resultados Comentarios
Clasificación de Quebec
sistema).
El CB-CFT
intervención tuvo 4
componentes principales 1)
un cognitivo
componente 2)
movimiento específico
ejercicio 3) dirigido
integración funcional
de actividades en su
vida diaria y 4) una
actividad física
programa a la medida
al movimiento
clasificación.
movilización o
manipulación
técnicas aplicadas a
la columna vertebral o la pelvis
manual actual
práctica de la terapia. En
Además, la mayoría
ejercicios o un programa
de ejercicios en casa.
6.4.3.12Discriminación
3 Tabla 13: Perfil de evidencia clínica: herramientas para predecir la mejora funcional (según la evaluación mediante una variedad de métodos que incluyen autoinforme, ODI, RMDQ,
4 calificación global de cambio)
área bajo
Curva
No de Agrupado/Medio
Herramienta de riesgo estudios norte Riesgo de sesgo Inconsecuencia indirecta imprecisión Sensibilidad especificidad un (rango) Calidad
Örebro modificado 1 106 Altoa - No serio Serio 88 85.7 0,88 (0,78- BAJO
Cuestionario de cribado indirecta imprecisiónC 0.99)
musculoesquelético (ÖMSPQ) en
Discriminación
Dolor lumbar y ciática
Centro Nacional de Directrices Clínicas, 2016
área bajo
Curva
No de Agrupado/Medio
Herramienta de riesgo estudios norte Riesgo de sesgo Inconsecuencia indirecta imprecisión Sensibilidad especificidad un (rango) Calidad
umbral 112 a los 6 meses
Cuestionario de detección del dolor lumbar agudo (ALBPSQ) (nombre alternativo para ÖREBRO)
INICIO DE VUELTA – a los 12 meses 1 53 Altoa - No serio No serio - - 0,82 (0,61 a MODERA
(atención secundaria) indirecta imprecisión 1.0) TE
INICIO DE VUELTA – a los 6 meses 2 1013 Muy altoa - No serio No serio - - 0,77 (0,69 a BAJO
(atención secundaria) indirecta imprecisión 0.84)
INICIO DE VUELTA – a los 6 meses 2 672 Bajo - No serio No serio 80.1Delaware 65.4Delaware 0,82 (rango ALTO
(atención primaria) indirecta imprecisión 0,73-0,90)
75
STarT Back – traducción al 1 344 Muy altoa - No serio No serio - - 0,71 (0,66 a BAJO
danés a los 3 meses indirecta imprecisión 0.77)
INICIO DE VUELTA – Reino Unido a los 3 meses 1 845 Muy altoa - No serio No serio - - 0,81 (0,78 a BAJO
indirecta imprecisión 0.84)
Índice de valoración de la función (FRI; 4 1 131 Muy altoa - No serio Serio - - 0,93 (0,89 – MUY
semanas) indirecta imprecisiónC 0.98) BAJO
Cuestionario de Oswestry
Discapacidad de Oswestry 1 131 Muy altoa - No serio Serio - - 0,93 (0,88 – MUY
Cuestionario (ODI; 4 semanas) indirecta imprecisiónC 0.98) BAJO
1 GRADE se realizó con énfasis en el AUC, ya que esta fue la medida principal discutida en la toma de decisiones, ya que el IC del 95 % no estaba disponible para el análisis.
2 a) El riesgo de sesgo se evaluó mediante la lista de verificación PROBAST. Cuando hubo más de un estudio agrupado, la calificación general del riesgo de sesgo se basó en la mayoría de las pruebas.
3 c) El juicio de precisión se basó en el valor medio de AUC y su IC del 95%. La evidencia se disminuyó en 1 incremento si el IC variaba en 2 áreas (50–90 % y 90–100 %) y en 2 incrementos
4 si los estudios individuales variaban en 3 áreas (0–50 %, 50–90 % y 90– 100%).
5 d) Números transcritos directamente del papel.
6 e) Los datos de sensibilidad y especificidad se informan sólo del estudio más grande (N = 500) (Hill 2008). Los datos de sensibilidad/especificidad no se informaron en el segundo estudio más pequeño.
1
Discriminación
Dolor lumbar y ciática
Nota: Un estudio75con muy alto riesgo de sesgo evaluó la capacidad pronóstica de la regla de predicción clínica de manipulación espinal para predecir un resultado positivo o negativo
Centro Nacional de Directrices Clínicas, 2016
2 para el dolor lumbar (evaluado por un cambio del 50 % en el ODI a la semana). Este estudio solo informó el cociente de verosimilitud positivo (13,2 %, IC del 95 % 3,4
3 – 52,1) y cociente de probabilidad negativo (0,10 %, IC del 95 %: 0,03 – 0,41) para un subgrupo de participantes que recibieron manipulación más ejercicio como intervención.
4 Tabla 14: Perfil de evidencia clínica: herramientas para predecir el dolor (evaluado usando la escala NRS y PGIC = Impresión global de cambio del paciente, puntaje 1-7)
5
área bajo
Curva
No de Agrupados/Yo
Herramienta de riesgo estudios norte Riesgo de sesgo Inconsecuencia indirecta imprecisión Sensibilidad especificidad dian (rango) Calidad
Retroceder
INICIO DE VUELTA – a los 12 meses 1 53 Altoa - No serio No serio - - 0,71 (0,54 MODERADO
(atención secundaria) indirecta imprecisión a 0,88)
INICIO DE VUELTA – a los 6 meses 2 1013 Muy altoa - No serio No serio - - 0,73 (0,72 BAJO
(atención secundaria) indirecta imprecisión a 0,73)
76
INICIO DE VUELTA – a los 6 meses 1 172 Muy altoa - No serio Serio - - 0,66 (0,46 MUY BAJO
(atención primaria) indirecta imprecisiónC a 0,85)
STarT Back – traducción al 1 344 Muy altoa - No serio No serio - - 0,79 (0,68 BAJO
danés a los 3 meses indirecta imprecisión a 0,89)
INICIO DE VUELTA – Reino Unido a los 3 meses 2 1594 Muy altoa - No serio No serio - - 0,68 (0,55 BAJO
indirecta imprecisión a 0,81)
Conjunto de elementos de riesgo de dolor crónico
Ítem de riesgo de dolor crónico fijado a los 4 1 571 Muy altoa - No serio No serio 72 70 0,79 (0,75 BAJO
meses indirecta imprecisión a 0,83)
RCP Hancock
RCP Hancock a las 12 semanas 1 937 Muy altoa - No serio No serio - - 0,60 (0,56- BAJO
indirecta imprecisión 0,64)
6 GRADE se realizó con énfasis en el AUC, ya que esta fue la medida principal discutida en la toma de decisiones, ya que el IC del 95 % no estaba disponible para el análisis.
7 a) El riesgo de sesgo se evaluó mediante la lista de verificación PROBAST. Cuando hubo más de un estudio agrupado, la calificación general del riesgo de sesgo se basó en la mayoría de las pruebas.
8 c) El juicio de precisión se basó en el valor medio de AUC y su IC del 95%. La evidencia se disminuyó en 1 incremento si el IC variaba en 2 áreas (50–90 % y 90–100 %) y en 2 incrementos
9 si los estudios individuales variaban en 3 áreas (0–50 %, 50–90 % y 90– 100%).
Herramientas de evaluación de riesgos y estratificación
6.4.3.21Calibración
2 Tabla 15: Perfil de evidencia clínica: herramientas para predecir la mejora funcional (según la evaluación mediante una variedad de métodos que incluyen autoinforme, ODI,
3 RMDQ)
Creencias de evitación del miedo 1 146 Muy altoa - No serio No 39.6 - - BAJO
cuestionario fisico indirecta estimable
escala de actividad a los 6 meses
Creencias de evitación del miedo 1 146 Muy altoa - No serio No 41.4 - - BAJO
cuestionario escala de trabajo indirecta estimable
fisico a los 6 meses
Escala de catastrofización del dolor a los 1 146 Muy altoa - No serio No 41.2 - - BAJO
6 meses indirecta estimable
Escala Tampa de Kinesiofobia
Cuestionario de salud del paciente- 1 146 Muy altoa - No serio No 41.2 - - BAJO
Herramientas de evaluación de riesgos y estratificación
1 a) El riesgo de sesgo se evaluó mediante la lista de verificación PROBAST. Cuando hubo más de un estudio agrupado, la calificación general del riesgo de sesgo se basó en la mayoría de las pruebas.
2 bc) El juicio de precisión se basó en el valor medio de AUC y su IC del 95%. La evidencia se disminuyó en 1 incremento si el IC variaba en 2 áreas (50–90 % y 90–100 %) y en 2
3 incrementos si los estudios individuales variaban en 3 áreas (0–50 %, 50–90 % y 90– 100%).
4
5 Un estudio233calibración informada para el ÖMSPQ (intersección (IC del 95 %) -0,03 (-0,06 - -0,00) y pendiente (IC del 95 %) 1,09 (1,01 - 1,17)) y escala de percepción del dolor lumbar
6 (intersección (IC del 95 %) 0,02 ( 0,02 - 0,03) y pendiente (95 % IC) 0,95 (0,93 - 0,97)) en la predicción del resultado funcional a 1 año con (alto riesgo de sesgo).
7
78
8Tabla 16: Perfil de evidencia clínica: herramientas para predecir el dolor (evaluado usando NRS)
Creencias de evitación del miedo 1 146 Muy altoa - No serio - 17.6 - - BAJO
cuestionario fisico indirecta
escala de actividad a los 6 meses
Creencias de evitación del miedo 1 146 Muy altoa - No serio - 18.9 - - BAJO
Herramientas de evaluación de riesgos y estratificación
Escala de catastrofización del dolor a los 1 146 Muy altoa - No serio - 17.1 - - BAJO
6 meses indirecta
Escala Tampa de Kinesiofobia
1 a) El riesgo de sesgo se evaluó mediante la lista de verificación PROBAST. Cuando hubo más de un estudio agrupado, la calificación general del riesgo de sesgo se basó en la mayoría de las pruebas.
2 c) El juicio de precisión se basó en el valor medio de AUC y su IC del 95%. La evidencia se disminuyó en 1 incremento si el IC variaba en 2 áreas (50–90 % y 90–100 %) y en 2 incrementos
3 si los estudios individuales variaban en 3 áreas (0–50 %, 50–90 % y 90– 100%).
4
5 Un estudio510informó la calibración para la regla de predicción clínica (RCP) de Hancock como el número de eventos observados frente a los eventos de recuperación previstos
6 (evaluados por estar libre de dolor). Aunque no se ofrecieron estadísticas formales de calibración, los autores informaron que a las 4 y 12 semanas las tasas de recuperación previstas
7 y reales no estaban bien calibradas y las tasas observadas eran típicamente un 10% inferiores a las tasas previstas (riesgo de sesgo muy alto).
6.4.3.38Reclasificación
No de
Partícipe Efectos absolutos anticipados
CV (SF-36, PCS, 0-100) ≤4 meses 78 MUY BAJOa, b La calidad de vida media (SF-36, uds, La CdV media (SF-36, uds,0-100) ≤4 meses en
(1 estudio) debido al riesgo de 0-100) ≤4 meses en los grupos de los grupos de intervención fue 6,2 veces
4 semanas parcialidad, control fue mayor
imprecisión 36.8 (8,74 inferior a 21,14 superior)
CdV(SF-36,PCS,0-100) >4 meses - 1 año 234 BAJOa * La QoL media (SF-36, uds, 0-100) >4
(2 estudios) debido al riesgo de meses en los grupos de intervención fue
> 4 meses - parcialidad 0,59 menor
1 año (3.7 inferior a 2.52 superior)
80
CdV (SF-36, MCS,0-100) ≤4 meses 78 MUY BAJOa, b La CdV media (SF-36, MCS,0-100) La CdV media (SF-36, MCS,0-100) ≤4
(1 estudio) debido al riesgo de ≤4 meses en los grupos de meses en los grupos de intervención fue
4 semanas parcialidad, control fue 1,6 más alta
imprecisión 50.6 (13,34 inferior a 16,54 superior)
CV(SF-36,MCS,0-100) >4 meses - 1 año 234 BAJOa * La CdV media (SF-36,MCS,0-100) >4
(2 estudios) debido al riesgo de meses - 1 año en los grupos de
> 4 meses - parcialidad intervención fue
1 año 0,94 más alto
(2,24 inferior a 4,12 superior)
Dolor (NRS,0-10) ≤4 meses 156 MUY BAJOa, b El dolor medio (NRS,0-10) ≤ 4 El dolor medio (NRS,0-10) ≤ 4 meses - nuevo
(1 estudio) debido al riesgo de meses - nuevo subgrupo en los subgrupo en los grupos de intervención fue
8 semanas parcialidad, grupos de control fue
imprecisión 6.2 0,49 inferior
(1,34 inferior a 0,36 superior)
Dolor (NRS,0-10) >4 meses - 1 año 156 MUY BAJOa, b El dolor medio (NRS,0-10) >4 El dolor medio (NRS,0-10) >4 meses - 1 año
(1 estudio) debido al riesgo de meses - 1 año - nuevo - nuevo subgrupo en los grupos de
1 año parcialidad, subgrupo en los grupos de control intervención fue
Herramientas de evaluación de riesgos y estratificación
No de
Partícipe Efectos absolutos anticipados
Función(ODI,0-100) >4 meses - 1 año* 234 BAJOa * La función media (ODI, 0-100)> 4 meses
(2 estudios) debido al riesgo de - 1 año en los grupos de intervención fue
> 4 meses - parcialidad 0,23 mayor
1 año (4,09 inferior a 4,54 superior)
debido al riesgo de
744 por 1000 30 más por 1000 (de 97
1 año parcialidad 1.24) menos a 179 más)
Criterios de respondedor (ODI>30% de mejora) 156 MUY BAJOa, b RR 0,81 Moderado
≤4 meses (1 estudio) debido al riesgo de (0,55 a 451 por 1000 86 menos por 1000 (de 203
8 semanas parcialidad, 1.19) menos a 86 más)
imprecisión
Criterios de respondedor (ODI>30% 156 MUY BAJOa, b RR 1.19 Moderado
de mejora)>4 meses - 1 año (1 estudio) debido al riesgo de (0,99 a 683 por 1000 130 más por 1000 (de 7
1 año parcialidad, 1.43) menos a 294 más)
imprecisión
Número de citas de terapia ≤ 4 78 MUY BAJOa, b El número medio de citas de El número medio de citas de
meses (1 estudio) debido al riesgo de terapia ≤ 4 meses en los terapia ≤ 4 meses en los grupos
4 semanas parcialidad, grupos de control fue de intervención fue
imprecisión 5.7 0,3 inferior
(1,68 inferior a 1,08 superior)
Número de citas de terapia >4 78 BAJOa El número medio de citas El número medio de citas de terapia
meses - 1 año (1 estudio) debido al riesgo de de terapia > 4 meses - 1 >4 meses - 1 año en el
Herramientas de evaluación de riesgos y estratificación
No de
Partícipe Efectos absolutos anticipados
1 año parcialidad año en los grupos de control fue de grupos de intervención fue
6,7 0,5 más bajo
(2,66 inferior a 1,66 superior)
aRebajado en 1 incremento si la mayoría de la evidencia tenía un alto riesgo de sesgo, y en 2 incrementos si la mayoría de la evidencia tenía un riesgo muy alto de sesgo
bRebajado en 1 incremento si el intervalo de confianza cruzó 1 MID o en 2 incrementos si el intervalo de confianza cruzó ambos MID.
* Tasa de control no informada en el estudio, solo se proporciona la diferencia de medias.
1Tabla 18: Sistema de clasificación de O'Sullivan versus clasificación de herramienta sin riesgo
Dolor (EVA,0-10)≤ 4 meses 94 BAJOa El dolor medio (EVA,0-10)≤ 4 meses El dolor medio (EVA,0-10)≤ 4 meses en los
(1 estudio) debido al riesgo de en los grupos control fue grupos de intervención fue
3 meses parcialidad 3.8 2.1 inferior
(2,83 a 1,37 menos)
Dolor(EVA,0-10)>4 meses - 94 MUY BAJOa, b El dolor medio (EVA,0-10)>4 meses - 1 año El dolor medio (EVA,0-10)>4 meses - 1 año en los
1 año (1 estudio) debido al riesgo de en los grupos de control fue de 3,8 grupos de intervención fue
1 año sesgo, imprecisión 1.5 más bajo
meses - 1 año (1 estudio) debido al riesgo de meses - 1 año en los grupos de control en los grupos de intervención fue
1 año sesgo, imprecisión fue 9,8 menor
19.7 (14,21 a 5,39 inferior)
aRebajado en 1 incremento si la mayoría de la evidencia tenía un alto riesgo de sesgo, y en 2 incrementos si la mayoría de la evidencia tenía un riesgo muy alto de sesgo
bRebajado en 1 incremento si el intervalo de confianza cruzó 1 MID o en 2 incrementos si el intervalo de confianza cruzó ambos MID.
1Tabla 19: Herramienta de riesgo STarT Back versus clasificación de herramienta sin riesgo
CV (SF-12, PCS, 0-100) ≤4 851 MUY BAJOa, b La CdV media (sf-12, uds,0-100) ≤4 meses La QoL media (sf-12, pcs,0-100) ≤4 meses
meses (1 estudio) debido al riesgo de en los grupos de control fue de 5,2 en los grupos de intervención fue 2,3 más
4 meses sesgo, imprecisión alta
(0,42 a 4,18 superior)
CdV (SF-12, PCS,0-100) >4 851 MUY BAJOa, b La QoL media (sf-12, pcs,0-100) >4 La QoL media (sf-12, pcs,0-100) >4
meses - 1 año (1 estudio) debido al riesgo de meses - 1 año en los grupos de control meses - 1 año en los grupos de
12 meses sesgo, imprecisión fue intervención fue
5.2 2.3 más alto
(0,73 a 3,87 más alto)
CdV (SF-12, MCS,0-100) ≤4 851 MUY BAJOa, b La CdV media (sf-12, MCS,0-100) ≤4 La CdV media (sf-12, MCS,0-100) ≤4 meses
meses (1 estudio) debido al riesgo de meses en los grupos de control fue de en los grupos de intervención fue 0 más
4 meses sesgo, imprecisión 2,1 alta
(1,58 inferior a 1,58 superior)
CdV (SF-12, MCS,0-100) >4 851 BAJOa La QoL media (sf-12, MCS,0-100) >4 La QoL media (sf-12, MCS,0-100) >4
Traducido del inglés al español - www.onlinedoctranslator.com
meses - 1 año (1 estudio) debido al riesgo de sesgo meses - 1 año en los grupos de control meses - 1 año en los grupos de
12 meses fue intervención fue
1.2 0.5 más alto
(1,39 inferior a 2,39 superior)
Dolor (EVA/NRS,0-10)≤ 4 meses 951 BAJOa El dolor medio (EVA,0-10)≤4 meses - 1 El dolor medio (EVA,0-10)≤4 meses - 1 año
(2 estudios) debido al riesgo de sesgo año en los grupos control fue de 2,06 en los grupos de intervención fue 0,70
≤4 meses menor
(1,01 inferior a 0,39 inferior)
Dolor(EVA,0-10)>4 meses - 1 851 MODERADOa El dolor medio (EVA, 0-10)> 4 meses - 1 El dolor medio (EVA, 0-10)> 4 meses - 1
año (1 estudio) debido al riesgo de sesgo año en los grupos de control fue año en los grupos de intervención fue 0,2
12 meses - 2.8 menor
(0,58 inferior a 0,18 superior)
84
Función (RMDQ/ODI, 0-24) ≤ 4 951 MUY BAJOa B C La función media (RMDQ/ODI,0-24)≤ 4 La función media (RMDQ/ODI,0-24)≤ 4
meses (2 estudios) debido al riesgo de meses en los grupos control fue meses en los grupos de intervención fue
≤4 meses sesgo, inconsistencia, - 3.7 0,34 inferior
imprecisión (0,47 a 0,2 menos)
Función (RMDQ, 0-24)> 4 meses 851 BAJOa La función media (RMDQ,0-24)>4 meses La función media (RMDQ,0-24)>4
- 1 año (1 estudio) debido al riesgo de sesgo - 1 año en los grupos de control fue meses - 1 año en los grupos de
12 meses intervención fue
- 3.3 1 inferior
(1,89 a 0,11 inferior)
Malestar Psicológico (HADS, 851 MODERADOa El malestar psicológico medio El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)≤ 4 (1 estudio) debido al riesgo de sesgo (HADS, subescala de ansiedad, 0-21) subescala de ansiedad, 0-21)≤ 4 meses en los
meses 4 meses ≤ 4 meses en los grupos control fue grupos de intervención fue
- 1.2 0,5 inferior
(1,05 inferior a 0,05 superior)
Malestar psicológico (HADS, 851 BAJOa La angustia psicológica media (HADS, La angustia psicológica media (HADS,
subescala de ansiedad, 0-21)>4 (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21)> 4 subescala de ansiedad, 0-21)> 4 meses - 1
Herramientas de evaluación de riesgos y estratificación
meses - 1 año 12 meses meses - 1 año en los grupos de control año en los grupos de intervención fue 0,3
fue menor
- 1.0 (0,9 inferior a 0,3 superior)
Malestar Psicológico (HADS, 851 BAJOa La angustia psicológica media (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21)≤ (1 estudio) debido al riesgo de sesgo subescala de depresión, 0-21) ≤ 4 meses subescala de depresión, 0-21) ≤ 4 meses en
4 meses 4 meses en los grupos de control fue los grupos de intervención fue
- 1.4 0,3 inferior
(0,87 inferior a 0,27 superior)
Malestar psicológico (HADS, 851 MUY BAJOa, b La angustia psicológica media (HADS, La angustia psicológica media (HADS,
subescala de depresión, 0-21) (1 estudio) debido al riesgo de subescala de depresión, 0-21) >4 meses subescala de depresión, 0-21) >4 meses - 1
>4 meses - 1 año 12 meses sesgo, imprecisión - 1 año en los grupos de control fue año en los grupos de intervención fue 0,5
más baja
85
CdV (EQ-5D,0-1) ≤4 221 MUY BAJOa, b La CdV media (eq-5d,0-1) ≤4 meses La CdV media (eq-5d,0-1) ≤4 meses
meses (estratificado) - Riesgo bajo (1 estudio) debido al riesgo de (estratificada) - bajo riesgo en los (estratificada) - bajo riesgo en los
4 meses sesgo, imprecisión grupos de control fue grupos de intervención fue
0.821 0,02 inferior
(0,08 inferior a 0,03 superior)
CdV (EQ-5D,0-1) ≤4 394 MUY BAJOa, b La CdV media (eq-5d,0-1) ≤4 meses La CdV media (eq-5d,0-1) ≤4 meses
meses (estratificado) - Riesgo medio (1 estudio) debido al riesgo de (estratificada) - riesgo medio en los (estratificada) - riesgo medio en los grupos
4 meses sesgo, imprecisión grupos control fue de intervención fue
0.674 0.03 más alto
(0,03 inferior a 0,09 superior)
CdV (EQ-5D,0-1) ≤4 236 MUY BAJOa, b La CdV media (eq-5d,0-1) ≤4 meses La CdV media (eq-5d,0-1) ≤4 meses
meses (estratificado) - Alto riesgo (1 estudio) debido al riesgo de (estratificada) - alto riesgo en los grupos (estratificada) - alto riesgo en los grupos
4 meses sesgo, imprecisión de control fue de intervención fue
0.474 0.11 más alto
(0,01 a 0,21 más alto)
Herramientas de evaluación de riesgos y estratificación
CdV (EQ-5D,0-1) >4 meses - 1 año 221 MUY BAJOa La CV media (eq-5d,0-1) >4 meses La CV media (eq-5d,0-1) >4 meses - 1 año
(estratificado) - Riesgo bajo (1 estudio) debido al riesgo de - 1 año (estratificado) - bajo riesgo en los (estratificado) - bajo riesgo en el
12 meses sesgo, imprecisión grupos de control fue grupos de intervención fue
0.773 0,01 más alto
(0,05 inferior a 0,08 superior)
CV (EQ-5D,0-1) >4 meses - 1 año 394 MUY BAJOa, b La CV media (eq-5d,0-1) >4 meses La CdV media (eq-5d,0-1) >4 meses - 1 año
(estratificado) - Riesgo medio (1 estudio) debido al riesgo de - 1 año (estratificado) - riesgo medio en (estratificada) - riesgo medio en los grupos
12 meses sesgo, imprecisión los grupos de control fue de intervención fue
0635 0.05 más alto
(0,01 inferior a 0,12 superior)
CdV (EQ-5D,0-1) >4 meses - 1 año 236 MUY BAJOa, b La CV media (eq-5d,0-1) >4 meses La CV media (eq-5d,0-1) >4 meses - 1 año
(estratificado) - Alto riesgo (1 estudio) debido al riesgo de - 1 año (estratificado) - alto riesgo en los (estratificado) - alto riesgo en el
86
CdV (SF-12, PCS,0-100) ≤4 meses 221 MUY BAJOa, b La CdV media (sf-12, uds,0-100) ≤4 meses La QoL media (sf-12, pcs,0-100) ≤4 meses
(estratificado) - Riesgo bajo (1 estudio) debido al riesgo de (estratificada) - riesgo bajo en los grupos (estratificada) - bajo riesgo en los grupos
sesgo, imprecisión de control fue de intervención fue
1.8 1.4 más alto
(1,31 inferior a 4,11 superior)
CV (SF-12, PCS,0-100) ≤4 meses 394 MUY BAJOa, b La CdV media (sf-12, uds,0-100) ≤4 meses La CdV media (sf-12, uds,0-100) ≤4 meses
(estratificado) - Riesgo medio (1 estudio) debido al riesgo de (estratificada) - riesgo medio en los (estratificada) - riesgo medio en los grupos
4 meses sesgo, imprecisión grupos de control fue de intervención fue
6.4 2.7 más alto
(0,39 a 5,01 superior)
QoL (SF-12, PCS,0-100) ≤4 meses 236 MUY BAJOa, b La CdV media (sf-12, uds,0-100) ≤4 meses La CdV media (sf-12, uds,0-100) ≤4 meses
(estratificado) - Alto riesgo (1 estudio) debido al riesgo de (estratificada) - alto riesgo en los grupos (estratificada) - alto riesgo en los grupos
4 meses sesgo, imprecisión de control fue de intervención fue
Herramientas de evaluación de riesgos y estratificación
CdV (SF-12, PCS,0-100) >4 meses - 1 221 MUY BAJOa, b La CdV media (sf-12, uds,0-100) >4 meses La CdV media (sf-12, uds,0-100) >4 meses - 1
año (estratificado) - Riesgo bajo (1 estudio) debido al riesgo de - 1 año (estratificada) - bajo riesgo en los año (estratificada) - bajo riesgo en los
12 meses sesgo, imprecisión grupos de control fue grupos de intervención fue
2.4 1.6 más alto
(1,19 inferior a 4,39 superior)
CV (SF-12, PCS,0-100) >4 392 MUY BAJOa, b La CdV media (sf-12, uds,0-100) >4 meses - La CdV media (sf-12, uds,0-100) >4 meses - 1
meses - 1 año (estratificado) - (1 estudio) debido al riesgo de 1 año (estratificada) - riesgo medio en los año (estratificada) - riesgo medio en los
Riesgo medio 12 meses sesgo, imprecisión grupos de control fue de 5,7 grupos de intervención fue
3.1 superior
(0,66 a 5,54 más alto)
87
CdV (SF-12, PCS,0-100) >4 meses - 1 236 MUY BAJOa, b La CdV media (sf-12, uds,0-100) >4 meses - La QoL media (sf-12, pcs,0-100) >4 meses - 1
año (estratificado) - Alto riesgo (1 estudio) debido al riesgo de 1 año (estratificada) - alto riesgo en los año (estratificada) - alto riesgo en los grupos
12 meses sesgo, imprecisión grupos de control fue de intervención fue
6.8 1.8 más alto
(1,66 inferior a 5,26 superior)
QoL (SF-12, MCS,0-100) ≤4 meses 221 MUY BAJOa, b La CdV media (sf-12, MCS,0-100) ≤4 meses La CdV media (sf-12, MCS,0-100) ≤4 meses
(estratificado) - Riesgo bajo (1 estudio) debido al riesgo de (estratificada) - bajo riesgo en los grupos (estratificada) - bajo riesgo en los grupos
4 meses sesgo, imprecisión de control fue de intervención fue
1 1.5 más bajo
QoL (SF-12, MCS,0-100) ≤4 meses 394 BAJOa La CdV media (sf-12, MCS,0-100) ≤4 La CdV media (sf-12, MCS,0-100) ≤4 meses
(estratificado) - Riesgo medio (1 estudio) debido al riesgo de sesgo meses (estratificada) - riesgo medio en (estratificada) - riesgo medio en los
4 meses los grupos de control fue grupos de intervención fue
1.1 0.4 más alto
(2,01 inferior a 2,81 superior)
CdV (SF-12, MCS,0-100) ≤4 236 MUY BAJOabdominales La QoL media (sf-12, MCS,0-100) ≤4 La QoL media (sf-12, MCS,0-100) ≤4
Herramientas de evaluación de riesgos y estratificación
meses (estratificado) - Alto riesgo (1 estudio) debido al riesgo de meses (estratificado) - alto riesgo en los meses (estratificado) - alto riesgo en los
4 meses sesgo, imprecisión grupos de control fue grupos de intervención fue
4.8 0,7 más alto
(3,01 inferior a 4,41 superior)
CdV (SF-12,MCS,0-100) >4 meses - 1 221 MUY BAJOa, b La CdV media (sf-12,MCS,0-100) ≤4 meses La CdV media (sf-12,MCS,0-100) ≤4 meses
año (estratificado) - Riesgo bajo (1 estudio) debido al riesgo de (estratificada) - bajo riesgo en los grupos (estratificada) - bajo riesgo en los grupos
12 meses sesgo, imprecisión de control fue de intervención fue
0.4 1.7 inferior
(4,55 inferior a 1,15 superior)
CV (SF-12,MCS,0-100) >4 394 MUY BAJOa, b La CdV media (sf-12,MCS,0-100) ≤4 La CdV media (sf-12,MCS,0-100) ≤4 meses
meses - 1 año (estratificado) - (1 estudio) debido al riesgo de meses (estratificada) - riesgo medio en (estratificada) - riesgo medio en los
Riesgo medio 12 meses sesgo, imprecisión los grupos de control fue grupos de intervención fue
88
QoL (SF-12,MCS,0-100) >4 meses - 1 236 MUY BAJOa, b La CdV media (sf-12,MCS,0-100) ≤4 meses La CdV media (sf-12,MCS,0-100) ≤4 meses
año (estratificado) - Alto riesgo (1 estudio) debido al riesgo de (estratificada) - alto riesgo en los grupos (estratificada) - alto riesgo en los grupos
12 meses sesgo, imprecisión de control fue de intervención fue
3.6 1.9 más alto
(1,83 inferior a 5,63 superior)
Dolor (EVA/NPRS,0-10)≤ 4 250 MUY BAJOa, b El dolor medio (EVA, 0-10) ≤ 4 meses El dolor medio (EVA, 0-10) ≤ 4 meses
meses (estratificado) - Riesgo bajo (2 estudios) debido al riesgo de (estratificado) - bajo riesgo en los (estratificado) - bajo riesgo en los
≤4 meses sesgo, imprecisión grupos control fue grupos de intervención fue
- 1.2 0,14 inferior
(0,68 inferior a 0,4 superior)
Dolor (EVA/NPRS,0-10)≤ 4 437 MUY BAJOa, b El dolor medio (EVA, 0-10) ≤ 4 meses El dolor medio (EVA, 0-10) ≤ 4 meses
meses (estratificado) - Riesgo medio (2 estudios) debido al riesgo de (estratificado) - riesgo medio en los (estratificado) - riesgo medio en los grupos
≤4 meses sesgo, imprecisión grupos control fue de intervención fue
- 1.5 0,81 inferior
Herramientas de evaluación de riesgos y estratificación
Dolor (EVA/NPRS,0-10)>4 meses 394 BAJOa El dolor medio (EVA, 0-10)> 4 meses - 1 año El dolor medio (EVA, 0-10)> 4 meses - 1 año
89
- 1 año (estratificado) - Riesgo medio (1 estudio) debido al riesgo de sesgo (estratificado) - riesgo medio en los grupos (estratificado) - riesgo medio en los grupos
12 meses de control fue de intervención fue
-3 0,3 inferior
(0,87 inferior a 0,27 superior)
Dolor (EVA/NPRS,0-10)>4 meses 236 BAJOa El dolor medio (EVA, 0-10)> 4 meses - 1 año El dolor medio (EVA, 0-10)> 4 meses - 1 año
- 1 año (estratificado) - Alto riesgo (1 estudio) debido al riesgo de sesgo (estratificado) - alto riesgo en los grupos de (estratificado) - alto riesgo en los grupos de
12 meses control fue intervención fue
- 3.6 0.1 inferior
(0,92 inferior a 0,72 superior)
Función(RMDQ/ODI)≤ 4 meses 250 BAJOa La función media (RMDQ/ODI)≤ 4 meses La función media (RMDQ/ODI)≤ 4 meses
(estratificado) - Bajo Riesgo (2 estudios) debido al riesgo de sesgo (estratificado) - bajo riesgo en los (estratificado) - bajo riesgo en los
≤4 meses grupos de control fue grupos de intervención fue
- 3,45 0,22 desviaciones estándar inferior
(0,48 inferior a 0,05 superior)
Función(RMDQ/ODI)≤ 4 meses 437 MUY BAJOa B C La función media (RMDQ/ODI)≤ 4 La función media (RMDQ/ODI)≤ 4 meses
(estratificado) - Riesgo medio (2 estudios) debido al riesgo de sesgo, meses (estratificado) - riesgo medio en (estratificado) - riesgo medio en el
Herramientas de evaluación de riesgos y estratificación
≤4 meses inconsecuencia, los grupos de control fue grupos de intervención fue 0,39
imprecisión - 2.1 desviaciones estándar inferior (0,59
a 0,18 inferior)
Función (RMDQ/ODI)≤ 4 meses 264 MUY BAJOa B C La función media (RMDQ/ODI)≤ 4 La función media (RMDQ/ODI)≤ 4 meses
(estratificado) - Alto riesgo (2 estudios) debido al riesgo de meses (estratificado) - alto riesgo en (estratificado) - alto riesgo en los grupos
≤4 meses sesgo, imprecisión los grupos control fue de intervención fue
- 5.6 0,38 desviaciones estándar menos
(0,64 a 0,12 menos)
Función (RMDQ, 0-24)> 4 meses 221 BAJOa La función media (RMDQ,0-24)>4 meses - La función media (RMDQ,0-24)>4 meses - 1
- 1 año (estratificado) - Riesgo bajo (1 estudio) debido al riesgo de sesgo 1 año (estratificado) - bajo riesgo en los año (estratificado) - bajo riesgo en los
12 meses grupos de control fue grupos de intervención fue
- 1.2 0,4 inferior
90
Función (RMDQ, 0-24)> 4 meses 394 BAJOa La función media(RMDQ,0-24)>4 meses La función media (RMDQ,0-24)>4 meses - 1
- 1 año (estratificado) - Riesgo (1 estudio) debido al riesgo de sesgo - 1 año (estratificado) - riesgo medio en año (estratificado) - riesgo medio en los
medio 12 meses los grupos de control fue grupos de intervención fue
- 3.6 1.3 inferior
(2,59 a 0,01 inferior)
Función (RMDQ, 0-24)> 4 meses 236 BAJOa La función media (RMDQ,0-24)>4 meses La función media (RMDQ,0-24)>4 meses - 1
- 1 año (estratificado) - Alto riesgo (1 estudio) debido al riesgo de sesgo - 1 año (estratificado) - alto riesgo en los año (estratificado) - alto riesgo en los
12 meses grupos de control fue grupos de intervención fue
- 4.8 1.1 inferior
(2,89 inferior a 0,69 superior)
Malestar psicológico (HADS, 221 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)≤ 4 (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21) ≤ 4 meses subescala de ansiedad, 0-21)≤ 4
meses (estratificado) - Riesgo bajo 4 meses (estratificado) - bajo riesgo en los meses (estratificado) - bajo riesgo en los
grupos de control fue grupos de intervención fue
- 0.9 0.3 más alto
Herramientas de evaluación de riesgos y estratificación
Malestar Psicológico (HADS, 394 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)≤ 4 (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21) ≤ 4 meses subescala de ansiedad, 0-21)≤ 4
meses (estratificado) - Riesgo medio 4 meses (estratificado) - riesgo medio en los meses (estratificado) - el riesgo medio en los
grupos control fue grupos de intervención fue
- 0.8 0,9 inferior
(1,68 a 0,12 menos)
Malestar Psicológico (HADS, 236 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)≤ 4 (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21) ≤ 4 meses subescala de ansiedad, 0-21)≤ 4
meses (estratificado) - Alto riesgo 4 meses (estratificado) - alto riesgo en los grupos meses (estratificado) - alto riesgo en los
de control fue grupos de intervención fue
- 2.2 0,6 inferior
91
Malestar psicológico (HADS, 221 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)>4 (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21)>4 meses - 1 subescala de ansiedad, 0-21) >4 meses - 1 año
meses - 1 año (estratificado) - Riesgo 12 meses año (estratificado) - bajo riesgo en los (estratificado) - bajo riesgo en el
bajo grupos de control fue grupos de intervención fue
- 0.8 0,3 más alto
(0,75 inferior a 1,35 superior)
Malestar psicológico (HADS, 394 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)>4 (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21)>4 meses - 1 subescala de ansiedad, 0-21)>4 meses - 1 año
meses - 1 año (estratificado) - 12 meses año (estratificado) - riesgo medio en los (estratificado) - riesgo medio en los grupos de
Riesgo medio grupos de control fue intervención fue
- 0.6 0.7 más bajo
Malestar psicológico (HADS, 236 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de ansiedad, 0-21)>4 meses (1 estudio) debido al riesgo de sesgo subescala de ansiedad, 0-21)>4 meses - 1 subescala de ansiedad, 0-21)>4 meses - 1 año
- 1 año (estratificado) - Alto 12 meses año (estratificado) - alto riesgo en los (estratificado) - alto riesgo en el
grupos de control fue
Herramientas de evaluación de riesgos y estratificación
Malestar psicológico (HADS, 221 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21)≤ 4 (1 estudio) debido al riesgo de sesgo subescala de depresión, 0-21) >4 meses - subescala de depresión, 0-21)>4 meses - 1
meses (estratificado) - Riesgo bajo 4 meses 1 año (estratificado) - bajo riesgo en los año (estratificado) - bajo riesgo en el
grupos de control fue grupos de intervención fue
- 0.2 0,1 menor
(1,02 inferior a 0,82 superior)
Malestar psicológico (HADS, 394 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21) ≤4 (1 estudio) debido al riesgo de sesgo subescala de depresión, 0-21)>4 meses subescala de depresión, 0-21) >4 meses - 1 año
meses (estratificado) - Riesgo medio 4 meses - 1 año (estratificado) - riesgo medio en (estratificado) - riesgo medio en los grupos de
92
Angustia psicológica (HADS, 236 MUY BAJOa, b El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21) ≤4 (1 estudio) debido al riesgo de subescala de depresión, 0-21)>4 meses - 1 subescala de depresión, 0-21)>4 meses - 1
meses (estratificado) - Alto riesgo 4 meses sesgo, imprecisión año (estratificado) - alto riesgo en los año (estratificado) - alto riesgo en el
grupos de control fue grupos de intervención fue
- 1.9 1.1 más bajo
(2,17 a 0,03 inferior)
Malestar psicológico (HADS, 221 BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21)>4 (1 estudio) debido al riesgo de sesgo subescala de depresión, 0-21) >4 meses - subescala de depresión, 0-21)>4 meses - 1
meses - 1 año (estratificado) - Riesgo 12 meses 1 año (estratificado) - bajo riesgo en los año (estratificado) - bajo riesgo en el
bajo grupos de control fue grupos de intervención fue 0
- 0.2 más alto
(0,96 inferior a 0,96 superior)
Malestar Psicológico (HADS, 394 BAJOa El malestar psicológico medio El malestar psicológico medio (HADS,
Herramientas de evaluación de riesgos y estratificación
Malestar psicológico (HADS, 236 MUY BAJOa, b El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21)>4 (1 estudio) debido al riesgo de subescala de depresión, 0-21)>4 meses - 1 subescala de depresión, 0-21)>4 meses - 1
meses - 1 año (estratificado) - Alto 12 meses sesgo, imprecisión año (estratificado) - alto riesgo en los año (estratificado) - alto riesgo en el
riesgo grupos de control fue grupos de intervención fue
- 1.5 1.2 más bajo
(2,43 inferior a 0,03 superior)
Criterios de respondedor (pacientes con 100 MUY BAJOa, b RR 2,25 212 por 1000 265 más por 1000 (de 23
93
> 30% de mejora del dolor) ≤ 4 (1 estudio) debido al riesgo de (1.11 a más a 753 más)
meses ≤4 meses sesgo, imprecisión 4.55)
Criterios de respondedor (pacientes con 29 MUY BAJOa, b RR 0,93 286 por 1000 20 menos por 1000
> 30% mejoría del dolor-ESTRATIFICADO) (1 estudio) debido al riesgo de (0,29 a (de 203 menos a 580 más)
≤ 4 meses - bajo riesgo ≤4 meses sesgo, imprecisión 3.03)
Criterios de respondedor (pacientes con 43 MUY BAJOa, b RR 3,87 167 por 1000 478 más por 1000 (de 10
> 30% mejoría del dolor- (1 estudio) debido al riesgo de (1,06 a más a 1000 más)
ESTRATIFICADO)≤ 4 meses - ≤4 meses sesgo, imprecisión 14.09)
riesgo medio
Criterios de respondedor (pacientes con 28 MUY BAJOa, b RR 2,67 143 por 1000 239 más por 1000 (de 86
> 30% mejoría del dolor- (1 estudio) debido al riesgo de (0,4 a menos a 1000 más)
ESTRATIFICADO)≤ 4 meses - alto ≤4 meses sesgo, imprecisión 17.74)
riesgo
Criterios de respondedor (pacientes con 100 MUY BAJOa, b RR 1,84 333 por 1000 280 más por 1000 (de 30
> 30% de mejora en (1 estudio) debido al riesgo de sesgo, (1,09 a más a 693 más)
Herramientas de evaluación de riesgos y estratificación
Criterios de respondedores (% de edad 43 MUY BAJOa, b RR 4.26 167 por 1000 544 más por 1000 (de 30
de pacientes con > 30% (1 estudio) debido al riesgo de (1,18 a más a 1000 más
mejora en ODI- ≤4 meses sesgo, imprecisión 15.39)
ESTRATIFICADODI)≤ 4 meses -
riesgo medio
de pacientes con > 30% (1 estudio) debido al riesgo de (0,47 a (de 227 menos a 921 más)
mejora en ODI- ≤4 meses sesgo, imprecisión 3.15)
ESTRATIFICADODI)≤ 4 meses - alto
riesgo
aRebajado en 1 incremento si la mayoría de la evidencia tenía un alto riesgo de sesgo, y en 2 incrementos si la mayoría de la evidencia tenía un riesgo muy alto de sesgo
bRebajado en 1 incremento si el intervalo de confianza cruzó 1 MID o en 2 incrementos si el intervalo de confianza cruzó ambos MID.
CRebajado en 1 o 2 incrementos debido a la heterogeneidad, yo2= 50 %, p = 0,04, no explicado por el análisis de subgrupos.
1Tabla 20: Herramienta de riesgo STarT Back versus clasificación de herramienta sin riesgo (cohorte IMPaCT)
No de
participante
Efectos absolutos anticipados
t Calidad de la Pariente
(estudios) evidencia efecto Diferencia de riesgo con STarT Back Group
Resultados Hacer un seguimiento (CALIFICACIÓN) (95% IC) Riesgo con atención habitual (IMPaCT) (95% IC)
CdV (SF-12, PCS, 0-100) >4 922 MUY BAJO La QoL media (sf-12, pcs,0-100) >4 La QoL media (sf-12, pcs,0-100) >4
Herramientas de evaluación de riesgos y estratificación
CdV (SF-12, MCS,0-100) >4 922 MUY BAJOa, b La CdV media (sf-12, MCS,0-100) >4 La CdV media (sf-12, MCS,0-100) >4 meses - 1
meses - 1 año (1 estudio) debido al riesgo de meses - 1 año en los grupos de control año en los grupos de intervención fue
6 meses parcialidad fue
2.1 0,2 inferior
(2,05 inferior a 1,65 superior)
Dolor(EVA,0-10)>4 meses - 1 año 922 MUY BAJOa El dolor medio (NRS,0-10)> 4 meses - 1 año El dolor medio (NRS,0-10)>4 meses - 1 año
(1 estudio) debido al riesgo de en los grupos de control fue en los grupos de intervención fue 0,2
6 meses parcialidad - 1.9 menor
(0,59 inferior a 0,19 superior)
Función(RMDQ,0-24)>4 meses - 1 922 MUY BAJOa La función media (RMDQ,0-24)>4 meses La función media (RMDQ,0-24)>4 meses
año (1 estudio) debido al riesgo de - 1 año en los grupos de control fue - 1 año en los grupos de intervención fue 0,5
6 meses parcialidad menor
- 2.7 (1,27 inferior a 0,27 superior)
95
Malestar psicológico (HADS, subescala 922 MUY BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
de ansiedad, 0-21) >4 meses (1 estudio) debido al riesgo de subescala de ansiedad, 0-21)> 4 meses - 1 subescala de ansiedad, 0-21)> 4 meses - 1
- 1 año 6 meses parcialidad año en los grupos de control fue año en los grupos de intervención fue
- 1.2 0,2 inferior
(0,8 inferior a 0,4 superior)
Malestar psicológico (HADS, 922 MUY BAJOa La angustia psicológica media (HADS, La angustia psicológica media (HADS,
subescala de depresión, 0-21) (1 estudio) debido al riesgo de subescala de depresión, 0-21) >4 meses - 1 subescala de depresión, 0-21) >4 meses - 1
>4 meses - 1 año 6 meses parcialidad año en los grupos de control fue año en los grupos de intervención fue 0,4
- 1.4 más baja
(0,91 inferior a 0,11 superior)
CdV (EQ-5D,0-1) ≤4 922 MUY BAJOa La CdV media (eq-5d,0-1) ≤4 meses La CdV media (eq-5d,0-1) ≤4 meses
meses (estratificado) - Riesgo bajo (1 estudio) debido al riesgo de (estratificada) - bajo riesgo en los (estratificada) - bajo riesgo en los
2 meses parcialidad grupos de control fue grupos de intervención fue
0.809 0.01 más alto
(0,03 inferior a 0,04 superior)
CdV (EQ-5D,0-1) ≤4 922 MUY BAJOa La CV media (eq-5d,0-1) ≤4 meses La CV media (eq-5d,0-1) ≤4 meses
(1 estudio) debido al riesgo de (estratificada) - riesgo medio en el (estratificada) - riesgo medio en el
Herramientas de evaluación de riesgos y estratificación
parcialidad
CdV (EQ-5D,0-1) ≤4 922 MUY BAJOa La CdV media (eq-5d,0-1) ≤4 meses La CdV media (eq-5d,0-1) ≤4 meses
meses (estratificado) - Alto riesgo (1 estudio) debido al riesgo de (estratificada) - alto riesgo en los grupos (estratificada) - alto riesgo en los grupos
2 meses parcialidad de control fue de intervención fue
0.431 0,06 más alto
(0,01 a 0,12 más alto)
CdV (EQ-5D,0-1) >4 meses - 1 año 922 MUY BAJOa La CdV media (eq-5d,0-1) >4 meses - 1 año La CV media (eq-5d,0-1) >4 meses - 1 año
(estratificado) - Riesgo bajo (1 estudio) debido al riesgo de (estratificada) - riesgo bajo en los grupos de (estratificado) - bajo riesgo en el
6 meses parcialidad control fue grupos de intervención fue 0
CV (EQ-5D,0-1) >4 meses - 1 año 922 MUY BAJOa La CdV media (eq-5d,0-1) >4 meses - 1 año La CdV media (eq-5d,0-1) >4 meses - 1 año
(estratificado) - Riesgo medio (1 estudio) debido al riesgo de (estratificada) - riesgo medio en los grupos (estratificada) - riesgo medio en los grupos
6 meses parcialidad de control fue de intervención fue
0.688 0.01 más alto
(0,03 inferior a 0,04 superior)
96
CdV (EQ-5D,0-1) >4 meses - 1 año 922 MUY BAJOa La CdV media (eq-5d,0-1) >4 meses - 1 año La CV media (eq-5d,0-1) >4 meses - 1 año
(estratificado) - Alto riesgo (1 estudio) debido al riesgo de (estratificada) - alto riesgo en los grupos de (estratificado) - alto riesgo en el
6 meses parcialidad control fue grupos de intervención fue
CV (SF-12, PCS,0-100) >4 383 MUY BAJOa La CdV media (sf-12, uds,0-100) >4 meses - 1 La CdV media (sf-12, uds,0-100) >4 meses - 1
meses - 1 año (estratificado) - (1 estudio) debido al riesgo de año (estratificada) - riesgo medio en los año (estratificada) - riesgo medio en los
Riesgo medio 6 meses parcialidad grupos de control fue grupos de intervención fue
4.0 1.7 inferior
(4,39 inferior a 0,99 superior)
CdV (SF-12, PCS, 0-100) >4 189 MUY BAJOa, b La QoL media (sf-12, pcs,0-100) >4 La QoL media (sf-12, pcs,0-100) >4
Herramientas de evaluación de riesgos y estratificación
riesgo 6 meses parcialidad, los grupos de control fue grupos de intervención fue
imprecisión 6.1 3.8 más alto
(0,19 inferior a 7,79 superior)
CdV (SF-12,MCS,0-100) >4 meses - 1 350 MUY BAJOa La CdV media (sf-12,MCS,0-100) >4 meses - 1 La CdV media (sf-12,MCS,0-100) >4 meses - 1 año
año (estratificado) - Riesgo bajo (1 estudio) debido al riesgo de año (estratificada) - riesgo bajo en los (estratificada) - bajo riesgo en los grupos de
parcialidad grupos de control fue intervención fue
0.2 0,9 inferior
(3,87 inferior a 2,07 superior)
CV (SF-12,MCS,0-100) >4 383 MUY BAJOa La CdV media (sf-12,MCS,0-100) >4 meses - La CdV media (sf-12,MCS,0-100) >4 meses -
meses - 1 año (estratificado) - (1 estudio) debido al riesgo de 1 año (estratificada) - riesgo medio en los 1 año (estratificada) - riesgo medio en los
Riesgo medio parcialidad, grupos de control fue grupos de intervención fue
imprecisión 2.0 0.8 más alto
(1,95 inferior a 3,55 superior)
QoL (SF-12,MCS,0-100) >4 meses - 1 189 MUY BAJOa La CdV media (sf-12,MCS,0-100) >4 meses - 1 La CdV media (sf-12,MCS,0-100) >4 meses - 1 año
año (estratificado) - Alto riesgo (1 estudio) debido al riesgo de año (estratificado) - alto riesgo en los grupos (estratificada) - alto riesgo en los grupos de
6 meses parcialidad de control fue intervención fue
97
Dolor(EVA,0-10)>4 meses - 1 350 MUY BAJOa El dolor medio (EVA, 0-10) > 4 meses - 1 año El dolor medio(EVA,0-10)>4 meses - 1
año(estratificado) - Riesgo Bajo (1 estudio) debido al riesgo de (estratificado) - bajo riesgo en los grupos año(estratificado) - bajo riesgo en el
6 meses parcialidad control fue grupos de intervención fue
Dolor(EVA,0-10)>4 meses - 1 383 MUY BAJOa El dolor medio (EVA, 0-10)> 4 meses - 1 año El dolor medio (EVA, 0-10)> 4 meses - 1 año
año(estratificado) - Riesgo medio (1 estudio) debido al riesgo de (estratificado) - riesgo medio en los grupos (estratificado) - riesgo medio en los grupos
6 meses parcialidad de control fue de intervención fue
- 2.4 0.1 inferior
(0,72 inferior a 0,52 superior)
Dolor(EVA,0-10)>4 meses - 1 189 MUY BAJOa, b El dolor medio (EVA, 0-10)> 4 meses - 1 año El dolor medio (EVA, 0-10)> 4 meses - 1 año
año(estratificado) - Alto riesgo (1 estudio) debido al riesgo de (estratificado) - alto riesgo en los grupos de (estratificado) - alto riesgo en los grupos de
6 parcialidad, control fue intervención fue
imprecisión - 2.9 1 inferior
(1,84 a 0,16 menos)
Herramientas de evaluación de riesgos y estratificación
(estratificado) - Riesgo bajo (1 estudio) debido al riesgo de año (estratificado) - bajo riesgo en los - 1 año (estratificado) - bajo riesgo en los
6 meses parcialidad grupos de control fue grupos de intervención fue
Función(RMDQ,0-24)>4 meses - 1 383 MUY BAJOa La función media(RMDQ,0-24)>4 meses La función media (RMDQ,0-24)>4 meses
año (estratificado) - Riesgo medio (1 estudio) debido al riesgo de - 1 año (estratificado) - riesgo medio en - 1 año (estratificado) - riesgo medio en los
6 meses parcialidad los grupos de control fue grupos de intervención fue
- 3.5 0.1 inferior
(1,37 inferior a 1,17 superior)
Función (RMDQ,0-24)>4 meses - 1 189 MUY BAJOa La función media(RMDQ,0-24)>4 meses La función media (RMDQ,0-24)>4 meses
año (estratificado) - Riesgo alto (1 estudio) debido al riesgo de - 1 año (estratificado) - riesgo medio en - 1 año (estratificado) - riesgo medio en los
6 meses parcialidad, los grupos de control fue grupos de intervención fue
imprecisión - 4.8 2.5 inferior
(4,3 a 0,7 inferior)
Malestar psicológico (HADS, subescala 350 MUY BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
de ansiedad, 0-21) >4 meses (1 estudio) debido al riesgo de subescala de ansiedad, 0-21)>4 meses - 1 año subescala de ansiedad, 0-21) >4 meses - 1 año
6 meses
98
- 1 año (estratificado) - Riesgo bajo parcialidad (estratificado) - bajo riesgo en los grupos de (estratificado) - bajo riesgo en el
control fue grupos de intervención fue
Malestar psicológico (HADS, subescala 383 MUY BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
de ansiedad, 0-21) >4 meses (1 estudio) debido al riesgo de subescala de ansiedad, 0-21)>4 meses - 1 año subescala de ansiedad, 0-21)>4 meses - 1 año
- 1 año (estratificado) - Riesgo medio 06 meses parcialidad (estratificado) - riesgo medio en los grupos de (estratificado) - riesgo medio en los grupos de
control fue intervención fue
- 1.0 0,2 inferior
(0,98 inferior a 0,58 superior)
Malestar psicológico (HADS, subescala 189 MUY BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
de ansiedad, 0-21) >4 meses (1 estudio) debido al riesgo de subescala de ansiedad, 0-21)>4 meses - 1 año subescala de ansiedad, 0-21)>4 meses - 1 año
- 1 año (estratificado) - Alto riesgo 6 meses parcialidad (estratificado) - alto riesgo en los grupos de (estratificado) - alto riesgo en el
control fue grupos de intervención fue
Malestar Psicológico (HADS, 350 MUY BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
Herramientas de evaluación de riesgos y estratificación
1 año (estratificado) - Riesgo bajo 6 meses parcialidad año(estratificado) - bajo riesgo en el control año(estratificado) - bajo riesgo en el
grupos fue grupos de intervención fue
0,2 más bajo
- 0.6
(1,06 inferior a 0,66 superior)
Malestar psicológico (HADS, 383 MUY BAJOa El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21)>4 (1 estudio) debido al riesgo de subescala de depresión, 0-21)>4 meses - 1 subescala de depresión, 0-21) >4 meses - 1 año
meses - 1 año (estratificado) - 6 meses parcialidad año (estratificado) - riesgo medio en los (estratificado) - riesgo medio en los grupos de
Riesgo medio grupos de control fue intervención fue
- 1.4 0 más alto
(0,68 inferior a 0,68 superior)
Malestar psicológico (HADS, 189 MUY BAJOa, b El malestar psicológico medio (HADS, El malestar psicológico medio (HADS,
subescala de depresión, 0-21)>4 (1 estudio) debido al riesgo de subescala de depresión, 0-21)>4 meses - 1 año subescala de depresión, 0-21)>4 meses - 1
meses - 1 año (estratificado) - Alto 6 meses parcialidad, (estratificado) - alto riesgo en los grupos de año (estratificado) - alto riesgo en el
riesgo imprecisión control fue grupos de intervención fue
bRebajado en 1 incremento si el intervalo de confianza cruzó 1 MID o en 2 incrementos si el intervalo de confianza cruzó ambos MID.
1
Dolor lumbar y ciática
Herramientas de evaluación de riesgos y estratificación
6.4.51Evidencia económica
10 Se identificó una evaluación económica relacionada con esta pregunta de revisión, pero se excluyó debido a su
11 aplicabilidad limitada y la disponibilidad de evidencia más aplicable.143Esto se enumera en el Apéndice M, con las
12 razones para la exclusión dadas.
1 Tabla 21: Perfil de evidencia económica: Hicks/Delitto versus atención habitual de fisioterapia
incrementales incrementales Costo
Apeldoorn Parcialmente Potencialmente Dentro del ensayo (ECA, artículo 2-1: Salva 2-1: 0,02 Intervención 2 Bootstrapping de ICER realizado pero
201217 aplicable(a) serio clínico asociado Apeldoorn2012A) £ 69 (IC del 95 %: AVAC (95% domina solo desde una sociedad
(Países Bajos) limitaciones Análisis de costo-utilidad (AVAC) - £ 312 a CI: -0,03 a intervención 1 perspectiva, no la perspectiva de un
(b)
Población: Adultos con dolor £ 226; p=NR) 0,08; p=NR) (costos mas bajos proveedor de atención médica. Por lo
(d)
lumbar (con o sin ciática) (C) y más alto tanto, esto no se informa aquí.
AVAC) Aquí se presenta el bootstrapping de
Dos comparadores en análisis completo:
los costos realizados y los intervalos de
1. Atención habitual de fisioterapia
confianza.
basado en las pautas
Se realizaron análisis de sensibilidad
holandesas de fisioterapia para
adicionales (incluido el uso de un
el dolor lumbar.
análisis por protocolo y
2. Intervenciones basadas en la
solo casos completos), sin embargo,
clasificación de Hicks/Delitto:
todos estos fueron desde una
manipulación espinal, ejercicios de
101
Seguimiento: 1 año
2 (a) Los datos de uso de recursos holandeses (2008-2010) y los costos unitarios (2009) pueden no reflejar el contexto actual del NHS. Tarifa holandesa EQ-5D utilizada. No todas las herramientas de estratificación de riesgo del protocolo de revisión están
3 incluidas en este estudio.
4 (b) El análisis dentro del ensayo y, por lo tanto, puede no reflejar el cuerpo completo de evidencia para esta comparación; Apeldoorn 2012A es uno de dos estudios en la revisión clínica para la estratificación del riesgo que
5 compara Hicks/Delitto. Bootstrapping de ICER no realizado.
6 (C) Euros holandeses de 2009 convertidos utilizando paridades de poder adquisitivo de 2009374. Los componentes del costo incluyen: Utilización de la atención primaria, incluidos: contactos con el médico de cabecera, fisioterapia y terapia
7 manual, psicólogo y atención domiciliaria profesional. Utilización de atención secundaria que incluye: rayos X, resonancia magnética, visita ambulatoria al especialista, hospitalización, cirugía de hernia del núcleo pulposo, rehabilitación
8 ambulatoria, inyección epidural y denervación facetaria.
9 (d) EQ-5D recopiló datos de referencia y 1 año de seguimiento. Tarifa holandesa EQ-5D.
10 Tabla 22: Perfil de evidencia económica: STarT Back versus mejores prácticas actuales/atención habitual
Costo
Whitehurst Directamente Potencialmente Dentro del ensayo (ECA, artículo 2-1: salva 2-1: 0,039 Intervención 2 Sin embargo, se llevó a cabo un arranque de
2012503/Colina aplicable(a) serio clínico asociado Hill 2011) 30,64 £ AVAC domina ICER que incluía los costos de atención
limitaciones (C) (d) intervención 1 médica privada, así como los costos del NHS.
2011205(REINO UNIDO) Análisis de costo-utilidad (AVAC)
(b)
Por lo tanto esto no es
Población: Adultos con dolor (costos mas bajos
lumbar (con o sin ciática) y más alto reportado aquí. Los análisis de
AVAC) sensibilidad se realizaron utilizando el
Dos comparadores en análisis completo:
análisis completo del caso en lugar del
-Mejor práctica actual: estratificación
análisis primario imputado. La
de STarT Back seguida de una
intervención 2 siguió siendo dominante
evaluación del fisioterapeuta de 30
(costos más bajos y QALY más altos).
minutos de duración que incluyó
asesoramiento sobre el
tratamiento inicial y ejercicio con la
opción de derivación posterior
para fisioterapia adicional, según
el juicio clínico del fisioterapeuta.
102
Costo
Sesiones de fisioterapia
estandarizadas.
- Grupo de alto riesgoreferidos
para sesiones de fisioterapia
psicológicamente informadas.
Seguimiento: 1 año
Whitehurst Directamente Potencialmente Dentro del ensayo (estudio de cohorte, 2−1: salva 2−1: 0,003 Intervención 2 Sin embargo, se llevó a cabo un arranque de
2015502,504/Para aplicable(mi) serio artículo clínico asociado Foster 2014) 4,89 £(gramo) AVAC(h) domina ICER que incluía los costos de atención
ester limitaciones(F) intervención 1 médica privada, así como los costos del NHS,
2014136,138
Análisis de costo-utilidad (AVAC) (costos mas bajos y se realizó solo por grupo de riesgo. Por lo
(REINO UNIDO)
Población: Adultos con dolor y más alto tanto esto no es
Costo
mantenerse activo,
prescripción de analgésicos en
su caso y tranquilidad de buen
pronóstico. Física individual
sesión de terapia que incluyó un
paquete mínimo de evaluación,
educación y apoyo para el
autocuidado.
- Grupo de riesgo medio: Se alienta al
médico de familia a derivar a los
pacientes a fisioterapia y abordar sus
problemas relacionados con la espalda
resaltados por
herramienta de estratificación. Intervención
de fisioterapia centrada en la reducción del
dolor y la discapacidad mediante la
104
Se proporciona fisioterapia
psicológicamente informada.
Seguimiento: 6 meses
1 (a) No todas las herramientas de estratificación de riesgo del protocolo de revisión están incluidas en este estudio.
2 (b) Análisis dentro del ensayo: Hill 2011 es uno de dos estudios incluidos en la revisión clínica para la estratificación del riesgo que compara STarT Back. Bootstrapping de ICER desde la perspectiva de NHS y PSS no
3 emprendida.
4 (C) 2008/2009 libras esterlinas. Los componentes del costo incluyen: costo de la intervención; utilización de la atención primaria, incluidos: contactos con médicos de cabecera y enfermeras; utilización de atención secundaria que incluye: contactos con consultores privados y del NHS,
5 radiografías, resonancias magnéticas, tomografías computarizadas, análisis de sangre, inyecciones epidurales (NHS y privadas) y pruebas de diagnóstico privadas; otros contactos profesionales de la salud, incluidos contactos adicionales
1
2 calcular y los costes presentados aquí son solo para el uso de recursos de asistencia sanitaria del NHS.
3 (d) EQ-5D recopiló datos de referencia y 12 meses de seguimiento. Los QALY se calcularon utilizando el enfoque del área bajo la curva ajustado para la utilidad de referencia. Tarifa EQ-5D del Reino Unido. No todas las herramientas
4 (mi) de estratificación de riesgo del protocolo están incluidas en el estudio.
5 (F) Puede ser preferible un horizonte de tiempo más largo si los efectos pueden persistir más allá de los 6 meses. No se informa la fuente de los costos unitarios. El análisis dentro del ensayo y, por lo tanto, no refleja el
6 cuerpo completo de evidencia disponible para esta comparación; Foster 2014 es uno de dos estudios incluidos en la revisión de estratificación del riesgo que compara STarT Back con la atención habitual. No se llevó a
7 (gramo) cabo un arranque adecuado de ICER. 2008/2009 libras esterlinas. Los componentes del costo incluyen: Utilización de la atención primaria, incluidos: contactos con el médico de cabecera y la enfermera; servicio de
8 fisioterapia; utilización de atención secundaria que incluye: contactos con consultores, admisiones, radiografías, resonancias magnéticas, tomografías computarizadas, análisis de sangre, inyecciones epidurales; otros
9 contactos profesionales de la salud, incluidos acupuntura y osteopatía; y medicación prescrita. Foster 2014 presentó los costes sanitarios totales que incluyeron el uso de recursos sanitarios privados y del NHS,
10
11 (h) El EQ-5D recolectó datos de referencia, 2 y 6 meses de seguimiento. Los QALY se calcularon utilizando el enfoque del área bajo la curva ajustado para la utilidad de referencia. Tarifa EQ-5D del Reino Unido.
12
13
14
105
Dolor lumbar y ciática
Herramientas de evaluación de riesgos y estratificación
6.51Declaraciones de evidencia
6.5.12Clínico
4 herramienta ÖREBRO
5 Evidencia de alta a baja calidad de estudios individuales (n=61 a n=296) mostró que la herramienta ÖREBRO tenía
6 un nivel moderado de discriminación y baja calibración para predecir la mejoría funcional.
8 Evidencia de alta a baja calidad de estudios individuales (n = 56 a n = 296) mostró que la herramienta ÖREBRO
9 tenía un nivel moderado de discriminación y un nivel bajo de calibración para predecir la mejoría funcional, y un
10 nivel bajo de calibración para predecir el dolor. No hubo datos de discriminación para el dolor.
12 Evidencia de alta a baja calidad (n = 53 a n = 1594) mostró que la herramienta STarT Back tenía un alto nivel de
13 discriminación y una calibración moderada para predecir la mejora funcional, y un nivel moderado de
14 discriminación y un bajo nivel de calibración para predecir el dolor.
dieciséis Evidencia de muy baja calidad de un solo estudio (n = 131) mostró que el cuestionario FRI tenía un alto
17 nivel de discriminación para predecir la mejoría funcional. No se informaron otros datos para esta
18 herramienta.
19 Cuestionario ODI
20 Evidencia de muy baja calidad de un solo estudio (n = 131) mostró que el cuestionario ODI tenía un alto
21 nivel de discriminación para predecir la mejoría funcional. No se informaron otros datos para esta
22 herramienta.
23
25 Evidencia de baja calidad de un solo estudio (n = 571) mostró que el conjunto de elementos de riesgo de dolor crónico tenía
26 un alto nivel de discriminación para predecir el dolor. No se informaron otros datos para esta herramienta.
27 RCP Hancock
28 La evidencia de baja calidad de un solo estudio (n = 937) mostró que la RCP de Hancock tenía un nivel moderado de
29 discriminación para predecir el dolor. No se informaron otros datos para esta herramienta.
31 La evidencia de baja calidad de un solo estudio (n = 146) mostró que el cuestionario Fear Avoidance Beliefs
32 tenía un nivel moderado de calibración para predecir la mejora funcional y un nivel bajo de calibración para
33 predecir el dolor. No se informaron otros datos para esta herramienta.
2 Evidencia de baja calidad de un solo estudio (n = 146) mostró que la escala de catastrofización del dolor tenía un
3 nivel moderado de calibración para predecir la mejoría funcional y un nivel bajo de calibración para predecir el
4 dolor. No se informaron otros datos para esta herramienta.
6 Evidencia de baja calidad de un solo estudio (n = 146) mostró que la escala de cinesifobia de Tampa tenía un
7 nivel moderado de calibración para predecir la mejora funcional y un nivel bajo de calibración para predecir el
8 dolor. No se informaron otros datos para esta herramienta.
10 Evidencia de baja calidad de un solo estudio (n = 146) mostró que el cuestionario de salud del paciente tenía un
11 nivel moderado de calibración para predecir la mejoría funcional y un nivel bajo de calibración para predecir el
12 dolor. No se informaron otros datos para esta herramienta.
14 Clasificación de Hicks/Delitto
15 La evidencia de 2 estudios no demostró ninguna diferencia clínica entre la herramienta de clasificación de Hicks/Delitto
dieciséis en comparación con la herramienta sin riesgo para la calidad de vida medida por las puntuaciones de los componentes
17 mental y físico del SF-36 (2 estudios, muy baja calidad, n = 234) excepto para la puntuación del componente físico del
18 SF-36 que demostró un beneficio clínico a favor del tratamiento estratificado a ≤ 4 meses. No hubo diferencias clínicas
19 entre las herramientas de Hicks/Delitto en comparación con la herramienta sin riesgo para la mayoría de los resultados
20 informados (dolor, función y utilización de atención médica), aunque se demostró el beneficio clínico para el
21 tratamiento estratificado para los que respondieron a la mejoría del dolor en ≤ 4 meses en un solo estudio. , estudio de
22 baja calidad (n=156). También se informó un beneficio clínico para los respondedores en la mejora de la función a > 4
23 meses (1 estudio, muy baja calidad, n=156).
25 La evidencia de un estudio demostró un beneficio clínico del tratamiento estratificado utilizando la herramienta de clasificación
26 de O'Sullivan en comparación con la herramienta sin riesgo para el dolor tanto a corto (≤ 4 meses) como a largo plazo (> 4
27 meses) y para la función a corto plazo solamente (calidad baja-muy baja, n=94). No se informaron diferencias clínicas entre la
28 clasificación de O'Sullivan en comparación con la herramienta sin riesgo para la función en el período de tiempo de >4 meses.
29
31 La evidencia general que comparó la herramienta de riesgo STarT Back con la herramienta sin riesgo no demostró diferencias
32 clínicas para la mayoría de los resultados (calidad de vida (puntuación del componente mental), dolor, función, angustia
33 psicológica) informados en un solo estudio de baja calidad (n = 851 ). Sin embargo, se demostró que el beneficio clínico para la
34 calidad de vida medida por la puntuación del componente físico del SF-36 favorece el uso del tratamiento estratificado tanto a
35 corto (≤ 4 meses) como a largo plazo (> 4 meses) en puntos temporales.
36 Cuando los grupos estratificados individuales de la clasificación STarT Back de pacientes de categoría de riesgo bajo,
37 medio y alto se compararon con la herramienta sin riesgo, se observó un beneficio clínico a favor del tratamiento
38 estratificado para la calidad de vida medida por EQ-5D en los pacientes de categoría de riesgo alto en ≤ 4 meses (muy
39 baja calidad, n=236) y en los pacientes de categoría de riesgo medio y alto a > 4 meses (muy baja calidad, n=394 y
40 n=236). De igual forma un beneficio clínico que favorece el tratamiento estratificado por calidad de vida medido por la
41 puntuación del componente físico del SF-36 se demostró tanto en los pacientes de riesgo medio como alto en el punto
42 de tiempo de ≤ 4 meses (calidad muy baja, n = 394 y n = 236), así como en los
1 pacientes de riesgo medio a > 4 meses (muy baja calidad, n=392). También hubo beneficio clínico en la función a favor del
2 tratamiento estratificado para los pacientes de la categoría de alto riesgo a corto plazo (≤4 meses) (muy baja calidad, n=236).
3 Por último, se observó un beneficio clínico en los criterios de respuesta para la mejoría del dolor y la función en el grupo
4 general y en cada grupo de riesgo estratificado en el seguimiento de ≤ 4 meses (calidad baja-muy baja, n = 951). No hubo
5 diferencia clínica entre la herramienta de riesgo STarT Back en comparación con la herramienta sin riesgo para todos los demás
6 resultados informados en cualquier punto temporal.
8 La evidencia general que comparó la herramienta de riesgo STarT Back con la herramienta sin riesgo no demostró diferencias
9 clínicas para ningún resultado informado (calidad de vida, dolor, función y angustia psicológica) de un solo estudio (evidencia
10 de calidad muy baja, n = 922).
11 Cuando los grupos estratificados individuales de la clasificación STarT Back de pacientes de categoría de riesgo bajo, medio y
12 alto se compararon con la herramienta sin riesgo, se observó un beneficio clínico a favor del tratamiento estratificado para la
13 calidad de vida medida por EQ-5D en los pacientes de categoría de riesgo alto en Puntos temporales ≤ 4 meses y > 4 meses
14 (calidad muy baja, n=922). El beneficio clínico del tratamiento estratificado en pacientes identificados como de alto riesgo
15 también se demostró para la calidad de vida medida por la puntuación del componente físico del SF-36, el dolor y la función en
dieciséis el seguimiento > 4 meses (muy baja calidad, n= 189). No hubo diferencia clínica entre la herramienta de riesgo STarT Back en
17 comparación con la herramienta sin riesgo para todos los demás resultados informados en cualquier punto temporal.
18
6.5.219 Económico
21 Un análisis de costo-utilidad encontró que en adultos con dolor lumbar (con o sin ciática) la intervención basada en la
22 clasificación de Hicks/Delitto dominaba (menos costosa y más efectiva) en comparación con la atención de fisioterapia
23 habitual. Este análisis se evaluó como parcialmente aplicable con limitaciones potencialmente graves.
24
25 Dos análisis de costo-utilidad encontraron que en adultos con dolor lumbar (con o sin ciática) la intervención basada en
26 la estratificación de STarT Back dominaba la intervención (menos costosa y más efectiva) en comparación con la mejor
27 práctica actual/atención habitual. Estos análisis se evaluaron como directamente aplicables con limitaciones
28 potencialmente graves.
diferentes resultados Para la revisión de la evaluación de riesgos, los resultados evaluados se agruparon en
términos de las siguientes medidas de precisión: discriminación, calibración y
reclasificación. El GDG acordó que la calibración y la reclasificación eran los resultados
críticos para la toma de decisiones. La discriminación se consideró importante.
Se encontró evidencia tanto para la discriminación (en términos de AUC y sensibilidad y especificidad)
como para la calibración (en términos de R2valores) para los resultados de dolor y
Para la revisión de la estratificación del riesgo, el GDG acordó que la calidad de vida relacionada con la
salud, la intensidad del dolor, la función y la angustia psicológica eran los resultados críticos para la
toma de decisiones. Los criterios de respuesta, los eventos adversos (morbilidad y mortalidad) y la
utilización de atención médica también se consideraron importantes.
Se encontró evidencia para todos los resultados excepto para los eventos adversos
(morbilidad y mortalidad). Todos los estudios se realizaron en una población de dolor
lumbar con o sin ciática.
beneficios clínicos y Los datos estaban disponibles para las siguientes herramientas: ÖREBRO, STarT Back, índice de
daña calificación funcional, ODI, creencias para evitar el miedo, escala de catastrofización del dolor, escala de
kinesiofobia de Tampa, cuestionario de salud del paciente y Hancock CPR. La evidencia de discriminación
estuvo disponible para las siguientes herramientas ÖREBRO, STarT Back, índice de calificación funcional
y ODI. Para la calibración hubo evidencia de ÖREBRO, creencias de evitación del miedo, escala de
catastrofización del dolor, escala de kinesiofobia de Tampa, cuestionario de salud del paciente, STarT
Back y Hancock CPR.
El GDG señaló que no había datos para la reclasificación, sin embargo, se pensó que esto puede deberse a que
esto a menudo se realiza como parte de la derivación o validación de las herramientas, por lo que es posible que
simplemente no se informe en las publicaciones incluidas en esta revisión.
ÖREBRO
La evidencia mostró una discriminación moderada para predecir la función en los umbrales de 112 y 113
del ÖREBRO, sin embargo, en umbrales inferiores a este, la discriminación fue deficiente. No se
informaron datos de discriminación del dolor. La evidencia para la calibración mostró que la
herramienta era deficiente tanto para la función como para el dolor. También se señaló que esta
herramienta constaba de 21 preguntas, cuya respuesta requeriría un tiempo considerable y, aunque
factible en el contexto de un ensayo, no sería apropiada para el uso habitual en un entorno de atención
primaria. Por lo tanto, el GDG consideró que la evidencia para la herramienta ÖREBRO era insuficiente y
la precisión no era lo suficientemente buena como para justificar una recomendación.
Retroceder
La evidencia mostró que hubo un nivel alto-moderado de discriminación para predecir el dolor y
la función. También hubo un nivel moderado de calibración del 42 al 46 % para predecir el
resultado funcional y del 8 al 17 % para predecir el dolor. Por lo tanto, el GDG acordó que había
suficientes pruebas y niveles de discriminación y calibración para considerar a STarT Back como
una herramienta de evaluación de riesgos razonablemente útil con respecto al resultado
funcional. Además, esta herramienta solo toma unos minutos en completarse, lo que sería
factible de usar en la práctica clínica.
La evidencia mostró un alto nivel de discriminación para predecir la función; sin embargo, no
hubo evidencia para el dolor y ninguno de los estudios informó datos de calibración. Por lo
tanto, el GDG consideró que la evidencia del índice de calificación funcional era insuficiente para
recomendarlo, a pesar de ser una herramienta bastante rápida de usar.
ODI
La evidencia mostró un alto nivel de discriminación para predecir la función; sin embargo, no
hubo evidencia para el dolor y ninguno de los estudios informó datos de calibración. Por lo
tanto, el GDG consideró que la evidencia de la herramienta ODI era insuficiente para
recomendarla, a pesar de ser una herramienta fácil de usar.
No hubo datos para la discriminación, sin embargo, la evidencia mostró un nivel moderado de
calibración para predecir la función pero un nivel muy bajo para predecir el dolor. Esta
herramienta también consta de 11 preguntas que pueden tardar demasiado en completarse
para que sea apropiada en la práctica clínica. Por lo tanto, el GDG consideró que la evidencia de
esta herramienta era insuficiente para recomendarla.
La evidencia mostró un nivel moderado de discriminación para predecir el dolor, pero no hubo
datos para la función. Tampoco hubo datos de calibración. También se señaló que esta
herramienta constaba de 22 preguntas, que llevaría mucho tiempo completar, lo que si bien es
factible en un contexto de prueba, no sería apropiado para la práctica clínica. Por lo tanto, el
GDG consideró que la evidencia de esta herramienta era insuficiente para recomendarla.
RCP Hancock
La evidencia mostró un bajo nivel de discriminación y calibración para predecir el dolor, sin
embargo, no hubo datos para la función. Por lo tanto, el GDG consideró que la evidencia de
esta herramienta era insuficiente para recomendarla, a pesar de ser una herramienta fácil de
usar.
Resumen
El GDG discutió que las pruebas sensibles son muy importantes en la atención primaria a la hora de
descartar un diagnóstico. La sensibilidad de la herramienta STarT Back fue del 80% comparando
personas de bajo riesgo frente a las de medio + alto riesgo. Por lo tanto, la tasa de falsos negativos fue
del 20%.
En cuanto a la predicción de los resultados funcionales, se encontró que los resultados del AUC eran mejores
para STarT Back (estadística C = 0,82 en atención primaria), el índice de calificación funcional y el ODI. En
cuanto a la predicción del resultado de la intensidad del dolor, los resultados del AUC fueron mejores para
STarT Back (estadística C = 0,66 en atención primaria) y RCP de Hancock.
El GDG señaló que, en términos de calibración, para todas las herramientas revisadas, la R2los valores fueron
generalmente bajos (particularmente para los resultados de dolor). Sin embargo, el GDG consideró que debido a
que ninguna prueba será a la vez altamente sensible y altamente específica, una R2valor del 40% (como se
muestra en la prueba STarT Back para la función), sería suficiente para los fines de esta revisión.
El GDG consideró que para la mayoría de las herramientas no había evidencia o evidencia
deficiente de la precisión de cualquiera de los resultados de función o dolor. Sin embargo,
STarT Back tenía pruebas de calibración y discriminación para ambos
estos resultados, y varios estudios informaron esta herramienta. La evidencia de STarT Back también se
encontraba entre las herramientas más precisas. El GDG consideró que a las personas cuyo tratamiento
se estratificó según la herramienta STarT Back les fue mejor cuando se consideró a la población de
intervención en su conjunto, pero señaló que la herramienta clasificaría erróneamente a algunas
personas. Por lo tanto, el GDG reflejó esto al recomendar que una herramienta de estratificación debe
considerarse como una herramienta de evaluación en el punto de primer contacto, lo que permite que
las personas que se presentan nuevamente sean consideradas para un tratamiento posterior. El GDG
también reflejó el valor predictivo de la herramienta al recomendar que la herramienta debe apoyar,
pero no reemplazar, la toma de decisiones clínicas.
Los datos estaban disponibles para las siguientes herramientas: sistema de clasificación Hicks/Delitto, sistema
de clasificación O'Sullivan y STarT Back. Todos los estudios compararon atención estratificada (basada en
herramientas) versus atención habitual (atención no estratificada).
Herramienta Hicks/Delitto
herramienta O'Sullivan
La evidencia mostró un efecto clínicamente importante que favorece la estratificación del riesgo (en
comparación con ninguna estratificación) para lo siguiente:
-Calidad de vida; Componente físico del SF-12 tanto a corto plazo para la población general
y los grupos estratificados de riesgo medio y alto como a más largo plazo para la
población general y el grupo estratificado de riesgo medio. EQ-5D a corto plazo para el
grupo estratificado de alto riesgo y a más largo plazo para los grupos estratificados de
riesgo medio y alto.
-Criterios de respuesta para la mejoría del dolor y la función a corto plazo tanto para la población
general como para todos los grupos de riesgo estratificados.
No hubo diferencias clínicamente importantes para los resultados antes mencionados en los otros
tiempos de seguimiento o en los otros grupos de riesgo estratificados. El dolor, la función (otras
medidas), la angustia psicológica y el componente mental de la calidad de vida tampoco mostraron
diferencias clínicamente importantes para la población general o cada uno de los grupos de riesgo
estratificados. Sin embargo, evidencia adicional de un estudio de impacto mostró un efecto clínicamente
importante a favor estratificación del riesgo (en comparación con ninguna estratificación) en el grupo
estratificado de alto riesgo para la calidad de vida (EQ-5D y SF-12 físico), el dolor y la función. Toda la
evidencia fue para el seguimiento a largo plazo y no se informó ninguna para el corto plazo. No hubo
diferencias clínicamente significativas para los grupos de riesgo bajo o medio para estos resultados, ni
para ninguno de los grupos de riesgo en cuanto al componente mental del SF-12 y malestar psicológico.
El GDG señaló que, aunque algunos de los efectos fueron clínicamente importantes, la evidencia fue de
muy baja calidad debido a que no fue aleatoria y, por lo tanto, propensa al sesgo de selección y a la falta
de cegamiento de los factores de confusión clave. El GDG consideró apropiado que se le diera menos
peso a la evidencia de este estudio no aleatorio debido al alto riesgo de sesgo asociado a los efectos.
El RCT que evaluó STarT Back recibió un paquete de atención que incluía asesoramiento y
educación (con folleto y video) proporcionado por un fisioterapeuta durante el transcurso de una
cita de 30 minutos además de la atención habitual. Al GDG le preocupaba que los comisionados y
los médicos, al malinterpretar "bajo riesgo" como sinónimo de "sin tratamiento", pudieran
negarles a estos pacientes una atención adecuada y eficaz.
El GDG consideró que si las personas estratificadas en el grupo de bajo riesgo continuaron
experimentando dolor, podrían regresar a su médico de cabecera (u otro proveedor de atención
médica) y recibir un tratamiento clínicamente adecuado. Se enfatizó que STarT Back es una
herramienta de apoyo a la toma de decisiones y no un sustituto de la perspicacia clínica.
También se discutió que uno de los ensayos relacionados con STarT Back solo se valida en un entorno de
atención primaria en el primer punto de contacto. Se aclaró que esto no implicaba una primera consulta
por dolor lumbar y puede representar una variedad de duraciones de dolor para diferentes personas y
en diferentes etapas en el proceso del paciente. Como el cuestionario solo se valida en el primer punto
de contacto, se acordó que no era adecuado volver a aplicar la herramienta si la persona regresaba por
el mismo episodio. Sin embargo, el segundo ensayo se basó en la implementación de STarT Back en un
entorno ambulatorio de atención secundaria. El GDG consideró que esta gama de entornos equilibró la
evidencia. El GDG estuvo de acuerdo en que una de las fortalezas de la herramienta era que identificaba
correctamente a más pacientes que estaban en la categoría de bajo riesgo en comparación con la falta
de uso de la herramienta, dando así confianza al proveedor de atención médica en el manejo del
paciente después del primer tratamiento inicial. Se reconoció que evitar el sobretratamiento en
pacientes en los que no se requería era un beneficio real de la herramienta con potencial para ahorrar
tiempo y dinero si se implementaba correctamente.
El GDG también señaló que STarT Back funciona mejor que no usar la herramienta en personas
con alto riesgo en comparación con grupos de riesgo medio o bajo. El GDG discutió que el valor
de la herramienta puede estar en identificar a aquellos con un peor pronóstico y garantizar que
reciban un tratamiento más intensivo sin demora.
El GDG estuvo de acuerdo en que una parte esencial de la estratificación no era solo identificar
subgrupos en riesgo de resultados deficientes, sino también informar la gestión adecuada y, por
lo tanto, acordó que era importante aclarar en la recomendación que la gestión debe adaptarse
como resultado de la estratificación.
En general, se acordó que se demostró el beneficio de la estratificación con STarT Back, pero
que si se usa la estratificación, debe considerarse como un paquete de una herramienta de
estratificación de riesgos y una gestión estratificada.
Intercambio entre Se identificaron tres evaluaciones económicas relevantes para la estratificación del riesgo.
efectos clínicos netos Un análisis de costo-utilidad encontró que en adultos con dolor lumbar (con o sin ciática) la
y costos intervención basada en la clasificación de Hicks/Delitto fue dominante (menos costosa y
más efectiva) que la atención de fisioterapia habitual. Este análisis se evaluó como
parcialmente aplicable con limitaciones potencialmente graves. El GDG consideró esta
evidencia junto con la evidencia clínica de Hicks/Delitto y consideró que no había suficiente
evidencia de efecto clínico para recomendarlo exclusivamente.
Un análisis de costo-utilidad basado en un RCT205,503encontró que en adultos con dolor lumbar (con o
sin ciática) la intervención basada en la estratificación STarT Back fue dominante (menos costosa y
más efectiva) en comparación con las mejores prácticas actuales/atención habitual. Otro artículo
basado en un estudio de cohorte138,502informaron conclusiones similares; sin embargo, hubo mayor
incertidumbre en torno a la magnitud de los ahorros en costos y la ganancia en salud. Estos análisis
se evaluaron como directamente aplicables con limitaciones potencialmente graves. Cabe destacar
que un análisis se basó en un ECA y el otro en un ensayo de cohorte de implementación de STarT
Back.
Con base en la evidencia clínica y costo-efectiva, el GDG recomendó que se considere una herramienta de
estratificación del riesgo en las primeras consultas en atención primaria para la estratificación y las
intervenciones ajustadas al riesgo para las personas en las que se está considerando un tratamiento
específico. No se identificaron evaluaciones económicas para la herramienta de evaluación de riesgos. El
GDG discutió la importancia de las herramientas de evaluación que son fáciles y rápidas
llevar a cabo en la práctica. Se señaló que la herramienta STarT Back es corta y se puede
completar en unos minutos y, por lo tanto, se dio como un ejemplo de la herramienta que
podría usarse en la recomendación.
La evidencia se calificó como de calidad baja o muy baja para todos los resultados y las herramientas de
evaluación de riesgos, excepto para ÖREBRO, que se calificó como de alta calidad (tanto para la discriminación
como para la calibración). La reducción en la calidad de la evidencia relacionada con las otras herramientas se
basó en que tenían un alto riesgo de sesgo debido al sesgo de informe de resultados y al sesgo de deserción
(mediante los criterios de la lista de verificación PROBAST). La evidencia de las herramientas provino
principalmente de ensayos únicos, que utilizaron un rango de valores de umbral de corte; sin embargo, hubo
más estudios que informaron sobre STarT Back yÖMSPQque las otras herramientas. Se señaló que obtener un
tamaño de muestra adecuado es un desafío particular al realizar un estudio de estratificación de buena calidad,
ya que generalmente se requiere que los tamaños de muestra sean 4 veces mayores para detectar diferencias en
los subgrupos. La mayoría de los estudios incluidos en la revisión fueron pequeños, excepto aquellos que
analizaron el conjunto de elementos de riesgo de dolor crónico, Hancock CPR y STarT Back. Sin embargo, la
evidencia para el conjunto de ítems de riesgo de dolor crónico y la RCP de Hancock provino solo de estudios
únicos, mientras que la evidencia para STarT Back provino de varios estudios (la mayoría de los cuales fueron
muy grandes).
No se informaron datos suficientes en los ensayos para poder calcular tablas completas de 2 x 2 para
sensibilidad y especificidad, y la mayoría de los estudios informaron valores de AUC. El GDG señaló que
los datos de AUC tienen limitaciones metodológicas y son menos sólidos que los datos de calibración, en
términos de evaluar la precisión de una herramienta para predecir el resultado.
La evidencia se calificó como de calidad baja o muy baja para todos los resultados, principalmente debido al
riesgo de sesgo (y en ocasiones debido a la imprecisión adicional). La evidencia de los estudios aleatorios tuvo un
alto riesgo de sesgo principalmente debido a la falta de un cegamiento adecuado de los factores de confusión
clave que podrían influir en el resultado. La evidencia provino principalmente de estudios únicos con un tamaño
de muestra razonable.
La evidencia de un estudio no aleatorio también tuvo un sesgo de selección asociado que, junto
con la falta de un cegamiento apropiado, significó que hubo un riesgo grave de sesgo
relacionado con los efectos informados en este estudio.
Otras Consideraciones Se señaló que todas las herramientas están validadas en poblaciones con dolor lumbar
únicamente o en poblaciones mixtas de personas con dolor lumbar y/o ciática. Ninguno está
validado específicamente para la ciática.
El grupo también consideró el entorno en el que se llevarían a cabo las herramientas de evaluación. Aunque
algunos de los estudios se realizaron en atención primaria y la herramienta STarT Back solo se validó en atención
primaria, en la práctica clínica las herramientas suelen ser utilizadas por terapeutas en atención secundaria.
atención, así como los médicos de cabecera.
El GDG estuvo de acuerdo en que la herramienta STarT Back sobre las otras herramientas de predicción
clínica incluidas en esta revisión demostró una especificidad, sensibilidad y facilidad de uso superiores
en un entorno clínico. STarT Back es rápido y fácil de realizar en la práctica, a diferencia de la
herramienta ÖREBRO, por ejemplo, que es más complicada y menos práctica de usar en una consulta.
También fue el más relevante ya que se basó y validó en un entorno de atención primaria en el Reino
Unido. También se planteó la preocupación acerca de la incapacidad de algunas herramientas de riesgo
para subagrupar el espectro completo de pacientes con dolor lumbar, dejando a una gran parte de la
población sin clasificar. La evidencia de STarT Back mostró resultados positivos
favoreciendo la atención estratificada para algunos resultados críticos como la función y también
fue respaldada por un estudio IMPaCT que probó la implementación de la atención estratificada
para el dolor lumbar en un entorno médico de atención primaria, aunque se observó que esta
evidencia era de peor calidad debido a que de un estudio no aleatorizado. Por lo tanto, el GDG
acordó que se debe considerar la estratificación, y que la herramienta STarTBack podría ofrecerse
como una herramienta amplia que se puede utilizar.
71Imágenes
7.12Introducción
3 Hay varios métodos que se pueden utilizar para obtener imágenes de la columna vertebral. La introducción de las resonancias
4 magnéticas a fines de la década de 1980 trajo un método más preciso para estudiar las estructuras de los tejidos blandos, incluida la
5 médula espinal, los ligamentos y los discos. Previamente, las investigaciones de rayos X mostraban adecuadamente las estructuras óseas
6 pero no los tejidos blandos. El mielograma por TC, una TC más invasiva con administración de contraste intratecal por punción lumbar,
7 era la única forma de mostrar la patología de la médula o de la raíz nerviosa. Se realizaron otras formas de obtención de imágenes,
8 incluida la densometría ósea y la exploración con isótopos, específicamente para responder preguntas sobre patología y osteoporosis.
9
10 Radiografía simplede la columna lumbar no es específica para mostrar la patología. Aunque es económico y está fácilmente
11 disponible, tiene un valor limitado para el seguimiento de fracturas osteoporóticas y la medición posterior al tratamiento de la
12 alineación y la estabilidad en traumatismos y deformidades. Sin embargo, sigue siendo la única prueba dinámica fácilmente
13 disponible, donde se puede determinar el efecto de la flexión y extensión de la gravedad en la columna vertebral.
14
15 tomografías computarizadasson el método preferido cuando se investiga la patología ósea. Con el avance de escáneres más
dieciséis rápidos y potentes, las reconstrucciones 3D y los cortes multidireccionales son más fáciles de obtener y usar. Esto es útil para
17 evaluar traumatismos, deformidades y planificar cirugías, así como el seguimiento de los planes de tratamiento. Las tomografías
18 computarizadas llevan una dosis alta de radiación y una tomografía computarizada simple sin contraste de la columna lumbar
19 equivale a aproximadamente 70 radiografías de tórax.
20 exploraciones de resonancia magnéticano tienen riesgos de radiación y, hasta el momento, no se han demostrado riesgos
21 documentados directamente como resultado del alto campo magnético utilizado. Es extremadamente bueno para mostrar los tejidos
22 blandos y la patología de la médula, el disco y los ligamentos. Aunque cada vez está más disponible y es más barata, sigue siendo una
23 prueba relativamente costosa.
24 El método exacto de obtención de imágenes debe determinarse después de un escrutinio cuidadoso de la condición del
25 individuo mediante la anamnesis y el examen. Debe estar dirigido a plantear una pregunta diagnóstica específica más
26 que como una herramienta de detección.
27 Sigue siendo un área de incertidumbre si las imágenes son beneficiosas o no en términos de mejorar los resultados
28 relacionados con el paciente para las personas con dolor de espalda inespecífico o ciática, ya sea en la presentación inicial o
29 más adelante en la vía. Esta revisión pretende abordar esta incertidumbre.
Intervención(es) -Imágenes con resonancia magnética (o tomografía computarizada donde la resonancia magnética está contraindicada), rayos X para el dolor lumbar
Resultados Crítico
-Calidad de vida relacionada con la salud (por ejemplo, SF-12, SF-36 o EQ-5D).
-Severidad del dolor (por ejemplo, escala analógica visual [VAS] o escala de calificación numérica [NRS]).
Diseño del estudio Los ECA/RS se incluirán en primera instancia. Si se encuentran pruebas de ECA insuficientes para
formar una recomendación, se incluirán estudios no aleatorios (estudios de cohortes).
7.31Evidencia Clínica
2 Se realizó una búsqueda de ensayos aleatorios que compararan la efectividad clínica y económica de la
3 realización de imágenes (rayos X o MRI/CT) versus ninguna investigación para mejorar la discapacidad funcional,
4 el dolor o la angustia psicológica en pacientes con dolor lumbar o ciática.
5 Se incluyeron nueve estudios en la revisión que informan los resultados de cinco estudios aleatorizados.
6 juicios107,112,152,153,155,248,249,249,252,253
7 - Gilbert 2004 y Gillan 2001 son el mismo estudio que Gilbert 2004A.152,153,155Gillan 2001 es un estudio piloto
8 realizado antes de Gilbert 2004A.153,155Gilbert 2004 informa resultados de asistencia sanitaria adicionales
9 del mismo estudio.152
10 - Kendrick 2001A es el mismo estudio que Kendrick 2001; los detalles completos de los métodos, los resultados y la discusión están
11 disponibles en este documento.248,249
12 - Kerry 2002 es el mismo estudio que Kerry 2000; los detalles completos de los métodos, los resultados y la discusión están
13 disponibles en este documento.252,253
14 Todos los ensayos aleatorios incluyeron poblaciones mixtas de personas con dolor lumbar con y sin ciática. Uno de los ensayos
15 incluyó una población indirecta (incluidas personas a partir de los 14 años de edad).152,153,155Todos los ensayos compararon
dieciséis imágenes con ninguna imagen; 4 compararon la radiografía con ninguna imagen,107.112.248.249.252.253mientras que uno comparó la
17 resonancia magnética con ninguna imagen.152,153,155
18 La búsqueda se amplió a cohortes para todas las comparaciones debido a evidencia insuficiente y se identificaron 4
19 estudios adicionales que cumplieron con los criterios de inclusión.166.167.229.496
20 - Graves 2014 es el mismo estudio que Graves 2012; Los datos de utilización de la atención médica están disponibles en este
21 papel.166,167;
22 La mayoría de los estudios de cohortes incluyeron una población mixta de personas con dolor lumbar con y sin ciática.
23 Un estudio tuvo una población con dolor lumbar solamente y otro con una población con ciática solamente.166,167Dos
24 estudios compararon imágenes (rayos X) con ninguna imagen.248,249,252,253Dos estudios compararon la imaginología con
25 ninguna imaginología o imaginología diferida; con uno comparando MRI solo con ninguna imagen o imagen diferida,
26 166,167y otro que compara rayos X y MRI por separado, con ninguna imagen o imagen diferida.229Un estudio comparó la
27 imaginología (IRM) con ninguna imaginología y con imaginología diferida por separado.496
1 Las pruebas de Deyo 1987, Djais 2005 y parte de las pruebas de Kendrick 2001 se informaron
2 en un formato que no se pudo analizar en este informe y se han presentado enMesa
3 25.107,112,248,249
4 Los estudios incluidos se resumen en la Tabla 24 a continuación. La evidencia de estos estudios se resume en el resumen de evidencia
5 clínica a continuación (Tabla 27). Consulte también el diagrama de flujo de selección de estudios en el Apéndice E, las tablas de pruebas
6 de estudios en el Apéndice H, los diagramas de bosque en el Apéndice K, las tablas GRADE en el Apéndice J y la lista de estudios
7 excluidos en el Apéndice L.
Deyó Radiografía en la visita índice Dolor lumbar con Severidad del dolor (auto- Todos los participantes fueron
Djais 2005112 Rayos X al inicio Dolor lumbar con relacionados con la salud Cuidados habituales para
entrevista o sin ciática calidad de vida pacientes con dolor lumbar
(EQ-5D)
Severidad del dolor (EVA
Sin imágenes N=101 Algunas personas en el
puntaje de dolor)
grupo de control (número
Función (RMDQ) no dado) pasó a
> 20 y < 55 años
recibir rayos X como
hallazgos sobre
radiografía son
3 semanas de seguimiento
reportado para ambos
grupos de tratamiento
Indonesia
gilberto resonancia magnética o tomografía computarizada Dolor lumbar con relacionados con la salud 115 (30%) personas en
Intervención y Concomitante
Estudiar comparación Población Resultados tratamiento
2004A152,153,1
o sin ciática
formación de imágenes', formación de imágenes como calidad de vida el grupo de control pasó
55
tan pronto como sea posible) (EQ-5D, SF-36) a recibir imágenes frente
a 353 (90%) del grupo de
N=782 Severidad del dolor
consulta)
Tumbas Resonancia magnética dentro de las 6 Dolor lumbar con relacionados con la salud Grupo de lumbalgia
2012166,167 calidad de vida
semanas de la lesión o sin ciática; con o sin ciática: un
lumbalgia; (SF-36v2 Rol-físico pequeño porcentaje
ciática y Físico (1.4%) de los trabajadores que no recibieron
Sin imágenes o
marcha) una resonancia magnética temprana
imágenes diferidas
Severidad del dolor recibieron una tomografía computarizada
(RM > 6 semanas de N=1226 (Tumbas
lesión) 2012), N=1770 (Calificado crónico temprana
escala de dolor)
(Tumbas 2014)
Función (RMDQ)
Cuidado de la salud
1 año de seguimiento
utilización (MRI, CT,
Rayos X, inyección,
Estados Unidos de
cirugía,
America
quiropráctica,
fisioterapia o
ocupacional
terapia,
pacientes ambulatorios
servicios)
Jarvik Radiografía (dentro de las 6 semanas Dolor lumbar con relacionados con la salud algunos pacientes
2015229 de la visita índice) o sin ciática calidad de vida asignado al grupo de
(índice EQ-5D, EQ-5D radiografía temprana podría
EVA) también he recibido
MRI o CT (dentro de las 6 N=5239
Severidad del dolor (breve MRI/CT temprano, pero solo si
semanas de la visita índice)
Inventario de dolor la imagen ocurrió después de
1 año de seguimiento
escala de interferencia, su radiografía.
Sin imágenes dentro de las 6
Dolor de espalda
semanas de la visita índice
Estados Unidos de Clasificación numérica
(sin imágenes o
America Escama, Dolor De Pierna
imágenes diferidas)
Clasificación numérica
control emparejado para
Escala)
radiografía
Función (RMDQ)
(sin imágenes o
imágenes diferidas)
Intervención y Concomitante
Estudiar comparación Población Resultados tratamiento
Kendrick Radiografía (se le entrega una Dolor lumbar con relacionados con la salud Atención habitual proporcionada
2001248,249
tarjeta para asistir a una radiografía o sin ciática calidad de vida por la práctica para
Kendrick Los pacientes optaron por Dolor lumbar con relacionados con la salud No se indica
2001248,249
tener una radiografía o sin ciática calidad de vida
(grupo) (EQ-5D)
Reino Unido
Kerry Radiografía (remisión el Dolor lumbar con relacionados con la salud En el ECA, 10 pacientes (14
2000252,253
día de la o sin ciática calidad de vida %) del grupo que se asignó al
utilización
Reino Unido
(subsecuente
consulta,
Intervención y Concomitante
Estudiar comparación Población Resultados tratamiento
remisión a
fisioterapeuta o
otra salud
profesional)
Webster MRI ('temprano', dentro Dolor lumbar con Cuidado de la salud No se indica
2014496 los primeros 30 días posteriores al o sin ciática utilización
inicio) (inyección, nervio
prueba, avanzado
N=3022
imágenes, cirugía)
RM diferida
('oportuno', 41-180 días
2 años de seguimiento
post-inicio)
Estados Unidos de
Sin imágenes (2 años America
periodo de estudio)
1
2
1Tabla 25: Imágenes frente a ninguna imagen: datos inadecuados para el metanálisis
Intervención Intervención Comparación
Estudiar Salir resultados grupo (n) Resultados de la comparación grupo (n) Riesgo de sesgo
Deyó 1987107 Dolor (mejoría autoevaluada del dolor, Puntuación de cambio: 2.6 No dado Puntuación de cambio: 2.6 No dado Muy alto
0-6) ≤ 4 meses
Función (perfil de impacto de la enfermedad, Media: 12,3 No dado Media: 10,3 No dado Muy alto
0-100) ≤ 4 meses
Función (perfil de impacto de la enfermedad, Media: 7,3 No dado Media: 8.1 No dado Muy alto
puntuación de la dimensión física, 0-100) ≤ 4
meses
Función (perfil de impacto de la enfermedad, Media: 15,7 No dado Media: 10,6 No dado Muy alto
puntuación de la dimensión psicosocial, 0-100) ≤
4 meses
Utilización de atención médica (buscó 9,3% No dado 9,8% No dado Muy alto
atención en otro lugar) ≤ 4 meses
121
Utilización de atención médica (rayos X) ≤ 4 88,4% No dado 29,3% No dado Muy alto
meses
Djais 2005112 Calidad de vida relacionada con la salud Mediana (Q1, Q3): 38 Mediana (Q1, Q3): 38 Muy alto
(EQ-5D, 0-1) ≤ 4 meses 0,63 (0,41, 0,75)
Severidad del dolor (EVA, 0-10) ≤ 4 meses Mediana (Q1, Q3): 4 38 Mediana (Q1, Q3): 3 38 Muy alto
(2, 6) (2,5)
Función (RMDQ, 0-24) ≤ 4 meses Mediana (Q1, Q3): 38 Mediana (Q1, Q3): 4,5 38 Muy alto
6.5 (2,10) (2,7)
Kendrick 2001248,249 Calidad de vida relacionada con la salud Mediana (RIC): 0,80 189 Mediana (RIC): 0,80 190 Muy alto
(evidencia de ECA) (EQ-5D, 0-1) ≤ 4 meses (0,69-0,88) (0,69-0,91)
Imágenes
Dolor lumbar y ciática
Intervención Intervención Comparación
Centro Nacional de Directrices Clínicas, 2016
Estudiar Salir resultados grupo (n) Resultados de la comparación grupo (n) Riesgo de sesgo
Calidad de vida relacionada con la salud Mediana (RIC): 0,80 180 Mediana (RIC): 0,80 189 Muy alto
(EQ-5D, 0-1) >4 meses - 1 año (0.69-1.00) (0.73-1.00)
Severidad del dolor (EVA, 0-5) ≤ 4 meses Mediana (RIC): 1 (1- 199 Mediana (RIC): 1 (0-2) 203 Muy alto
2)
Severidad del dolor (EVA, 0-5) >4 meses - 1 Mediana (RIC): 1 (0- 195 Mediana (RIC): 1 (0-2) 199 Muy alto
año 2)
Función (RMDQ, 0-24) ≤ 4 meses Mediana (RIC): 4 (1- 199 Mediana (RIC):3 (1-7) 203 Muy alto
8)
Función (RMDQ, 0-24) >4 meses - 1 Mediana (RIC): 3 195 Mediana (RIC): 2 (0-6) 199 Muy alto
año (0-7)
Kendrick 2001248,249 Calidad de vida relacionada con la salud Mediana (RIC): 0,80 28 Mediana (RIC): 0,76 22 Muy alto
(Estudio de cohorte (EQ-5D, 0-1) ≤ 4 meses (0,64-0,84) (0,72-0,91)
evidencia)
122
Calidad de vida relacionada con la salud 27 Mediana (RIC): 0,83 20 Muy alto
Mediana (RIC): 0,80
(EQ-5D, 0-1) >4 meses - 1 año (0.76-1.00)
(0.76-1.00)
Severidad del dolor (EVA, 0-5) ≤ 4 meses Mediana (RIC): 1 (0- 30 Mediana (RIC): 1 (1-2) 22 Muy alto
2)
Severidad del dolor (EVA, 0-5) >4 meses - 1 Mediana (RIC): 1 (0- 29 Mediana (RIC): 0 (0-1) 21 Muy alto
año 2)
Función (RMDQ, 0-24) ≤ 4 meses Mediana (RIC): 6,5 30 Mediana (RIC): 3 (2- 22 Muy alto
(3-14.75) 7,25)
Función (RMDQ, 0-24) >4 meses - 1 Mediana (RIC): 3 29 Mediana (RIC): 1 (0-4) 21 Muy alto
año (0.5-6.5)
1Tabla 26: Resumen de evidencia clínica: Imágenes versus ninguna imagen para dolor lumbar y/o ciática (ECA)
Resultados No de Calidad de la Pariente Efectos absolutos anticipados
Imágenes
Dolor lumbar y ciática
Participantes evidencia efecto
Centro Nacional de Directrices Clínicas, 2016
(estudios) (CALIFICACIÓN) (95% IC) Diferencia de riesgo con imágenes (IC del 95 %)
Calidad de vida relacionada con la salud 124 BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 dolor corporal, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo media (SF-36 dolor corporal, 0-100) ≤ 4 media (SF-36 dolor corporal, 0-100) ≤ 4
6 semanas meses en los grupos de control fue de 49 meses en los grupos de intervención fue
0 más alto
(8,31 inferior a 8,31 superior)
Calidad de vida relacionada con la salud 120 BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 percepción general de salud, 0-100) ≤ 4 (1 estudio) debido al riesgo de sesgo media (SF-36 salud general media (SF-36 percepción general de la salud,
meses 6 semanas percepción, 0-100) ≤ 4 meses en los 0-100) ≤ 4 meses en los grupos de
grupos de control fue intervención fue
67 2 más alto
(6,31 inferior a 10,31 superior)
Calidad de vida relacionada con la salud 123 MUY BAJOa, b La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 vitalidad, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de media (SF-36 vitalidad, 0-100) ≤ 4 meses en media (SF-36 vitalidad, 0-100) ≤ 4 meses en
123
6 semanas sesgo, imprecisión los grupos de control fue de 46 los grupos de intervención fue 8 veces mayor
Calidad de vida relacionada con la salud (SF-36 124 MUY BAJOa, b La calidad de vida relacionada con la La calidad de vida relacionada con la salud
funcionamiento social, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de salud media (función social SF-36, 0-100) media (función social SF-36, 0-100) ≤ 4
6 semanas sesgo, imprecisión ≤ 4 meses en los grupos de control fue meses en los grupos de intervención fue
67 5 más alto
(4,78 inferior a 14,78 superior)
Calidad de vida relacionada con la salud 123 MUY BAJOa, b La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 salud mental, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo, media (SF-36 salud mental, 0-100) ≤ media (SF-36 salud mental, 0-100) ≤ 4
Imágenes
Dolor lumbar y ciática
6 semanas imprecisión 4 meses en los grupos de control meses en los grupos de intervención
Centro Nacional de Directrices Clínicas, 2016
fue fue
sesenta y cinco 9 más alto
(3,46 a 14,54 más alto)
Calidad de vida relacionada con la salud 121 BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la
(SF-36 funcionamiento físico, 0-100) ≤ 4 (1 estudio) debido al riesgo de sesgo salud media (SF-36 funcionamiento salud media (SF-36 funcionamiento
meses 6 semanas físico, 0-100) ≤ 4 meses en los grupos de físico, 0-100) ≤ 4 meses en los grupos de
control fue intervención fue
sesenta y cinco 2 más alto
(6,31 inferior a 10,31 superior)
Calidad de vida relacionada con la salud (SF-36 118 MUY BAJOa, b La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
rol-funcionamiento emocional, 0-100) ≤ 4 (1 estudio) debido al riesgo de media (SF-36 rol-emocional media (SF-36 rol-emocional
meses 6 semanas sesgo, imprecisión funcional, 0-100) ≤ 4 meses en los funcional, 0-100) ≤ 4 meses en los
grupos de control fue grupos de intervención fue
sesenta y cinco 10 más alto
(3,85 inferior a 23,85 superior)
Calidad de vida relacionada con la salud 121 MUY BAJOa, b La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
124
(EQ-5D EVA, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de media (eq-5d VAS, 0-100) ≤ 4 meses en los media (eq-5d VAS, 0-100) ≤ 4 meses en los
6 semanas sesgo, imprecisión grupos de control fue grupos de intervención fue
67 7 más alto
(1,31 inferior a 15,31 superior)
Severidad del dolor (puntaje Aberdeen Low 692 MUY BAJOC.A La gravedad media del dolor (puntuación La gravedad media del dolor (puntuación
Back Pain (ALBP), 0-100) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo, falta ALBP, 0-100) >4 meses - 1 año en los ALBP, 0-100) >4 meses - 1 año en los grupos
2 años de direccionalidad grupos de control fue de intervención fue
35.8 4.2 inferior
(7,17 a 1,23 menos)
Función (RMDQ, 0-24) ≤ 4 meses 126 MUY BAJOa, b La función media (RMDQ, 0-24) ≤ 4 La función media (RMDQ, 0-24) ≤ 4
(1 estudio) debido al riesgo de meses en los grupos de control fue meses en los grupos de intervención
6 semanas sesgo, imprecisión fue
6.9 1 inferior
(3,08 inferior a 1,08 superior)
Función (RMDQ, 0-24) >4 meses - 1 103 BAJOa La función media (RMDQ, 0-24) La función media (RMDQ, 0-24) >4
año (1 estudio) debido al riesgo de sesgo > 4 meses - 1 año en los grupos de meses - 1 año en los grupos de
1 año control fue intervención fue
4.3
Imágenes
Dolor lumbar y ciática
0,2 más alto
Centro Nacional de Directrices Clínicas, 2016
Angustia psicológica (puntuación de 122 MUY BAJOa, b La angustia psicológica media La angustia psicológica media
ansiedad HADS, 0-21) ≤ 4 meses (1 estudio) debido al riesgo de (HADS Anxiety Score, 0-21) ≤ 4 (puntuación de ansiedad HADS, 0-21) ≤
6 semanas sesgo, imprecisión meses en los grupos de control fue 4 meses en los grupos de intervención
de 7,7 fue
0,9 inferior
(2,43 inferior a 0,63 superior)
Angustia psicológica (puntuación de 99 BAJOa La angustia psicológica media La angustia psicológica media
ansiedad HADS, 0-21) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo (puntuación de ansiedad HADS, 0-21) (puntuación de ansiedad HADS, 0-21) >4
1 año >4 meses - 1 año en los grupos de meses - 1 año en los grupos de
control fue intervención fue
6.7 0,4 inferior
(2,08 inferior a 1,28 superior)
Angustia psicológica (puntuación de 122 BAJOa La angustia psicológica media La angustia psicológica media
depresión HADS, 0-21) ≤ 4 meses (1 estudio) debido al riesgo de sesgo (puntuación de depresión HADS, 0-21) ≤ (puntuación de depresión HADS, 0-21) ≤
6 semanas 4 meses en los grupos de control fue de 4 meses en los grupos de intervención
125
5,1 fue
0,4 inferior
(1,65 inferior a 0,85 superior)
Angustia psicológica (puntuación de 102 BAJOa La angustia psicológica media La angustia psicológica media
depresión HADS, 0-21) >4 meses (1 estudio) debido al riesgo de sesgo (puntuación de depresión HADS, 0-21) (puntuación de depresión HADS, 0-21)
1 año >4 meses - 1 año en los grupos de >4 meses - 1 año en los grupos de
control fue intervención fue
4.1 0,3 inferior
(1,68 inferior a 1,08 superior)
Calidad de vida relacionada con la salud 792 MUY BAJOa B C La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 dolor corporal, 0-100) >4 meses (2 estudios) debido al riesgo de sesgo, falta media (SF-36 dolor corporal, 0-100) >4 media (SF-36 dolor corporal, 0-100) >4
de direccionalidad, meses - 1 año en los grupos de control fue meses - 1 año en los grupos de
imprecisión intervención fue
53.1 3.97 más alto
(0,36 a 7,59 más alto)
Calidad de vida relacionada con la salud 790 MUY BAJOa B C D La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 salud mental, 0-100) >4 meses (2 estudios) debido al riesgo de sesgo, media (SF-36 salud mental, 0-100) >4 media (SF-36 salud mental, 0-100) >4
Imágenes
Dolor lumbar y ciática
inconsecuencia, meses - 1 año en los grupos de meses - 1 año en los grupos de
Centro Nacional de Directrices Clínicas, 2016
Calidad de vida relacionada con la salud (SF-36 794 MUY BAJOa B C La calidad de vida relacionada con la La calidad de vida relacionada con la salud
funcionamiento social, 0-100) >4 meses (2 estudios) debido al riesgo de sesgo, falta salud media (función social SF-36, 0-100) media (SF-36 funcionamiento social, 0-100)
de direccionalidad, >4 meses - 1 año en los grupos de > 4 meses - 1 año en los
imprecisión control fue grupos de intervención fue
70.4 4,25 mayor
(0,16 a 8,33 más alto)
Calidad de vida relacionada con la salud (transición de 692 MUY BAJOC.A La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
126
salud informada por el rol de SF-36, 0-100) (1 estudio) debido al riesgo de sesgo, falta media (transición de salud informada por promedio (transición de salud informada por el
> 4 meses 24 meses de direccionalidad el SF-36, 0-100) >4 meses - 1 año en los rol de SF-36, 0-100) >4 meses - 1 año en los
grupos de control fue 49,8 grupos de intervención fue 1,9 más alta
Calidad de vida relacionada con la salud 790 MUY BAJOa B C La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 vitalidad, 0-100) >4 meses (2 estudios) debido al riesgo de sesgo, falta media (SF-36 vitalidad, 0-100) >4 meses - 1 media (SF-36 vitalidad, 0-100) >4 meses - 1 año
de direccionalidad, año en los grupos de control fue en los grupos de intervención fue 3,72 más
imprecisión alta
47.35 (0,54 a 6,9 más alto)
Calidad de vida relacionada con la salud 790 MUY BAJOa B C La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 percepción general de salud, 0-100) >4 (2 estudios) debido al riesgo de sesgo, falta media (SF-36 salud general media (SF-36 percepción general de la salud,
meses de direccionalidad, percepción, 0-100) >4 meses - 1 año 0-100) >4 meses - 1 año en los grupos de
imprecisión en los grupos de control fue 60,3 intervención fue
1,59 más alto
(1,76 inferior a 4,93 superior)
Calidad de vida relacionada con la salud (SF-36) 789 MUY BAJOa B C La calidad media relacionada con la salud de La calidad media relacionada con la salud de
Imágenes
Dolor lumbar y ciática
rol-función física, 0-100) >4 (2 estudios) debido al riesgo de sesgo, falta vida (SF-36 rol-funcionamiento vida (SF-36 rol-funcionamiento físico,
Centro Nacional de Directrices Clínicas, 2016
meses de direccionalidad, físico, 0-100) >4 meses - 1 año en los 0-100) >4 meses - 1 año en los grupos
imprecisión grupos de control fue 52.6 de intervención fue
4,76 más alto
(1,24 inferior a 10,75 superior)
Calidad de vida relacionada con la salud (SF-36 789 MUY BAJOa B C La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
rol-funcionamiento emocional, 0-100) >4 (2 estudios) debido al riesgo de sesgo, falta media (SF-36 rol-emocional media (SF-36 rol-emocional
meses de direccionalidad, funcional, 0-100) >4 meses - 1 año funcional, 0-100) >4 meses - 1 año
imprecisión en los grupos de control fue 66,9 en los grupos de intervención fue
5,54 mayor
(0,51 inferior a 11,58 superior)
Calidad de vida relacionada con la salud (EQ-5D, 692 MUY BAJOC.A La calidad de vida relacionada con la La calidad de vida relacionada con la salud
0- 1) >4 meses (1 estudio) debido al riesgo de sesgo, falta salud media (eq-5d, 0-1) >4 meses - 1 media (eq-5d, 0-1) >4 meses - 1 año en los
2 años de direccionalidad año en los grupos de control fue grupos de intervención fue
0.539 0,06 más alto
(0,01 a 0,11 más alto)
Calidad de vida relacionada con la salud 100 MUY BAJOa, b La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
127
(EQ-5D EVA, 0-100) >4 meses (1 estudio) debido al riesgo de media (eq-5d VAS, 0-100) >4 meses - 1 año media (eq-5d VAS, 0-100) >4 meses - 1 año en
1 año sesgo, imprecisión en los grupos de control fue de 76 los grupos de intervención fue 2 veces menor
4 meses (1 estudio) debido al riesgo de (0,3 a 44 por 1000 9 menos por 1000 (de 31
3 meses sesgo, imprecisión 2.09) menos a 48 más)
Utilización de atención médica (asistencia 402 MUY BAJOun g RR 0,87 Moderado
ambulatoria) ≤ 4 meses (1 estudio) debido al riesgo de (0,3 a 35 por 1000 5 menos por 1000 (de 24
3 meses sesgo, imprecisión 2.56) menos a 55 más)
Utilización de atención médica 402 BAJOser RR 1.04 Moderado
(medicamento de venta libre) ≤ 4 meses (1 estudio) debido al riesgo de (0,79 a 330 por 1000 13 más por 1000 (de 69
3 meses sesgo, imprecisión 1.36) menos a 119 más)
Utilización de atención médica 402 BAJOser RR 1.09 Moderado
(medicamento recetado) ≤ 4 meses (1 estudio) debido al riesgo de (0,81 a 291 por 1000 26 más por 1000 (de 55
3 meses sesgo, imprecisión 1.47) menos a 137 más)
Utilización de asistencia sanitaria 140 MUY BAJOun g RR 1.13 Moderado
(derivación a fisioterapeuta u otro (1 estudio) debido al riesgo de (0,68 a 282 por 1000 37 más por 1000 (de 90
profesional de la salud) ≤ 4 meses 6 semanas sesgo, imprecisión 1.88) menos a 248 más)
128
35 por 1000
9 meses sesgo, imprecisión 2.56) menos a 55 más)
Utilización de atención médica (medicamento 394 BAJOc,e RR 1.24 Moderado
de venta libre) >4 meses - 1 año (1 estudio) debido al riesgo de (0,92 a 286 por 1000 69 más por 1000 (de 23
9 meses sesgo, imprecisión 1.65) menos a 186 más)
Utilización de atención médica 394 BAJOc,e RR 1.17 Moderado
(medicamento recetado) >4 meses - 1 año (1 estudio) debido al riesgo de (0,84 a 246 por 1000 42 más por 1000 (de 39
9 meses sesgo, imprecisión 1.62) menos a 153 más)
Utilización de atención médica (imágenes por TC) 782 MUY BAJOa B C RR 1,44 Moderado
>4 meses - 1 año* (1 estudio) debido al riesgo de sesgo, falta (0,83 a 51 por 1000 22 más por 1000 (de 9
2 años de direccionalidad, 2.49) menos a 76 más)
imprecisión
Utilización de atención médica (imágenes al 782 MUY BAJOC.A RR 3.04 Moderado
menos una vez) >4 meses - 1 año* (1 estudio) debido al riesgo de sesgo, falta (2,6 a 296 por 1000 604 más por 1000 (de 474
2 años de direccionalidad 3.55) más a 755 más)
Utilización de atención médica (inyección) >4 782 MUY BAJOa B C RR 0,91 Moderado
Imágenes
Dolor lumbar y ciática
meses - 1 año (1 estudio) debido al riesgo de sesgo, falta (0,68 a 195 por 1000 18 menos por 1000 (de 62
Centro Nacional de Directrices Clínicas, 2016
1Tabla 27: Resumen de la evidencia clínica: imágenes versus ninguna imagen para el dolor lumbar con o sin ciática (estudios de cohortes)
No de Efectos absolutos anticipados
Participantes Calidad de la Pariente
(estudios) evidencia efecto Diferencia de riesgo con imágenes (IC del 95 %)
7 inferior
(14,06 inferior a 0,06 superior)
133
Calidad de vida relacionada con la salud 332 MUY BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la salud
(SF-36 Rol emocional, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo salud media (SF-36 rol emocional, 0-100) media (SF-36 rol emocional, 0-100) ≤ 4
6 semanas ≤ 4 meses en los grupos de control fue meses en los grupos de intervención fue
67 3 más alto
(8,42 inferior a 14,42 superior)
Calidad de vida relacionada con la salud 332 MUY BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la
(SF-36 salud general, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo salud media (SF-36 salud general, 0-100) salud media (SF-36 salud general, 0-100) ≤
6 semanas ≤ 4 meses en los grupos de control fue 4 meses en los grupos de intervención
fue
68 1 más alto
(3,38 inferior a 5,38 superior)
Calidad de vida relacionada con la salud 343 MUY BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la
(SF-36 salud mental, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo salud media (SF-36 salud mental, 0-100) salud media (SF-36 salud mental, 0-100) ≤
6 semanas ≤ 4 meses en los grupos de control fue 4 meses en los grupos de intervención
fue
68 3 más alto
Imágenes
Dolor lumbar y ciática
No de Efectos absolutos anticipados
Centro Nacional de Directrices Clínicas, 2016
Calidad de vida relacionada con la salud 334 MUY BAJOa, b La calidad de vida relacionada con la La calidad de vida relacionada con la
(SF-36 funcionamiento físico, 0-100) ≤ 4 (1 estudio) debido al riesgo de salud media (SF-36 funcionamiento salud media (SF-36 funcionamiento
meses 6 semanas sesgo, imprecisión físico, 0-100) ≤ 4 meses en los grupos de físico, 0-100) ≤ 4 meses en los grupos de
control fue intervención fue
71 8 inferior
(15,07 a 0,93 inferior)
Calidad de vida relacionada con la salud 329 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la
(SF-36 rol físico, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo media (función física SF-36, 0-100) ≤ 4 salud media (SF-36 rol físico, 0-100) ≤ 4
6 semanas meses en los grupos de control fue de 54 meses en los grupos de intervención fue
8 inferior
(19,42 inferior a 3,42 superior)
134
Calidad de vida relacionada con la salud (SF-36 348 MUY BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la salud
funcionamiento social, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo salud media (función social SF-36, 0-100) media (función social SF-36, 0-100) ≤ 4
6 semanas ≤ 4 meses en los grupos de control fue meses en los grupos de intervención fue
74 5 inferiores
Calidad de vida relacionada con la salud 346 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 vitalidad, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo media (SF-36 vitalidad, 0-100) ≤ 4 meses en media (SF-36 vitalidad, 0-100) ≤ 4 meses en
6 semanas los grupos de control fue de 52 los grupos de intervención fue 2 más alta
Calidad de vida relacionada con la salud 343 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(EQ-5D EVA, 0-100) ≤ 4 meses (1 estudio) debido al riesgo de sesgo media (eq-5d VAS, 0-100) ≤ 4 meses en los media (eq-5d VAS, 0-100) ≤ 4 meses en los
6 semanas grupos de control fue grupos de intervención fue
72 2 inferiores
Calidad de vida relacionada con la salud (SF-36) 315 MUY BAJOa, b La calidad media relacionada con la salud de La calidad media relacionada con la salud de
Imágenes
Dolor lumbar y ciática
No de Efectos absolutos anticipados
Centro Nacional de Directrices Clínicas, 2016
Calidad de vida relacionada con la salud 291 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 Rol emocional, 0-100) >4 meses - 1 (1 estudio) debido al riesgo de sesgo media (SF-36 rol emocional, 0-100) media (función emocional SF-36, 0-100) >4
año 1 año > 4 meses - 1 año en los grupos de meses - 1 año en los grupos de intervención
control fue fue
78 1.00 más alto
(9,56 inferior a 11,56 superior)
Calidad de vida relacionada con la salud 302 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la
(SF-36 salud general, 0-100) >4 meses - 1 (1 estudio) debido al riesgo de sesgo media (SF-36 salud general, 0-100) salud media (SF-36 salud general, 0-100)
135
año 1 año > 4 meses - 1 año en los grupos de >4 meses - 1 año en los grupos de
control fue intervención fue
68 1 inferior
(7,19 inferior a 5,19 superior)
Calidad de vida relacionada con la salud 311 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la
(SF-36 salud mental, 0-100) >4 meses - 1 (1 estudio) debido al riesgo de sesgo media (SF-36 salud mental, 0-100) salud media (SF-36 salud mental, 0-100)
año 1 año > 4 meses - 1 año en los grupos de >4 meses - 1 año en los grupos de
control fue intervención fue
71 0 más alto
(4,37 inferior a 4,37 superior)
Calidad de vida relacionada con la salud (SF-36 300 MUY BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la
funcionamiento físico, 0-100) >4 meses (1 estudio) debido al riesgo de sesgo salud media (SF-36 funcionamiento salud media (SF-36 funcionamiento
- 1 año 1 año físico, 0-100) >4 meses - 1 año en los físico, 0-100) >4 meses - 1 año en los
grupos de control fue grupos de intervención fue
74 4.00 menos
(11,06 inferior a 3,06 superior)
Calidad de vida relacionada con la salud (SF-36) 297 MUY BAJOa La calidad media relacionada con la salud de La calidad media relacionada con la salud de
Imágenes
Dolor lumbar y ciática
No de Efectos absolutos anticipados
Centro Nacional de Directrices Clínicas, 2016
Calidad de vida relacionada con la salud (SF-36 315 MUY BAJOa La calidad de vida relacionada con la La calidad de vida relacionada con la salud
funcionamiento social, 0-100) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo salud media (función social SF-36, 0-100) media (SF-36 funcionamiento social, 0-100)
1 año >4 meses - 1 año en los grupos de > 4 meses - 1 año en los
control fue grupos de intervención fue
81 4,00 menor
(10,2 inferior a 2,2 superior)
Calidad de vida relacionada con la salud 312 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(SF-36 vitalidad, 0-100) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo media (SF-36 vitalidad, 0-100) >4 meses - 1 media (SF-36 vitalidad, 0-100) >4 meses - 1 año
136
1 año año en los grupos de control fue en los grupos de intervención fue 3,00 más
baja
56 (9,19 inferior a 3,19 superior)
Calidad de vida relacionada con la salud 312 MUY BAJOa La calidad de vida relacionada con la salud La calidad de vida relacionada con la salud
(EQ-5D VAS, 0-100) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo media (eq-5d VAS, 0-100) >4 meses - 1 año media (eq-5d VAS, 0-100) >4 meses - 1 año
1 año en los grupos de control fue de 75 en los grupos de intervención fue 3,00
inferior
(7,37 inferior a 1,37 superior)
Función (RMDQ, 0-24) ≤ 4 meses 352 MUY BAJOa, b La función media (RMDQ, 0-24) ≤ 4 La función media (RMDQ, 0-24) ≤ 4
(1 estudio) debido al riesgo de meses en los grupos de control fue meses en los grupos de intervención
6 semanas sesgo, imprecisión fue
5.4 1,30 más alto
(0,01 inferior a 2,61 superior)
Función (RMDQ, 0-24) >4 meses - 1 317 MUY BAJOa, b La función media (RMDQ, 0-24) La función media (RMDQ, 0-24) >4
año (1 estudio) debido al riesgo de > 4 meses - 1 año en los grupos de meses - 1 año en los grupos de
1 año sesgo, imprecisión control fue intervención fue
4.2 1,40 más alto
Imágenes
Dolor lumbar y ciática
No de Efectos absolutos anticipados
Centro Nacional de Directrices Clínicas, 2016
Malestar psicológico (HADS Ansiedad, 309 MUY BAJOa El malestar psicológico medio El malestar psicológico medio
0-21) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo (ansiedad HADS, 0-21) >4 meses - 1 (ansiedad HADS, 0-21) >4 meses - 1
1 año año en los grupos de control fue de año en los grupos de intervención fue
6,5 0,20 menor
(1,34 inferior a 0,94 superior)
Angustia psicológica (HADS 341 MUY BAJOa El malestar psicológico medio (HADS La angustia psicológica media (HADS
Depresión, 0-21) ≤ 4 meses (1 estudio) debido al riesgo de sesgo depresión, 0-21) ≤ 4 meses en los depresión, 0-21) ≤ 4 meses en los
137
6 semanas grupos de control fue de 4,5 grupos de intervención fue 0,30 menor
Angustia psicológica (HADS 310 MUY BAJOa La angustia psicológica media La angustia psicológica media (HADS
Depresión, 0-21) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo (HADS depresión, 0-21) >4 meses depresión, 0-21) >4 meses - 1 año en los
1 año - 1 año en los grupos de control grupos de intervención fue 0,40 menor
fue
4.1 (1,29 inferior a 0,49 superior)
1Tabla 28: Resumen de la evidencia clínica: Imágenes versus ninguna imagen o imagen diferida para el dolor lumbar con o sin ciática (estudios de cohortes)
Hacer un seguimiento
Calidad de vida (Índice EuroQuol 5D, 0-1) ≤ 4 3046 MUY BAJOa La calidad de vida media (índice La calidad de vida media (índice
meses (1 estudio) debido al riesgo de sesgo euroquol 5d, 0-1) ≤ 4 meses en los euroquol 5d, 0-1) ≤ 4 meses en el
3 meses grupos de control fue grupos de intervención fue 0
0.735 más alto
(0,01 inferior a 0,01 superior)
Calidad de vida (EuroQuol 5D VAS, 0-100) ≤ 3046 MUY BAJOa La calidad de vida media (euroquol La calidad de vida media (euroquol 5d
4 meses (1 estudio) debido al riesgo de sesgo 5d VAS, 0-100) ≤ 4 meses en los VAS, 0-100) ≤ 4 meses en los grupos de
3 meses grupos de control fue intervención fue
69.75 0,63 más alto
(0,72 inferior a 1,97 superior)
Calidad de vida (Índice EuroQuol 5D, 0-1) 3046 MUY BAJOa La calidad de vida media (índice La calidad de vida media (índice
> 4 meses - 1 año (1 estudio) debido al riesgo de sesgo euroquol 5d, 0-1) >4 meses - 1 año euroquol 5d, 0-1) >4 meses - 1 año en
1 año en los grupos de control fue los grupos de intervención fue
0.745 0.01 más alto
(0 a 0,02 más alto)
Calidad de vida (EuroQuol 5D EVA, 0-100) 3046 MUY BAJOa, b La calidad de vida media (euroquol La calidad de vida media (euroquol 5d
138
> 4 meses - 1 año. (1 estudio) debido al riesgo de 5d VAS, 0-100) >4 meses - 1 año en VAS, 0-100) >4 meses - 1 año en los
1 año sesgo, inconsistencia los grupos de control fue grupos de intervención fue
70 1.33 más alto
(0,01 inferior a 2,66 superior)
Severidad del dolor (Dolor de espalda NRS, 0-10) ≤ 3046 MUY BAJOa La gravedad media del dolor (dolor de La gravedad media del dolor (dolor de
4 meses (1 estudio) debido al riesgo de sesgo espalda NRS, 0-10) ≤ 4 meses en los espalda NRS, 0-10) ≤ 4 meses en los
3 meses grupos de control fue grupos de intervención fue
4.2 0,09 inferior
(0,28 inferior a 0,1 superior)
Severidad del dolor (dolor de pierna NRS, 0-10) ≤ 3046 MUY BAJOa La gravedad media del dolor (dolor en las La gravedad media del dolor (dolor de pierna
4 meses (1 estudio) debido al riesgo de sesgo piernas NRS, 0-10) ≤ 4 meses en los grupos NRS, 0-10) ≤ 4 meses en los grupos de
3 meses de control fue intervención fue
3.68 0,29 inferior
(0,5 a 0,08 inferior)
Severidad del dolor (Interferencia del 3046 MUY BAJOa La intensidad media del dolor (inventario La gravedad media del dolor (inventario
Inventario Breve del Dolor, 0-10) ≤ 4 meses (1 estudio) debido al riesgo de sesgo breve de interferencia del dolor, 0-10) ≤ 4 breve de interferencia del dolor, 0-10) ≤ 4
3 meses meses en los grupos de control fue meses en los grupos de intervención
Imágenes
Dolor lumbar y ciática
3.345 estaba
Centro Nacional de Directrices Clínicas, 2016
0 más alto
(0,18 inferior a 0,17 superior)
Severidad del dolor (Dolor de espalda NRS, 0-10) 3046 MUY BAJOa La gravedad media del dolor (dolor de La gravedad media del dolor (dolor de
>4 meses - 1 año (1 estudio) debido al riesgo de sesgo espalda NRS, 0-10) >4 meses - 1 año en los espalda NRS, 0-10) >4 meses - 1 año en los
1 año grupos de control fue grupos de intervención fue
3.97 0,17 inferior
(0,36 inferior a 0,02 superior)
Severidad del dolor (dolor de pierna NRS, 0-10) 3046 MUY BAJOa La severidad media del dolor (dolor de La gravedad media del dolor (dolor de pierna
>4 meses - 1 año (1 estudio) debido al riesgo de sesgo pierna NRS, 0-10) >4 meses - 1 año en NRS, 0-10) >4 meses - 1 año en los grupos de
1 año los grupos de control fue intervención fue
3.53 0,23 inferior
(0,44 a 0,02 menos)
Severidad del dolor (Interferencia del Inventario 3046 MUY BAJOa La intensidad media del dolor (inventario La gravedad media del dolor (inventario
Breve del Dolor, 0-10) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo breve de interferencia del dolor, 0-10) > 4 breve de interferencia del dolor, 0-10) >4
1 año meses - 1 año en los grupos de control fue meses - 1 año en los grupos de
intervención fue
139
Función (RMDQ, 0-24) ≤ 4 meses 3046 MUY BAJOa La función media (RMDQ, 0-24) ≤ 4 La función media (RMDQ, 0-24) ≤ 4
(1 estudio) debido al riesgo de sesgo meses en los grupos de control fue meses en los grupos de intervención
3 meses fue
10.52 0.02 más alto
(0,44 inferior a 0,49 superior)
Función (RMDQ, 0-24) >4 meses - 1 3046 MUY BAJOa La función media (RMDQ, 0-24) La función media (RMDQ, 0-24) >4
año (1 estudio) debido al riesgo de sesgo > 4 meses - 1 año en los grupos de meses - 1 año en los grupos de
1 año control fue intervención fue
9.62 0,3 inferior
(0,79 inferior a 0,18 superior)
Utilización de atención médica (terapia 1770 MUY BAJOC La media de utilización de atención La utilización media de atención
física o terapia ocupacional) >4 meses - 1 (1 estudio) debido al riesgo de sesgo médica (terapia física o terapia médica (terapia física o terapia
año 1 año ocupacional) > 4 meses - 1 año en los ocupacional) >4 meses - 1 año en los
grupos de control fue grupos de intervención fue
6.8 11,6 más alto
Imágenes
Dolor lumbar y ciática
(9,36 a 13,84 más alto)
Centro Nacional de Directrices Clínicas, 2016
Utilización de atención médica (quiropráctica) 1770 MUY BAJOC La utilización media de atención médica La utilización media de atención médica
>4 meses - 1 año (1 estudio) debido al riesgo de sesgo (quiropráctica) >4 meses - 1 año en los (quiropráctica) >4 meses - 1 año en los
1 año grupos de control fue grupos de intervención fue 0,8 más alta
13.9
(2,46 inferior a 4,06 superior)
Utilización de atención médica (servicios 1770 MUY BAJOC La utilización media de atención médica La utilización media de atención médica
ambulatorios) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo (servicios ambulatorios) >4 meses - 1 año (servicios ambulatorios) >4 meses - 1 año en
1 año en los grupos de control fue 4.3 los grupos de intervención fue 7,9 más alta
Utilización de atención médica (CT) > 4 meses - 1 1770 MUY BAJOdiscos compactos RR 1,75 Moderado
año (1 estudio) debido al riesgo de (1,02 a 31 por 1000 23 más por 1000 (de 1
1 año sesgo, imprecisión 2.98) más a 61 más)
Utilización de atención médica (IRM) >4 meses - 1 1770 MUY BAJOC RR 5.61 Moderado
año (1 estudio) debido al riesgo de sesgo (5.02 a 178 por 1000 821 más por 1000 (de 716
1 año 6.27) más a 938 más)
Utilización de atención médica (cirugía) >4 1770 MUY BAJOC $7.94 Moderado
meses - 1 año (1 estudio) debido al riesgo de sesgo (5.39 a 25 por 1000 174 más por 1000 (de 110
12 meses 11.7) más a 268 más)
a Rebajado en 1 incremento si la mayoría de la evidencia tenía un alto riesgo de sesgo b
Heterogeneidad, I2=81%, p=0,02
c Disminuyó 2 incrementos si la mayoría de la evidencia tenía un riesgo de sesgo muy alto d
Disminuyó 1 incremento si el intervalo de confianza cruzó 1 MID
1 Tabla 29:
Imágenes
Dolor lumbar y ciática
Resumen de la evidencia clínica: imágenes versus ninguna imagen o imagen diferida para el dolor lumbar sin ciática (estudios de cohortes)
Centro Nacional de Directrices Clínicas, 2016
Severidad del dolor (Escala graduada de dolor 955 MUY BAJOa La gravedad media del dolor (escala La gravedad media del dolor (escala graduada
crónico, 0-10) >4 meses - 1 año (1 estudio) debido al riesgo de sesgo graduada de dolor crónico, 0-10) >4 meses de dolor crónico, 0-10) >4 meses - 1 año en los
1 año - 1 año en los grupos de control fue grupos de intervención fue 0,9 más alta
4.1
(0,3 a 1,5 más alto)
Función (RMDQ, 0-24) >4 meses - 1 955 MUY BAJOa, b La función media (RMDQ, 0-24) >4 La función media (RMDQ, 0-24) >4
año (1 estudio) debido al riesgo de meses - 1 año en los grupos de control meses - 1 año en los grupos de
1 año sesgo, imprecisión fue intervención fue
7.4 4.6 más alto
(3,25 a 5,95 superior)
1 Rebajado en 2 incrementos si la mayoría de la evidencia tenía un riesgo muy alto de sesgo 2
Rebajado en 1 incremento si el intervalo de confianza cruzaba 1 MID
2 Tabla 30: Resumen de la evidencia clínica: imágenes versus imágenes diferidas para el dolor lumbar con o sin ciática (estudios de cohortes)
No de Efectos absolutos anticipados
Participantes Calidad de la Pariente
Resultados (estudios) evidencia efecto Riesgo con imágenes diferidas para Diferencia de riesgo con Imagenología (95%
IC)
Imágenes
Dolor lumbar y ciática
(CALIFICACIÓN) (95% IC) Dolor lumbar con o sin
Centro Nacional de Directrices Clínicas, 2016
Hacer un seguimiento
ciática
Utilización de atención médica (inyecciones) ≤ 4 1205 MUY BAJOa, b RR 1.3 Moderado
meses (1 estudio) debido al riesgo de (1,08 a 265 por 1000 79 más por 1000 (de 21
3 meses sesgo, imprecisión 1.57) más a 151 más)
Utilización de atención médica 1205 MUY BAJOa, b RR 1.31 Moderado
(imágenes avanzadas) ≤ 4 meses (1 estudio) debido al riesgo de (0,84 a 62 por 1000 19 más por 1000 (de 10
3 meses sesgo, imprecisión 2.04) menos a 64 más)
Utilización de atención médica (pruebas nerviosas) 1205 MUY BAJOa, b RR 1.34 Moderado
≤ 4 meses (1 estudio) debido al riesgo de (0,91 a 78 por 1000 27 más por 1000 (de 7
3 meses sesgo, imprecisión 1.98) menos a 76 más)
Utilización de atención médica (cirugía) ≤ 4 1205 MUY BAJOa RR 2,91 Moderado
meses (1 estudio) debido al riesgo de sesgo (1,63 a 31 por 1000 59 más por 1000 (de 20
3 meses 5.2) más a 130 más)
Utilización de atención médica (inyecciones) 1205 MUY BAJOa, b RR 1.16 Moderado
(1 a
142
Severidad del dolor (Escala graduada de dolor 271 MUY BAJOa, b La gravedad media del dolor (escala La gravedad media del dolor (escala
crónico, 0-10) > 4 meses (1 estudio) debido al riesgo de graduada de dolor crónico, 0-10) en los graduada de dolor crónico, 0-10) en los
1 año sesgo, imprecisión grupos de control fue grupos de intervención fue
4.8 0.8 más alto
(0,15 a 1,45 más alto)
Función (RMDQ, 0-24) >4 meses - 1 271 MUY BAJOa, b La función media (RMDQ, 0-24) La función media (RMDQ, 0-24) >4
año (1 estudio) debido al riesgo de > 4 meses - 1 año en los grupos de meses - 1 año en los grupos de
1 año sesgo, imprecisión control fue intervención fue
11.5 2.3 más alto
(0,58 a 4,02 superior)
a Rebajado en 2 incrementos si la mayoría de la evidencia tenía un riesgo de sesgo muy alto b
Rebajado en 1 incremento si el intervalo de confianza cruzaba 1 MID
3
Dolor lumbar y ciática
Imágenes
7.41Evidencia económica
2Literatura publicada
3 Se identificó una evaluación económica relacionada con imaginología versus ninguna imaginología y se ha incluido en
4 esta revisión.152,153Esto se resume en el perfil de evidencia económica a continuación (Tabla 32) y el cuadro de evidencias
5 económicas del Anexo I.
6 Se identificaron seis evaluaciones económicas publicadas en siete artículos diferentes relacionados con esta revisión,
7 pero se excluyeron debido a problemas de aplicabilidad o se excluyeron selectivamente debido a limitaciones
8 metodológicas y la disponibilidad de evidencia más aplicable.252.249.237.321.167.229.496
11
GILBERT2004 Parcialmente Potencialmente Análisis dentro del ensayo (RCT, mismo Significar Significar Significar Probabilidad de que las imágenes tempranas
152/GILBERT20 aplicable(a) serio artículo). incremental adicional incremental sean rentables (umbral de £ 20 000): 89,7 %
04A153(REINO UNIDO) limitaciones Análisis de costo-utilidad (CUA). costo: £ 61.07 AVAC: 0,04 costo por QALY
(b) (95% IC: – (95% IC: – de £ 1,527
Población: Adultos con dolor El bootstrapping de ICER (utilizando
lumbar (con y sin ciática). 25.24, 0,015 a cuando falta QALY ajustados) se realizó desde un
147.36) 0.10) los datos son
pagador de atención médica
Dos comparadores en análisis completo:
imputado
perspectiva. Los resultados se presentan
- 'imágenes selectivas tardías' (sin
arriba. Se realizaron análisis de
imágenes a menos que se desarrolle
sensibilidad adicionales para mostrar el
una indicación clínica clara).
efecto sobre el costo por QALY obtenido al
- 'imágenes tempranas' (MRI o CT tan
cambiar el costo estimado de las
pronto como sea posible).
imágenes. Esto encontró que a medida
Seguimiento: 2 años.
que aumenta el costo de las imágenes,
145
6
Dolor lumbar y ciática
Imágenes
7.51Declaraciones de evidencia
7.5.12Clínico
7.5.1.13Imágenes versus ninguna imagen para el dolor lumbar con o sin ciática
4 Hubo pruebas inconsistentes del efecto de la imaginología en la calidad de vida de los pacientes con dolor lumbar
5 con o sin ciática. Un ECA que comparó la radiografía con ninguna imagen encontró un beneficio clínico en
6 algunos resultados del SF-36 (percepción general de la salud, vitalidad, funcionamiento social, salud mental,
7 funcionamiento emocional) y en el EQ-5D a ≤ 4 meses (calidad baja a muy baja). ;n=153). Se observaron resultados
8 similares en 2 estudios que compararon rayos X con ninguna imagen y resonancia magnética o tomografía
9 computarizada con ninguna imagen en > 4 meses - 1 año para algunos resultados del SF-36 (calidad baja a muy
10 baja; n = 935; dolor corporal, funcionamiento físico , vitalidad, rol-funcionamiento físico, funcionamiento
11 emocional) y el EQ-5D (1 estudio; muy baja calidad; n=782). Sin embargo, estos resultados no fueron consistentes
12 con la evidencia del estudio de cohorte que comparó la radiografía con ninguna imagen (calidad muy baja; n =
13 506),
14 La evidencia de 1 ECA que comparó la resonancia magnética o la tomografía computarizada con ninguna imaginología no
15 sugirió ninguna diferencia clínica entre la imaginología y ninguna imaginología para el resultado de la gravedad del dolor en
dieciséis >4 meses - 1 año (calidad muy baja; n = 782). Los resultados de la función y la angustia psicológica fueron informados por un
17 ECA y un artículo de cohorte por el mismo grupo de estudio, comparando rayos X con ninguna imagen (calidad baja a muy
18 baja; n = 153 y 506 respectivamente); tampoco hubo diferencia clínica entre imágenes y ninguna imagen para estos
19 resultados en ≤ 4 y > 4 meses - 1 año.
20 La evidencia de los ECA que compararon los rayos X con ninguna imagen (1 o 2 estudios; calidad baja a muy baja;
21 n = 153 y 421) sugirió que no hubo diferencia clínica para los resultados de utilización de atención médica en ≤ 4
22 meses. Se observaron menos consultas médicas posteriores en el grupo que no recibió imágenes. Los estudios de
23 cohortes individuales, que compararon radiografías, resonancias magnéticas o tomografías computarizadas con
24 ninguna imagen, sugirieron que hubo un beneficio clínico a favor de la ausencia de imágenes para los resultados
25 de utilización de atención médica en ≤ 4 meses (2 estudios; calidad muy baja; n = 506 y 3022). De manera similar,
26 la evidencia de ECA (3 estudios; 2 que compararon rayos X con ninguna imagen, 1 que comparó IRM con ninguna
27 imagen; calidad baja a muy baja; rango de n = 153-782) y estudios observacionales individuales (2 estudios; 1 que
28 comparó rayos X a ninguna imagen, 1 comparó la RM con ninguna imagen, muy baja calidad;
29
30 No hubo datos disponibles para los criterios de respuesta o los eventos adversos.
7.5.1.231 Imágenes versus ninguna imagen o imagen diferida para el dolor lumbar con o sin ciática
32 La evidencia de 1 estudio de cohorte (dentro de las 6 semanas de la visita índice) mostró que las imágenes (rayos X, MRI o CT)
33 no tienen una diferencia clínicamente importante en comparación con ninguna imagen o imagen diferida en los resultados
34 críticos calidad de vida relacionada con la salud (EQ -5D), gravedad y función del dolor, tanto en seguimientos a corto como a
35 largo plazo (muy baja calidad; n=5239). Lo mismo ocurrió con la utilización de la atención médica cuando se compararon las
36 imágenes y la ausencia de imágenes o las imágenes diferidas; en algunos casos, la utilización de la atención médica fue menor
37 en los grupos que no recibieron imágenes (1 estudio de cohorte, muy baja calidad; n = 1770).
38 No hubo datos disponibles para el resultado crítico de angustia psicológica, criterios de respuesta o
39 eventos adversos.
7.5.1.340Imágenes versus ninguna imagen o imagen diferida para el dolor lumbar sin ciática
41 La evidencia de un estudio de cohorte único que comparó la resonancia magnética (dentro de las 6 semanas posteriores a la lesión) con ninguna imagenología o
42 imagenología diferida (RMN > 6 semanas de la lesión) indicó un beneficio clínico de la ausencia de imagenología o la imagenología diferida.
1 imágenes en la calidad de vida (función física SF-36 y función física) y resultados de la función a los ≥4 meses. No se
2 encontraron diferencias clínicas entre la imaginología y la no imaginología o la imaginología diferida en la intensidad del
3 dolor a los ≥ 4 meses (todos los resultados se calificaron como de muy baja calidad; n = 1226).
4 No hubo datos disponibles para la angustia psicológica o cualquiera de los resultados importantes.
7.5.1.45Imágenes versus imágenes diferidas para el dolor lumbar con o sin ciática
6 La evidencia de un único estudio de cohorte (n = 3022) que comparó la resonancia magnética temprana (dentro de los primeros 30 días
7 posteriores al inicio) con la resonancia magnética diferida (41-180 días posteriores al inicio) sugirió un beneficio clínico de las imágenes diferidas
8 para la mayoría de los resultados de utilización de atención médica informados en ambos ≤4 y ≥4 meses. No se observaron diferencias clínicas
9 entre las imágenes y las imágenes diferidas en la utilización de inyecciones en el cuidado de la salud a los ≤4 meses y las pruebas nerviosas a los
11 No hubo datos disponibles para ningún resultado crítico ni para ninguno de los otros resultados importantes.
13 La evidencia de un único estudio de cohorte que comparó la resonancia magnética (dentro de las 6 semanas posteriores a la lesión) con
14 ninguna imagenología o imagenología diferida (sin resonancia magnética o resonancia magnética después de 6 semanas de la lesión)
15 mostró un beneficio clínico que favorecía a esta última para la calidad de vida (función física SF-36 y rol-físico) y función a >4 meses - 1
dieciséis año (muy baja calidad, n=1226). No se demostró ninguna diferencia clínicamente importante en la intensidad del dolor a >4 meses - 1
17 año.
18 No hubo datos disponibles para el resultado de la angustia psicológica o cualquiera de los resultados importantes.
7.5.219 Económico
20 - Un análisis de costo-utilidad encontró que las imágenes tempranas son rentables en comparación con las imágenes
21 selectivas tardías (ICER: £ 1,527 por QALY ganado). Este análisis se evaluó como parcialmente aplicable con limitaciones
22 potencialmente graves.
3. Explique a las personas con lumbalgia con o sin ciática que si se las deriva para
la opinión de un especialista, es posible que no necesiten imágenes.
personas con dolor lumbar con o sin ciática solo si es probable que el resultado cambie el
tratamiento.
Valores relativos de El GDG estuvo de acuerdo en que la calidad de vida relacionada con la salud, la intensidad del dolor, la
diferentes resultados función y la angustia psicológica eran los resultados críticos para la toma de decisiones. Criterios de
respuesta (para el dolor y la función), eventos adversos y utilización de la atención médica
Tampoco hubo pruebas en esta revisión de eventos adversos o criterios de respuesta para
ninguna de las comparaciones.
El GDG también señaló que la única evidencia para la comparación de imaginología versus no
imaginología o imaginología diferida provino de 2 estudios de cohortes, con la mayoría de los
resultados mostrando que la imaginología no tiene un beneficio sustancial sobre ninguna imaginología
o diferida. Además, para la comparación de imaginología versus imaginología diferida, solo hubo
evidencia de un único estudio de cohorte, que solo informó los resultados de utilización de la atención
médica, mostrando el beneficio clínico de la imaginología diferida.
Ciática población
El GDG observó que toda la evidencia para la comparación de imaginología versus ninguna imaginología
o imaginología diferida provino de un solo estudio de cohorte que solo informó resultados a >4 meses - 1
año. Se observó algún beneficio clínico sin imágenes o imágenes diferidas en comparación con las
imágenes tempranas.
Resumen
El GDG señaló que para la mayoría de las comparaciones, había pruebas limitadas de una
pequeña cantidad de estudios. Además, el GDG reconoció que una cantidad considerable
de evidencia provino de estudios de cohortes y discutió la dificultad de determinar la causa
y el efecto en la interpretación de los resultados. El GDG señaló una serie de limitaciones
adicionales; la evidencia disponible podría estar desactualizada, ya que las radiografías
fueron la modalidad de imagen estudiada en la mayoría de los artículos, en lugar de la
resonancia magnética. Un ECA usó el reposo en cama como tratamiento concomitante con
la imaginología. Además, la evidencia de 3 estudios no sería necesariamente aplicable al
entorno de atención médica del Reino Unido donde los datos relacionados con la calidad de
vida y la utilización de la atención médica se recopilaron de los entornos de atención de EE.
UU. (p. ej., registros de quejas de los trabajadores).
El GDG observó que la mayor parte de la evidencia a favor de las imágenes se obtuvo
de un solo ECA realizado en un entorno de atención secundaria. Se consideró que los
médicos de atención primaria podrían tener menos probabilidades de ser expertos en
evaluación musculoesquelética en comparación con los médicos dentro de entornos
de atención especializados y, como tales, tienen un mayor grado de incertidumbre
diagnóstica. Dado que es probable que el nivel de incertidumbre diagnóstica en
entornos especializados sea menor, el GDG acordó que las imágenes no deben
realizarse en atención primaria sino solo en entornos especializados. El GDG discutió
además que los resultados positivos en este entorno fueron solo de un estudio y que
los hallazgos no podían generalizarse a todos los pacientes con dolor lumbar y/o
ciática. El GDG acordó que las imágenes deben realizarse en función de la idoneidad
clínica.
En los casos en los que no era probable que las imágenes cambiaran el manejo, se consideró que
las personas podrían aceptar la decisión de no obtener imágenes más fácilmente de parte de
médicos especialistas expertos. Se acordó que la evidencia revisada era suficiente para
desaconsejar el uso rutinario de imágenes en un entorno no especializado en esta población.
El GDG señaló que las personas a menudo buscan imágenes para tranquilizarse, ya
que no confían en un diagnóstico clínico. Sin embargo, sobre la base de la evidencia
clínica y de rentabilidad revisada, el GDG discutió que las imágenes en esta
circunstancia no serían apropiadas.
Al GDG le preocupaba que la recomendación de que las imágenes solo se deben realizar en
entornos de atención especializados podría dar lugar a derivaciones con la expectativa de que se
realizarían imágenes. Por lo tanto, el GDG aconsejó que los profesionales de la salud deben dejar
en claro que si van a derivar a un servicio especializado, lo hacen principalmente para una
opinión clínica y no necesariamente para imágenes.
Intercambio entre Se incluyó una evaluación económica relevante que consideró la imaginología en
efectos clínicos netos comparación con ninguna imaginología/imágenes tardías para personas con dolor lumbar
y costos con o sin ciática. Esto se basó en el ECA de Gilbert et al. (2004) incluidos en la revisión clínica.
152,153Este análisis dentro del ensayo encontró que la imaginología temprana con MRI o CT
tan pronto como fue posible aumentó los costos y mejoró la salud (aumento de QALY) en
comparación con una imaginología selectiva tardía (ninguna imaginología a menos que se
desarrolle una indicación clínica clara), con una rentabilidad incremental ratio de £1.527 por
QALY ganado. La probabilidad de que las imágenes tempranas sean rentables en el umbral
de £ 20 000 por QALY fue de alrededor del 90 %. El análisis solo reflejó la evidencia de
efectividad de 1 ECA incluido en la revisión clínica mientras que se identificaron otros
estudios. El GDG señaló que las conclusiones de este estudio no eran consistentes con la
evidencia de los estudios de cohortes, que no indicaron una diferencia clínicamente
importante o un beneficio clínicamente importante a favor de la no imaginología.
Por estas razones, el GDG consideró que es poco probable que las imágenes sean rentables en un entorno de
atención primaria, mientras que podrían ser rentables en aquellos casos en los que las imágenes en entornos
de atención especializados podrían conducir a un cambio en el manejo.
Calidad de la evidencia Para la mayoría de las pruebas en esta revisión, la calidad varió de una calificación GRADE de baja a muy
baja. Lo anterior se debió al alto número de abandonos o cruces de participantes de cada grupo, lo que
resultó en una calificación de alto riesgo de sesgo, así como a la naturaleza imprecisa de los resultados
extraídos y analizados en esta revisión. Para dos de los ensayos de intervención, los datos solo se
informaron como mediana y rango intercuartílico para el dolor, la función y la calidad de vida
relacionada con la salud y, por lo tanto, no se pudieron establecer conclusiones sobre la eficacia basadas
en estos resultados con algún grado de certeza. Se extrajo una cantidad considerable de pruebas de los
estudios de cohortes, que obtuvieron una calificación de calidad GRADE muy baja.
Otras Consideraciones El GDG discutió qué personas con dolor lumbar deberían ser examinadas. La presencia de síntomas o
signos que sugieran una posible patología subyacente grave (banderas rojas), incluidos antecedentes de
cáncer o traumatismos, puede justificar la obtención de imágenes tempranas; sin embargo, está más allá
del alcance de esta guía revisar el uso de imágenes para estas afecciones.
El GDG señaló que cuando se solicitan imágenes de atención primaria, a menudo son para radiografías. Sin
embargo, el GDG discutió que es más probable que la resonancia magnética cambie el tratamiento que las
radiografías. Por lo tanto, debatieron en qué entorno (es decir, atención primaria o atención secundaria) y por
qué razón (p. ej., diagnóstico o vía de tratamiento) se deben administrar imágenes a las personas con dolor de
espalda inespecífico y acordaron que debería ser solo en un entorno especializado.
81Autogestión
8.12Introducción
3 Se espera que la mayoría de los episodios de dolor lumbar inespecífico mejoren en unos pocos días o semanas
4 con el regreso a la actividad normal. Sin embargo, si el dolor no se resuelve y se prolonga, puede afectar la
5 condición física de las personas y su capacidad para realizar actividades normales de la vida diaria. El dolor de
6 espalda puede afectar su estado de ánimo y confianza y puede volverse cada vez más angustioso.
7 El dolor lumbar inespecífico es difícil de definir con precisión y las personas a menudo tienen descripciones de sus síntomas, a la
8 manera de un síndrome, en lugar de un diagnóstico definitivo. Esta falta de una definición clara puede resultar en una creciente
9 confusión, angustia y, para muchas personas, puede resultar en una incapacidad para adoptar estrategias de afrontamiento
10 positivas. Esto puede resultar rápidamente en círculos viciosos de pérdida de condición física, bajo estado de ánimo, retiro de la
11 actividad normal y aumento de la ansiedad.
12 Estos factores a menudo pueden colocar el manejo del dolor lumbar inespecífico crónico en gran medida fuera
13 del alcance de un enfoque biomédico. A menudo hay una transición difícil de la ontología familiar de la medicina
14 curativa al territorio desconocido de la autogestión y las ideas contrarias a la intuición como 'vivir bien' con una
15 condición de salud a largo plazo.206La calidad de vida de las personas en esta situación depende menos de las
dieciséis intervenciones de los profesionales de la salud y más de la capacidad de la persona para emprender el
17 autocuidado.451,488
18 Esta revisión intenta revisar la evidencia del autocuidado para el dolor lumbar y la ciática e incluye
19 consejos de autocuidado, programas de autocuidado y la efectividad de la información escrita y los
20 regímenes de ejercicio no supervisados.
-Ejercicio sin supervisión (incluyendo prescripción de ejercicio, consejos para hacer ejercicio en casa)
Resultados Crítico
-Calidad de vida relacionada con la salud (por ejemplo, SF-12, SF-36 o EQ-5D).
-Severidad del dolor (por ejemplo, escala analógica visual [VAS] o escala de calificación numérica [NRS]).
índice de discapacidad).
Diseño del estudio Se incluirán ECA y RS en primera instancia. Si se encuentran pruebas de ECA insuficientes para
formar una recomendación, se incluirán estudios no aleatorios.
8.31Evidencia Clínica
3 Se incluyeron 28 estudios en la revisión, 3 de los cuales se incluyeron en varios artículos para un total
4 de 32 papeles.36,46,71,70,72,122,154,174,176,193,196,202,210,212,227,255,291,296,304,375,382,391,396,402,422,425,
5 438,465,492,508,509,522Estos se resumen enTabla 34abajo. Pengel et al. 2007 también se incluye en el
6 capítulo de Programas multidisciplinarios de rehabilitación biopsicosocial (Ver Capítulo 17).382
7 La evidencia de estos estudios se resume en los resúmenes de evidencia clínica a continuación. Consulte también el diagrama de
8 flujo de selección de estudios en el Apéndice E, las tablas de pruebas de estudios en el Apéndice H, los diagramas de bosque en el
9 Apéndice K, las tablas GRADE en el Apéndice J y la lista de estudios excluidos en el Apéndice L.
11 Siete estudios (1 incluido en 2 artículos para un total de 8 artículos)4 7.113.129.170.176.210.291En esta revisión también se
12 incluyeron combinaciones de intervenciones no invasivas (con autocuidado como complemento). Estos se resumen en
13 Tabla 35abajo. La evidencia de estos estudios se resume en el perfil de evidencia clínica GRADE/resumen de evidencia
14 clínica a continuación. Consulte también el diagrama de flujo de selección de estudios en el Apéndice E, las tablas de
15 pruebas de estudios en el Apéndice H, los diagramas de bosque en el Apéndice K, las tablas GRADE en el Apéndice J y la
dieciséis lista de estudios excluidos en el Apéndice L. El estudio de Ferreira129
17 y el pequeño estudio210,291también se incluyen en el capítulo de terapia manual (Ver Capítulo 12).
18
8.3.319 Heterogeneidad
20 Para la comparación de los programas de autocuidado versus la atención habitual, hubo heterogeneidad
21 significativa entre los estudios cuando se metanalizaron para los siguientes resultados: dolor (VAS y
22 VonKorff 0-10) y función (RMDQ/ODI) en ≤4 meses. No se pudieron realizar análisis de subgrupos
23 preespecificados (diferentes modalidades dentro de la clase y cronicidad del dolor) sobre este resultado
24 porque los estudios no fueron diferentes en cuanto a estos factores. Por lo tanto, se aplicó un metanálisis
25 de efectos aleatorios a estos dos resultados, y la evidencia se disminuyó por inconsistencia en GRADE.
26
Programas de autogestión
cherkin Folleto Lumbalgia Función Concurrente
1996A71 Sesión enfermera + folleto con o sin (RMDQ) tratamiento: no
Atención habitual (sin
ciática Cuidado de la salud fijado
intervención adicional) N=294 utilización
EE.UU
tratamiento lumbalgia
rellenos de medicamentos)
EE.UU
Gilberto 1985 Autocuidado - reposo en cama Lumbalgia Respondedor También tenía un grupo de reposo
154
+ ejercicio con o sin criterios (sin en cama frente al habitual
EE.UU utilización
(consulta
para el dolor de espalda)
arriba)
EE.UU
añadido cuando
apropiado en el
terapia combinada
grupo. Ninguna
mencionado en el
otros grupos
irvine 2015227 Autogestión Lumbalgia Sin relevancia Concurrente
programa (fitback, educación con o sin resultados tratamiento: no
online y estrategias ciática reportado fijado
conductuales con enfoque N=597
cognitivo conductual)
Duración del estudio: 4
Autogestión meses
programa (en línea; el paciente tenía
EE.UU
opciones de sitios web para visitar
con fines educativos)
quiropráctico
EE.UU
visitas para la espalda
dolor; físico
visitas de terapia
para el dolor de espalda;
días de hospital)
poco claro
Finlandia
actividades. los
los brazos/comparaciones en 6 semanas
tratamiento
fisioterapeuta
este ensayo se han incluido en la
explicó el
revisión de MBR Australia y nueva
naturaleza benigna de
zelanda
lumbalgia,
abordó cualquier
creencias inútiles
sobre el dolor de espalda,
y enfatizó
Concurrente
tratamiento: farsa
ejercicio - el
controlar para el
ejercicio
intervención
consistía en una farsa
pulsado
ultrasonografía (5
minutos) y falso
onda corta pulsada
diatermia (20
minutos).
fueron alentados
participar en
ejercicios caseros.
tratamiento único
(1 año de seguimiento)
Reino Unido
en anteriores
semana)
tratamiento único
(media en cada
grupo 17 y 24
días respectivamente)
Reino Unido
Porcelana
Hagen 2000A Consejos para mantenerse activo Lumbalgia Sin relevancia El único resultado
176
Atención habitual (gp care) con o sin resultados reportado es regreso
ciática en enfermo reportado trabajar (no en el
abandonar protocolo)
N=457 Concurrente
Duración del estudio: tratamiento: no
12 meses fijado
Noruega
Wiesel 1980 Consejos para mantenerse activo Lumbalgia Días a full Concurrente
508
Consejos para el reposo en cama sin ciática actividad tratamiento: uno
N=200 paracetamol
tableta dos veces al día
Duración del estudio:
14 dias
EE.UU
N=42 fuera
extracción.
en un formato que no
Suecia
pudo ser
metaanalizado.
regimiento de ejercicio
EE.UU
Se proporcionaron datos
en un formato que no
pudo ser
metaanalizado.
N=24 fijado
Duración del estudio: 5
semanas
EE.UU
Poco Ejercicio sin supervisión más Lumbalgia Dolor (von Korff) Concurrente
2008A291(Ehrli atención habitual sin ciática Función tratamiento: no
cap 2009122, Atención habitual (no se N=579 (RMDQ) fijado
Hollinghurst informan detalles) Duración del estudio: 3 Calidad de vida
2008210) Masaje semanas – 5 meses (SF-36)(a)
Técnica Alexander (6 Reino Unido
sesiones)
Técnica Alexander (24
sesiones)
extracción.
meses
EE.UU
meses
Noruega
intervención y
seguimiento no
fijado
Polonia
intervención (MODI))
Pavo
Hagen Educación; uno mismo- Lumbalgia Estudio cumple Concomitante
2000a176 administración; hogar con o sin toda inclusión tratamiento: no indicado
ejercicio ciática criterios para la
Atención habitual (atención primaria de salud; tuvo N=457 revisar, pero
al menos una visita al médico de cabecera para Inmediato no es
obtener licencia por enfermedad). reportar cualquier
Noruega
importante
resultados
lecciones utilización
Automanejo (prescripción de (atención primaria
especificados
8.3.4.12Intervenciones individuales
Bentsen 199736 Función (Subjetiva Puntuación media de cambio: - N=28 Puntuación media de cambio: - N=40 Muy alto
índice de discapacidad) ≤ 5,15 6,75
4 meses
Brandt 201546 Función (MODI, 0- Puntuación media de cambio: - N=6 Puntuación media de cambio: N=7 Muy alto
100) ≤ 4 meses 4,8 + 1.7
Folleto versus atención habitual
Cherkín 1996A71 Función (RMDQ, 0- Puntuación media de cambio: - N=100 Puntuación media de cambio: - N=93 Muy alto
24) ≤ 4 meses
161
5,4 5,3
Cherkín 1996A71 Función (RMDQ, 0- Puntuación media de cambio: - N=93 Puntuación media de cambio: - N=93 Muy alto
24) ≤ 4 meses 5,2 5,3
Shirado 2010425 Calidad de vida (dolor Cambiar puntuación N=103 Cambiar puntuación N=98 Alto
lumbar en Japón) (mediana; 25 y (mediana; 25 y
evaluación percentiles 75): - percentiles 75): -
cuestionario, 0-120) 0,58 (-0,78 a -0,33) 0,44 (-0,75 a -0,17)
≤ 4 meses
Shirado 2010425 Severidad del dolor (EVA, Cambiar puntuación N=103 Cambiar puntuación N=98 Alto
0-10) ≤ 4 meses (mediana; 25 y (mediana; 25 y
percentiles 75): - percentiles 75): -
0,44 (-0,73 a -0,15) 0,35 (-0,67 a -0,02),
0,332
Shirado 2010425 Función (RMDQ, 0- Cambiar puntuación N=103 Cambiar puntuación N=98 Muy alto
Autogestión
Dolor lumbar y ciática
grupo de intervención grupo de comparación
Centro Nacional de Directrices Clínicas, 2016
Estudiar Salir Resultados de la intervención (norte) Resultados de la comparación (norte) Riesgo de sesgo
8.3.4.21Intervenciones combinadas: física (taping) más autocuidado más ejercicio versus electroterapia más ejercicio
grupo de intervención grupo de comparación
Estudiar Salir Resultados de la intervención (norte) Resultados de la comparación (norte) Riesgo de sesgo
Adamczyk 20094 Dolor (EVA, 0-10) al Media: 0.3333 N=30 Media: 7.1333 N=30 Muy alto
final del tratamiento
(duración no indicada)
3Tabla 36: Programa de autocuidado versus atención habitual en lumbalgia con o sin ciática
162
Resultados Hacer un seguimiento (CALIFICACIÓN) IC) Riesgo con Control atención habitual (IC del 95 %)
Calidad de vida (resumen del 49 BAJOa La calidad de vida media (resumen del La calidad de vida media (resumen del
componente físico SF-36, 0-100) ≤ 4 (1 estudio) debido al riesgo de sesgo componente físico del SF-36, 0-100) ≤ componente físico del SF-36, 0-100) ≤ 4
meses 4 meses en los grupos de control fue meses en los grupos de intervención fue
27,24 superior
63.68 (16,41 a 38,07 mayor)
Calidad de vida (resumen del 49 MUY BAJOa, b La calidad de vida media (resumen del La calidad de vida media (resumen del
componente mental SF-36, 0-100) ≤ 4 (1 estudio) debido al riesgo de componente mental del SF-36, 0-100) ≤ 4 componente mental del SF-36, 0-100) ≤ 4
meses sesgo, imprecisión meses en los grupos de control fue de meses en los grupos de intervención fue
82,35 7,49 superior
(0,16 a 14,82 más alto)
Calidad de vida (dominio de energía SF-36, 80 BAJOa, b La calidad de vida media (dominio de La calidad de vida media (dominio de
0-100) > 4 meses (1 estudio) debido al riesgo de sesgo, energía SF-36, 0-100) > 4 meses en energía SF-36, 0-100) > 4 meses en el
Autogestión
Dolor lumbar y ciática
No de Relativo Efectos absolutos anticipados
Centro Nacional de Directrices Clínicas, 2016
participante mi
t Calidad de la efecto
(estudios) evidencia (95% Diferencia de riesgo con el autocuidado frente a la
Resultados Hacer un seguimiento (CALIFICACIÓN) IC) Riesgo con Control atención habitual (IC del 95 %)
Calidad de vida (dominio de 80 MODERADOa La calidad de vida media (dominio de La calidad de vida media (dominio de
bienestar SF-36, 0-100) > 4 meses (1 estudio) debido al riesgo de sesgo bienestar del SF-36, 0-100) > 4 meses en bienestar del SF-36, 0-100) > 4 meses en los
los grupos de control fue grupos de intervención fue
- 2.5 8.5 más alto
(0,35 a 16,65 más alto)
Calidad de vida (SF-36 dominio de 80 BAJOa, b La calidad de vida media (SF-36 La calidad de vida media (SF-36 dominio de
salud general, 0-100) > 4 meses (1 estudio) debido al riesgo de dominio de salud general, 0-100) > 4 salud general, 0-100) > 4 meses en los
sesgo, imprecisión meses en los grupos de control fue de grupos de intervención fue
3,2 4.4 inferior
163
Severidad del dolor (lumbalgia, EVA 0- 106 MUY BAJOC.A La intensidad media del dolor La severidad media del dolor (dolor
10) ≤ 4 meses (2 estudios) debido al riesgo de (lumbalgia, EVA 0-10) ≤ 4 meses en lumbar, EVA 0-10) ≤ 4 meses en el
sesgo, inconsistencia los grupos control fue grupos de intervención fue
1.54 0,16 más bajo
(0,81 inferior a 0,49 superior)
Severidad del dolor (dolor lumbar, von Korff 101 MODERADOa La intensidad media del dolor La severidad media del dolor (lumbalgia,
modificado 0-10) > 4 meses (1 estudio) debido al riesgo de sesgo (lumbalgia, EVA 0-10) > 4 meses en EVA 0-10) > 4 meses en el
los grupos control fue grupos de intervención fue
- 0,67 0,1 menor
(1,07 inferior a 0,87 superior)
Función (modificado von Korff, 0-100) 101 BAJOa, b La Función media (Von Korff modificado La Función media (Von Korff modificado
> 4 meses (1 estudio) debido al riesgo de 0-100) >4 meses en los grupos de 0-100) >4 meses en los grupos de
sesgo, imprecisión control fue intervención fue
- 4.2 8.0 inferior
(19,28 inferior a 3,28 superior)
Autogestión
Dolor lumbar y ciática
No de Relativo Efectos absolutos anticipados
Centro Nacional de Directrices Clínicas, 2016
participante mi
t Calidad de la efecto
(estudios) evidencia (95% Diferencia de riesgo con el autocuidado frente a la
Resultados Hacer un seguimiento (CALIFICACIÓN) IC) Riesgo con Control atención habitual (IC del 95 %)
meses (1 estudio) debido al riesgo de 1.09 59 por 1000 5 más por 1000
sesgo, imprecisión (0.51 (de 29 menos a 76 más)
a
2.29)
Función (RMDQ/ODI) ≤ 4 meses 106 MUY BAJOa, b, d La función media (RMDQ/ODI) ≤ 4 La función media (RMDQ/ODI) ≤ 4 meses
(2 estudios) debido al riesgo de meses en los grupos de control fue de en los grupos de intervención fue 0,02
sesgo, inconsistencia, 12,17 inferior
imprecisión (0,78 inferior a 0,73 superior)
Función (RMDQ, 0-24) > 4 meses. 421 BAJOa La función media (RMDQ) >4 meses La función media (RMDQ) >4 meses en los
(1 estudio) debido al riesgo de sesgo en los grupos de control fue grupos de intervención fue
- 1.51 1.26 más bajo
(2,18 a 0,34 menos)
164
participante mi
t Calidad de la efecto
(estudios) evidencia (95% Diferencia de riesgo con el autocuidado frente a la
Resultados Hacer un seguimiento (CALIFICACIÓN) IC) Riesgo con Control atención habitual (IC del 95 %)
> 4 meses (1 estudio) debido al riesgo de 0.54 42 por 1000 19 menos por 1000 (de 31
sesgo, imprecisión (0.26 menos a 5 más)
a
1.13)
Utilización de atención médica (visitas al médico 421 BAJOa La utilización media de atención médica La utilización media de atención médica (visitas
para la espalda) > 4 meses (1 estudio) debido al riesgo de sesgo (visitas al médico para la espalda) > 4 meses al médico para la espalda) > 4 meses en los
en los grupos de control fue grupos de intervención fue
- 0,65 0,89 inferior
(1,63 a 0,15 inferior)
Utilización de atención médica (visitas al 421 BAJOa La utilización media de atención médica La utilización media de atención médica (visitas al
quiropráctico para la espalda) > 4 meses (1 estudio) debido al riesgo de sesgo (visitas al quiropráctico para la espalda) > 4 quiropráctico para la espalda) > 4 meses en los
meses en los grupos de control fue grupos de intervención fue
165
Utilización de atención médica (visitas al 421 BAJOa La utilización media de atención médica La utilización media de atención médica (visitas
fisioterapeuta para la espalda) > 4 meses (1 estudio) debido al riesgo de sesgo (visitas al fisioterapeuta para la espalda) > 4 al fisioterapeuta para la espalda) > 4 meses en
meses en los grupos de control fue los grupos de intervención fue 0,68 menor
- 1.31
(2,16 inferior a 0,8 superior)
Utilización de asistencia sanitaria (días de hospital) 421 BAJOa La utilización media de atención médica La utilización media de atención médica
> 4 meses (1 estudio) debido al riesgo de sesgo (días de hospitalización) > 4 meses en los (días de hospitalización) > 4 meses en los
grupos de control fue grupos de intervención fue
0.04 0,24 inferior
(0,48 inferior a 0 superior)
a Disminución de 1 incremento si la mayoría de la evidencia presentaba un alto riesgo de sesgo, y disminución de 2 incrementos si la mayoría de la evidencia presentaba un riesgo de sesgo
muy alto
b Rebajado en 1 incremento si el intervalo de confianza cruzaba 1 MID o rebajado en 2 incrementos si el intervalo de confianza cruzaba ambos MID c Rebajado
en 1 o 2 incrementos debido a la heterogeneidad, I2=54 %, p=0,14, no explicado por el análisis de subgrupos d Rebajado en 2 incrementos debido a la
heterogeneidad, I2=74 %, p=0,05, no explicado por el análisis de subgrupos
1 Tabla 37: Programa de autocuidado versus simulacro en el dolor lumbar con o sin ciática
Autogestión
Dolor lumbar y ciática
Centro Nacional de Directrices Clínicas, 2016
Resultados Hacer un seguimiento (CALIFICACIÓN) IC) Riesgo con Control tratamiento simulado (IC del 95 %)
Severidad del dolor (EVA 0-10) ≤ 4 meses 131 BAJOa * La gravedad media del dolor (dolor lumbar
(1 estudio) debido al riesgo de 0-10) ≤ 4 meses en los grupos de
sesgo, imprecisión intervención fue
0,6 inferior
(1.2 inferior a 0 superior)
Severidad del dolor (EVA 0-10) >4 meses 131 BAJOa, b * La gravedad media del dolor (dolor lumbar
(1 estudio) debido al riesgo de 0-10) >4 meses en los grupos de
sesgo, imprecisión intervención fue
0,4 inferior
(1 inferior a 0,2 superior)
Función (RMDQ, 0-24) ≤ 4 meses 131 MODERADOa * La función media (RMDQ) ≤ 4 meses en los
166
Función (RMDQ, 0-24) >4 meses 131 MODERADOa * La función media (RMDQ) >4 meses en los
(1 estudio) debido al riesgo de sesgo grupos de intervención fue
0,6 inferior
(1,9 inferior a 0,7 superior)
a Disminución de 1 incremento si la mayoría de la evidencia presentaba un alto riesgo de sesgo, y disminución de 2 incrementos si la mayoría de la evidencia presentaba un riesgo de sesgo
muy alto
b Rebajado en 1 incremento si el IC del 95 % cruzaba 1 MID, y rebajado en 2 incrementos si el IC del 95 % cruzaba ambos MID
* No se proporcionan las tasas de eventos de control, solo la diferencia de medias informada por el estudio
2 Tabla 38: Programa de autocuidado versus reposo en cama en dolor lumbar con o sin ciática
Resultados No de Calidad de la relativo Efectos absolutos anticipados
ve
Autogestión
Dolor lumbar y ciática
participante evidencia
Centro Nacional de Directrices Clínicas, 2016
t (CALIFICACIÓN) efecto
(estudios) (95% Diferencia de riesgo con autocuidado versus
Hacer un seguimiento IC) Riesgo con Control reposo en cama (IC del 95 %)