Clase y Equivalencia |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Niveles
de evidencia para eficacia
Niveles de evidencia para seguridad Cumplimiento Coste Comentario Equivalencia ¿Son los pacientes y variables de resultado similares al ensayo original? ¿Se aplicaron los regímenes de idéntica manera? ¿Hubo un análisis estadístico apropiado? ¿Estaba predeterminado el intervalo de equivalencia? ¿Tamaño? Comentario Clase (sustantivo); cualquier conjunto
de personas o cosas agrupadas juntas o diferenciadas de otras. Una pregunta
que cada vez se hace con mas frecuencia es si un conjunto de fármacos
forman una clase, y si además existe un “efecto de clase”.
Efecto de clase se interpreta como presencia de efectos terapéuticos
y reacciones adversas similares, tanto en naturaleza como en extensión.
Si dicho efecto de clase existe las decisiones se vuelven más fáciles:
eliges el más barato.
Los niveles se muestran en la Tabla 1. De entrada, los niveles 3 y 4 nos señalan terrenos poco consistentes. El nivel 1 es lo que siempre nos gustaría tener pero que nunca conseguimos, una gran comparación aleatorizada frente a frente. En el momento en que ya hay suficientes elementos como para constituir una clase resulta que no hay casi ninguna organización interesada en patrocinar nuevos y costosos ensayos para comprobar si A es verdaderamente mejor que B. Tabla
1: Niveles de evidencia sobre eficacia para efecto de clase
En la mayoría de las ocasiones nos encontramos con ensayos aleatorizados de A frente a placebo o tratamiento estándar y B frente a placebo o tratamiento estándar. Esto sería el nivel 2 de evidencia basado en resultados de importancia clínica (una curación) o resultados subrogados validados (reducción del colesterol con una estatina). Por lo tanto para poder establecer un efecto de clase se necesitará realizar una revisión sistemática o meta análisis de calidad de buenos ensayos clínicos. Lo que entendemos por calidad en general se observa en la Tabla 1, aunque habrá situaciones dependientes de las circunstancias. Una de las cosas que faltan en la Tabla 1 es el tamaño. Probablemente, debería incluirse la existencia de una estimación previa de cuántos pacientes o eventos son razonablemente necesarios para el análisis
Se muestran en la Tabla 2. Siempre va a haber problemas con las reacciones adversas raras pero graves. La regla inversa del tres nos dice que si no hemos visto reacciones adversas graves en 1.500 pacientes, entonces podemos tener un 95 por ciento de seguridad de que no aparecerán con una frecuencia mayor de 1 en 500. Tabla
2: Niveles de evidencia sobre seguridad en efecto de clase
Los ensayos aleatorizados de eficacia en general tienen escaso poder para detectar la tasa de reacciones adversas graves, y por lo tanto deberemos utilizar otro tipo de diseños. En la práctica la dificultad estriba en que tan pronto como los nuevos tratamientos se ponen en marcha empiezan a escasear las oportunidades y datos para realizar estos otros tipos de estudio. En muy raras ocasiones se ponen en marcha ensayos clínicos con poder suficiente para detectar reacciones adversas raras. La mayoría de los tratamientos se introducen después de haber sido comprobados en ensayos clínicos con unos pocos miles de pacientes. Se necesita precaución en los tratamientos para las enfermedades crónicas, donde los ensayos clínicos son de una duración corta y pueden coexistir otras enfermedades y tratamientos. Este es un asunto especialmente difícil y del que hay una información fragmentada. Sabemos que la adherencia terapéutica suele ser alta en los ensayos clínicos y menor en la práctica clínica. Pautas de tratamiento que contemplen la mejora del cumplimiento (una vez al día) pueden ser importantes.
Este artículo utiliza estatinas como ejemplo y se contempla la toma de decisiones de un clínico o político sanitario al elegir entre usar estatinas más viejas y caras frente a nuevas más baratas. Con mucho tacto uno elige la estatina más barata pero con menos información y el otro la más vieja y más cara pero con la experiencia de haber sido ya utilizada en una masa enorme de pacientes. ¿Puede adivinar lo que elige cada uno?. Bandolera 47 examinó la evidencia de algunas estatinas viejas con más de 27.000 personas/año de experiencia en pacientes y concluye que el peso de la evidencia debe ser tan importante como el precio de adquisición. Haber tenido este artículo en la mano en su momento hubiera sido de una gran ayuda. McAlister y Sackett extienden sus ideas del efecto de clase al caso particular de los ensayos clínicos de equivalencia y aportan algunas guías útiles sobre cuáles son las características de los ensayos de equivalencia más importantes para determinar su validez (2). El problema intelectual con los ensayos de equivalencia (A versus B) es que el mismo resultado es consistente con tres conclusiones:
Tabla
3: Calidad de la evidencia para ensayos de superioridad y de equivalencia
con control activo.
¿Había mostrado previamente el control ser eficaz? Documentado idealmente en una revisión sistemática de ensayos clínicos controlados con placebo. Los ensayos deben mostrar que los beneficios del fármaco activo están por encima de un efecto clínicamente importante. Sin esta información ambos pueden ser igualmente ineficaces. ¿Son los pacientes y variables
de resultado similares a los de los ensayos originales?.
¿Se aplicaron los regímenes de igual manera? El ejemplo más común es aquel que elige la mejor dosis de A frente a una dosis ineficaz de B (no es necesario dar nombres) son muchos los ejemplos especialmente ensayos patrocinados por la industria farmacéutica que dicen eso de “nuestro fármaco es mejor que el vuestro”. Ahora bien, debe darse un OK si las dosis elegidas son las autorizadas. Otras pegas que hay que buscar son una pobre cumplimentación o cambios frecuentes en el tratamiento, seguimiento incompleto, uso desproporcionado de intervenciones paralelas y ausencia de enmascaramiento. ¿Era el análisis estadístico apropiado? Los ensayos clínicos de equivalencia son diseñados para descartar diferencias importantes entre dos tratamientos. A menudo se utilizan pruebas estadísticas de diferencias de una sola cola. La ausencia de significación en la superioridad no es necesariamente lo mismo que definir un nivel apropiado de equivalencia y verificarle. El análisis por intención de tratar confiere el riesgo de realizar una conclusión falsa negativa de que los tratamientos tienen la misma eficacia, cuando no la tienen. En los ensayos de equivalencia el enfoque más conservador puede ser comparar pacientes segun el tratamiento que recibieron realmente. Probablemente ambos tipos análisis deberían mostrarse. ¿Se había predefinido el margen de equivalencia? ¿Qué diferencia es necesaria para que algo sea diferente?. Los ensayos de equivalencia deben tener una definición previa de lo diferente que debe ser una diferencia y justificarlo. Pero hay mucho mas, tienen que convencerte de que la ausencia de dicha diferencia significa que los tratamientos de hecho sean equivalentes. ¿Y el tamaño? La mayoría de los ensayos de equivalencia no tienen poder suficiente para detectar incluso un 50 por ciento de diferencia entre tratamientos. Una revisión (3) en 1994 encontró que el 84% eran demasiado pequeños para detectar una diferencia del 25%, el tamaño lo es todo cuando queremos mostrar que no hay diferencia y cuanto más pequeña sea la diferencia importante más grande tiene que ser el ensayo clínico. McAlister y Sackett aplican sus criterios metodológicos a cuatro grandes ensayos sobre hipertensión. Todos tienen defectos y ninguno detectaría una diferencia del 10% entre tratamientos. Los lectores de ensayos de equivalencia deben estar muy atentos. Designar un efecto de clase a un grupo de fármacos y juzgarles como equivalentes sobre evidencia inadecuada es algo que la mayoría de nosotros hacemos de vez en cuando, en un momento u otro. Dado que prescribir costes a menudo acarrea decisiones del tipo “lo mas barato es lo mejor” es preferible pararse a pensar. Muchas de las veces tomaremos decisiones incorrectas pero afortunadamente no tendremos información suficiente para saber que son erróneas. Este es un territorio importante y resbaladizo que necesita más trabajo. Bibliografía:
url original http://www.jr2.ox.ac.uk/bandolier/band95/b95-3.html |