Clase y Equivalencia

Niveles de evidencia para eficacia 
Niveles de evidencia para seguridad
Cumplimiento
Coste
Comentario
Equivalencia
¿Son los pacientes y variables de resultado similares al ensayo original?
¿Se aplicaron los regímenes de idéntica manera?
¿Hubo un análisis estadístico apropiado? 
¿Estaba predeterminado el intervalo de equivalencia?
¿Tamaño? 
Comentario
 

Clase (sustantivo); cualquier conjunto de personas o cosas agrupadas juntas o diferenciadas de otras. Una pregunta que cada vez se hace con mas frecuencia es si un conjunto de fármacos forman una clase, y si además  existe un “efecto de clase”. Efecto de clase se interpreta como presencia de  efectos terapéuticos y reacciones adversas similares, tanto en naturaleza como en extensión. Si dicho efecto de clase existe las decisiones se vuelven más fáciles: eliges el más barato. 
Los criterios para que un conjunto de fármacos puedan ser agrupados en la misma clase incluyen algunos de los siguientes:

  • Fármacos con estructura química similar
  • Fármacos con mecanismos de acción similares
  • Fármacos con efectos farmacológicos semejantes. 


Para  señalar un efecto de clase se requiere, no obstante, pensar un poco.  Cuánto hay que pensar y cómo,  es lo que considera uno de esas brillantes series del JAMA para usuarios de la literatura médica [1]. Nadie debe proclamar un efecto de clase y elegir el más barato sin antes referirse a las reglas de evidencia establecidas en ese artículo

Niveles de evidencia para eficacia

Los niveles se muestran en la Tabla 1. De entrada,  los niveles 3 y 4 nos señalan  terrenos poco consistentes. El  nivel 1 es lo que siempre nos gustaría tener  pero que nunca conseguimos, una gran comparación aleatorizada frente a frente. En el momento en que ya hay suficientes elementos como para constituir una clase resulta que  no hay casi ninguna organización interesada en patrocinar nuevos y costosos ensayos para comprobar si A  es verdaderamente mejor que B.

Tabla 1: Niveles de evidencia sobre eficacia para efecto de clase
 

Nivel
Comparación
Pacientes
Resultados
Criterios de validez
1
ECA con comparación directa
Idénticos
Clínicamente importantes
Aleatorización oculta 


Seguimiento completo 
Doble ciego
Rigurosa verificación del efecto 

2
ECA con comparación directa
Idénticos
Subrogados pero válidos
El Nivel 1 mas validez del resultado subrogado. 
2
Comparación indirecta con placebo en ECA
Similares o diferentes en gravedad de la enfermedad o riesgo
Clínicamente importantes o Subrogados pero válidos
El Nivel 1 mas:


Diferencias en la calidad metodológica 

Variables de resultado 
Cumplimiento
Riesgo basal

3
Análisis de subgrupo en comparación indirecta con placebo en ECA
Similares o diferentes en gravedad de la enfermedad o riesgo
Clínicamente importantes o Subrogados pero válidos
El Nivel 1 mas:


Comparaciones múltiples, datos extraídos a posteriori
Subgrupos sin poder estadístico
Sesgo de información en los subgrupos
 

3
Comparación indirecta con placebo en ECA
Similares o diferentes en gravedad de la enfermedad o riesgo
Subrogados pero no validados 
Los resultados subrogados puede que no capturen todo lo bueno o malo del efecto del tratamiento
4
Comparación indirecta entre grupos no aleatorios
Similares o diferentes en gravedad de la enfermedad o riesgo
Clínicamente importante
Sesgo de confusión por indicación, cumplimiento o time
 
Factores de confusión no medidos o desconocidos
Errores de medición

Datosmuy limitados o sistemas de información no apropiados para investigación

En la mayoría de las ocasiones nos encontramos con ensayos aleatorizados de A frente a placebo o tratamiento estándar  y B frente a placebo o tratamiento estándar. Esto sería el nivel 2 de evidencia basado en resultados de importancia clínica (una curación) o resultados subrogados validados (reducción del colesterol con una estatina). Por lo tanto para poder establecer un efecto de clase se  necesitará realizar una revisión sistemática o meta análisis de calidad de buenos ensayos clínicos. 

Lo que entendemos por calidad en general se observa en la Tabla 1, aunque habrá situaciones dependientes de las circunstancias. Una de las cosas que faltan en la Tabla 1 es el tamaño. Probablemente, debería incluirse la existencia de una estimación previa de cuántos pacientes o eventos son razonablemente  necesarios para el análisis


Niveles de evidencia para seguridad

Se muestran en la Tabla 2. Siempre va a haber  problemas con las reacciones adversas raras pero graves. La regla inversa del tres nos dice que si no hemos visto reacciones adversas graves en 1.500 pacientes, entonces podemos tener un 95 por ciento de seguridad de que no aparecerán con una frecuencia mayor de 1 en 500. 

Tabla 2: Niveles de evidencia sobre seguridad en efecto de clase
 

Nivel
Tipo de estudio
Ventajas 
Criterios de validez
1
ECA
Solo diseños que permiten la detección del efecto adverso cuando el efecto adverso es similar al evento que el tratamiento trata de evitar.
Poder insuficiente para detectar efectos adversos a no ser que el diseño sea especifico para su detección.
2
Cohorte
Recogida prospectiva de datos , cohorte definida
Depende críticamente de la exactitud en el seguimiento clasificación y medición.
3
Caso-control
Barato y generalmente rápido de hacer
Los sesgos de selección y recuerdo pueden dar problemas, las relaciones temporales pueden no estar claras
4
Estudios fase 4
Pueden detectar eventos raros y graves si son lo suficientemente extensos 
Ausencia de grupo control o control no emparejado


Depende críticamente de la exactitud en el seguimiento clasificación y medición.

5
Series de casos
Baratos y generalmente rápidos 
Generalmente pequeño tamaño muestral, el sesgo de selección puede ser un problema, ausencia de grupo control
6
A propósito de un / unos casos
Depende críticamente de la exactitud en el seguimiento clasificación y medición.
Generalmente pequeño tamaño muestral, el sesgo de selección puede ser un problema, ausencia de grupo control

Los ensayos aleatorizados de eficacia en general tienen escaso poder para detectar la tasa de reacciones adversas graves, y por lo tanto deberemos utilizar otro tipo de diseños. En la práctica la dificultad estriba en que tan pronto como los nuevos tratamientos se ponen en marcha  empiezan a escasear las oportunidades y datos para realizar    estos otros tipos de estudio. En muy raras ocasiones se ponen en marcha ensayos clínicos con poder suficiente para detectar reacciones adversas raras. 

La mayoría de los tratamientos se introducen después de haber sido comprobados  en ensayos clínicos con unos  pocos miles de pacientes. Se necesita precaución en los tratamientos para las enfermedades crónicas, donde los ensayos clínicos son de una duración corta y pueden coexistir otras enfermedades y tratamientos.


Cumplimiento terapéutico

Este es un asunto especialmente difícil y del que hay una información fragmentada. Sabemos que la adherencia terapéutica suele ser alta en los ensayos clínicos y menor en la práctica clínica. Pautas de tratamiento que contemplen la mejora del cumplimiento (una vez al día) pueden ser importantes.


Coste 
Los estudios económicos son bestias complejas y necesitamos tratar este tipo de información con cuidado. El hecho de  asumir una efecto de clase, en general, se utiliza para justificar la elección del medicamento mas barato en términos de adquisición (prescripción). La idea de conseguir lo mismo minimizando los costes es fenomenal. Sin embargo, esto no suele ser así y la economía de la salud en el terreno del efecto de clase debe ser contemplada con mucho cuidado.


Comentario

Este artículo utiliza estatinas como ejemplo y se contempla la toma de  decisiones  de un clínico o político sanitario al elegir entre usar estatinas más viejas y caras frente a nuevas más baratas. Con mucho tacto uno elige la estatina más barata pero con menos información y el otro la más vieja y más cara pero con la experiencia  de haber sido ya utilizada en una masa enorme de pacientes.  ¿Puede adivinar lo que elige cada uno?. 

Bandolera 47 examinó la evidencia de algunas estatinas viejas con más de 27.000 personas/año de experiencia en pacientes y concluye que el peso de la evidencia debe ser tan importante como el precio de adquisición. Haber tenido este artículo en la mano en su momento hubiera sido de una gran ayuda.


Equivalencia 

McAlister y Sackett extienden sus ideas del efecto de clase al caso particular de los ensayos clínicos de equivalencia y aportan algunas guías útiles sobre cuáles son  las características de los ensayos de equivalencia más  importantes  para determinar su validez (2). El problema intelectual con los ensayos de equivalencia (A versus B) es que el mismo resultado es consistente con tres conclusiones: 

  1. Tanto A como B son igualmente efectivos. 
  2. Tanto A como B son igualmente inefectivos.
  3. Ensayo inadecuado para detectar diferencias entre A y B. 
Para combatir los problemas planteados por las dos últimas conclusiones McAlister y Sackett sugieren algunos criterios añadidos a aquellos utilizados para los ensayos clínicos de superioridad (A y/o B versus placebo). Los criterios se muestran en la Tabla 3. 

Tabla 3: Calidad de la evidencia para ensayos de superioridad y de equivalencia con control activo.
 

Ensayos de superioridad
Ensayos de equivalencia activo-control
Asignación aleatoria
 Asignación aleatoria
Aleatorización oculta 
Aleatorización oculta
Se tuvieron en cuenta todos los pacientes aleatorizados
Se tuvieron en cuenta todos los pacientes aleatorizados
Analisis por Intención de tratar 
Analisis por Intención de tratar y Analisis por tratamiento
Medicos y pacientes ciegos con respecto al tto recibido
Medicos y pacientes ciegos con respecto al tto recibido
Los grupos reciben igual tratamiento 
Los grupos reciben igual tratamiento 
Grupos indenticos al principio Grupos indenticos al principio
Resultados clinicamente importantes Resultados clinicamente importantes
El control activo ha demostrado previamente ser eficaz
Pacientes y resultados similares a los ensayos donde previamente se demostraba la eficacia
Ambos regimes aplicados de una manera optima y similar
Prueba apropiada de la hipotesis nula
Pre-especificar el margen de equivalencia
Ensayo con muestra suficiente Ensayo con muestra suficiente

¿Había mostrado previamente el control ser eficaz?

Documentado idealmente en una revisión sistemática de ensayos clínicos controlados con placebo. Los ensayos deben mostrar que los  beneficios del fármaco activo están por encima de un efecto clínicamente importante. Sin esta información ambos pueden ser igualmente ineficaces.

¿Son los pacientes y variables de resultado similares a los de los ensayos originales?
Esto es obvio. Si no lo son, entonces cualquier conclusión sobre equivalencia esta condenada al fracaso. Por lo tanto mucha atención a aquellos ensayos diseñados para mostrar equivalencia y que se pretenden usar para demostrar diferencias en daño o toxicidad, circunstancias para las que no fueron diseñados.

¿Se aplicaron los regímenes de igual manera?

El ejemplo más común es aquel que elige la mejor dosis de A frente a una dosis ineficaz de B (no es necesario dar nombres) son muchos los ejemplos especialmente ensayos patrocinados por la industria farmacéutica que dicen eso de “nuestro fármaco es mejor que el vuestro”. Ahora bien, debe darse un OK si las dosis elegidas son las autorizadas. 

Otras pegas que hay que buscar son una pobre cumplimentación o cambios frecuentes en el tratamiento, seguimiento incompleto, uso desproporcionado de intervenciones paralelas y ausencia de enmascaramiento.

¿Era el análisis estadístico apropiado?

Los ensayos clínicos de equivalencia son diseñados para descartar diferencias importantes entre dos tratamientos. A menudo se utilizan pruebas estadísticas de diferencias de una sola cola. La ausencia de significación en la superioridad no es necesariamente lo mismo que definir un nivel apropiado de equivalencia y verificarle. 

El análisis por intención de tratar confiere el riesgo de realizar una conclusión falsa negativa de que los tratamientos tienen la misma eficacia, cuando no la tienen. En los ensayos de equivalencia el enfoque  más conservador  puede ser  comparar pacientes segun el tratamiento que recibieron realmente. Probablemente ambos tipos análisis deberían  mostrarse. 

¿Se había predefinido el margen de equivalencia? ¿Qué diferencia es necesaria para que algo sea diferente?.

 Los ensayos de equivalencia deben tener una definición previa de lo diferente que debe ser una diferencia y justificarlo. Pero hay mucho mas, tienen que convencerte de que la ausencia de dicha diferencia significa que los tratamientos de hecho sean equivalentes.

¿Y el tamaño?

La mayoría de los ensayos de equivalencia no tienen poder suficiente para detectar incluso un 50 por ciento de diferencia entre tratamientos. Una revisión (3) en 1994 encontró que el 84% eran  demasiado pequeños para detectar una diferencia del 25%, el tamaño lo es todo cuando queremos mostrar que no hay diferencia y cuanto más pequeña sea la diferencia importante más grande tiene que ser el ensayo clínico.


Comentario

McAlister y Sackett aplican sus criterios metodológicos a cuatro grandes ensayos sobre hipertensión. Todos tienen defectos y ninguno detectaría una diferencia del 10% entre tratamientos. Los lectores de ensayos  de equivalencia deben estar muy atentos. Designar un efecto de clase a un grupo de fármacos y juzgarles como equivalentes sobre evidencia inadecuada es algo que la mayoría de nosotros hacemos de vez en cuando, en un momento u otro. 

Dado que prescribir costes a menudo acarrea decisiones del tipo “lo mas barato es lo mejor” es preferible pararse a pensar.  Muchas de las veces tomaremos decisiones incorrectas pero afortunadamente no tendremos información suficiente para saber que son erróneas. Este es un territorio importante y resbaladizo que necesita más trabajo. 

Bibliografía:
 

  1. FA McAlister et al. Users' guides to the medical literature XIX Applying clinical trial results B. Guidelines for determining whether a drug is exerting (more than) a class effect. JAMA 1999 282: 1371-1377. 
  2. FA McAlister & DL Sackett. Active-control equivalence trials and antihypertensive agents. American Journal of Medicine 2001 111: 553-558. 
  3. D Moher et al. Statistical power, sample size, and their reporting in randomized controlled trials. JAMA1994 272: 122-124. 
Traducido por Agustín Gómez de la Cámara y Rafael Bravo Toledo. Madrid
url original http://www.jr2.ox.ac.uk/bandolier/band95/b95-3.html 

artículo previo o siguiente en este número