Os ensaios clínicos de não inferioridade são muito comuns na área médica, mas será que sabemos interpretá-los com segurança? O quão confiantes estamos para diferenciá-los dos estudos de superioridade? Como podemos aplicar os resultados encontrados na nossa rotina?
Estudos de não inferioridade vs. estudos de superioridade
Os ensaios clínicos randomizados (RCTs) são os de mais alta evidência científica e, em geral, são os que utilizamos para basear nossa conduta. Em um artigo anterior aqui no nosso Portal, trouxemos um guia detalhado de como interpretar os dados de um estudo clínico, considerando o poder estatístico, os dados relatados e todos os vieses (aqui).
Mas quando falamos de uma intervenção ou exposição, podemos citar dois modelos dentro dos RCTs: os que avaliam a superioridade da intervenção, e os que avaliam a não inferioridade.
Estudos clínicos que buscam avaliar a não inferioridade são desenvolvidos para determinar se um novo tratamento pode ser, no máximo, marginalmente menos eficaz do que o tratamento padrão. Em geral, são estudos de extensão dos de superioridade, pois buscam a bioequivalência de uma nova formulação a um medicamento estabelecido.
É mais difícil avaliar estudos de não inferioridade
Uma análise completa de um estudo convencional requer a comparação de dois grupos: tratado e não tratado. Já o de não inferioridade requer a consideração de três resultados – um para cada população não tratada, a população que recebe o tratamento padrão e a população que recebe o tratamento experimental.
Ou seja, o novo tratamento precisa ser: (1) não inferior à referência e (2) superior à ausência de tratamento. Porém, a grande maioria dos estudos não utiliza o grupo não tratado dentro dos ensaios clínicos – o que torna a interpretação ainda mais complexa.
A ausência do grupo placebo é limitante?
Sabemos que para que um novo tratamento seja considerado aceitável é essencial que se mostre superior a ausência de tratamento. Nesse sentido, há uma dificuldade nos estudos de não inferioridade, pois a comparação é tratamento vs. tratamento.
Será que, caso os pacientes não tivesse sido tratados, o benefício seria o mesmo do novo tratamento proposto?
Essa análise precisa ser realizada, mesmo que indiretamente. O mais comum é o uso de metanálise comparativa para determinar a eficácia em comparação a um grupo não tratado. São realizadas comparações históricas, do tratamento convencional e de pacientes sem tratamento, com foco em pacientes com prognóstico semelhante ao do estudo em análise.
Porém, o mais importante são os objetivos e os achados do trabalho. Afinal, por que o estudo de não inferioridade foi proposto? Às vezes, o objetivo de comparar um novo tratamento com um tratamento padrão não é encontrar uma abordagem mais eficaz, mas encontrar uma terapia que tenha outras vantagens – como menor custo, menos efeitos adversos ou maior conveniência.
Outra questão importante é que estudos de não inferioridade utilizam análises “por protocolo” e de “intenção de tratar (ITT)”. Na primeira, são avaliados apenas os pacientes que, de fato, realizam corretamente o tratamento até o final do estudo. Já na ITT, todos os pacientes randomizados são incluídos.
Essa abordagem dupla, somada ao grande número amostral incluído nesse tipo de estudo, permite a confirmação da eficácia entre os dois tratamentos de forma mais linear.
Em qual ponto é necessário cautela nas interpretações?
A não inferioridade permite avaliar SE o novo tratamento proposto “não é pior” em comparação ao padrão, e não QUANTO um tratamento é pior em comparação ao outro. Em alguns casos, essa interpretação pode ser duvidosa.
O primeiro ponto necessário é avaliar a margem de não inferioridade determinada no trabalho. O medicamento será considerado não inferior se, a depender da intervenção proposta, atingir essa margem.
Por exemplo: um grupo propõe avaliar a eficácia de dois medicamentos utilizados para o tratamento do câncer. Sabe-se que o medicamento referência reduz o risco de recorrência em 5 anos em cerca de 7%. Logo, a margem de não inferioridade deve ser próxima desse valor. No ensaio, os dois medicamentos devem alcançá-la, a fim de validar o experimento.
Seguindo o exemplo, dois medicamentos avaliados: A e B. O tratamento A reduz o risco de recorrência da doença em 5 anos em 7% (IC95% -4 – 18). O tratamento B, avaliado no ensaio clínico, mostrou resultado de -3% (IC95% -15 – 9). Nesse trabalho específico, a margem de inferioridade foi determinada como 5%.
Como interpretar?
Segundo o IC95%, o tratamento A pode aumentar o risco de recorrência em até 4%, o que alcança o tratamento B. O tratamento B pode ser até 9% melhor na redução de risco, o que ultrapassa o potencial do tratamento A.
Os valores absolutos são diferentes, mas o IC95% mostra que provavelmente não houve diferença estatística entre os grupos na análise de não inferioridade. Ainda, ambos alcançaram a margem previamente determinada. Isso significa que os medicamentos são potencialmente equivalentes?
Não! Segundo as diretrizes da European Medicines Agency (EMA) e da Food and Drug Administration (FDA), todo o intervalo de confiança deve estar dentro da região determinada de não inferioridade. Nesse exemplo, o medicamento B (no pior cenário) pode aumentar o risco de recorrência em até 15%, e isso é maior do que o menor valor para o medicamento A.
Não ser diferente é o mesmo que ser equivalente?
Outro exemplo é de um trabalho que avaliou o uso de radioterapia intraoperatória em câncer de mama localizado. O grupo buscou uma margem de não inferioridade de 2,5% na recorrência local em 5 anos, comparando o novo tratamento com a radioterapia convencional.
De fato, ambas as drogas atingiram a margem, e o intervalo de confiança dos dados mostra a não inferioridade. Mas o novo tratamento, de forma absoluta, resultou um maior número de eventos de recorrência em 5 anos (2,11% comparado a 0,95%).
A conclusão do artigo é de que não houve inferioridade e os tratamentos apresentaram “eficácia comparável a longo prazo no controle do câncer e menor mortalidade.” Ainda, os autores destacam que o “uso da alternativa deve ser discutido com pacientes elegíveis quando a cirurgia conservadora da mama for planejada”.
De fato, não houve diferença estatística, mas esse exemplo mostra que é necessário muita cautela ao avaliar apenas os resultados apresentados e não cuidar com a discussão e particularidades de cada caso.
E aqui, ainda cabe a discussão da ausência de evidência de diferença estatística. O fato de os tratamentos não serem estatisticamente diferentes implica diretamente na equivalência?
Então continuamos com o tratamento referência, sem questionamentos?
Como mencionamos, mesmo que o novo tratamento proposto não seja tão eficaz quanto o padrão, se tiver outros benefícios, como menos efeitos colaterais, menor custo ou facilidade de entrega, isso pode ser aceitável. Veja, um tratamento um pouco menos eficaz que a referência, mas que oferece 70% menos efeitos adversos, não é mais interessante?
Também é importante subdividir os grupos de acordo com o prognóstico – um tratamento que se mostre superior em um grupo pode não ser igualmente eficaz em outro. Com base nisso, o novo tratamento pode ser considerado não inferior para pacientes de bom prognóstico, mas inferior para pacientes de prognóstico ruim.
—
Referências:
Cuzick, J., Sasieni, P. Interpreting the results of noninferiority trials—a review. Br J Cancer 127, 1755–1759 (2022). https://doi.org/10.1038/s41416-022-01937-w
Kaji AH, Lewis RJ. Noninferiority Trials: Is a New Treatment Almost as Effective as Another? JAMA. 2015;313(23):2371–2372. doi:10.1001/jama.2015.6645
Tripepi G, Chesnaye NC, Dekker FW, Zoccali C, Jager KJ. Intention to treat and per protocol analysis in clinical trials. Nephrology (Carlton). 2020 Jul;25(7):513-517. doi: 10.1111/nep.13709.
Vaidya JS, Bulsara M, Baum M, et al. Long term survival and local control outcomes from single dose targeted intraoperative radiotherapy during lumpectomy (TARGIT-IORT) for early breast cancer: TARGIT-A randomised clinical trial. BMJ. 2020 Aug 19;370:m2836. doi: 10.1136/bmj.m2836.