La angiotensina II (ATII) ha sido aprobada para el shock distributivo en España (2023). El objetivo es valorar la experiencia de la ATII comparando: un metanálisis (MTA) y 4 herramientas de inteligencia artificial (IA).
DiseñoSe buscó en Pubmed®, Central®, Embase® y Scopus®. Se incluyeron ensayos clínicos aleatorizados, no aleatorios y estudios observacionales. El resultado principal fue la mortalidad por cualquier causa. Se agruparon las odds ratio (OR) con intervalos de confianza (IC) del 95%. Se usaron 4 herramientas de IA: Consensus, Perplexity, Elicit y Scite.
Ámbitomedicina intensiva. Validación de herramientas de IA.
Pacientes o participantesMil seiscientos treinta y seis estudios, incluyendo en el MTA 10 estudios.
IntervencionesNo realizadas.
Variables de interés principalesMortalidad, eficacia y seguridad.
ResultadosLa ATII presenta una tendencia a disminuir la mortalidad respecto al control, OR: 0,86 (IC del 95%: 0,60-1,23); en subgrupos de pacientes esta disminución resulta significativa: niveles de renina alta, OR: 0,45 (IC del 95%: 0,22-0,93); shock con reemplazo renal, OR: 0,38 (IC del 95%: 0,17-0,84). La ATII es muy efectiva aumentando la presión arterial media, OR: 3,25 (IC del 95%: 2,24-4,73), sin incrementar eventos, OR: 0,77 (IC del 95%: 0,51-1,14). La IA llega a las mismas conclusiones, pero solo el 25-30% de los estudios fueron incluidos en el MTA.
ConclusionesLa ATII aumenta la tensión de forma efectiva, sin efectos secundarios y sin modificar la mortalidad. La IA puede ayudar a la evidencia clínica.
Angiotensin II (ATII) was approved for distributive shock in Spain (2023). The objective is to assess the experience with ATII by comparing a meta-analysis (MTA) and 4 Artificial Intelligence (AI) tools.
DesignA search was conducted in Pubmed®, Central®, Embase®, and Scopus®. Randomized clinical trials, non-randomized trials, and observational studies were included. The primary outcome was all-cause mortality. Odds ratios (OR) with 95% confidence intervals (CI) were pooled. Four AI tools were used: Consensus, Perplexity, Elicit, and Scite.
SettingIntensive care medicine.
Patients or participantsOne thousand six hundred and thirty-six studies were identified, with 10 studies included in the MTA.
InterventionsNo interventions.
Main variables of interestMortality, efficacy, and safety.
ResultsATII shows a trend towards mortality reduction when compared with controls, OR: 0.86 (95% CI: 0.60-1.23); this reduction reaches significance in patient subgroups: High Renin Levels, OR: 0.45 (95% CI: 0.22-0.93); shock with renal replacement therapy, OR: 0.38 (95% CI: 0.17-0.84). ATII is very effective in increasing mean arterial pressure, OR: 3.25 (95% CI: 2.24-4.73), without increasing events, OR: 0.77 (95% CI: 0.51-1.14). The AI reached the same conclusions, but only 25-30% of the studies were included in the MTA.
ConclusionsATII effectively increases blood pressure without side effects and without altering mortality. AI can assist in evaluating clinical evidence.
La angiotensina II (ATII) es un octapéptido natural, hormona del sistema renina-angiotensina-aldosterona (SRAA) y vasoconstrictor potente. Desde 19411, la ATII ha sido administrada en múltiples estudios: estudios de resistencia vascular e hipertensión2,3, preeclampsia4,5, cáncer 6 y cardiopatías congénitas7.
Un ensayo reciente de la ATII para el tratamiento del shock, así como análisis retrospectivos, han despertado interés en el uso de la ATII en el tratamiento del shock. Así, la ATII ha sido aprobada para el tratamiento del shock distributivo en EE. UU., Europa y España. Este interés nos lleva a pensar que grado de experiencia clínica existe y plantear formas de responder rápidamente a las dudas que planteamos.
En las últimas décadas, las revisiones sistemáticas y los metaanálisis (MTA) son ampliamente aceptadas como la forma estandarizada y menos sesgada de sopesar la evidencia. Sin embargo, en su proceso, los científicos pueden: incluir o excluir ciertos tipos de estudios, limitar el tiempo, incluir únicamente publicaciones en inglés o artículos revisados por pares, y aplicar criterios de calidad de los estudios flexibles.
Las actuales herramientas de inteligencia artificial (IA) para la investigación son motores de búsqueda que utilizan modelos de lenguaje natural para mostrar artículos y sintetizarlos. Ejecutan una búsqueda vectorial y podrían ser una herramienta rápida y objetiva de análisis de la evidencia.
ObjetivosEl objetivo principal es comparar 2 métodos alternativos para valorar los resultados clínicos de la ATII en el shock séptico distributivo: un MTA, llevado a cabo íntegramente por los autores, y herramientas de IA específicas de investigación.
Para valorar ello se pretende dar respuesta a las siguientes preguntas:
- •
Q1 ¿Tiene impacto sobre la mortalidad el tratamiento con ATII en los pacientes con shock?
- •
Q2 ¿Es la angiotensina efectiva en el tratamiento del shock?
- •
Q3 ¿Es la angiotensina segura en el shock?
Como objetivos secundarios establecemos estos mismos: analizar la eficacia de la ATII, valorar el perfil de seguridad y explorar el impacto sobre la mortalidad de la ATII en los pacientes con shock.
Pacientes y métodosLa metodología del estudio del estudio se resume en la figura 2.
MetaanálisisEl MTA desarrollado está de acuerdo con las recomendaciones Preferred Reporting Items for Systematic reviews and Meta-Analyses (PRISMA)8. Utilizamos el marco PICO con el fin de definir la pregunta clínica.
Estrategia de búsqueda y criterios de selecciónCuatro autores han buscado de forma independiente en las bases de datos de: PubMed® (I.O.E.), Embase® (L.S.M.), Scopus® (S.A.J.) y Central® (R.L.A.) hasta el 30 de abril de 2024. Se ha realizado una búsqueda avanzada en la base de datos hasta abril de 2024, utilizando los términos MeSH introducidos mediante la siguiente secuencia booleana:
- •
((angiotensin) AND ((sepsis) OR (shock)) AND ((effective) OR (safety) OR (mortality)))
Se ha establecido un filtro en la propia base de datos y para este MTA fueron incluidos ensayos clínicos randomizados (RCT), no randomizados (non RCT) y estudios observacionales (OE). Por otra parte, se ha adoptado otra estrategia adicional de búsqueda de estudios, analizando las referencias bibliográficas contenidas en las guías clínicas relevantes y en otras revisiones sistemáticas.
Los criterios de exclusión han sido los siguientes: publicaciones duplicadas, informes de casos, cartas, comentarios, revisiones, estudios de casos sin controles y estudios de cohortes o estudios en animales.
Extracción de datos y medidas de resultadosSe ha diseñado un formulario de extracción de datos estándar en el que se recogió: el primer autor, la referencia bibliográfica, el tipo de estudio, el número total y características de los pacientes incluidos (subgrupos), los regímenes terapéuticos utilizados, la duración del seguimiento y los principales resultados de los ensayos elegidos, tanto globales como en subgrupos.
Los datos extraídos se exponen en la tabla 1 (material electrónico suplementario).
- •
Mortalidad. Durante el proceso de selección de la literatura, se han detectado 4 mortalidades en diferentes momentos (UCI, 28 y 30 días y hospitalaria).
La mortalidad a los 30 días y hospitalaria se consideraron equivalentes a la mortalidad a los 28 días. El criterio de valoración principal elegido ha sido la mortalidad a los 28 días.
- •
Eficacia. El principal parámetro de eficacia analizado en los estudios ha sido la presión arterial media (MAP), en la mayoría de los estudios como la consecución de un objetivo de MAP en un tiempo, en otros de forma cuantitativa y en alguno por la dosis de norepinefrina (NE) necesaria para mantenerla. Otros parámetros hemodinámicos han sido: índice cardíaco (CI), índice de resistencia vascular pulmonar (PVRI), índice de resistencia vascular sistémica (SVRI). Otros parámetros de eficacia han sido: cambios de SOFA, pico de creatinina plasmática. El criterio de valoración elegido ha sido la MAP como variable cualitativa.
- •
Seguridad. Unos estudios valoran la seguridad según diferentes clasificaciones de efectos adversos (EA): código MDRA, código TEAE; y otros como la aparición de un efecto concreto (fracaso renal). El criterio de valoración elegido es los EA de cada estudio.
El sesgo y calidad de los trabajos elegibles ha sido evaluado de conformidad con el Manual Cochrane para revisiones sistémicas de intervenciones.
El sesgo de publicación se ha evaluado mediante gráficos de embudo en función del efecto de cada ensayo contra el error estándar. Además, para evaluar la calidad de los resultados de la pregunta primaria, se ha utilizado el Grading of Recommendation Assessment, Development, and Evaluation (GRADE), mediante el software GRADEprofiler© v3.6.1. La calidad de la evidencia se clasifica como alta, moderada, baja o muy baja, en base al diseño de los estudios incluidos, el riesgo de sesgo, la incoherencia y la imprecisión.
Análisis estadísticoEn el caso de variables categóricas/dicotómica se han calculado las odds ratio (OR) y se han combinado mediante el método Mantel-Haenszel (MH) con un intervalo de confianza (IC) del 95%. Para la combinación estadística de los resultados se ha usado el modelo de efectos fijos (fixed-effect).
La heterogeneidad se ha analizado mediante una prueba de Chi-cuadrado y se ha cuantificado utilizando el estadístico I2 y su valor de p. Considerando como poca, moderada o alta heterogeneidad si el valor I2 era <25%, 25-75, >75%, respectivamente. Los análisis de subgrupos de población se han realizado sobre los resultados en función de las características y variables de los estudios elegidos.
Las diferencias estadísticamente significativas se han definido para un valor de p<0,05. Todas las estadísticas se han realizado mediante el programa informático RevMan© v. 5.3 (The Nordic Cochrane Centre, Copenhagen, Denmark).
Herramientas de inteligencia artificialLas herramientas de IA para la investigación se basan en unos algoritmos determinados Generative Pretrained Transformer (GPT), motores de búsqueda que utilizan modelos de procesamiento de lenguaje natural (NLP, por sus siglas en ingles) para mostrar artículos y sintetizar conocimientos de artículos de investigación académica.
Tres autores distintos han usado de forma independiente 4 herramientas de IA, introduciendo como las preguntas señaladas en los objetivos:
- •
Consensus (https://consensus.app) (I.I.V.). Su fuente de datos actual proviene de la base Semantic Scholar, que incluye más de 200 millones de artículos en todos los dominios de la ciencia.
- •
Perplexity AI (https://www.perplexity.ai) (I.I.V.). A diferencia de los motores de búsqueda tradicionales, Perplexity AI busca en Internet en tiempo real y recopila información de fuentes confiables, como artículos, sitios web y revistas.
- •
Scite (https://scite.ai) (M.M.G.). Las bibliotecas de código y la documentación se almacenan en SciTE.
- •
Elicit (https://elicit.com) (H.M.C.). Sus fuentes son Web of Science®, Scopus®, PubMed®, Google Scholar®, y bases de datos privadas.
Hasta el 30 de abril de 2024, se han recuperado 1.636 estudios. El cuadro del proceso de selección de estudios se muestra en la figura 1.
Los artículos elegidos para el análisis final han sido 8 RCT y 2 OE: Bennett SR et al.9 de 2001, Chawla LS et al.10 de 2014, Kanna A et al.11 de 2017, Tumlin JA et al.12 y Busse L et al.13 de 2018, Bellomo R et al.14 de 2020, Klijian A et al.15 de 2021, Wieruszewski PM et al.16 y los OE de Quan et al.17 de 2022 y el ARAMIS de See EJ et al.18 de 2023. Las características y los datos extraídos de los estudios incluidos se exponen en la tabla 1.
En los estudios elegidos la edad media es de 47,53 a 72,83 años. El porcentaje de mujeres participantes oscila entre 17,86 y 51,22%, y la puntuación media de APACHE II está entre 19,09 y 30,60. Las fuentes de infección son las vías respiratorias inferiores (43,1%), el abdomen (29,4%), las vías urinarias (7,8%), la piel o tejidos blandos (3,21%), la sangre (2,2%) y otras (18,4%).
Síntesis del resultado primario (Q1): mortalidadLa ATII (138 eventos, 269 pacientes) presenta una tendencia a disminuir la mortalidad con respecto al control (183 eventos, 339 pacientes) sin significación estadística, OR: 0,86 (IC del 95%: 0,60-1,23). La heterogeneidad de los estudios es moderada (I2: 52%) y deriva fundamentalmente del estudio de Quan et al.17, el cual determina también un sesgo de publicación en funnel plot (fig. 3, material suplementario e-2).
En determinados subgrupos de pacientes esta disminución de la mortalidad resulta significativa: pacientes en shock con niveles de renina alta antes del tratamiento, OR: 0,45 (IC del 95%: 0,22-0,93)14; o aquellos con terapias de reemplazo renal, OR: 0,38 (IC del 95%: 0,17-0,84)12, La heterogeneidad de los estudios es baja (I2: 3%) (fig. 3).
Síntesis de resultados secundarios (Q2 y Q3): eficacia y seguridadLa ATII es muy efectiva de forma global en términos de aumentar la presión arterial media, OR: 3,25 (IC del 95%: 2,24-4,73). En determinados subgrupos de pacientes esta eficacia resulta muy significativa: pacientes con vasoplejia tras cirugía cardiaca, OR: 85 (IC del 95%: 2,99-2417) (n=16) (15); o aquellos con dosis bajas de NE antes de iniciar el tratamiento con ATII, OR: 11,0 (IC del 95%: 4,41-27,42)16 (fig. 4). Todo ello, sin aumentar la incidencia de eventos adversos de forma significativa, OR: 0,77 (IC del 95%: 0,51-1,14) (fig. 5).
Riesgos de sesgo y evaluación de la calidadRespecto de la evaluación de los riesgos de sesgo, los estudios de Quan et al.17 y See et al.18 (OE), tienen un riesgo alto en todos los apartados. En los estudios post-hoc del ATHOS-3 (Tumlin et al.12, Busse et al.13, Bellomo et al.14, Klijian et al.15 y Wieruszewski et al.16) se adjudicó riesgo de sesgo alto por informe selectivo de resultados. La evaluación de la calidad de los estudios relativos a la mortalidad con el nivel de calidad fue muy baja (GRADE) (material suplementario e-3).
Resultados de la inteligencia artificialEn la tabla 2 se resumen las conclusiones y métricas a las que llegan las herramientas de IA utilizadas para cada una de las preguntas planteadas, y en la información suplementaria e-4 se añaden los puntos claves y el listado de todas las referencias biográficas proporcionadas por la IA. Como puede comprobarse, solo el 25-30% de los estudios que proporciona la IA, han sido incluidos en el MTA por los revisores humanos.
DiscusiónHasta donde sabemos, nuestro estudio podría ser el primer MTA específico para evaluar la ATII en el tratamiento de los pacientes adultos con shock y tampoco conocemos ningún artículo de cuidados intensivos publicado con uso de IA para la investigación, por ello que es necesario aclarar sus limitaciones.
La NE19,20 es el tratamiento de primera línea desde la primera Surviving Sepsis Campaign. Este agente adrenérgico provoca un aumento del estrés oxidativo y tiene efectos nocivos sobre la respuesta inflamatoria y el metabolismo energético. En este sentido, el concepto de «descatecolaminización» surgió por temor a la exposición a las catecolaminas, lo que resultó en una demanda de otros fármacos no adrenérgicos.
En el contexto de los objetivos secundarios, nuestro MTA puede concluir que la ATII aumenta la tensión de forma efectiva, sin efectos secundarios significativos, pero no modifica la mortalidad. Este análisis coincide con la recomendación actual de considerar la ATII en el shock séptico refractario, con muy baja calidad de la evidencia.
Integrando estos objetivos secundarios con el principal, esta misma conclusión puede sacarse de las herramientas de IA utilizadas, aunque las referencias analizadas por la IA no son exactamente las mismas que en el MTA. Estos modelos de IA generativa aprovechan técnicas de aprendizaje profundo para interpretar y replicar patrones complejos encontrados en conjuntos de datos. La IA generativa probablemente facilitará la investigación21,22: mejorar la creación y edición de contenidos, así pueden ser usadas para escribir y corregir artículos de investigación, redactar citas y generar un resumen del contenido; análisis de datos, pueden ser muy útiles para ayudar a procesar información relacionada útil; y en los procesos de revisión por pares es otra área donde pueden tener un impacto importante.
Estamos de acuerdo con Salvagno et al.23 que las herramientas de IA pueden ser muy útiles en los procesos complicados, como son las revisiones sistemáticas y los metanálisis y estudios recientes han evaluado: (Abstrackr, DistillerSR, RobotAnalyst, EPPI-Revisor)24 y (LitSuggest, Rayyan, Abstrackr, BIBOT, R software, RobotAnalyst, DistillerSR, ExaCT and NetMetaXL)25. En este sentido pueden ser útiles en la búsqueda y cribado bibliográfico y en la creación automática de tablas y otros elementos.
Sin embargo, las aplicaciones disponibles presentan limitaciones26, que a nuestro entender son 2:
- •
Fiabilidad: perpetuar o amplificar sesgos existentes en los datos, proporcionando resultados injustos y obstaculizando el crecimiento científico. Las versiones beta vs. pago, la introducción de pagos podría generar disparidad en la producción científica, lo que podría tener consecuencias impredecibles. Fuentes concretas y de acceso limitado. Como se nutren casi exclusivamente de fuentes en inglés, y con un acceso restringido solo a los abstracts y documentos digitales Open Access, se plantean muchas dudas sobre la credibilidad de sus resultados. En nuestro estudio solo el 26% de las citas usadas por la IA habían sido elegibles por los autores para el MTA. Por último, en el contexto de la IA, «alucinación» se refiere al modelo que genera información para la cual no fue entrenado explícitamente y que puede no ser precisa. A veces pueden generar referencias o citas que son completamente fabricadas por la IA. Por lo tanto, es fundamental validar los resultados de la IA utilizando metodologías establecidas.
- •
Ética: Los organismos reguladores están trabajando para desarrollar normas que orienten el uso de la IA en la atención médica 27,28. Pero la actualización tan dinámica de estos sistemas de IA plantea desafíos para los enfoques regulatorios.
A la vista de la información aportada por la cuatro IA podemos decir:
- •
En líneas generales, las conclusiones de la IA son similares a los resultados extraídos en el MTA llevado a cabo por los autores:
- ∘
Algunos estudios sugieren que el tratamiento con ATII reduce la mortalidad en los pacientes con shock vasodilatador y shock vasodilatador resistente a catecolaminas, mientras que otros estudios indican que no hay una diferencia significativa en las tasas de mortalidad en comparación con el placebo.
- ∘
Estos estudios sugieren que la ATII es eficaz para aumentar la presión arterial y reducir la mortalidad en varios tipos de shock, particularmente en shock vasodilatador y distributivo, aunque su uso óptimo y perfil de seguridad requieren una mayor aclaración.
- ∘
La ATII parece prometedora para el shock vasodilatador refractario, pero se necesitan más datos sobre la dosificación óptima, la selección de pacientes y la seguridad a largo plazo. Los clínicos deben estar atentos a los posibles EA, como las complicaciones isquémicas, al utilizar este agente novedoso.
- ∘
- •
Las citas bibliográficas proporcionadas por la IA son todas correctas, pero se nutren fundamentalmente de artículos Open Access, revisiones y alguna página web.
- •
La métrica de consenso sobrevalora el efecto de la ATII, en todos los aspectos analizados, al compararlas con las gráficas de árbol del MTA, especialmente respecto de la mortalidad: según CONSENSUS el 86% de los artículos están de acuerdo que la ATII tiene impacto en la mortalidad. Resulta llamativa la diferencia visual de los diagramas de árbol del MTA con respecto a las métricas de consenso de la IA.
- •
La contestación a las distintas preguntas realizadas se reitera y responde con aspectos que no son específicos de la pregunta planteada.
- •
Los filtros de búsqueda aplicados en la IA (RCT) no limitaban la búsqueda y mostraban todo tipo de artículos.
Las tecnologías de IA están preparadas para transformar el panorama de la investigación médica: agilizar los procesos de investigación, facilitar análisis de datos, mejorar las interacciones y la toma de decisiones29. Pero es importante destacar que, se requiere de la orientación y supervisión de investigadores humanos para garantizar la exactitud, coherencia y credibilidad.
Para aprovechar los beneficios que la IA puede proporcionar a la investigación, manteniendo los más altos estándares de la integridad y garantizando la confianza en las publicaciones científicas, se hace necesario: más investigaciones que analicen estas nuevas herramientas y responsabilidad ética: garantizando la precisión, transparencia y reproducibilidad.
Limitaciones- •
Respecto del MTA. Hay pocos estudios y el peso lo soporta el RCT de Khanna et al. y los estudios post-hoc derivados. Así pues, no podemos ignorar la heterogeneidad clínica y metodológica, que está relacionada con las diferencias de pacientes, intervenciones, criterios de valoración, diseños de investigación y calidades. Por lo tanto, son necesarios más RCT prospectivos para valorar la evidencia clínica de la ATII.
- •
Respecto de la IA. Las herramientas de IA utilizadas son versiones gratuitas y quizás no recuperaron toda la información relevante, pero sí la esencia de los resultados.
Como conclusión principal del estudio, obtenemos que la IA y herramientas derivadas con útiles como apoyo a la hora de la evaluación de la evidencia clínica, pero que, no han de ser una herramienta exclusiva. Es un campo en desarrollo y evolución por lo que más estudios serán necesarios evaluando su progresión.
FinanciaciónLos autores declaran que no han recibido ningún soporte económico para la realización de este proyecto.
Contribución de los autoresTodos los autores cumpliendo con las categorías generales del ICMJE, han participado en los diferentes apartados del estudio.
Declaración IAEn este trabajo, los autores utilizaron: Consensus, Perplexity, Scite y Elicit, con el fin de comparar los resultados y conclusiones de la IA con las del MTA llevado a cabo íntegramente por los investigadores. Después de utilizar estas herramientas, los autores revisaron y editaron el texto y asumen plena responsabilidad por el contenido de la publicación. Los textos íntegros generados por la IA se especifican explícitamente, en cada parte del artículo.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses en relación con el contenido del presente proyecto.
Al Servicio de Medicina Intensiva del HCU Lozano Blesa: a los pacientes atendidos, sus familiares y los profesionales que a ellos se dedican.