En el presente número de Medicina Intensiva publicamos un trabajo realizado sobre un registro multicéntrico español de gripe grave, que desarrolla una escala pronóstica de mortalidad en las UCI1.
En los años 80 del siglo XX, se inició para los cuidados intensivos un camino de comprensión de la realidad y de ayuda a la toma de decisiones basado en escalas de gravedad. El APACHE II, aún con matizaciones, sigue vigente en la valoración de la gravedad de los pacientes críticos. Los mecanismos de generación de estas escalas se basaban en la acumulación de gran cantidad de datos representativos, y la utilización de técnicas de análisis multivariante a través de regresión logística (RL) que permitieran generar modelos predictivos y utilizar los estimadores beta para generar las puntuaciones individuales. Para los investigadores y los clínicos, el nivel de comprensión de los entresijos matemáticos necesarios para la obtención de los estimadores beta es suficiente, y existe una razonable correlación de entendimiento con las odds ratio y sus intervalos de confianza, formando un conjunto metodológico comprensible e interpretable2.
Por otra parte, el uso de técnicas de análisis masivo de datos a través del machine learning (ML) ha tenido un crecimiento exponencial en los últimos años, como puede comprobarse en el número de citas bibliográficas registradas en Medline3. Sin embargo, uno de los problemas de las técnicas de ML reside en la dificultad para trasladar los análisis al ámbito de la práctica clínica4. A diferencia de las técnicas convencionales de análisis estadístico, los resultados de los estudios publicados tienen buenos indicadores matemáticos, pero la percepción de los clínicos es de una aplicabilidad práctica limitada5. En parte, esto es debido a la dificultad para comprender los mecanismos a través de los cuales se generan los resultados y a las dificultades de utilizar un gran número de variables de manera simultánea. Ello probablemente es más concordante con la compleja realidad biológica, pero reduce la posibilidad de manejarlo en entornos de práctica clínica para los profesionales.
En este sentido, el trabajo que presentamos en este número de Medicina Intensiva, consigue un doble objetivo: incorporar técnicas de aprendizaje automático a una extensa base de datos de gripe grave en las UCI, y generar una escala de riesgo de mortalidad combinando este abordaje con otras técnicas clásicas, más asequibles para su incorporación a la práctica clínica.
La gripe grave constituye cada invierno un reto para las UCI de todo el mundo. Con el brote de gripe A (H1N1) del año 2009 como uno de los más importantes, han sido varias las temporadas que han generado problemas asistenciales en las UCI, afectando a pacientes jóvenes, generando distrés respiratorio severo, con estancias prolongadas y una elevada mortalidad6.
La comparación de los resultados obtenidos por técnicas convencionales con las obtenidas mediante un análisis avanzado con random forest (ML) da fortaleza a los hallazgos, y parece indicar que las nuevas técnicas serán capaces de añadir información a las técnicas de análisis clásico, pero gran parte de la información sustantiva puede lograrse con estas últimas7. Eso sí, para que las técnicas de RL tengan consistencia debemos tener registros de calidad y de tamaño muestral suficiente, lo que se ha garantizado en este estudio, a diferencia de otros recientes en los que un tamaño muestral insuficiente potencia la capacidad predictiva del ML sobre la RL8.
El desarrollo de una escala de predicción de mortalidad en pacientes críticos con gripe grave puede servir de ayuda para la toma de decisiones de ingreso, la toma de decisiones terapéuticas (prono, oxigenación extracorpórea, óxido nítrico) o incluso las decisiones de traslado para aplicar técnicas avanzadas en otros centros. Otra utilidad de esta escala reside en la posibilidad de segmentar grupos de riesgo para orientar ensayos terapéuticos, así como para el benchmarking de unidades. La utilización de variables presentes en el momento del ingreso en este estudio debe considerarse además una ventaja, pues facilitaría la asesoría precoz en la toma de decisiones. Algunos modelos que utilizan variables de curso clínico pueden valer para comparar resultados de diferentes unidades, pero no para establecer pronósticos precoces en las primeras horas de ingreso o para definir grupos susceptibles de ensayos terapéuticos.
El estudio, no obstante, tiene algunas limitaciones. La base de datos es amplia y multicéntrica, pero abarca un periodo muy amplio de tiempo (10 años), en el que se han modificado las estrategias terapéuticas y los resultados. Aunque se realiza una validación interna segmentando la base de datos, es preciso evaluar la utilidad de la escala de manera prospectiva, para corroborar la exactitud de las predicciones. Por otra parte, analiza la mortalidad en las UCI, y la escala APACHE II está diseñada para la mortalidad hospitalaria, mientras que la escala SOFA no fue ni diseñada con ese fin. Tampoco podemos descartar que el uso de ML con más variables registradas hubiera tenido mayor poder predictivo.
El futuro de las técnicas de análisis a través del ML se dirigirá casi seguro al asesoramiento en tiempo real de la actividad clínica con retroalimentación inmediata y enriquecimiento de los procesos analíticos9. Aunque este escenario llegará, habrá que valorar el poder que tendrá esa información en la toma de decisiones, desde un punto de vista ético, legal y deontológico10. Y tendrá que dilucidarse el papel del clínico en la aplicación y en la retirada de tratamientos cuando el propio sistema de aprendizaje automático se alimente de las decisiones que él llegue a inducir. Serán problemas de las nuevas generaciones, y la casi imposibilidad de comprender el modo de funcionamiento matemático generará complejas sensaciones en los profesionales. Mientras eso ocurre, habrá que seguir apostando por el desarrollo de herramientas asequibles y válidas como la presentada en este número.
La medicina intensiva trabaja localmente con pocos pacientes, y si ha de centrarse en enfermedades concretas, las limitaciones son aún mayores. De aquí la importancia de disponer de potentes registros multicéntricos que faciliten análisis complejos y nos permitan añadir conocimiento en áreas de difícil manejo, y con impacto en la salud de los ciudadanos. Con la vigencia de la pandemia de la COVID-19, es una llamada a la generación de registros colaborativos.
FinanciaciónEl autor declara no haber recibido financiación para la realización de este trabajo.