To develop a sepsis death classification model based on machine learning techniques for patients admitted to the Intensive Care Unit (ICU).
DesignCross-sectional descriptive study.
SettingThe Intensive Care Units (ICUs) of three Hospitals from Murcia (Spain) and patients from the MIMIC III open-access database.
Patients180 patients diagnosed with sepsis in the ICUs of three hospitals and a total of 4559 patients from the MIMIC III database.
Main variables of interestAge, weight, heart rate, respiratory rate, temperature, lactate levels, partial oxygen saturation, systolic and diastolic blood pressure, pH, urine, and potassium levels.
ResultsA random forest classification model was calculated using the local and MIMIC III databases. The sensitivity of the model of our database, considering all the variables classified as important by the random forest, was 95.45%, the specificity was 100%, the accuracy was 96.77%, and an AUC of 95%. . In the case of the model based on the MIMIC III database, the sensitivity was 97.55%, the specificity was 100%, and the precision was 98.28%, with an AUC of 97.3%.
ConclusionsAccording to random forest classification in both databases, lactate levels, urine output and variables related to acid.base equilibrium were the most important variable in mortality due to sepsis in the ICU. The potassium levels were more critical in the MIMIC III database than the local database.
Desarrollar un modelo de clasificación basado en técnicas de machine-learning de muerte por sepsis para pacientes ingresados en la Unidad de Cuidados Intensivos (UCI).
DiseñoEstudio descriptivo transversal.
ÄmbitoUnidades de Cuidados Intensivos (UCI) de tres hospitales de Murcia (España) y pacientes con sepsis-3 de la base de datos de acceso abierto MIMIC III.
Pacientes180 pacientes diagnosticados de sepsis en las UCI de tres hospitales y un total de 4559 pacientes con la base de datos MIMIC III.
Variables de interés principalesSe evaluaron la edad, el peso, la frecuencia cardiaca, la frecuencia respiratoria, la temperatura, los niveles de lactato, la saturación parcial de oxígeno, la presión arterial sistólica y diastólica, el pH, los niveles de orina y los niveles de potasio.
ResultadosSe calcularon un modelo de clasificación de bosque aleatorio con la base de datos local y la base de datos MIMIC III. La sensibilidad del modelo de nuestra base de datos teniendo en cuenta todas las variables catalogadas como importantes por el random forest fue del 95,45%%, la especificidad del 100% y la exactitud del 96,77% y un AUC del 95%. En el caso del modelo sobre la base de datos MIMIC III la sensibilidad fue del 97,55%, la especificidad del 100% y la exactitud del 98,28% con un AUC del 97,3%.
ConclusionesSegún la clasificación de bosque aleatorio en ambas bases de datos, los niveles de lactato, la diuresis y las variables relacionadas con el equilibrio ácido-base fueron las variables más importantes para determinar las muertes por sepsis en la UCI. Los niveles medios de potasio fueron más críticos en la base de datos MIMIC III que en las locales.
Article
Go to the members area of the website of the SEMICYUC (www.semicyuc.org )and click the link to the magazine.