array:24 [
  "pii" => "S0210569118303139"
  "issn" => "02105691"
  "doi" => "10.1016/j.medin.2018.10.007"
  "estado" => "S300"
  "fechaPublicacion" => "2019-10-01"
  "aid" => "1293"
  "copyright" => "Elsevier España, S.L.U. y SEMICYUC"
  "copyrightAnyo" => "2018"
  "documento" => "article"
  "crossmark" => 1
  "subdocumento" => "rev"
  "cita" => "Med Intensiva. 2019;43:416-26"
  "abierto" => array:3 [
    "ES" => true
    "ES2" => true
    "LATM" => true
  ]
  "gratuito" => true
  "lecturas" => array:2 [
    "total" => 709
    "formatos" => array:3 [
      "EPUB" => 41
      "HTML" => 509
      "PDF" => 159
    ]
  ]
  "Traduccion" => array:1 [
    "en" => array:19 [
      "pii" => "S2173572719301420"
      "issn" => "21735727"
      "doi" => "10.1016/j.medine.2019.06.012"
      "estado" => "S300"
      "fechaPublicacion" => "2019-10-01"
      "aid" => "1293"
      "copyright" => "Elsevier España, S.L.U. and SEMICYUC"
      "documento" => "article"
      "crossmark" => 1
      "subdocumento" => "rev"
      "cita" => "Med Intensiva. 2019;43:416-26"
      "abierto" => array:3 [
        "ES" => true
        "ES2" => true
        "LATM" => true
      ]
      "gratuito" => true
      "lecturas" => array:2 [
        "total" => 198
        "formatos" => array:3 [
          "EPUB" => 35
          "HTML" => 130
          "PDF" => 33
        ]
      ]
      "en" => array:13 [
        "idiomaDefecto" => true
        "cabecera" => "<span class="elsevierStyleTextfn">Review</span>"
        "titulo" => "Big Data Analysis and Machine Learning in Intensive Care Units"
        "tienePdf" => "en"
        "tieneTextoCompleto" => "en"
        "tieneResumen" => array:2 [
          0 => "en"
          1 => "es"
        ]
        "paginas" => array:1 [
          0 => array:2 [
            "paginaInicial" => "416"
            "paginaFinal" => "426"
          ]
        ]
        "titulosAlternativos" => array:1 [
          "es" => array:1 [
            "titulo" => "Big Data Analysis y Machine Learning en medicina intensiva"
          ]
        ]
        "contieneResumen" => array:2 [
          "en" => true
          "es" => true
        ]
        "contieneTextoCompleto" => array:1 [
          "en" => true
        ]
        "contienePdf" => array:1 [
          "en" => true
        ]
        "resumenGrafico" => array:2 [
          "original" => 0
          "multimedia" => array:7 [
            "identificador" => "fig0010"
            "etiqueta" => "Figure 2"
            "tipo" => "MULTIMEDIAFIGURA"
            "mostrarFloat" => true
            "mostrarDisplay" => false
            "figura" => array:1 [
              0 => array:4 [
                "imagen" => "gr2.jpeg"
                "Alto" => 1425
                "Ancho" => 2901
                "Tamanyo" => 292039
              ]
            ]
            "descripcion" => array:1 [
              "en" => "<p id="spar0035" class="elsevierStyleSimplePara elsevierViewall">Typical structure of a data frame&#44; composed of rows for each of the registries&#44; with an anonymized identifier&#44; and columns corresponding to the values of different variables for each case&#46; The last column shows the target variable &#40;in this case mortality&#41;&#46; Here we can see a section of some registries of the database used as an example in the material included in the GitHub repository&#46;</p>"
            ]
          ]
        ]
        "autores" => array:1 [
          0 => array:2 [
            "autoresLista" => "A&#46; N&#250;&#241;ez Reiz, M&#46;A&#46; Armengol de la Hoz, M&#46; S&#225;nchez Garc&#237;a"
            "autores" => array:3 [
              0 => array:2 [
                "nombre" => "A&#46;"
                "apellidos" => "N&#250;&#241;ez Reiz"
              ]
              1 => array:2 [
                "nombre" => "M&#46;A&#46;"
                "apellidos" => "Armengol de la Hoz"
              ]
              2 => array:2 [
                "nombre" => "M&#46;"
                "apellidos" => "S&#225;nchez Garc&#237;a"
              ]
            ]
          ]
        ]
      ]
      "idiomaDefecto" => "en"
      "Traduccion" => array:1 [
        "es" => array:9 [
          "pii" => "S0210569118303139"
          "doi" => "10.1016/j.medin.2018.10.007"
          "estado" => "S300"
          "subdocumento" => ""
          "abierto" => array:3 [
            "ES" => true
            "ES2" => true
            "LATM" => true
          ]
          "gratuito" => true
          "lecturas" => array:1 [
            "total" => 0
          ]
          "idiomaDefecto" => "es"
          "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0210569118303139?idApp=WMIE"
        ]
      ]
      "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S2173572719301420?idApp=WMIE"
      "url" => "/21735727/0000004300000007/v1_201910040722/S2173572719301420/v1_201910040722/en/main.assets"
    ]
  ]
  "itemSiguiente" => array:18 [
    "pii" => "S0210569119301214"
    "issn" => "02105691"
    "doi" => "10.1016/j.medin.2019.03.011"
    "estado" => "S300"
    "fechaPublicacion" => "2019-10-01"
    "aid" => "1340"
    "documento" => "article"
    "crossmark" => 1
    "subdocumento" => "rev"
    "cita" => "Med Intensiva. 2019;43:427-34"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 674
      "formatos" => array:3 [
        "EPUB" => 16
        "HTML" => 446
        "PDF" => 212
      ]
    ]
    "es" => array:13 [
      "idiomaDefecto" => true
      "cabecera" => "<span class="elsevierStyleTextfn">SERIES EN MEDICINA INTENSIVA&#58; MEDICINA INTENSIVA PERIOPERATORIA</span>"
      "titulo" => "Medicina intensiva perioperatoria"
      "tienePdf" => "es"
      "tieneTextoCompleto" => "es"
      "tieneResumen" => array:2 [
        0 => "es"
        1 => "en"
      ]
      "paginas" => array:1 [
        0 => array:2 [
          "paginaInicial" => "427"
          "paginaFinal" => "434"
        ]
      ]
      "titulosAlternativos" => array:1 [
        "en" => array:1 [
          "titulo" => "Perioperative intensive care medicine"
        ]
      ]
      "contieneResumen" => array:2 [
        "es" => true
        "en" => true
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "contienePdf" => array:1 [
        "es" => true
      ]
      "resumenGrafico" => array:2 [
        "original" => 0
        "multimedia" => array:7 [
          "identificador" => "fig0005"
          "etiqueta" => "Figura 1"
          "tipo" => "MULTIMEDIAFIGURA"
          "mostrarFloat" => true
          "mostrarDisplay" => false
          "figura" => array:1 [
            0 => array:4 [
              "imagen" => "gr1.jpeg"
              "Alto" => 1698
              "Ancho" => 2917
              "Tamanyo" => 302590
            ]
          ]
          "descripcion" => array:1 [
            "es" => "<p id="spar0015" class="elsevierStyleSimplePara elsevierViewall">Medicina perioperatoria&#46; Aspectos relevantes de la calidad del proceso&#46;</p>"
          ]
        ]
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "M&#46;C&#46; Mart&#237;n Delgado, F&#46; Gordo Vidal"
          "autores" => array:2 [
            0 => array:2 [
              "nombre" => "M&#46;C&#46;"
              "apellidos" => "Mart&#237;n Delgado"
            ]
            1 => array:2 [
              "nombre" => "F&#46;"
              "apellidos" => "Gordo Vidal"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "Traduccion" => array:1 [
      "en" => array:9 [
        "pii" => "S2173572719301419"
        "doi" => "10.1016/j.medine.2019.03.010"
        "estado" => "S300"
        "subdocumento" => ""
        "abierto" => array:3 [
          "ES" => true
          "ES2" => true
          "LATM" => true
        ]
        "gratuito" => true
        "lecturas" => array:1 [
          "total" => 0
        ]
        "idiomaDefecto" => "en"
        "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S2173572719301419?idApp=WMIE"
      ]
    ]
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0210569119301214?idApp=WMIE"
    "url" => "/02105691/0000004300000007/v1_201910100635/S0210569119301214/v1_201910100635/es/main.assets"
  ]
  "itemAnterior" => array:19 [
    "pii" => "S0210569118301517"
    "issn" => "02105691"
    "doi" => "10.1016/j.medin.2018.04.007"
    "estado" => "S300"
    "fechaPublicacion" => "2019-10-01"
    "aid" => "1213"
    "copyright" => "Elsevier Espa&#241;a&#44; S&#46;L&#46;U&#46; y SEMICYUC"
    "documento" => "article"
    "crossmark" => 1
    "subdocumento" => "fla"
    "cita" => "Med Intensiva. 2019;43:410-5"
    "abierto" => array:3 [
      "ES" => true
      "ES2" => true
      "LATM" => true
    ]
    "gratuito" => true
    "lecturas" => array:2 [
      "total" => 411
      "formatos" => array:3 [
        "EPUB" => 35
        "HTML" => 312
        "PDF" => 64
      ]
    ]
    "es" => array:13 [
      "idiomaDefecto" => true
      "cabecera" => "<span class="elsevierStyleTextfn">Original</span>"
      "titulo" => "Perfil de tromboelastometr&#237;a rotacional &#40;ROTEM&#41; en una cohorte de asistolia no controlada"
      "tienePdf" => "es"
      "tieneTextoCompleto" => "es"
      "tieneResumen" => array:2 [
        0 => "es"
        1 => "en"
      ]
      "paginas" => array:1 [
        0 => array:2 [
          "paginaInicial" => "410"
          "paginaFinal" => "415"
        ]
      ]
      "titulosAlternativos" => array:1 [
        "en" => array:1 [
          "titulo" => "Rotational thromboelastometry &#40;ROTEM&#41; profile in a cohort of asystole donors"
        ]
      ]
      "contieneResumen" => array:2 [
        "es" => true
        "en" => true
      ]
      "contieneTextoCompleto" => array:1 [
        "es" => true
      ]
      "contienePdf" => array:1 [
        "es" => true
      ]
      "resumenGrafico" => array:2 [
        "original" => 0
        "multimedia" => array:7 [
          "identificador" => "fig0005"
          "etiqueta" => "Figura 1"
          "tipo" => "MULTIMEDIAFIGURA"
          "mostrarFloat" => true
          "mostrarDisplay" => false
          "figura" => array:1 [
            0 => array:4 [
              "imagen" => "gr1.jpeg"
              "Alto" => 1049
              "Ancho" => 1620
              "Tamanyo" => 66933
            ]
          ]
          "descripcion" => array:1 [
            "es" => "<p id="spar0075" class="elsevierStyleSimplePara elsevierViewall">Tiempo de parada y niveles de fibrin&#243;geno&#46;</p>"
          ]
        ]
      ]
      "autores" => array:1 [
        0 => array:2 [
          "autoresLista" => "J&#46;A&#46; Barea-Mendoza, L&#46;J&#46; Terceros-Almanza, C&#46; Garc&#237;a-Fuentes, S&#46; Bermejo-Azn&#225;rez, I&#46;J&#46; Prieto del Portillo, C&#46; Mudarra-Reche, M&#46; Valiente-Fern&#225;ndez, A&#46; Rodr&#237;guez-Biendicho, J&#46;C&#46; Montejo Gonz&#225;lez, M&#46; Chico-Fern&#225;ndez"
          "autores" => array:10 [
            0 => array:2 [
              "nombre" => "J&#46;A&#46;"
              "apellidos" => "Barea-Mendoza"
            ]
            1 => array:2 [
              "nombre" => "L&#46;J&#46;"
              "apellidos" => "Terceros-Almanza"
            ]
            2 => array:2 [
              "nombre" => "C&#46;"
              "apellidos" => "Garc&#237;a-Fuentes"
            ]
            3 => array:2 [
              "nombre" => "S&#46;"
              "apellidos" => "Bermejo-Azn&#225;rez"
            ]
            4 => array:2 [
              "nombre" => "I&#46;J&#46;"
              "apellidos" => "Prieto del Portillo"
            ]
            5 => array:2 [
              "nombre" => "C&#46;"
              "apellidos" => "Mudarra-Reche"
            ]
            6 => array:2 [
              "nombre" => "M&#46;"
              "apellidos" => "Valiente-Fern&#225;ndez"
            ]
            7 => array:2 [
              "nombre" => "A&#46;"
              "apellidos" => "Rodr&#237;guez-Biendicho"
            ]
            8 => array:2 [
              "nombre" => "J&#46;C&#46;"
              "apellidos" => "Montejo Gonz&#225;lez"
            ]
            9 => array:2 [
              "nombre" => "M&#46;"
              "apellidos" => "Chico-Fern&#225;ndez"
            ]
          ]
        ]
      ]
    ]
    "idiomaDefecto" => "es"
    "Traduccion" => array:1 [
      "en" => array:9 [
        "pii" => "S2173572719301274"
        "doi" => "10.1016/j.medine.2019.06.003"
        "estado" => "S300"
        "subdocumento" => ""
        "abierto" => array:3 [
          "ES" => true
          "ES2" => true
          "LATM" => true
        ]
        "gratuito" => true
        "lecturas" => array:1 [
          "total" => 0
        ]
        "idiomaDefecto" => "en"
        "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S2173572719301274?idApp=WMIE"
      ]
    ]
    "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0210569118301517?idApp=WMIE"
    "url" => "/02105691/0000004300000007/v1_201910100635/S0210569118301517/v1_201910100635/es/main.assets"
  ]
  "es" => array:20 [
    "idiomaDefecto" => true
    "cabecera" => "<span class="elsevierStyleTextfn">Revisi&#243;n</span>"
    "titulo" => "Big Data Analysis y Machine Learning en medicina intensiva"
    "tieneTextoCompleto" => true
    "paginas" => array:1 [
      0 => array:2 [
        "paginaInicial" => "416"
        "paginaFinal" => "426"
      ]
    ]
    "autores" => array:1 [
      0 => array:4 [
        "autoresLista" => "A&#46; N&#250;&#241;ez Reiz, M&#46;A&#46; Armengol de la Hoz, M&#46; S&#225;nchez Garc&#237;a"
        "autores" => array:3 [
          0 => array:4 [
            "nombre" => "A&#46;"
            "apellidos" => "N&#250;&#241;ez Reiz"
            "email" => array:1 [
              0 => "anunezreiz@gmail.com"
            ]
            "referencia" => array:2 [
              0 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">a</span>"
                "identificador" => "aff0005"
              ]
              1 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">&#42;</span>"
                "identificador" => "cor0005"
              ]
            ]
          ]
          1 => array:3 [
            "nombre" => "M&#46;A&#46;"
            "apellidos" => "Armengol de la Hoz"
            "referencia" => array:3 [
              0 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">b</span>"
                "identificador" => "aff0010"
              ]
              1 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">c</span>"
                "identificador" => "aff0015"
              ]
              2 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">d</span>"
                "identificador" => "aff0020"
              ]
            ]
          ]
          2 => array:3 [
            "nombre" => "M&#46;"
            "apellidos" => "S&#225;nchez Garc&#237;a"
            "referencia" => array:1 [
              0 => array:2 [
                "etiqueta" => "<span class="elsevierStyleSup">a</span>"
                "identificador" => "aff0005"
              ]
            ]
          ]
        ]
        "afiliaciones" => array:4 [
          0 => array:3 [
            "entidad" => "Servicio de Medicina Intensiva&#44; Hospital Universitario Cl&#237;nico San Carlos&#44; Madrid&#44; Espa&#241;a"
            "etiqueta" => "a"
            "identificador" => "aff0005"
          ]
          1 => array:3 [
            "entidad" => "Department of Anesthesia&#44; Critical Care and Pain Medicine&#44; Beth Israel Deaconess Medical Center&#44; Harvard Medical School&#44; Boston&#44; MA&#44; Estados Unidos"
            "etiqueta" => "b"
            "identificador" => "aff0010"
          ]
          2 => array:3 [
            "entidad" => "Laboratory for Computational Physiology&#44; Institute for Medical Engineering and Science&#44; Massachusetts Institute of Technology&#44; Cambridge&#44; MA&#44; Estados Unidos"
            "etiqueta" => "c"
            "identificador" => "aff0015"
          ]
          3 => array:3 [
            "entidad" => "Biomedical Engineering and Telemedicine Group&#44; Biomedical Technology Centre CTB&#44; ETSI Telecomunicaci&#243;n&#44; Universidad Polit&#233;cnica de Madrid&#44; Madrid&#44; Espa&#241;a"
            "etiqueta" => "d"
            "identificador" => "aff0020"
          ]
        ]
        "correspondencia" => array:1 [
          0 => array:3 [
            "identificador" => "cor0005"
            "etiqueta" => "&#8270;"
            "correspondencia" => "Autor para correspondencia&#46;"
          ]
        ]
      ]
    ]
    "titulosAlternativos" => array:1 [
      "en" => array:1 [
        "titulo" => "Big Data Analysis and Machine Learning in Intensive Care Units"
      ]
    ]
    "resumenGrafico" => array:2 [
      "original" => 0
      "multimedia" => array:7 [
        "identificador" => "fig0005"
        "etiqueta" => "Figura 1"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "gr1.jpeg"
            "Alto" => 1495
            "Ancho" => 2167
            "Tamanyo" => 208955
          ]
        ]
        "descripcion" => array:1 [
          "es" => "<p id="spar0025" class="elsevierStyleSimplePara elsevierViewall">Flujo de datos en medicina intensiva&#46; La calidad de la asistencia y de la toma de decisiones estrat&#233;gicas depende del procesamiento de la informaci&#243;n presente en el repositorio activo de datos &#40;informaci&#243;n que se va generando en cada momento y que est&#225; disponible para tomar decisiones&#41; y de la reutilizaci&#243;n de conocimiento previo almacenado en bases de datos locales o compartidas&#46; El procesamiento autom&#225;tico de la informaci&#243;n mediante Machine Learning &#40;ML&#41; y la posibilidad de acceso r&#225;pido a grandes cantidades de datos de estructura heterog&#233;nea mediante Big Data Analysis &#40;BDA&#41; permite mejorar los procesos asistenciales y extraer conocimiento de los datos&#46;</p> <p id="spar0030" class="elsevierStyleSimplePara elsevierViewall">Adaptada de Celi et al&#46;<a class="elsevierStyleCrossRef" href="#bib0295"><span class="elsevierStyleSup">12</span></a>&#44; con permiso de los autores&#46;</p>"
        ]
      ]
    ]
    "textoCompleto" => """
      <span class="elsevierStyleSections"><span id="sec0005" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0025">Introducci&#243;n</span><p id="par0005" class="elsevierStylePara elsevierViewall">Los profesionales de la medicina intensiva vivimos sumergidos en un mar de datos&#46; En un servicio de medicina intensiva informatizado&#44; como el del Hospital Cl&#237;nico San Carlos &#40;con tres unidades de cuidados intensivos y aproximadamente 2&#46;400 ingresos al a&#241;o&#41;&#44; durante un d&#237;a normal de actividad en nuestra Unidad se incorporan a nuestra base de datos informatizada 1&#46;400 nuevas unidades de informaci&#243;n en promedio por cada paciente ingresado&#44; lo que supone unos diez millones de unidades de informaci&#243;n al a&#241;o &#40;Nu&#241;ez A&#44; comunicaci&#243;n personal&#41;&#46;</p><p id="par0010" class="elsevierStylePara elsevierViewall">El desarrollo exponencial de la inform&#225;tica y la irrupci&#243;n de computadores con gran capacidad de almacenamiento y procesamiento a un coste asequible hacen que toda esa informaci&#243;n quede registrada y pueda ser utilizada de diversas maneras&#46; Incluso en aquellas unidades que todav&#237;a carecen de historia cl&#237;nica electr&#243;nica o aplicaciones departamentales para medicina intensiva existe la posibilidad de utilizar el potencial de los m&#233;todos computacionales de &#250;ltima generaci&#243;n para mejorar la manera en que hacemos nuestro trabajo cada d&#237;a&#46; Un ejemplo es la aplicaci&#243;n de t&#233;cnicas de procesamiento de lenguaje natural &#40;<span class="elsevierStyleItalic">Natural Language Processing</span> &#91;NLP&#93;&#41; a un conjunto de informes almacenados en Word&#44; PDF u otro formato similar de texto libre &#40;no estructurado&#41;<a class="elsevierStyleCrossRef" href="#bib0240"><span class="elsevierStyleSup">1</span></a>&#46;</p><p id="par0015" class="elsevierStylePara elsevierViewall">Los datos que los intensivistas manejamos pueden provenir de diversas fuentes&#46; Los profesionales sanitarios est&#225;n a&#241;adiendo continuamente datos &#40;estructurados o no&#41; a la documentaci&#243;n del paciente&#46; Se estima que los m&#233;dicos dedican casi dos horas a la documentaci&#243;n por cada hora de atenci&#243;n directa al paciente<a class="elsevierStyleCrossRef" href="#bib0245"><span class="elsevierStyleSup">2</span></a>&#46; Los m&#233;dicos&#44; las enfermeras y los t&#233;cnicos los escriben como notas o informes de distintas especialidades en texto libre&#44; o como informaci&#243;n codificada sobre diagn&#243;sticos o procedimientos&#46; Tambi&#233;n generamos &#243;rdenes de tratamiento y registros de administraci&#243;n de f&#225;rmacos&#44; y recibimos grandes cantidades de datos generados por nuestro aparataje medico&#58; resultados de los analizadores de laboratorio&#44; constantes vitales&#44; datos de monitorizaci&#243;n avanzada&#44; par&#225;metros del respirador&#44; par&#225;metros de funcionamiento de equipos complejos como bombas de perfusi&#243;n&#44; monitores de di&#225;lisis&#44; dispositivos de ECMO &#40;membrana de oxigenaci&#243;n extracorp&#243;rea&#41;&#44; as&#237; como informaci&#243;n en forma de im&#225;genes&#44; sonidos&#44; v&#237;deos y muchos m&#225;s&#46; Hasta algunos a&#241;os esta informaci&#243;n se perd&#237;a en la nada o como mucho en archivos de historias cl&#237;nicas en papel&#46; Hoy es posible almacenar y procesar esta informaci&#243;n de manera autom&#225;tica en formato digital y extraer de ella nuevo conocimiento y orientaci&#243;n para mejorar el cuidado de los pacientes&#46;</p><p id="par0020" class="elsevierStylePara elsevierViewall">Existe un amplio espectro en cuanto a lo estructurados que est&#225;n los datos que utilizamos&#46; Es mucho m&#225;s f&#225;cil hacer investigaci&#243;n cl&#237;nica cuando los datos est&#225;n en un formato estructurado&#44; pero los profesionales sanitarios todav&#237;a no han alcanzado un consenso en cuanto a una manera un&#237;voca de expresar cada concepto relacionado con la salud&#46; Esto no quiere decir que no tengamos est&#225;ndares&#46; SNOMED CT<a class="elsevierStyleCrossRef" href="#bib0250"><span class="elsevierStyleSup">3</span></a>&#44; HL7<a class="elsevierStyleCrossRef" href="#bib0255"><span class="elsevierStyleSup">4</span></a>&#44; UMLS<a class="elsevierStyleCrossRef" href="#bib0260"><span class="elsevierStyleSup">5</span></a>&#44; DICOM<a class="elsevierStyleCrossRef" href="#bib0265"><span class="elsevierStyleSup">6</span></a>&#44; LOINC<a class="elsevierStyleCrossRef" href="#bib0270"><span class="elsevierStyleSup">7</span></a> y muchos otros son ejemplos de ello y son usados en diferentes campos sanitarios&#44; permitiendo el tratamiento automatizado de los datos y el intercambio de informaci&#243;n entre sistemas&#46; Pero los est&#225;ndares no lo son de manera absoluta&#58; podemos expresar un diagn&#243;stico en diferentes est&#225;ndares&#44; como MESH<a class="elsevierStyleCrossRef" href="#bib0275"><span class="elsevierStyleSup">8</span></a>&#44; UMLS&#44; SNOMED CT&#44; ICD-9<a class="elsevierStyleCrossRef" href="#bib0280"><span class="elsevierStyleSup">9</span></a>&#44; ICD-10<a class="elsevierStyleCrossRef" href="#bib0280"><span class="elsevierStyleSup">9</span></a>&#44; y frecuentemente es necesario hacer &#171;traducciones&#187; entre est&#225;ndares &#40;el t&#233;rmino t&#233;cnico es &#171;mapeo&#187;&#41; para trasladar informaci&#243;n de unos sistemas a otros&#46; Soluciones con nuevos enfoques del problema de la multiplicidad de est&#225;ndares &#40;por ejemplo&#44; OMOP<a class="elsevierStyleCrossRef" href="#bib0285"><span class="elsevierStyleSup">10</span></a>&#41; proporcionan herramientas para realizar estos mapeos de una manera sistematizada&#46;</p><p id="par0025" class="elsevierStylePara elsevierViewall">No solo los datos en s&#237; son importantes&#44; tambi&#233;n lo es el contexto en el que est&#225;n inmersos&#46; A veces un dato no tiene valor alguno si no podemos asociarlo a m&#225;s informaci&#243;n relevante sobre el paciente o la situaci&#243;n cl&#237;nica&#46; Un registro de presi&#243;n arterial de 90&#47;60<span class="elsevierStyleHsp" style=""></span>mmHg se interpreta de manera muy diferente en una mujer joven sometida a cirug&#237;a pl&#225;stica que en un anciano hipertenso con una hemorragia&#46; El mismo concepto puede adem&#225;s plasmarse de formas distintas por distintos profesionales&#44; en distintas situaciones y &#8212;en el caso de valores num&#233;ricos&#8212; con distintas unidades&#46;</p><p id="par0030" class="elsevierStylePara elsevierViewall">Nuestros datos estructurados pueden ser categ&#243;ricos&#44; valores num&#233;ricos enteros o con decimales&#44; fechas&#44; horas&#44; duraciones&#44; o bien pueden agruparse &#40;por ejemplo&#44; la presi&#243;n arterial con sus dos componentes&#44; sist&#243;lico y diast&#243;lico&#41; de una manera similar a las listas&#44; tuplas u objetos que vemos como estructuras de datos en lenguajes de programaci&#243;n&#46; A veces nuestros datos son matrices de bytes organizados para representar una imagen o un v&#237;deo&#44; como por ejemplo un fichero DICOM que puede utilizarse para mostrar una imagen de CT&#46; En este ejemplo concreto aparece otro concepto interesante&#44; que es el de metadatos&#58; informaci&#243;n acerca de los propios datos &#40;por ejemplo&#44; en el caso de la imagen del CT&#44; metadatos ser&#237;an los par&#225;metros de adquisici&#243;n&#41;&#46;</p><p id="par0035" class="elsevierStylePara elsevierViewall">Algunos datos son subjetivos&#46; Por ejemplo&#44; un m&#233;dico puede expresar el razonamiento que le llev&#243; a un determinado diagn&#243;stico mediante una serie de frases en una nota de texto libre&#46; Otros datos son objetivos&#58; nuestro hemofiltro ha extra&#237;do exactamente 52<span class="elsevierStyleHsp" style=""></span>mL de ultrafiltrado al paciente durante la &#250;ltima hora&#44; y pasa esta informaci&#243;n a la gr&#225;fica electr&#243;nica a trav&#233;s de la conexi&#243;n de red&#46;</p><p id="par0040" class="elsevierStylePara elsevierViewall">Para llevar a cabo an&#225;lisis secundarios de datos cl&#237;nicos&#44; son diversos los aspectos que han de tenerse en cuenta en cuanto a privacidad&#44; seguridad y sensibilidad&#46; Para un paciente&#44; el que se conozca p&#250;blicamente su frecuencia respiratoria puede ser perfectamente tolerable&#44; pero no suele opinar lo mismo sobre su seropositividad al virus de la inmunodeficiencia humana&#46;</p><p id="par0045" class="elsevierStylePara elsevierViewall">Los datos vienen de distintos or&#237;genes porque se obtienen por distintos motivos &#40;contabilidad&#44; investigaci&#243;n o manejo cl&#237;nico del paciente&#44; por ejemplo&#44; son algunas de las opciones&#41;&#44; y por tanto hay distintos actores implicados en el proceso &#40;gestores&#44; cl&#237;nicos&#44; investigadores&#44; proveedores de servicios&#41;&#46;</p><p id="par0050" class="elsevierStylePara elsevierViewall">Si queremos ser capaces de extraer conocimiento v&#225;lido de toda esta mezcolanza&#44; para poder ayudar al profesional sanitario a tomar mejores decisiones y para orientar nuestra investigaci&#243;n cl&#237;nica&#44; hemos de ser capaces de trabajar de manera eficiente con este rompecabezas cl&#237;nico de miles de peque&#241;as piezas que nuestro quehacer con el paciente genera cada d&#237;a&#46;</p></span><span id="sec0010" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0030">Flujo de datos en medicina intensiva</span><p id="par0055" class="elsevierStylePara elsevierViewall">La informaci&#243;n fluye en nuestro entorno a trav&#233;s de varias fases que vamos a estudiar brevemente &#40;<a class="elsevierStyleCrossRef" href="#fig0005">fig&#46; 1</a>&#41;&#44; ya que en distintos momentos del proceso de atenci&#243;n cl&#237;nica se producen eventos cr&#237;ticos que influyen sobre nuestra capacidad de utilizar eficientemente la informaci&#243;n&#46;</p><elsevierMultimedia ident="fig0005"></elsevierMultimedia><span id="sec0015" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0035">Entrada de datos</span><p id="par0060" class="elsevierStylePara elsevierViewall">Una parte del proceso de introducci&#243;n de los datos se realiza de manera autom&#225;tica y en un formato estructurado que permite el empleo de los datos de manera eficiente&#46; Sin embargo&#44; existe una gran ventana de oportunidad de mejora en la adquisici&#243;n de los datos para los que hoy en d&#237;a se utiliza el texto libre&#46; Intentemos explicar esto con un ejemplo&#58;</p><p id="par0065" class="elsevierStylePara elsevierViewall">&#171;Paciente var&#243;n de 58 a&#241;os que acude hace 1 hora a urgencias por un cuadro de disnea y dolor centrotor&#225;cico irradiado al brazo izquierdo&#8230;&#187;</p><p id="par0070" class="elsevierStylePara elsevierViewall">En este breve p&#225;rrafo de 24 palabras existen al menos 8 conceptos que pueden expresarse de manera estructurada en el siguiente documento xml &#40;un formato est&#225;ndar para mostrar informaci&#243;n<a class="elsevierStyleCrossRef" href="#bib0290"><span class="elsevierStyleSup">11</span></a>&#41;&#58;</p><p id="par0075" class="elsevierStylePara elsevierViewall">&lt;episodio id="xxxx"&gt;&lt;/episodio&gt;</p><p id="par0080" class="elsevierStylePara elsevierViewall">&lt;paciente&gt;&lt;/paciente&gt;</p><p id="par0085" class="elsevierStylePara elsevierViewall">&lt;id&gt;\n
       xxxx\n
      &lt;/id&gt;</p><p id="par0090" class="elsevierStylePara elsevierViewall">&lt;sexo&gt;\n
       Var&#243;n\n
      &lt;/sexo&gt;</p><p id="par0095" class="elsevierStylePara elsevierViewall">&lt;edad unidad="&#8220;a&#241;os&#8221;"&gt;\n
       58\n
      &lt;/edad&gt;</p><p id="par0100" class="elsevierStylePara elsevierViewall"></p><p id="par0105" class="elsevierStylePara elsevierViewall">&lt;lugar&gt;\n
       Urgencias\n
      &lt;/lugar&gt;</p><p id="par0110" class="elsevierStylePara elsevierViewall">&lt;momento&gt;\n
       2018-08-12 15&#58;30&#58;00\n
      &lt;/momento&gt;</p><p id="par0115" class="elsevierStylePara elsevierViewall">&lt;fecha registro&lt;2018-08-12="" 16:30:00&lt;="" echa="" registro=""&gt;&lt;/fecha&gt;</p><p id="par0120" class="elsevierStylePara elsevierViewall">&lt;s&iacute;ntomas&gt;&lt;/s&iacute;ntomas&gt;</p><p id="par0125" class="elsevierStylePara elsevierViewall">&lt;disnea /&gt;</p><p id="par0130" class="elsevierStylePara elsevierViewall">&lt;dolor&gt;&lt;/dolor&gt;</p><p id="par0135" class="elsevierStylePara elsevierViewall">&lt;localizaci&oacute;n&gt;\n
       Centrotor&#225;cica\n
      &lt;/localizaci&oacute;n&gt;</p><p id="par0140" class="elsevierStylePara elsevierViewall">&lt;irradiaci&oacute;n&gt;\n
       Brazo izquierdo\n
      &lt;/irradiaci&oacute;n&gt;</p><p id="par0145" class="elsevierStylePara elsevierViewall"></p><p id="par0150" class="elsevierStylePara elsevierViewall"></p><p id="par0155" class="elsevierStylePara elsevierViewall"></p><p id="par0160" class="elsevierStylePara elsevierViewall">Para un m&#233;dico suele ser mucho m&#225;s f&#225;cilmente interpretable el p&#225;rrafo de texto libre&#44; mientras que para su manejo en un computador la segunda manera de representar la informaci&#243;n es mucho m&#225;s eficiente&#46; Lo ideal ser&#237;a encontrar una herramienta que permita al humano introducir la informaci&#243;n de una manera al menos tan r&#225;pida y c&#243;moda como el texto libre&#44; pero que tambi&#233;n permita su almacenamiento directo en un formato estructurado&#44; facilitando su lectura y comprensi&#243;n tanto por humanos como por ordenadores&#46;</p></span><span id="sec0020" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0040">Procesamiento de los datos en vivo</span><p id="par0165" class="elsevierStylePara elsevierViewall">Los datos que se van introduciendo en el sistema quedan en un estado &#171;pasivo&#187;&#44; y es el profesional sanitario el que tiene que hacer inferencias tras recopilar los datos que le parecen relevantes en un momento concreto de la evoluci&#243;n del paciente&#46;</p><p id="par0170" class="elsevierStylePara elsevierViewall">Sin embargo&#44; existe la posibilidad de transformar los datos almacenados en datos &#171;activos&#187;&#44; que desencadenen respuestas del sistema&#44; a trav&#233;s de un sistema de soporte a la decisi&#243;n cl&#237;nica &#40;<span class="elsevierStyleItalic">Clinical Decission Support System</span> &#91;CDSS&#93;&#41;&#46; Siguiendo con el ejemplo previo&#44; supongamos que hemos introducido el p&#225;rrafo previo y en el sistema existe un concepto almacenado&#58;</p><p id="par0175" class="elsevierStylePara elsevierViewall">&lt;s&iacute;ndrome&gt;&lt;/s&iacute;ndrome&gt;</p><p id="par0180" class="elsevierStylePara elsevierViewall">&lt;nombre&gt;\n
       S&#237;ndrome coronario agudo\n
      &lt;/nombre&gt;</p><p id="par0185" class="elsevierStylePara elsevierViewall">&lt;s&iacute;ntomas&gt;&lt;/s&iacute;ntomas&gt;</p><p id="par0190" class="elsevierStylePara elsevierViewall">&lt;dolor&gt;&lt;/dolor&gt;</p><p id="par0195" class="elsevierStylePara elsevierViewall">&lt;localizaci&oacute;n&gt;\n
       Centrotor&#225;cica\n
      &lt;/localizaci&oacute;n&gt;</p><p id="par0200" class="elsevierStylePara elsevierViewall">&lt;irradiaci&oacute;n&gt;\n
       Brazo izquierdo\n
      &lt;/irradiaci&oacute;n&gt;</p><p id="par0205" class="elsevierStylePara elsevierViewall"></p><p id="par0210" class="elsevierStylePara elsevierViewall"></p><p id="par0215" class="elsevierStylePara elsevierViewall"></p><p id="par0220" class="elsevierStylePara elsevierViewall">Al introducir la informaci&#243;n del paciente el sistema puede alertarnos directamente de que el paciente muestra un s&#237;ntoma compatible con el s&#237;ndrome coronario agudo&#46; Este es un ejemplo muy sencillo&#44; pero lo realmente &#250;til de las herramientas inform&#225;ticas es que este tipo de procesamiento puede realizarse de manera autom&#225;tica para miles de conceptos y de una manera mucho m&#225;s sistem&#225;tica que la que realiza un cerebro humano&#46; Para entenderlo con una analog&#237;a&#44; es como si el sistema estuviera realizando un <span class="elsevierStyleItalic">checklist</span> continuo con nuestros pacientes&#46; Adicionalmente&#44; las t&#233;cnicas actuales de inteligencia artificial &#40;IA&#41; permiten utilizar la experiencia adquirida de pacientes previos en forma de datos estructurados en la valoraci&#243;n del paciente individual subsiguiente&#46; Esto puede tener en el futuro un gran impacto sobre la pr&#225;ctica cl&#237;nica&#46;</p><p id="par0225" class="elsevierStylePara elsevierViewall">Otro ejemplo es el empleo de sistemas de control en tiempo real&#44; por ejemplo&#44; para ajustar continuamente las dosis de insulina en perfusi&#243;n de un paciente en funci&#243;n de la sensibilidad a la insulina que ha mostrado previamente&#44; su situaci&#243;n de estr&#233;s valorado por distintos datos de la gr&#225;fica y la anal&#237;tica&#44; y el aporte cal&#243;rico y de hidratos de carbono que se est&#225; realizando en ese momento&#46; El sistema puede ir aprendiendo con el tiempo sobre el propio paciente y optimizando progresivamente el control de la glucemia dentro de unos par&#225;metros de seguridad&#46;</p><span id="sec0025" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0045">Almacenamiento de los datos</span><p id="par0230" class="elsevierStylePara elsevierViewall">Existen dos maneras de almacenar la informaci&#243;n de nuestros pacientes&#58; a&#41;<span class="elsevierStyleHsp" style=""></span>en bases de datos relacionales&#44; que utilizan el lenguaje de consulta SQL para poder recuperar y procesar los datos almacenados&#44; y b&#41;<span class="elsevierStyleHsp" style=""></span>en repositorios de datos no estructurados &#40;NoSQL&#41;&#46; Hoy en d&#237;a existen herramientas que permiten extraer y procesar informaci&#243;n tambi&#233;n de este tipo de datos&#46; Tipos espec&#237;ficos de datos pueden almacenarse en bases de datos especializadas&#44; como por ejemplo un PACS para almacenamiento de im&#225;genes cl&#237;nicas que utiliza el formato DICOM&#46;</p></span><span id="sec0030" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0050">An&#225;lisis de los datos a posteriori y compartici&#243;n de la informaci&#243;n</span><p id="par0235" class="elsevierStylePara elsevierViewall">Una vez que tenemos almacenados los datos&#44; podemos procesarlos de diversas formas&#46; Por ejemplo&#44; podemos obtener un informe autom&#225;tico de actividad de nuestra unidad utilizando una consulta a nuestra base de datos SQL con los datos demogr&#225;ficos y cl&#237;nicos de nuestros pacientes&#44; o podemos averiguar qu&#233; antibi&#243;ticos utilizamos con m&#225;s frecuencia&#44; o qu&#233; tipo de patolog&#237;as se atienden primordialmente en nuestra unidad&#44; sin tener que revisar de nuevo uno por uno nuestros pacientes&#46; Podemos utilizar esta informaci&#243;n para llevar a cabo <span class="elsevierStyleItalic">benchmarking</span> &#40;comparaci&#243;n de resultados entre unidades o dentro de la misma unidad al cambiar procesos o recursos&#41; o para planificar actuaciones estrat&#233;gicas&#46;</p><p id="par0240" class="elsevierStylePara elsevierViewall">Recomendamos consultar el art&#237;culo de Celi et al&#46;<a class="elsevierStyleCrossRef" href="#bib0295"><span class="elsevierStyleSup">12</span></a>&#44; en el que se revisa todo este ciclo de flujo de informaci&#243;n y se aborda el concepto de &#171;cerrar el c&#237;rculo&#187; <span class="elsevierStyleItalic">&#40;closing the loop&#41;</span>&#44; explicando de qu&#233; manera la IA puede contribuir al desarrollo de la medicina intensiva&#46;</p></span></span></span><span id="sec0035" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0055">&#191;Qu&#233; es Big Data&#63;</span><p id="par0245" class="elsevierStylePara elsevierViewall">El planteamiento cl&#225;sico del cl&#237;nico con respecto al manejo de los datos para investigaci&#243;n cl&#237;nica se basa en la premisa de que es necesario obtener informaci&#243;n de calidad para conseguir resultados fiables y aplicables a los pacientes&#46; La dificultad para obtener la informaci&#243;n hace que se intente optimizar este proceso aplicando dise&#241;os prospectivos&#44; aleatorizaci&#243;n y una hip&#243;tesis de trabajo previa al an&#225;lisis de los datos&#46;</p><p id="par0250" class="elsevierStylePara elsevierViewall">Como alternativa al uso exclusivo de datos recogidos de manera ortodoxa&#44; la novedad que las t&#233;cnicas de an&#225;lisis de Big Data &#40;<span class="elsevierStyleItalic">Big Data Analysis</span> &#91;BDA&#93;&#41; ofrecen es la detecci&#243;n de la estructura y el conocimiento subyacente en cantidades ingentes de informaci&#243;n&#44; incluso aunque aparentemente no est&#233; estructurada&#46;</p><p id="par0255" class="elsevierStylePara elsevierViewall">Una definici&#243;n popular del concepto<a class="elsevierStyleCrossRef" href="#bib0300"><span class="elsevierStyleSup">13</span></a> establece que &#171;se considera Big Data a conjuntos de datos caracterizados por un volumen tan grande y una variedad tan amplia en su estructura&#44; que hace necesario el uso de tecnolog&#237;a y m&#233;todos anal&#237;ticos espec&#237;ficos para su procesamiento y transformaci&#243;n en conocimiento o valor&#187;&#46;</p><p id="par0260" class="elsevierStylePara elsevierViewall">Las t&#233;cnicas espec&#237;ficas de BDA se han aplicado con &#233;xito a campos como el marketing&#44; la toma de decisiones estrat&#233;gicas en el mundo de los negocios&#44; la banca&#44; el transporte&#44; la log&#237;stica&#44; los seguros o la detecci&#243;n de fraude en el comercio electr&#243;nico&#46; No hay ning&#250;n motivo para pensar que no puedan aplicarse a nuestro entorno&#44; donde continuamente estamos tomando decisiones estrat&#233;gicas o concretas en pacientes determinados&#44; cuyas caracter&#237;sticas&#44; aunque complejas&#44; se repiten con frecuencia&#46;</p><p id="par0265" class="elsevierStylePara elsevierViewall">Un ejemplo reciente&#44; del que hablamos m&#225;s adelante&#44; es el seguimiento de las epidemias de gripe mediante el an&#225;lisis de las b&#250;squedas realizadas en internet&#46; En este caso se utilizan bases de datos de muchos millones de registros para obtener conclusiones epidemiol&#243;gicas r&#225;pidas y fiables<a class="elsevierStyleCrossRef" href="#bib0305"><span class="elsevierStyleSup">14</span></a>&#46;</p><p id="par0270" class="elsevierStylePara elsevierViewall">La filosof&#237;a de c&#243;digo abierto ha irrumpido con fuerza en el mundo del Big Data&#44; permitiendo su utilizaci&#243;n sin que ello suponga una gran inversi&#243;n econ&#243;mica&#46; Proyectos como Apache Hadoop<a class="elsevierStyleCrossRefs" href="#bib0310"><span class="elsevierStyleSup">15&#44;16</span></a> incluyen toda una serie de recursos en su ecosistema &#40;HDFS&#44; Spark&#44; MapReduce&#44; Impala&#44; HBase&#44; Hive&#41; que permiten construir a bajo coste un sistema de procesamiento de Big Data en <span class="elsevierStyleItalic">batch</span> &#40;an&#225;lisis de datos ya almacenados en grandes bases de datos relacionales o no relacionales&#41; o en <span class="elsevierStyleItalic">streaming</span> &#40;an&#225;lisis y procesamiento de los datos seg&#250;n se van generando&#41; de bajo coste&#46;</p></span><span id="sec0040" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0060">&#191;Qu&#233; es Machine Learning&#63;</span><p id="par0275" class="elsevierStylePara elsevierViewall">El concepto de Machine Learning &#40;ML&#41; o &#171;aprendizaje m&#225;quina&#187; data de mediados del siglo<span class="elsevierStyleHsp" style=""></span>XX&#44; y se defini&#243; ya en un art&#237;culo de Samuel de 1959<a class="elsevierStyleCrossRef" href="#bib0320"><span class="elsevierStyleSup">17</span></a> como un apartado de la IA que usa t&#233;cnicas estad&#237;sticas y algoritmos computacionales para proporcionar a los ordenadores la capacidad de &#171;aprender&#187;&#44; es decir&#44; mejorar sus resultados en una tarea espec&#237;fica tras procesar datos en suficiente cantidad y sin unas instrucciones expl&#237;citas externas &#40;y por tanto potencialmente sesgadas&#41; proporcionadas por el programador&#46;</p><p id="par0280" class="elsevierStylePara elsevierViewall">El &#225;mbito del ML est&#225; estrechamente relacionado con otros campos&#44; como la simulaci&#243;n y el modelado&#44; la optimizaci&#243;n de sistemas y la estad&#237;stica&#46; En todos ellos se emplean de manera intensiva t&#233;cnicas matem&#225;ticas comunes que requieren entrenamiento espec&#237;fico&#46;</p><p id="par0285" class="elsevierStylePara elsevierViewall">Es necesario definir algunos conceptos b&#225;sicos en este momento&#46; Debemos utilizar un formato conocido como <span class="elsevierStyleItalic">&#171;dataframe&#187;</span> para trabajar con los datos en ML&#46; Un <span class="elsevierStyleItalic">dataframe</span> es una matriz donde cada fila corresponde a uno de los pacientes o registros y cada columna a una de las variables que registramos &#40;<a class="elsevierStyleCrossRef" href="#fig0010">fig&#46; 2</a>&#41;&#46;</p><elsevierMultimedia ident="fig0010"></elsevierMultimedia><p id="par0290" class="elsevierStylePara elsevierViewall">Supongamos&#44; a modo de ejemplo&#44; que queremos desarrollar un modelo de predicci&#243;n de mortalidad en funci&#243;n de las siguientes variables&#58; tipo de ingreso &#40;m&#233;dico&#44; quir&#250;rgico programado o quir&#250;rgico urgente&#41;&#44; edad&#44; sexo&#44; APACHE<span class="elsevierStyleHsp" style=""></span>II al ingreso&#44; SOFA al ingreso y niveles sangu&#237;neos de &#225;cido l&#225;ctico&#46; En este caso tendremos tantas filas como episodios de pacientes tengamos recogidos&#44; y cada fila tendr&#225; una columna que identifica el episodio &#40;de manera an&#243;nima&#41; y una columna por cada una de las variables explicativas que hemos definido m&#225;s otra columna con la variable objetivo &#40;en este caso es una variable dicot&#243;mica mortalidad &#91;S&#205;&#47;NO&#93;&#41;&#46;</p><p id="par0295" class="elsevierStylePara elsevierViewall">Para los lectores que quieran reproducir los ejemplos que se proporcionan en esta revisi&#243;n hemos preparado un conjunto anonimizado de datos de nuestra base propia y la hemos subido en forma de tabla Excel a un repositorio en GitHub &#40;<a href="https://github.com/anunezr/revision_medicina_intensiva">https&#58;&#47;&#47;github&#46;com&#47;anunezr&#47;revision&#95;medicina&#95;intensiva</a>&#41;&#46;</p><p id="par0300" class="elsevierStylePara elsevierViewall">Existen tres variantes principales de aprendizaje m&#225;quina&#58;<ul class="elsevierStyleList" id="lis0015"><li class="elsevierStyleListItem" id="lsti0005"><span class="elsevierStyleLabel">&#8226;</span><p id="par0305" class="elsevierStylePara elsevierViewall"><span class="elsevierStyleItalic">Aprendizaje supervisado</span>&#46; Cada registro est&#225; etiquetado con un valor de la variable objetivo&#44; y se emplean distintas t&#233;cnicas capaces de predecir en un registro nuevo el valor de esa variable&#46; En nuestro ejemplo&#44; la variable objetiva es la mortalidad &#40;S&#205;&#47;NO&#41;&#46; Una vez &#171;entrenado&#187; el sistema&#44; este ha de ser capaz de predecir el valor de esa variable para un episodio que no haya sido presentado al sistema previamente&#46; Por tanto&#44; los datos de entrenamiento y los de prueba deben ser diferentes y estar almacenados por separado&#46; Se utiliza en tareas de clasificaci&#243;n&#44; predicci&#243;n y detecci&#243;n de similitud&#46;</p></li><li class="elsevierStyleListItem" id="lsti0010"><span class="elsevierStyleLabel">&#8226;</span><p id="par0310" class="elsevierStylePara elsevierViewall"><span class="elsevierStyleItalic">Aprendizaje no supervisado</span>&#46; En este caso se trata de detectar patrones o tendencias en los datos sin utilizar una variable objetivo&#46; Se utiliza por ejemplo para clasificar pacientes en grupos de manera autom&#225;tica y para reducir el n&#250;mero de variables y la complejidad de los modelos&#46;</p></li><li class="elsevierStyleListItem" id="lsti0015"><span class="elsevierStyleLabel">&#8226;</span><p id="par0315" class="elsevierStylePara elsevierViewall"><span class="elsevierStyleItalic">Aprendizaje por refuerzo</span>&#46; En este caso el sistema debe perseguir un objetivo o recompensa&#44; e ir&#225; aprendiendo a medida que se va explorando el entorno con el que interact&#250;a&#44; que no se conoce de antemano&#44; evitando las acciones con recompensa negativa e intentando llevar a cabo acciones con recompensa positiva&#46; Un ejemplo ser&#237;a un sistema que va aprendiendo y ajustando las pautas antibi&#243;ticas emp&#237;ricas que realizan los cl&#237;nicos seg&#250;n van siendo los resultados y las caracter&#237;sticas de los pacientes s&#233;pticos que se van presentando&#46;</p></li></ul></p><p id="par0320" class="elsevierStylePara elsevierViewall">En la tabla 1&#95;Sup&#44; que se incluye en el <a class="elsevierStyleCrossRef" href="#sec0095">anexo A</a> de material suplementario&#44; se resumen las distintas t&#233;cnicas de ML para cada una de estas variantes&#46; El empleo de estas t&#233;cnicas requiere tener unos conocimientos en programaci&#243;n y un dominio de los conceptos utilizados en el campo de la IA que normalmente no est&#225;n al alcance del cl&#237;nico&#46; Por ello se va imponiendo un nuevo enfoque de trabajo colaborativo que incluye la aparici&#243;n en las unidades de un nuevo tipo de profesional&#44; con conocimientos cl&#237;nicos b&#225;sicos y dominio avanzado de la estad&#237;stica y de las herramientas y m&#233;todos de BDA y ML&#46; Estos profesionales&#44; trabajando codo con codo con los cl&#237;nicos&#44; pueden ayudarnos a extraer valor de la gran cantidad de informaci&#243;n cl&#237;nica que ahora mismo se encuentra almacenada en nuestras bases de datos&#46; Este <span class="elsevierStyleItalic">man in the middle</span>&#44; que empieza a aparecer ya en centros punteros en desarrollo tecnol&#243;gico&#44; ser&#225; en un futuro cercano una parte importante del equipo de nuestras unidades y ayudar&#225; a planificar las decisiones estrat&#233;gicas y a optimizar las herramientas inform&#225;ticas para obtener de ellas el m&#225;ximo rendimiento&#46;</p><p id="par0325" class="elsevierStylePara elsevierViewall">Para los lectores con conocimientos de R o Python que quieran adquirir pr&#225;ctica b&#225;sica en el campo del ML incluimos en el repositorio de GitHub asociado a esta revisi&#243;n &#40;<a href="https://github.com/anunezr/revision_medicina_intensiva">https&#58;&#47;&#47;github&#46;com&#47;anunezr&#47;revision&#95;medicina&#95;intensiva</a>&#41; una serie de scripts que utilizan las distintas t&#233;cnicas reflejadas en la tabla 1&#95;Sup sobre la base de datos anonimizada que se proporciona como ejemplo&#46;</p><p id="par0330" class="elsevierStylePara elsevierViewall">En la <a class="elsevierStyleCrossRef" href="#tbl0005">tabla 1</a> se muestra un &#171;mapa de ruta&#187; para poner en pr&#225;ctica un sistema de ML adaptado a un problema concreto<a class="elsevierStyleCrossRef" href="#bib0325"><span class="elsevierStyleSup">18</span></a>&#46; Cada uno de los aspectos que se contemplan dar&#237;a para una revisi&#243;n tan extensa o m&#225;s que este manuscrito&#46; El objeto de la tabla es hacer entender que el empleo de BDA y ML precisa de una metodolog&#237;a y una sistem&#225;tica compleja que requiere conocimientos y experiencia espec&#237;ficos para conseguir resultados&#46; Solo bajo estas premisas podremos extraer conocimiento de los datos eficazmente&#46;</p><elsevierMultimedia ident="tbl0005"></elsevierMultimedia></span><span id="sec0045" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0065">Herramientas</span><p id="par0335" class="elsevierStylePara elsevierViewall">Para poder hacer uso de las t&#233;cnicas de BDA y ML es necesario dominar al menos algunos de los lenguajes de computaci&#243;n estad&#237;stica para an&#225;lisis &#40;R&#44; Python o Java&#41;&#44; dominar SQL como herramienta de consulta de bases de datos y saber utilizar las bibliotecas de c&#243;digo que se utilizan en este campo&#46; En el ap&#233;ndice de material suplementario puede verse una breve rese&#241;a del software m&#225;s utilizado&#46;</p></span><span id="sec0050" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0070">Dificultades y estrategias para aplicar estas t&#233;cnicas en un servicio de medicina intensiva</span><p id="par0340" class="elsevierStylePara elsevierViewall">Despu&#233;s de esta ensalada de acr&#243;nimos y tecnicismos&#44; el intensivista de a pie tiende a preguntarse si realmente las t&#233;cnicas de BDA y ML pueden aplicarse a su entorno de trabajo&#44; y c&#243;mo hacerlo en la pr&#225;ctica de manera asequible&#46; En realidad&#44; el objetivo de esta revisi&#243;n es concienciar al cl&#237;nico de que entrar en el mundo de la inteligencia artificial aplicada a la medicina intensiva es posible&#44; pero exige cambios estructurales e inversi&#243;n en recursos humanos y tecnolog&#237;a&#44; as&#237; como una visi&#243;n ampliada del concepto de investigaci&#243;n cl&#237;nica&#46;</p><p id="par0345" class="elsevierStylePara elsevierViewall">El primer requisito&#44; l&#243;gicamente&#44; es un sistema de adquisici&#243;n y almacenamiento de los datos que permita su procesamiento anal&#237;tico posterior&#46; En Espa&#241;a todav&#237;a estamos muy lejos de conseguirlo&#44; ya que los sistemas de informaci&#243;n cl&#237;nica informatizados distan de tener una implantaci&#243;n universal en nuestras unidades&#44; por no hablar de un est&#225;ndar interhospitalario&#46; Adem&#225;s&#44; un gran n&#250;mero de las que poseen estas aplicaciones departamentales carecen de un acceso eficiente a los datos almacenados &#40;a menudo porque el contrato de adquisici&#243;n de los sistemas no incluy&#243; en su momento este aspecto&#44; que suele tener un coste adicional&#41;&#46; Estas situaciones parad&#243;jicas&#44; que rayan en la falta de &#233;tica al quedar los datos cl&#237;nicos &#171;prisioneros&#187; en manos de los proveedores del software comercial&#44; deben ser solventadas con urgencia si queremos empezar a trabajar con las nuevas herramientas de BDA y ML por el bien de nuestros pacientes&#46;</p><p id="par0350" class="elsevierStylePara elsevierViewall">En segundo lugar&#44; hace falta que los hospitales asignen personal especializado de los departamentos de tecnolog&#237;a de la informaci&#243;n a las labores de custodia&#44; procesamiento y an&#225;lisis de los datos cl&#237;nicos de nuestras unidades&#44; trabajando de manera colaborativa con los m&#233;dicos y enfermeras para conseguir obtener el m&#225;ximo rendimiento de la informaci&#243;n almacenada&#46;</p><p id="par0355" class="elsevierStylePara elsevierViewall">En tercer lugar&#44; es necesario aliarse y trabajar conjuntamente con los comit&#233;s de &#233;tica locales y regionales para conseguir garantizar por un lado la seguridad y la privacidad de los datos y&#44; por otro lado&#44; no ensombrecer las oportunidades de mejora de los procesos y la atenci&#243;n cl&#237;nica que la explotaci&#243;n de los datos almacenados puede proporcionarnos&#46;</p></span><span id="sec0055" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0075">Bases de datos compartidas</span><p id="par0360" class="elsevierStylePara elsevierViewall">Se conoce como an&#225;lisis secundario de las bases de datos de salud electr&#243;nicas &#40;<span class="elsevierStyleItalic">Electronic Health Records</span> &#91;EHR&#93;&#41;<a class="elsevierStyleCrossRef" href="#bib0330"><span class="elsevierStyleSup">19</span></a> al procesamiento que se realiza sobre los datos cl&#237;nicos de los pacientes generados como subproducto de su adquisici&#243;n con fines asistenciales y que puede utilizarse como ayuda en la toma de decisiones estrat&#233;gicas en una unidad o puntuales para un paciente concreto&#46;</p><p id="par0365" class="elsevierStylePara elsevierViewall">En un af&#225;n por potenciar la investigaci&#243;n cl&#237;nica en el &#225;mbito de la medicina intensiva&#44; algunas de las instituciones que disponen de bases de datos cl&#237;nicos muy extensas las han puesto a disposici&#243;n de los investigadores de todo el mundo tras un proceso de anonimizaci&#243;n para mantener la privacidad de los datos&#46; La m&#225;s popular en el momento actual es <span class="elsevierStyleItalic">Medical Information Mart in Intensive Care</span> &#40;MIMIC-III&#41;<a class="elsevierStyleCrossRefs" href="#bib0335"><span class="elsevierStyleSup">20&#44;21</span></a>&#44; que re&#250;ne como caracter&#237;sticas principales el ser de acceso p&#250;blico y presentar una excelente calidad de los datos incluidos&#44; que abarcan informaci&#243;n cl&#237;nica de todo tipo&#44; extra&#237;da de m&#225;s de 58&#46;000 pacientes cr&#237;ticos&#44; tanto adultos como neonatos&#46;</p><p id="par0370" class="elsevierStylePara elsevierViewall">Otro ejemplo de estas bases de datos ser&#237;a <span class="elsevierStyleItalic">eICU Collaborative Research Database</span><a class="elsevierStyleCrossRef" href="#bib0345"><span class="elsevierStyleSup">22</span></a>&#44; poblada con datos de una combinaci&#243;n de numerosas unidades de cuidados intensivos en todo el territorio continental de Estados Unidos&#46; Los registros de la base de datos colaborativa recogen informaci&#243;n de casi 200&#46;000 pacientes que fueron admitidos en las unidades de cuidados cr&#237;ticos en 2014 y 2015&#46;</p><p id="par0375" class="elsevierStylePara elsevierViewall">Como podemos imaginar&#44; aunque este an&#225;lisis secundario puede ser de gran utilidad para un servicio de medicina intensiva o para un investigador cl&#237;nico&#44; su proyecci&#243;n se ve incrementada si los datos de varias unidades pueden combinarse para formar una gran base de datos multic&#233;ntrica&#46; El efecto es similar al que sucede cuando consideramos las conclusiones que pueden obtenerse de un ensayo cl&#237;nico realizado en un &#250;nico centro con respecto a un ensayo multic&#233;ntrico&#46;</p><p id="par0380" class="elsevierStylePara elsevierViewall">Sin embargo&#44; para poder llegar a este objetivo es necesario vencer una serie de dificultades&#46;</p><p id="par0385" class="elsevierStylePara elsevierViewall">Cada unidad recoge los datos en una herramienta de software que puede no ser la misma en todas las unidades cuyos datos se quieren agrupar&#46; Por tanto&#44; hay que realizar un proceso de conversi&#243;n a una estructura de datos com&#250;n que permita su an&#225;lisis conjunto&#46; Esto es lo que antes hemos denominado &#171;mapeo&#187;&#46; Para ello han surgido ontolog&#237;as que permiten expresar y mapear los conceptos almacenados de manera uniforme&#46; Algunas de ellas&#44; como <span class="elsevierStyleItalic">Observational Medical Outcomes Partnership</span> &#40;OMOP&#41;<a class="elsevierStyleCrossRef" href="#bib0285"><span class="elsevierStyleSup">10</span></a> o <span class="elsevierStyleItalic">Informatics for Integrating Biology and the Bedside</span> &#40;i2b2&#41;<a class="elsevierStyleCrossRef" href="#bib0350"><span class="elsevierStyleSup">23</span></a>&#44; ofrecen herramientas para facilitar la migraci&#243;n de la base de datos local a un est&#225;ndar com&#250;n de datos&#46;</p><p id="par0390" class="elsevierStylePara elsevierViewall">Si tenemos en cuenta &#250;nicamente los estudios publicados en los &#250;ltimos a&#241;os utilizando la base de datos p&#250;blica MIMIC<a class="elsevierStyleCrossRef" href="#bib0335"><span class="elsevierStyleSup">20</span></a> y bibliotecas de software con algoritmos de &#250;ltima generaci&#243;n y acceso gratuito&#44; nos encontramos con que se han obtenido resultados interesantes en campos muy diversos de la medicina intensiva&#44; que se muestran en la <a class="elsevierStyleCrossRef" href="#tbl0010">tabla 2</a>&#46;</p><elsevierMultimedia ident="tbl0010"></elsevierMultimedia><p id="par0395" class="elsevierStylePara elsevierViewall">Adem&#225;s&#44; una ventaja de esta estrategia es que los resultados son completamente reproducibles&#58; podemos tomar el conjunto de datos que han utilizado los autores y reproducir los m&#233;todos estad&#237;sticos y de aprendizaje m&#225;quina que han utilizado&#44; incluso con nuestros propios datos&#44; ya que est&#225;n disponibles habitualmente en repositorios p&#250;blicos como GitHub<a class="elsevierStyleCrossRefs" href="#bib0355"><span class="elsevierStyleSup">24&#44;25</span></a>&#46; Esto hace que los estudios est&#233;n sometidos a un control de calidad adicional y que cualquiera pueda revisar tanto m&#233;todos y como resultados&#46;</p><p id="par0400" class="elsevierStylePara elsevierViewall">Existen condicionantes de tipo legal y &#233;tico que pueden dificultar el proceso de compartici&#243;n de los datos&#44; y puede ser necesario que los comit&#233;s de &#233;tica locales autoricen el acceso y verifiquen la salvaguarda de la privacidad y la seguridad de los datos&#46;</p><p id="par0405" class="elsevierStylePara elsevierViewall">La log&#237;stica del proceso requiere una acci&#243;n coordinada entre los centros participantes y un soporte tecnol&#243;gico y de hardware en consonancia con el proyecto a trav&#233;s de equipos multidisciplinares que puedan hacer frente a los retos que las distintas facetas de tama&#241;a empresa requieren&#46;</p><p id="par0410" class="elsevierStylePara elsevierViewall">Una vez superadas estas dificultades&#44; las oportunidades de mejora de la gesti&#243;n&#44; de <span class="elsevierStyleItalic">benchmarking</span> y de avance en la investigaci&#243;n cl&#237;nica son enormes&#44; y sin duda compensar&#225;n el esfuerzo que la incorporaci&#243;n de un servicio de medicina intensiva en un proyecto de este tipo supone&#46;</p></span><span id="sec0060" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0080">Procesamiento del lenguaje natural</span><p id="par0415" class="elsevierStylePara elsevierViewall">Dado que la mayor&#237;a de la informaci&#243;n que el profesional introduce en la historia cl&#237;nica est&#225; en formato de texto libre &#40;tambi&#233;n conocido como lenguaje natural&#41;&#44; un posible campo de aplicaci&#243;n de las t&#233;cnicas de inteligencia artificial a la medicina es la creaci&#243;n de informaci&#243;n estructurada a partir del texto libre de manera autom&#225;tica&#44; as&#237; como la clasificaci&#243;n o fenotipado de los pacientes en distintos grupos en funci&#243;n del contenido de lo escrito por los profesionales&#46; Estas t&#233;cnicas&#44; conocidas como procesamiento del lenguaje natural &#40;<span class="elsevierStyleItalic">Natural Language Processing</span> &#91;NLP&#93;&#41;&#44; est&#225;n avanzando r&#225;pidamente<a class="elsevierStyleCrossRef" href="#bib0365"><span class="elsevierStyleSup">26</span></a>&#46; Existen dos posibles enfoques&#58;<ul class="elsevierStyleList" id="lis0010"><li class="elsevierStyleListItem" id="lsti0020"><span class="elsevierStyleLabel">&#8226;</span><p id="par0420" class="elsevierStylePara elsevierViewall">La estrategia de extracci&#243;n de conceptos a partir del texto utilizando herramientas como cTAKES<a class="elsevierStyleCrossRef" href="#bib0370"><span class="elsevierStyleSup">27</span></a> est&#225; bastante desarrollada en el mundo anglosaj&#243;n&#44; pero existen pocas opciones pr&#225;cticas para texto no escrito en ingl&#233;s&#46; El grupo de Investigaci&#243;n en Miner&#237;a de Datos del Centro de Tecnolog&#237;a Biom&#233;dica de la Universidad Polit&#233;cnica de Madrid est&#225; trabajando con una herramienta derivada de cTAKES llamada TIDA<a class="elsevierStyleCrossRef" href="#bib0375"><span class="elsevierStyleSup">28</span></a>&#44; y es posible que en el futuro este tipo de sistemas se incorporen a nuestro arsenal inform&#225;tico&#46;</p></li><li class="elsevierStyleListItem" id="lsti0025"><span class="elsevierStyleLabel">&#8226;</span><p id="par0425" class="elsevierStylePara elsevierViewall">Como alternativa est&#225; el empleo de redes neuronales convolucionales &#40;CNN&#41;<a class="elsevierStyleCrossRef" href="#bib0380"><span class="elsevierStyleSup">29</span></a>&#44; pero este tipo de estrategia tiene el inconveniente de que los algoritmos que se obtienen no son f&#225;cilmente interpretables por el m&#233;dico &#40;aunque si el modelo funciona correctamente esto puede ser irrelevante&#41;&#44; y sus resultados son variables dependiendo de los fenotipos buscados&#46;</p></li></ul></p></span><span id="sec0065" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0085">An&#225;lisis retrospectivo de Big Data versus ensayos cl&#237;nicos aleatorizados</span><p id="par0430" class="elsevierStylePara elsevierViewall">Dado que los datos cl&#237;nicos que se almacenan en nuestros sistemas de informaci&#243;n cl&#237;nica no se recogen con la misma exigencia que aplicamos a los ensayos cl&#237;nicos&#44; &#191;c&#243;mo es posible que el an&#225;lisis secundario de los datos asistenciales nos proporcione conclusiones fiables&#63; La clave est&#225; en el volumen de datos y en la capacidad de las herramientas de ML de detectar estructura en medio del caos<a class="elsevierStyleCrossRef" href="#bib0330"><span class="elsevierStyleSup">19</span></a>&#46; Podemos utilizar como ejemplo el seguimiento que se realiz&#243; de la incidencia de la gripe H1N1 durante la epidemia de 2008 mediante el contaje de las b&#250;squedas en Google utilizando el t&#233;rmino &#171;gripe&#187;<a class="elsevierStyleCrossRef" href="#bib0305"><span class="elsevierStyleSup">14</span></a>&#44; que se ha seguido validando posteriormente &#40;<a class="elsevierStyleCrossRef" href="#fig0015">fig&#46; 3</a>&#41;&#44; y que se correlaciona perfectamente con los registros de casos obtenidos mediante m&#233;todos m&#225;s ortodoxos&#46;</p><elsevierMultimedia ident="fig0015"></elsevierMultimedia><p id="par0435" class="elsevierStylePara elsevierViewall">Aunque hasta ahora no podemos decir que BDA y ML hayan desbancado a los m&#233;todos tradicionales de investigaci&#243;n cl&#237;nica&#44; s&#237; es cierto que permiten la detecci&#243;n de tendencias o patrones en grandes conjuntos de datos que pueden pasar desapercibidos al investigador y que pueden guiar el dise&#241;o de nuevos estudios que se atengan a la metodolog&#237;a convencional<a class="elsevierStyleCrossRef" href="#bib0385"><span class="elsevierStyleSup">30</span></a>&#46; Adem&#225;s&#44; son la &#250;nica alternativa en aquellas situaciones en las que no es posible log&#237;sticamente plantearse un ensayo cl&#237;nico ortodoxo con suficiente poder estad&#237;stico para resolver una pregunta relevante&#46;</p></span><span id="sec0070" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0090">Cuestiones &#233;ticas y legales</span><p id="par0440" class="elsevierStylePara elsevierViewall">En un reciente art&#237;culo en <span class="elsevierStyleItalic">Intensive Care Medicine</span>&#44; McLennan et al&#46;<a class="elsevierStyleCrossRef" href="#bib0390"><span class="elsevierStyleSup">31</span></a> hacen un excelente an&#225;lisis de los problemas que la compartici&#243;n de datos cl&#237;nicos incluidos en bases de datos asistenciales puede generar&#46; Desde la puesta en vigor de la directiva general europea sobre protecci&#243;n de datos &#40;GDPR&#41;<a class="elsevierStyleCrossRef" href="#bib0395"><span class="elsevierStyleSup">32</span></a> en mayo de 2018&#44; las instituciones han de cumplir una normativa con respecto al manejo de los datos personales de pacientes que residen en la Uni&#243;n Europea&#46; El equivalente que impera en Estados Unidos de Am&#233;rica es conocida como <span class="elsevierStyleItalic">Health Insurance Portability and Accountability Act</span> &#40;HIPAA&#41;&#44; de 1996<a class="elsevierStyleCrossRef" href="#bib0400"><span class="elsevierStyleSup">33</span></a>&#46;</p><p id="par0445" class="elsevierStylePara elsevierViewall">El aspecto clave es la anonimizaci&#243;n de los datos&#58; si los datos son completamente an&#243;nimos&#44; no hay problema legal en su compartici&#243;n desde el punto de vista de los derechos de privacidad y seguridad&#46; Pero &#191;cu&#225;ndo podemos considerar nuestros datos completamente an&#243;nimos&#63; &#218;nicamente cuando no lleven a la identificaci&#243;n un&#237;voca del paciente cuando se complementan con otros datos &#40;por ejemplo&#44; aunque no sepamos el nombre del paciente o su n&#250;mero de historia&#44; si sabemos la fecha de ingreso y la edad podemos llegar a identificar de qu&#233; paciente se trata&#41;&#46; Tambi&#233;n debe evitarse la identificaci&#243;n un&#237;voca del personal sanitario que aparece en la historia cl&#237;nica del paciente&#46; En todos los dem&#225;s casos se considera que los datos est&#225;n pseudoanonimizados&#44; y en ese caso estar&#237;amos obligados&#44; seg&#250;n la directiva GDPR&#44; a pedir consentimiento al paciente para su utilizaci&#243;n&#46;</p><p id="par0450" class="elsevierStylePara elsevierViewall">Por ello resulta crucial el paso de anonimizaci&#243;n de las bases de datos y es necesario estandarizar un proceso que permita cumplir la normativa europea perdiendo el m&#237;nimo valor posible de la informaci&#243;n&#46; Los investigadores deben trabajar juntamente con los comit&#233;s de &#233;tica locales para armonizar la salvaguarda de la privacidad y seguridad de los datos con los avances en la investigaci&#243;n cl&#237;nica que las nuevas herramientas de BDA nos pueden proporcionar en el futuro&#46; Deben desarrollarse mecanismos que faciliten el consentimiento del paciente &#40;o su retirada&#41; a la utilizaci&#243;n de los datos generados en su proceso asistencial y convenientemente anonimizados para la investigaci&#243;n cl&#237;nica&#46;</p><p id="par0455" class="elsevierStylePara elsevierViewall">Otro aspecto importante que tratar es el tema de la propiedad de los datos&#46; En este caso estamos enfocando ya no aspectos de seguridad o privacidad&#44; sino m&#225;s bien su valor intr&#237;nseco &#40;incluso como bien comercial&#41;&#46; &#191;Tienen el paciente &#40;origen de los datos&#41; o el cl&#237;nico &#40;actor del proceso que introduce la informaci&#243;n en el sistema&#41; derecho a exigir una compensaci&#243;n econ&#243;mica o a prohibir el empleo de los datos para investigaci&#243;n cl&#237;nica o cualquier otro uso&#63; Aunque la realidad actual es que los datos est&#225;n frecuentemente en manos de las empresas desarrolladoras del software sanitario&#44; que son las que pretenden obtener un beneficio comercial por su explotaci&#243;n<a class="elsevierStyleCrossRef" href="#bib0405"><span class="elsevierStyleSup">34</span></a>&#44; este aspecto est&#225; hoy en d&#237;a sometido a una gran controversia y ser&#237;a deseable una clarificaci&#243;n por parte del legislador para resolver los problemas que ahora mismo se plantean&#46;</p></span><span id="sec0075" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0095">Conclusiones</span><p id="par0460" class="elsevierStylePara elsevierViewall">Las herramientas de Big Data Analysis y Machine Learning suponen una gran oportunidad para mejorar la gesti&#243;n estrat&#233;gica de las unidades&#44; el manejo de casos cl&#237;nicos concretos y la investigaci&#243;n cl&#237;nica&#46; Sin embargo&#44; para poder aprovechar esta nueva metodolog&#237;a necesitamos evolucionar incorporando nuevos recursos humanos &#40;personal especializado con conocimientos cl&#237;nicos y entrenamiento en inteligencia artificial&#41; y tecnol&#243;gicos&#46; Adem&#225;s&#44; debemos ser capaces de armonizar los condicionantes de privacidad y seguridad de los datos de nuestros pacientes con la posibilidad de utilizar grandes bases de datos cl&#237;nicas de manera eficiente&#46;</p><p id="par0465" class="elsevierStylePara elsevierViewall">Los autores estamos convencidos de que un equipo internacional y multidisciplinar&#44; que trabaje colectivamente para extraer conocimiento de grandes conjuntos de datos cl&#237;nicos seg&#250;n se ha explicado a lo largo de este manuscrito&#44; puede traer una revoluci&#243;n a la pr&#225;ctica moderna de la atenci&#243;n al paciente cr&#237;tico&#46;</p></span><span id="sec0080" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0100">Financiaci&#243;n</span><p id="par0470" class="elsevierStylePara elsevierViewall">Los autores no han recibido ning&#250;n soporte econ&#243;mico para la realizaci&#243;n del manuscrito&#46;</p></span><span id="sec0085" class="elsevierStyleSection elsevierViewall"><span class="elsevierStyleSectionTitle" id="sect0105">Conflicto de intereses</span><p id="par0475" class="elsevierStylePara elsevierViewall">Los autores declaran no tener ning&#250;n conflicto de intereses en relaci&#243;n con el contenido del art&#237;culo&#46;</p></span></span>
      """
    "textoCompletoSecciones" => array:1 [
      "secciones" => array:18 [
        0 => array:3 [
          "identificador" => "xres1252600"
          "titulo" => "Resumen"
          "secciones" => array:1 [
            0 => array:1 [
              "identificador" => "abst0005"
            ]
          ]
        ]
        1 => array:2 [
          "identificador" => "xpalclavsec1161035"
          "titulo" => "Palabras clave"
        ]
        2 => array:3 [
          "identificador" => "xres1252599"
          "titulo" => "Abstract"
          "secciones" => array:1 [
            0 => array:1 [
              "identificador" => "abst0010"
            ]
          ]
        ]
        3 => array:2 [
          "identificador" => "xpalclavsec1161036"
          "titulo" => "Keywords"
        ]
        4 => array:2 [
          "identificador" => "sec0005"
          "titulo" => "Introducci&#243;n"
        ]
        5 => array:3 [
          "identificador" => "sec0010"
          "titulo" => "Flujo de datos en medicina intensiva"
          "secciones" => array:2 [
            0 => array:2 [
              "identificador" => "sec0015"
              "titulo" => "Entrada de datos"
            ]
            1 => array:3 [
              "identificador" => "sec0020"
              "titulo" => "Procesamiento de los datos en vivo"
              "secciones" => array:2 [
                0 => array:2 [
                  "identificador" => "sec0025"
                  "titulo" => "Almacenamiento de los datos"
                ]
                1 => array:2 [
                  "identificador" => "sec0030"
                  "titulo" => "An&#225;lisis de los datos a posteriori y compartici&#243;n de la informaci&#243;n"
                ]
              ]
            ]
          ]
        ]
        6 => array:2 [
          "identificador" => "sec0035"
          "titulo" => "&#191;Qu&#233; es Big Data&#63;"
        ]
        7 => array:2 [
          "identificador" => "sec0040"
          "titulo" => "&#191;Qu&#233; es Machine Learning&#63;"
        ]
        8 => array:2 [
          "identificador" => "sec0045"
          "titulo" => "Herramientas"
        ]
        9 => array:2 [
          "identificador" => "sec0050"
          "titulo" => "Dificultades y estrategias para aplicar estas t&#233;cnicas en un servicio de medicina intensiva"
        ]
        10 => array:2 [
          "identificador" => "sec0055"
          "titulo" => "Bases de datos compartidas"
        ]
        11 => array:2 [
          "identificador" => "sec0060"
          "titulo" => "Procesamiento del lenguaje natural"
        ]
        12 => array:2 [
          "identificador" => "sec0065"
          "titulo" => "An&#225;lisis retrospectivo de Big Data versus ensayos cl&#237;nicos aleatorizados"
        ]
        13 => array:2 [
          "identificador" => "sec0070"
          "titulo" => "Cuestiones &#233;ticas y legales"
        ]
        14 => array:2 [
          "identificador" => "sec0075"
          "titulo" => "Conclusiones"
        ]
        15 => array:2 [
          "identificador" => "sec0080"
          "titulo" => "Financiaci&#243;n"
        ]
        16 => array:2 [
          "identificador" => "sec0085"
          "titulo" => "Conflicto de intereses"
        ]
        17 => array:1 [
          "titulo" => "Bibliograf&#237;a"
        ]
      ]
    ]
    "pdfFichero" => "main.pdf"
    "tienePdf" => true
    "fechaRecibido" => "2018-09-05"
    "fechaAceptado" => "2018-10-21"
    "PalabrasClave" => array:2 [
      "es" => array:1 [
        0 => array:4 [
          "clase" => "keyword"
          "titulo" => "Palabras clave"
          "identificador" => "xpalclavsec1161035"
          "palabras" => array:4 [
            0 => "Big Data Analysis"
            1 => "Machine Learning"
            2 => "Inteligencia artificial"
            3 => "An&#225;lisis secundario de datos cl&#237;nicos electr&#243;nicos"
          ]
        ]
      ]
      "en" => array:1 [
        0 => array:4 [
          "clase" => "keyword"
          "titulo" => "Keywords"
          "identificador" => "xpalclavsec1161036"
          "palabras" => array:4 [
            0 => "Big Data Analysis"
            1 => "Machine Learning"
            2 => "Artificial intelligence"
            3 => "Secondary electronic health record data analysis"
          ]
        ]
      ]
    ]
    "tieneResumen" => true
    "resumen" => array:2 [
      "es" => array:2 [
        "titulo" => "Resumen"
        "resumen" => "<span id="abst0005" class="elsevierStyleSection elsevierViewall"><p id="spar0005" class="elsevierStyleSimplePara elsevierViewall">La gran cantidad de informaci&#243;n que se procesa inform&#225;ticamente en el entorno de la medicina intensiva la convierte en un campo ideal para el empleo de t&#233;cnicas conocidas como Big Data Analysis &#40;BDA&#41; y Machine Learning &#40;ML&#41;&#44; que pueden permitir en el futuro mejorar nuestra capacidad de investigaci&#243;n cl&#237;nica y dirigir de manera m&#225;s precisa las terapias que proporcionamos a nuestros pacientes&#46;</p><p id="spar0010" class="elsevierStyleSimplePara elsevierViewall">En este art&#237;culo se revisan los conceptos fundamentales sobre BDA y ML&#44; y se estudian sus posibles aplicaciones al &#225;mbito de la medicina intensiva&#44; desde un punto de vista del cl&#237;nico&#46; Tambi&#233;n se plantean potenciales estrategias para sacar el m&#225;ximo partido a estas tecnolog&#237;as emergentes&#44; incluyendo la aparici&#243;n de un nuevo tipo de profesional sanitario encargado de actuar como enlace entre la parte cl&#237;nica y la ingenier&#237;a de datos&#46;</p></span>"
      ]
      "en" => array:2 [
        "titulo" => "Abstract"
        "resumen" => "<span id="abst0010" class="elsevierStyleSection elsevierViewall"><p id="spar0015" class="elsevierStyleSimplePara elsevierViewall">Intensive care is an ideal environment for the use of Big Data Analysis &#40;BDA&#41; and Machine Learning &#40;ML&#41;&#44; due to the huge amount of information processed and stored in electronic format in relation to such care&#46; These tools can improve our clinical research capabilities and clinical decision making in the future&#46;</p><p id="spar0020" class="elsevierStyleSimplePara elsevierViewall">The present study reviews the foundations of BDA and ML&#44; and explores possible applications in our field from a clinical viewpoint&#46; We also suggest potential strategies to optimize these new technologies and describe a new kind of hybrid healthcare-data science professional with a linking role between clinicians and data&#46;</p></span>"
      ]
    ]
    "apendice" => array:1 [
      0 => array:1 [
        "seccion" => array:1 [
          0 => array:4 [
            "apendice" => "<p id="par0485" class="elsevierStylePara elsevierViewall"><elsevierMultimedia ident="upi0005"></elsevierMultimedia></p>"
            "etiqueta" => "Anexo A"
            "titulo" => "Material suplementario"
            "identificador" => "sec0095"
          ]
        ]
      ]
    ]
    "multimedia" => array:6 [
      0 => array:7 [
        "identificador" => "fig0005"
        "etiqueta" => "Figura 1"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "gr1.jpeg"
            "Alto" => 1495
            "Ancho" => 2167
            "Tamanyo" => 208955
          ]
        ]
        "descripcion" => array:1 [
          "es" => "<p id="spar0025" class="elsevierStyleSimplePara elsevierViewall">Flujo de datos en medicina intensiva&#46; La calidad de la asistencia y de la toma de decisiones estrat&#233;gicas depende del procesamiento de la informaci&#243;n presente en el repositorio activo de datos &#40;informaci&#243;n que se va generando en cada momento y que est&#225; disponible para tomar decisiones&#41; y de la reutilizaci&#243;n de conocimiento previo almacenado en bases de datos locales o compartidas&#46; El procesamiento autom&#225;tico de la informaci&#243;n mediante Machine Learning &#40;ML&#41; y la posibilidad de acceso r&#225;pido a grandes cantidades de datos de estructura heterog&#233;nea mediante Big Data Analysis &#40;BDA&#41; permite mejorar los procesos asistenciales y extraer conocimiento de los datos&#46;</p> <p id="spar0030" class="elsevierStyleSimplePara elsevierViewall">Adaptada de Celi et al&#46;<a class="elsevierStyleCrossRef" href="#bib0295"><span class="elsevierStyleSup">12</span></a>&#44; con permiso de los autores&#46;</p>"
        ]
      ]
      1 => array:7 [
        "identificador" => "fig0010"
        "etiqueta" => "Figura 2"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "gr2.jpeg"
            "Alto" => 1425
            "Ancho" => 2901
            "Tamanyo" => 240715
          ]
        ]
        "descripcion" => array:1 [
          "es" => "<p id="spar0035" class="elsevierStyleSimplePara elsevierViewall">Estructura t&#237;pica de un <span class="elsevierStyleItalic">dataframe</span>&#44; constituido por filas por cada registro con un identificador anonimizado y columnas donde se almacenan los valores de distintas variables para cada caso&#46; En la &#250;ltima columna en este caso se muestra la variable objetivo &#40;en este caso mortalidad&#41;&#46; Aqu&#237; podemos ver una secci&#243;n de unos cuantos registros de la base de datos que se utiliza como ejemplo en el material incluido en el repositorio de GitHub&#46;</p>"
        ]
      ]
      2 => array:7 [
        "identificador" => "fig0015"
        "etiqueta" => "Figura 3"
        "tipo" => "MULTIMEDIAFIGURA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "figura" => array:1 [
          0 => array:4 [
            "imagen" => "gr3.jpeg"
            "Alto" => 2119
            "Ancho" => 2479
            "Tamanyo" => 266715
          ]
        ]
        "descripcion" => array:1 [
          "es" => "<p id="spar0040" class="elsevierStyleSimplePara elsevierViewall">Uno de los primeros ejemplos de la aplicaci&#243;n del an&#225;lisis de Big Data a la investigaci&#243;n cl&#237;nica&#46; Durante la epidemia de gripe N1H1 de 2008&#44; las b&#250;squedas en Google del t&#233;rmino &#171;gripe&#187; o sus s&#237;ntomas predijeron con gran precisi&#243;n el aumento de casos y la severidad del cuadro&#46; En la imagen superior puede visualizarse la cantidad de b&#250;squedas y en la imagen inferior la evoluci&#243;n de los casos seg&#250;n el Sistema de Vigilancia Oficial de Gripe en Espa&#241;a &#40;las escalas de tiempo est&#225;n ajustadas para que se correspondan verticalmente ambos gr&#225;ficos&#41;&#46; Este hallazgo ha sido utilizado posteriormente como sistema de vigilancia epidemiol&#243;gico con gran &#233;xito&#46;</p>"
        ]
      ]
      3 => array:8 [
        "identificador" => "tbl0005"
        "etiqueta" => "Tabla 1"
        "tipo" => "MULTIMEDIATABLA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "detalles" => array:1 [
          0 => array:3 [
            "identificador" => "at1"
            "detalle" => "Tabla "
            "rol" => "short"
          ]
        ]
        "tabla" => array:1 [
          "tablatextoimagen" => array:1 [
            0 => array:2 [
              "tabla" => array:1 [
                0 => """
                  <table border="0" frame="\n
                  \t\t\t\t\tvoid\n
                  \t\t\t\t" class=""><tbody title="tbody"><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleItalic">Limpieza&#44; reorganizaci&#243;n y preprocesamiento</span>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Una vez extra&#237;dos los datos se procede a verificar su calidad y darles el formato y escala adecuados&#44; resolviendo problemas de ausencias e inconsistencias para prepararlos para ser procesados por el modelo correspondiente&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Son de hecho estas primeras dos tareas las que consumen la mayor parte del tiempo en un proyecto Big Data Analysis &#40;BDA&#41; y&#47;o Machine Learning &#40;ML&#41;&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleItalic">Selecci&#243;n de atributos</span>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Escoger qu&#233; variables se van a utilizar en el proceso de aprendizaje&#44; reduciendo al m&#237;nimo posible su n&#250;mero y dimensionalidad&#46; Sin embargo&#44; una ventaja del ML frente a modelos de estad&#237;stica convencional es que es capaz de asimilar mayor cantidad de variables y&#44; bas&#225;ndose en ellas&#44; hacer predicciones m&#225;s potentes&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleItalic">Creaci&#243;n de los datasets de entrenamiento y validaci&#243;n</span>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Decidir el tipo de muestreo y c&#243;mo vamos a dividir los conjuntos de datos entre entrenamiento&#44; validaci&#243;n y prueba&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleItalic">Selecci&#243;n del modelo y ajuste hiperparam&#233;trico</span>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Escoger los algoritmos de aprendizaje que vamos a utilizar &#40;selecci&#243;n de modelo&#44; validaci&#243;n cruzada&#44; m&#233;tricas de resultados&#44; optimizaci&#243;n de hiperpar&#225;metros&#41;&#46; Comparar los resultados entre los distintos algoritmos y modelos utilizados&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Evaluaci&#243;n del funcionamiento del modelo elegido&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleItalic">Predicci&#243;n</span>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t"><span class="elsevierStyleHsp" style=""></span>Empleo del modelo en nuevos casos y reevaluaci&#243;n de su funcionamiento&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr></tbody></table>
                  """
              ]
              "imagenFichero" => array:1 [
                0 => "xTab2142613.png"
              ]
            ]
          ]
        ]
        "descripcion" => array:1 [
          "es" => "<p id="spar0045" class="elsevierStyleSimplePara elsevierViewall">Pasos a seguir para construir un sistema de Machine Learning</p>"
        ]
      ]
      4 => array:8 [
        "identificador" => "tbl0010"
        "etiqueta" => "Tabla 2"
        "tipo" => "MULTIMEDIATABLA"
        "mostrarFloat" => true
        "mostrarDisplay" => false
        "detalles" => array:1 [
          0 => array:3 [
            "identificador" => "at2"
            "detalle" => "Tabla "
            "rol" => "short"
          ]
        ]
        "tabla" => array:1 [
          "tablatextoimagen" => array:1 [
            0 => array:2 [
              "tabla" => array:1 [
                0 => """
                  <table border="0" frame="\n
                  \t\t\t\t\tvoid\n
                  \t\t\t\t" class=""><tbody title="tbody"><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La utilidad del uso la ecocardiograf&#237;a en la sepsis<a class="elsevierStyleCrossRef" href="#bib0410"><span class="elsevierStyleSup">35</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La utilidad de conocer la variabilidad de los niveles de glucosa en sangre en el pron&#243;stico de los pacientes no diab&#233;ticos<a class="elsevierStyleCrossRef" href="#bib0415"><span class="elsevierStyleSup">36</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La mejora en la predicci&#243;n de mortalidad en UCI en funci&#243;n de par&#225;metros fisiol&#243;gicos<a class="elsevierStyleCrossRef" href="#bib0420"><span class="elsevierStyleSup">37</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La detecci&#243;n precoz de la sepsis<a class="elsevierStyleCrossRef" href="#bib0425"><span class="elsevierStyleSup">38</span></a> y la posibilidad de generar una alerta precoz en los pacientes con alto riesgo de desarrollar shock s&#233;ptico<a class="elsevierStyleCrossRef" href="#bib0430"><span class="elsevierStyleSup">39</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La diferencia entre los objetivos de balance h&#237;drico a establecer entre las primeras y las segundas 24<span class="elsevierStyleHsp" style=""></span>h de resucitaci&#243;n de la sepsis<a class="elsevierStyleCrossRef" href="#bib0435"><span class="elsevierStyleSup">40</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">El valor predictivo de las notas de enfermer&#237;a en el pron&#243;stico a largo plazo de los pacientes<a class="elsevierStyleCrossRef" href="#bib0440"><span class="elsevierStyleSup">41</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La utilidad del drenaje precoz de la v&#237;a biliar en la colangitis aguda<a class="elsevierStyleCrossRef" href="#bib0445"><span class="elsevierStyleSup">42</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La capacidad de las herramientas de procesamiento de lenguaje natural para detectar diagn&#243;sticos no codificados en notas de texto libre<a class="elsevierStyleCrossRef" href="#bib0380"><span class="elsevierStyleSup">29</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">El valor pron&#243;stico negativo de la taquicardia prolongada<a class="elsevierStyleCrossRef" href="#bib0450"><span class="elsevierStyleSup">43</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La parad&#243;jica relaci&#243;n entre obesidad y mortalidad en UCI en pacientes con patolog&#237;as cr&#243;nicas<a class="elsevierStyleCrossRef" href="#bib0455"><span class="elsevierStyleSup">44</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">La predicci&#243;n de los reingresos precoces no deseados<a class="elsevierStyleCrossRef" href="#bib0460"><span class="elsevierStyleSup">45</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">El empleo de variables cl&#237;nicas adicionales para ajustar mejor las dosis de heparina en perfusi&#243;n<a class="elsevierStyleCrossRef" href="#bib0465"><span class="elsevierStyleSup">46</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr><tr title="table-row"><td class="td-with-role" title="\n
                  \t\t\t\t\ttable-entry\n
                  \t\t\t\t ; entry_with_role_rowhead " align="left" valign="\n
                  \t\t\t\t\ttop\n
                  \t\t\t\t">El peor pron&#243;stico que presentan tras ingresar en UCI pacientes que toman inhibidores de la recaptaci&#243;n de serotonina<a class="elsevierStyleCrossRef" href="#bib0470"><span class="elsevierStyleSup">47</span></a>&nbsp;\t\t\t\t\t\t\n
                  \t\t\t\t</td></tr></tbody></table>
                  """
              ]
              "imagenFichero" => array:1 [
                0 => "xTab2142612.png"
              ]
            ]
          ]
        ]
        "descripcion" => array:1 [
          "es" => "<p id="spar0050" class="elsevierStyleSimplePara elsevierViewall">Aspectos de investigaci&#243;n cl&#237;nica estudiados mediante t&#233;cnicas de Big Data Analysis y Machine Learning</p>"
        ]
      ]
      5 => array:5 [
        "identificador" => "upi0005"
        "tipo" => "MULTIMEDIAECOMPONENTE"
        "mostrarFloat" => false
        "mostrarDisplay" => true
        "Ecomponente" => array:2 [
          "fichero" => "mmc1.pdf"
          "ficheroTamanyo" => 124312
        ]
      ]
    ]
    "bibliografia" => array:2 [
      "titulo" => "Bibliograf&#237;a"
      "seccion" => array:1 [
        0 => array:2 [
          "identificador" => "bibs0015"
          "bibliografiaReferencia" => array:47 [
            0 => array:3 [
              "identificador" => "bib0240"
              "etiqueta" => "1"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Natural language processing techniques for extracting and categorizing finding measurements in narrative radiology reports"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:5 [
                            0 => "M&#46; Sevenster"
                            1 => "J&#46; Buurman"
                            2 => "P&#46; Liu"
                            3 => "J&#46;F&#46; Peters"
                            4 => "P&#46;J&#46; Chang"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.4338/ACI-2014-11-RA-0110"
                      "Revista" => array:6 [
                        "tituloSerie" => "Appl Clin Inform&#46;"
                        "fecha" => "2015"
                        "volumen" => "6"
                        "paginaInicial" => "600"
                        "paginaFinal" => "610"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/26448801"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            1 => array:3 [
              "identificador" => "bib0245"
              "etiqueta" => "2"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Tethered to the EHR&#58; Primary care physician workload assessment using EHR event log data and time-motion observations"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "B&#46;G&#46; Arndt"
                            1 => "J&#46;W&#46; Beasley"
                            2 => "M&#46;D&#46; Watkinson"
                            3 => "J&#46;L&#46; Temte"
                            4 => "W&#46;J&#46; Tuan"
                            5 => "C&#46;A&#46; Sinsky"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Ann Fam Med&#46;"
                        "fecha" => "2017"
                        "volumen" => "15"
                        "paginaInicial" => "419"
                        "paginaFinal" => "426"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            2 => array:3 [
              "identificador" => "bib0250"
              "etiqueta" => "3"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "SNOMED International&#46; SNOMED 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;snomed&#46;org&#47;"
                ]
              ]
            ]
            3 => array:3 [
              "identificador" => "bib0255"
              "etiqueta" => "4"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "HL7&#46; HL7 Standards 2018&#46; Disponible en&#58; http&#58;&#47;&#47;www&#46;hl7&#46;org&#47;"
                ]
              ]
            ]
            4 => array:3 [
              "identificador" => "bib0260"
              "etiqueta" => "5"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "NIH&#46; UMLS 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;nlm&#46;nih&#46;gov&#47;research&#47;umls&#47;"
                ]
              ]
            ]
            5 => array:3 [
              "identificador" => "bib0265"
              "etiqueta" => "6"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "DICOM&#46; DICOM 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;dicomstandard&#46;org&#47;"
                ]
              ]
            ]
            6 => array:3 [
              "identificador" => "bib0270"
              "etiqueta" => "7"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Institute R&#46; LOINC 2018&#46; Disponible en&#58; https&#58;&#47;&#47;loinc&#46;org&#47;"
                ]
              ]
            ]
            7 => array:3 [
              "identificador" => "bib0275"
              "etiqueta" => "8"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "NIH&#46; Medical Subject Headings 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;ncbi&#46;nlm&#46;nih&#46;gov&#47;mesh"
                ]
              ]
            ]
            8 => array:3 [
              "identificador" => "bib0280"
              "etiqueta" => "9"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Diseases ICo&#46; CIE 10 2018&#46; Disponible en&#58; https&#58;&#47;&#47;eciemaps&#46;msssi&#46;gob&#46;es&#47;"
                ]
              ]
            ]
            9 => array:3 [
              "identificador" => "bib0285"
              "etiqueta" => "10"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "OHDSI&#46; OMOP Data Model 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;ohdsi&#46;org&#47;data-standardization&#47;the-common-data-model&#47;"
                ]
              ]
            ]
            10 => array:3 [
              "identificador" => "bib0290"
              "etiqueta" => "11"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "XML&#46; Extensible Markup Language 2018&#46; Disponible en&#58; https&#58;&#47;&#47;es&#46;wikipedia&#46;org&#47;wiki&#47;Extensible&#95;Markup&#95;Language"
                ]
              ]
            ]
            11 => array:3 [
              "identificador" => "bib0295"
              "etiqueta" => "12"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "&#8220;Big Data&#8221; in the intensive care unit&#46; Closing the data loop"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:4 [
                            0 => "L&#46;A&#46; Celi"
                            1 => "R&#46;G&#46; Mark"
                            2 => "D&#46;J&#46; Stone"
                            3 => "R&#46;A&#46; Montgomery"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1164/rccm.201212-2311ED"
                      "Revista" => array:6 [
                        "tituloSerie" => "Am J Respir Crit Care Med&#46;"
                        "fecha" => "2013"
                        "volumen" => "187"
                        "paginaInicial" => "1157"
                        "paginaFinal" => "1160"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/23725609"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            12 => array:3 [
              "identificador" => "bib0300"
              "etiqueta" => "13"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "A formal definition of Big Data based on its essential features"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:3 [
                            0 => "D&#46;M&#46; Andrea"
                            1 => "G&#46; Marco"
                            2 => "G&#46; Michele"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Library Review&#46;"
                        "fecha" => "2016"
                        "volumen" => "65"
                        "paginaInicial" => "122"
                        "paginaFinal" => "135"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            13 => array:3 [
              "identificador" => "bib0305"
              "etiqueta" => "14"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Detecting influenza epidemics using search engine query data"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:6 [
                            0 => "J&#46; Ginsberg"
                            1 => "M&#46;H&#46; Mohebbi"
                            2 => "R&#46;S&#46; Patel"
                            3 => "L&#46; Brammer"
                            4 => "M&#46;S&#46; Smolinski"
                            5 => "L&#46; Brilliant"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1038/nature07634"
                      "Revista" => array:5 [
                        "tituloSerie" => "Nature&#46;"
                        "fecha" => "2008"
                        "volumen" => "457"
                        "paginaInicial" => "1012"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/19020500"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            14 => array:3 [
              "identificador" => "bib0310"
              "etiqueta" => "15"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Foundation AS&#46; Apache Hadoop 2014&#46; Disponible en&#58; http&#58;&#47;&#47;hadoop&#46;apache&#46;org&#47;"
                ]
              ]
            ]
            15 => array:3 [
              "identificador" => "bib0315"
              "etiqueta" => "16"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Mehta R&#46; 1&#46; Big Data Analytics with Java&#46; Big Data Analytics with Java&#58; Data analysis&#44; visualization &#38; machine learning techniques&#46; Birmingham&#44; UK&#58; Packt&#59; 2018&#46;"
                ]
              ]
            ]
            16 => array:3 [
              "identificador" => "bib0320"
              "etiqueta" => "17"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Some studies in machine learning using the game of checkers"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "A&#46;L&#46; Samuel"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "IBM J Res Dev"
                        "fecha" => "1959"
                        "volumen" => "3"
                        "paginaInicial" => "210"
                        "paginaFinal" => "229"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            17 => array:3 [
              "identificador" => "bib0325"
              "etiqueta" => "18"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Raschka S MV&#46; Chapter 1&#46; Giving computers the ability to learn from data&#46; Python Machine Learning Machine learning and deep learning with Python&#44; scikit-learn and Tensorflow&#46; Birmingham&#44; UK&#58; Packt&#59; 2017&#44; September&#46;"
                ]
              ]
            ]
            18 => array:3 [
              "identificador" => "bib0330"
              "etiqueta" => "19"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Data MC&#46; Secondary Analysis of Electronic Health Records 2016&#46;"
                ]
              ]
            ]
            19 => array:3 [
              "identificador" => "bib0335"
              "etiqueta" => "20"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "MIMIC-III&#44; a freely accessible critical care database"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "A&#46;E&#46; Johnson"
                            1 => "T&#46;J&#46; Pollard"
                            2 => "L&#46; Shen"
                            3 => "L&#46;W&#46; Lehman"
                            4 => "M&#46; Feng"
                            5 => "M&#46; Ghassemi"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1038/sdata.2016.35"
                      "Revista" => array:5 [
                        "tituloSerie" => "Sci Data&#46;"
                        "fecha" => "2016"
                        "volumen" => "3"
                        "paginaInicial" => "160035"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/27219127"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            20 => array:3 [
              "identificador" => "bib0340"
              "etiqueta" => "21"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "MIT Lab for Computational Physiology&#46; MIMIC 2018&#46; Disponible en&#58; http&#58;&#47;&#47;mimic&#46;physionet&#46;org"
                ]
              ]
            ]
            21 => array:3 [
              "identificador" => "bib0345"
              "etiqueta" => "22"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Database eCR&#46; eICU Collaborative Research Database 2018&#46; Disponible en&#58; https&#58;&#47;&#47;eicu-crd&#46;mit&#46;edu&#47;"
                ]
              ]
            ]
            22 => array:3 [
              "identificador" => "bib0350"
              "etiqueta" => "23"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Computing NCfB&#46; i2b2 &#40;Informatics for Integrating Biology and the Bedside&#41; 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;i2b2&#46;org"
                ]
              ]
            ]
            23 => array:3 [
              "identificador" => "bib0355"
              "etiqueta" => "24"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "The MIMIC Code Repository&#58; Enabling reproducibility in critical care research"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:4 [
                            0 => "A&#46;E&#46; Johnson"
                            1 => "D&#46;J&#46; Stone"
                            2 => "L&#46;A&#46; Celi"
                            3 => "T&#46;J&#46; Pollard"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1093/jamia/ocx084"
                      "Revista" => array:6 [
                        "tituloSerie" => "J Am Med Inform Assoc&#46;"
                        "fecha" => "2018"
                        "volumen" => "25"
                        "paginaInicial" => "32"
                        "paginaFinal" => "39"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/29036464"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            24 => array:3 [
              "identificador" => "bib0360"
              "etiqueta" => "25"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "MIT-LCP&#46; MIMIC Code Repository&#58; Code shared by the research community for the MIMIC-III database 2018&#46; Disponible en&#58; https&#58;&#47;&#47;github&#46;com&#47;MIT-LCP&#47;mimic-code"
                ]
              ]
            ]
            25 => array:3 [
              "identificador" => "bib0365"
              "etiqueta" => "26"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Workshop on using natural language processing applications for enhancing clinical decision making&#58; An executive summary"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:6 [
                            0 => "V&#46;M&#46; Pai"
                            1 => "M&#46; Rodgers"
                            2 => "R&#46; Conroy"
                            3 => "J&#46; Luo"
                            4 => "R&#46; Zhou"
                            5 => "B&#46; Seto"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1136/amiajnl-2013-001896"
                      "Revista" => array:6 [
                        "tituloSerie" => "J Am Med Inform Assoc&#46;"
                        "fecha" => "2014"
                        "volumen" => "21"
                        "paginaInicial" => "e2"
                        "paginaFinal" => "e5"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/23921193"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            26 => array:3 [
              "identificador" => "bib0370"
              "etiqueta" => "27"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Apache Software Foundation&#46; Apache cTAKES&#8482; 2018&#46; Disponible en&#58; http&#58;&#47;&#47;ctakes&#46;apache&#46;org&#47;"
                ]
              ]
            ]
            27 => array:3 [
              "identificador" => "bib0375"
              "etiqueta" => "28"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "Costumero R&#44; Gonzalo C&#44; Menasalvas E&#46; TIDA&#58; A Spanish EHR Semantic Search Engine&#46; 8<span class="elsevierStyleHsp" style=""></span>th International Conference on Practical Applications of Computational Biology &#38; Bioinformatics &#40;PACBB 2014&#41;&#46; 1<span class="elsevierStyleHsp" style=""></span>st edition&#46; New York&#58; Springer&#59; 2014&#58; pp&#46; 235-242&#46;"
                ]
              ]
            ]
            28 => array:3 [
              "identificador" => "bib0380"
              "etiqueta" => "29"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Comparing deep learning and concept extraction based methods for patient phenotyping from clinical narratives"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "S&#46; Gehrmann"
                            1 => "F&#46; Dernoncourt"
                            2 => "Y&#46; Li"
                            3 => "E&#46;T&#46; Carlson"
                            4 => "J&#46;T&#46; Wu"
                            5 => "J&#46; Welt"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1371/journal.pone.0208783"
                      "Revista" => array:4 [
                        "tituloSerie" => "PLoS One&#46;"
                        "fecha" => "2018"
                        "volumen" => "13"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/30586373"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            29 => array:3 [
              "identificador" => "bib0385"
              "etiqueta" => "30"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Big Data in designing clinical trials&#58; Opportunities and challenges"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:6 [
                            0 => "C&#46;S&#46; Mayo"
                            1 => "M&#46;M&#46; Matuszak"
                            2 => "M&#46;J&#46; Schipper"
                            3 => "S&#46; Jolly"
                            4 => "J&#46;A&#46; Hayman"
                            5 => "R&#46;K&#46; Ten Haken"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.3389/fonc.2017.00187"
                      "Revista" => array:5 [
                        "tituloSerie" => "Front Oncol&#46;"
                        "fecha" => "2017"
                        "volumen" => "7"
                        "paginaInicial" => "187"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/28913177"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            30 => array:3 [
              "identificador" => "bib0390"
              "etiqueta" => "31"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "The challenge of local consent requirements for global critical care databases"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:3 [
                            0 => "S&#46; McLennan"
                            1 => "D&#46; Shaw"
                            2 => "L&#46;A&#46; Celi"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1007/s00134-018-5257"
                      "Revista" => array:3 [
                        "tituloSerie" => "Intensive Care Med&#46;"
                        "fecha" => "2018"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/21365313"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            31 => array:3 [
              "identificador" => "bib0395"
              "etiqueta" => "32"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "EU GDPR Portal&#46; EU General Data Protection Regulation &#40;GDPR&#41; 2018&#46; Disponible en&#58; https&#58;&#47;&#47;www&#46;eugdpr&#46;org&#47;"
                ]
              ]
            ]
            32 => array:3 [
              "identificador" => "bib0400"
              "etiqueta" => "33"
              "referencia" => array:1 [
                0 => array:1 [
                  "referenciaCompleta" => "HHS&#46;gov&#46; Health information privacy&#46; 2018&#46;"
                ]
              ]
            ]
            33 => array:3 [
              "identificador" => "bib0405"
              "etiqueta" => "34"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Our Bodies&#44; Our Data&#58; How Companies Make Billions Selling Our Medical Records"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:1 [
                            0 => "A&#46; Tanner"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Libro" => array:4 [
                        "fecha" => "2016"
                        "paginaInicial" => "218"
                        "editorial" => "Beacon Press"
                        "editorialLocalizacion" => "Boston"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            34 => array:3 [
              "identificador" => "bib0410"
              "etiqueta" => "35"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Transthoracic echocardiography and mortality in sepsis&#58; Analysis of the MIMIC-III database"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "M&#46; Feng"
                            1 => "J&#46;I&#46; McSparron"
                            2 => "D&#46;T&#46; Kien"
                            3 => "D&#46;J&#46; Stone"
                            4 => "D&#46;H&#46; Roberts"
                            5 => "R&#46;M&#46; Schwartzstein"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1007/s00134-018-5208-7"
                      "Revista" => array:6 [
                        "tituloSerie" => "Intensive Care Med&#46;"
                        "fecha" => "2018"
                        "volumen" => "44"
                        "paginaInicial" => "884"
                        "paginaFinal" => "892"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/29806057"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            35 => array:3 [
              "identificador" => "bib0415"
              "etiqueta" => "36"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Establishment and validation of GV-SAPS II scoring system for non-diabetic critically ill patients"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "W&#46;Y&#46; Liu"
                            1 => "S&#46;G&#46; Lin"
                            2 => "G&#46;Q&#46; Zhu"
                            3 => "S&#46;V&#46; Poucke"
                            4 => "M&#46; Braddock"
                            5 => "Z&#46; Zhang"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1371/journal.pone.0166085"
                      "Revista" => array:5 [
                        "tituloSerie" => "PLoS One&#46;"
                        "fecha" => "2016"
                        "volumen" => "11"
                        "paginaInicial" => "e0166085"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/27824941"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            36 => array:3 [
              "identificador" => "bib0420"
              "etiqueta" => "37"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Using electronic health record collected clinical variables to predict medical intensive care unit mortality"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "J&#46; Calvert"
                            1 => "Q&#46; Mao"
                            2 => "J&#46;L&#46; Hoffman"
                            3 => "M&#46; Jay"
                            4 => "T&#46; Desautels"
                            5 => "H&#46; Mohamadlou"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1016/j.amsu.2016.09.002"
                      "Revista" => array:6 [
                        "tituloSerie" => "Ann Med Surg &#40;Lond&#41;&#46;"
                        "fecha" => "2016"
                        "volumen" => "11"
                        "paginaInicial" => "52"
                        "paginaFinal" => "57"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/27699003"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            37 => array:3 [
              "identificador" => "bib0425"
              "etiqueta" => "38"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Prediction of sepsis in the intensive care unit with minimal electronic health record data&#58; A Machine Learning approach"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "T&#46; Desautels"
                            1 => "J&#46; Calvert"
                            2 => "J&#46; Hoffman"
                            3 => "M&#46; Jay"
                            4 => "Y&#46; Kerem"
                            5 => "L&#46; Shieh"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.2196/medinform.5909"
                      "Revista" => array:5 [
                        "tituloSerie" => "JMIR Med Inform&#46;"
                        "fecha" => "2016"
                        "volumen" => "4"
                        "paginaInicial" => "e28"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/27694098"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            38 => array:3 [
              "identificador" => "bib0430"
              "etiqueta" => "39"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "A targeted real-time early warning score &#40;TREWScore&#41; for septic shock"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:4 [
                            0 => "K&#46;E&#46; Henry"
                            1 => "D&#46;N&#46; Hager"
                            2 => "P&#46;J&#46; Pronovost"
                            3 => "S&#46; Saria"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1126/scitranslmed.aad3106"
                      "Revista" => array:4 [
                        "tituloSerie" => "Sci Transl Med&#46;"
                        "fecha" => "2015"
                        "volumen" => "7"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/26659569"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            39 => array:3 [
              "identificador" => "bib0435"
              "etiqueta" => "40"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Time-related association between fluid balance and mortality in sepsis patients&#58; Interaction between fluid balance and haemodynamics"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:4 [
                            0 => "Y&#46; Shen"
                            1 => "W&#46; Ru"
                            2 => "X&#46; Huang"
                            3 => "W&#46; Zhang"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1038/s41598-018-36161-1"
                      "Revista" => array:4 [
                        "tituloSerie" => "Sci Rep&#46;"
                        "fecha" => "2018"
                        "volumen" => "8"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/30573733"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            40 => array:3 [
              "identificador" => "bib0440"
              "etiqueta" => "41"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Sentiment in nursing notes as an indicator of out-of-hospital mortality in intensive care patients"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:4 [
                            0 => "I&#46;E&#46;R&#46; Waudby-Smith"
                            1 => "N&#46; Tran"
                            2 => "J&#46;A&#46; Dubin"
                            3 => "J&#46; Lee"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:4 [
                        "tituloSerie" => "PLoS One&#46;"
                        "fecha" => "2018"
                        "volumen" => "13"
                        "paginaInicial" => "e0198687"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            41 => array:3 [
              "identificador" => "bib0445"
              "etiqueta" => "42"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Early biliary drainage is associated with favourable outcomes in critically-ill patients with acute cholangitis"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:5 [
                            0 => "M&#46; Aboelsoud"
                            1 => "O&#46; Siddique"
                            2 => "A&#46; Morales"
                            3 => "Y&#46; Seol"
                            4 => "M&#46; al-Qadi"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Prz Gastroenterol&#46;"
                        "fecha" => "2018"
                        "volumen" => "13"
                        "paginaInicial" => "16"
                        "paginaFinal" => "21"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            42 => array:3 [
              "identificador" => "bib0450"
              "etiqueta" => "43"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Prolonged elevated heart rate and 90-day survival in acutely ill patients&#58; Data from the MIMIC-III database"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:5 [
                            0 => "V&#46; Sandfort"
                            1 => "A&#46;E&#46;W&#46; Johnson"
                            2 => "L&#46;M&#46; Kunz"
                            3 => "J&#46;D&#46; Vargas"
                            4 => "D&#46;R&#46; Rosing"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1177/0885066618756828"
                      "Revista" => array:2 [
                        "tituloSerie" => "J Intensive Care Med&#46;"
                        "fecha" => "2018"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            43 => array:3 [
              "identificador" => "bib0455"
              "etiqueta" => "44"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "The obesity paradox in ICU patients"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:5 [
                            0 => "P&#46; Janice"
                            1 => "R&#46; Shaffer"
                            2 => "Z&#46; Sinno"
                            3 => "M&#46; Tyler"
                            4 => "J&#46; Ghosh"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1109/EMBC.2017.8037576"
                      "Revista" => array:6 [
                        "tituloSerie" => "Conf Proc IEEE Eng Med Biol Soc&#46;"
                        "fecha" => "2017"
                        "volumen" => "2017"
                        "paginaInicial" => "3360"
                        "paginaFinal" => "3364"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/29060617"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            44 => array:3 [
              "identificador" => "bib0460"
              "etiqueta" => "45"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Prediction of early unplanned intensive care unit readmission in a UK tertiary care hospital&#58; A cross-sectional machine learning approach"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => true
                          "autores" => array:6 [
                            0 => "T&#46; Desautels"
                            1 => "R&#46; Das"
                            2 => "J&#46; Calvert"
                            3 => "M&#46; Trivedi"
                            4 => "C&#46; Summers"
                            5 => "D&#46;J&#46; Wales"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1136/bmjopen-2017-017199"
                      "Revista" => array:5 [
                        "tituloSerie" => "BMJ Open&#46;"
                        "fecha" => "2017"
                        "volumen" => "7"
                        "paginaInicial" => "e017199"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/28918412"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
            45 => array:3 [
              "identificador" => "bib0465"
              "etiqueta" => "46"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "A data-driven approach to optimized medication dosing&#58; A focus on heparin"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:6 [
                            0 => "M&#46;M&#46; Ghassemi"
                            1 => "S&#46;E&#46; Richter"
                            2 => "I&#46;M&#46; Eche"
                            3 => "T&#46;W&#46; Chen"
                            4 => "J&#46; Danziger"
                            5 => "L&#46;A&#46; Celi"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:1 [
                      "Revista" => array:5 [
                        "tituloSerie" => "Intensive Care Med&#46;"
                        "fecha" => "2014"
                        "volumen" => "40"
                        "paginaInicial" => "1332"
                        "paginaFinal" => "1339"
                      ]
                    ]
                  ]
                ]
              ]
            ]
            46 => array:3 [
              "identificador" => "bib0470"
              "etiqueta" => "47"
              "referencia" => array:1 [
                0 => array:2 [
                  "contribucion" => array:1 [
                    0 => array:2 [
                      "titulo" => "Leveraging a critical care database&#58; Selective serotonin reuptake inhibitor use prior to ICU admission is associated with increased hospital mortality"
                      "autores" => array:1 [
                        0 => array:2 [
                          "etal" => false
                          "autores" => array:5 [
                            0 => "M&#46; Ghassemi"
                            1 => "J&#46; Marshall"
                            2 => "N&#46; Singh"
                            3 => "D&#46;J&#46; Stone"
                            4 => "L&#46;A&#46; Celi"
                          ]
                        ]
                      ]
                    ]
                  ]
                  "host" => array:1 [
                    0 => array:2 [
                      "doi" => "10.1378/chest.13-1722"
                      "Revista" => array:6 [
                        "tituloSerie" => "Chest&#46;"
                        "fecha" => "2014"
                        "volumen" => "145"
                        "paginaInicial" => "745"
                        "paginaFinal" => "752"
                        "link" => array:1 [
                          0 => array:2 [
                            "url" => "https://www.ncbi.nlm.nih.gov/pubmed/24371841"
                            "web" => "Medline"
                          ]
                        ]
                      ]
                    ]
                  ]
                ]
              ]
            ]
          ]
        ]
      ]
    ]
  ]
  "idiomaDefecto" => "es"
  "url" => "/02105691/0000004300000007/v1_201910100635/S0210569118303139/v1_201910100635/es/main.assets"
  "Apartado" => array:4 [
    "identificador" => "34"
    "tipo" => "SECCION"
    "es" => array:2 [
      "titulo" => "Revisi&#243;n"
      "idiomaDefecto" => true
    ]
    "idiomaDefecto" => "es"
  ]
  "PDF" => "https://static.elsevier.es/multimedia/02105691/0000004300000007/v1_201910100635/S0210569118303139/v1_201910100635/es/main.pdf?idApp=WMIE&text.app=https://medintensiva.org/"
  "EPUB" => "https://multimedia.elsevier.es/PublicationsMultimediaV1/item/epub/S0210569118303139?idApp=WMIE"
]
Compartir
Información de la revista
Vol. 43. Núm. 7.
Páginas 416-426 (octubre 2019)
Visitas
20051
Vol. 43. Núm. 7.
Páginas 416-426 (octubre 2019)
Revisión
Acceso a texto completo
Big Data Analysis y Machine Learning en medicina intensiva
Big Data Analysis and Machine Learning in Intensive Care Units
Visitas
20051
A. Núñez Reiza,
Autor para correspondencia
anunezreiz@gmail.com

Autor para correspondencia.
, M.A. Armengol de la Hozb,c,d, M. Sánchez Garcíaa
a Servicio de Medicina Intensiva, Hospital Universitario Clínico San Carlos, Madrid, España
b Department of Anesthesia, Critical Care and Pain Medicine, Beth Israel Deaconess Medical Center, Harvard Medical School, Boston, MA, Estados Unidos
c Laboratory for Computational Physiology, Institute for Medical Engineering and Science, Massachusetts Institute of Technology, Cambridge, MA, Estados Unidos
d Biomedical Engineering and Telemedicine Group, Biomedical Technology Centre CTB, ETSI Telecomunicación, Universidad Politécnica de Madrid, Madrid, España
Este artículo ha recibido
Información del artículo
Resumen
Texto completo
Bibliografía
Descargar PDF
Estadísticas
Figuras (3)
Mostrar másMostrar menos
Tablas (2)
Tabla 1. Pasos a seguir para construir un sistema de Machine Learning
Tabla 2. Aspectos de investigación clínica estudiados mediante técnicas de Big Data Analysis y Machine Learning
Mostrar másMostrar menos
Material adicional (1)
Resumen

La gran cantidad de información que se procesa informáticamente en el entorno de la medicina intensiva la convierte en un campo ideal para el empleo de técnicas conocidas como Big Data Analysis (BDA) y Machine Learning (ML), que pueden permitir en el futuro mejorar nuestra capacidad de investigación clínica y dirigir de manera más precisa las terapias que proporcionamos a nuestros pacientes.

En este artículo se revisan los conceptos fundamentales sobre BDA y ML, y se estudian sus posibles aplicaciones al ámbito de la medicina intensiva, desde un punto de vista del clínico. También se plantean potenciales estrategias para sacar el máximo partido a estas tecnologías emergentes, incluyendo la aparición de un nuevo tipo de profesional sanitario encargado de actuar como enlace entre la parte clínica y la ingeniería de datos.

Palabras clave:
Big Data Analysis
Machine Learning
Inteligencia artificial
Análisis secundario de datos clínicos electrónicos
Abstract

Intensive care is an ideal environment for the use of Big Data Analysis (BDA) and Machine Learning (ML), due to the huge amount of information processed and stored in electronic format in relation to such care. These tools can improve our clinical research capabilities and clinical decision making in the future.

The present study reviews the foundations of BDA and ML, and explores possible applications in our field from a clinical viewpoint. We also suggest potential strategies to optimize these new technologies and describe a new kind of hybrid healthcare-data science professional with a linking role between clinicians and data.

Keywords:
Big Data Analysis
Machine Learning
Artificial intelligence
Secondary electronic health record data analysis
Texto completo
Introducción

Los profesionales de la medicina intensiva vivimos sumergidos en un mar de datos. En un servicio de medicina intensiva informatizado, como el del Hospital Clínico San Carlos (con tres unidades de cuidados intensivos y aproximadamente 2.400 ingresos al año), durante un día normal de actividad en nuestra Unidad se incorporan a nuestra base de datos informatizada 1.400 nuevas unidades de información en promedio por cada paciente ingresado, lo que supone unos diez millones de unidades de información al año (Nuñez A, comunicación personal).

El desarrollo exponencial de la informática y la irrupción de computadores con gran capacidad de almacenamiento y procesamiento a un coste asequible hacen que toda esa información quede registrada y pueda ser utilizada de diversas maneras. Incluso en aquellas unidades que todavía carecen de historia clínica electrónica o aplicaciones departamentales para medicina intensiva existe la posibilidad de utilizar el potencial de los métodos computacionales de última generación para mejorar la manera en que hacemos nuestro trabajo cada día. Un ejemplo es la aplicación de técnicas de procesamiento de lenguaje natural (Natural Language Processing [NLP]) a un conjunto de informes almacenados en Word, PDF u otro formato similar de texto libre (no estructurado)1.

Los datos que los intensivistas manejamos pueden provenir de diversas fuentes. Los profesionales sanitarios están añadiendo continuamente datos (estructurados o no) a la documentación del paciente. Se estima que los médicos dedican casi dos horas a la documentación por cada hora de atención directa al paciente2. Los médicos, las enfermeras y los técnicos los escriben como notas o informes de distintas especialidades en texto libre, o como información codificada sobre diagnósticos o procedimientos. También generamos órdenes de tratamiento y registros de administración de fármacos, y recibimos grandes cantidades de datos generados por nuestro aparataje medico: resultados de los analizadores de laboratorio, constantes vitales, datos de monitorización avanzada, parámetros del respirador, parámetros de funcionamiento de equipos complejos como bombas de perfusión, monitores de diálisis, dispositivos de ECMO (membrana de oxigenación extracorpórea), así como información en forma de imágenes, sonidos, vídeos y muchos más. Hasta algunos años esta información se perdía en la nada o como mucho en archivos de historias clínicas en papel. Hoy es posible almacenar y procesar esta información de manera automática en formato digital y extraer de ella nuevo conocimiento y orientación para mejorar el cuidado de los pacientes.

Existe un amplio espectro en cuanto a lo estructurados que están los datos que utilizamos. Es mucho más fácil hacer investigación clínica cuando los datos están en un formato estructurado, pero los profesionales sanitarios todavía no han alcanzado un consenso en cuanto a una manera unívoca de expresar cada concepto relacionado con la salud. Esto no quiere decir que no tengamos estándares. SNOMED CT3, HL74, UMLS5, DICOM6, LOINC7 y muchos otros son ejemplos de ello y son usados en diferentes campos sanitarios, permitiendo el tratamiento automatizado de los datos y el intercambio de información entre sistemas. Pero los estándares no lo son de manera absoluta: podemos expresar un diagnóstico en diferentes estándares, como MESH8, UMLS, SNOMED CT, ICD-99, ICD-109, y frecuentemente es necesario hacer «traducciones» entre estándares (el término técnico es «mapeo») para trasladar información de unos sistemas a otros. Soluciones con nuevos enfoques del problema de la multiplicidad de estándares (por ejemplo, OMOP10) proporcionan herramientas para realizar estos mapeos de una manera sistematizada.

No solo los datos en sí son importantes, también lo es el contexto en el que están inmersos. A veces un dato no tiene valor alguno si no podemos asociarlo a más información relevante sobre el paciente o la situación clínica. Un registro de presión arterial de 90/60mmHg se interpreta de manera muy diferente en una mujer joven sometida a cirugía plástica que en un anciano hipertenso con una hemorragia. El mismo concepto puede además plasmarse de formas distintas por distintos profesionales, en distintas situaciones y —en el caso de valores numéricos— con distintas unidades.

Nuestros datos estructurados pueden ser categóricos, valores numéricos enteros o con decimales, fechas, horas, duraciones, o bien pueden agruparse (por ejemplo, la presión arterial con sus dos componentes, sistólico y diastólico) de una manera similar a las listas, tuplas u objetos que vemos como estructuras de datos en lenguajes de programación. A veces nuestros datos son matrices de bytes organizados para representar una imagen o un vídeo, como por ejemplo un fichero DICOM que puede utilizarse para mostrar una imagen de CT. En este ejemplo concreto aparece otro concepto interesante, que es el de metadatos: información acerca de los propios datos (por ejemplo, en el caso de la imagen del CT, metadatos serían los parámetros de adquisición).

Algunos datos son subjetivos. Por ejemplo, un médico puede expresar el razonamiento que le llevó a un determinado diagnóstico mediante una serie de frases en una nota de texto libre. Otros datos son objetivos: nuestro hemofiltro ha extraído exactamente 52mL de ultrafiltrado al paciente durante la última hora, y pasa esta información a la gráfica electrónica a través de la conexión de red.

Para llevar a cabo análisis secundarios de datos clínicos, son diversos los aspectos que han de tenerse en cuenta en cuanto a privacidad, seguridad y sensibilidad. Para un paciente, el que se conozca públicamente su frecuencia respiratoria puede ser perfectamente tolerable, pero no suele opinar lo mismo sobre su seropositividad al virus de la inmunodeficiencia humana.

Los datos vienen de distintos orígenes porque se obtienen por distintos motivos (contabilidad, investigación o manejo clínico del paciente, por ejemplo, son algunas de las opciones), y por tanto hay distintos actores implicados en el proceso (gestores, clínicos, investigadores, proveedores de servicios).

Si queremos ser capaces de extraer conocimiento válido de toda esta mezcolanza, para poder ayudar al profesional sanitario a tomar mejores decisiones y para orientar nuestra investigación clínica, hemos de ser capaces de trabajar de manera eficiente con este rompecabezas clínico de miles de pequeñas piezas que nuestro quehacer con el paciente genera cada día.

Flujo de datos en medicina intensiva

La información fluye en nuestro entorno a través de varias fases que vamos a estudiar brevemente (fig. 1), ya que en distintos momentos del proceso de atención clínica se producen eventos críticos que influyen sobre nuestra capacidad de utilizar eficientemente la información.

Figura 1.

Flujo de datos en medicina intensiva. La calidad de la asistencia y de la toma de decisiones estratégicas depende del procesamiento de la información presente en el repositorio activo de datos (información que se va generando en cada momento y que está disponible para tomar decisiones) y de la reutilización de conocimiento previo almacenado en bases de datos locales o compartidas. El procesamiento automático de la información mediante Machine Learning (ML) y la posibilidad de acceso rápido a grandes cantidades de datos de estructura heterogénea mediante Big Data Analysis (BDA) permite mejorar los procesos asistenciales y extraer conocimiento de los datos.

Adaptada de Celi et al.12, con permiso de los autores.

(0.2MB).
Entrada de datos

Una parte del proceso de introducción de los datos se realiza de manera automática y en un formato estructurado que permite el empleo de los datos de manera eficiente. Sin embargo, existe una gran ventana de oportunidad de mejora en la adquisición de los datos para los que hoy en día se utiliza el texto libre. Intentemos explicar esto con un ejemplo:

«Paciente varón de 58 años que acude hace 1 hora a urgencias por un cuadro de disnea y dolor centrotorácico irradiado al brazo izquierdo…»

En este breve párrafo de 24 palabras existen al menos 8 conceptos que pueden expresarse de manera estructurada en el siguiente documento xml (un formato estándar para mostrar información11):

xxxx

Varón

58

Urgencias

2018-08-12 15:30:00

Centrotorácica

Brazo izquierdo

Para un médico suele ser mucho más fácilmente interpretable el párrafo de texto libre, mientras que para su manejo en un computador la segunda manera de representar la información es mucho más eficiente. Lo ideal sería encontrar una herramienta que permita al humano introducir la información de una manera al menos tan rápida y cómoda como el texto libre, pero que también permita su almacenamiento directo en un formato estructurado, facilitando su lectura y comprensión tanto por humanos como por ordenadores.

Procesamiento de los datos en vivo

Los datos que se van introduciendo en el sistema quedan en un estado «pasivo», y es el profesional sanitario el que tiene que hacer inferencias tras recopilar los datos que le parecen relevantes en un momento concreto de la evolución del paciente.

Sin embargo, existe la posibilidad de transformar los datos almacenados en datos «activos», que desencadenen respuestas del sistema, a través de un sistema de soporte a la decisión clínica (Clinical Decission Support System [CDSS]). Siguiendo con el ejemplo previo, supongamos que hemos introducido el párrafo previo y en el sistema existe un concepto almacenado:

Síndrome coronario agudo

Centrotorácica

Brazo izquierdo

Al introducir la información del paciente el sistema puede alertarnos directamente de que el paciente muestra un síntoma compatible con el síndrome coronario agudo. Este es un ejemplo muy sencillo, pero lo realmente útil de las herramientas informáticas es que este tipo de procesamiento puede realizarse de manera automática para miles de conceptos y de una manera mucho más sistemática que la que realiza un cerebro humano. Para entenderlo con una analogía, es como si el sistema estuviera realizando un checklist continuo con nuestros pacientes. Adicionalmente, las técnicas actuales de inteligencia artificial (IA) permiten utilizar la experiencia adquirida de pacientes previos en forma de datos estructurados en la valoración del paciente individual subsiguiente. Esto puede tener en el futuro un gran impacto sobre la práctica clínica.

Otro ejemplo es el empleo de sistemas de control en tiempo real, por ejemplo, para ajustar continuamente las dosis de insulina en perfusión de un paciente en función de la sensibilidad a la insulina que ha mostrado previamente, su situación de estrés valorado por distintos datos de la gráfica y la analítica, y el aporte calórico y de hidratos de carbono que se está realizando en ese momento. El sistema puede ir aprendiendo con el tiempo sobre el propio paciente y optimizando progresivamente el control de la glucemia dentro de unos parámetros de seguridad.

Almacenamiento de los datos

Existen dos maneras de almacenar la información de nuestros pacientes: a)en bases de datos relacionales, que utilizan el lenguaje de consulta SQL para poder recuperar y procesar los datos almacenados, y b)en repositorios de datos no estructurados (NoSQL). Hoy en día existen herramientas que permiten extraer y procesar información también de este tipo de datos. Tipos específicos de datos pueden almacenarse en bases de datos especializadas, como por ejemplo un PACS para almacenamiento de imágenes clínicas que utiliza el formato DICOM.

Análisis de los datos a posteriori y compartición de la información

Una vez que tenemos almacenados los datos, podemos procesarlos de diversas formas. Por ejemplo, podemos obtener un informe automático de actividad de nuestra unidad utilizando una consulta a nuestra base de datos SQL con los datos demográficos y clínicos de nuestros pacientes, o podemos averiguar qué antibióticos utilizamos con más frecuencia, o qué tipo de patologías se atienden primordialmente en nuestra unidad, sin tener que revisar de nuevo uno por uno nuestros pacientes. Podemos utilizar esta información para llevar a cabo benchmarking (comparación de resultados entre unidades o dentro de la misma unidad al cambiar procesos o recursos) o para planificar actuaciones estratégicas.

Recomendamos consultar el artículo de Celi et al.12, en el que se revisa todo este ciclo de flujo de información y se aborda el concepto de «cerrar el círculo» (closing the loop), explicando de qué manera la IA puede contribuir al desarrollo de la medicina intensiva.

¿Qué es Big Data?

El planteamiento clásico del clínico con respecto al manejo de los datos para investigación clínica se basa en la premisa de que es necesario obtener información de calidad para conseguir resultados fiables y aplicables a los pacientes. La dificultad para obtener la información hace que se intente optimizar este proceso aplicando diseños prospectivos, aleatorización y una hipótesis de trabajo previa al análisis de los datos.

Como alternativa al uso exclusivo de datos recogidos de manera ortodoxa, la novedad que las técnicas de análisis de Big Data (Big Data Analysis [BDA]) ofrecen es la detección de la estructura y el conocimiento subyacente en cantidades ingentes de información, incluso aunque aparentemente no esté estructurada.

Una definición popular del concepto13 establece que «se considera Big Data a conjuntos de datos caracterizados por un volumen tan grande y una variedad tan amplia en su estructura, que hace necesario el uso de tecnología y métodos analíticos específicos para su procesamiento y transformación en conocimiento o valor».

Las técnicas específicas de BDA se han aplicado con éxito a campos como el marketing, la toma de decisiones estratégicas en el mundo de los negocios, la banca, el transporte, la logística, los seguros o la detección de fraude en el comercio electrónico. No hay ningún motivo para pensar que no puedan aplicarse a nuestro entorno, donde continuamente estamos tomando decisiones estratégicas o concretas en pacientes determinados, cuyas características, aunque complejas, se repiten con frecuencia.

Un ejemplo reciente, del que hablamos más adelante, es el seguimiento de las epidemias de gripe mediante el análisis de las búsquedas realizadas en internet. En este caso se utilizan bases de datos de muchos millones de registros para obtener conclusiones epidemiológicas rápidas y fiables14.

La filosofía de código abierto ha irrumpido con fuerza en el mundo del Big Data, permitiendo su utilización sin que ello suponga una gran inversión económica. Proyectos como Apache Hadoop15,16 incluyen toda una serie de recursos en su ecosistema (HDFS, Spark, MapReduce, Impala, HBase, Hive) que permiten construir a bajo coste un sistema de procesamiento de Big Data en batch (análisis de datos ya almacenados en grandes bases de datos relacionales o no relacionales) o en streaming (análisis y procesamiento de los datos según se van generando) de bajo coste.

¿Qué es Machine Learning?

El concepto de Machine Learning (ML) o «aprendizaje máquina» data de mediados del sigloXX, y se definió ya en un artículo de Samuel de 195917 como un apartado de la IA que usa técnicas estadísticas y algoritmos computacionales para proporcionar a los ordenadores la capacidad de «aprender», es decir, mejorar sus resultados en una tarea específica tras procesar datos en suficiente cantidad y sin unas instrucciones explícitas externas (y por tanto potencialmente sesgadas) proporcionadas por el programador.

El ámbito del ML está estrechamente relacionado con otros campos, como la simulación y el modelado, la optimización de sistemas y la estadística. En todos ellos se emplean de manera intensiva técnicas matemáticas comunes que requieren entrenamiento específico.

Es necesario definir algunos conceptos básicos en este momento. Debemos utilizar un formato conocido como «dataframe» para trabajar con los datos en ML. Un dataframe es una matriz donde cada fila corresponde a uno de los pacientes o registros y cada columna a una de las variables que registramos (fig. 2).

Figura 2.

Estructura típica de un dataframe, constituido por filas por cada registro con un identificador anonimizado y columnas donde se almacenan los valores de distintas variables para cada caso. En la última columna en este caso se muestra la variable objetivo (en este caso mortalidad). Aquí podemos ver una sección de unos cuantos registros de la base de datos que se utiliza como ejemplo en el material incluido en el repositorio de GitHub.

(0.23MB).

Supongamos, a modo de ejemplo, que queremos desarrollar un modelo de predicción de mortalidad en función de las siguientes variables: tipo de ingreso (médico, quirúrgico programado o quirúrgico urgente), edad, sexo, APACHEII al ingreso, SOFA al ingreso y niveles sanguíneos de ácido láctico. En este caso tendremos tantas filas como episodios de pacientes tengamos recogidos, y cada fila tendrá una columna que identifica el episodio (de manera anónima) y una columna por cada una de las variables explicativas que hemos definido más otra columna con la variable objetivo (en este caso es una variable dicotómica mortalidad [SÍ/NO]).

Para los lectores que quieran reproducir los ejemplos que se proporcionan en esta revisión hemos preparado un conjunto anonimizado de datos de nuestra base propia y la hemos subido en forma de tabla Excel a un repositorio en GitHub (https://github.com/anunezr/revision_medicina_intensiva).

Existen tres variantes principales de aprendizaje máquina:

  • Aprendizaje supervisado. Cada registro está etiquetado con un valor de la variable objetivo, y se emplean distintas técnicas capaces de predecir en un registro nuevo el valor de esa variable. En nuestro ejemplo, la variable objetiva es la mortalidad (SÍ/NO). Una vez «entrenado» el sistema, este ha de ser capaz de predecir el valor de esa variable para un episodio que no haya sido presentado al sistema previamente. Por tanto, los datos de entrenamiento y los de prueba deben ser diferentes y estar almacenados por separado. Se utiliza en tareas de clasificación, predicción y detección de similitud.

  • Aprendizaje no supervisado. En este caso se trata de detectar patrones o tendencias en los datos sin utilizar una variable objetivo. Se utiliza por ejemplo para clasificar pacientes en grupos de manera automática y para reducir el número de variables y la complejidad de los modelos.

  • Aprendizaje por refuerzo. En este caso el sistema debe perseguir un objetivo o recompensa, e irá aprendiendo a medida que se va explorando el entorno con el que interactúa, que no se conoce de antemano, evitando las acciones con recompensa negativa e intentando llevar a cabo acciones con recompensa positiva. Un ejemplo sería un sistema que va aprendiendo y ajustando las pautas antibióticas empíricas que realizan los clínicos según van siendo los resultados y las características de los pacientes sépticos que se van presentando.

En la tabla 1_Sup, que se incluye en el anexo A de material suplementario, se resumen las distintas técnicas de ML para cada una de estas variantes. El empleo de estas técnicas requiere tener unos conocimientos en programación y un dominio de los conceptos utilizados en el campo de la IA que normalmente no están al alcance del clínico. Por ello se va imponiendo un nuevo enfoque de trabajo colaborativo que incluye la aparición en las unidades de un nuevo tipo de profesional, con conocimientos clínicos básicos y dominio avanzado de la estadística y de las herramientas y métodos de BDA y ML. Estos profesionales, trabajando codo con codo con los clínicos, pueden ayudarnos a extraer valor de la gran cantidad de información clínica que ahora mismo se encuentra almacenada en nuestras bases de datos. Este man in the middle, que empieza a aparecer ya en centros punteros en desarrollo tecnológico, será en un futuro cercano una parte importante del equipo de nuestras unidades y ayudará a planificar las decisiones estratégicas y a optimizar las herramientas informáticas para obtener de ellas el máximo rendimiento.

Para los lectores con conocimientos de R o Python que quieran adquirir práctica básica en el campo del ML incluimos en el repositorio de GitHub asociado a esta revisión (https://github.com/anunezr/revision_medicina_intensiva) una serie de scripts que utilizan las distintas técnicas reflejadas en la tabla 1_Sup sobre la base de datos anonimizada que se proporciona como ejemplo.

En la tabla 1 se muestra un «mapa de ruta» para poner en práctica un sistema de ML adaptado a un problema concreto18. Cada uno de los aspectos que se contemplan daría para una revisión tan extensa o más que este manuscrito. El objeto de la tabla es hacer entender que el empleo de BDA y ML precisa de una metodología y una sistemática compleja que requiere conocimientos y experiencia específicos para conseguir resultados. Solo bajo estas premisas podremos extraer conocimiento de los datos eficazmente.

Tabla 1.

Pasos a seguir para construir un sistema de Machine Learning

Limpieza, reorganización y preprocesamiento 
Una vez extraídos los datos se procede a verificar su calidad y darles el formato y escala adecuados, resolviendo problemas de ausencias e inconsistencias para prepararlos para ser procesados por el modelo correspondiente 
Son de hecho estas primeras dos tareas las que consumen la mayor parte del tiempo en un proyecto Big Data Analysis (BDA) y/o Machine Learning (ML) 
Selección de atributos 
Escoger qué variables se van a utilizar en el proceso de aprendizaje, reduciendo al mínimo posible su número y dimensionalidad. Sin embargo, una ventaja del ML frente a modelos de estadística convencional es que es capaz de asimilar mayor cantidad de variables y, basándose en ellas, hacer predicciones más potentes 
Creación de los datasets de entrenamiento y validación 
Decidir el tipo de muestreo y cómo vamos a dividir los conjuntos de datos entre entrenamiento, validación y prueba 
Selección del modelo y ajuste hiperparamétrico 
Escoger los algoritmos de aprendizaje que vamos a utilizar (selección de modelo, validación cruzada, métricas de resultados, optimización de hiperparámetros). Comparar los resultados entre los distintos algoritmos y modelos utilizados 
Evaluación del funcionamiento del modelo elegido 
Predicción 
Empleo del modelo en nuevos casos y reevaluación de su funcionamiento 
Herramientas

Para poder hacer uso de las técnicas de BDA y ML es necesario dominar al menos algunos de los lenguajes de computación estadística para análisis (R, Python o Java), dominar SQL como herramienta de consulta de bases de datos y saber utilizar las bibliotecas de código que se utilizan en este campo. En el apéndice de material suplementario puede verse una breve reseña del software más utilizado.

Dificultades y estrategias para aplicar estas técnicas en un servicio de medicina intensiva

Después de esta ensalada de acrónimos y tecnicismos, el intensivista de a pie tiende a preguntarse si realmente las técnicas de BDA y ML pueden aplicarse a su entorno de trabajo, y cómo hacerlo en la práctica de manera asequible. En realidad, el objetivo de esta revisión es concienciar al clínico de que entrar en el mundo de la inteligencia artificial aplicada a la medicina intensiva es posible, pero exige cambios estructurales e inversión en recursos humanos y tecnología, así como una visión ampliada del concepto de investigación clínica.

El primer requisito, lógicamente, es un sistema de adquisición y almacenamiento de los datos que permita su procesamiento analítico posterior. En España todavía estamos muy lejos de conseguirlo, ya que los sistemas de información clínica informatizados distan de tener una implantación universal en nuestras unidades, por no hablar de un estándar interhospitalario. Además, un gran número de las que poseen estas aplicaciones departamentales carecen de un acceso eficiente a los datos almacenados (a menudo porque el contrato de adquisición de los sistemas no incluyó en su momento este aspecto, que suele tener un coste adicional). Estas situaciones paradójicas, que rayan en la falta de ética al quedar los datos clínicos «prisioneros» en manos de los proveedores del software comercial, deben ser solventadas con urgencia si queremos empezar a trabajar con las nuevas herramientas de BDA y ML por el bien de nuestros pacientes.

En segundo lugar, hace falta que los hospitales asignen personal especializado de los departamentos de tecnología de la información a las labores de custodia, procesamiento y análisis de los datos clínicos de nuestras unidades, trabajando de manera colaborativa con los médicos y enfermeras para conseguir obtener el máximo rendimiento de la información almacenada.

En tercer lugar, es necesario aliarse y trabajar conjuntamente con los comités de ética locales y regionales para conseguir garantizar por un lado la seguridad y la privacidad de los datos y, por otro lado, no ensombrecer las oportunidades de mejora de los procesos y la atención clínica que la explotación de los datos almacenados puede proporcionarnos.

Bases de datos compartidas

Se conoce como análisis secundario de las bases de datos de salud electrónicas (Electronic Health Records [EHR])19 al procesamiento que se realiza sobre los datos clínicos de los pacientes generados como subproducto de su adquisición con fines asistenciales y que puede utilizarse como ayuda en la toma de decisiones estratégicas en una unidad o puntuales para un paciente concreto.

En un afán por potenciar la investigación clínica en el ámbito de la medicina intensiva, algunas de las instituciones que disponen de bases de datos clínicos muy extensas las han puesto a disposición de los investigadores de todo el mundo tras un proceso de anonimización para mantener la privacidad de los datos. La más popular en el momento actual es Medical Information Mart in Intensive Care (MIMIC-III)20,21, que reúne como características principales el ser de acceso público y presentar una excelente calidad de los datos incluidos, que abarcan información clínica de todo tipo, extraída de más de 58.000 pacientes críticos, tanto adultos como neonatos.

Otro ejemplo de estas bases de datos sería eICU Collaborative Research Database22, poblada con datos de una combinación de numerosas unidades de cuidados intensivos en todo el territorio continental de Estados Unidos. Los registros de la base de datos colaborativa recogen información de casi 200.000 pacientes que fueron admitidos en las unidades de cuidados críticos en 2014 y 2015.

Como podemos imaginar, aunque este análisis secundario puede ser de gran utilidad para un servicio de medicina intensiva o para un investigador clínico, su proyección se ve incrementada si los datos de varias unidades pueden combinarse para formar una gran base de datos multicéntrica. El efecto es similar al que sucede cuando consideramos las conclusiones que pueden obtenerse de un ensayo clínico realizado en un único centro con respecto a un ensayo multicéntrico.

Sin embargo, para poder llegar a este objetivo es necesario vencer una serie de dificultades.

Cada unidad recoge los datos en una herramienta de software que puede no ser la misma en todas las unidades cuyos datos se quieren agrupar. Por tanto, hay que realizar un proceso de conversión a una estructura de datos común que permita su análisis conjunto. Esto es lo que antes hemos denominado «mapeo». Para ello han surgido ontologías que permiten expresar y mapear los conceptos almacenados de manera uniforme. Algunas de ellas, como Observational Medical Outcomes Partnership (OMOP)10 o Informatics for Integrating Biology and the Bedside (i2b2)23, ofrecen herramientas para facilitar la migración de la base de datos local a un estándar común de datos.

Si tenemos en cuenta únicamente los estudios publicados en los últimos años utilizando la base de datos pública MIMIC20 y bibliotecas de software con algoritmos de última generación y acceso gratuito, nos encontramos con que se han obtenido resultados interesantes en campos muy diversos de la medicina intensiva, que se muestran en la tabla 2.

Tabla 2.

Aspectos de investigación clínica estudiados mediante técnicas de Big Data Analysis y Machine Learning

La utilidad del uso la ecocardiografía en la sepsis35 
La utilidad de conocer la variabilidad de los niveles de glucosa en sangre en el pronóstico de los pacientes no diabéticos36 
La mejora en la predicción de mortalidad en UCI en función de parámetros fisiológicos37 
La detección precoz de la sepsis38 y la posibilidad de generar una alerta precoz en los pacientes con alto riesgo de desarrollar shock séptico39 
La diferencia entre los objetivos de balance hídrico a establecer entre las primeras y las segundas 24h de resucitación de la sepsis40 
El valor predictivo de las notas de enfermería en el pronóstico a largo plazo de los pacientes41 
La utilidad del drenaje precoz de la vía biliar en la colangitis aguda42 
La capacidad de las herramientas de procesamiento de lenguaje natural para detectar diagnósticos no codificados en notas de texto libre29 
El valor pronóstico negativo de la taquicardia prolongada43 
La paradójica relación entre obesidad y mortalidad en UCI en pacientes con patologías crónicas44 
La predicción de los reingresos precoces no deseados45 
El empleo de variables clínicas adicionales para ajustar mejor las dosis de heparina en perfusión46 
El peor pronóstico que presentan tras ingresar en UCI pacientes que toman inhibidores de la recaptación de serotonina47 

Además, una ventaja de esta estrategia es que los resultados son completamente reproducibles: podemos tomar el conjunto de datos que han utilizado los autores y reproducir los métodos estadísticos y de aprendizaje máquina que han utilizado, incluso con nuestros propios datos, ya que están disponibles habitualmente en repositorios públicos como GitHub24,25. Esto hace que los estudios estén sometidos a un control de calidad adicional y que cualquiera pueda revisar tanto métodos y como resultados.

Existen condicionantes de tipo legal y ético que pueden dificultar el proceso de compartición de los datos, y puede ser necesario que los comités de ética locales autoricen el acceso y verifiquen la salvaguarda de la privacidad y la seguridad de los datos.

La logística del proceso requiere una acción coordinada entre los centros participantes y un soporte tecnológico y de hardware en consonancia con el proyecto a través de equipos multidisciplinares que puedan hacer frente a los retos que las distintas facetas de tamaña empresa requieren.

Una vez superadas estas dificultades, las oportunidades de mejora de la gestión, de benchmarking y de avance en la investigación clínica son enormes, y sin duda compensarán el esfuerzo que la incorporación de un servicio de medicina intensiva en un proyecto de este tipo supone.

Procesamiento del lenguaje natural

Dado que la mayoría de la información que el profesional introduce en la historia clínica está en formato de texto libre (también conocido como lenguaje natural), un posible campo de aplicación de las técnicas de inteligencia artificial a la medicina es la creación de información estructurada a partir del texto libre de manera automática, así como la clasificación o fenotipado de los pacientes en distintos grupos en función del contenido de lo escrito por los profesionales. Estas técnicas, conocidas como procesamiento del lenguaje natural (Natural Language Processing [NLP]), están avanzando rápidamente26. Existen dos posibles enfoques:

  • La estrategia de extracción de conceptos a partir del texto utilizando herramientas como cTAKES27 está bastante desarrollada en el mundo anglosajón, pero existen pocas opciones prácticas para texto no escrito en inglés. El grupo de Investigación en Minería de Datos del Centro de Tecnología Biomédica de la Universidad Politécnica de Madrid está trabajando con una herramienta derivada de cTAKES llamada TIDA28, y es posible que en el futuro este tipo de sistemas se incorporen a nuestro arsenal informático.

  • Como alternativa está el empleo de redes neuronales convolucionales (CNN)29, pero este tipo de estrategia tiene el inconveniente de que los algoritmos que se obtienen no son fácilmente interpretables por el médico (aunque si el modelo funciona correctamente esto puede ser irrelevante), y sus resultados son variables dependiendo de los fenotipos buscados.

Análisis retrospectivo de Big Data versus ensayos clínicos aleatorizados

Dado que los datos clínicos que se almacenan en nuestros sistemas de información clínica no se recogen con la misma exigencia que aplicamos a los ensayos clínicos, ¿cómo es posible que el análisis secundario de los datos asistenciales nos proporcione conclusiones fiables? La clave está en el volumen de datos y en la capacidad de las herramientas de ML de detectar estructura en medio del caos19. Podemos utilizar como ejemplo el seguimiento que se realizó de la incidencia de la gripe H1N1 durante la epidemia de 2008 mediante el contaje de las búsquedas en Google utilizando el término «gripe»14, que se ha seguido validando posteriormente (fig. 3), y que se correlaciona perfectamente con los registros de casos obtenidos mediante métodos más ortodoxos.

Figura 3.

Uno de los primeros ejemplos de la aplicación del análisis de Big Data a la investigación clínica. Durante la epidemia de gripe N1H1 de 2008, las búsquedas en Google del término «gripe» o sus síntomas predijeron con gran precisión el aumento de casos y la severidad del cuadro. En la imagen superior puede visualizarse la cantidad de búsquedas y en la imagen inferior la evolución de los casos según el Sistema de Vigilancia Oficial de Gripe en España (las escalas de tiempo están ajustadas para que se correspondan verticalmente ambos gráficos). Este hallazgo ha sido utilizado posteriormente como sistema de vigilancia epidemiológico con gran éxito.

(0.25MB).

Aunque hasta ahora no podemos decir que BDA y ML hayan desbancado a los métodos tradicionales de investigación clínica, sí es cierto que permiten la detección de tendencias o patrones en grandes conjuntos de datos que pueden pasar desapercibidos al investigador y que pueden guiar el diseño de nuevos estudios que se atengan a la metodología convencional30. Además, son la única alternativa en aquellas situaciones en las que no es posible logísticamente plantearse un ensayo clínico ortodoxo con suficiente poder estadístico para resolver una pregunta relevante.

Cuestiones éticas y legales

En un reciente artículo en Intensive Care Medicine, McLennan et al.31 hacen un excelente análisis de los problemas que la compartición de datos clínicos incluidos en bases de datos asistenciales puede generar. Desde la puesta en vigor de la directiva general europea sobre protección de datos (GDPR)32 en mayo de 2018, las instituciones han de cumplir una normativa con respecto al manejo de los datos personales de pacientes que residen en la Unión Europea. El equivalente que impera en Estados Unidos de América es conocida como Health Insurance Portability and Accountability Act (HIPAA), de 199633.

El aspecto clave es la anonimización de los datos: si los datos son completamente anónimos, no hay problema legal en su compartición desde el punto de vista de los derechos de privacidad y seguridad. Pero ¿cuándo podemos considerar nuestros datos completamente anónimos? Únicamente cuando no lleven a la identificación unívoca del paciente cuando se complementan con otros datos (por ejemplo, aunque no sepamos el nombre del paciente o su número de historia, si sabemos la fecha de ingreso y la edad podemos llegar a identificar de qué paciente se trata). También debe evitarse la identificación unívoca del personal sanitario que aparece en la historia clínica del paciente. En todos los demás casos se considera que los datos están pseudoanonimizados, y en ese caso estaríamos obligados, según la directiva GDPR, a pedir consentimiento al paciente para su utilización.

Por ello resulta crucial el paso de anonimización de las bases de datos y es necesario estandarizar un proceso que permita cumplir la normativa europea perdiendo el mínimo valor posible de la información. Los investigadores deben trabajar juntamente con los comités de ética locales para armonizar la salvaguarda de la privacidad y seguridad de los datos con los avances en la investigación clínica que las nuevas herramientas de BDA nos pueden proporcionar en el futuro. Deben desarrollarse mecanismos que faciliten el consentimiento del paciente (o su retirada) a la utilización de los datos generados en su proceso asistencial y convenientemente anonimizados para la investigación clínica.

Otro aspecto importante que tratar es el tema de la propiedad de los datos. En este caso estamos enfocando ya no aspectos de seguridad o privacidad, sino más bien su valor intrínseco (incluso como bien comercial). ¿Tienen el paciente (origen de los datos) o el clínico (actor del proceso que introduce la información en el sistema) derecho a exigir una compensación económica o a prohibir el empleo de los datos para investigación clínica o cualquier otro uso? Aunque la realidad actual es que los datos están frecuentemente en manos de las empresas desarrolladoras del software sanitario, que son las que pretenden obtener un beneficio comercial por su explotación34, este aspecto está hoy en día sometido a una gran controversia y sería deseable una clarificación por parte del legislador para resolver los problemas que ahora mismo se plantean.

Conclusiones

Las herramientas de Big Data Analysis y Machine Learning suponen una gran oportunidad para mejorar la gestión estratégica de las unidades, el manejo de casos clínicos concretos y la investigación clínica. Sin embargo, para poder aprovechar esta nueva metodología necesitamos evolucionar incorporando nuevos recursos humanos (personal especializado con conocimientos clínicos y entrenamiento en inteligencia artificial) y tecnológicos. Además, debemos ser capaces de armonizar los condicionantes de privacidad y seguridad de los datos de nuestros pacientes con la posibilidad de utilizar grandes bases de datos clínicas de manera eficiente.

Los autores estamos convencidos de que un equipo internacional y multidisciplinar, que trabaje colectivamente para extraer conocimiento de grandes conjuntos de datos clínicos según se ha explicado a lo largo de este manuscrito, puede traer una revolución a la práctica moderna de la atención al paciente crítico.

Financiación

Los autores no han recibido ningún soporte económico para la realización del manuscrito.

Conflicto de intereses

Los autores declaran no tener ningún conflicto de intereses en relación con el contenido del artículo.

Bibliografía
[1]
M. Sevenster, J. Buurman, P. Liu, J.F. Peters, P.J. Chang.
Natural language processing techniques for extracting and categorizing finding measurements in narrative radiology reports.
Appl Clin Inform., 6 (2015), pp. 600-610
[2]
B.G. Arndt, J.W. Beasley, M.D. Watkinson, J.L. Temte, W.J. Tuan, C.A. Sinsky, et al.
Tethered to the EHR: Primary care physician workload assessment using EHR event log data and time-motion observations.
Ann Fam Med., 15 (2017), pp. 419-426
[3]
SNOMED International. SNOMED 2018. Disponible en: https://www.snomed.org/
[4]
HL7. HL7 Standards 2018. Disponible en: http://www.hl7.org/
[5]
NIH. UMLS 2018. Disponible en: https://www.nlm.nih.gov/research/umls/
[6]
DICOM. DICOM 2018. Disponible en: https://www.dicomstandard.org/
[7]
Institute R. LOINC 2018. Disponible en: https://loinc.org/
[8]
NIH. Medical Subject Headings 2018. Disponible en: https://www.ncbi.nlm.nih.gov/mesh
[9]
Diseases ICo. CIE 10 2018. Disponible en: https://eciemaps.msssi.gob.es/
[10]
OHDSI. OMOP Data Model 2018. Disponible en: https://www.ohdsi.org/data-standardization/the-common-data-model/
[11]
XML. Extensible Markup Language 2018. Disponible en: https://es.wikipedia.org/wiki/Extensible_Markup_Language
[12]
L.A. Celi, R.G. Mark, D.J. Stone, R.A. Montgomery.
“Big Data” in the intensive care unit. Closing the data loop.
Am J Respir Crit Care Med., 187 (2013), pp. 1157-1160
[13]
D.M. Andrea, G. Marco, G. Michele.
A formal definition of Big Data based on its essential features.
Library Review., 65 (2016), pp. 122-135
[14]
J. Ginsberg, M.H. Mohebbi, R.S. Patel, L. Brammer, M.S. Smolinski, L. Brilliant.
Detecting influenza epidemics using search engine query data.
Nature., 457 (2008), pp. 1012
[15]
Foundation AS. Apache Hadoop 2014. Disponible en: http://hadoop.apache.org/
[16]
Mehta R. 1. Big Data Analytics with Java. Big Data Analytics with Java: Data analysis, visualization & machine learning techniques. Birmingham, UK: Packt; 2018.
[17]
A.L. Samuel.
Some studies in machine learning using the game of checkers.
IBM J Res Dev, 3 (1959), pp. 210-229
[18]
Raschka S MV. Chapter 1. Giving computers the ability to learn from data. Python Machine Learning Machine learning and deep learning with Python, scikit-learn and Tensorflow. Birmingham, UK: Packt; 2017, September.
[19]
Data MC. Secondary Analysis of Electronic Health Records 2016.
[20]
A.E. Johnson, T.J. Pollard, L. Shen, L.W. Lehman, M. Feng, M. Ghassemi, et al.
MIMIC-III, a freely accessible critical care database.
Sci Data., 3 (2016), pp. 160035
[21]
MIT Lab for Computational Physiology. MIMIC 2018. Disponible en: http://mimic.physionet.org
[22]
Database eCR. eICU Collaborative Research Database 2018. Disponible en: https://eicu-crd.mit.edu/
[23]
Computing NCfB. i2b2 (Informatics for Integrating Biology and the Bedside) 2018. Disponible en: https://www.i2b2.org
[24]
A.E. Johnson, D.J. Stone, L.A. Celi, T.J. Pollard.
The MIMIC Code Repository: Enabling reproducibility in critical care research.
J Am Med Inform Assoc., 25 (2018), pp. 32-39
[25]
MIT-LCP. MIMIC Code Repository: Code shared by the research community for the MIMIC-III database 2018. Disponible en: https://github.com/MIT-LCP/mimic-code
[26]
V.M. Pai, M. Rodgers, R. Conroy, J. Luo, R. Zhou, B. Seto.
Workshop on using natural language processing applications for enhancing clinical decision making: An executive summary.
J Am Med Inform Assoc., 21 (2014), pp. e2-e5
[27]
Apache Software Foundation. Apache cTAKES™ 2018. Disponible en: http://ctakes.apache.org/
[28]
Costumero R, Gonzalo C, Menasalvas E. TIDA: A Spanish EHR Semantic Search Engine. 8th International Conference on Practical Applications of Computational Biology & Bioinformatics (PACBB 2014). 1st edition. New York: Springer; 2014: pp. 235-242.
[29]
S. Gehrmann, F. Dernoncourt, Y. Li, E.T. Carlson, J.T. Wu, J. Welt, et al.
Comparing deep learning and concept extraction based methods for patient phenotyping from clinical narratives.
[30]
C.S. Mayo, M.M. Matuszak, M.J. Schipper, S. Jolly, J.A. Hayman, R.K. Ten Haken.
Big Data in designing clinical trials: Opportunities and challenges.
Front Oncol., 7 (2017), pp. 187
[31]
S. McLennan, D. Shaw, L.A. Celi.
The challenge of local consent requirements for global critical care databases.
Intensive Care Med., (2018),
[32]
EU GDPR Portal. EU General Data Protection Regulation (GDPR) 2018. Disponible en: https://www.eugdpr.org/
[33]
HHS.gov. Health information privacy. 2018.
[34]
A. Tanner.
Our Bodies, Our Data: How Companies Make Billions Selling Our Medical Records.
Beacon Press, (2016), pp. 218
[35]
M. Feng, J.I. McSparron, D.T. Kien, D.J. Stone, D.H. Roberts, R.M. Schwartzstein, et al.
Transthoracic echocardiography and mortality in sepsis: Analysis of the MIMIC-III database.
Intensive Care Med., 44 (2018), pp. 884-892
[36]
W.Y. Liu, S.G. Lin, G.Q. Zhu, S.V. Poucke, M. Braddock, Z. Zhang, et al.
Establishment and validation of GV-SAPS II scoring system for non-diabetic critically ill patients.
PLoS One., 11 (2016), pp. e0166085
[37]
J. Calvert, Q. Mao, J.L. Hoffman, M. Jay, T. Desautels, H. Mohamadlou, et al.
Using electronic health record collected clinical variables to predict medical intensive care unit mortality.
Ann Med Surg (Lond)., 11 (2016), pp. 52-57
[38]
T. Desautels, J. Calvert, J. Hoffman, M. Jay, Y. Kerem, L. Shieh, et al.
Prediction of sepsis in the intensive care unit with minimal electronic health record data: A Machine Learning approach.
JMIR Med Inform., 4 (2016), pp. e28
[39]
K.E. Henry, D.N. Hager, P.J. Pronovost, S. Saria.
A targeted real-time early warning score (TREWScore) for septic shock.
[40]
Y. Shen, W. Ru, X. Huang, W. Zhang.
Time-related association between fluid balance and mortality in sepsis patients: Interaction between fluid balance and haemodynamics.
[41]
I.E.R. Waudby-Smith, N. Tran, J.A. Dubin, J. Lee.
Sentiment in nursing notes as an indicator of out-of-hospital mortality in intensive care patients.
PLoS One., 13 (2018), pp. e0198687
[42]
M. Aboelsoud, O. Siddique, A. Morales, Y. Seol, M. al-Qadi.
Early biliary drainage is associated with favourable outcomes in critically-ill patients with acute cholangitis.
Prz Gastroenterol., 13 (2018), pp. 16-21
[43]
V. Sandfort, A.E.W. Johnson, L.M. Kunz, J.D. Vargas, D.R. Rosing.
Prolonged elevated heart rate and 90-day survival in acutely ill patients: Data from the MIMIC-III database.
J Intensive Care Med., (2018),
[44]
P. Janice, R. Shaffer, Z. Sinno, M. Tyler, J. Ghosh.
The obesity paradox in ICU patients.
Conf Proc IEEE Eng Med Biol Soc., 2017 (2017), pp. 3360-3364
[45]
T. Desautels, R. Das, J. Calvert, M. Trivedi, C. Summers, D.J. Wales, et al.
Prediction of early unplanned intensive care unit readmission in a UK tertiary care hospital: A cross-sectional machine learning approach.
BMJ Open., 7 (2017), pp. e017199
[46]
M.M. Ghassemi, S.E. Richter, I.M. Eche, T.W. Chen, J. Danziger, L.A. Celi.
A data-driven approach to optimized medication dosing: A focus on heparin.
Intensive Care Med., 40 (2014), pp. 1332-1339
[47]
M. Ghassemi, J. Marshall, N. Singh, D.J. Stone, L.A. Celi.
Leveraging a critical care database: Selective serotonin reuptake inhibitor use prior to ICU admission is associated with increased hospital mortality.
Chest., 145 (2014), pp. 745-752
Copyright © 2018. Elsevier España, S.L.U. y SEMICYUC
Descargar PDF
Idiomas
Medicina Intensiva
Opciones de artículo
Herramientas
Material suplementario
es en

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?