Una plataforma integral de aprendizaje automático convierte los datos sanitarios en conocimientos

Una plataforma integral de aprendizaje automático convierte los datos sanitarios en conocimientos

Al impulsar los datos del hospital con un conjunto cada vez mayor de modelos de aprendizaje automático, Cardea se creó para ayudar a los hospitales a planificar eventos tan grandes como pandemias globales y tan pequeños como ausencias a las reuniones. Crédito: Arash Akhgari

Durante la última década, los hospitales y otros profesionales de la salud han dedicado una gran cantidad de tiempo y energía a adoptar registros médicos electrónicos, convirtiendo las notas imprudentes de los médicos en fuentes persistentes de información. Pero recopilar estos datos es menos de la mitad de la batalla. Puede llevar incluso más tiempo y esfuerzo convertir estos registros en conocimientos reales, que utilizan el conocimiento pasado para tomar decisiones futuras.

Cardea, un sistema de software construido por científicos i ingenieros de software en el Data to AI Lab del MIT (DAI Lab) se crea para ayudar con esto. El sistema puede ayudar a los hospitales a planificar eventos tan grandes como pandemias globales y tan pequeños como visitas de pacientes ambulatorios al canalizar los datos del hospital a través de un conjunto cada vez mayor de modelos de aprendizaje automático.

Con Cardea, los hospitales finalmente pueden resolver “cientos de diferentes tipos de problemas de aprendizaje automático”, dice Kalyan Veeramanchaneni, investigador principal del laboratorio DAI y científico principal del Laboratorio de Sistemas de Decisión e Información (LIDS) del MIT. Porque El marco es de código abiertoy utiliza técnicas generalizables, también pueden compartir estas soluciones, aumentando la transparencia y permitiendo el trabajo en equipo.

Automatizado para personas

Cardea pertenece al campo conocido como aprendizaje automático automatizado o AutoML. El aprendizaje automático es cada vez más común y se utiliza para todo, desde el desarrollo de medicamentos hasta la detección de fraudes con tarjetas de crédito. El objetivo de AutoML es democratizar estas herramientas predictivas, facilitando que las personas, incluidos en última instancia los no expertos, las creen, usen y comprendan, dice Veeramachaneni.

En lugar de requerir que las personas diseñen y programen un modelo completo de aprendizaje automático, los sistemas AutoML como Cardea muestran los existentes, junto con explicaciones de lo que hacen y cómo funcionan. Luego, los usuarios pueden mezclar y combinar módulos para lograr sus objetivos, como ir al buffet en lugar de cocinar una comida desde cero.

Por ejemplo, los científicos de datos han creado muchas herramientas de aprendizaje automático para la atención médica, pero la mayoría de ellas no son muy accesibles, incluso para los expertos. “Están escritos y ocultos”, dice Sarah Alnegheimish, una estudiante de posgrado de LIDS. Ella dice que para construir Cardea, ella y sus colegas desenterraron estas herramientas y las juntaron con el objetivo de crear una “referencia poderosa” para los solucionadores de problemas hospitalarios.

Paso a paso

Para convertir toneladas de datos en pronósticos útiles, Cardea guía a los usuarios a través de una tubería, tomando decisiones y protegiendo en cada etapa. Primero, son recibidos por un ensamblador de datos que recupera la información que brindan. Cardea se desarrolló para trabajar con Fast Healthcare Interoperability Resources (FHIR), el estándar actual de la industria para registros médicos electrónicos.

Los hospitales difieren exactamente en la forma en que utilizan FHIR, por lo que Cardea se creó para “adaptarse perfectamente a diferentes condiciones y diferentes conjuntos de datos”, dice Veeramachaneni. En caso de discrepancia en los datos, el Auditor de Datos de Cardea lo llamará la atención para que pueda ser corregido o rechazado.

Luego, Cardea pregunta al usuario qué quiere saber. Quizás les gustaría estimar cuánto tiempo puede permanecer un paciente en el hospital. Incluso preguntas aparentemente pequeñas como esta son clave cuando se trata de las operaciones hospitalarias diarias, especialmente ahora que las instalaciones de atención médica están administrando sus recursos durante la pandemia de COVID-19, dice Alnegheimish. Los usuarios pueden elegir entre diferentes modelos, y el sistema de software utiliza un conjunto de datos y modelos para aprender patrones de pacientes anteriores y predecir lo que podría suceder en este caso, lo que ayuda a las partes interesadas a planificar el futuro.

Cardea está ayudando actualmente a resolver cuatro tipos de preguntas sobre asignación de recursos. Pero debido a que la tubería incluye tantos modelos diferentes, se puede adaptar fácilmente a otros escenarios que puedan surgir. A medida que Cardea crece, el objetivo es que las partes interesadas puedan utilizarlo en última instancia para “resolver cualquier problema de pronóstico de la atención médica”, dice Alnegheimish.

El equipo presentó su artículo que describe el sistema en la Conferencia Internacional de Ciencia de Datos y Análisis Avanzado de IEEE en octubre de 2020. Los investigadores probaron la precisión del sistema con los usuarios de la popular plataforma de ciencia de datos y encontraron que venció al 90% de ellos. También probaron su efectividad pidiendo a los analistas de datos que utilicen Cardea para realizar pronósticos en un conjunto de datos de demostración de atención médica. Descubrió que Cardea mejoró significativamente su rendimiento, por ejemplo, diseñar una función que, según los analistas, generalmente les toma un promedio de dos horas, en lugar de eso, les tomó cinco minutos.

Confía en el proceso

Los trabajadores del hospital a menudo tienen la tarea de tomar decisiones importantes y críticas. Es importante que confíen en todas las herramientas que utilizan a lo largo del camino, incluida Cardea. No es suficiente que los usuarios ingresen números, presionen un botón y obtengan la respuesta: “Deben comprender el modelo y saber lo que está sucediendo”, dice Dongyu Liu, un postdoctorado en LIDS.

Para una transparencia aún mayor, el siguiente paso de Cardea es una auditoría de modelo. Como todos los motores predictivos, aprendizaje automático los modelos tienen fortalezas y debilidades. Al apilarlos, Cardea le da al usuario la oportunidad de decidir si acepta los resultados de este modelo o comienza de nuevo.

Cardea fue lanzado al público a principios de este año. Como es un software de código abierto, los usuarios pueden integrar sus propias herramientas. El equipo también ha hecho todo lo posible para garantizar que el sistema de software no solo sea accesible, sino también comprensible y fácil de usar. También ayudará con la reproducibilidad, dice Veeramachaneni, para que otras personas puedan entender y verificar las predicciones hechas en modelos construidos con el software.

El equipo también planea crear más visualizadores de datos y llamadas para proporcionar una visión aún más profunda y hacer que el sistema de software más accesible para los no expertos, dice Liu.

“Existe la esperanza de que la gente acepte esto y comience a contribuir”, dice Alnegheimish. “Con la ayuda de la comunidad, podemos hacerlo mucho más poderoso”.


Los científicos están construyendo modelos utilizando técnicas de aprendizaje automático para mejorar las predicciones de los resultados de COVID-19

Más información:
Cardea: Plataforma abierta de aprendizaje automático para registros médicos electrónicos. arXiv: 2010.00509 [cs.LG] arxiv.org/abs/2010.00509

Esta historia se volvió a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular de noticias sobre investigación, innovación y enseñanza del MIT.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *