La idea
Las historias clínicas electrónicas (HCE) son una herramienta cada vez más utilizada en la industria de la salud para almacenar y gestionar la información longitudinal detallada sobre el estado de salud y el historial clínico de cada paciente. Mucha de esta información se encuentra en forma de texto no estructurado.
La modelización temporal de esta historia clínica, que tiene en cuenta la secuencia de eventos, puede utilizarse para predecir y simular eventos futuros, estimar riesgos, sugerir diagnósticos alternativos o prever complicaciones. Muchos enfoques de predicción se basan principalmente en datos estructurados o en un subconjunto de pronósticos y resultados de un solo dominio.
Sin embargo, Foresight es un proceso novedoso basado en GPT3 que procesa toda la parte de texto libre de las HCE para la modelización longitudinal. Utiliza herramientas de extracción de entidades y etiquetado de lenguaje (NER+L, por sus siglas en inglés) como MedCAT para convertir el texto del documento en conceptos estructurados y codificados, y proporciona predicciones probabilísticas de futuros eventos médicos como trastornos, medicamentos, síntomas e intervenciones.
El Proceso
Al procesar gran parte de los datos de la HCE en forma de texto, este enfoque permite obtener una visión granular y detallada del paciente, aunque también introduce un nivel moderado de ruido. Foresight ha demostrado ser eficaz en la predicción de eventos médicos futuros en pruebas realizadas en dos grandes hospitales del Reino Unido y en el conjunto de datos estadounidense MIMIC-III, con una precisión@10 del 80%, 81% y 91%, respectivamente, para predecir el siguiente concepto biomédico. Además, ha sido validado por cinco médicos en 34 líneas de tiempo de pacientes sintéticos, alcanzando una relevancia del 97% para el principal trastorno candidato pronosticado.
Foresight es un modelo de propósito general para la modelización de conceptos biomédicos que puede utilizarse para la estimación de riesgos en el mundo real, ensayos virtuales e investigación clínica para estudiar la progresión de enfermedades, simular intervenciones y contrafactuales, y con fines educativos. Es fácilmente entrenable y se puede desplegar de forma local, ya que sólo requiere datos de texto libre (como mínimo). Como modelo generativo, puede simular
- Un ejemplo de como funciona a modo de demostración lo encontrarás en su web
- Toda la documentación del proceso en arxiv
La Herramienta MedCAT
MedCAT se puede utilizar para extraer información de registros médicos electrónicos (EHR) y vincularla a ontologías biomédicas como SNOMED-CT y UMLS.
Tiene 4 modelos públicos disponibles:
- UMLS Small (un paquete modelo que contiene un subconjunto de UMLS (trastornos, síntomas, medicamentos…). Entrenado en MIMIC-III)
- SNOMED International (Paquete completo de modelos SNOMED entrenado en MIMIC-III)
- UMLS holandés v1.10 (un paquete de modelos proporcionado por UMC Utrecht que contiene entidades UMLS con nombres holandeses entrenados en artículos médicos holandeses de wikipedia y un repositorio / documento modelo de detección de negación entrenado en EMC Dutch Clinical Corpus).
- UMLS completa. >4MM conceptos entrenados autosupervisados en MIMIC-III. v2022AA de UMLS.
Para descargar cualquiera de estos modelos, siga este enlace e inicie sesión en su perfil NIH/licencia UMLS. A continuación, será redirigido al formulario de descarga del modelo MedCAT.
- La UNESCO llama a todos los gobiernos a implementar el Marco Ético Mundial sin demora - 30 de marzo de 2023
- ¿Qué implica la IA generativa para la propiedad intelectual? - 28 de marzo de 2023
- Descubriendo AUC: Un indicador clave en la evaluación de modelos de clasificación - 26 de marzo de 2023