News Release

Un nuevo modelo de IA predice el riesgo de padecer enfermedades con décadas de antelación

El modelo puede estimar el riesgo a largo plazo de más de 1000 enfermedades y predice los cambios en la salud humana con décadas de antelación

Peer-Reviewed Publication

European Molecular Biology Laboratory

image: 

AI model forecasts disease risk decades in advance

view more 

Credit: Karen Arnott/EMBL-EBI

Imagina un futuro donde tu historial médico pudiera ayudar a predecir qué enfermedades podrías padecer en las próximas dos décadas. Científicos del EMBL y DKFZ desarrollan un modelo de IA generativa que usa informes médicos a gran escala para estimar cómo cambia la salud humana durante años. Este modelo puede predecir el riesgo y el momento concreto de más de 1000 enfermedades y predecir resultados de salud con más de una década de antelación.

Este nuevo modelo de IA generativa ha sido construido a medida usando conceptos algorítmicos similares a los de modelos de lenguaje a gran escala (LLM por sus siglas en inglés). Los científicos entrenaron el modelo con datos anónimos de más de 400.000 pacientes del UK Biobank. El modelo se probó de manera exitosa usando datos de 1,9 millones de pacientes del Registro Nacional de Pacientes Daneses. Este método es una de las demostraciones más completas hasta la fecha de cómo la IA generativa puede modelar la progresión de enfermedades humanas a gran escala y se testeó con datos de dos sistemas de atención sanitaria completamente independientes.

“Nuestro modelo de IA es una prueba de concepto: demuestra que es posible aprender de nuestros patrones de salud a largo plazo y usar esta información  para generar predicciones valiosas,” dice Ewan Birney, Director General Interino del Laboratorio Europeo de Biología Molecular (EMBL). “Si modelamos cómo se desarrollan las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo empiezan a emerger ciertos riesgos y esto nos permite planificar intervenciones preventivas. Es un gran paso hacia un sistema de salud personalizado y hacia la medicina preventiva.”

Este trabajo se publica en Nature y es una colaboración entre el EMBL, la DKFZ y la Universidad de Copenhague.

IA para la predicción de la salud

Así como los modelos de lenguaje a gran escala pueden aprender la estructura de las oraciones, este modelo de IA aprende la ‘gramática’ de los datos de salud para modelar los historiales médicos como secuencias de eventos que se desarrollan a lo largo del tiempo. Estos eventos incluyen diagnósticos médicos o factores de estilo de vida, como el tabaquismo. El modelo aprende a predecir el riesgo de enfermedad a partir del orden en que ocurren dichos eventos y del tiempo que transcurre entre ellos.

“Los eventos médicos a menudo siguen patrones predecibles”. dice Tom Fitzgerald, investigador del Instituto Europeo de Bioinformática del EMBL. “Nuestro modelo de IA aprende esos patrones y puede predecir resultados de salud. Nos proporciona una vía para explorar lo que podría pasarle a una persona basándose en su historial médico y otros factores clave. Obviamente la predicción no es una certeza, si no una estimación de los riesgos potenciales.”

El modelo funciona especialmente bien para condiciones con patrones de desarrollo claros y consistentes como por ejemplo ciertos tipos de cáncer, infartos y sepsis en sangre.

Usos futuros y limitaciones

Como las predicciones del tiempo, este nuevo modelo de IA proporciona probabilidades, no certezas. No predice de manera exacta lo que le pasará a un individuo, pero proporciona estimaciones bien calibradas de cómo ciertas condiciones médicas pueden ocurrir durante un periodo de tiempo. Por ejemplo, el modelo podría predecir las probabilidades de desarrollar una enfermedad cardiovascular en el próximo año. Estos riesgos vienen expresados como ratios o tasas a lo largo del tiempo, similar a prever un 70% de probabilidad de lluvia para mañana.

Algunos sucesos, como el riesgo de ser hospitalizado por un evento médico importante – como un infarto – se pueden predecir con certeza, mientras que otros son más inciertos. Así mismo pasa con las predicciones a corto plazo, que son más exactas que aquellas que se hacen a largo plazo.

Por ejemplo, cuando se usan nuevos datos que no se utilizaron para entrenar el modelo, éste predice niveles de riesgo variables para un infarto. Si se toma el cohorte del UK BioBank para edades entre 50 y 55, el riesgo de infarto varía desde una probabilidad de 1 en 10.000 por año para algunos hombres hasta aproximadamente 1 en 100 para otros, dependiendo de sus diagnósticos anteriores y su estilo de vida. Las mujeres tienen un riesgo promedio menor, pero una distribución de riesgo similar. Además, de media, el riesgo aumenta con la edad de los pacientes. Una evaluación sistemática de estos riesgos calculados en distintos grupos de edad y sexo mostró que corresponden bien con el número de casos observados.

El modelo está calibrado para producir estimaciones precisas de riesgo a nivel poblacional, prediciendo con qué frecuencia ocurren ciertas condiciones en grupos de personas. No obstante, como cualquier modelo de IA, tiene ciertas limitaciones. Por ejemplo, como los datos que se usaron para entrenarlo son del UK Biobank y éste principalmente contiene información de individuos entre 40 y 60 años, las condiciones médicas pediátricas y de adolescentes están subrepresentadas. El modelo también tiene sesgos demográficos debido a la falta de datos para entrenarlo, incluyendo subrepresentación de ciertos grupos étnicos.

Pese a que el modelo no está en la fase de uso clínico, ya puede ayudar a investigadores a:

  • entender cómo las enfermedades se desarrollan a lo largo del tiempo,

  • explorar cómo el estilo de vida y enfermedades pasadas afectan al riesgo de enfermedad a largo plazo,

  • simular resultados de salud usando datos de pacientes artificiales para situaciones en las que es difícil tener o acceder a datos reales.

En el futuro, modelos similares de IA entrenados con datos más representativos, podrían ayudar al personal sanitario a identificar de manera preventiva pacientes de alto riesgo. La población envejece, las tasas de enfermedades crónicas aumentan, y modelos como estos pueden ayudar a predecir necesidades futuras en los sistemas de salud, así como planificar mejor y destinar recursos de manera más eficiente. No obstante, antes de que modelos de IA como este puedan ser implementados en contextos clínicos, se necesita mucho más testeo, asesoramiento y marcos regulatorios sólidos.

“Este es el principio de una nueva manera de entender la salud humana y el desarrollo de enfermedades,” dice Moritz Gerstung, Director de la División de IA en Oncología en DKFZ y ex-jefe de grupo en EMBL-EBI “Algún día, modelos generativos como el nuestro podrían ayudar a personalizar la asistencia y a anticipar necesidades sanitarias a gran escala. Al aprender de grandes poblaciones, estos modelos ofrecen una perspectiva poderosa sobre cómo se desarrollan las enfermedades y, a la larga, podrían ayudar a hacer intervenciones preventivas y más personalizadas.”

Privacidad y ética

Este modelo de IA fue entrenado utilizando datos sanitarios anonimizados bajo estrictas normas éticas. Los participantes del UK Biobank dieron su consentimiento informado, y los datos daneses se accedieron de acuerdo con las regulaciones nacionales que exigen que los datos permanezcan dentro de Dinamarca. Los investigadores utilizaron sistemas virtuales seguros para analizar los datos sin moverlos a través de fronteras. Estas medidas de seguridad ayudan a garantizar que los modelos de IA se desarrollen y utilicen de manera que respeten la privacidad y cumplan con los estándares éticos.

Financiación

Este trabajo fue financiado por las contribuciones de los Estados miembros del EMBL, fondos del DKFZ y una subvención de la Fundación Novo Nordisk.


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.