Hipócrates: un marco de aprendizaje automático de código abierto para promover modelos de lenguaje grandes en la atención médica

La inteligencia artificial (IA) está transformando la atención sanitaria, aportando técnicas computacionales sofisticadas para abordar desafíos que van desde el diagnóstico hasta la planificación del tratamiento. En este campo dinámico, los modelos de lenguaje grande (LLM) están surgiendo como herramientas poderosas capaces de analizar y comprender datos médicos complejos, lo que promete revolucionar la atención y la investigación del paciente.

Un problema clave al que se enfrenta el sector sanitario es la naturaleza compleja de los datos médicos y las rigurosas exigencias de precisión y eficiencia en los diagnósticos médicos. Para las aplicaciones de IA, el desafío no es solo procesar grandes cantidades de datos, sino también brindar información precisa y aplicable en entornos clínicos en tiempo real.

Las investigaciones existentes en IA sanitaria incluyen el Meditron 70B, que utiliza ajustes supervisados ​​en textos médicos, y el modelo MedAlpaca, que aprovecha la arquitectura LLaMA para diálogos médicos. BioGPT se centra en la generación de textos biomédicos y demuestra la adaptabilidad de los transformadores en dominios especializados. El modelo PMC-LLaMA mejora aún más el rendimiento mediante un entrenamiento previo de dominio específico a partir de grandes bases de datos biomédicas. Las limitaciones de estas herramientas surgen de su acceso restringido a conjuntos de datos propietarios y de la complejidad involucrada en modelos de capacitación que pueden manejar los matices de la terminología médica y los datos de los pacientes de manera efectiva.

Investigadores de la Universidad de Koç, la Universidad Hacettepe, la Universidad Técnica de Yıldız y el Robert College presentaron “Hippocrates”, un marco de código abierto diseñado para aplicaciones sanitarias de los LLM. A diferencia de los modelos anteriores que se basan en datos patentados, Hipócrates otorga acceso completo a sus amplios recursos, fomentando una mayor innovación y colaboración en la investigación de la IA médica. Este marco se destaca por integrar la capacitación previa continua y el aprendizaje de refuerzo con comentarios de expertos humanos, lo que mejora la utilidad práctica del modelo en entornos médicos.

El marco de Hipócrates emplea una metodología sistemática que comienza con una capacitación previa continua sobre un corpus integral de textos médicos. Luego, los modelos, incluida la familia Hippo de modelos de parámetros 7B, se ajustan utilizando conjuntos de datos especializados, como las bases de datos MedQA y PMC-Patients. Este proceso aprovecha las técnicas de ajuste de instrucciones y aprendizaje de refuerzo para alinear los resultados del modelo con los conocimientos médicos de expertos. La evaluación sólida emplea el marco de evaluación de EleutherAI, lo que garantiza que los modelos se prueben en varios puntos de referencia médicos para validar su eficacia y confiabilidad.

El marco de Hipócrates ha demostrado una eficacia notable: los modelos Hippo-7B lograron una precisión de 5 disparos del 59,9 % en el conjunto de datos MedQA, superando la precisión del 58,5 % de los modelos de parámetros 70B de la competencia. Esta importante mejora pone de relieve la eficacia del marco. Además, estos modelos superan consistentemente a otros LLM médicos establecidos en múltiples puntos de referencia, lo que valida la solidez de los procesos de capacitación y ajuste empleados. Estos resultados afirman la capacidad del marco de Hipócrates para mejorar la precisión y confiabilidad de las aplicaciones de IA en el ámbito médico.

En conclusión, el marco de Hipócrates representa un avance significativo en la aplicación de los LLM a la atención sanitaria. Hipócrates facilita mejoras sustanciales en el diagnóstico médico al brindar acceso abierto a recursos integrales y emplear una metodología refinada de capacitación previa continua y ajuste con conjuntos de datos médicos especializados. La implementación exitosa y el rendimiento superior de los modelos Hippo, evidenciados por su sólida precisión en varios puntos de referencia, subrayan el potencial del marco para mejorar la investigación médica y la atención al paciente a través de soluciones innovadoras impulsadas por IA.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Únete a nuestro Canal de telegramas, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro SubReddit de más de 40.000 ml


Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.