Los modelos de base son prometedores en medicina, especialmente para ayudar en tareas complejas como la toma de decisiones médicas (MDM). MDM es un proceso matizado que requiere que los médicos analicen diversas fuentes de datos, como imágenes, registros médicos electrónicos e información genética, mientras se adaptan a las nuevas investigaciones médicas. Los LLM podrían respaldar la MDM al sintetizar datos clínicos y permitir el razonamiento probabilístico y causal. Sin embargo, la aplicación de LLM en atención médica sigue siendo un desafío debido a la necesidad de enfoques adaptables y de múltiples niveles. Aunque los LLM con múltiples agentes muestran potencial en otros campos, su diseño actual carece de integración con la toma de decisiones colaborativa y escalonada esencial para un uso clínico eficaz.
Los LLM se aplican cada vez más a tareas médicas, como responder preguntas de exámenes médicos, predecir riesgos clínicos, diagnosticar, generar informes y crear evaluaciones psiquiátricas. Las mejoras en los LLM médicos se derivan principalmente de la capacitación con datos especializados o del uso de métodos de tiempo de inferencia como la ingeniería rápida y la generación aumentada de recuperación (RAG). Los modelos de uso general, como el GPT-4, funcionan bien en pruebas médicas mediante indicaciones avanzadas. Los marcos de múltiples agentes mejoran la precisión, con agentes colaborando o debatiendo para resolver tareas complejas. Sin embargo, los marcos estáticos existentes pueden limitar el rendimiento en diversas tareas, por lo que un enfoque dinámico de múltiples agentes puede respaldar mejor la toma de decisiones médicas complejas.
El MIT, Google Research y el Hospital Universitario Nacional de Seúl desarrollaron Agentes de toma de decisiones médicas (MDAgents), un marco de múltiples agentes diseñado para asignar dinámicamente la colaboración entre LLM en función de la complejidad de las tareas médicas, imitando la toma de decisiones médicas del mundo real. Los agentes de MDA eligen de forma adaptable la colaboración individual o en equipo adaptada a tareas específicas, con un buen desempeño en varios puntos de referencia médicos. Superó los métodos anteriores en 7 de 10 puntos de referencia, logrando una mejora de hasta un 4,2 % en la precisión. Los pasos clave incluyen evaluar la complejidad de las tareas, seleccionar los agentes adecuados y sintetizar las respuestas; las revisiones grupales mejoran la precisión en un 11,8%. MDAgents también equilibra el rendimiento con la eficiencia ajustando el uso de los agentes.
El marco de MDAgents está estructurado en torno a cuatro etapas clave en la toma de decisiones médicas. Comienza evaluando la complejidad de una consulta médica, clasificándola como baja, moderada o alta. A partir de esta evaluación se contrata a los expertos adecuados: un único médico para los casos más sencillos o un equipo multidisciplinar para los más complejos. Luego, la etapa de análisis utiliza diferentes enfoques basados en la complejidad del caso, que van desde evaluaciones individuales hasta discusiones colaborativas. Finalmente, el sistema sintetiza todos los conocimientos para tomar una decisión concluyente, con resultados precisos que indican la efectividad de los agentes MDA en comparación con configuraciones de agente único y otras configuraciones de agentes múltiples en varios puntos de referencia médicos.
El estudio evalúa el marco y los modelos de referencia en varios puntos de referencia médicos en condiciones individuales, grupales y adaptativas, mostrando una notable solidez y eficiencia. El método adaptativo, MDAgents, ajusta eficazmente la inferencia en función de la complejidad de la tarea y supera consistentemente a otras configuraciones en siete de diez puntos de referencia. Los investigadores que prueban conjuntos de datos como MedQA y Path-VQA descubren que la selección de complejidad adaptativa mejora la precisión de las decisiones. Al incorporar MedRAG y la revisión de un moderador, la precisión mejora hasta un 11,8%. Además, la resistencia del marco a los cambios de parámetros, incluidos los ajustes de temperatura, destaca su adaptabilidad para tareas complejas de toma de decisiones médicas.
En conclusión, el estudio presenta MDAgents, un marco que mejora el papel de los LLM en la toma de decisiones médicas al estructurar su colaboración en función de la complejidad de las tareas. Inspirándose en la dinámica de las consultas clínicas, los agentes de la MDA asignan a los LLM roles individuales o grupales según sea necesario, con el objetivo de mejorar la precisión del diagnóstico. Las pruebas realizadas en diez puntos de referencia médicos muestran que los agentes MDA superan a otros métodos en siete tareas, con una ganancia de precisión de hasta el 4,2 % (p < 0,05). Los estudios de ablación revelan que la combinación de revisiones de moderadores y conocimiento médico externo en entornos grupales aumenta la precisión en un promedio de 11,8%, lo que subraya el potencial de los agentes MDA en el diagnóstico clínico.
Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.
[Sponsorship Opportunity with us] Promocione su investigación/producto/seminario web con más de 1 millón de lectores mensuales y más de 500.000 miembros de la comunidad
A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.