La aplicación de modelos de idiomas grandes (LLM) en el manejo de enfermedades clínicas tiene numerosos desafíos críticos. Aunque los modelos han sido efectivos en el razonamiento de diagnóstico, su aplicación en el manejo de enfermedades longitudinales, la prescripción de los medicamentos y la atención del paciente múltiple no se han probado. Los principales desafíos son la comprensión limitada del contexto en numerosas visitas, la adherencia heterogénea a las pautas clínicas y las complejidades de razonamiento de drogas. Además, proporcionar interacciones de pacientes y eficiencia computacional en tiempo real y de alta calidad es un desafío significativo. Superar estos desafíos es esencial para desarrollar sistemas basados en IA que puedan ayudar a los profesionales de la salud a proporcionar un manejo preciso, basado en evidencia y personalizado de enfermedades.
Los modelos clínicos basados en inteligencia artificial anteriores se han centrado predominantemente en el razonamiento de diagnóstico, empleando conjuntos de datos estructurados para generar diagnósticos diferenciales. Sin embargo, estos enfoques encuentran limitaciones significativas cuando se implementan en entornos de manejo de enfermedades del mundo real. Una gran mayoría de los enfoques existentes no logran mantener un seguimiento adecuado de la historia del paciente en las visitas, lo que resulta en recomendaciones de atención desconectadas e inconsistentes. Varios modelos también muestran una incapacidad para ajustarse de manera efectiva a las pautas clínicas existentes, disminuyendo así la confiabilidad de sus planes de gestión. Además, el razonamiento de medicamentos es un desafío, ya que las técnicas existentes tienden a generar inconsistencias en la elección de medicamentos, dosificación e interacciones, disminuyendo así su confiabilidad para un comportamiento seguro de prescripción. Aún más, la necesidad de la toma de decisiones en tiempo real en entornos médicos implica el procesamiento rápido de enormes datos clínicos, que es un cuello de botella computacional para la mayoría de los sistemas basados en modelos de idiomas grandes.
Los investigadores de Google presentan un innovador sistema de agente con sede en LLM, diseñado para el manejo de enfermedades clínicas y los encuentros de pacientes múltiples. La solución mejora el razonamiento médico basado en IA con una serie de innovaciones. Se presenta un sistema de múltiples agentes, donde un agente de diálogo permite una conversación natural y empática y rastrea el historial del paciente de la visita a la visita y un agente de razonamiento de gestión (MX) razones sobre las pautas clínicas, el historial del paciente y los resultados de las pruebas para crear planes de tratamiento estructurados. El sistema utiliza las capacidades de contexto extendido de Gemini para permanecer alineados con las pautas clínicas actuales y los formularios de los medicamentos. A diferencia de los modelos heredados basados en IA heredados que operan dentro de entornos estáticos de visitas únicas, esta solución administra dinámicamente interacciones en tiempo real y múltiples, lo que permite que las recomendaciones evolucionen en función del progreso del paciente y los resultados de las pruebas. También se presenta un nuevo punto de referencia de opción múltiple, RXQA, para evaluar la precisión del razonamiento de los medicamentos. Este conjunto de datos, creado a partir de dos formularios nacionales de fármacos (EE. UU., Reino Unido), desafía la capacidad de procesar consultas farmacológicas complejas, y muestra un rendimiento mejorado en comparación con los médicos humanos en el manejo de tareas relacionadas con los medicamentos de alta calidad.
El sistema combina varias metodologías de vanguardia para mejorar el rendimiento. Se implementó un examen clínico estructurado de objetivos virtuales cegados y aleatorios (OSCE) para comparar este método mejorado con AI con 21 médicos de atención primaria en 100 escenarios de casos múltiples de visitas, incluidas la guía agradable del Reino Unido y las pautas de mejores prácticas BMJ. Para la evaluación de razonamiento de medicamentos, el punto de referencia RXQA está compuesto por 600 preguntas de opción múltiple extraídas de OpenFDA y el Formulario Nacional Británico (BNF) y validada por farmacéuticos certificados por la junta. Architecturalmente, el sistema incluye un agente de diálogo basado en Gemini 1.5 Flash, optimizado para diálogos médicos de visitas múltiples y un agente MX basado en la recuperación estructurada y el razonamiento para generar planes de gestión detallados. Un marco de generación estructurado con restricciones especificadas garantiza la consistencia en la producción, así como la fidelidad de las citas de las pautas clínicas. Para garantizar la eficiencia durante la participación del paciente en tiempo real, el modelo está diseñado para responder en un minuto en función de un corpus de evaluación integral de 627 pautas clínicas, incluidos 10.5 millones de tokens, lo que requiere métodos de recuperación optimizados para manejar de manera efectiva dichos datos.
El sistema de IA exhibió un rendimiento no inferior a los médicos de atención primaria en el razonamiento del manejo de enfermedades, pero los superó en áreas críticas como la precisión del tratamiento, el razonamiento de los medicamentos y el cumplimiento de la guía. Un estudio de OSCE múltiple, ofreció planes de gestión más estructurados y precisos con un mejor cumplimiento de las pautas clínicas y más especificidad en las recomendaciones de tratamiento e investigación. La capacidad de razonamiento de medicamentos también superó a los médicos humanos, especialmente en las consultas relacionadas con los medicamentos de alta calidad, utilizando con éxito formularios de fármacos externos para mejorar la precisión. Además, las calificaciones de médicos especializados y actores del paciente también reflejaron la capacidad de la IA para monitorear y actualizar los planes de gestión, asegurando la toma de decisiones estructuradas y centradas en el paciente en múltiples visitas. Estos hallazgos reflejan su potencial para mejorar el apoyo a la decisión clínica basada en la IA, proporcionando soluciones de manejo de enfermedades precisas, basadas en evidencia y efectivas.
Este sistema de IA es un salto notable en el manejo de enfermedades desde funciones de diagnóstico simples hasta la atención holística del paciente entre las visitas y la planificación sistemática del tratamiento. Con la adición de un razonamiento contextual profundo, la coordinación de múltiples agentes y la recuperación en tiempo real de las pautas clínicas, logra las capacidades de toma de decisiones a la par con los médicos para casos complejos. Su capacidad para dar tratamientos precisos, aumentar el razonamiento farmacológico y seguir estrictamente los protocolos establecidos demuestra su potencial revolucionario para la práctica clínica asistida por AI. Si bien se necesita investigación adicional para la aplicación en entornos del mundo real, esta investigación es un paso notable en el puente de las brechas en la atención primaria, mejorando la uniformidad de los tratamientos y maximizar la prestación de salud a través de la automatización con AI.
Verificar el Papel y Artículo del blog. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 80k+ ml.
Aswin AK es un pasante de consultoría en MarktechPost. Está persiguiendo su doble título en el Instituto de Tecnología Indio, Kharagpur. Le apasiona la ciencia de datos y el aprendizaje automático, aportando una sólida experiencia académica y una experiencia práctica en la resolución de desafíos de dominio de la vida real.