Estudio: Google revela nuevas capacidades de los LLM de Med-Gemini

Un estudio interpretado por Google Investigación, en colaboración con Google DeepMindrevela que el gigante tecnológico amplió las capacidades de sus modelos de IA para Med-Gemini-2D, Med-Gemini-3D y Med-Gemini Polygenic.

Google dijo que perfeccionó las capacidades de Med-Gemini utilizando datos de histopatología, dermatología, radiología 2D y 3D, genómica y oftalmológica.

El Med-Gemini-2 de la compañía fue entrenado con imágenes médicas convencionales codificadas en 2D, como cortes de TC, parches de patología y radiografías de tórax.

Med-Gemini-3D analiza datos médicos en 3D y Google entrenó a Med-Gemini-Polygenic en funciones sin imágenes, como la genómica.

El estudio reveló que el modelo refinado de Med-Gemini-2D superó los resultados anteriores para la generación de informes de radiografías de tórax habilitadas por IA entre un 1% y un 12%, siendo los informes “equivalentes o mejores” que los informes de los radiólogos originales.

El modelo también superó su rendimiento anterior en cuanto a respuesta visual a preguntas de rayos X de tórax gracias a mejoras en el codificador visual y el componente de lenguaje de Gemini.

También tuvo un buen desempeño en la clasificación de radiografías de tórax y en la respuesta a preguntas visuales de radiología, superando las líneas de base anteriores en 17 de 20 tareas; sin embargo, en oftalmología, histopatología y dermatología, Med-Gemini-2D superó los valores iniciales en 18 de 20 tareas.

Med-Gemini-3D podría leer exploraciones 3D, como tomografías computarizadas, y responder preguntas sobre las imágenes.

El modelo resultó ser el primer LLM capaz de generar informes para tomografías computarizadas en 3D. Sin embargo, sólo el 53% de los informes fueron clínicamente aceptables. La compañía reconoció que se necesita investigación adicional para que la tecnología alcance la calidad de los informes de radiólogos expertos.

Med-Gemini-Polygenic es el primer modelo de la compañía que utiliza datos genómicos para predecir resultados de salud.

Los autores escribieron que el modelo superó “el enfoque estándar basado en puntuación de riesgo poligénico lineal para la predicción del riesgo de enfermedad y se generaliza a enfermedades genéticamente correlacionadas para las que nunca ha sido entrenado”.

LA TENDENCIA MÁS GRANDE

Los investigadores informaron limitaciones del estudio, afirmando que es necesario optimizar los modelos multimodales para diversas aplicaciones clínicas relevantes, evaluarlos exhaustivamente en los conjuntos de datos clínicos apropiados y probarlos fuera de los puntos de referencia académicos tradicionales para garantizar la seguridad y confiabilidad en situaciones del mundo real.

Los autores del estudio también señalaron que “una gama cada vez más diversa de profesionales de la salud debe involucrarse profundamente en futuras iteraciones de esta tecnología, ayudando a guiar los modelos hacia capacidades que tengan una valiosa utilidad en el mundo real”.

Se mencionaron varias áreas en las que deberían centrarse las evaluaciones futuras, incluido cerrar la brecha entre el punto de referencia y el de cabecera, minimizar la contaminación de los datos en modelos grandes e identificar y mitigar los riesgos de seguridad y el sesgo de los datos.

“Si bien las capacidades avanzadas en tareas médicas individuales son útiles por derecho propio, imaginamos un futuro en el que todas estas capacidades se integren en sistemas integrales para realizar una variedad de tareas clínicas multidisciplinarias complejas, trabajando junto con los humanos para maximizar la eficacia clínica y mejorar resultados de los pacientes. Los resultados presentados en este estudio representan un paso hacia la realización de esta visión”, escribieron los investigadores.