Screenshot 2023 09 17 At 11.07.38 Pm.png

Los modelos de lenguajes grandes (LLM) creados sobre transformadores, incluidos ChatGPT y GPT-4, han demostrado increíbles capacidades de procesamiento del lenguaje natural. La creación de modelos de PNL basados ​​en transformadores ha provocado avances en el diseño y el uso de modelos basados ​​en transformadores en visión por computadora y otras modalidades. Desde noviembre de 2022, los LLM se han utilizado en investigaciones clínicas, farmacia, radiografía, enfermedad de Alzheimer, agricultura e investigación en ciencias del cerebro, inspirados en las diversas cualidades y el reconocimiento generalizado de ChatGPT. Sin embargo, su uso aún no se ha adoptado ampliamente en campos especializados como la atención sanitaria. Primero, debido a las leyes de privacidad, los hospitales no pueden intercambiar ni cargar datos en modelos comerciales como ChatGPT o GPT-4; por lo tanto, los modelos de lenguaje grande localizados son esenciales para la atención médica del mundo real.

Se requiere un modelo que esté adecuadamente capacitado en datos de dominio que sean clínicamente significativos, ya que los LLM capacitados en dominios amplios, como ChatGPT, GPT-4 y PaLM 2, necesitan más experiencia médica en campos especializados como la radiología. Además, aunque su Radiology-Llama2 imita con precisión los patrones de habla de los radiólogos, modelos como ChatGPT proporcionan respuestas completas que se parecen a Wikipedia, a diferencia del lenguaje claro y directo utilizado por los radiólogos reales, que acelera la transmisión de información. Finalmente, su estudio allana el camino para ayudas radiológicas personalizadas que se ajusten a las preferencias de cada médico.

El LLM Radiology-Llama2, adaptado a la radiología mediante el ajuste de instrucciones para proporcionar impresiones radiológicas a partir de los resultados, llena este vacío en la literatura. Los estudios revelan que supera a los LLM estándar en cuanto a la coherencia, la concisión y la utilidad clínica de las impresiones producidas.

• Rendimiento de última generación: en los conjuntos de datos MIMIC-CXR y OpenI, supere a todos los demás modelos de lenguaje para generar impresiones clínicas, estableciendo un nuevo estándar.

• Flexibilidad y dinamismo: a diferencia de sus competidores basados ​​en BERT, radiologic-Llama2 no está limitado a una estructura de entrada particular, lo que permite una gama más amplia de entradas y flexibilidad para diversas tareas radiológicas, incluido el razonamiento complicado.

• Usabilidad clínica con capacidades conversacionales: los LLM generativos tienen capacidades conversacionales integradas que les permiten responder a consultas y brindar información contextual de manera humana. Esto mejora el diagnóstico y la presentación de informes, lo que hace que Radiology-Llama2 sea muy útil para los profesionales médicos en un contexto clínico.

Figura 1 muestra la estructura general de Radiology-Llama2

Cuando se construyen correctamente, los LLM localizados pueden revolucionar la radiología, como lo demuestra Radiology-Llama2.

Es muy prometedor para la asistencia en la toma de decisiones clínicas y otros usos si se regula adecuadamente. Los resultados de esta investigación abren la puerta a LLM especializados en especialidades médicas adicionales. En conclusión, Radiology-Llama2 es un importante paso adelante en el uso de los LLM en medicina. Estos LLM especializados pueden facilitar los avances en la IA médica con un estudio continuo sobre la construcción y evaluación de modelos.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de más de 30.000 ml, Comunidad de Facebook de más de 40.000 personas, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.


Aneesh Tickoo es pasante de consultoría en MarktechPost. Actualmente está cursando su licenciatura en Ciencia de Datos e Inteligencia Artificial en el Instituto Indio de Tecnología (IIT), Bhilai. Pasa la mayor parte de su tiempo trabajando en proyectos destinados a aprovechar el poder del aprendizaje automático. Su interés de investigación es el procesamiento de imágenes y le apasiona crear soluciones en torno a él. Le encanta conectarse con personas y colaborar en proyectos interesantes.