Con el auge de los modelos de lenguaje grandes (LLM) en los últimos años, la IA generativa ha logrado avances significativos en el campo del procesamiento del lenguaje, mostrando habilidades impresionantes en una amplia gama de tareas. Dado su potencial para resolver tareas complejas, los investigadores han realizado numerosos intentos de aplicar estos modelos en el campo del descubrimiento de fármacos para optimizar la tarea. Sin embargo, la optimización de moléculas es un aspecto crítico del descubrimiento de fármacos que los LLM no han logrado afectar de manera significativa.
Los métodos existentes generalmente se centran en los patrones de la estructura química proporcionados por los datos en lugar de aprovechar la retroalimentación y la experiencia de los expertos. Esto plantea un problema, ya que el proceso de descubrimiento de fármacos implica incorporar comentarios de expertos en el campo para perfeccionar aún más el proceso. En este trabajo, los autores han intentado abordar las lagunas de trabajos anteriores centrándose en la interacción hombre-máquina y aprovechando la interactividad y la generalización de potentes LLM.
Investigadores del Tencent AI Lab y el Departamento de Ciencias de la Computación de la Universidad de Hunan publicaron Instrucciones MolOpt, que es un gran conjunto de datos basado en instrucciones para ajustar los LLM en tareas de optimización de moléculas. Este conjunto de datos tiene una cantidad adecuada de datos que cubren tareas asociadas con la optimización de moléculas y garantiza restricciones de similitud y una diferencia sustancial en las propiedades entre moléculas. Además, también han propuesto asistencia de drogas, un modelo de optimización de moléculas basado en Llama-2-7B-Chat capaz de realizar la optimización de forma interactiva a través del diálogo hombre-máquina. A través de los diálogos, los expertos pueden guiar aún más el modelo y optimizar los resultados generados inicialmente.
Para la evaluación, los investigadores compararon DrugAssist con dos modelos de optimización de moléculas anteriores y con tres LLM en métricas como solubilidad y PA y tasa de éxito y validez, respectivamente. Según los resultados, DrugAssist logró constantemente resultados prometedores en la optimización de múltiples propiedades y mantuvo valores de propiedades moleculares optimizados dentro de un rango determinado.
Además, los investigadores también demostraron las capacidades excepcionales de DrugAssist a través de un estudio de caso. Bajo la configuración de disparo cero, se le pidió al modelo que aumentara los valores de dos propiedades, BP y QED, en al menos 0,1 simultáneamente, y el modelo pudo realizar la tarea con éxito incluso cuando estuvo expuesto a los datos solo durante el entrenamiento. .
Además, DrugAssist también aumentó con éxito el valor logP de una molécula determinada en 0,1, aunque esta propiedad no se incluyó en los datos de entrenamiento. Esto muestra la buena transferibilidad del modelo en configuraciones de disparo cero y de pocos disparos, lo que brinda a los usuarios la opción de combinar propiedades individuales y optimizarlas simultáneamente. Finalmente, en una de las interacciones, el modelo generó una respuesta errónea al proporcionar una molécula que no cumplía los requisitos. Sin embargo, corrigió su error y brindó una respuesta correcta basada en la retroalimentación humana.
En conclusión, DrugAssist es un modelo de optimización molecular basado en el modelo Llama-2-7B-Chat y es capaz de interactuar con humanos en tiempo real. Demostró resultados excepcionales en optimizaciones de propiedades únicas y múltiples y mostró una gran transferibilidad y capacidades de optimización iterativa. Por último, los autores se han propuesto mejorar aún más las capacidades del modelo mediante el manejo de datos multimodal, lo que mejorará y optimizará significativamente el proceso de descubrimiento de fármacos.
Revisar la Papel y GitHub. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y noticias de Google. Unirse nuestro SubReddit de 36k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.
Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..
No olvides unirte a nuestro Canal de telegramas
Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como emprendedor e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.