El desarrollo de la terapéutica continúa siendo un esfuerzo inherentemente costoso y desafiante, caracterizado por altas tasas de falla y plazos de desarrollo prolongados. El proceso tradicional de descubrimiento de fármacos requiere amplias validaciones experimentales desde la identificación del objetivo inicial hasta los ensayos clínicos en etapa tardía, consumiendo recursos y tiempo sustanciales. Metodologías computacionales, particularmente aprendizaje automático y el modelado predictivo, han surgido como herramientas fundamentales para optimizar este proceso. Sin embargo, los modelos computacionales existentes suelen ser altamente especializados, lo que limita su efectividad para abordar diversas tareas terapéuticas y ofrecer capacidades de razonamiento interactivos limitadas requeridas para la investigación y el análisis científicos.
Para abordar estas limitaciones, Google AI ha introducido TXGEMMA, una colección de modelos de idiomas grandes generalistas (LLM) diseñados explícitamente para facilitar varias tareas terapéuticas en el desarrollo de medicamentos. TXGEMMA se distingue por integrar diversos conjuntos de datos, abarcar moléculas pequeñas, proteínas, ácidos nucleicos, enfermedades y líneas celulares, lo que le permite abarcar múltiples etapas dentro de la tubería de desarrollo terapéutico. Los modelos TXGEMMA, disponibles con 2 mil millones (2b), 9 mil millones (9b) y 27 mil millones (27b) de parámetros, están ajustados a la arquitectura GEMMA-2 utilizando conjuntos de datos terapéuticos integrales. Además, el suite incluye TXGEMMA-CHAT, una variante interactiva del modelo de conversación, que permite a los científicos participar en discusiones detalladas e interpretaciones mecanicistas de los resultados predictivos, fomentando la transparencia en la utilización del modelo.
Desde un punto de vista técnico, TXGEMMA aprovecha los extensos datos de datos terapéuticos (TDC), un conjunto de datos curado que contiene más de 15 millones de puntos de datos en 66 conjuntos de datos terapéuticamente relevantes. TXGEMMA-predicto, la variante predictiva del conjunto de modelos, demuestra un rendimiento significativo en estos conjuntos de datos, coincidiendo o excediendo el rendimiento de los modelos generalistas y especialistas actualmente empleados en el modelado terapéutico. En particular, el enfoque de ajuste fino empleado en TXGEMMA optimiza la precisión predictiva con sustancialmente menos muestras de entrenamiento, proporcionando una ventaja crucial en los dominios donde prevalece la escasez de datos. Extendiendo aún más sus capacidades, Agentic-TX, impulsada por Gemini 2.0, orquesta dinámicamente consultas terapéuticas complejas mediante la combinación de ideas predictivas de discretas de TXGEMMA e discusiones interactivas de TXGEMMA-CHAT con herramientas externas específicas de dominio.
Evaluaciones empíricas subrayan la capacidad de Txgemma. En 66 tareas seleccionadas por el TDC, el predicto de TXGEMMA logró un rendimiento constante comparable o excediendo los modelos de estado existentes de última generación. Específicamente, los modelos predictivos de TXGEMMA superaron los modelos generalistas de última generación en 45 tareas y modelos especializados en 26 tareas, con una eficiencia notable en las predicciones de eventos adversos de ensayos clínicos. En puntos de referencia desafiantes como el último examen de Chembench y la humanidad, Agentic-TX demostró ventajas claras sobre modelos líderes anteriores, mejorando la precisión en aproximadamente 5.6% y 17.9%, respectivamente. Además, las capacidades de conversación integradas en TXGEMMA-CHAT proporcionaron un razonamiento interactivo esencial para apoyar análisis y discusiones científicos en profundidad.
La utilidad práctica de TXGEMMA es particularmente evidente en la predicción adversa de eventos durante los ensayos clínicos, un aspecto esencial de la evaluación de seguridad terapéutica. El predicto TXGEMMA-27B demostró un rendimiento predictivo robusto al tiempo que utiliza significativamente menos muestras de entrenamiento en comparación con los modelos convencionales, ilustrando una mayor eficiencia de datos y confiabilidad. Además, las evaluaciones de rendimiento computacional indican que la velocidad de inferencia de TXGEMMA admite aplicaciones prácticas en tiempo real, como la detección virtual, con la mayor variante (parámetros de 27b) capaz de procesar eficientemente grandes volúmenes de muestras diariamente cuando se despliega en una infraestructura escalable.
En resumen, la introducción de TXGEMMA por Google AI representa un avance metódico en la investigación terapéutica computacional, combinando eficacia predictiva, razonamiento interactivo y mejor eficiencia de datos. Al hacer que TXGEMMA sea accesible públicamente, Google permite una mayor validación y adaptación en conjuntos de datos diversos y patentados, promoviendo así una aplicabilidad y reproducibilidad más amplias en la investigación terapéutica. Con una funcionalidad de conversación sofisticada a través de TXGEMMA-CHAT y la integración compleja de flujo de trabajo a través de Agentic-TX, la suite proporciona a los investigadores herramientas computacionales avanzadas capaces de mejorar significativamente los procesos de toma de decisiones en el desarrollo terapéutico.
Verificar el Papel y Modelos en la cara abrazada . Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 85k+ ml de subreddit.
Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.