Qwen AI presenta QWEN2.5-Max: un gran MOE LLM previamente en datos masivos y post-entrenado con recetas SFT y RLHF curadas

El campo de la inteligencia artificial está evolucionando rápidamente, con un aumento de los esfuerzos para desarrollar modelos lingüísticos más capaces y eficientes. Sin embargo, la escala de estos modelos viene con desafíos, particularmente con respecto a los recursos computacionales y la complejidad de la capacitación. La comunidad de investigación todavía está explorando las mejores prácticas para escalar modelos extremadamente grandes, ya sea que usen una arquitectura densa o de la mezcla de expertos (MOE). Hasta hace poco, muchos detalles sobre este proceso no se compartían ampliamente, lo que dificultaba la refinar y mejorar los sistemas de IA a gran escala.

Qwen AI tiene como objetivo abordar estos desafíos con Qwen2.5-Max, un modelo de MOE grande que se detiene en más de 20 billones de tokens y se refina aún más a través del ajuste fino supervisado (SFT) y el aprendizaje de refuerzo de la retroalimentación humana (RLHF). Este enfoque ajusta el modelo para alinearse mejor con las expectativas humanas mientras se mantiene la eficiencia en la escala.

Técnicamente, Qwen2.5-Max utiliza una arquitectura de mezcla de expertos, lo que le permite activar solo un subconjunto de sus parámetros durante la inferencia. Esto optimiza la eficiencia computacional mientras mantiene el rendimiento. La extensa fase previa a la preparación proporciona una sólida base de conocimiento, mientras que SFT y RLHF refinan la capacidad del modelo para generar respuestas coherentes y relevantes. Estas técnicas ayudan a mejorar el razonamiento y la usabilidad del modelo en varias aplicaciones.

QWEN2.5-Max ha sido evaluado contra modelos líderes en puntos de referencia como MMLU-Pro, LivecodeBench, LiveBench y Arena-Hard. Los resultados sugieren que funciona de manera competitiva, superando a Deepseek V3 en pruebas como Arena-Hard, LiveBench, LivecodeBench y GPQA-Diamond. Su rendimiento en MMLU-Pro también es fuerte, destacando sus capacidades en la recuperación de conocimiento, tareas de codificación y aplicaciones de IA más amplias.

En resumen, QWEN2.5-Max presenta un enfoque reflexivo para escalar modelos de lenguaje mientras mantiene la eficiencia y el rendimiento. Al aprovechar una arquitectura MOE y métodos estratégicos posteriores a la capacitación, aborda los desafíos clave en el desarrollo del modelo de IA. A medida que avanza la investigación de IA, modelos como Qwen2.5-Max demuestran cómo el uso de datos reflexivo y las técnicas de entrenamiento pueden conducir a sistemas de IA más capaces y confiables.

Verificar el Demostración en la cara abrazaday Detalle técnico. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos Gorjeo y únete a nuestro Canal de telegrama y LinkedIn GRsalpicar. No olvides unirte a nuestro 70k+ ml de subreddit.

Aswin AK es un pasante de consultoría en MarktechPost. Está persiguiendo su doble título en el Instituto de Tecnología Indio, Kharagpur. Le apasiona la ciencia de datos y el aprendizaje automático, aportando una sólida experiencia académica y una experiencia práctica en la resolución de desafíos de dominio de la vida real.

Qwen AI presenta QWEN2.5-Max: un gran MOE LLM previamente en datos masivos y post-entrenado con recetas SFT y RLHF curadas

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Una implementación de codificación de decodificación cerebral de extremo a extremo a partir de señales MEG utilizando NeuralSet y aprendizaje profundo para predecir características lingüísticas

Una guía de codificación sobre capacitación posterior a LLM con TRL desde el ajuste fino supervisado hasta el razonamiento DPO y GRPO

Cómo ser contratado en la era de la IA

You missed

El radar de drones podría ayudar a las naves espaciales a identificar dónde perforar en busca de agua en Marte, dicen los científicos

Panel del Quinto Circuito bloquea la aprobación de telemedicina de mifepristona en 2023

Gasto de 725.000 millones de dólares frente al PIB de la nación

Cierra la Tienda Infantil Mariposa de Quesada tras 20 años de labor solidaria – El Dirigente