QWEN emite QWEN3-Coder-480B-A35B-Instructo: su modelo de código de agente abierto más potente hasta ahora

Introducción

Qwen ha presentado Qwen3-coder-480b-A35B-Instructo, su El modelo de código de agente abierto más potente publicado hasta la fecha. Con una arquitectura distintiva de la mezcla de expertos (MOE) y capacidades integrales de codificación de agente, QWEN3-coder no solo establece un nuevo estándar para los modelos de codificación de código abierto, sino que también redefine lo que es posible para la asistencia de desarrollador autónoma a gran escala y a gran escala.

Arquitectura y especificaciones de modelos

Características clave

Diseño de la mezcla de expertos

El enfoque MOE activa solo un subconjunto de los parámetros del modelo para cualquier inferencia dada, ofreciendo un rendimiento de vanguardia con sobrecarga computacional dramáticamente reducida y habilitando una escala sin precedentes.

Contexto largo y escalabilidad

QWEN3-Coder-480B-A35B-Instructo se destaca por su Ventana de contexto de 256k nativopermitiendo el manejo directo de archivos y repositorios extremadamente grandes. Con la extrapolación de la ventana de contexto (utilizando métodos como el hilo), puede escalar hasta 1 millón de tokenshaciéndolo adecuado incluso para las bases de código y conjuntos de documentación más grandes.

Rendimiento a través de puntos de referencia

Codificación de agente

QWEN3-coder está diseñado y optimizado para flujos de trabajo de codificación de agente, donde el modelo no solo genera código sino que interactúa de forma autónoma con herramientas y entornos de desarrolladores.

Puntos de referencia

Modelo de base para ecosistemas de desarrolladores

QWEN3-Coder-480B-A35B-Instructo se construye como un modelo de base—Pasto para servir como una columna vertebral universal para la comprensión del código, la generación y los flujos de trabajo de agente en todo el mundo digital:

  • Mantiene fortalezas en matemáticas y razonamiento, heredado del modelo base QWEN3.
  • Se adapta fácilmente a varios flujos de trabajo de desarrolladores, tuberías de CI/CD y sistemas de revisión de código.

Descripción general

En conjunto con el modelo, Qwen también es “Código QWen” de origen abiertouna herramienta de codificación de agente de línea de comandos diseñada para aprovechar completamente las capacidades del nuevo modelo.

Características clave

Uso y extensibilidad

QWEN3-Coder-480B-A35B-Instructo está disponible bajo una licencia abierta y se integra con la IA y el panorama de desarrollo de código abierto más amplios. Se puede ejecutar utilizando tuberías de transformadores estándar o a través de la CLI de código QWEN dedicado, y es compatible con las pilas modernas de desarrolladores.

Conclusión

QWEN3-Coder-480B-A35B-Instructo marca un hito significativo en la inteligencia de código de código abierto. Con su combinación de escalabilidad, habilidades de codificación de agente de vanguardia y herramientas centradas en el desarrollador, proporciona un modelo de base robusto para el futuro del desarrollo de software autónomo. El compromiso de Qwen con la apertura, exagerado tanto por la versión del modelo como por la CLI agente del código QWEN, es señalal de una nueva era para la codificación de agente con IA en la comunidad de desarrolladores globales.

Preguntas frecuentes 1: ¿Cuáles son las principales ventajas de QWEN3-coder-480b-A35B-Instructo en comparación con otros modelos de código abierto?

QWEN3-Coder-480B-A35B-Instructo se destaca debido a su escala masiva: una arquitectura de mezcla de expertos de 480b-paraméteres con parámetros activos 35B, y su capacidad para manejar de forma nativa de 256,000 contextos (escala hasta 1 millón de tokens a través de la extracción de contexto). Esto le permite funcionar con grandes bases de código o repositorios de una sola vez. Su diseño de agente le permite no solo generar código, sino que también interactúa activamente con las herramientas y entornos de desarrolladores para resolver de forma autónoma tareas de programación complejas. A través de múltiples puntos de referencia de codificación y agente, QWEN3-coder ofrece un rendimiento de primer nivel entre los modelos abiertos, particularmente sobresaliendo en las tareas de ingeniería de software verificadas por SWE-Bench y otras del mundo real.

Preguntas frecuentes 2: ¿Cómo uso QWEN3-coder con mis propios proyectos y qué es el código QWEN?

Se puede acceder a la instrucción QWEN3-coder-480b-A35B a través de tuberías de transformadores estándar o con el Código qwen Interfaz de línea de comandos, que es de código abierto y está disponible en GitHub. El código QWEN, bifurcado del código Gemini, es una herramienta de codificación de agente especializada que aprovecha los protocolos avanzados de llamadas de funciones y las funciones avanzadas del modelo. Se integra fácilmente con las pilas de desarrollo populares, admite una interacción perfecta con bases y herramientas de código, y le permite utilizar las capacidades de agente de QWEN3-Coder para tareas como la generación de códigos, la refactorización, la depuración y el uso automatizado de herramientas directamente desde su terminal.

Preguntas frecuentes 3: ¿Qué tipo de lenguajes y tareas de programación es compatible con QWEN3-coder?

QWEN3-coder admite nativamente 358 lenguajes de programación y marcadoincluyendo Python, JavaScript, Java, C ++, GO, Rust, HTML, SQL y muchos más. Es competente en un amplio espectro de tareas de codificación, desde la programación competitiva y la finalización del código hasta la fijación de errores, la revisión del código, la comprensión a escala de repositorio, la generación de pruebas, la refactorización y los flujos de trabajo de agente múltiples. Su arquitectura de modelo de contexto y base también lo hace adecuado para integrarse con tuberías de CI/CD, plataformas en la nube y entornos de ingeniería de software a gran escala.


Mira el Modelo en la cara abrazada y Página de GitHub de código qwen. Todo el crédito por esta investigación va a los investigadores de este proyecto.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.