Tencent Hunyuan de fuentes abiertas Hunyuan-MT-7B y Hunyuan-MT-Chimera-7b: Modelos de traducción multilingüe de vanguardia




Introducción

El equipo de Hunyuan de Tencent ha lanzado Hunyuan-mt-7b (un modelo de traducción) y Hunyuan-mt-chimera-7b (un modelo de conjunto). Ambos modelos están diseñados específicamente para la traducción automática multilingüe y se introdujeron junto con la participación de Tencent en el WMT2025 Traducción automática general Tarea compartidadonde hunyuan-mt-7b clasificó primero en 30 de 31 pares de idiomas.

https://github.com/tencent-hunyuan/hunyuan-mt/blob/main/hunyuan_mt_technical_report.pdf

Descripción general del modelo

Hunyuan-mt-7b

  • A Modelo de traducción de parámetros 7b.
  • Soporte Traducción mutua en 33 idiomasincluido Idiomas de minorías étnicas chinas como tibetano, mongol, uigur y kazajro.
  • Optimizado para ambos Tareas de traducción de alta recursos y de baja recursoslogrando resultados de vanguardia entre modelos de tamaño comparable.

Hunyuan-mt-chimera-7b

  • Un modelo integrado de fusión débil a fuerte.
  • Combina múltiples salidas de traducción al momento de la inferencia y produce una traducción refinada utilizando técnicas de aprendizaje y agregación de refuerzo.
  • Representa el Primer modelo de traducción de código abierto de este tipoMejora de la calidad de la traducción más allá de las salidas de un solo sistema.
https://github.com/tencent-hunyuan/hunyuan-mt/blob/main/hunyuan_mt_technical_report.pdf

Marco de capacitación

Los modelos fueron entrenados utilizando un marco de cinco etapas Diseñado para tareas de traducción:

  1. Pre-entrenamiento general
    • 1.3 billones de tokens que cubren 112 idiomas y dialectos.
    • Corporos multilingües evaluados por valor de conocimiento, autenticidad y estilo de escritura.
    • Diversidad mantenida a través de sistemas disciplinarios, de la industria y de etiquetado temático.
  2. Pre-entrenamiento orientado a MT
    • Corporativos monolingües de MC4 y Oscar, filtrados utilizando FastText (ID del lenguaje), MINLSH (deduplicación) y KenLM (filtrado de perplejidad).
    • Corporativos paralelos de Opus y Paracrawl, filtrados con Cometkiwi.
    • Reproducción de datos generales de pre-entrenamiento (20%) para evitar el olvido catastrófico.
  3. Ajuste de fino supervisado (SFT)
    • Etapa I: ~ 3M Paralelos paralelos (Flores-200, conjuntos de pruebas WMT, datos curados de mandarina-minoridad, pares sintéticos, datos de ajuste de instrucciones).
    • Etapa II: ~ 268K Pares de alta calidad seleccionadas a través de la puntuación automatizada (Cometkiwi, Gemba) y la verificación manual.
  4. Aprendizaje de refuerzo (RL)
    • Algoritmo: Grpo.
    • Funciones de recompensa:
      • XCOMET-XXL y Deepseek-V3-0324 puntuación para la calidad.
      • Recompensas con terminología (TAT-R1).
      • Sanciones de repetición para evitar salidas degeneradas.
  5. RL débil
    • Múltiples salidas candidatas generadas y agregadas a través de la salida basada en recompensas
    • Aplicado Hunyuan-mt-chimera-7bmejorando la robustez de traducción y reduciendo los errores repetitivos.

Resultados de referencia

Evaluación automática

  • WMT24PP (English⇔xx): Hunyuan-mt-7b logrado 0.8585 (xcomet-xxl)superando modelos más grandes como Gemini-2.5-Pro ​​(0.8250) y Claude-Sonnet-4 (0.8120).
  • Flores-200 (33 idiomas, 1056 pares): Hunyuan-mt-7b anotado 0.8758 (XCOMET-XXL)superando las líneas de base de código abierto, incluyendo QWEN3-32B (0.7933).
  • Lenguas mandarin⇔inoridad: Anotado 0.6082 (xcomet-xxl)más alto que Gemini-2.5-Pro ​​(0.5811), que muestra mejoras significativas en entornos de baja recursos.

Resultados comparativos

  • Supera Traductor de Google en 15-65% en todas las categorías de evaluación.
  • Superenta modelos de traducción especializados como Torre-Plus-9B y Seed-X-PPO-7B a pesar de tener menos parámetros.
  • Quimera-7b agrega ~ 2,3% de mejora en Flores-200, particularmente en las traducciones chinas y no inglesas-chinas.

Evaluación humana

Un conjunto de evaluación personalizada (que cubre dominios sociales, médicos, legales e internet) comparó Hunyuan-MT-7B con modelos de vanguardia:

  • Hunyuan-mt-7b: Avg. 3.189
  • Gemini-2.5-pro: Avg. 3.223
  • Deepseek-v3: Avg. 3.219
  • Google Translate: Avg. 2.344

Esto muestra que Hunyuan-MT-7B, a pesar de ser más pequeño en los parámetros 7b, aborda la calidad de modelos patentados mucho más grandes.

Estudios de caso

El informe destaca varios casos del mundo real:

  • Referencias culturales: Traduce correctamente “小红薯” como la plataforma “Rednote”, a diferencia de las “batatas” de Google Translate.
  • Modismos: Interpreta “Me estás matando” como “你真要把我笑死了” (expresando diversión), evitando la mala interpretación literal.
  • Términos médicos: Traduce con precisión los “cálculos renales de ácido úrico”, mientras que las líneas de base generan salidas malformadas.
  • Idiomas minoritarios: Para kazajos y tibetanos, Hunyuan-MT-7b produce traducciones coherentes, donde las líneas de base fallan o emiten texto sin sentido.
  • Mejoras de quimera: Agrega mejoras en la jerga de los juegos, los intensificadores y la terminología deportiva.

Conclusión

Liberación de Tencent de Hunyuan-mt-7b y Hunyuan-mt-chimera-7b Establece un nuevo estándar para la traducción de código abierto. Combinando un marco de capacitación cuidadosamente diseñado con enfoque especializado en Traducción de idiomas de baja recursos y minoríaslos modelos logran calidad a la par o excede los sistemas de código cerrado más grandes. El lanzamiento de estos 2 modelos proporciona a la comunidad de investigación de IA las herramientas accesibles de alto rendimiento para la investigación y el despliegue de traducción multilingüe.


Mira el Papel, Página de Githuby Modelo en la cara abrazada. Todo el crédito por esta investigación va a los investigadores de este proyecto. No dude en ver nuestro Página de Github para tutoriales, códigos y cuadernos. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.