Moonshot AI lanza Kimi K2.7-Code: un modelo de codificación que reporta un +21,8 % en Kimi Code Bench v2 sobre K2.6

Esta semana, Moonshot AI lanzó Kimi K2.7-Code. Es un modelo agente centrado en la codificación. Los pesos del modelo se envían en Hugging Face bajo una licencia MIT modificada. También puede acceder a él a través de Kimi API y Kimi Code.

K2.7-Code apunta a la ingeniería de software a largo plazo, no al chat general. Planifica, edita, ejecuta herramientas y depura en muchos pasos. Moonshot combina el modelo con una plataforma de codificación de suscripción a su alrededor.

Código Kimi K2.7

K2.7-Code es un modelo de mezcla de expertos. Tiene 1T de parámetros totales y activa 32B por token. El diseño utiliza 384 expertos, 8 seleccionados por token y 1 compartido. Tiene 61 capas, incluida 1 capa densa.

La atención usa MLA y la ruta de avance usa SwiGLU. Un codificador de visión MoonViT agrega 400M de parámetros para entrada de imagen y video. El modelo se envía con cuantificación INT4 nativa. La ventana de contexto es de 256.000 tokens (262.144).

Dos limitaciones importan: el modo de pensar es obligatorio; deshabilitarlo devuelve un error de API. El muestreo es fijo: temperatura 1,0, top_p 0,95, n 1, penalizaciones 0,0. La salida máxima predeterminada es 32.768 tokens.

Puede autohospedarse con vLLM, SGLang o KTransformers. El repositorio de Hugging Face es grande, aproximadamente 595 GB en disco. Este es un objetivo de implementación de clase servidor, no un modelo de computadora portátil.

Punto de referencia

El equipo de Moonshot publicó seis filas de referencia. Comparan K2.7-Code con K2.6, GPT-5.5 y Claude Opus 4.8. K2.7-Code supera a K2.6 en cada fila. El mayor salto en codificación es Kimi Code Bench v2, de 50,9 a 62,0.

Punto de referenciaKimi K2.6Kimi K2.7-CodeGPT-5.5Claude Opus 4.8K2.7 vs K2.6Kimi Code Bench v250.962.069.067.4+21.8%Program Bench48.353.669.163.8+11.0%MLS Bench Lite26.735.135.542.8+31.5%Kimi Claw 24/7 Bench42.946.952.850.4+9.3%MCP Atlas69.476.079.481.3+9.5%MCP Mark Verified72.881.192.976.4+11.4%

K2.7-Code supera a Opus 4.8 en MCP Mark Verified, 81,1 frente a 76,4. También se acerca a GPT-5.5 en MLS Bench Lite. K2.7-Code se ejecutó en Kimi Code CLI, GPT-5.5 en Codex xhigh y Opus 4.8 en Claude Code xhigh.

Eficiencia del token de razonamiento: una afirmación de costos, no solo de calidad

El equipo de Moonshot informa aproximadamente un 30% menos de uso de tokens de razonamiento que K2.6. Enmarca esto como “pensar menos demasiado”.

Los tokens de razonamiento se facturan como tokens de salida en la mayoría de las tarjetas de precios. La codificación agente ejecuta cientos o miles de pasos. Cada plan, reintento y verificación paga nuevamente el costo de pensamiento. Un recorte del 30% aumenta a largo plazo.

El efecto aterriza en tres lugares a la vez. En primer lugar, reducir el costo del token de producción por tarea. En segundo lugar, pasos más rápidos, lo que ayuda a las sesiones CLI interactivas. En tercer lugar, dar más pasos antes de alcanzar los límites del contexto.

Casos de uso con ejemplos

Los refactores de escala de repositorio son el principal caso de uso. Señale al agente un conjunto de pruebas fallido. Lee archivos, edita entre módulos y luego vuelve a ejecutar las pruebas hasta que estén en verde. La revisión del código es una segunda opción. Introduzca una diferencia de solicitud de extracción y solicite un análisis de riesgos. La ventana de 256K contiene grandes diferencias, registros y archivos relacionados. Los flujos de trabajo de uso de herramientas MCP son una tercera opción. K2.7-Code obtuvo una puntuación de 81,1 en MCP Mark Verified. Ese conjunto prueba la invocación correcta de la herramienta a través del Protocolo de contexto del modelo. Piense en comprobaciones de CI, actualizaciones de tickets y ediciones de archivos en un solo bucle. El análisis de contexto a largo plazo es un cuarto ajuste. El modelo acepta entrada de texto, imágenes y vídeo. La documentación, las capturas de pantalla y una reproducción grabada pueden compartir un mensaje.

Explorador interactivo de Marktechpost

Kimi K2.7-Code — Explorador interactivo

Puntos de referencia informados por la empresa y precios oficiales de API. Publicado el 12 de junio de 2026. Verificado el 12 de junio de 2026.

Puntos de referencia

Calculadora de costos

Especificaciones

Fuente: Tarjeta modelo Moonshot AI Kimi K2.7-Code. K2.7-Code se ejecutó en la CLI de Kimi Code; GPT-5.5 en Codex xhigh; Claude Opus 4.8 en Claude Code xhigh. Números propios, no una clasificación independiente.

Costo de insumos$0.00

Costo de producción$0.00

Est. total mensual$0.00

$0.00

Tarifas: entrada en caché $0,19/1 millón, entrada sin caché $0,95/1 millón, salida $4,00/1 millón (precio oficial de Kimi). La línea de ahorro ilustra el uso de tokens de razonamiento reportado por K2.7-Code aproximadamente un 30 % menor en comparación con K2.6, aplicado a la participación de razonamiento en la producción. Estimación únicamente.

Fuente: tarjeta modelo Kimi K2.7-Code Hugging Face y documentos API de Kimi.

Un inicio rápido mínimo

La API de Kimi es compatible con OpenAI. La cadena del modelo es código kimi-k2.7. No anule los parámetros de muestreo fijos ni los errores de solicitud.

importar sistema operativo desde openai importar OpenAI # URL base y clave según los documentos de la API de Kimi en platform.moonshot.ai cliente = OpenAI( api_key=os.environ.get(“MOONSHOT_API_KEY”), base_url=”https://api.moonshot.ai/v1″, ) mensajes = [
{“role”: “system”, “content”: “You are a coding agent.”},
{“role”: “user”, “content”: “Refactor utils.py to remove duplicate code.”},
]

resp = client.chat.completions.create( model=”kimi-k2.7-code”, mensajes=messages, max_tokens=32768, # límite predeterminado; también el pensamiento máximo # está habilitado de forma predeterminada y no se puede deshabilitar. # temperatura (1.0), top_p (0.95), n (1) y penalizaciones (0.0) son # fijas en el lado del servidor. Pasar cualquier otro valor devuelve un error. ) msg = opciones resp.[0].message print(msg.content) # Llamadas a herramientas de varios pasos: agregue el mensaje completo del asistente para que # se conserve el contenido_razonamiento. Al soltarlo se produce un error en el siguiente turno. # mensajes.append(msg.model_dump())

Dos reglas de uso de herramientas provienen de los documentos. Mantenga el razonamiento_content del turno actual en contexto. Y configure tool_choice solo en “auto” o “ninguno”.

Cómo se compara el código K2.7

ModeloLicenseParamsContextPrecio API (entrada/salida por 1M)Kimi K2.7-Código MIT modificado (abierto)1T total / 32B activo256K$0,95 / $4,00Kimi K2.6Open-weight1T-class MoE256K~$0,67–0,95 / ~$3,39–4,00GPT-5.5CerradoNo divulgado—No en la tabla MoonshotClaude Opus 4.8CerradoNo divulgado1M$5.00 / $25.00Qwen3-Coder-480B-A35BOpen (licencia Qwen)480B / 35B activo256K nativoVaría según el host

El código K2.7 enumera $0,19 por 1 millón para la entrada en caché.

Fortalezas y debilidades

Fortalezas:

Pesos abiertos en MIT modificado, con una ruta de autohospedaje real. Ganancias amplias y consistentes con respecto a K2.6 en codificación y evaluaciones de agentes. Precios API bajos en relación con los modelos de frontera cerrada. Supera a Opus 4.8 en el punto de referencia MCP Mark Verified (informado por la empresa).

Debilidades:

Todos los números de los titulares son propios en el momento del lanzamiento. El modo de pensamiento no se puede desactivar. Los controles de muestreo están bloqueados en valores fijos. Las llamadas a herramientas de varios pasos deben preservar el contenido_razonamiento. El peso de 595 GB hace que el autohospedaje sea un compromiso serio.

Conclusiones clave

Todos los puntos de referencia principales son realizados por proveedores; Los resultados independientes están pendientes. K2.7-Code es de peso abierto, especializado en codificación y está construido sobre Kimi K2.6. Moonshot reporta un +21,8% en Kimi Code Bench v2 sobre K2.6. El modelo utiliza aproximadamente un 30% menos de tokens de razonamiento que K2.6.

Consulte el peso del modelo, el código Kimi y la API. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ml y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros