Nvidia continúa presionando los límites del desarrollo de IA abierta mediante la orientación abierta de su Abrir suite de modelo de razonamiento de código (OCR) -Un trío de modelos de lenguaje grande de alto rendimiento diseñados especialmente para el razonamiento de código y la resolución de problemas. Las variantes 32B, 14B y 7B, todas lanzadas bajo el Licencia Apache 2.0.
Benchmarked para vencer a lo mejor
El Abrir razonamiento del código (OCR) Los modelos vienen con logros de referencia notablesrendimiento superior O3-Mini y O1 de OpenAI (bajo) modelos en el LivecodeBench punto de referencia. LivecodeBench es un conjunto de evaluación integral para tareas de razonamiento de código, como la depuración, la generación de código y la finalización de la lógica en los entornos de desarrolladores del mundo real. En comparación directa, el modelo OCR 32B de NVIDIA encabeza la tabla de clasificación en la capacidad de razonamiento para modelos abiertos.
Este salto en el rendimiento se atribuye no solo a la arquitectura modelo, sino a Nvidia’s personalizado “conjunto de datos OCR” -Un corpus de entrenamiento centrado en el código de alta calidad diseñado para enfatizar el seguimiento de las instrucciones, el razonamiento y la resolución de problemas de código de múltiples pasos. Según Nvidia, esto da como resultado un Mejora del 30% en la eficiencia del tokenpermitiendo que los modelos produzcan código preciso y salidas lógicas con menos tokens.
Una alineación de modelos para cada caso de uso
El suite de razonamiento de código abierto entra Tres escalas de parámetros:
- OpenCoderAsoning-Nemotron-32B
- OpenCoderAsoning-Nemotron-14B
- OpenCoderAsoning-Nemotron-7B
Cada modelo equilibra la escala con rendimiento. La variante 32B ofrece resultados de última generación para la inferencia y la investigación de alto rendimiento; El modelo 14B proporciona fuertes capacidades de razonamiento con requisitos de cómputo reducidos, y la variante 7B es ideal para entornos con recursos limitados al tiempo que conserva el rendimiento competitivo en los puntos de referencia.
Todos los modelos están entrenados utilizando el Arquitectura nemotronBackbone basada en transformadores de NVIDIA optimizada para aprendizaje multilingüe de múltiples tareas. Los pesos y configuraciones del modelo están disponibles en la cara de abrazo:
Compatible con ecosistemas de inferencia abierta
Una característica clave de estos modelos es compatibilidad listos con marcos de inferencia populares:
llama.cppPara inferencia liviana de CPU/GPUvLLMpara servir y decodificación especulativa optimizadasTransformersAbrazando la cara para tuberías de entrenamiento y evaluaciónTGI(Inferencia de generación de texto) para la implementación de API escalable
Esta flexibilidad permite a los desarrolladores, investigadores y empresas conectar estos modelos a la infraestructura de IA de código existente con una sobrecarga mínima.
Un paso adelante para la inteligencia de código abierto
Con esta versión, NVIDIA contribuye significativamente al creciente ecosistema de los modelos de código abierto. Por apuntar razonamiento del código -Un dominio históricamente dominado por modelos patentados, y que se libera bajo una licencia totalmente abierta y permisiva, NVIDIA facilita a la comunidad de IA y un desarrollador más amplio para construir, afinar y desplegar modelos de razonamiento avanzados en producción.
La suite de razonamiento de código abierto se suma a la creciente cartera de NVIDIA de LLMS Open y fortalece su postura en el desarrollo de IA accesible y transparente. Ya sea que esté creando copilotos de desarrolladores, agentes de revisión de código automatizados o servicios de generación de código, estos modelos ofrecen una alternativa de alto rendimiento, rentable y amigable para la comunidad a las soluciones cerradas.
Mira el Modelo 32B, Modelo 14b, Modelo 7b y Variante de instrucción 32B ajustada. Además, no olvides seguirnos Gorjeo.
Aquí hay una breve descripción de lo que estamos construyendo en MarkTechPost:
Sana Hassan, una pasante de consultoría en MarktechPost y estudiante de doble grado en IIT Madras, le apasiona aplicar tecnología e IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.