Modelos de razonamiento de código abierto NVIDIA de código abierto (32B, 14B, 7B)

Nvidia continúa presionando los límites del desarrollo de IA abierta mediante la orientación abierta de su Abrir suite de modelo de razonamiento de código (OCR) -Un trío de modelos de lenguaje grande de alto rendimiento diseñados especialmente para el razonamiento de código y la resolución de problemas. Las variantes 32B, 14B y 7B, todas lanzadas bajo el Licencia Apache 2.0.

Benchmarked para vencer a lo mejor

El Abrir razonamiento del código (OCR) Los modelos vienen con logros de referencia notablesrendimiento superior O3-Mini y O1 de OpenAI (bajo) modelos en el LivecodeBench punto de referencia. LivecodeBench es un conjunto de evaluación integral para tareas de razonamiento de código, como la depuración, la generación de código y la finalización de la lógica en los entornos de desarrolladores del mundo real. En comparación directa, el modelo OCR 32B de NVIDIA encabeza la tabla de clasificación en la capacidad de razonamiento para modelos abiertos.

Este salto en el rendimiento se atribuye no solo a la arquitectura modelo, sino a Nvidia’s personalizado “conjunto de datos OCR” -Un corpus de entrenamiento centrado en el código de alta calidad diseñado para enfatizar el seguimiento de las instrucciones, el razonamiento y la resolución de problemas de código de múltiples pasos. Según Nvidia, esto da como resultado un Mejora del 30% en la eficiencia del tokenpermitiendo que los modelos produzcan código preciso y salidas lógicas con menos tokens.

Una alineación de modelos para cada caso de uso

El suite de razonamiento de código abierto entra Tres escalas de parámetros:

OpenCoderAsoning-Nemotron-32B
OpenCoderAsoning-Nemotron-14B
OpenCoderAsoning-Nemotron-7B

Cada modelo equilibra la escala con rendimiento. La variante 32B ofrece resultados de última generación para la inferencia y la investigación de alto rendimiento; El modelo 14B proporciona fuertes capacidades de razonamiento con requisitos de cómputo reducidos, y la variante 7B es ideal para entornos con recursos limitados al tiempo que conserva el rendimiento competitivo en los puntos de referencia.

Todos los modelos están entrenados utilizando el Arquitectura nemotronBackbone basada en transformadores de NVIDIA optimizada para aprendizaje multilingüe de múltiples tareas. Los pesos y configuraciones del modelo están disponibles en la cara de abrazo:

Compatible con ecosistemas de inferencia abierta

Una característica clave de estos modelos es compatibilidad listos con marcos de inferencia populares:

llama.cpp Para inferencia liviana de CPU/GPU
vLLM para servir y decodificación especulativa optimizadas
Transformers Abrazando la cara para tuberías de entrenamiento y evaluación
TGI (Inferencia de generación de texto) para la implementación de API escalable

Esta flexibilidad permite a los desarrolladores, investigadores y empresas conectar estos modelos a la infraestructura de IA de código existente con una sobrecarga mínima.

Un paso adelante para la inteligencia de código abierto

Con esta versión, NVIDIA contribuye significativamente al creciente ecosistema de los modelos de código abierto. Por apuntar razonamiento del código -Un dominio históricamente dominado por modelos patentados, y que se libera bajo una licencia totalmente abierta y permisiva, NVIDIA facilita a la comunidad de IA y un desarrollador más amplio para construir, afinar y desplegar modelos de razonamiento avanzados en producción.

La suite de razonamiento de código abierto se suma a la creciente cartera de NVIDIA de LLMS Open y fortalece su postura en el desarrollo de IA accesible y transparente. Ya sea que esté creando copilotos de desarrolladores, agentes de revisión de código automatizados o servicios de generación de código, estos modelos ofrecen una alternativa de alto rendimiento, rentable y amigable para la comunidad a las soluciones cerradas.

Mira el Modelo 32B, Modelo 14b, Modelo 7b y Variante de instrucción 32B ajustada. Además, no olvides seguirnos Gorjeo.

Aquí hay una breve descripción de lo que estamos construyendo en MarkTechPost:

Sana Hassan, una pasante de consultoría en MarktechPost y estudiante de doble grado en IIT Madras, le apasiona aplicar tecnología e IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.

Modelos de razonamiento de código abierto NVIDIA de código abierto (32B, 14B, 7B)

ByEquipo de 7 minutos

Benchmarked para vencer a lo mejor

Una alineación de modelos para cada caso de uso

Compatible con ecosistemas de inferencia abierta

Un paso adelante para la inteligencia de código abierto

By Equipo de 7 minutos

Related Post

Un mes después de aprender ingeniería de datos en público: esto es lo que no escribí

Baidu lanza OCR ilimitado, un modelo 3B que mantiene plana la caché KV para el análisis de documentos largos

Mejorar la velocidad y la eficiencia energética de los agentes de IA | Noticias del MIT

You missed

Un nuevo documental explora la seguridad del agua mientras Europa se enfrenta a un aumento vertiginoso de muertes por ahogamiento

Barack Obama explica por qué toma el camino correcto con Trump

Un mes después de aprender ingeniería de datos en público: esto es lo que no escribí

Estos binoculares Celestron EclipSmart 12×50 te permitirán ver eclipses con seguridad y tienen un descuento de $ 30