NVIDIA AI lleva Nemotron-3-Nano-30B a NVFP4 con destilación consciente de la cuantificación (QAD) para una inferencia de razonamiento eficiente
NVIDIA ha lanzado Nemotron-Nano-3-30B-A3B-NVFP4, un punto de control de producción que ejecuta un modelo de razonamiento de parámetros 30B en formato NVFP4 de 4 bits manteniendo una precisión cercana a…