Neural Magic lanza 2:4 Sparse Llama 3.1 8B: modelos más pequeños para una inferencia eficiente de GPU
El rápido crecimiento del tamaño de los modelos de IA ha traído consigo importantes desafíos computacionales y ambientales. Los modelos de aprendizaje profundo, en particular los modelos de lenguaje, se…