SVDQuant: un nuevo paradigma de cuantificación post-entrenamiento de 4 bits para modelos de difusión
El rápido escalamiento de los modelos de difusión ha generado desafíos en el uso de la memoria y la latencia, lo que dificulta su implementación, particularmente en entornos con recursos…