Nvidia AI presenta el transformador normalizado (nGPT): un transformador basado en hiperesfera que logra un entrenamiento entre 4 y 20 veces más rápido y una estabilidad mejorada para los LLM
El auge de los modelos basados en Transformer ha hecho avanzar significativamente el campo del procesamiento del lenguaje natural. Sin embargo, el entrenamiento de estos modelos suele ser computacionalmente intensivo…