Investigadores de MBZUAI y CMU presentan Bi-Mamba: una arquitectura Mamba de 1 bit escalable y eficiente diseñada para modelos de lenguaje grandes en múltiples tamaños (parámetros 780M, 1.3B y 2.7B)
La evolución del aprendizaje automático ha traído avances significativos en los modelos de lenguaje, que son fundamentales para tareas como la generación de texto y la respuesta a preguntas. Entre…