Uni-MoE: un LLM multimodal unificado basado en una arquitectura MoE dispersa
Liberar el potencial de los grandes modelos de lenguaje multimodal (MLLM) para manejar diversas modalidades como voz, texto, imágenes y video es un paso crucial en el desarrollo de la…