Revolucionando las habilidades auditivas de la IA: la Universidad de Tsinghua y ByteDance presentan SALMONN, una innovadora red neuronal multimodal para el procesamiento de audio avanzado
En varias aplicaciones de procesamiento de lenguaje natural, los modelos de lenguaje grande basados en texto han mostrado un rendimiento impresionante e incluso a nivel humano. Mientras tanto, ha evolucionado…