OpenMOSS lanza MOSS-Audio: un modelo básico de código abierto para el razonamiento del habla, el sonido, la música y el audio con reconocimiento del tiempo
Comprender lo que sucede en un clip de audio es un problema engañosamente difícil. Transcribir palabras habladas es la parte fácil. Un sistema verdaderamente capaz también necesita reconocer quién está…