Kyutai lanza Moshivis: El primer modelo de habla en tiempo real de código abierto que puede hablar sobre imágenes
La inteligencia artificial ha hecho avances significativos en los últimos años, pero integrar la interacción del habla en tiempo real con el contenido visual sigue siendo un desafío complejo. Los…