Investigadores de Microsoft presentan VALL-E 2: un enfoque de modelado de lenguaje que logra la paridad humana Síntesis de texto a voz (TTS) Zero-Shot
La síntesis de texto a voz (TTS) se centra en convertir texto en palabras habladas con un alto grado de naturalidad e inteligibilidad. Este campo se cruza con el procesamiento…