StreamSpeech: un modelo de traducción directa de voz a voz Simul-S2ST que aprende conjuntamente traducción y políticas simultáneas en un marco unificado de aprendizaje multitarea
Los modelos de lenguaje grandes (LLM) han ganado una atención significativa en el campo de la traducción simultánea de voz a voz (SimulS2ST). Esta tecnología se ha vuelto crucial para…