Sondeo de transformadores de imagen y lenguaje para la comprensión de los verbos
Conectar el lenguaje a la visión es un problema fundamental para muchos sistemas de inteligencia artificial del mundo real, como la recuperación de imágenes o la generación de descripciones para…