Panda-70M: un conjunto de datos a gran escala con 70 millones de pares de subtítulos de vídeo de alta calidad
La importancia de la informática y el tamaño de los datos es innegable en el aprendizaje multimodal a gran escala. Aún así, recopilar datos de texto en vídeo de alta…