Meta AI Lotes Web-SSL: un enfoque escalable y sin lenguaje para el aprendizaje de representación visual
En los últimos años, los modelos de imagen de lenguaje contrastante como Clip se han establecido como una opción predeterminada para aprender representaciones de visión, particularmente en aplicaciones multimodales como…