Meta Clip 2: La primera capacitación de imagen de idioma contrastante (clip) entrenado con pares de texto de imagen mundial desde cero
El pre-entrenamiento de imagen de lenguaje contrastante (clip) se ha vuelto importante para la visión moderna y los modelos multimodales, lo que permite aplicaciones como la clasificación de imágenes de…