Codificador audiovisual de percepción de código abierto Meta AI (PE-AV): el codificador audiovisual que impulsa el audio SAM y la recuperación multimodal a gran escala
Metainvestigadores han presentado Perception Encoder Audiovisual, PEAV, como una nueva familia de codificadores para la comprensión conjunta de audio y vídeo. El modelo aprende representaciones alineadas de audio, video y…