Investigadores de la UNC-Chapel Hill presentan la guía de región contrastiva (CRG): un método de IA de guía sin capacitación que permite que los modelos VLM de visión y lenguaje de código abierto respondan a indicaciones visuales
Los avances recientes en los grandes modelos de lenguaje visual (VLM) se han mostrado prometedores a la hora de abordar tareas multimodales al combinar las capacidades de razonamiento de los…