Google DeepMind presenta Vision Banana: un generador de imágenes ajustado por instrucciones que supera a SAM 3 en segmentación y profundidad Anything V3 en estimación de profundidad métrica
Durante años, la comunidad de visión por computadora ha operado en dos vías separadas: modelos generativos (que producen imágenes) y modelos discriminativos (que las comprenden). La suposición era sencilla: los…