Google DeepMind presenta Direct Reward Fine-Tuning (DRaFT): un método eficaz de inteligencia artificial para ajustar modelos de difusión para maximizar funciones de recompensa diferenciables
Los modelos de difusión han revolucionado el modelado generativo en varios tipos de datos. Sin embargo, en aplicaciones prácticas como generar imágenes estéticamente agradables a partir de descripciones de texto,…