Este artículo de IA presenta el modelo mundial de difusión (DWM): un marco general para aprovechar los modelos de difusión como modelos mundiales en el contexto del aprendizaje por refuerzo fuera de línea
El aprendizaje por refuerzo (RL) comprende una amplia gama de algoritmos, generalmente divididos en dos grupos principales: métodos basados en modelos (MB) y sin modelos (MF). Los algoritmos MB se…