Jugar a Connect Four con Deep Q-Learning
exploramos cómo extender el aprendizaje por refuerzo (RL) más allá de la configuración tabular mediante la aproximación de funciones. Si bien esto nos permitió generalizar entre estados, nuestros experimentos también…