PLAN-SEQ-LEARN: un método de aprendizaje automático que integra las capacidades de razonamiento a largo plazo de los modelos lingüísticos con la destreza de las políticas de aprendizaje por refuerzo aprendidas
El campo de la investigación en robótica se ha transformado significativamente mediante la integración de grandes modelos de lenguaje (LLM). Estos avances han presentado una oportunidad para guiar los sistemas…