Abstral: enseñanza de razonamiento abstracto de LLMS a través del refuerzo para aumentar la robustez en los puntos de referencia GSM
Investigaciones recientes indican que los LLM, particularmente los más pequeños, con frecuencia luchan con un razonamiento robusto. Tienden a funcionar bien en preguntas familiares, pero faltan cuando esos mismos problemas…