O1-Pruner: racionalización del razonamiento prolongado en modelos de lenguaje
Los modelos de lenguajes grandes (LLM) han introducido capacidades impresionantes, particularmente en tareas de razonamiento. Modelos como el O1 de OpenAI utilizan un “razonamiento de largo pensamiento”, donde los problemas…