Demasiado pensamiento puede romper las LLM: escala inversa en el momento de la prueba.
Avances recientes en Modelos de idiomas grandes (LLM) han alentado la idea de que dejar que los modelos “piensen más tiempo” durante la inferencia generalmente mejora su precisión y robustez.…