OpentHoughts: una tubería de curación de datos SFT de ajuste fino escalable para modelos de razonamiento
La creciente complejidad de la curación de datos de razonamiento Los modelos de razonamiento recientes, como Deepseek-R1 y O3, han mostrado un rendimiento sobresaliente en áreas matemáticas, codificadas y científicas,…