Investigadores de CMU y Microsoft presentan TinyGSM: un conjunto de datos sintéticos que contiene problemas matemáticos escritos al estilo GSM8K combinados con soluciones Python

En el procesamiento del lenguaje natural, la atención se está desplazando hacia el potencial sin explotar de los modelos de lenguaje pequeño (SLM). Si bien sus contrapartes más grandes han dominado el panorama, la pregunta persiste: ¿cuán crítico es el tamaño del modelo para una resolución efectiva de problemas? El estudio explora esta cuestión fundamental, profundizando en las ventajas de los SLM e introduciendo TinyGSM.

Investigadores de la Universidad Carnegie Mellon y Microsoft Research presentan TinyGSM, un conjunto de datos sintéticos que comprende 12,3 millones de problemas matemáticos de la escuela primaria y soluciones Python generadas por GPT-3.5. Es una herramienta de estudio de modelos de lenguaje pequeño (SLM) en razonamiento matemático. El enfoque aprovecha el conjunto de datos de alta calidad y utiliza un verificador para mejorar el rendimiento, superando en precisión a los modelos más grandes.

El estudio aborda la eficacia de la utilización de datos versus las leyes de escalamiento convencionales en la mejora del modelo, enfatizando la importancia de la generación de datos sintéticos en escenarios de escasez de datos. Observa el efecto compensatorio de aumentar el tamaño del conjunto de datos para modelos de tamaño más pequeño. El uso de verificadores para seleccionar respuestas óptimas de múltiples candidatos se destaca como exitoso en trabajos anteriores.

El estudio aborda el potencial poco explorado de los SLM en el razonamiento matemático, centrándose en romper la barrera del 80% de precisión en el desafiante punto de referencia GSM8K para problemas matemáticos de la escuela primaria. Para lograrlo, los investigadores proponen aprovechar conjuntos de datos de alta calidad como TinyGSM y un modelo de verificación para una selección óptima de resultados de múltiples generaciones candidatas. El estudio explora la generación de datos sintéticos, datos de ingeniería rápida y un escenario profesor-alumno para mejorar el rendimiento de modelos pequeños, presentando TinyGSM como un conjunto de datos sintéticos que demuestra una alta precisión en el punto de referencia GSM8K.

TinyGSM, un conjunto de datos sintéticos de problemas matemáticos de la escuela primaria con soluciones de Python, está generado en su totalidad por GPT-3.5. Al ajustar un modelo de generación de 1.300 millones y un modelo de verificador de 1.300 millones en TinyGSM, el verificador selecciona resultados óptimos de múltiples candidatos, lo que mejora la precisión del modelo. El filtrado garantiza la calidad de los datos, excluyendo problemas breves o contenido no numérico. Explorar diferentes formatos de solución sugiere escalar el verificador como un uso más eficiente de los parámetros del modelo, estableciendo conexiones con los conocimientos de entrenamiento de GAN. Al enfatizar conjuntos de datos de alta calidad y el uso de verificadores, el estudio subraya el logro de una alta precisión con modelos de lenguaje pequeños.

Se presenta TinyGSM, un conjunto de datos sintéticos de problemas matemáticos de la escuela primaria y soluciones de Python generados por GPT-3.5. Al ajustar un modelo de generación de 1.300 millones y un verificador de 1.300 millones en TinyGSM se logra una notable precisión del 81,5 % en el punto de referencia GSM8K, superando a modelos mucho más grandes. El rendimiento del modelo rivaliza con el del conjunto de datos GSM8K y muestra solidez con una precisión del 75,6 % en SVAMP sin necesidad de realizar más ajustes. El estudio enfatiza la eficacia del verificador en la selección de respuestas óptimas, sugiriendo escalarlo como un uso más eficiente de los parámetros del modelo. Los conjuntos de datos de alta calidad y la inclusión de contexto irrelevante contribuyen a mejorar el rendimiento del modelo de lenguaje pequeño.

https://arxiv.org/abs/2312.09241

En conclusión, el estudio destaca el potencial de los SLM para mejorar el razonamiento matemático en la escuela primaria. Al emplear conjuntos de datos de alta calidad como TinyGSM y un modelo de verificación, los SLM pueden superar a los modelos más grandes en precisión en el punto de referencia GSM8K. El estudio también enfatiza la importancia de utilizar conjuntos de datos y verificadores de calidad, que pueden ayudar a cerrar la brecha de desempeño entre los modelos de estudiantes y docentes. Los resultados sugieren que los SLM pueden ser un enfoque prometedor para lograr tareas de razonamiento matemático eficientes y efectivas.

Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 34k+ ML, 41k+ comunidad de Facebook, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.

A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.

🐝 [FREE AI WEBINAR] Google Gemini Pro: descripción general de los desarrolladores: 20 de diciembre de 2023, 10 a. m. PST

Investigadores de CMU y Microsoft presentan TinyGSM: un conjunto de datos sintéticos que contiene problemas matemáticos escritos al estilo GSM8K combinados con soluciones Python

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Los 10 principales modelos físicos de IA que impulsarán a los robots del mundo real en 2026

Cómo Popsa utilizó Amazon Nova para inspirar a los clientes con sugerencias de títulos personalizados

Cómo construir un agente encarnado ligero, inspirado en la visión, el lenguaje y la acción, con modelado del mundo latente y control predictivo de modelos

You missed

Cómo no pago casi nada para alimentar mi casa y mi coche eléctrico

Un registro histórico de los abogados especiales antes de Watergate

Las ganancias de BP se duplican con creces a medida que el aumento del precio del petróleo impulsa las ganancias comerciales

La historia de un perro empapado – Costa Tropical Gazette News