9 de febrero de 2026
3 minutos de lectura
Agréganos en GoogleAñadir ciencia-Am
Los matemáticos lanzan un gran desafío a la IA: muéstranos tu trabajo
Frustrado por las afirmaciones de la industria de la IA de demostrar resultados matemáticos sin ofrecer transparencia, un equipo de destacados académicos ha propuesto una mejor manera

Alfred Gescheidt/Getty Images
Ha comenzado la carrera para desarrollar una inteligencia artificial que pueda hacer matemáticas puras, y los mejores matemáticos acaban de lanzar el desafío con un examen de problemas reales sin resolver que son relevantes para su investigación. El equipo está dando a los sistemas de IA una semana para resolver los problemas.
El esfuerzo, llamado “Primera prueba”, se detalla en una preimpresión que se publicó el jueves pasado.
“Estos son problemas completamente nuevos que no se pueden encontrar en ningún LLM [large language model’s] datos de entrenamiento”, dice Andrew Sutherland, matemático del Instituto Tecnológico de Massachusetts, que no participó en el nuevo examen. “Este parece un experimento mucho mejor que cualquiera que haya visto hasta la fecha”, añade, refiriéndose a la dificultad de probar qué tan bien las IA pueden hacer matemáticas.
Sobre el apoyo al periodismo científico
Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado suscribiéndose. Al comprar una suscripción, ayudas a garantizar el futuro de historias impactantes sobre los descubrimientos y las ideas que dan forma a nuestro mundo actual.
La industria de la IA se ha obsesionado con las matemáticas puras. Debido a que las pruebas matemáticas siguen una secuencia comprobable de pasos lógicos, su conclusión es verdadera o falsa más allá de cualquier medida subjetiva. Y eso puede ofrecer una mejor manera de comparar las destrezas de los LLM que evaluar qué tan convincente es su poesía. Las empresas emergentes dedicadas a la IA para las matemáticas han contratado recientemente a varios matemáticos de alto perfil.
Estos esfuerzos han tenido algunos éxitos iniciales: en 2025, una versión avanzada de Gemini Deep Think de Google logró una puntuación de nivel oro en la Olimpiada Internacional de Matemáticas, un examen para estudiantes de secundaria prodigiosos. Y en los últimos meses, una IA ha resuelto múltiples “problemas de Erdø”, un tesoro de desafíos planteados por el fallecido matemático Paul Erdøs. La nueva empresa Axiom Math fue noticia la semana pasada por abordar con éxito varias preguntas matemáticas de nivel de investigación (aunque lejos de ser innovadoras).
Pero ninguna de estas pruebas fueron experimentos controlados. Los problemas de las Olimpiadas no son preguntas de investigación. Y los LLM parecen tener una tendencia a encontrar pruebas existentes y olvidadas en lo más profundo de la literatura matemática y presentarlas como originales. Una de las pruebas recientes de Axiom Math, por ejemplo, resultó ser un resultado de búsqueda de literatura tergiversado.
Y algunos resultados matemáticos que provienen de empresas tecnológicas han llamado la atención entre los académicos por otras razones, dice Daniel Spielman, profesor de la Universidad de Yale y uno de los expertos detrás del nuevo desafío. “Casi todos los artículos que ves sobre personas que utilizan LLM están escritos por personas de las empresas que producen los LLM”, dice Spielman. “Parece una especie de publicidad”.
La Primera Prueba es un intento de disipar el humo. Para preparar el examen, 11 luminarias matemáticas, incluido un ganador de la Medalla Fields, contribuyeron con problemas matemáticos que habían surgido en su investigación. Los expertos también subieron pruebas de las soluciones, pero las cifraron. Las respuestas se descifrarán poco antes de la medianoche del 13 de febrero.
Ninguna de las pruebas es trascendental. Son “lemas”, una palabra que los matemáticos usan para describir la miríada de pequeños teoremas que demuestran en el camino hacia un resultado más significativo. Los lemas no suelen publicarse como artículos independientes.
Pero si una IA resolviera estos lemas, demostraría lo que muchos matemáticos ven como el potencial de la tecnología a corto plazo: una herramienta útil para acelerar las partes más tediosas de la investigación matemática.
“Creo que el mayor impacto que la IA tendrá este año en las matemáticas no será la resolución de grandes problemas abiertos, sino su penetración en la vida cotidiana de los matemáticos que trabajan, lo que en su mayoría no ha sucedido todavía”, dice Sutherland. “Este puede ser el año en el que mucha más gente empiece a prestar atención”.
Es hora de defender la ciencia
Si te ha gustado este artículo, me gustaría pedirte tu apoyo. Científico americano ha servido como defensor de la ciencia y la industria durante 180 años, y ahora mismo puede ser el momento más crítico en esos dos siglos de historia.
he sido un Científico americano suscriptor desde que tenía 12 años y me ayudó a moldear mi forma de ver el mundo. Ciencia-Am Siempre me educa y me deleita, e inspira una sensación de asombro por nuestro vasto y hermoso universo. Espero que también lo haga por ti.
Si te suscribes a Científico americanousted ayuda a garantizar que nuestra cobertura se centre en investigaciones y descubrimientos significativos; que tenemos los recursos para informar sobre las decisiones que amenazan a los laboratorios en todo Estados Unidos; y que apoyemos a los científicos tanto en ciernes como en activo en un momento en el que con demasiada frecuencia el valor de la ciencia misma pasa desapercibido.
A cambio, obtiene noticias esenciales, podcasts cautivadores, infografías brillantes, boletines informativos imperdibles, vídeos imprescindibles, juegos desafiantes y los mejores escritos e informes del mundo científico. Incluso puedes regalarle a alguien una suscripción.
Nunca ha habido un momento más importante para que nos levantemos y demostremos por qué la ciencia es importante. Espero que nos apoyes en esa misión.