10 de febrero de 2025
3 Leer mínimo
La IA de Google puede vencer a los estudiantes de secundaria más inteligentes en matemáticas
Alphageometry2 AI de Google alcanza el nivel de estudiantes de medalla de oro en la Olimpiada Matemática Internacional
Google Deepmind’s AI Alphageometry2 Problemas acertados establecidos en la Olimpiada Matemática Internacional.
Wirestock, Inc./alamy Stock Photo
Hace un año, Alfageometry, un solucionador de problemas de inteligencia artificial (IA) creada por Google Deepmind, sorprendió al mundo por actuando a nivel de medallistas de plata en la Olimpiada Matemática Internacional (OMI), una prestigiosa competencia que establece problemas de matemáticas difíciles para estudiantes de secundaria.
El equipo de DeepMind ahora dice que el rendimiento de su sistema mejorado, Alphageometry2, ha superado el nivel del medallista de oro promedio. Los resultados se describen en una preimpresión en el ARXIV.
“Me imagino que no pasará mucho tiempo antes de que las computadoras obtengan calificaciones completas en la OMI”, dice Kevin Buzzard, matemático en el Imperial College London.
Sobre el apoyo al periodismo científico
Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado con suscripción. Al comprar una suscripción, está ayudando a garantizar el futuro de las historias impactantes sobre los descubrimientos e ideas que dan forma a nuestro mundo hoy.
Resolver problemas en la geometría euclidiana es uno de los cuatro temas cubiertos en problemas de OMI: los otros cubren las ramas de la teoría de números, el álgebra y la combinatoria. La geometría exige habilidades específicas de una IA, porque los competidores deben proporcionar una prueba rigurosa para una declaración sobre los objetos geométricos en el plano. En julio, Alphageometry2 hizo su debut público junto con un sistema recién presentado, Alphaproof, que DeepMind desarrolló para resolver las preguntas de no geometría en los conjuntos de problemas de la OMI.
Lenguaje matemático
La alfageometría es una combinación de componentes que incluyen un modelo de lenguaje especializado y un sistema ‘neuro-simbólico’, uno que no capacita aprendiendo de datos como una red neuronal pero tiene un razonamiento abstracto codificado por humanos. El equipo capacitó al modelo de idioma para hablar un lenguaje matemático formal, lo que permite verificar automáticamente su salida para el rigor lógico, y eliminar las ‘alucinaciones’, las declaraciones incoherentes o falsas que los chatbots de IA son propensos a hacer.
Para Alphageometry2, el equipo realizó varias mejoras, incluida la integración del modelo de lenguaje grande de última generación de Google, Gemini. El equipo también introdujo la capacidad de razonar moviendo objetos geométricos alrededor del avión, como mover un punto a lo largo de una línea para cambiar la altura de un triángulo y resolver ecuaciones lineales.
El sistema pudo resolver el 84% de todos los problemas de geometría dados en IMOS en los últimos 25 años, en comparación con el 54% para la primera alfageometría. (Los equipos en India y China utilizaron diferentes enfoques el año pasado para lograr un rendimiento de nivel de oro en geometría, pero en un subconjunto más pequeño de problemas de geometría de la OMI).
Los autores del artículo de DeepMind escriben que las mejoras futuras de la alfageometría incluirán abordar problemas matemáticos que involucran desigualdades y ecuaciones no lineales, que deberán “resolver completamente la geometría”.
Progreso rápido
El primer sistema de IA en lograr un puntaje de medalla de oro para la prueba general podría ganar un premio de US $ 5 millones llamado Premio Olimpiado Matemático AI, aunque esa competencia requiere que los sistemas sean de código abierto, lo cual no es el caso de DeepMind.
Buzzard dice que no está sorprendido por el rápido progreso realizado tanto por DeepMind como por los equipos indios y chinos. Pero, agrega, aunque los problemas son difíciles, el tema sigue siendo conceptualmente simple y hay muchos más desafíos que superar antes de que la IA pueda resolver problemas a nivel de matemáticas de investigación.
Los investigadores de la IA estarán esperando ansiosamente la próxima iteración de la OMI en Sunshine Coast, Australia, en julio. Una vez que sus problemas se hacen públicos para que los participantes humanos resuelvan, los sistemas basados en IA también pueden resolverlos. (Los agentes de IA no pueden participar en la competencia y, por lo tanto, no son elegibles para ganar medallas). La solución existió en línea y puede haberse ‘filtrado’ en conjuntos de datos de capacitación, sesgando los resultados.
Este artículo se reproduce con permiso y fue Primero publicado el 7 de febrero de 2025.