Deepmind AI de Google puede resolver problemas matemáticos a la par con los mejores solucionadores humanos

10 de febrero de 2025

3 Leer mínimo

La IA de Google puede vencer a los estudiantes de secundaria más inteligentes en matemáticas

Alphageometry2 AI de Google alcanza el nivel de estudiantes de medalla de oro en la Olimpiada Matemática Internacional

Por Davide Castelvecchi Y Revista de la naturaleza

Google Deepmind’s AI Alphageometry2 Problemas acertados establecidos en la Olimpiada Matemática Internacional.

Wirestock, Inc./alamy Stock Photo

Hace un año, Alfageometry, un solucionador de problemas de inteligencia artificial (IA) creada por Google Deepmind, sorprendió al mundo por actuando a nivel de medallistas de plata en la Olimpiada Matemática Internacional (OMI), una prestigiosa competencia que establece problemas de matemáticas difíciles para estudiantes de secundaria.

El equipo de DeepMind ahora dice que el rendimiento de su sistema mejorado, Alphageometry2, ha superado el nivel del medallista de oro promedio. Los resultados se describen en una preimpresión en el ARXIV.

“Me imagino que no pasará mucho tiempo antes de que las computadoras obtengan calificaciones completas en la OMI”, dice Kevin Buzzard, matemático en el Imperial College London.

Sobre el apoyo al periodismo científico

Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado con suscripción. Al comprar una suscripción, está ayudando a garantizar el futuro de las historias impactantes sobre los descubrimientos e ideas que dan forma a nuestro mundo hoy.

Resolver problemas en la geometría euclidiana es uno de los cuatro temas cubiertos en problemas de OMI: los otros cubren las ramas de la teoría de números, el álgebra y la combinatoria. La geometría exige habilidades específicas de una IA, porque los competidores deben proporcionar una prueba rigurosa para una declaración sobre los objetos geométricos en el plano. En julio, Alphageometry2 hizo su debut público junto con un sistema recién presentado, Alphaproof, que DeepMind desarrolló para resolver las preguntas de no geometría en los conjuntos de problemas de la OMI.

Lenguaje matemático

La alfageometría es una combinación de componentes que incluyen un modelo de lenguaje especializado y un sistema ‘neuro-simbólico’, uno que no capacita aprendiendo de datos como una red neuronal pero tiene un razonamiento abstracto codificado por humanos. El equipo capacitó al modelo de idioma para hablar un lenguaje matemático formal, lo que permite verificar automáticamente su salida para el rigor lógico, y eliminar las ‘alucinaciones’, las declaraciones incoherentes o falsas que los chatbots de IA son propensos a hacer.

Para Alphageometry2, el equipo realizó varias mejoras, incluida la integración del modelo de lenguaje grande de última generación de Google, Gemini. El equipo también introdujo la capacidad de razonar moviendo objetos geométricos alrededor del avión, como mover un punto a lo largo de una línea para cambiar la altura de un triángulo y resolver ecuaciones lineales.

El sistema pudo resolver el 84% de todos los problemas de geometría dados en IMOS en los últimos 25 años, en comparación con el 54% para la primera alfageometría. (Los equipos en India y China utilizaron diferentes enfoques el año pasado para lograr un rendimiento de nivel de oro en geometría, pero en un subconjunto más pequeño de problemas de geometría de la OMI).

Los autores del artículo de DeepMind escriben que las mejoras futuras de la alfageometría incluirán abordar problemas matemáticos que involucran desigualdades y ecuaciones no lineales, que deberán “resolver completamente la geometría”.

Progreso rápido

El primer sistema de IA en lograr un puntaje de medalla de oro para la prueba general podría ganar un premio de US $ 5 millones llamado Premio Olimpiado Matemático AI, aunque esa competencia requiere que los sistemas sean de código abierto, lo cual no es el caso de DeepMind.

Buzzard dice que no está sorprendido por el rápido progreso realizado tanto por DeepMind como por los equipos indios y chinos. Pero, agrega, aunque los problemas son difíciles, el tema sigue siendo conceptualmente simple y hay muchos más desafíos que superar antes de que la IA pueda resolver problemas a nivel de matemáticas de investigación.

Los investigadores de la IA estarán esperando ansiosamente la próxima iteración de la OMI en Sunshine Coast, Australia, en julio. Una vez que sus problemas se hacen públicos para que los participantes humanos resuelvan, los sistemas basados en IA también pueden resolverlos. (Los agentes de IA no pueden participar en la competencia y, por lo tanto, no son elegibles para ganar medallas). La solución existió en línea y puede haberse ‘filtrado’ en conjuntos de datos de capacitación, sesgando los resultados.

Este artículo se reproduce con permiso y fue Primero publicado el 7 de febrero de 2025.

Deepmind AI de Google puede resolver problemas matemáticos a la par con los mejores solucionadores humanos

ByEquipo de 7 minutos

Sobre el apoyo al periodismo científico

Lenguaje matemático

Progreso rápido

By Equipo de 7 minutos

Related Post

China abre el primer centro de datos submarinos impulsado por energía eólica del mundo

Cómo el dúo de rock canadiense Angine de Poitrine juega con la neurobiología y la física para hacer música viral

Un Waymo casi me atropella, pero sigo siendo optimista sobre los coches sin conductor

You missed

No te pierdas el Strawberry Moon de junio « Euro Weekly News

Alix Earle y Lando Norris pasan tiempo juntos después del Gran Premio de Mónaco

China abre el primer centro de datos submarinos impulsado por energía eólica del mundo

Comienzan las maniobras para un trabajo de inteligencia de Trump