Cómo este avance de la IA con matemáticas puras y aprendizaje de refuerzo podría ayudar a predecir las crisis futuras

Imagine saber que el mercado de valores probablemente se estrellará en tres años, que el clima extremo destruirá su hogar en ocho o que tendrá una enfermedad debilitante en 15, pero ahora puede tomar medidas para protegerse de estas crisis. Aunque predecir el futuro con certeza siempre será imposible, inteligencia artificial Podría acercarse a hacerlo, sugieren algunos expertos. Las predicciones de dicha magnitud requerirían hacer miles de millones de conexiones en inmensos conjuntos de datos a través de enormes distancias o períodos de tiempo. Aunque tales capacidades están más allá de los sistemas de IA actuales, un avance matemático Descrito en un documento de preimpresión reciente podría proporcionar pistas para navegar en tan vastos datos y encontrar los patrones más grandes dentro de él para revelar resultados que las personas no podrían predecir.

Para desarrollar un sistema de IA capaz de hacer un trabajo tan difícil, un equipo de investigadores del Instituto de Tecnología de California y otras instituciones utilizó la conjetura de Andrews-Curtis, un problema matemático intratable de la teoría grupal, un campo que estudia simetría, estructura y operaciones en grupos matemáticos. Propuesta por los matemáticos James Andrews y Morton Curtis en 1965, la conjetura sugiere que cualquier configuración matemática tan complicada podría reducirse a su forma más básica mediante una secuencia finita de tres movimientos. Una forma de visualizar la conjetura es imaginar un gran laberinto en el que un jugador intenta conectar todos los puntos a un punto central de “hogar”. La longitud de cualquier camino solo podría ser inimaginablemente larga y requerir tomar millones o incluso miles de millones de pasos en el laberinto, dice Sergei Gukov, autor principal del estudio reciente y profesor de matemáticas en Caltech. “Esa fue la razón por la que elegimos este problema”, dice, “porque es un problema matemático en el que, para progresar, básicamente nos vemos obligados a desarrollar nuevos sistemas de IA que puedan adaptarse a este nivel de complejidad”.

En los 60 años transcurridos desde que se formuló la conjetura de Andrews-Curtis, la conjetura nunca ha sido probada o refutada. Probar que significaría mostrar que cada descripción elegible puede conectarse a la descripción de “Inicio” estándar único. Despreciarlo requeriría mostrar un llamado contraejemplo en el que no hay un “camino” para lograr la conjetura. “A priori, no se sabe si existen caminos [for coordinates]y el objetivo es tratar de demostrar o refutar si existe una ruta o encontrar un ejemplo en el que un camino no seaxista “, dice el autor principal del estudio Ali Shehper, un investigador de IA de alto nivel en Caltech. Durante décadas, los matemáticos han intentado despojar la conjetura de la conjetura por muchos contraevenir para los cuales no se pueden encontrar caminos, al menos ahora. El equipo hizo su ruptura completa por parte de los caminos de manera completa de los caminos. Controlones potenciales no resueltos, lo que demuestra que ninguna de estas propuestas realmente refuta la conjetura.


Sobre el apoyo al periodismo científico

Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado con suscripción. Al comprar una suscripción, está ayudando a garantizar el futuro de las historias impactantes sobre los descubrimientos e ideas que dan forma a nuestro mundo hoy.


Con la conjetura de Andrews-Curtis como su modelo, el equipo creó un juego: imaginar un tablero de ajedrez pero con un millón o incluso mil millones de cuadrados. Como jugador, debes llegar a un cuadrado “Inicio” designado, utilizando una caja de herramientas de solo unos pocos movimientos, similar a cómo cada pieza de ajedrez se puede mover de manera específica. Pero este es un juego solitario: eres el único jugador, y tu trabajo es tomar cualquier coordenada que te dan y determinar si, usando alguna combinación de los movimientos disponibles tantas veces como sea necesario, puedes llegar a casa. Para las coordenadas más cercanas a casa, la tarea no es tan difícil. Pero cuando las coordenadas están muy lejos, encontrar su camino por prueba y error podría llevar fácilmente toda la vida, especialmente porque no tiene forma de juzgar de inmediato si cada paso tomado está en el camino correcto hasta llegar al destino. El camino también es mucho más largo que la distancia real entre los dos puntos. “Para pasar de A a B, debe ir miles de millas en este complicado laberinto, a pesar de que la distancia real puede ser muy pequeña”, dice Gukov. “Entonces es como un demonio diseñado el laberinto”.

Para entrenar a la IA para jugar el juego, el equipo de Gukov usó el aprendizaje de refuerzo, una técnica de aprendizaje automático donde un agente de IA, un sistema que toma decisiones y toma medidas para lograr un objetivo, aprenden qué acciones funcionan mejor a través de la prueba y el error y al recibir recompensas o sanciones. “Si solo muestra al agente problemas difíciles al principio, no sabrá qué hacer con ellos. Pero si lo muestra más fáciles de problemas primero, eso realmente ayuda”, dice Shehper.

Pero para cruzar los inmensos espacios requeridos por la conjetura de Andrews-Curtis, los pequeños pasos no son suficientes. El juego aborda este problema usando dos agentes de IA con roles distintos: un jugador y un observador. Al observar al jugador y evaluar sus éxitos, el agente de observadores comienza a combinar movimientos básicos en combinaciones o “supermasados”, que el jugador puede usar para hacer saltos más grandes. A medida que el jugador ejecuta sus movimientos disponibles para sobresalir en las rutas más cortas, el observador aprende a evaluar la dificultad de las coordenadas y medir qué supermoves servirá mejor al jugador; Luego proporciona a esos supermitados estratégicamente cuando es más probable que el jugador pueda usarlos.

Mientras que las coordenadas más fáciles pueden requerir tan solo 10 movimientos para llegar a “hogar”, las coordenadas más difíciles crecen rápidamente en complejidad. “Matemáticamente se sabe que existe casos en los que necesita miles de millones de movimientos, pero aún no hemos llegado allí con nuestro sistema de IA”, dice Shehper. “Estamos en el rango de miles de movimientos”.

No obstante, miles de movimientos han sido suficientes para comenzar con algunas contraejemplos de larga data a la conjetura de Andrews-Curtis. Utilizando el sistema de IA Agentic, el equipo pudo resolver grandes familias de potenciales contraejemplos de larga data que habían estado abiertos durante 30 años. Incluso avanzó en una serie de contraejemplos que han existido durante aproximadamente cuatro décadas, reduciendo la mayoría de ellas a formas más simplificadas. A estudio de preimpresión En la Universidad de Liverpool, desde entonces confirmó de forma independiente los resultados del equipo de Gukov.

“Lo que hicieron, está más allá de las expectativas que tenía” por lo que AI podría hacer con la conjetura, dice Alexei Miasnikov, profesor de matemáticas en el Instituto de Tecnología Stevens. Miasnikov, que ha realizado Investigación sobre la conjetura de Andrews-Curtis Y no participó en el estudio del equipo de Gukov, dice que su trabajo ha demostrado cuán útil podría ser el refuerzo de la máquina para las matemáticas experimentales. “Muestra que puede obtener resultados interesantes que no puede obtener sin una computadora”, dice Miasnikov. “Creo que pronto se desarrollarán cosas mucho más interesantes. Estamos al principio”.

El equipo de Gukov espera crear herramientas para una amplia gama de problemas en matemáticas y fuera de él, dice Shehper. Los sistemas de IA actuales, como Alphago (que se reproduce GO) o Alphastar (que reproduce el videojuego Starcraft II), e incluso muchos modelos de idiomas grandes, como el GPT de OpenAi o el Grok de Xai, tratan los problemas que se sabe que son solucionables, e funcionan para encontrar soluciones más óptimas. “Sabemos que el ajedrez y el Go son problemas solucionables”, dice Shehper. “Un juego termina, y ganas o pierdes, y estos sistemas en realidad son solo una mejor manera de hacerlo”. El objetivo del equipo es desarrollar sistemas para abordar problemas en los que los matemáticos aún no saben si existen soluciones, y donde el camino para evaluar si una respuesta podría ser posible es incalculablemente largo.

Gukov y Shehper esperan que las nuevas herramientas que desarrollan puedan aplicarse en última instancia a las predicciones del mundo real. Quizás los futuros modelos de IA podrán prever cómo las máquinas complejas podrían fallar después de años de uso, cómo los sistemas de conducción automatizados pueden producir errores raros pero peligrosos durante largos períodos y cómo la enfermedad podría surgir en un individuo durante décadas. Potencialmente podrían aplicarse a muchos campos, como medicina, criptografía, finanzas y modelado climático. “Se podría decir que estamos desarrollando sistemas de IA para tales aplicaciones”, dice Gukov, “pero primero los estamos entrenando con matemáticas. Las matemáticas son baratas, por lo que no vamos a quemar el dinero de alguien ni hacer predicciones equivocadas sobre los huracanes”.

En cuanto a probar o refutar la conjetura de Andrews-Curtis en sí, el sistema de IA desarrollado por el equipo de Gukov está lejos de poder hacerlo, y este ni siquiera es el objetivo de los investigadores. Pero al descartar contra los contraejemplos, su trabajo ha proporcionado un nuevo soporte para la conjetura. “La creencia común en el [mathematics] La comunidad cuando comenzamos este trabajo era que la conjetura de Andrews-Curtis es probablemente falsa, por lo que uno debería tratar de refutarlo “, dice Gukov.” Pero después de pasar varios años en esta conjetura, he comenzado a creer que tal vez hay una posibilidad, una buena posibilidad, es realmente cierto “.