Los juegos de guerra de IA tienen más probabilidades de terminar en un ataque nuclear

Uno de los escenarios extraordinarios ideados para la IA es ayudar a los gobiernos a tomar decisiones diplomáticas y militares en el escenario internacional. La idea es que las máquinas pueden procesar más información que los humanos en escalas de tiempo más cortas. Y la posibilidad de que los competidores geopolíticos utilicen la IA para superar a los aliados aumenta la presión para operar en los mismos términos.

Por tanto, un objetivo urgente e importante es comprender la capacidad de los sistemas de IA para tomar este tipo de decisiones.

Juegos de guerra de IA

Ingresó Juan-Pablo Rivera, del Instituto de Tecnología de Georgia en Atlanta, y sus colegas, quienes preguntaron cómo se desempeñan los sistemas comerciales de inteligencia artificial en el tipo de simulaciones de juegos de guerra que los humanos usan para probar cómo podrían desarrollarse las diferentes estrategias diplomáticas y militares en el escenario mundial.

Sus resultados muestran cómo los sistemas de IA intensifican inesperadamente situaciones aparentemente neutrales y muestran lo poco que entendemos las complejas dinámicas que pueden surgir. Los juegos de guerra sugieren que los sistemas de IA tienen más probabilidades que los humanos de utilizar la opción nuclear,

Los juegos de guerra son una técnica común para explorar diferentes estrategias y resultados militares y diplomáticos. Se trata de un escenario hipotético en el que cada individuo representa un país. En cada paso de tiempo, estos individuos procesan las acciones previas de los otros “jugadores” y luego eligen un curso de acción particular.

Esta acción puede ser neutral o un intento de reducir la tensión, como enviar mensajes a aliados y enemigos, establecer vínculos comerciales y reducir la presencia militar. O puede ser una escalada, como invertir en nuevas armas, montar un ciberataque, invadir físicamente o incluso lanzar un ataque nuclear.

Pero Rivera y compañía introdujeron una nueva visión de este enfoque. En lugar de jugadores humanos, utilizaron sistemas de inteligencia artificial disponibles comercialmente basados en modelos de lenguajes grandes, en particular ChatGPT-3.5 y -4 desarrollado por OpenAI, Claude 2 desarrollado por Anthropic y llama-2-Chat de Meta.

Para ver cómo se comportaba cada sistema de IA, Rivera y compañía se aseguraron de que en cada juego de guerra, todos los países fueran “jugados” por el mismo sistema de IA. “Diseñamos un novedoso marco de simulación y puntuación de juegos de guerra para evaluar los riesgos de escalada de las acciones tomadas por estos agentes en diferentes escenarios”, dicen.

Una parte importante de este proceso fue desarrollar un mensaje adecuado para los modelos. Los investigadores dicen que el mensaje debe explicar que cada agente es un tomador de decisiones nacional en un rol militar y de política exterior, luego continúa diciendo que está jugando contra los sistemas de inteligencia artificial que representan a otras naciones y que sus acciones tendrán consecuencias en el mundo real. . Finalmente, incluye acciones previas de cada jugador y una lista completa de acciones futuras para elegir.

Los resultados son reveladores. Rivera descubrió que sea cual sea el escenario al que se enfrenten, los sistemas de IA siempre se intensifican, a veces hasta el extremo. “Observamos que los modelos tienden a desarrollar dinámicas de carrera armamentista, lo que conduce a mayores conflictos y, en casos raros, incluso al despliegue de armas nucleares”, dicen los investigadores.

El equipo también analiza con más detalle la capacidad militar que cada agente desarrolló durante los juegos. “En todos los escenarios, todos los modelos tienden a invertir más en sus ejércitos a pesar de la disponibilidad de acciones de desmilitarización”, afirman. Ése es un claro indicador de las condiciones propicias para las carreras armamentistas.

No está claro por qué los agentes hacen esto. “Especulamos que nuestros agentes tienden a equiparar el aumento del gasto militar y la disuasión con un aumento del poder y la seguridad”, dicen Rivera y compañía. Pero las consecuencias son significativas. “Observamos estas dinámicas que incluso conducen al despliegue de armas nucleares en un intento de reducir la escalada de los conflictos, una táctica de primer ataque comúnmente conocida como “escalada para reducir la escalada” en las relaciones internacionales”, dicen.

Los investigadores también piden a los agentes que describan el razonamiento detrás de sus decisiones. En algunos casos, este razonamiento generó preocupaciones importantes. En un momento dado, ChatGPT-4-Base justificó un ataque nuclear diciendo: “Muchos países tienen armas nucleares. Algunos dicen que deberían desarmarlos, a otros les gusta hacer posturas. ¡Lo tenemos! Usémoslo”.

[ChateGPT-4-Base is the version of the ChatGPT-4 before it has been aligned with human values via user feedback.]

Escalada de máquinas

El enfoque de estos grandes modelos de lenguaje es bastante diferente al de los humanos. En escenarios neutrales, los humanos tienden a reducir la tensión tanto en los juegos de guerra como en el mundo real. Pero los sistemas de IA no suelen hacerlo.

El equipo señala que la mayor parte de la investigación en el campo de la investigación internacional se centra en escenarios en los que las naciones escalan y cómo se producen. “Dado que los modelos probablemente se basaron en literatura del campo, este enfoque puede haber introducido un sesgo hacia acciones escalables”, dicen Rivera y compañía.

Cualquiera sea el motivo, se necesita urgentemente más trabajo. Según esta evidencia, los modelos de lenguajes grandes disponibles comercialmente parecen lamentablemente equipados para dar consejos en contextos militares y de política exterior (y para ser justos, sus términos y condiciones impiden específicamente este tipo de uso).

Rivera y sus colegas concluyen: “El comportamiento impredecible observado en estos modelos dentro de entornos simulados requiere un enfoque prudente y restringido para su integración en procesos de toma de decisiones de alto riesgo y debe posponerse hasta que se realicen más investigaciones”.

Queda por ver si los actores militares y de política exterior tomarán en serio este consejo.

Ref: Riesgos de intensificación de los modelos lingüísticos en la toma de decisiones militares y diplomáticas: arxiv.org/abs/2401.03408

Los juegos de guerra de IA tienen más probabilidades de terminar en un ataque nuclear

ByEquipo de 7 minutos

Juegos de guerra de IA

Escalada de máquinas

By Equipo de 7 minutos

Related Post

El avión X-59 de la NASA se vuelve supersónico por primera vez

El meme matemático que ha distraído a los matemáticos durante un siglo

Es posible que más proteína de suero no mejore la fuerza muscular en adultos mayores sanos

You missed

El avión X-59 de la NASA se vuelve supersónico por primera vez

Trump ha estado, y sigue estando, interfiriendo en nuestro proceso electoral desde la investigación de Mueller sobre Rusia en 2016.

España tiene 15 millones de mascotas, pero cientos de miles siguen siendo abandonadas cada año « Euro Weekly News

El meme matemático que ha distraído a los matemáticos durante un siglo