¿Necesitas preocuparte por Mythos, la IA de Anthropic que piratea computadoras?

El Proyecto Glasswing de Anthropic tiene como objetivo mejorar la seguridad en línea

Jonathan Raa/NurPhoto vía Getty Images)

Las últimas semanas han traído noticias aparentemente alarmantes sobre Mythos, una IA que puede identificar fallas de ciberseguridad en cuestión de momentos, dejando los sistemas operativos y el software vulnerables a los piratas informáticos. La comunidad de la ciberseguridad está empezando a tener una mejor idea de cómo Mythos puede cambiar la cara de la ciberseguridad, y no necesariamente para peor.

¿Qué es Mythos y por qué preocupa a la gente?

Mythos es una IA creada por Anthropic. Su existencia fue revelada accidentalmente el mes pasado cuando la gente desenterró contenido en el sitio web de la compañía, que no estaba previsto para publicación, y que no estaba protegido para que cualquiera pudiera verlo.

Según Anthropic, hay una buena razón por la que el modelo se mantuvo a puerta cerrada: es, más por accidente que por diseño, extremadamente bueno para piratear. Supuestamente puede descubrir fallas en prácticamente cualquier software, si se le solicita, que permitirían al usuario ingresar.

La compañía dice que Mythos encontró miles de vulnerabilidades de gravedad alta y crítica en sistemas operativos y otro software. Anthropic no respondió a la solicitud de comentarios de New Scientist, pero la compañía dijo en su sitio web que “las consecuencias (para las economías, la seguridad pública y la seguridad nacional) podrían ser graves”.

La empresa dice que tomó la medida responsable de mantenerlo oculto.

¿Entonces nadie puede usarlo?

No exactamente. Anthropic ha decidido ponerlo a disposición de un grupo selecto de gigantes de la tecnología y las finanzas como Amazon Web Services, Apple, Google, JPMorganChase, Microsoft y NVIDIA bajo algo llamado Proyecto Glasswing para que puedan descubrir cualquier error en su propio software antes que alguien más lo haga.

Los miembros de un foro privado en línea también lograron obtener acceso no autorizado al ensayo. Los informes sugieren que simplemente hicieron una “suposición fundamentada” sobre dónde se alojaría el modelo en línea, el mismo tipo de problema que llevó a la revelación de la existencia de Mythos en primer lugar. Quizás una empresa tan preocupada por la ciberseguridad debería prestar más atención a la suya.

Si bien inicialmente el modelo debía mantenerse en secreto y fuera de uso, ahora está ganando gran atención y está siendo probado por algunos de los mejores expertos en ciberseguridad del mundo. Muchas de esas empresas también son los mayores clientes potenciales de Anthropic, por supuesto, y la exageración sobre el poder de Mythos ciertamente no le hará daño a Anthropic.

El experto en seguridad Davi Ottenheimer resumió la situación en una publicación de blog como “una capacidad tecnológica legítima, reformulada como amenaza a la civilización, por una parte que se beneficia de la reformulación”.

¿Es tan peligroso como la gente cree?

Kevin Curran, de la Universidad de Ulster, Reino Unido, dice que la revelación de Mythos y lo que podría ser capaz de hacer “activó la alarma en toda la industria de la seguridad”, aunque los investigadores estaban divididos sobre la gravedad de la amenaza en realidad. “¿Qué sucede cuando una máquina puede hacer en segundos lo que un hacker humano experto tarda meses en lograr?” se pregunta.

Pero hay indicios de que todavía no es momento de entrar en pánico. Bobby Holley de Firefox – una de esas organizaciones a las que se les dio acceso a Mythos – escribió en una publicación de blog que el modelo ayudó a su equipo a encontrar 271 vulnerabilidades en el navegador web, lo que sin duda es un gran botín, pero que ninguna era tan ingeniosa, impenetrablemente compleja o sofisticada que un humano no podría haberlas desenterrado.

“Un solo error de este tipo habría entrado en alerta roja en 2025, y tantos a la vez hacen que uno se pregunte si es posible seguir el ritmo”, escribió Holley. “Es alentador que tampoco hayamos visto ningún error que no pudiera haber sido encontrado por un investigador humano de élite”.

El Instituto de Seguridad de IA (AISI), creado bajo el entonces primer ministro del Reino Unido, Rishi Sunak, después de la Cumbre de IA del Reino Unido en 2023, también investigó a Mythos. En las pruebas, se descubrió que era capaz de atacar sólo “sistemas empresariales pequeños, débilmente defendidos y vulnerables” y no había indicios de que una parte de software o red realmente segura estuviera en riesgo, aunque era un paso adelante en capacidad con respecto a modelos anteriores. Y AISI advirtió que estas cosas están mejorando rápidamente. AISI no hizo comentarios cuando New Scientist le pidió que hablara sobre la amenaza.

Alan Woodward, de la Universidad de Surrey, Reino Unido, tiene una visión pragmática de la amenaza que plantean Mythos y todos los demás modelos de IA en general, que también tienen la capacidad de detectar vulnerabilidades cibernéticas en diversos grados. “La IA no es necesariamente capaz de encontrar vulnerabilidades que un humano no encontraría, pero es mucho más rápida, exhaustiva e implacable. Por lo tanto, encuentra vulnerabilidades que los humanos han pasado por alto”, afirma. “La IA, como lo demuestra Mythos, hace que el trabajo del atacante sea más eficiente y le da una velocidad y agilidad que hace que la defensa sea más difícil, pero no imposible”.

Entonces parece que, si bien Mythos puede encontrar fallas a escala y velocidad, todavía no está encontrando nada devastadoramente peligroso. E incluso hay razones para creer que en realidad podría ser algo bueno.

¿Cómo puede ser positiva una IA hackeadora?

“Los defectos son finitos y estamos entrando en un mundo en el que finalmente podremos encontrarlos todos”, escribió Holley. En esencia, si crea o mantiene software, también puede utilizar Mythos para separar su propio código y parchearlo, tal vez incluso antes de su lanzamiento.

Es casi seguro que la IA será más capaz de encontrar fallas y los atacantes maliciosos seguramente se beneficiarán de esto hasta cierto punto. Pero esto también ayudará a los fabricantes de software, aunque aquellos que mantienen software gubernamental anticuado y torpe escrito hace décadas pueden encontrar dificultades para mantenerse al día.

Incluso Anthropic cree que hackear IA eventualmente beneficiará más a los defensores que a los atacantes, pero, claro, decir lo contrario haría difícil justificar su fabricación.

Básicamente, la IA está facilitando (y seguirá facilitando) tanto la piratería como la defensa contra los piratas informáticos, pero aquellos que ignoren la tecnología se encontrarán en una gran desventaja.

“Trata a Mythos como si fuera un disparo de advertencia”, dice Curran. “Y supongamos que dentro de 18 meses, capacidades comparables estarán en manos de los adversarios. La ventana para adelantarse a esto está abierta, pero se está cerrando rápidamente”.

Temas: