Hoy anunciamos una asociación ampliada con el Instituto de Seguridad de IA del Reino Unido (AISI) a través de un nuevo Memorando de Entendimiento centrado en la seguridad fundamental y la investigación de protección, para ayudar a garantizar que la inteligencia artificial se desarrolle de forma segura y beneficie a todos.
La asociación de investigación con AISI es una parte importante de nuestra colaboración más amplia con el gobierno del Reino Unido para acelerar el progreso seguro y beneficioso de la IA.
Construir sobre una base de colaboración
La IA tiene un inmenso potencial para beneficiar a la humanidad al ayudar a tratar enfermedades, acelerar los descubrimientos científicos, crear prosperidad económica y abordar el cambio climático. Para que estos beneficios se hagan realidad, debemos poner la seguridad y la responsabilidad en el centro del desarrollo. La evaluación de nuestros modelos frente a un amplio espectro de riesgos potenciales sigue siendo una parte fundamental de nuestra estrategia de seguridad, y las asociaciones externas son un elemento importante de este trabajo.
Es por eso que nos hemos asociado con AISI del Reino Unido desde su creación en noviembre de 2023 para probar nuestros modelos más capaces. Estamos profundamente comprometidos con el objetivo del AISI del Reino Unido de dotar a los gobiernos, la industria y la sociedad en general de una comprensión científica de los riesgos potenciales que plantea la IA avanzada, así como de posibles soluciones y mitigaciones.
Estamos trabajando activamente con AISI para crear evaluaciones más sólidas para los modelos de IA, y nuestros equipos han colaborado en investigaciones de seguridad para hacer avanzar el campo, incluido un trabajo reciente sobre Monitorización de la cadena de pensamiento: una nueva y frágil oportunidad para la seguridad de la IA. Aprovechando este éxito, hoy estamos ampliando nuestra asociación desde las pruebas hasta incluir investigaciones más amplias y fundamentales en una variedad de áreas.
Qué implica la asociación
En el marco de esta nueva asociación de investigación, estamos ampliando nuestra colaboración para incluir:
Compartir el acceso a nuestros modelos, datos e ideas patentados para acelerar el progreso de la investigación. Informes y publicaciones conjuntos que comparten hallazgos con la comunidad de investigación. Más investigación colaborativa sobre seguridad y protección que combine la experiencia de nuestros equipos. Debates técnicos para abordar desafíos complejos de seguridad.
Áreas clave de investigación
Nuestra investigación conjunta con AISI se centra en áreas críticas donde la experiencia de Google DeepMind, los equipos interdisciplinarios y los años de investigación responsable pionera pueden ayudar a que los sistemas de IA sean más seguros:
Monitoreo de los procesos de razonamiento de la IA
Trabajaremos en técnicas para monitorear el “pensamiento” de un sistema de IA, también conocido comúnmente como su cadena de pensamiento (CoT). Este trabajo también se basa en investigaciones anteriores de Google DeepMind y en nuestra reciente colaboración sobre este tema con AISI, OpenAI, Anthropic y otros socios. El monitoreo de CoT nos ayuda a comprender cómo un sistema de IA produce sus respuestas, lo que complementa la investigación de interpretabilidad.
Comprender los impactos sociales y emocionales
Trabajaremos juntos para investigar las implicaciones éticas de la desalineación socioafectiva; es decir, la posibilidad de que los modelos de IA se comporten de maneras que no se alinean con el bienestar humano, incluso cuando técnicamente siguen las instrucciones correctamente. Esta investigación se basará en el trabajo existente de Google DeepMind que ha ayudado a definir esta área crítica de la seguridad de la IA.
Evaluación de sistemas económicos
Exploraremos el impacto potencial de la IA en los sistemas económicos mediante la simulación de tareas del mundo real en diferentes entornos. Los expertos calificarán y validarán estas tareas, después de lo cual se clasificarán según dimensiones como complejidad o representatividad, para ayudar a predecir factores como el impacto a largo plazo en el mercado laboral.
Trabajando juntos para aprovechar los beneficios de la IA
Nuestra asociación con AISI es un elemento de cómo pretendemos lograr los beneficios de la IA para la humanidad y al mismo tiempo mitigar los riesgos potenciales. Nuestra estrategia más amplia incluye investigación prospectiva, una amplia capacitación en seguridad que va de la mano con el desarrollo de capacidades, pruebas rigurosas de nuestros modelos y el desarrollo de mejores herramientas y marcos para comprender y mitigar el riesgo.
Los procesos sólidos de gobernanza interna también son esenciales para el desarrollo seguro y responsable de la IA, al igual que la colaboración con expertos externos independientes que aportan nuevas perspectivas y experiencia diversa a nuestro trabajo. El Consejo de Responsabilidad y Seguridad de Google DeepMind trabaja en equipos para monitorear los riesgos emergentes, revisar las evaluaciones de ética y seguridad e implementar mitigaciones técnicas y políticas relevantes. También nos asociamos con otros expertos externos como Apollo Research, Vaultis, Dreadnode y más, para realizar pruebas y evaluaciones exhaustivas de nuestros modelos, incluido Gemini 3, nuestro modelo más inteligente y seguro hasta la fecha.
Además, Google DeepMind es un orgulloso miembro fundador del Foro de modelos de frontera, así como de la Asociación sobre IA, donde nos enfocamos en garantizar el desarrollo seguro y responsable de modelos de IA de frontera y aumentar la colaboración en importantes cuestiones de seguridad.
Esperamos que nuestra asociación ampliada con AISI nos permita construir enfoques más sólidos para la seguridad de la IA en beneficio no solo de nuestras propias organizaciones, sino también de la industria en general y de todos los que interactúan con los sistemas de IA.