Google Deepmind presenta CodeMender: un nuevo agente de IA que utiliza Gemini Deep Think para parchear automáticamente las vulnerabilidades de software críticas

¿Qué pasaría si un agente de IA pudiera localizar una causa raíz, probar una solución candidata a través de análisis y pruebas automatizadas y reescribir proactivamente el código relacionado para eliminar toda la clase de vulnerabilidad, que abren un parche ascendente para su revisión? Google DeepMind presenta a CodeMender, un agente de IA que genera, valida y aguas arriba corriges para las vulnerabilidades del mundo real utilizando el razonamiento de “pensamiento profundo” de Gemini y un flujo de trabajo acuático con herramientas. En seis meses de implementación interna, CodeMender contribuyó con 72 parches de seguridad en proyectos de código abierto, incluidas las bases de código de hasta ~ 4.5m líneas, y está diseñado para actuar tanto reactivamente (parches de problemas conocidos) y de manera proactiva (reescribir código para eliminar las clases de vulnerabilidad).

Comprender la arquitectura

https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/?

Tuberías de validación y puerta humana

DeepMind enfatiza la validación automática antes de que cualquier humano toque un parche: el sistema prueba las correcciones de la causa raíz, la corrección funcional, la ausencia de regresiones y el cumplimiento del estilo; Solo se proponen parches de alta confianza para la revisión del mantenedor. Este flujo de trabajo está explícitamente vinculado al razonamiento centrado en la planificación de Gemini Deep Think sobre las huellas del depurador, los resultados de búsqueda de código y los resultados de las pruebas.

Endurecimiento proactivo: guardias a nivel de compilador

Más allá del parche, CodeMender aplica transformaciones de endurecimiento de seguridad a escala. Ejemplo: Inserción automatizada de las anotaciones de seguridad de CLANG en LibWebP para hacer cumplir las verificaciones de los límites a nivel de compilador, un enfoque que habría neutralizado la uplán de HEAP libeBP 2023 (CVE-2023-4863) explotadas en una cadena IOS cero y un amortiguador similar a los flusos de amortiguamiento similar donde se aplican anotaciones. Se aplican anotaciones.

Estudios de caso

Detalles de DeepMind dos soluciones no triviales: (1) Un bloqueo inicialmente marcado como un desbordamiento de montón rastreado para una gestión incorrecta de la pila XML; y (2) un error de por vida que requiere ediciones a un generador de código C personalizado. En ambos casos, los parches generados por el agente pasaron el análisis automatizado y una verificación de jueces LLM para la equivalencia funcional antes de la propuesta.

https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/?

El anuncio más amplio de Google enmarca Codemender como parte de una pila defensiva que incluye un nuevo programa de recompensa de vulnerabilidad de IA (consolidando recompensas relacionadas con la IA) y el Secure AI Framework 2.0 para la seguridad del agente. La publicación reitera la motivación: como escalas de descubrimiento de vulnerabilidad con IA (por ejemplo, a través de Bigsleep y OSS-Fuzz), la remediación automatizada debe escalar en conjunto.

Codemender operacionaliza Gemini Deep Think Plus Herramientas de análisis del programa (análisis estático/dinámico, confuso, SMT) para localizar las causas raíz y proponer parches que pasan la validación automatizada antes de la revisión humana. Datos tempranos informados: 72 correcciones de seguridad ascendentes en proyectos de código abierto durante seis meses, incluidas las bases de código en el orden de ~ 4.5M líneas. El sistema también aplica endurecimiento proactivo (p. Ej. Todavía no se publican puntos de referencia de latencia o rendimiento, por lo que el impacto se mide mejor mediante correcciones validadas y alcance del código endurecido.

Consulte los detalles técnicos. No dude en consultar nuestra página de GitHub para obtener tutoriales, códigos y cuadernos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro subreddit de 100k+ ml y suscribirse a nuestro boletín. ¡Esperar! ¿Estás en Telegram? Ahora también puedes unirte a nosotros en Telegram.

Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.

🙌 Siga a MarkTechPost: agrégenos como una fuente preferida en Google.