VulScribeR: un enfoque basado en un modelo de lenguaje amplio para generar ejemplos de código vulnerable diversos y realistas

En ingeniería de software, detectar vulnerabilidades en el código es una tarea crucial que garantiza la seguridad y confiabilidad de los sistemas de software. Si no se controlan, las vulnerabilidades pueden provocar importantes violaciones de seguridad, comprometiendo la integridad del software y los datos que maneja. Con el paso de los años, el desarrollo de herramientas automatizadas para detectar estas vulnerabilidades ha adquirido cada vez mayor importancia, en particular a medida que los sistemas de software se vuelven más complejos e interconectados.

Un desafío importante en el desarrollo de estas herramientas automatizadas es la falta de conjuntos de datos amplios y diversos necesarios para entrenar eficazmente los modelos de detección de vulnerabilidades basados en aprendizaje profundo (DLVD). Sin datos suficientes, estos modelos tienen dificultades para identificar y generalizar con precisión diferentes tipos de vulnerabilidades. Este problema se agrava por el hecho de que los métodos existentes para generar muestras de código vulnerable suelen tener un alcance limitado, se centran en tipos específicos de vulnerabilidades y requieren conjuntos de datos grandes y bien seleccionados para ser efectivos.

Tradicionalmente, los métodos para generar código vulnerable se han basado en métodos como la mutación y la inyección. La mutación implica alterar muestras de código vulnerable para crear otras nuevas, manteniendo la funcionalidad del código a la vez que se introducen ligeras variaciones. Por el contrario, la inyección implica insertar segmentos de código vulnerable en código limpio para generar nuevas muestras. Si bien estos métodos han demostrado ser prometedores, a menudo tienen limitaciones para generar vulnerabilidades diversas y complejas, que son cruciales para entrenar modelos DLVD robustos.

Investigadores de la Universidad de Manitoba y la Universidad Estatal de Washington introdujeron un nuevo enfoque llamado VulScribeR, diseñado para abordar estos desafíos. VulScribeR emplea modelos de lenguaje grandes (LLM) para generar muestras de código vulnerable diversas y realistas a través de tres estrategias: mutación, inyección y extensión. Este enfoque aprovecha técnicas avanzadas como la generación aumentada por recuperación (RAG) y la agrupación para mejorar la diversidad y la relevancia de las muestras generadas, lo que las hace más efectivas para el entrenamiento de modelos DLVD.

La metodología detrás de VulScribeR es sofisticada y bien estructurada. La estrategia de mutación solicita al LLM que modifique muestras de código vulnerables, asegurando que los cambios no alteren la funcionalidad original del código. La estrategia de inyección implica recuperar muestras de código vulnerable y limpio similares, y el LLM inyecta la lógica vulnerable en el código limpio para crear nuevas muestras. La estrategia de extensión lleva esto un paso más allá al incorporar partes de código limpio en muestras ya vulnerables, mejorando así la diversidad contextual de las vulnerabilidades. Para garantizar la calidad del código generado, un analizador difuso filtra las muestras no válidas o sintácticamente incorrectas.

En términos de rendimiento, VulScribeR ha demostrado mejoras significativas con respecto a los métodos existentes. La estrategia de inyección, por ejemplo, superó a varios enfoques de referencia, incluidos NoAug, VulGen, VGX y ROS, con mejoras en la puntuación F1 del 30,80 %, 27,48 %, 27,93 % y 15,41 %, respectivamente, al generar un promedio de 5000 muestras vulnerables. Cuando se amplió a 15 000 muestras, la estrategia de inyección logró resultados aún más impresionantes, superando las mismas líneas de base en un 53,84 %, 54,10 %, 69,90 % y 40,93 %. Estos resultados subrayan la eficacia de VulScribeR a la hora de generar conjuntos de datos diversos y de alta calidad que mejoran significativamente el rendimiento de los modelos DLVD.

El éxito de VulScribeR destaca la importancia de la ampliación de datos a gran escala en el campo de la detección de vulnerabilidades. Al generar muestras de código vulnerable diversas y realistas, este enfoque proporciona una solución práctica al problema de escasez de datos que ha obstaculizado durante mucho tiempo el desarrollo de modelos DLVD efectivos. El uso innovador de LLM por parte de VulScribeR, combinado con técnicas avanzadas de ampliación de datos, representa un avance significativo en el campo, allanando el camino para herramientas de detección de vulnerabilidades más efectivas y escalables en el futuro.

Echa un vistazo a la PapelTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit de más de 48 000 millones de usuarios

Encuentra lo próximo Seminarios web sobre IA aquí

Nikhil es consultor en prácticas en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA y el aprendizaje automático que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de los materiales, está explorando nuevos avances y creando oportunidades para contribuir.

VulScribeR: un enfoque basado en un modelo de lenguaje amplio para generar ejemplos de código vulnerable diversos y realistas

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Conozca Harness-1: un subagente de recuperación 20B capacitado con aprendizaje por refuerzo dentro de un arnés de búsqueda con estado en gpt-oss-20b

La nueva CLI Colab de Google permite a los desarrolladores y agentes de IA ejecutar Python en GPU y TPU Colab remotas desde la terminal

Tutorial de Microsoft Fara: ejecute un agente de uso del navegador en Google Colab con un punto final simulado compatible con OpenAI

You missed

Arquitecto de la economía de agentes en el fútbol

Lo que ella realmente está diciendo – Hollywood Life

13 consejos para empacar con conciencia ambiental para sus próximas vacaciones

Trump se aferra a los fondos arancelarios y aún podría darles su dinero a los J6ers