DLAP: un marco de estímulo de LLM aumentado de aprendizaje profundo para la detección de vulnerabilidades de software

La detección de vulnerabilidades de software es un campo crítico centrado en salvaguardar la seguridad del sistema y la privacidad del usuario mediante la identificación de fallas de seguridad en los sistemas de software. Garantizar que los sistemas de software estén seguros contra posibles ataques es crucial ante amenazas cibernéticas cada vez más sofisticadas. La aplicación de tecnologías avanzadas de inteligencia artificial, en particular modelos de lenguajes grandes (LLM) y aprendizaje profundo, se ha vuelto fundamental para mejorar la detección de vulnerabilidades de software.

El desafío principal en la detección de vulnerabilidades de software radica en identificar con precisión las vulnerabilidades en sistemas de software cada vez más complejos para evitar posibles infracciones. Los métodos tradicionales de detección de vulnerabilidades, como las herramientas de análisis estático y los modelos basados ​​en aprendizaje automático, a menudo producen altas tasas de falsos positivos y no pueden seguir el ritmo de las amenazas en continua evolución. Las herramientas existentes están limitadas por su dependencia de patrones o conjuntos de datos predefinidos, lo que genera imprecisiones y vulnerabilidades pasadas por alto.

La investigación actual sobre detección de vulnerabilidades de software incluye marcos como GRACE y modelos basados ​​en ChatGPT que aprovechan el aprendizaje profundo y los LLM para una mejor precisión de detección. Estos enfoques integran la ingeniería rápida con modelos basados ​​en aprendizaje automático y utilizan una guía de cadena de pensamiento para mejorar las capacidades de detección. Sin embargo, los marcos existentes a menudo necesitan ayuda con altas tasas de falsos positivos y una adaptabilidad limitada, lo que destaca la necesidad de soluciones más sofisticadas en la detección de vulnerabilidades.

Investigadores de la Universidad de Nanjing, China, y la Universidad Southern Cross, Australia, han presentado DLAP, un marco que se destaca por su combinación de LLM, aprendizaje profundo e ingeniería rápida. DLAP refina la detección de vulnerabilidades a través de una taxonomía jerárquica y una guía de cadena de pensamiento (COT), lo que le permite guiar a los LLM con precisión. Utiliza indicaciones personalizadas adaptadas a categorías específicas para ayudar a los modelos a comprender y detectar vulnerabilidades complejas de manera efectiva, abordando las limitaciones de las herramientas tradicionales.

El marco DLAP aprovecha herramientas de análisis estático y modelos de aprendizaje profundo para crear indicaciones que mejoren los LLM. Evaluado en un conjunto de datos de más de 40.000 ejemplos de cuatro importantes proyectos de software, DLAP integra resultados de análisis estáticos con LLM para un análisis semántico y lógico en profundidad. El marco emplea orientación COT para mejorar la precisión inmediata, lo que permite una identificación eficiente de las vulnerabilidades del software. Esta integración de metodologías permite a DLAP detectar vulnerabilidades de código y minimizar los falsos positivos con precisión.

Los cuatro conjuntos de datos en los que se probó DLAP fueron: Chrome, Android, Linux y Qemu, cada uno de los cuales comprende miles de funciones y vulnerabilidades. En comparación con otros métodos, DLAP logró puntuaciones F1 hasta un 10 % más altas y un coeficiente de correlación de Matthews (MCC) un 20 % más alto. Para Chrome, DLAP alcanzó un 40,4 % de precisión y un 73,3 % de recuperación, con puntuaciones F1 de 52,1 % para Chrome, 49,3 % para Android, 65,4 % para Linux y 66,7 % para Qemu, lo que demuestra su rendimiento sólido y consistente en diversos conjuntos de datos.

Para concluir, la investigación introdujo el marco DLAP, que combina aprendizaje profundo y LLM para una detección eficaz de vulnerabilidades de software. Al utilizar indicaciones especializadas y una guía de cadena de pensamiento, DLAP mejora la precisión de la detección y la recuperación al tiempo que reduce los falsos positivos. Su rendimiento en cuatro grandes conjuntos de datos demostró una precisión superior en comparación con los métodos existentes, destacando su importante potencial para mejorar las prácticas de ciberseguridad. La investigación subraya la importancia de los enfoques innovadores para abordar las vulnerabilidades de software en evolución, ofreciendo una herramienta confiable para la seguridad del software.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Únete a nuestro Canal de telegramas, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro SubReddit de 41k+ ML


Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.