DLAP: un marco de estímulo de LLM aumentado de aprendizaje profundo para la detección de vulnerabilidades de software

La detección de vulnerabilidades de software es un campo crítico centrado en salvaguardar la seguridad del sistema y la privacidad del usuario mediante la identificación de fallas de seguridad en los sistemas de software. Garantizar que los sistemas de software estén seguros contra posibles ataques es crucial ante amenazas cibernéticas cada vez más sofisticadas. La aplicación de tecnologías avanzadas de inteligencia artificial, en particular modelos de lenguajes grandes (LLM) y aprendizaje profundo, se ha vuelto fundamental para mejorar la detección de vulnerabilidades de software.

El desafío principal en la detección de vulnerabilidades de software radica en identificar con precisión las vulnerabilidades en sistemas de software cada vez más complejos para evitar posibles infracciones. Los métodos tradicionales de detección de vulnerabilidades, como las herramientas de análisis estático y los modelos basados en aprendizaje automático, a menudo producen altas tasas de falsos positivos y no pueden seguir el ritmo de las amenazas en continua evolución. Las herramientas existentes están limitadas por su dependencia de patrones o conjuntos de datos predefinidos, lo que genera imprecisiones y vulnerabilidades pasadas por alto.

La investigación actual sobre detección de vulnerabilidades de software incluye marcos como GRACE y modelos basados en ChatGPT que aprovechan el aprendizaje profundo y los LLM para una mejor precisión de detección. Estos enfoques integran la ingeniería rápida con modelos basados en aprendizaje automático y utilizan una guía de cadena de pensamiento para mejorar las capacidades de detección. Sin embargo, los marcos existentes a menudo necesitan ayuda con altas tasas de falsos positivos y una adaptabilidad limitada, lo que destaca la necesidad de soluciones más sofisticadas en la detección de vulnerabilidades.

Investigadores de la Universidad de Nanjing, China, y la Universidad Southern Cross, Australia, han presentado DLAP, un marco que se destaca por su combinación de LLM, aprendizaje profundo e ingeniería rápida. DLAP refina la detección de vulnerabilidades a través de una taxonomía jerárquica y una guía de cadena de pensamiento (COT), lo que le permite guiar a los LLM con precisión. Utiliza indicaciones personalizadas adaptadas a categorías específicas para ayudar a los modelos a comprender y detectar vulnerabilidades complejas de manera efectiva, abordando las limitaciones de las herramientas tradicionales.

El marco DLAP aprovecha herramientas de análisis estático y modelos de aprendizaje profundo para crear indicaciones que mejoren los LLM. Evaluado en un conjunto de datos de más de 40.000 ejemplos de cuatro importantes proyectos de software, DLAP integra resultados de análisis estáticos con LLM para un análisis semántico y lógico en profundidad. El marco emplea orientación COT para mejorar la precisión inmediata, lo que permite una identificación eficiente de las vulnerabilidades del software. Esta integración de metodologías permite a DLAP detectar vulnerabilidades de código y minimizar los falsos positivos con precisión.

Los cuatro conjuntos de datos en los que se probó DLAP fueron: Chrome, Android, Linux y Qemu, cada uno de los cuales comprende miles de funciones y vulnerabilidades. En comparación con otros métodos, DLAP logró puntuaciones F1 hasta un 10 % más altas y un coeficiente de correlación de Matthews (MCC) un 20 % más alto. Para Chrome, DLAP alcanzó un 40,4 % de precisión y un 73,3 % de recuperación, con puntuaciones F1 de 52,1 % para Chrome, 49,3 % para Android, 65,4 % para Linux y 66,7 % para Qemu, lo que demuestra su rendimiento sólido y consistente en diversos conjuntos de datos.

Para concluir, la investigación introdujo el marco DLAP, que combina aprendizaje profundo y LLM para una detección eficaz de vulnerabilidades de software. Al utilizar indicaciones especializadas y una guía de cadena de pensamiento, DLAP mejora la precisión de la detección y la recuperación al tiempo que reduce los falsos positivos. Su rendimiento en cuatro grandes conjuntos de datos demostró una precisión superior en comparación con los métodos existentes, destacando su importante potencial para mejorar las prácticas de ciberseguridad. La investigación subraya la importancia de los enfoques innovadores para abordar las vulnerabilidades de software en evolución, ofreciendo una herramienta confiable para la seguridad del software.

Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Únete a nuestro Canal de telegramas, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro SubReddit de 41k+ ML

Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.

✅ [FREE AI WEBINAR Alert] Prueba de comparación de RAG en vivo: Pinecone vs Mongo vs Postgres vs SingleStore: 9 de mayo de 2024 de 10:00 a. m. a 11:00 a. m. PDT

DLAP: un marco de estímulo de LLM aumentado de aprendizaje profundo para la detección de vulnerabilidades de software

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Una implementación de codificación en Phi-4-Mini de Microsoft para la herramienta de razonamiento de inferencia cuantificada utiliza el ajuste fino RAG y LoRA

Una implementación de codificación en Qwen 3.6-35B-A3B que cubre inferencia multimodal, control de pensamiento, llamada de herramientas, enrutamiento MoE, RAG y persistencia de sesión

Moonshot AI lanza Kimi K2.6 con codificación de horizonte largo, enjambre de agentes ampliado a 300 subagentes y 4000 pasos coordinados

You missed

DESI supera las expectativas con el mapa 3D más grande del universo, examinando más de 47 millones de galaxias

Trump respalda el impulso del nacionalismo cristiano con una lectura poco convincente de la Biblia

OPPO abre inscripciones para los OPPO Photography Awards 2026 y presenta la nueva categoría “Súper vídeo” y programas que apoyan a jóvenes creadores

El auge de las economías gamificadas en las finanzas modernas ⋆ Madrid Metropolitan