Meta AI presenta Meta LLM Compiler: un LLM de última generación que se basa en Code Llama con rendimiento mejorado para la optimización del código y el razonamiento del compilador

La ingeniería de software ha sido testigo de avances notables con el desarrollo de modelos de lenguajes grandes (LLM). Estos modelos, entrenados en extensos conjuntos de datos, han demostrado competencia en diversas tareas, incluida la generación, traducción y optimización de código. Los LLM se utilizan cada vez más para la optimización de compiladores, un proceso crítico que transforma el código fuente para mejorar el rendimiento y la eficiencia manteniendo la funcionalidad. Sin embargo, los métodos tradicionales de optimización de código suelen requerir mucha mano de obra y conocimientos especializados del lenguaje de programación de destino y la arquitectura de hardware subyacente, lo que plantea desafíos importantes a medida que el software crece en complejidad y escala.

El principal problema en el desarrollo de software es lograr una optimización eficiente del código en diversas arquitecturas de hardware. Esta complejidad se ve agravada por la naturaleza lenta de los métodos de optimización tradicionales, que exigen una gran experiencia. A medida que los sistemas de software se expanden, lograr un rendimiento óptimo se vuelve cada vez más difícil, lo que requiere herramientas y metodologías avanzadas que puedan manejar de manera eficaz las complejidades de las bases de código modernas.

Los enfoques para la optimización del código han empleado algoritmos de aprendizaje automático para guiar el proceso. Estos métodos implican representar el código en diversas formas, como gráficos o características numéricas, para facilitar la comprensión y la optimización por parte de los algoritmos. Sin embargo, estas representaciones a menudo necesitan detalles más críticos, lo que lleva a un rendimiento subóptimo. Si bien los LLM como Code Llama y GPT-4 se han utilizado para tareas menores de optimización, necesitan capacitación especializada para la optimización integral del compilador, lo que limita su efectividad en este dominio.

Los investigadores de Meta AI han presentado el Compilador de modelos de lenguaje meta de gran tamaño (compilador LLM), diseñado específicamente para tareas de optimización de código. Esta innovadora herramienta se basa en la base de Code Llama y se afina en un extenso conjunto de datos de 546 mil millones de tokens de representaciones intermedias (IR) de LLVM y código ensamblador. El equipo de Meta AI ha tenido como objetivo abordar las necesidades específicas de optimización del compilador aprovechando esta amplia capacitación, haciendo que el modelo esté disponible bajo una licencia comercial personalizada para facilitar un uso amplio por parte de investigadores académicos y profesionales de la industria.

El compilador LLM se somete a un sólido proceso de capacitación previa que involucra 546 mil millones de tokens de datos centrados en el compilador, seguido de instrucciones de ajuste fino de 164 mil millones de tokens para tareas posteriores, como el ajuste y el desmontaje de banderas. El modelo está disponible en 7 mil millones y 13 mil millones de parámetros. Este proceso de capacitación detallado permite que el modelo realice una optimización sofisticada del tamaño del código y convierta con precisión el código ensamblador nuevamente a LLVM-IR. Las etapas de capacitación incluyen comprender el código de entrada, aplicar varios pases de optimización y predecir el código y el tamaño optimizados resultantes. Este proceso de capacitación de varias etapas garantiza que LLM Compiler sea experto en manejar tareas complejas de optimización de manera eficiente.

El rendimiento del compilador LLM alcanza el 77% del potencial de optimización de los métodos de autoajuste tradicionales sin compilaciones extensas. El modelo alcanza una tasa de desmontaje de ida y vuelta del 45 % en la tarea de desmontaje, con una precisión de coincidencia exacta del 14 %. Estos resultados resaltan la efectividad del modelo para producir código optimizado y revertir con precisión el ensamblaje a su representación intermedia. En comparación con otros modelos como Code Llama y GPT-4 Turbo, LLM Compiler los supera significativamente en tareas específicas, lo que demuestra sus capacidades avanzadas en la optimización del compilador.

El aprovechamiento de una amplia formación sobre datos específicos de compiladores proporciona una solución escalable y rentable para investigadores académicos y profesionales de la industria. Esta innovación aborda los desafíos de la optimización de código y ofrece una herramienta eficaz para mejorar el rendimiento del software en diversas plataformas de hardware. La disponibilidad del modelo en dos tamaños, junto con sus sólidas métricas de rendimiento, subraya su potencial para revolucionar el enfoque de las tareas de optimización de compiladores.

En conclusión, Meta LLM Compiler es una herramienta innovadora en la optimización de código y compiladores. Al aprovechar las capacidades fundamentales de Code Llama y mejorarlas con capacitación especializada, LLM Compiler aborda desafíos críticos en el desarrollo de software. Su capacidad para optimizar el código de manera eficiente y sus impresionantes métricas de rendimiento lo convierten en un recurso valioso para investigadores y profesionales. Este modelo simplifica el proceso de optimización y establece un nuevo punto de referencia para futuros avances en el campo.


Revisar la Papel y Repo HFTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo.

Únete a nuestro Canal de telegramas y LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro SubReddit de más de 45.000 ml


🚀 Cree, edite y aumente datos tabulares con el primer sistema de IA compuesto, Gretel Navigator, ¡ahora disponible de forma generalizada! [Advertisement]


Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como empresario e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.