Screenshot 2024 03 01 At 9.13.42 Am.png

La capacidad de generar código automáticamente ha pasado de ser una idea incipiente a una herramienta práctica, que ayuda a los desarrolladores a crear aplicaciones de software complejas de manera más eficiente. Sin embargo, sigue existiendo una brecha entre la generación de código sintácticamente correcto y la posterior necesidad de su ejecución y refinamiento. Las metodologías actuales a menudo necesitan un refinamiento más dinámico del código en función de los resultados de la ejecución o la integración efectiva de la retroalimentación humana en el proceso de codificación. Esta limitación dificulta la aplicabilidad práctica del código.

Los LLM para código a menudo incluyen datos de código para entrenamiento previo, con diferentes proporciones para diferentes modelos. Los LLM especializados se han desarrollado específicamente para generar código. El ajuste de los LLM de propósito general para la generación de código permite explorar formas de mejorar las capacidades de generación de código. Los enfoques iterativos se utilizan comúnmente para mejorar la calidad de las tareas de generación de secuencias, incluida la generación de código, generando resultados iniciales y actualizándolos iterativamente con comentarios.

Un equipo de investigadores de la Comunidad de Investigación de Proyección de Arte Multimodal, la Universidad de Waterloo, el Instituto Allen de Inteligencia Artificial, HKUST e IN.AI Research ha presentado OpenCodeInterpreter. Este sistema de vanguardia está diseñado para cerrar la brecha entre la generación y ejecución de código, proporcionando una plataforma integral para generar, ejecutar y refinar código de forma iterativa. Con el respaldo del conjunto de datos CodeFeedback, OpenCodeInterpreter se destaca por incorporar comentarios de ejecución y conocimientos humanos en el proceso de refinamiento del código, mejorando la calidad y aplicabilidad del código generado.

La metodología de OpenCodeInterpreter se basa en la creación y utilización del conjunto de datos CodeFeedback, que abarca 68 000 interacciones de múltiples turnos entre usuarios, modelos de código y compiladores. Esta metodología facilita un ciclo fluido desde la generación del código hasta la ejecución y el refinamiento. Inicialmente, el sistema genera código adaptado a consultas específicas de los usuarios. Ejecuta el código, recopila comentarios de ejecución y conocimientos humanos para un refinamiento iterativo. Este proceso dinámico permite a OpenCodeInterpreter mejorar continuamente el código generado, garantizando que no solo cumpla sino que supere los requisitos iniciales al incorporar comentarios y diagnósticos del mundo real, redefiniendo así las capacidades de los sistemas automatizados de generación de código.

OpenCodeInterpreter presenta un rendimiento excepcional de generación de código de un solo giro y de múltiples giros, superando a modelos destacados como GPT-3.5/4-Turbo y CodeLlama-Python. Su incorporación única de datos de un solo turno de alta calidad refuerza significativamente las capacidades de interacción de múltiples turnos, mejoradas aún más por diversas fuentes de datos como el embalaje de un solo turno y la simulación de interacción. A través de estudios de casos prácticos, demuestra habilidad en el desarrollo de funciones, validación de direcciones e identificación de intersecciones de listas, aunque enfrenta desafíos con errores complejos y simultáneos.

En conclusión, OpenCodeInterpreter representa un desarrollo fundamental en el panorama de la codificación, ya que ofrece una poderosa herramienta que trasciende la generación de código tradicional. Al integrar capacidades de ejecución y refinamiento iterativo, allana el camino para un desarrollo de software más dinámico y eficiente. Esta innovación mejora la productividad de la codificación y democratiza el acceso a herramientas de codificación avanzadas, presagiando una nueva era en el desarrollo de software.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y noticias de Google. Unirse nuestro SubReddit de 38k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Canal de telegramas

También te puede gustar nuestro Cursos GRATUITOS de IA….


Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.