El rápido avance de los modelos de lenguajes grandes (LLM) ha despertado el interés entre los investigadores tanto del mundo académico como de la industria. Tanto las comunidades de procesamiento de lenguaje natural (NLP) como de bases de datos están explorando el potencial de los LLM para abordar la tarea NL2SQL de lenguaje natural a SQL, que implica convertir consultas de lenguaje natural en declaraciones SQL ejecutables consistentes con la intención del usuario.
Mientras miles de organizaciones aprovechan Business Intelligence (BI) para respaldar sus decisiones, los investigadores de la industria se han centrado en NL2BI, un escenario donde el lenguaje natural se transforma en consultas de BI. NL2BI permite a usuarios no expertos, como gerentes de producto o personal de operaciones, realizar análisis de datos, facilitando los procesos de toma de decisiones.
En el escenario NL2BI del lenguaje natural a la inteligencia empresarial, la interacción humana juega un papel fundamental, y a menudo involucra escenarios de diálogo de múltiples rondas (MRD) donde los usuarios participan en conversaciones iterativas para refinar las consultas. Los métodos NL2SQL existentes manejan principalmente consultas de diálogo de ronda única (SRD) y luchan con escenarios MRD. En consecuencia, la transición a consultas de BI complejas, como las comparaciones semana a semana, presenta desafíos para los enfoques NL2SQL existentes. Además, las diferencias en las estructuras de las tablas de datos entre los contextos de BI y SQL tradicional complican aún más el proceso de traducción.
Los investigadores se han centrado principalmente en mejorar los métodos NL2SQL, que se pueden clasificar en métodos pre-entrenados y de ajuste fino supervisado (SFT), LLM basados en ingeniería rápida y LLM específicamente capacitados para NL2SQL. Sin embargo, cuando se aplican a escenarios de BI del mundo real, estos métodos encuentran limitaciones, particularmente a la hora de abordar eficazmente las interacciones MRD. Persisten los desafíos para discernir con precisión entre consultas SRD y MRD y adaptar técnicas de ingeniería rápidas para adaptarse a escenarios MRD.
Los investigadores proponen soluciones novedosas adaptadas al escenario NL2BI para abordar estos desafíos. Introducen metodologías para manejar las interacciones MRD de manera efectiva y transformar la vinculación de esquemas en un problema de selección de vista única, aprovechando la tecnología de vista de base de datos. Además, abogan por un flujo de proceso por fases en la generación de consultas, enfatizando resultados intermedios estructurados para manejar semánticas complejas y relaciones de comparación de manera más efectiva.
El enfoque propuesto, denominado ChatBI, se implementa en entornos de producción y se integra en múltiples líneas de productos. Las evaluaciones comparativas con los métodos NL2SQL convencionales demuestran la superioridad de ChatBI en términos de precisión y eficiencia. Al abordar los desafíos únicos de los escenarios NL2BI y aprovechar los resultados intermedios estructurados, ChatBI representa un avance significativo en la generación de consultas de BI basadas en lenguaje natural, facilitando mejores procesos de toma de decisiones para usuarios no expertos.
Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Únete a nuestro Canal de telegramas, Canal de discordiay LinkedIn Grarriba.
Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..
No olvides unirte a nuestro SubReddit de 42k+ ML
Arshad es pasante en MarktechPost. Actualmente cursa su carrera internacional. Maestría en Física del Instituto Indio de Tecnología Kharagpur. Comprender las cosas hasta el nivel fundamental conduce a nuevos descubrimientos que conducen al avance de la tecnología. Le apasiona comprender la naturaleza fundamentalmente con la ayuda de herramientas como modelos matemáticos, modelos de aprendizaje automático e inteligencia artificial.