Screenshot 2024 07 21 At 8.29.49 Pm.png

Las capacidades semánticas de los modelos de lenguaje modernos ofrecen el potencial para realizar análisis y razonamientos avanzados sobre amplios corpus de conocimiento. Sin embargo, los sistemas actuales necesitan abstracciones de mayor nivel para consultas semánticas a gran escala. Las tareas complejas, como resumir investigaciones recientes, extraer información biomédica o analizar transcripciones comerciales internas, requieren un procesamiento y razonamiento de datos sofisticados. Los métodos existentes, como la generación aumentada por recuperación (RAG), se limitan a búsquedas simples y no admiten patrones de consulta más complejos.

Investigadores de la Universidad de Stanford (EE. UU.) y de la Universidad de California en Berkeley han desarrollado operadores semánticos, una interfaz de programación declarativa que mejora el modelo relacional con operaciones impulsadas por IA para consultas semánticas sobre conjuntos de datos. Estos operadores se implementan en LOTUS, un motor de consultas de código abierto con una API similar a Pandas, que permite la creación de canales de consultas eficientes y expresivos. LOTUS ha demostrado ser eficaz en varias aplicaciones, incluida la verificación de datos, la clasificación de múltiples etiquetas y la búsqueda, y ha logrado mejoras significativas en la precisión y el tiempo de ejecución. Por ejemplo, en la verificación de datos del conjunto de datos FEVER, los programas LOTUS aumentan la precisión hasta en un 9,5 % y reducen el tiempo de ejecución entre 7 y 34 veces en comparación con los canales de última generación actuales.

Varios trabajos anteriores han ampliado los lenguajes relacionales con operaciones basadas en LM para tareas especializadas. Por ejemplo, Palimpzest ofrece un enfoque declarativo para la limpieza de datos y las tareas ETL, introduciendo un operador de conversión para la extracción de entidades y un filtro basado en IA. SUQL extiende SQL para admitir agentes conversacionales con nuevos operadores para responder preguntas y resumir datos. ZenDB y EVAPORATE se centran en la extracción de documentos semiestructurados en tablas estructuradas. Por el contrario, LOTUS proporciona un modelo de programación de propósito general con operadores semánticos componibles para diversas aplicaciones. Admite patrones de consulta complejos, incluidas uniones, agregación, clasificación y funciones de búsqueda, más allá de las capacidades de las UDF LLM por filas.

El modelo de programación LOTUS permite a los desarrolladores crear canales de consulta impulsados ​​por IA para procesar grandes conjuntos de datos estructurados y no estructurados. Amplía el modelo relacional con operadores semánticos, lo que mejora la funcionalidad a través de una API creada en Pandas. Estos operadores incluyen `sem_filter` para filtrar, `sem_join` para unir tablas, `sem_sim_join` para uniones de similitud y otros para agregación, clasificación y agrupamiento. LOTUS admite expresiones de lenguaje natural (langex) para especificar estas operaciones, lo que permite una programación intuitiva y declarativa. El modelo incorpora técnicas de optimización como inferencia por lotes, cascadas de modelos e índices de similitud semántica para manejar consultas complejas y mejorar el rendimiento de manera eficiente.

La evaluación de LOTUS se centra en su programabilidad y eficiencia en tres aplicaciones: verificación de datos, clasificación extrema de múltiples etiquetas y búsqueda y clasificación. Cada aplicación demuestra que se pueden lograr resultados de vanguardia con una sobrecarga de desarrollo mínima utilizando programas LOTUS. Por ejemplo, LOTUS puede reproducir y mejorar la precisión de un flujo de trabajo de verificación de datos reciente en un 9,5 %, al tiempo que reduce significativamente el tiempo de ejecución. LOTUS logra un rendimiento hasta 800 veces más rápido en la clasificación extrema de múltiples etiquetas que los métodos tradicionales. En búsqueda y clasificación, LOTUS supera a otros métodos en nDCG@10 en hasta un 49,4 %, al mismo tiempo que es más rápido. Los experimentos se llevaron a cabo utilizando varios modelos y configuraciones, incluidos los modelos Llama 3 en 4 GPU A100.

En conclusión, el estudio introduce operadores semánticos, proporcionando la primera interfaz declarativa de propósito general para el procesamiento semántico masivo. Implementados en el sistema LOTUS, estos operadores extienden el modelo relacional, permitiendo la composición sencilla de secuencias de consultas basadas en razonamiento avanzado sobre grandes conjuntos de datos. LOTUS demuestra su eficacia en aplicaciones como verificación de hechos, clasificación extrema de múltiples etiquetas y búsqueda, mostrando la expresividad de su modelo de programación y la baja sobrecarga de desarrollo. Por ejemplo, LOTUS mejora la precisión en un 9,5 % en el conjunto de datos FEVER y reduce significativamente el tiempo de ejecución. LOTUS logra resultados de vanguardia con ganancias de eficiencia sustanciales en tareas de clasificación y búsqueda de múltiples etiquetas, destacando sus capacidades de optimización y su potencial para realizar análisis enriquecidos sobre vastos corpus de conocimiento.


Revisar la Papel y GitHub. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Subreddit de más de 46 000 millones de usuarios

Encuentra lo próximo Seminarios web sobre IA aquí


Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en el IIT Madrás, es un apasionado de la aplicación de la tecnología y la IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una perspectiva nueva a la intersección de la IA y las soluciones de la vida real.