Los rápidos avances en las tecnologías de motores de búsqueda integrados con modelos de idiomas grandes (LLM) han favorecido predominantemente soluciones patentadas como la vista previa de búsqueda GPT-4O de Google y la sonda de Perplexity Raonaling Pro. Si bien estos sistemas patentados ofrecen un rendimiento sólido, su naturaleza de código cerrado plantea desafíos significativos, particularmente en relación con la transparencia, la innovación y la colaboración comunitaria. Esta exclusividad limita la personalización y obstaculiza el compromiso académico y empresarial más amplio con la IA mejorada con la búsqueda.
En respuesta a estas limitaciones, los investigadores de la Universidad de Washington, la Universidad de Princeton y UC Berkeley han introducido Abierto de búsqueda profunda (ODS), un marco de IA de búsqueda de código abierto diseñado para una integración perfecta con cualquier LLM seleccionada por el usuario de manera modular. ODS comprende dos componentes centrales: la herramienta de búsqueda abierta y el agente de razonamiento abierto. Juntos, estos componentes mejoran sustancialmente las capacidades de la base LLM al mejorar la recuperación de contenido y la precisión del razonamiento.
La herramienta de búsqueda abierta se distingue a través de una tubería de recuperación avanzada, con un método de reformulación de consulta inteligente que captura mejor la intención del usuario al generar múltiples consultas semánticamente relacionadas. Este enfoque mejora notablemente la precisión y diversidad de los resultados de búsqueda. Además, la herramienta emplea técnicas refinadas de fragmentación y reanicación para filtrar sistemáticamente los resultados de búsqueda de acuerdo con la relevancia. Complementando el componente de recuperación, el agente de razonamiento abierto opera a través de dos metodologías distintas: el agente React de cadena de pensamiento y el agente CodeAct de cadena de código. Estos agentes interpretan consultas de usuarios, administran el uso de la herramienta, incluidas las búsquedas y los cálculos, y producen respuestas integrales y contextualmente precisas.
Las evaluaciones empíricas subrayan la efectividad de los ODS. Integrado con Deepseek-R1, un modelo de razonamiento de código abierto avanzado, ODS-V2 logra una precisión del 88.3% en el SimpleQA Benchmark y el 75.3% en el punto de referencia de Frames. Esta actuación supera notablemente alternativas propietarias, como el Pro Razonor Pro Razoning Pro de Perplexity, que obtiene 85.8% y 44.4% en estos puntos de referencia, respectivamente. En comparación con la vista previa de búsqueda GPT-4O de OpenAI, ODS-V2 muestra una ventaja significativa en el punto de referencia de marcos, logrando una precisión 9.7% mayor. Estos resultados ilustran la capacidad de ODS para ofrecer un rendimiento competitivo y en áreas específicas superiores, en relación con los sistemas propietarios.
Una característica importante de ODS es su uso adaptativo de herramientas, como lo demuestra la toma de decisiones estratégicas con respecto a las búsquedas web adicionales. Para consultas directas, como se observa en SimpleQA, ODS minimiza las búsquedas adicionales, lo que demuestra la utilización eficiente de los recursos. Por el contrario, para consultas complejas de múltiples saltos, como en el punto de referencia de marcos, ODS aumenta adecuadamente su uso de búsquedas en la web, ejemplificando así la gestión inteligente de recursos adaptada a la complejidad de consultas.
En conclusión, Open Deep Search representa un avance notable hacia la democratización de la IA mejorada para la búsqueda al proporcionar un marco de código abierto compatible con diversos LLM. Fomenta la innovación y la transparencia dentro de la comunidad de investigación de IA y apoya una participación más amplia en el desarrollo de capacidades sofisticadas de búsqueda y razonamiento. Al integrar efectivamente las técnicas de recuperación avanzada con metodologías de razonamiento adaptativo, ODS contribuye de manera significativa al desarrollo de IA de código abierto, estableciendo un estándar robusto para la exploración futura en modelos de lenguaje grande integrados en la búsqueda.
Verificar el Papel y Página de Github. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 85k+ ml de subreddit.
Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.