Google presenta la pila de agentes de IA de pila de código abierto utilizando Gemini 2.5 y Langgraph para la búsqueda, reflexión y síntesis de múltiples pasos

Introducción: la necesidad de asistentes dinámicos de investigación de IA

La IA conversacional ha evolucionado rápidamente más allá de los marcos de chatbot básicos. Sin embargo, la mayoría de los modelos de lenguaje grande (LLM) aún sufren una limitación crítica: generan respuestas basadas solo en datos de entrenamiento estático, sin la capacidad de autoinicionar las brechas de conocimiento o realizar la síntesis de información en tiempo real. Como resultado, estos modelos a menudo ofrecen respuestas incompletas o anticuadas, particularmente para temas de evolución o nicho.

Para superar estos problemas, los agentes de IA deben ir más allá de la consulta pasiva. Necesitan reconocer brechas informativas, realizar búsquedas en la web autónoma, validar los resultados y refinar las respuestas, imitando de manera efectiva a un asistente de investigación humana.

Agente de investigación completo de Google: Géminis 2.5 + Langgraph

Googleen colaboración con contribuyentes de Cara abrazada y otras comunidades de código abierto, ha desarrollado un Agente de investigación de pila completa pila diseñada para resolver este problema. Construido con un Reaccionar frontend y un Fastapi + backend de langgrapheste sistema combina la generación de idiomas con flujo de control inteligente y búsqueda web dinámica.

La pila de agentes de investigación utiliza el Géminis 2.5 API para procesar consultas de los usuarios, generando términos de búsqueda estructurados. Luego realiza ciclos recursivos de búsqueda y reflexión utilizando el API de búsqueda de Googleverificar si cada resultado responde suficientemente la consulta original. Este proceso iterativo continúa hasta que el agente genera una respuesta validada y bien citada.

Descripción general de la arquitectura: amigable para desarrolladores y extensible

Interfaz: Construido con VITE + reaccionarofreciendo recarga caliente y separación de módulos limpios.
Backend: Impulsado por Python (3.8+)Fastapi y Langgraph, habilitando el control de la decisión, los bucles de evaluación y el refinamiento de consulta autónoma.
Directorios clave: La lógica del agente reside en backend/src/agent/graph.pymientras que los componentes de la interfaz de usuario están estructurados bajo frontend/.
Configuración local: Requiere Node.js, Python y una llave de API de Géminis. Correr con make devo lanzar frontend/backend por separado.
Puntos finales:
- API de backend: http://127.0.0.1:2024
- Frontend ui: http://localhost:5173

Esta separación de las preocupaciones garantiza que los desarrolladores puedan modificar fácilmente el comportamiento del agente o la presentación de la interfaz de usuario, lo que hace que el proyecto sea adecuado para equipos de investigación globales y desarrolladores tecnológicos por igual.

Por qué es importante: un paso hacia la investigación en la web autónoma

Este sistema ilustra cómo razonamiento autónomo y Síntesis de búsqueda se puede integrar directamente en los flujos de trabajo LLM. El agente no solo responde, investiga, verifica y se adapta. Esto refleja un cambio más amplio en el desarrollo de la IA: desde los bots de preguntas y respuestas sin estado hasta Agentes de razonamiento en tiempo real.

El agente permite a los desarrolladores, investigadores y empresas en regiones como América del norte, Europa, Indiay Sudeste de Asia para implementar asistentes de investigación de IA con una configuración mínima. Al usar herramientas accesibles a nivel mundial como Fastapi, React y Gemini API, el proyecto está bien posicionado para una adopción generalizada.

Control de llave

🧠 Diseño del agente: El sistema modular React + Langgraph admite la generación y reflexión de consultas autónomas.
🔁 Razonamiento iterativo: El agente refina consultas de búsqueda hasta que se cumplen los umbrales de confianza.
🔗 Citas incorporadas: Las salidas incluyen enlaces directos a fuentes web para la transparencia.
⚙️ Listo para desarrollador: La configuración local requiere Node.js, Python 3.8+ y una tecla API Gemini.
🌐 Código abierto: Disponible públicamente para contribución y extensión de la comunidad.

Conclusión

Al combinar el Gemini 2.5 de Google con la orquestación lógica de Langgraph, este proyecto ofrece un avance en el razonamiento autónomo de IA. Muestra cómo los flujos de trabajo de investigación se pueden automatizar sin comprometer la precisión o la trazabilidad. A medida que evolucionan los agentes de conversación, sistemas como este establecen el estándar para herramientas de investigación inteligentes, confiables y de IA IA amigables para los desarrolladores.

Mira el Página de Github. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 99k+ ml de subreddit y suscribirse a Nuestro boletín.

Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.

Google presenta la pila de agentes de IA de pila de código abierto utilizando Gemini 2.5 y Langgraph para la búsqueda, reflexión y síntesis de múltiples pasos

ByEquipo de 7 minutos

Introducción: la necesidad de asistentes dinámicos de investigación de IA

Agente de investigación completo de Google: Géminis 2.5 + Langgraph

Descripción general de la arquitectura: amigable para desarrolladores y extensible

Lo más destacado y el rendimiento técnicos

Por qué es importante: un paso hacia la investigación en la web autónoma

Control de llave

Conclusión

By Equipo de 7 minutos

Related Post

Los 10 principales modelos físicos de IA que impulsarán a los robots del mundo real en 2026

Cómo Popsa utilizó Amazon Nova para inspirar a los clientes con sugerencias de títulos personalizados

Cómo construir un agente encarnado ligero, inspirado en la visión, el lenguaje y la acción, con modelado del mundo latente y control predictivo de modelos

You missed

¿Qué líneas de ayuda en inglés están disponibles en España?

Riddhima Kapoor Sahni debutará como actor con Daadi Ki Shaadi y revela el consejo de Ranbir Kapoor

El síndrome de ovario poliquístico también podría afectar a los hombres. Así es como

Las fotos de torturas en prisiones iraquíes conmocionaron a la nación