Cómo crear agentes con GPT-5

discutiré cómo construir sistemas agentes usando GPT-5 de OpenAI. Recientemente hablé sobre cómo usar GPT-5 de manera efectiva y hoy continuaré mi cobertura de GPT-5 analizando cómo utilizar GPT de manera efectiva como agente. Tener agentes con herramientas disponibles en su aplicación pronto será un requisito básico del usuario para la mayoría de las aplicaciones de IA, por lo que debe comenzar a implementarlo lo antes posible.

Cubriré cómo puede utilizar GPT-5 como un poderoso modelo de respuesta a preguntas al permitirle acceder a sus datos y brindarle herramientas útiles para responder las consultas de los usuarios. Este artículo pretende ser una descripción general de alto nivel de las posibilidades que tiene para utilizar GPT-5 como agente. No estoy patrocinado por OpenAI.

Esta infografía destaca los contenidos principales de este artículo. Analizaré cómo usar GPT-5 como agente de IA y cubriré temas como por qué necesita un agente de IA, almacenamiento vectorial, herramientas personalizadas y el SDK de agentes de OpenAI. Imagen de ChatGPT.

¿Por qué utilizar GPT-5 como agente?

Siempre que esté considerando implementar un sistema como tener GPT-5 como agente, siempre es importante pensar en el por qué. Necesita saber por qué lo está implementando y qué problema está tratando de resolver. Algunos problemas en los que podría estar trabajando son:

Acceso a la base de conocimientos interna Agente de codificación Automatizar flujos de trabajo

Todas estas son razones válidas para implementar un sistema agente, y GPT-5 con herramientas puede ayudar a lograrlas todas.

La razón principal por la que elegí utilizar GPT-5 para mi agente es que normalmente trabajo con un corpus de documentos y OpenAI tiene un ecosistema integrado que es muy útil para resolver los problemas que intento resolver: Responder consultas de los usuarios, dado un corpus de información.

A lo largo de las diferentes secciones de este artículo, cubriré algunas herramientas diferentes que están disponibles en OpenAI. Tenga en cuenta que existen muchas alternativas que son más baratas o más adecuadas para su caso de uso. Gemini de Google me viene a la mente como una plataforma que esencialmente tiene paridad de características con OpenAI, y definitivamente es una alternativa que debes considerar. Además, existe una gran cantidad de herramientas de código abierto.

Acceso RAG a los datos.

RAG es un enfoque poderoso para obtener acceso a sus datos. Normalmente, RAG se ha realizado fragmentando e incrustando sus propios datos antes de enviarlos a una base de datos vectorial como Pinecone. Sin embargo, ahora existen excelentes alternativas que esencialmente ofrecen servicios RAG administrados. Tanto OpenAI como Gemini ofrecen una API para cargar archivos, donde fragmentan e incrustan sus archivos automáticamente, haciéndolos accesibles a través de una simple llamada API. Esto proporciona un acceso súper simple a sus datos. Puede encontrar detalles en esta página API. Parte del código de ejemplo que mostraré también será de esta página.

Después de haber cargado sus documentos y haberlos colocado en un almacenamiento vectorial, puede, por ejemplo, realizar una búsqueda vectorial para encontrar documentos relevantes con:

user_query = “¿Cuándo es nuestro último acuerdo de gestión de datos?” resultados = cliente.vector_stores.search (vector_store_id =, consulta = consulta_usuario,)

Esto devolverá una serie de documentos y fragmentos específicos de esos documentos, similar a lo que hace Pinecone. Luego puede proceder a utilizar estos fragmentos para responder las consultas de los usuarios.

Sin embargo, puede hacer que el almacenamiento vectorial sea aún más potente proporcionando acceso GPT-5 a través de una herramienta.

from openai import OpenAI client = OpenAI(api_key=””) respuesta = client.responses.create( model=”gpt-5″, input=”¿Cuándo es nuestro último acuerdo de gestión de datos?”, herramientas=[{
“type”: “file_search”,
“vector_store_ids”: [“”]
}])

Esto es mucho más poderoso porque ahora ha puesto el almacenamiento vectorial a disposición de GPT-5 a través de una herramienta. Cuando ahora ingresa la consulta del usuario, GPT-5 decide si necesita o no usar la herramienta para responder la consulta del usuario. Si decide que necesita utilizar la herramienta, GPT-5 hace lo siguiente:

Razones sobre qué herramientas o almacenamiento vectorial tiene disponible y cuáles utilizar. Reescribe consultas: escribe 5 versiones diferentes del mensaje de usuario, pero optimizadas para encontrar información relevante con RAG. Activa los 5 mensajes en paralelo y recupera los documentos más relevantes. Determina si tiene suficiente información para responder la consulta del usuario. En caso afirmativo, responde a la consulta del usuario. Si no, puede buscar más en los almacenamientos de vectores.

Esta es una forma súper fácil y poderosa de obtener acceso a sus datos, y OpenAI esencialmente maneja toda la complejidad con:

Fragmentar e incrustar documentos Decidir cuándo realizar una búsqueda vectorial Reescribir consultas Determinar documentos relevantes en función de la similitud con las consultas Decidir si tiene suficiente información para responder la consulta del usuario Responder a la consulta del usuario

Gemini también creó recientemente un sistema RAG administrado con su API de archivos, que esencialmente ofrece el mismo servicio.

Uso de la herramienta GPT-5

En la sección anterior, hablé de la herramienta de almacenamiento vectorial que puede poner a disposición de GPT-5. Sin embargo, también puede poner cualquier otra herramienta a disposición de GPT-5. Un ejemplo clásico es proporcionar acceso GPT-5 a una herramienta get_weather, para que pueda acceder al clima actual. El ejemplo actual proviene de los documentos de OpenAI.

desde openai importar cliente OpenAI = herramientas OpenAI() = [
{
“type”: “function”,
“name”: “get_weather”,
“description”: “Get current temperature for a given location.”,
“parameters”: {
“type”: “object”,
“properties”: {
“location”: {
“type”: “string”,
“description”: “City and country e.g. Bogotá, Colombia”,
}
},
“required”: [“location”]”additionalProperties”: False, }, “strict”: True, }, ]respuesta = client.responses.create( model=”gpt-5″, input=[
{“role”: “user”, “content”: “What is the weather like in Paris today?”},
]herramientas=herramientas, )

Ahora necesita determinar qué herramientas debe poner a disposición de su agente, para que pueda responder mejor a las consultas que le proporcionará. Por ejemplo:

Si está trabajando con bases de conocimiento externas, debe tener disponible una herramienta para buscar en estas bases de conocimiento e informar al modelo cuándo usar la herramienta Herramienta de ejecución de Python: puede darle al modelo una herramienta para ejecutar código Python y ver el resultado con la herramienta Calculadora: en lugar de que el LLM realice los cálculos por sí mismo (lo cual es ineficiente y propenso a errores), puede proporcionarle una herramienta de calculadora para ejecutar cálculos.

Etcétera. La parte importante aquí es que le brinde al agente la mejor oportunidad posible para responder las consultas de los usuarios. Sin embargo, también es fácil cometer el error de poner a disposición demasiadas herramientas. Es importante que siga las pautas generales para brindar herramientas a su agente, asegurando:

Las herramientas siempre están bien descritas. Las herramientas no son ambiguas: siempre debe quedar claro para el modelo (y para cualquier persona que lea una herramienta) cuándo se debe utilizar una herramienta y cuándo no. Superposición mínima entre herramientas.

Cubrí el tema de las herramientas de agentes de IA con más profundidad en mi artículo anterior sobre Cómo crear herramientas para agentes de IA.

Al definir herramientas para GPT-5, también puede proporcionar pautas sobre si una herramienta es necesaria o no. Una herramienta necesaria podría ser la búsqueda de almacenamiento vectorial, donde se fuerza al modelo a buscar la consulta vectorial para cada solicitud del usuario, garantizando que las respuestas siempre se basen en el corpus del documento. Sin embargo, la función get_weather normalmente debería ser una función opcional, considerando que la función solo debe invocarse cuando un usuario pregunta sobre el clima.

También puedes fabricar herramientas utilizando conectores. Los conectores son esencialmente herramientas que dan acceso a otras aplicaciones, como:

Esto permite a GPT, por ejemplo, enumerar sus correos electrónicos, buscar hilos específicos en Slack, consultar diseños en Figma o buscar código en GitHub.

Paquete de agentes

También vale la pena mencionar que OpenAI creó un SDK de agentes al que puede acceder a través de Python o TypeScript. El SDK de agentes es útil para escenarios de creación de agentes más complejos, en los que es necesario:

Hacer que el agente realice acciones complejas y encadenadas. Mantener el contexto entre tareas.

Puede, por ejemplo, crear agentes específicos, que se especialicen en determinadas tareas (obtener información, resumir información, etc.) y crear un agente orquestador que responda a las solicitudes de los usuarios, active subagentes para buscar y resumir información, determine si tiene suficiente información y luego responda al usuario.

Existen muchos SDK de agentes similares, lo que hace que crear su propio agente sea bastante sencillo. Algunas otras buenas alternativas son:

Kit de desarrollo del agente LangGraph CrewAI

Todos estos paquetes tienen el mismo propósito de hacer que los agentes de IA sean más fáciles de crear y, por lo tanto, más accesibles.

Conclusión

En este artículo, analicé cómo utilizar GPT-5 como agente de IA. Comencé hablando de cuándo es necesario crear agentes y por qué GPT-5 es una de varias buenas alternativas. Luego me sumergí en el almacenamiento vectorial de OpenAI y en cómo se puede crear un almacenamiento vectorial de forma muy sencilla y ponerlo a disposición de su agente como herramienta. Además, hablé sobre cómo proporcionarle a su agente otras herramientas personalizadas y el SDK de agentes que puede usar para crear aplicaciones agentes avanzadas. Proporcionar herramientas a sus LLM es una forma sencilla de potenciar a sus agentes y hacerlos mucho más capaces de responder las consultas de los usuarios. Como dije al principio de este artículo, los usuarios pronto comenzarán a esperar que la mayoría de las aplicaciones de IA tengan agentes disponibles que puedan realizar acciones a través de herramientas y, por lo tanto, este es un tema sobre el que debe aprender más e implementar lo más rápido posible.

👉 Encuéntrame en las redes sociales:

📩 Suscríbete a mi newsletter

🧑‍💻 Ponte en contacto

🔗 LinkedIn

🐦X/Twitter

✍️ Medio

También puedes leer mi artículo sobre: