En 17 de julio de 2025OpenAi lanzado Agente de chatgpttransformando chatgpt de un asistente de conversación en una IA unificada agente Capaz de ejecutar tareas complejas de forma compleja, desde la navegación web hasta la ejecución del código, en un entorno de computadora virtual.
Puente de capacidades anteriores
El agente de chatgpt se basa en dos herramientas anteriores:
- Operadorhabilitó interacciones web limitadas (clic, desplazamiento y relleno de forma) con un agente basado en el navegador.
- Investigación profundaproporcionó una navegación autónoma y una síntesis de informes en plazos más largos.
Individualmente, ambos tenían limitaciones: el operador podía interactuar pero no podía realizar un análisis en profundidad; La investigación profunda podría analizar pero no interactuar dinámicamente con los sitios. El agente de ChatGPT fusiona ambas fortalezas, una navegación unificadora, uso de herramientas y razonamiento dentro de una sola arquitectura de agente.
Arquitectura interna y flujo de trabajo
En el núcleo hay un entorno de computadora virtual combinatorio:
- A navegador visual para sitios de orientación humana,
- A navegador de texto optimizado para razonamiento estructurado,
- A concha/terminal para ejecutar código,
- Integrado Conectores API Para servicios como Gmail o Github.
El agente se adapta continuamente, decisando si hacer clic en botones, ejecutar scripts o analizar contenido, mientras mantiene el estado en todas las herramientas. Todas las acciones ocurren dentro del contexto de agente controlado, asegurando la trazabilidad y la flexibilidad.
Tareas de ejemplo: desde la planificación hasta la ejecución
El agente de ChatGPT puede abordar tareas como:
- Información de calendario: Escanear su calendario, obtener noticias relacionadas y resumir las próximas reuniones.
- Comestibles: Abastecimiento de ingredientes, comparar precios, colocar pedidos.
- Análisis competitivo: Obtener páginas de la competencia, raspar datos, crear diapositivas o hojas de cálculo.
- Modelado financiero: Descargar datos, actualizar hojas de cálculo, preservar el formato.
Estos flujos de trabajo implican el uso de herramientas multimodales: iniciar sesión en sitios, ejecutar scripts en la terminal y luego empacar resultados en documentos editables, todo con su supervisión.
Rendimiento: puntos de referencia y comparaciones humanas
Openai informa ganancias significativas en múltiples puntos de referencia:
- El último examen de la humanidad: Aprobar@1 tasa de 41.6 % (mejor resultado de agente); hasta 44.4% con ensayos paralelos
- Frontiermath: 27.4% de precisión utilizando soporte de terminal y código, superando los modelos anteriores.
- Hojas de cálculo: 45.5% puntaje general con edición XLSX, en comparación con el copiloto en el 20% de Excel y las puntuaciones humanas de ≈71%
- Punto de referencia de trabajo de conocimiento interno: Las herramientas de agentes cumplen o exceden el rendimiento de los expertos aproximadamente al 50% del tiempo
- Browsecomp y webarena: Nuevos resultados de estado de arte con 68.9 % en tareas basadas en la navegación
Estas evaluaciones demuestran una mejora marcada tanto en la autonomía como en la sofisticación de la tarea.
Seguridad y mitigación de riesgos
La autonomía de agente introduce nuevos riesgos. Operai ha implementado varias salvaguardas:
- Confirmación explícita antes de cualquier acción consecuente (por ejemplo, compras, publicaciones).
- Modo de reloj: Ciertas tareas confidenciales exigen supervisión activa.
- Robusto defensas de inyección inmediataincluida la capacitación para detectar indicaciones web anómalas y supervisar la salida de la herramienta.
- Mecanismos de privacidad: Modo de adquisición específico de sesión sin retención de entradas confidenciales como contraseñas.
- Medidas de biothreat: Clasificado como de alto riesgo para agentes biológicos, desencadenando un modelado de amenazas mejorado, capacitación en rechazo, monitoreo en vivo y sistemas de recompensas de errores.
Estas capas tienen como objetivo reducir el mal uso, desde fugas de datos hasta secuestro de tareas.
Cómo empezar
Disponible ahora para chatgpt Pro, plus y equipo Usuarios:
- Usuarios profesionales Obtenga acceso hoy con 400 mensajes/mes en modo de agente.
- Más y equipo obtendrá acceso gradual en los próximos días (40 mensajes/mes).
- Empresa y educación Los niveles seguirán en las próximas semanas.
- El lanzamiento rodante fuera de los territorios estadounidenses (EEA, Suiza) está en marcha.
Puede cambiar al “modo de agente” a través del menú Herramientas en cualquier conversación y describir el flujo de trabajo deseado. El progreso se narra en tiempo real, y puede hacer una pausa, hacerse cargo o detenerse en cualquier momento.
Importancia para los flujos de trabajo de AI -aughed
El agente de ChatGPT representa un salto de los sistemas pasivos de respuesta de consulta a los trabajadores digitales proactivos. Al combinar:
- Razonamiento del idioma (a través de modelos GPT -4 -class),
- Orquestación de herramientas (navegadores, terminales),
- Entornos de ejecución de preservación de contexto,
… OpenAi está habilitando más autónomo, confiabley orientado a la acción casos de uso. Si bien los controles son esenciales para protegerse contra el mal uso, esta liberación amplía el alcance de lo que los asistentes de IA pueden realmente hacerno solo decir.
Para los desarrolladores y científicos de datos, ChatGPT Agent se convierte en una plataforma: un agente programable y observable capaz de raspar, analizar, sintetizar y exportar a pedido. Abre oportunidades para los flujos de trabajo de la próxima encuesta en la investigación, la automatización de negocios y la productividad personal.
Conclusión
El agente de ChatGPT no es solo una mejora conversacional: es un eje estratégico hacia flujos de trabajo de IA autónomos generalizados. Su debut marca la transición de LLM de asesores pasivos a agentes activos, realizando investigaciones, creación y acción del mundo real en un entorno unificado y controlable. Espere que esto madure en una capacidad fundamental en los dominios acuáticos de AI.
| Oportunidad de patrocinio |
|---|
| Llegar a los desarrolladores de IA más influyentes en todo el mundo. 1M+ lectores mensuales, 500k+ constructores comunitarios, infinitas posibilidades. [Explore Sponsorship] |
Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias en Ciencias de Datos de la Universidad de Padova. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca por transformar conjuntos de datos complejos en ideas procesables.
