Un nuevo estudio de Harvard y Perplexity encuentra que los agentes de IA realizan 26 minutos de trabajo autónomo por sesión frente a 33 segundos para la búsqueda

Una nueva investigación de trabajo de Perplexity y Harvard ofrece evidencia de campo sobre lo que hacen los agentes de IA en el trabajo del conocimiento. Se basa en datos de producción de dos productos de Perplexity: Búsqueda y Computadora.

La configuración es una comparación natural. La búsqueda es un motor de respuestas conversacional. La computadora es un agente que planifica y ejecuta tareas de un extremo a otro. Los mismos usuarios tocan ambos productos, por lo que el equipo puede mantener la tarea aproximadamente constante.

Lo que realmente mide el estudio

El estudio de investigación cubre un período de 90 días, del 27 de febrero al 27 de mayo de 2026. La computadora se inició dos días antes de que se abriera ese período.

El método principal hace coincidir pares de consultas casi idénticas en los dos productos. El equipo de investigación encontró 10.000 pares de sesiones con una similitud de coseno superior a 0,99. Cada par es efectivamente la misma tarea intentada en ambos sentidos.

Los pares de computadoras están conectados a sesiones que invocan una herramienta de ejecución. Estas herramientas de “hacer” incluyen ejecución de código, acciones del navegador, escritura de archivos y llamadas a conectores. Esa puerta garantiza que cada sesión de computadora realice un trabajo realmente autónomo.

La adopción se elevó por la ventana. Las consultas informáticas acumuladas alcanzaron 84 veces el total de la primera semana. Un análisis coincidente encontró que la adopción de computadoras también aumentó las consultas de búsqueda diarias de los usuarios en un 1,05. El efecto positivo apunta a la complementariedad, no a la sustitución.

https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

El marco de estructura de costos

La investigación basa sus datos en un modelo simple basado en tareas. Cada tarea tiene un recuento de pasos y las tareas más largas tienen un valor levemente mayor.

Los agentes cambian la estructura de costos. Cobran un coste fijo mayor por tarea, por delegación y revisión. Pero cobran un costo marginal más bajo por paso, ya que el sistema se ejecuta.

Esto produce un recuento de pasos de equilibrio. Por debajo, el modo conversacional es más económico. Por encima de él, gana el modo agente. Las búsquedas breves siguen siendo manuales; los flujos de trabajo largos se trasladan al agente.

Autonomía: 26 Minutos vs 33 Segundos

La primera medida de autonomía es el tiempo de ejecución. La computadora realiza 26 minutos de trabajo mecánico por sesión. La búsqueda dura 33 segundos. Esa es una brecha de 48×.

Las medianas muestran el mismo patrón: 9 minutos frente a 14 segundos. La brecha varía según el dominio. Las tareas locales muestran 75×; La ciencia muestra 26×, ya que las respuestas sencillas suelen ser suficientes.

Una mayor autonomía no redujo la calidad aquí. El equipo de investigación calificó la insatisfacción en el siguiente turno con lo que hacen los usuarios a continuación. La tasa de insatisfacción significativa con la informática fue del 1,3%, frente al 2,9% de la Búsqueda (reducción del 55%).

Los turnos de seguimiento también se desplazan hacia la revisión y extensión en la computadora, aunque los cambios son pequeños. El uso de conectores aumentó más claramente. La computadora invocó al menos un conector en el 7,9% de las sesiones, frente al 1,8% de la Búsqueda. La computadora encadena herramientas externas que los usuarios de la Búsqueda ejecutarían manualmente.

Eficiencia: de dónde provienen los ahorros

La sección de eficiencia estima un contrafactual de Búsqueda + Humano. Un ser humano solo con Búsqueda tarda 269 minutos por tarea coincidente. Computadora + Humano toma 36 minutos.

Esto supone un 87 % menos de tiempo y un 94 % menos de costes en general. Los ahorros de costos superan los ahorros de tiempo porque los salarios del dominio amplifican el efecto. El costo del modelo de computadora oscila entre 4 y 10 dólares por tarea; La búsqueda cuesta alrededor de $0,05.

Los números marginales respaldan el marco. Computadora + Humano cuesta $0,16 por paso, versus $2,05 para Búsqueda + Humano. Las sesiones de Matched Computer también ejecutaron indicaciones más largas, 652 frente a 448 caracteres en la mediana. Esto respalda el supuesto de mayores costos fijos para los agentes.

El análisis del punto de equilibrio dice que un profesional debe finalizar todos los pasos manuales en menos de 20 minutos para igualar a la computadora. El equipo de investigación cotejó con una estimación independiente de LLM y entrevistas con usuarios. El método LLM encontró un 84 % de ahorro de tiempo y un 93 % de costos. Los entrevistados informaron aceleraciones de 5× a 300×.

Expansión horizontal y vertical

El alcance es donde esta investigación se extiende más allá del trabajo anterior. La autonomía no sólo acelera las tareas. Cambia las tareas que intentan los usuarios.

Horizontalmente, las consultas informáticas cruzan con mayor frecuencia líneas ocupacionales. La participación entre ocupaciones alcanzó un promedio del 59 % en Computadora, frente al 50 % en Búsqueda. Gestión y Emprendimiento mostraron la mayor brecha, con 19 puntos.

Verticalmente, las consultas informáticas son más exigentes. En la taxonomía revisada de Bloom, el 76 % requirió cognición de orden superior, frente al 55 % para la búsqueda. El trabajo a nivel de creación representó el 50% de las consultas informáticas, frente al 26%.

Las tareas informáticas también abarcan más dominios del conocimiento. Cada consulta abordó 2,40 dominios de conocimiento O*NET en promedio, frente a 1,74. Era casi tres veces más probable que necesitara tres o más dominios.

La componibilidad aumenta a medida que la jerarquía O*NET se vuelve más fina. A nivel de Declaración de tareas, Computadora realizó un 60% más de actividades. Alrededor del 23% de las consultas informáticas llegaron a una declaración de tarea que los mismos usuarios nunca enviaron a la Búsqueda.

https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

Tabla comparativa: búsqueda frente a computadora

DimensiónPerplejidad BúsquedaPerplejidad ComputadoraModo en el marcoMotor de respuesta conversacionalAgente orquestadorTiempo de máquina por sesión33 segundos (mediana 14s)26 minutos (mediana 9m)Consultas por sesión2.85.3Insatisfacción significativa (media+alta)2.9%1.3%Sesiones con una llamada de conector1.8%7.9%Tiempo de tarea contrafactual269 min (Búsqueda + Humano)36 min (Computadora + Humano) Costo por paso$2,05$0,16Costo del modelo por tarea~$0,05$4–10Participación de consultas entre ocupaciones50%59%Cognición Bloom de orden superior55%76%O*NET Dominios de conocimiento por consulta1.742.40

Conclusiones clave

La computadora ejecuta 26 minutos de trabajo autónomo por sesión versus 33 segundos para la Búsqueda, una brecha de 48 veces. En tareas coincidentes, Computadora + Humano reduce el tiempo estimado en un 87% y el costo en un 94% en comparación con Búsqueda + Humano. La tasa significativa de insatisfacción con la computadora es del 1,3% frente al 2,9% de la Búsqueda, una reducción del 55%. Las consultas informáticas abarcan más ocupaciones (59% frente a 50%) y exigen más cognición de orden superior (76% frente a 55%). Alrededor del 23% de las consultas informáticas llegaron a una declaración de tarea que los mismos usuarios nunca enviaron a la Búsqueda.

Explicador visual de Marktechpost

Guía de investigación

Harvard × Perplejidad

01 / 10

Cómo los agentes de IA remodelan el trabajo del conocimiento

Autonomía, eficiencia y alcance: evidencia de campo a partir de datos de producción.

Un nuevo estudio compara a un agente autónomo con un asistente de búsqueda conversacional. Utiliza datos de uso reales de Perplexity Search y Perplexity Computer.

Jeremy Yang (Harvard) · Kate Zyskowski, Noah Yonack, Jerry Ma (Perplejidad) · arXiv:2606.07489v1

02 / 10

Qué mide el estudio

Un diseño de pares emparejados mantiene la tarea aproximadamente constante en todos los productos.

Ventana de 90 días: del 27 de febrero al 27 de mayo de 2026. 10.000 pares de sesiones coincidentes con similitud de cosenos superiores a 0,99. Las sesiones de computadora están cerradas a herramientas de “hacer”: ejecución de código, acciones del navegador, escritura de archivos, llamadas a conectores. Los mismos usuarios de producto dual aparecen en ambos lados.

03 / 10

El marco de estructura de costos

Un modelo simple basado en tareas explica cuándo vale la pena delegar.

La modalidad de agente cobra un coste fijo mayor por tarea, por delegación y revisión. Cobra un menor costo marginal por paso, ya que se ejecuta. Un conteo de pasos de equilibrio clasifica el trabajo: corto debajo, agente arriba. La selección de tareas se modela como un problema de mochila 0-1.

04 / 10

Autonomía: Trabajo de la Máquina por Sesión

Una mayor autonomía aquí no tuvo un costo de calidad.

26 min frente a 33 s

Trabajo autónomo por sesión (48× gap)

9 min frente a 14 s

Tiempo medio de sesión (intervalo de 40×)

1,3% frente a 2,9%

Insatisfacción significativa (55% menos)

7,9% frente a 1,8%

Sesiones que invocan una llamada de conector

05 / 10

Eficiencia: tiempo y costo

Estimado frente a un contrafactual de Búsqueda + Humano en tareas coincidentes.

269 ​​→ 36 minutos

Tiempo promedio de finalización de la tarea

87% / 94%

Ahorro de tiempo/costos ahorrados en general

0,16 dólares frente a 2,05 dólares

Costo por paso (Computadora vs Búsqueda + Humano)

< 20 minutos

Punto de equilibrio de paso manual para igualar a la computadora

06 / 10

Alcance: Trabajo más amplio y más duro

La autonomía cambia las tareas que intentan los usuarios, no solo su velocidad.

Horizontal: participación entre ocupaciones 59% vs 50% (Gestión y Emprendimiento +19 pp). Vertical: cognición de Bloom de orden superior 76% frente a 55%. Trabajo a nivel de creación: 50% de las consultas informáticas frente al 26% de las búsquedas. Amplitud de conocimiento: 2,40 frente a 1,74 dominios O*NET por consulta (+38%).

07 / 10

Qué desbloquea la computadora

Lo distintivo radica en el trabajo de ejecución detallado, no en el alcance temático.

+60 % más declaraciones de tareas O*NET involucradas por consulta que la búsqueda. El 23% de las consultas informáticas llegaron a una declaración de tarea que los mismos usuarios nunca enviaron a la Búsqueda. Las ganancias se concentran en software y desarrollo web, documentación y visualización de datos.

08 / 10

Búsqueda vs Computadora

En paralelo, las principales medidas del estudio.

DimensionSearchComputadora Tiempo de máquina por sesión33 s (media 14 s)26 min (media 9 m) Consultas por sesión2.85.3 Insatisfacción significativa2.9%1.3% Costo por paso$2.05$0.16 Participación entre ocupaciones50%59% Cognición de orden superior55%76% Dominios O*NET por consulta1.742.40

09 / 10

Casos de uso para ingenieros

Cómo se relacionan los hallazgos con el trabajo técnico del día a día.

Científicos de datos: tareas únicas que abarcan diseño, matemáticas y economía y contabilidad. Ingenieros de software: el agente escribe archivos, ejecuta código y lo implementa; tu supervisas. Ingenieros de inteligencia artificial: dirigen las búsquedas breves a una ruta conversacional y los flujos de trabajo largos a un agente.

10 / 10

La comida para llevar

De la velocidad al alcance.

Los ahorros de tiempo y costos son grandes pero esperados. El hallazgo más claro es que se intentó realizar un trabajo más amplio y complejo. La lección práctica es la adaptación entre tarea y herramienta: hacer coincidir la herramienta con el recuento de pasos.

Fuente: Cómo los agentes de IA remodelan el trabajo del conocimiento: autonomía, eficiencia y alcance (arXiv:2606.07489v1).

Marktechpost
Cobertura de investigación de IA/ML exclusiva para profesionales, decodificada para ingenieros.

Consulte el documento y los detalles técnicos. También hemos creado una breve demostración para este trabajo de investigación. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros