Una nueva investigación de trabajo de Perplexity y Harvard ofrece evidencia de campo sobre lo que hacen los agentes de IA en el trabajo del conocimiento. Se basa en datos de producción de dos productos de Perplexity: Búsqueda y Computadora.
La configuración es una comparación natural. La búsqueda es un motor de respuestas conversacional. La computadora es un agente que planifica y ejecuta tareas de un extremo a otro. Los mismos usuarios tocan ambos productos, por lo que el equipo puede mantener la tarea aproximadamente constante.
Lo que realmente mide el estudio
El estudio de investigación cubre un período de 90 días, del 27 de febrero al 27 de mayo de 2026. La computadora se inició dos días antes de que se abriera ese período.
El método principal hace coincidir pares de consultas casi idénticas en los dos productos. El equipo de investigación encontró 10.000 pares de sesiones con una similitud de coseno superior a 0,99. Cada par es efectivamente la misma tarea intentada en ambos sentidos.
Los pares de computadoras están conectados a sesiones que invocan una herramienta de ejecución. Estas herramientas de “hacer” incluyen ejecución de código, acciones del navegador, escritura de archivos y llamadas a conectores. Esa puerta garantiza que cada sesión de computadora realice un trabajo realmente autónomo.
La adopción se elevó por la ventana. Las consultas informáticas acumuladas alcanzaron 84 veces el total de la primera semana. Un análisis coincidente encontró que la adopción de computadoras también aumentó las consultas de búsqueda diarias de los usuarios en un 1,05. El efecto positivo apunta a la complementariedad, no a la sustitución.
El marco de estructura de costos
La investigación basa sus datos en un modelo simple basado en tareas. Cada tarea tiene un recuento de pasos y las tareas más largas tienen un valor levemente mayor.
Los agentes cambian la estructura de costos. Cobran un coste fijo mayor por tarea, por delegación y revisión. Pero cobran un costo marginal más bajo por paso, ya que el sistema se ejecuta.
Esto produce un recuento de pasos de equilibrio. Por debajo, el modo conversacional es más económico. Por encima de él, gana el modo agente. Las búsquedas breves siguen siendo manuales; los flujos de trabajo largos se trasladan al agente.
Autonomía: 26 Minutos vs 33 Segundos
La primera medida de autonomía es el tiempo de ejecución. La computadora realiza 26 minutos de trabajo mecánico por sesión. La búsqueda dura 33 segundos. Esa es una brecha de 48×.
Las medianas muestran el mismo patrón: 9 minutos frente a 14 segundos. La brecha varía según el dominio. Las tareas locales muestran 75×; La ciencia muestra 26×, ya que las respuestas sencillas suelen ser suficientes.
Una mayor autonomía no redujo la calidad aquí. El equipo de investigación calificó la insatisfacción en el siguiente turno con lo que hacen los usuarios a continuación. La tasa de insatisfacción significativa con la informática fue del 1,3%, frente al 2,9% de la Búsqueda (reducción del 55%).
Los turnos de seguimiento también se desplazan hacia la revisión y extensión en la computadora, aunque los cambios son pequeños. El uso de conectores aumentó más claramente. La computadora invocó al menos un conector en el 7,9% de las sesiones, frente al 1,8% de la Búsqueda. La computadora encadena herramientas externas que los usuarios de la Búsqueda ejecutarían manualmente.
Eficiencia: de dónde provienen los ahorros
La sección de eficiencia estima un contrafactual de Búsqueda + Humano. Un ser humano solo con Búsqueda tarda 269 minutos por tarea coincidente. Computadora + Humano toma 36 minutos.
Esto supone un 87 % menos de tiempo y un 94 % menos de costes en general. Los ahorros de costos superan los ahorros de tiempo porque los salarios del dominio amplifican el efecto. El costo del modelo de computadora oscila entre 4 y 10 dólares por tarea; La búsqueda cuesta alrededor de $0,05.
Los números marginales respaldan el marco. Computadora + Humano cuesta $0,16 por paso, versus $2,05 para Búsqueda + Humano. Las sesiones de Matched Computer también ejecutaron indicaciones más largas, 652 frente a 448 caracteres en la mediana. Esto respalda el supuesto de mayores costos fijos para los agentes.
El análisis del punto de equilibrio dice que un profesional debe finalizar todos los pasos manuales en menos de 20 minutos para igualar a la computadora. El equipo de investigación cotejó con una estimación independiente de LLM y entrevistas con usuarios. El método LLM encontró un 84 % de ahorro de tiempo y un 93 % de costos. Los entrevistados informaron aceleraciones de 5× a 300×.
Expansión horizontal y vertical
El alcance es donde esta investigación se extiende más allá del trabajo anterior. La autonomía no sólo acelera las tareas. Cambia las tareas que intentan los usuarios.
Horizontalmente, las consultas informáticas cruzan con mayor frecuencia líneas ocupacionales. La participación entre ocupaciones alcanzó un promedio del 59 % en Computadora, frente al 50 % en Búsqueda. Gestión y Emprendimiento mostraron la mayor brecha, con 19 puntos.
Verticalmente, las consultas informáticas son más exigentes. En la taxonomía revisada de Bloom, el 76 % requirió cognición de orden superior, frente al 55 % para la búsqueda. El trabajo a nivel de creación representó el 50% de las consultas informáticas, frente al 26%.
Las tareas informáticas también abarcan más dominios del conocimiento. Cada consulta abordó 2,40 dominios de conocimiento O*NET en promedio, frente a 1,74. Era casi tres veces más probable que necesitara tres o más dominios.
La componibilidad aumenta a medida que la jerarquía O*NET se vuelve más fina. A nivel de Declaración de tareas, Computadora realizó un 60% más de actividades. Alrededor del 23% de las consultas informáticas llegaron a una declaración de tarea que los mismos usuarios nunca enviaron a la Búsqueda.
Tabla comparativa: búsqueda frente a computadora
Conclusiones clave
La computadora ejecuta 26 minutos de trabajo autónomo por sesión versus 33 segundos para la Búsqueda, una brecha de 48 veces. En tareas coincidentes, Computadora + Humano reduce el tiempo estimado en un 87% y el costo en un 94% en comparación con Búsqueda + Humano. La tasa significativa de insatisfacción con la computadora es del 1,3% frente al 2,9% de la Búsqueda, una reducción del 55%. Las consultas informáticas abarcan más ocupaciones (59% frente a 50%) y exigen más cognición de orden superior (76% frente a 55%). Alrededor del 23% de las consultas informáticas llegaron a una declaración de tarea que los mismos usuarios nunca enviaron a la Búsqueda.
Explicador visual de Marktechpost
Guía de investigación
Harvard × Perplejidad
Marktechpost
Cobertura de investigación de IA/ML exclusiva para profesionales, decodificada para ingenieros.
Consulte el documento y los detalles técnicos. También hemos creado una breve demostración para este trabajo de investigación. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.
¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros