El nuevo marco de la IA evalúa dónde debe automatizar a los trabajos de aumento vs. Aumento, dice Stanford Study

Redefinir la ejecución del trabajo con agentes de IA

Los agentes de IA están remodelando cómo se realizan los trabajos ofreciendo herramientas que ejecutan tareas complejas dirigidas por objetivos. A diferencia de los algoritmos estáticos, estos agentes combinan la planificación de varios pasos con herramientas de software para manejar flujos de trabajo completos en varios sectores, incluidas la educación, la ley, las finanzas y la logística. Su integración ya no es teórica: los trabajadores ya los están aplicando para apoyar una variedad de tareas profesionales. El resultado es un entorno laboral en la transición, donde los límites de la colaboración humana y máquina se están redefiniendo a diario.

Pinchar la brecha entre la capacidad de IA y la preferencia de los trabajadores

Un problema persistente en esta transformación es la desconexión entre lo que los agentes de IA pueden hacer y lo que los trabajadores quieren que hagan. Incluso si los sistemas de IA son técnicamente capaces de hacerse cargo de una tarea, los trabajadores pueden no apoyar ese cambio debido a las preocupaciones sobre la satisfacción laboral, la complejidad de las tareas o la importancia del juicio humano. Mientras tanto, las tareas de que los trabajadores están ansiosos por descargar pueden carecer de soluciones maduras de IA. Este desajuste presenta una barrera significativa para el despliegue responsable y efectivo de la IA en la fuerza laboral.

Más allá de los ingenieros de software: una evaluación holística de la fuerza laboral

Hasta hace poco, las evaluaciones de la adopción de IA a menudo se centraron en un puñado de roles, como ingeniería de software o servicio al cliente, lo que limita la comprensión de cómo la IA impacta una diversidad ocupacional más amplia. La mayoría de estos enfoques también priorizaron la productividad de la empresa sobre la experiencia de los trabajadores. Se basaron en un análisis de los patrones de uso actuales, que no proporciona una visión prospectiva. Como resultado, el desarrollo de herramientas de IA ha carecido de una base integral basada en las preferencias y necesidades reales de las personas que realizan el trabajo.

Base de datos de Bank Workbank impulsada por la encuesta de Stanford: captura de voces de trabajadores reales

El equipo de investigación de la Universidad de Stanford introdujo un marco de auditoría basado en encuestas que evalúa qué tareas preferirían los trabajadores para ver automatizado o aumentado y compara esto con evaluaciones expertas de la capacidad de IA. Utilizando datos de tareas de la base de datos NET del Departamento de Trabajo de EE. UU., Los investigadores crearon el Banco de trabajo, un conjunto de datos basado en respuestas de 1.500 trabajadores de dominio y evaluaciones de 52 expertos en IA. El equipo empleó mini entrevistas respaldadas por audio para recopilar preferencias matizadas. Introdujo la Escala de la Agencia Humana (HA), una métrica de cinco niveles que captura el alcance deseado de la participación humana en la finalización de la tarea.

Escala de agencia humana (HA): medir el nivel correcto de participación de la IA

En el centro de este marco se encuentra la escala de agencia humana, que varía desde H1 (control de IA completo) hasta H5 (control humano completo). Este enfoque reconoce que no todas las tareas se benefician de la automatización completa, ni todas las herramientas de IA deberían apuntar a ella. Por ejemplo, las tareas clasificadas H1 o H2, como la transcripción de datos o la generación de informes de rutina, son adecuados para la ejecución independiente de IA. Mientras tanto, las tareas como los programas de capacitación de planificación o participar en discusiones relacionadas con la seguridad a menudo se clasificaron en H4 o H5, lo que refleja la alta demanda de supervisión humana. Los investigadores reunieron aportes duales: los trabajadores calificaron su deseo de automatización y preferidos tienen nivel para cada tarea, mientras que los expertos evaluaron la capacidad actual de IA para esa tarea.

Insights de Workbank: donde los trabajadores adoptan o resisten la IA

Los resultados de la base de datos de Workbank revelaron patrones claros. Aproximadamente el 46.1% de las tareas recibieron un alto deseo de automatización de los trabajadores, particularmente aquellos considerados de bajo valor o repetitivo. Por el contrario, se encontró una resistencia significativa en las tareas que involucran creatividad o dinámica interpersonal, independientemente de la capacidad técnica de IA para realizarlas. Al superponer las preferencias de los trabajadores y las capacidades expertas, las tareas se dividieron en cuatro zonas: la zona de “luz verde” de automatización (alta capacidad y alto deseo), zona de automatización de “luz roja” (alta capacidad pero bajo deseo), zona de oportunidad de I + D (baja capacidad pero alto deseo) y zona de baja prioridad (bajo deseo y baja capacidad). El 41% de las tareas alineadas con las empresas financiadas por Y Combinator cayeron en las zonas de baja prioridad o luz roja, lo que indica una posible desalineación entre las inversiones de inicio y las necesidades de los trabajadores.

Hacia el despliegue de AI responsable en la fuerza laboral

Esta investigación ofrece una imagen clara de cómo se puede abordar la integración de AI de manera más responsable. El equipo de Stanford descubrió no solo donde la automatización es técnicamente factible, sino también donde los trabajadores son receptivos a ella. Su marco a nivel de tareas se extiende más allá de la preparación técnica para abarcar los valores humanos, por lo que es una herramienta valiosa para el desarrollo de la IA, la política laboral y las estrategias de capacitación en la fuerza laboral.

Tl; dr:

Este documento presenta Workbank, un conjunto de datos a gran escala que combina las preferencias de los trabajadores y las evaluaciones de expertos de IA en 844 tareas y 104 ocupaciones, para evaluar dónde los agentes de IA deben automatizar o aumentar el trabajo. Utilizando una nueva escala de agencia humana (HA), el estudio revela un complejo panorama de automatización, destacando una desalineación entre la capacidad técnica y el deseo de los trabajadores. Los resultados muestran que los trabajadores dan la bienvenida a la automatización para las tareas repetitivas, pero lo resisten en roles que requieren creatividad o habilidades interpersonales. El marco ofrece ideas procesables para la implementación de IA responsable alineada con los valores humanos.


Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 100k+ ml y suscribirse a Nuestro boletín.


Nikhil es consultor interno en MarktechPost. Está buscando un doble grado integrado en materiales en el Instituto Indio de Tecnología, Kharagpur. Nikhil es un entusiasta de AI/ML que siempre está investigando aplicaciones en campos como biomateriales y ciencias biomédicas. Con una sólida experiencia en la ciencia material, está explorando nuevos avances y creando oportunidades para contribuir.