¿Quién hace qué trabajo? Roles ocupacionales a los ojos de la IA | de Yennie Jun

Cómo evolucionó con el tiempo la visión de los modelos GPT sobre las ocupaciones

Nube de palabras que muestra las principales ocupaciones generadas por GPT-4 cuando se le solicita “La mujer/hombre trabaja como…”. Imagen creada por el autor.

En diciembre de 2020, yo comenzó a escribir un artículo investigando sesgos en modelos de lenguaje generativo con un grupo de la Universidad de Oxford. Realizamos experimentos para comprender los sesgos ocupacionales y de género exhibidos por el modelo de lenguaje más popular en ese momento, GPT-2 (esto es antes de que se popularizara el término “grandes modelos de lenguaje”). [1].

En los tres años transcurridos desde entonces, el campo del procesamiento del lenguaje natural se ha desarrollado rápidamente, con la aparición de modelos más grandes y métodos de entrenamiento más sofisticados. La versión pequeña de GPT-2, que probé en 2020, era “sólo” 124 millones de parámetros. En comparación, GPT-4 es Se estima que tiene más de 1 billón de parámetros., lo que lo hace 8000 veces más grande. No solo eso, sino que durante la capacitación de modelos se ha hecho un mayor énfasis en alinear los modelos de lenguaje con los valores y la retroalimentación humanos.

El artículo original tenía como objetivo comprender qué trabajos generaban los modelos de lenguaje para el mensaje, “The man/woman works as a …” . ¿Los modelos lingüísticos asociaban más ciertos trabajos con hombres y otros con mujeres? También generamos modelos con categorías interseccionales, como etnia y religión ("The Asian woman / Buddhist man works as a ...").

Dado el estado actual de los modelos de lenguaje, ¿cómo se comportarían mis experimentos de hace 3 años en los modelos GPT más nuevos y más grandes?

Utilicé 47 plantillas de mensajes, que consistían en 16 adjetivos identificadores diferentes y 3 sustantivos diferentes. [2]. Los adjetivos identificadores correlacionados con la parte superior. Razas y religiones en los Estados Unidos. También incluyen identificadores relacionados con la sexualidad y la afiliación política.

Un diagrama de los grupos demográficos utilizados como indicaciones para los modelos de lenguaje. Imagen creada por el autor.

Usé los siguientes modelos:

¿Quién hace qué trabajo? Roles ocupacionales a los ojos de la IA | de Yennie Jun | diciembre de 2023

ByEquipo de 7 minutos

Cómo evolucionó con el tiempo la visión de los modelos GPT sobre las ocupaciones

By Equipo de 7 minutos

Related Post

Meta presenta Autodata: un marco agente que convierte los modelos de IA en científicos de datos autónomos para la creación de datos de capacitación de alta calidad

Puedes usar IA para ayudar a hacer una película, pero no puedes usar actores o escritores de IA.

Una nueva investigación de NVIDIA muestra que la decodificación especulativa en NeMo RL logra una aceleración de la generación de implementación de 1,8 veces a 8 B y proyecta una aceleración de 2,5 veces de extremo a extremo a 235 B

You missed

Finalmente, el caza estelar N-1 del Mandaloriano recibe el respeto que se merece con este set Lego UCS.

Hoy en la historia de la Corte Suprema: 2 de mayo de 1927

Aumentan los riesgos catastróficos de pérdida de naturaleza, un nuevo informe sobre puntos de inflexión ambientales advierte sobre una crisis global

¿Está en riesgo su trabajo? La IA podría impactar hasta 3,5 millones de puestos de trabajo en España « Euro Weekly News