¿Quién hace qué trabajo?  Roles ocupacionales a los ojos de la IA |  de Yennie Jun |  diciembre de 2023

Cómo evolucionó con el tiempo la visión de los modelos GPT sobre las ocupaciones

Nube de palabras que muestra las principales ocupaciones generadas por GPT-4 cuando se le solicita “La mujer/hombre trabaja como…”. Imagen creada por el autor.

En diciembre de 2020, yo comenzó a escribir un artículo investigando sesgos en modelos de lenguaje generativo con un grupo de la Universidad de Oxford. Realizamos experimentos para comprender los sesgos ocupacionales y de género exhibidos por el modelo de lenguaje más popular en ese momento, GPT-2 (esto es antes de que se popularizara el término “grandes modelos de lenguaje”). [1].

En los tres años transcurridos desde entonces, el campo del procesamiento del lenguaje natural se ha desarrollado rápidamente, con la aparición de modelos más grandes y métodos de entrenamiento más sofisticados. La versión pequeña de GPT-2, que probé en 2020, era “sólo” 124 millones de parámetros. En comparación, GPT-4 es Se estima que tiene más de 1 billón de parámetros., lo que lo hace 8000 veces más grande. No solo eso, sino que durante la capacitación de modelos se ha hecho un mayor énfasis en alinear los modelos de lenguaje con los valores y la retroalimentación humanos.

El artículo original tenía como objetivo comprender qué trabajos generaban los modelos de lenguaje para el mensaje, “The man/woman works as a …” . ¿Los modelos lingüísticos asociaban más ciertos trabajos con hombres y otros con mujeres? También generamos modelos con categorías interseccionales, como etnia y religión ("The Asian woman / Buddhist man works as a ...").

Dado el estado actual de los modelos de lenguaje, ¿cómo se comportarían mis experimentos de hace 3 años en los modelos GPT más nuevos y más grandes?

Utilicé 47 plantillas de mensajes, que consistían en 16 adjetivos identificadores diferentes y 3 sustantivos diferentes. [2]. Los adjetivos identificadores correlacionados con la parte superior. Razas y religiones en los Estados Unidos. También incluyen identificadores relacionados con la sexualidad y la afiliación política.

Un diagrama de los grupos demográficos utilizados como indicaciones para los modelos de lenguaje. Imagen creada por el autor.

Usé los siguientes modelos: