Imágenes que Bing Image Creator no creará

Como todas las grandes empresas de inteligencia artificial, el software Image Creator de Bing tiene una política de contenido que prohíbe la creación de imágenes que fomenten el abuso sexual, el suicidio, la violencia gráfica, el discurso de odio, el acoso, el engaño y la desinformación. Algunas de las reglas son estrictas incluso con respecto a los estándares habituales de “confianza y seguridad” (el discurso de odio se define como un discurso que “excluye” a individuos sobre la base de cualquier “característica, real o percibida, que esté consistentemente asociada con prejuicios sistémicos o marginación”). ). Como era de esperar, esto excluirá muchas imágenes perfectamente anodinas. Pero las reglas son lo de menos. La pregunta más impactante e interesante es cómo se aplican realmente esas reglas.

Ahora tengo una visión estenopeica de las reglas de seguridad de la IA en acción, y parece que Bing está tomando reglas muy amplias y entrenando su motor para aplicarlas incluso más ampliamente de lo que cualquiera esperaría.

Aquí está mi experiencia. He estado usando Bing Image Creator últimamente para crear Cybertoonz (ejemplos aquí, aquíy aquí), a pesar de mi profunda falta de talento artístico. Tenía los problemas técnicos habituales (demasiados dedos, caras extrañas) y algunos problemas que sospeché estaban diseñados para evitar acusaciones de parcialidad. Por ejemplo, si pedía una fotografía de miembros del Tribunal de Justicia de las Comunidades Europeas, el motor casi siempre creaba imágenes de más mujeres y minorías identificables de las que probablemente tendrá el TJUE en los próximos cincuenta años. Pero si la corrección política del motor de IA restó valor al mensaje de la caricatura, fue bastante fácil solicitar jueces masculinos, y Bing no trató esto como imágenes “excluyentes” por género, como uno podría haber temido.

Mi experiencia más reciente es un poco más inquietante. yo creé esta caricatura de Cybertoonz para ilustrar la afirmación contraintuitiva de Silicon Valley de que las redes sociales participan en un discurso protegido cuando suprimen el discurso de muchos de sus usuarios. Mi mensaje de imagen era una variante de “Toma de ángulo bajo de una figura de autoridad masculina con una camiseta negra que se pone de pie y habla por un altavoz en un grupo grande de personas sentadas con mordazas o cinta adhesiva sobre la boca. Arte digital de baja fidelidad”. .

Como siempre, el primer intento de Bing fue sorprendentemente bueno, pero defectuoso, y obtener una versión utilizable requirió docenas de ediciones del mensaje. Ninguna de las imágenes estaba del todo bien. Finalmente me decidí por el que funcionaba mejor, lo convertí en una caricatura de Cybertoonz y lo publiqué. Pero no había renunciado a encontrar algo mejor, así que volví al día siguiente y ejecuté el mensaje nuevamente.

Esta vez, Bing se resistió. Me dijo que mi mensaje violaba los estándares de seguridad de Bing:

Después de algunos experimentos, quedó claro que lo que Bing objetaba era representar a una audiencia “con mordazas o cinta adhesiva sobre la boca”.

¿Cómo viola esto las reglas de seguridad de Bing? ¿Son las mordazas una incitación a la violencia? Un marcador para “[n]”actividad íntima no consensual”? En contexto, esas interpretaciones de las reglas son ridículas. Pero Bing no está interpretando las reglas en contexto. Está tratando de escribir código adicional para asegurarse de que no haya violaciones de las reglas, contra viento y marea. agua. Entonces, si existe la posibilidad de que la imagen que produce pueda mostrar violencia o sexo no consensuado, el código de confianza y seguridad la rechazará.

Es casi seguro que este es el futuro de los límites de confianza y seguridad de la IA. Comenzará con reglas demasiado amplias escritas para satisfacer a los críticos de izquierda de Silicon Valley. Luego, esas reglas excesivamente amplias se ampliarán aún más mediante un código oculto escrito para bloquear muchos mensajes que cumplen perfectamente las normas sólo para garantizar que bloquee un puñado de mensajes que no cumplen las normas.

En el contexto de Cybertoonz, tales límites a la producción de IA son simplemente una molestia. Pero la IA no siempre será un juguete. Se utilizará en medicina, contratación y otros contextos críticos, y la misma dinámica funcionará allí. Las empresas de inteligencia artificial se verán presionadas a adoptar estándares de confianza y seguridad e implementar códigos que prohíban agresivamente resultados que puedan ofender a la mitad izquierda del discurso político estadounidense. Sin embargo, en aplicaciones que afectan la vida de las personas, el código que garantiza esos resultados tendrá una serie de consecuencias imprevistas, muchas de las cuales nadie puede defender.

Teniendo en cuenta lo que está en juego, mi pregunta es simple. ¿Cómo evitamos esas consecuencias y quién trabaja para prevenirlas?