PÍDELE a tu teléfono que te muestre un neandertal y obtendrás un bruto peludo y encorvado que parece más un chimpancé que un humano. Pídale que describa su vida diaria y oirá hablar de cazadores que habitan en cavernas y que fabrican sencillas herramientas de piedra. ¿El problema? Lo sabemos mejor desde hace décadas.
Matthew Magnani y Jon Clindaniel no buscaban avergonzar a la inteligencia artificial. Solo querían saber qué sucede cuando dejamos que los chatbots visualicen el pasado. Entonces los antropólogos hicieron algo simple: pidieron a DALL-E 3 y ChatGPT que crearan imágenes y narrativas que representaran la vida neandertal, y luego compararon los resultados con más de un siglo de investigación científica real. Lo que regresó fue una cápsula del tiempo de ideas obsoletas y una advertencia sobre qué versión de la historia está aprendiendo la IA.
La pareja probó cuatro indicaciones diferentes 100 veces cada una. Dos indicaciones pedían precisión científica; dos no lo hicieron. Algunos eran detallados y especificaban qué deberían hacer o vestir los neandertales. Otros fueron deliberadamente vagos. “Es muy importante examinar los tipos de prejuicios inherentes a nuestro uso diario de estas tecnologías”, dice Magnani, profesor asistente de antropología en la Universidad de Maine.
Las imágenes que surgieron contaron una historia coherente, pero no la correcta. En todas las indicaciones, DALL-E 3 generó neandertales que parecían haber salido de un diorama de un museo de la década de 1920. Hombres muy musculosos dominaban cada escena, encorvados y cubiertos de vello corporal excesivo. Sus rostros tenían cejas exageradas y mandíbulas prominentes, más dramáticas que cualquier cráneo de neandertal real. Las mujeres y los niños estuvieron en gran medida ausentes. Sólo cuando los investigadores solicitaron explícitamente conocimiento experto apareció un solo niño, jugando en el fondo.
Estas no fueron sólo elecciones artísticas. Cuando Magnani y Clindaniel cruzaron las imágenes con diferentes épocas de la literatura científica, pudieron fechar el conocimiento de la IA. DALL-E 3 surgió en algún lugar entre finales de los 80 y principios de los 90. ¿Descripciones de texto de ChatGPT? Incluso más antiguo: muy consistente con investigaciones de principios de la década de 1960, completadas con vagas conversaciones sobre “cultura” y “naturaleza” que dominaban la antropología en ese momento.
Las narrativas del chatbot enfatizaban la vida en cavernas y la caza, describiendo a los neandertales fabricando herramientas con solo tres materiales: piedra, piel y madera. El fuego se mantuvo pero aparentemente nunca se hizo, una idea abandonada por la mayoría de los investigadores hace años. Mientras tanto, las imágenes mostraban anacronismos tecnológicos que corrían en dirección opuesta. La cestería apareció junto a los techos de paja con escaleras. Algunas escenas incluían vasijas de vidrio e instrumentos metálicos, tecnologías que no existirían hasta dentro de decenas de miles de años. Fue una lucha temporal, que mezclaba una biología anticuada con una cultura increíblemente avanzada.
“Es fundamental comprender cómo las respuestas rápidas que recibimos se relacionan con el conocimiento científico contemporáneo y de última generación”, dice Magnani. “¿Somos propensos a recibir respuestas obsoletas cuando buscamos información de los chatbots y en qué campos?”
Para saber con qué fecha, los investigadores crearon una base de datos de más de 2.000 resúmenes científicos sobre los neandertales publicados entre 1923 y 2023. Utilizaron métodos computacionales para mapear el espacio semántico de la investigación sobre los neandertales, creando esencialmente un panorama de cómo los científicos hablan sobre las especies a lo largo del tiempo. Luego colocaron el contenido generado por IA en ese mapa para ver dónde aterrizaba.
Aproximadamente la mitad de las narrativas de ChatGPT no se alineaban en absoluto con el conocimiento académico. Por un momento, esa cifra saltó por encima del 80 por ciento. El texto que sí coincidió pertenecía a grupos de investigaciones más antiguos. Cuando el equipo calculó la “edad” del contenido generado por IA al encontrar los 20 años de investigación a los que más se parecía, ChatGPT promedió consistentemente entre 1962 y 1964, una era en la que la ecología humana dominaba el campo y los neandertales todavía eran ampliamente considerados precursores primitivos de los humanos modernos.
A las imágenes les fue un poco mejor y llegaron a finales de los años 1980 y principios de los 1990, cuando la investigación genética comenzaba a remodelar nuestra comprensión de la evolución humana. Pero incluso estas representaciones más recientes fueron valores atípicos: ni mucho menos representativos de las últimas dos décadas de avances paleogenómicos, análisis líticos y estudios demográficos que han revolucionado la ciencia neandertal.
¿Por qué la IA está estancada en el pasado? La respuesta está en lo que realmente puede leer. Las leyes de derechos de autor de la década de 1920 significan que la mayoría de los artículos científicos permanecen encerrados detrás de muros de pago hasta que pasan al dominio público. Cuando Magnani y Clindaniel intentaron descargar artículos en texto completo de las principales bases de datos para su análisis, se toparon con un muro: sólo estaban disponibles 378 artículos completos, la mayoría de 1927 o antes. En Estados Unidos, las obras de 1927 pasaron a ser de dominio público en 2023, creando una clara línea divisoria en lo que los modelos de entrenamiento de IA pueden acceder libremente.
La publicación en acceso abierto ha mejorado las cosas desde principios de la década de 2000, pero no ha borrado décadas de investigación inaccesible. El resultado es que la IA generativa se entrena en gran medida con todo lo que está disponible gratuitamente en la web, que tiende a ser material académico muy antiguo o contenido popular que puede reflejar suposiciones culturales obsoletas. “Una manera importante de generar resultados de IA más precisos es trabajar para garantizar que los conjuntos de datos antropológicos y los artículos académicos sean accesibles a través de la IA”, dice Clindaniel, que se especializa en antropología computacional en la Universidad de Chicago.
Hay otro problema al acecho en esas imágenes generadas: el género. La investigación moderna sobre los neandertales ha trabajado duro para ir más allá de los estereotipos de género del “hombre cazador”, pero las imágenes de la IA se mantuvieron obstinadamente centradas en hombres muy musculosos en poses de acción. Esto probablemente refleja datos de entrenamiento que en sí mismos conllevan esos sesgos, ya sea de artículos de Wikipedia, fotografías de dioramas de museos o medios populares que todavía gravitan hacia la representación de hombres prehistóricos.
Los investigadores probaron si pedir explícitamente “conocimientos expertos” mejoraría la precisión. Ayudó, pero no lo suficiente. La sugerencia de los expertos generó neandertales con menos rasgos parecidos a los de los chimpancés, menos vello corporal y estructuras faciales más realistas. Las narrativas de expertos de ChatGPT mencionaron la recolección de plantas, los refugios al aire libre y la crianza de los niños, todo ello de acuerdo con la comprensión contemporánea. Pero el problema fundamental persistía: incluso cuando se le pedía experiencia, la IA estaba recopilando información de fuentes obsoletas.
“Nuestro estudio proporciona un modelo para que otros investigadores examinen la distancia entre la erudición y el contenido generado mediante inteligencia artificial”, dice Magnani. La metodología podría funcionar para cualquier período arqueológico, cualquier región, cualquier campo donde el conocimiento haya evolucionado significativamente con el tiempo. Pregúntele a AI sobre las redes comerciales de la Edad del Bronce, los asentamientos vikingos o el uso de herramientas de los aborígenes australianos, y probablemente obtendrá resultados igualmente obsoletos; solo que aún no sabemos en qué décadas están atrapados.
Esto importa más allá de la arqueología. Cuando alguien pregunta en su teléfono sobre los neandertales, normalmente no está escribiendo un trabajo de investigación. Satisfacen la curiosidad, ayudan a un niño con la tarea o resuelven una discusión en la mesa. Si la IA ofrece constantemente información de hace 60 años, no sólo es inexacta: está maleducando activamente a millones de personas que no tienen motivos para dudar de sus dispositivos.
Y no se va a arreglar solo. Las empresas de inteligencia artificial guardan en secreto sus datos de capacitación, pero sabemos que favorecen el acceso libre a texto e imágenes. A menos que los editores académicos amplíen drásticamente el acceso abierto, o que los desarrolladores de inteligencia artificial otorguen licencias a las bases de datos de investigación actuales, el pasado que estos sistemas imaginan permanecerá congelado en el tiempo –o más bien, congelado en cualquier período de tiempo que esté fuera de los derechos de autor y sea fácil de extraer de la web.
Hay una ironía aquí. La misma tecnología que promete democratizar el acceso a la información en realidad está afianzando conocimientos obsoletos, haciéndolos más accesibles que las investigaciones actuales. Alguien con una tarjeta de biblioteca y paciencia aún puede encontrar información precisa sobre los neandertales. Pero la mayoría de las personas nunca superarán la primera respuesta segura de su chatbot, incluso si la mayoría de los expertos hubieran considerado incorrecta esa respuesta antes de nacer.
“Enseñar a nuestros estudiantes a abordar la IA generativa con cautela dará lugar a una sociedad más crítica y con más conocimientos técnicos”, afirma Magnani. Esa precaución parece justificada cuando la visión de la prehistoria humana de su asistente digital es más antigua que la de sus padres.
El estudio, publicado en diciembre en Advances in Archaeological Practice, llegó justo cuando la IA generativa pasó de la tecnología del horizonte a la herramienta cotidiana. Magnani espera que si el experimento se repitiera ahora, los chatbots incorporarían investigaciones más recientes. Pero a menos que algo cambie acerca de cómo el conocimiento científico ingresa a los bienes comunes digitales, estaremos enseñando a las máquinas a soñar con estereotipos de décadas de antigüedad.
¿Qué hacer hasta entonces? Los investigadores sugieren utilizar la IA como punto de partida, no como punto final. Deje que genere imágenes o texto, pero luego compárelos con fuentes actuales. Suponga que todo lo que le dice sobre el pasado podría datar del pasado, y no del pasado sobre el que está preguntando. Y tal vez, cuando tu teléfono te muestre con confianza a ese bruto peludo y encorvado, recuerda que los verdaderos neandertales eran mucho más interesantes que eso. Sólo tenemos que esperar a que las máquinas se pongan al día.
Enlace de estudio: https://www.cambridge.org/core/journals/advances-in-archaeological-practice/article/artificial-intelligence-and-the-interpretation-of-the-past/
Aquí no hay muro de pago
Si nuestros informes lo han informado o inspirado, considere hacer una donación. Cada contribución, sin importar el tamaño, nos permite continuar brindando noticias médicas y científicas precisas, atractivas y confiables. El periodismo independiente requiere tiempo, esfuerzo y recursos; su apoyo garantiza que podamos seguir descubriendo las historias que más le importan.
Únase a nosotros para hacer que el conocimiento sea accesible e impactante. ¡Gracias por estar con nosotros!