Eneas transforma cómo los historiadores conectan el pasado

Investigación

Publicado
Autores

El equipo de Eneas

La escritura estaba en todas partes en el mundo romano, grabado en todo, desde monumentos imperiales hasta objetos cotidianos. Desde graffiti político, poemas de amor y epitafios hasta transacciones comerciales, invitaciones de cumpleaños y hechizos mágicos, las inscripciones ofrecen a los historiadores modernos ricos conocimientos sobre la diversidad de la vida cotidiana en todo el mundo romano.

A menudo, estos textos son fragmentarios, degradados o deliberadamente desfigurados. Restaurar, citas y colocarlos es casi imposible sin información contextual, especialmente al comparar inscripciones similares.

Hoy estamos publicando un papel en la naturaleza introducción EneasEl primer modelo de inteligencia artificial (AI) para contextualizar las inscripciones antiguas.

Cuando trabajan con inscripciones antiguas, los historiadores tradicionalmente confían en su experiencia y recursos especializados para identificar “paralelos”, que son textos que comparten similitudes en la redacción, sintaxis, fórmulas estandarizadas o procedencia.

Eneas acelera enormemente este trabajo complejo y lento. Razona a través de miles de inscripciones latinas, recuperando paralelos textuales y contextuales en segundos que permiten a los historiadores interpretar y aprovechar los hallazgos del modelo.

Nuestro modelo también se puede adaptar a otros idiomas, scripts y medios antiguos, desde papiros hasta monedas, ampliando sus capacidades para ayudar a dibujar conexiones en una gama más amplia de evidencia histórica.

Codegamos a Eneas con la Universidad de Nottingham, y en asociación con investigadores de las universidades de Warwick, Oxford y Atenas, la Universidad de Economía y Negocios (AUEB). Este trabajo fue parte de un esfuerzo más amplio para explorar cómo la IA generativa puede ayudar a los historiadores a identificar e interpretar mejor los paralelos a escala.

Queremos que esta investigación beneficie a tantas personas como sea posible, por lo que estamos haciendo una versión interactiva de Eneas libremente disponibles para investigadores, estudiantes, educadores, profesionales del museo y más PredictarThepast.com. Para apoyar más investigaciones, también estamos abiertos Nuestro código y conjunto de datos.

Capacidades avanzadas de Eneas

Llamado así por el héroe errante de la mitología grecorromana, Eneas se basa en Ithacanuestro trabajo anterior utilizando IA para restaurar, fecha y colocar las antiguas inscripciones griegas.

Eneas va un paso más allá, ayudando a los historiadores a interpretar y contextualizar un texto, dar sentido a los fragmentos aislados, sacar conclusiones más ricas y reconstruir una mejor comprensión de la historia antigua.

Las capacidades avanzadas de nuestro modelo incluyen:

  • Búsqueda de paralelos: Busca paralelos en una vasta colección de inscripciones latinas. Al convertir cada texto en una especie de huella digital histórica, Eneas identifica conexiones profundas que pueden ayudar a los historiadores a ubicar inscripciones dentro de su contexto histórico más amplio.
  • Procesamiento de entrada multimodal: Eneas es el primer modelo en determinar la procedencia geográfica de un texto utilizando entradas multimodales. Analiza tanto el texto como la información visual, como imágenes de una inscripción.
  • Restauración de brechas de longitud desconocida: Por primera vez, Eneas puede restaurar los huecos en los textos donde se desconoce la longitud que falta. Esto lo convierte en una herramienta más versátil para los historiadores que tratan con material muy dañado.
  • Rendimiento de última generación: Eneas establece un nuevo punto de referencia de vanguardia para restaurar los textos dañados y predecir cuándo y dónde fueron escritos.

Animación de un diploma militar de bronce restaurado de Sardinia 113/14 CE (Cil Xvi, 60).

Cómo funciona Eneas

Eneas es una red neuronal generativa multimodal que toma el texto y la imagen de una inscripción como entrada. Para entrenar Eneas, seleccionamos un conjunto de datos grande y confiable, que se basa en décadas de trabajo de los historiadores para crear colecciones digitales, especialmente la Base de datos epigráfica Roma (EDR), Base de datos epigráfico Heidelberg (Edh) y Base de datos epigráfico Clauss Slaby (EDCS-ELT).

Limpiamos, armonizamos y vinculamos estos registros en un solo conjunto de datos aplicable a máquina al que nos referimos como el Conjunto de datos epigráfico latino (LED), que comprende más de 176,000 inscripciones latinas de todo el antiguo mundo romano.

Nuestro modelo utiliza un decodificador basado en transformador para procesar la entrada textual de una inscripción. Las redes especializadas manejan la restauración y las citas de los caracteres utilizando texto, mientras que la atribución geográfica también utiliza imágenes de las inscripciones como entrada. El decodificador recupera inscripciones similares del LED, clasificado por relevancia.

Para cada inscripción, el mecanismo de contextualización de Eneas recupera una lista de paralelos utilizando una técnica llamada “incrustaciones”: codificando la información textual y contextual de cada inscripción en una especie de huella digital histórica que contiene detalles de lo que dice el texto, su lenguaje, cuándo y de dónde proviene y cómo se relaciona con otras inscripciones.

Diagrama de la arquitectura de Eneas que muestra cómo el modelo toma el texto y la entrada de imágenes para generar predicciones de provincia, fecha y restauración.

Actuación de última generación

Inscripciones de grupos de Eneas mediante la fecha de escritura mucho más claramente que otros modelos de propósito general también entrenados en latín, como se muestra en la visualización a continuación.

Visualización de aproximación y proyección de múltiples uniformes (UMAP) que ilustra la atribución cronológica de las incrustaciones históricamente ricas de Eneas en comparación con las incrustaciones textuales genéricas del modelo de lenguaje grande.

Eneas restaura las inscripciones dañadas con una precisión de los 20 mejores del 73% en brechas de hasta diez caracteres. Esto solo disminuye al 58% cuando se desconoce la longitud de la restauración, en sí misma una tarea increíblemente desafiante. También muestra su razonamiento de una manera interpretable, proporcionando mapas de prominencia que resaltan qué partes de las entradas influyeron en sus predicciones. Gracias a su uso de datos visuales, nuestro modelo puede atribuir una inscripción a una de las 62 provincias romanas antiguas con una precisión del 72%. Para las citas, Eneas coloca un texto dentro de los 13 años de los rangos de fecha proporcionados por los historiadores.

Una nueva lente sobre debates históricos

Para probar las capacidades de Eneas en un debate de investigación en curso, le dimos una de las inscripciones romanas más famosas: la Res Gestae Divi Augusti, El relato en primera persona del emperador Augustus sobre sus logros.

Los historiadores han argumentado mucho sobre la datación de esta inscripción. En lugar de predecir una sola fecha fija, Eneas produjo una distribución detallada de posibles fechas, que muestra dos picos distintos, con un pico más pequeño alrededor de 10-1 a. C. y un pico más grande y más seguro entre 10-20 CE. Estos resultados capturaron tanto hipótesis de datación prevalecientes de manera cuantitativa.

Histograma que muestra la predicción de atribución cronológica de Eneas para el Res gestasque modela debates académicos sobre la fecha de esta famosa inscripción.

Eneas basó sus predicciones en características lingüísticas sutiles y marcadores históricos, como títulos oficiales y monumentos mencionados en el texto. Al convertir la pregunta de citas en una estimación probabilística basada en datos lingüísticos y contextuales, nuestro modelo ofrece una nueva forma cuantitativa de involucrarse con debates históricos de larga data.

Lo más importante es que Eneas también recuperó muchos paralelos relevantes de los textos legales imperiales vinculados al legado de Augustus, destacando cómo se reprodujo la ideología del imperio en los medios y la geografía.

Avance de la investigación histórica en colaboración

Para evaluar el impacto de Eneas como una ayuda para la investigación, realizamos un estudio de colaboración historiador y de IA a gran escala. Invitamos a veintitrés historiadores que trabajan regularmente con inscripciones para restaurar, salir y colocar un conjunto de textos usando Eneas.

Nuestra evaluación, resumida en la tabla a continuación, muestra cómo se lograron los resultados más efectivos cuando los historiadores usaron la información contextual de Eneas junto con sus predicciones para restaurar y atribuir inscripciones romanas.

Tabla que muestra el desempeño de los historiadores en tres tareas epigráficas (restauración, atribución geográfica, datación) utilizando 60 inscripciones de nuestro conjunto de pruebas de base de datos. Las tareas se realizaron primero de forma independiente, luego con información paralela a Eneas, o paralelos y predicciones juntos.

Eneas ayudó a los historiadores en nuestro estudio a identificar nuevos paralelos y aumentar su confianza al abordar tareas epigráficas complejas. Los historiadores destacaron constantemente el valor de Eneas para acelerar su trabajo y ampliar el rango de inscripciones paralelas más relevantes.

Los paralelos de Eneas cambiaron por completo mi percepción de la inscripción. Notó detalles que marcaron la diferencia para restaurar y atribuir cronológicamente el texto.

Historiador anónimo de nuestro estudio

Compartir las herramientas, dar forma al futuro

Eneas está diseñado para integrarse dentro de los flujos de trabajo de investigación existentes de los historiadores. Al combinar el conocimiento experto con el aprendizaje automático, abre un proceso de colaboración, ofreciendo sugerencias interpretables que sirven como puntos de partida valiosos para la investigación histórica.

Como parte del lanzamiento de hoy, estamos actualizando Ithacanuestro antiguo modelo griego, para ser alimentado por Eneas e incluir la función de contextualización, las restauraciones de longitud desconocida y un mejor rendimiento en general.

También hemos diseñado codiseñados un nuevo programa de enseñanza para unir habilidades técnicas con pensamiento histórico en el aula. Este plan de estudios se alinea con las iniciativas de alfabetización de IA, incluidas las de la Comisión Europea Marco de competencias digitales para ciudadanos (DigComp 2.2), UNESCO’s Marco de competencia de IA para estudiantesy la vista previa de la Comisión Europea y la Organización para la Cooperación y el Desarrollo Económico (OCDE) Marco de Ailit.

El equipo de Eneas continúa asociándose con diversos expertos en la materia, utilizando Eneas para ayudar a arrojar luz a nuestro pasado antiguo, con más por venir.

Obtenga más información sobre Eneas

Expresiones de gratitud

La investigación fue dirigida por Yannis Assael y Thea Sommerschield.

Los contribuyentes incluyen: Alison Cooley, Brendan Shillingford, John Pavlopoulos, Priyanka Suresh, Bailey Herms, Jonathan Prag, Alex Mullen y Shakir Mohamed. La interfaz web de Eneas fue desarrollada por Justin Grayston, Benjamin Maynard y Nicholas Dietrich, y está impulsado por Google Cloud.

El plan de estudios fue desarrollado por Robbe Wulgaert, Sint-Lievenscollege, Gante, Bélgica.