Por qué los registros gubernamentales digitales son tan difíciles de preservar

En mayo, un juez federal ordenó al personal de la Casa Blanca que cumpliera con la Ley de Registros Presidenciales, la ley de 1978 que convierte los registros oficiales del presidente en propiedad pública y rige su preservación y eventual divulgación.

Un mes antes, el Departamento de Justicia había argumentado que la ley excede la autoridad constitucional del Congreso. La Asociación Histórica Estadounidense y el grupo de vigilancia American Oversight demandaron, advirtiendo que la opinión podría permitir a la Casa Blanca abandonar políticas destinadas a impedir que los funcionarios realicen asuntos gubernamentales a través de correo electrónico personal o mensajes cifrados. El riesgo, argumentaron, era una pérdida actual de responsabilidad y una brecha permanente en el registro histórico.

Hasta ahora, el juez John D. Bates ha considerado que la ley es “probablemente constitucional”. Pero la lucha judicial es sólo una parte de un desafío mucho más amplio. Los registros que revelan cómo los gobiernos y las figuras públicas toman decisiones ahora nacen en el correo electrónico, las aplicaciones de chat y los documentos en la nube, a menudo dentro de sistemas propietarios cuya vida útil se mide en ciclos de productos. Preservarlos el tiempo suficiente para que el público los vea se ha convertido en un problema técnico en sí mismo, que se vuelve más difícil a medida que aumenta el volumen. Los Archivos Nacionales agregaron 463 terabytes de registros electrónicos a su colección permanente solo en 2024.

Sobre el apoyo al periodismo científico

Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado suscribiéndose. Al comprar una suscripción, ayudas a garantizar el futuro de historias impactantes sobre los descubrimientos y las ideas que dan forma a nuestro mundo actual.

“El mundo está creando registros digitales a un ritmo que ninguna organización anticipó”, afirma Mike Quinn, director ejecutivo de la empresa de preservación digital Preservica.

Antes de que los archiveros puedan preservar un documento, éste debe sobrevivir el tiempo suficiente para llegar a sus manos. Las leyes de registros públicos pueden exigir su preservación, y existe tecnología para capturar y almacenar mensajes incluso desde algunas plataformas cifradas cuando las cuentas o dispositivos están configurados para conservarlos. La empresa de preservación digital Smarsh, por ejemplo, anuncia que puede capturar datos de más de 100 canales de comunicación. Pero incidentes recientes sugieren con qué facilidad aún pueden desaparecer registros importantes, desde funcionarios del gabinete estadounidense que discuten planes militares a través de la aplicación cifrada Signal hasta el supuesto uso por parte del Primer Ministro del Reino Unido, Keir Starmer, de mensajes de WhatsApp que desaparecen.

La misma fragilidad también afecta a los archivos privados. Incluso cuando individuos como políticos o artistas –o sus patrimonios– donan documentos físicos a una biblioteca universitaria, el material digital que alguna vez estuvo junto a ellos puede pasarse por alto y perderse, dice Thorsten Ries, profesor asistente de la Universidad de Texas en Austin que aplica técnicas forenses digitales al trabajo de archivo.

Sacar los datos de un disco duro o unidad USB sin alterar archivos o metadatos como marcas de tiempo también requiere habilidad, dice Ries. Diferentes versiones de software, e incluso diferentes medios de almacenamiento, pueden conservar diferentes fragmentos de archivos y copias de seguridad automáticas. Estos ofrecen pistas valiosas sobre cómo se redactó un documento y cómo pensaron sus creadores, pero recuperarlos e interpretarlos es un trabajo minucioso y especializado. “Este tipo de conocimientos y experiencia son todavía muy escasos”, afirma.

Los sistemas basados en la nube, como Google Docs, pueden contener los historiales de archivos más detallados de todos, pero extraer archivos de ellos sin las contraseñas originales y la autenticación de dos factores es su propio desafío, añade.

La supervivencia es sólo el primer paso; el material también debe permanecer legible a medida que cambia el software. “Todos estos tipos de contenido digital no envejecen como el papel”, afirma Quinn. “Se vuelven ilegibles cuando los formatos se vuelven obsoletos”.

Esto a menudo requiere migrar periódicamente material como documentos de procesamiento de textos, hojas de cálculo y archivos de diseño asistido por computadora a los formatos de archivo actuales y, al mismo tiempo, mantener un registro cuidadoso de exactamente lo que se ha hecho. Si se manejan descuidadamente, esas conversiones pueden tergiversar el original, dice Christopher J. Prom de la biblioteca Urbana-Champaign de la Universidad de Illinois. Eso parece ser lo que sucedió cuando el Departamento de Justicia publicó correos electrónicos vinculados al fallecido financiero y delincuente sexual Jeffrey Epstein que estaban empañados por errores de representación.

Un archivo conservado aún puede resultar difícil de utilizar. Los archivos digitales pueden contener material protegido por derechos de autor junto con correspondencia confidencial, incluidos mensajes personales y facturas médicas, en las mismas bandejas de entrada y carpetas que los archivos que desea un investigador. Eso hace que las instituciones sean cautelosas a la hora de abrir colecciones de forma amplia. Y aunque en teoría un archivo digital podría abrirse desde cualquier lugar con conexión a Internet, los archivos todavía requieren una visita in situ de forma rutinaria, si es que permiten el acceso, dice Lise Jaillant, profesora de patrimonio cultural digital en la Universidad de Loughborough. Los investigadores deben programar y pagar los viajes y luego revisar enormes colecciones de sistemas potencialmente desconocidos en el tiempo que tengan.

Los “volumenes asombrosos” de material digital producido por agencias gubernamentales estadounidenses también han ralentizado el manejo de las solicitudes de la Ley de Libertad de Información, dice Jason R. Baron, profesor de la Facultad de Información de la Universidad de Maryland y ex director de litigios de la Administración Nacional de Archivos y Registros. Las agencias primero deben intentar localizar archivos potencialmente relevantes, a menudo mediante búsquedas por palabras clave, y luego eliminar o redactar cualquier cosa clasificada, sensible o exenta de divulgación.

“No es inusual que un solicitante espere años o incluso, en algunos casos, más de una década para recibir respuestas completas”, dice Baron.

La automatización puede ayudar, con una supervisión humana sustancial. En un artículo de 2025, Baron exploró el uso de inteligencia artificial y técnicas de aprendizaje automático para marcar párrafos que probablemente estén exentos bajo la disposición de la FOIA que protege el “proceso deliberativo” de una agencia. El software también puede ayudar a detectar información confidencial, como números de Seguro Social, y extraer texto de documentos escaneados o videos archivados mediante el reconocimiento óptico de caracteres y la transcripción automática.

La IA también puede mostrar archivos relevantes para una pregunta particular en un archivo en expansión, incluidos documentos que una simple búsqueda por palabra clave pasaría por alto. Como señala Baron, las mismas técnicas ya se utilizan en litigios por descubrimiento electrónico, cuando a menudo se deben buscar grandes conjuntos de archivos corporativos, correos electrónicos y otros registros en busca de material relacionado con una demanda.

Aún así, persisten desafíos, dice Jaillant, quien lidera un proyecto internacional sobre las aplicaciones de la IA a los registros gubernamentales. Uno es la escasez de datos de correo electrónico disponibles públicamente para entrenar a la IA para manejar mensajes de diversos tipos y orígenes. En parte debido a preocupaciones de privacidad, los investigadores todavía se apoyan a menudo en un conjunto de mensajes de hace décadas que los investigadores gubernamentales obtuvieron de Enron, dice Jaillant.

E incluso a medida que la IA mejora en el análisis del material de archivo, es poco probable que libere a los investigadores humanos de la necesidad de leer ellos mismos los documentos relevantes. “Sigue siendo importante que un usuario humano vuelva a los documentos y pueda leer correos electrónicos individuales sólo para comprender el contexto”, afirma.

Todo eso supone que los registros sobrevivan el tiempo suficiente para ser leídos, que es precisamente lo que la lucha en Washington ha puesto en duda. Los archiveros, y el software del que dependen, están trabajando para asegurarse de que así sea, antes de que los registros de las decisiones de hoy queden atrapados en formatos muertos o borrados de los hilos de mensajes sin que el público tenga la oportunidad de verlos.

Por qué los registros gubernamentales digitales son tan difíciles de preservar

ByEquipo de 7 minutos

Sobre el apoyo al periodismo científico

By Equipo de 7 minutos

Related Post

La primera evidencia de colmillos de araña descubierta en fósiles de 500 millones de años: ScienceAlert

Cómo Trump ayudó a China a fabricar el vehículo eléctrico más barato de Estados Unidos

¿Quieres tu ropa interior con probióticos añadidos?

You missed

Lo que sabemos sobre las medidas enérgicas previstas en España contra los propietarios de alquileres a corto plazo

Jordana Brewster detalla la cirugía cerebral para una malformación cavernosa

La primera evidencia de colmillos de araña descubierta en fósiles de 500 millones de años: ScienceAlert

La caída de Trump continúa con un informe de empleo sombrío