Cómo la ciencia forense digital podría demostrar qué es real en la era de los deepfakes

Imagínese este escenario. El año es 2030; Los deepfakes y el contenido generado por inteligencia artificial están en todas partes, y usted es miembro de una nueva profesión: un notario de realidad. Desde su oficina, los clientes le piden que verifique la autenticidad de fotografías, videos, correos electrónicos, contratos, capturas de pantalla, grabaciones de audio, hilos de mensajes de texto, publicaciones en redes sociales y registros biométricos. La gente llega desesperada por proteger su dinero, su reputación y su cordura, y también su libertad.

Los cuatro están en juego un lunes lluvioso cuando una anciana le cuenta que su hijo ha sido acusado de asesinato. Ella lleva las pruebas en su contra: una unidad flash USB que contiene imágenes de vigilancia del tiroteo. Está sellado en una bolsa de plástico grapada a una declaración jurada, lo que explica que la unidad contiene pruebas que la fiscalía pretende utilizar. En la parte inferior hay una cadena de números y letras: un hash criptográfico.

El laboratorio estéril

Sobre el apoyo al periodismo científico

Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado suscribiéndose. Al comprar una suscripción, ayudas a garantizar el futuro de historias impactantes sobre los descubrimientos y las ideas que dan forma a nuestro mundo actual.

El primer paso no es mirar el vídeo; eso sería como recorrer la escena de un crimen. En su lugar, conecta la unidad a una computadora fuera de línea con un bloqueador de escritura, un dispositivo de hardware que evita que los datos se vuelvan a escribir en la unidad. Esto es como llevar pruebas a un laboratorio estéril. La computadora es donde procesas el archivo. El hash criptográfico, una verificación de integridad en la ciencia forense digital, tiene un “efecto avalancha” de modo que cualquier pequeño cambio (un píxel eliminado o un ajuste de audio) da como resultado un código completamente diferente. Si abre la unidad sin protegerla, su computadora podría modificar silenciosamente los metadatos (información sobre el archivo) y no sabrá si el archivo que recibió era el mismo que la fiscalía pretende presentar. Cuando analiza el video, obtiene la misma cadena de números y letras impresas en la declaración jurada.

A continuación, crea una copia y la aplica un hash, verificando que los códigos coincidan. Luego bloquea el original en un archivo seguro. Mueves la copia a una estación de trabajo forense, donde miras el video: lo que parece ser imágenes de una cámara de seguridad que muestra al hijo adulto de la mujer acercándose a un hombre en un callejón, levantando una pistola y disparando. El vídeo es convincente porque es aburrido: no tiene ángulos cinematográficos ni iluminación dramática. De hecho, lo ha visto antes: recientemente comenzó a circular en línea, semanas después del asesinato. La declaración jurada señala el momento exacto en que la policía lo descargó de una plataforma social.

Al mirar las imágenes granuladas, recuerdas por qué haces esto. Todavía estabas en la universidad a mediados de la década de 2020, cuando los deepfakes pasaron de ser una novedad a convertirse en un gran negocio. Las empresas de verificación informaron que los deepfakes se multiplicaron por 10 entre 2022 y 2023, y los ataques de intercambio de caras aumentaron más del 700 por ciento en solo seis meses. En 2024, cada cinco minutos se produciría un intento de fraude deepfake. Tenías amigos cuyas cuentas bancarias fueron vaciadas y tus abuelos transfirieron miles de dólares a un estafador de secuestro virtual después de recibir fotografías alteradas de tu prima mientras viajaba por Europa. Entraste en esta profesión porque viste cómo una sola mentira podía arruinar una vida.

Huellas digitales

El siguiente paso para analizar el vídeo es realizar una verificación de procedencia. En 2021, se fundó la Coalición para la procedencia y autenticidad del contenido (C2PA) para desarrollar un estándar para rastrear el historial de un archivo. Las credenciales de contenido C2PA funcionan como un pasaporte y recogen sellos a medida que el archivo avanza por el mundo. Si el vídeo tiene alguno, puedes realizar un seguimiento de su creación y modificaciones. Pero la mayoría ha tardado en adoptarse y las credenciales de contenido a menudo se eliminan a medida que los archivos circulan en línea. En una prueba del Washington Post de 2025, los periodistas adjuntaron credenciales de contenido a un video generado por IA, pero todas las plataformas importantes donde lo subieron eliminaron los datos.

Luego abre los metadatos del archivo, aunque rara vez sobrevive a las transferencias en línea. Las marcas de tiempo no coinciden con la hora del asesinato. Se restablecieron en algún momento (ahora todos aparecen como medianoche) y el campo del dispositivo está en blanco. La etiqueta de software le indica que el archivo se guardó por última vez mediante el tipo de codificador de video común utilizado por las plataformas sociales. Nada indica que el clip proceda directamente de un sistema de vigilancia.

Cuando consulta los expedientes judiciales públicos en el caso de homicidio, descubre que el dueño de la propiedad con la cámara de seguridad tardó en responder a la solicitud de la policía. El sistema de vigilancia estaba configurado para sobrescribir datos cada 72 horas y cuando la policía accedió a él, las imágenes habían desaparecido. Esto es lo que hizo que la aparición anónima del vídeo en línea (con el asesinato mostrado desde el ángulo exacto de esa cámara de seguridad) fuera una sensación.

La física del engaño

Comienzas la investigación en Internet que los investigadores llaman inteligencia de código abierto u OSINT. Le indicas a un agente de inteligencia artificial que busque una copia anterior del video. Después de ocho minutos, entrega los resultados. Un video publicado dos horas antes de la descarga policial muestra un registro parcial que dice que la grabación se realizó con un teléfono.

La razón por la que está encontrando datos de C2PA es que empresas como Truepic y Qualcomm desarrollaron formas para que teléfonos y cámaras firmen criptográficamente el contenido en el punto de captura. Lo que está claro ahora es que el vídeo no provino de una cámara de seguridad.

Lo vuelves a ver por física que no tiene sentido. Los fotogramas ralentizados pasan como un libro animado. Miras las sombras, las líneas de la puerta de un callejón. Luego, en el borde de una pared, parpadea una luz que no debería estar allí. No es el parpadeo de una bombilla sino un brillo rítmico. Alguien filmó una pantalla.

El parpadeo es señal de que dos relojes no están sincronizados. La cámara de un teléfono escanea el mundo línea por línea, de arriba a abajo, muchas veces por segundo, mientras que la pantalla se actualiza en ciclos: 60, 90 o 120 veces por segundo. Cuando un teléfono graba una pantalla, puede capturar el brillo de la actualización de la pantalla. Pero esto todavía no te dice si la pantalla grabada mostró la verdad. Es posible que alguien simplemente haya grabado el monitor de vigilancia original para guardar el metraje antes de que se sobrescribiera. Para demostrar que se trata de un deepfake, hay que mirar más profundamente.

Artefactos de lo falso

Ahora busca marcas de agua: patrones estadísticos invisibles dentro de la imagen. Por ejemplo, SynthID es la marca de agua de Google DeepMind para el contenido de IA creado por Google. Su software encuentra indicios de lo que podría ser una marca de agua, pero nada seguro. Recortar, comprimir o filmar una pantalla puede dañar las marcas de agua y dejar sólo rastros, como los de palabras borradas en papel. Esto no significa que la IA haya generado toda la escena; sugiere que un sistema de inteligencia artificial pudo haber alterado el metraje antes de que se grabara la pantalla.

Luego lo pasas por un detector de falsificaciones como Reality Defender. El análisis señala anomalías alrededor del rostro del tirador. Divides el vídeo en imágenes fijas. Se utiliza el complemento InVID-WeVerify para extraer marcos claros y realizar búsquedas de imágenes inversas en el rostro del hijo acusado para ver si apareció en otro contexto. No surge nada.

En el camino hay otras pruebas, incluidas imágenes más recientes de la misma cámara. Los ladrillos se alinean con el video. Esta no es una escena inventada.

Regresas a la cara del tirador. La iluminación del callejón es dura y proyecta una veta distintiva. Su chaqueta, sus manos y la pared detrás de él tienen un ruido digital áspero, pero su rostro no. Es un poco más suave y proviene de una fuente más limpia.

Las cámaras de seguridad desenfocan claramente los objetos en movimiento y sus imágenes se comprimen. El tirador tiene esa cualidad borrosa y en bloques a excepción de su rostro. Vuelves a mirar el vídeo, ampliado solo en la cara. El contorno de la mandíbula tiembla levemente: dos capas están ligeramente desalineadas.

El cálculo final

Regresas al momento en que aparece el tirador. Levanta el arma en su mano izquierda. Llamas a la mujer. Ella te dice que su hijo es diestro y te envía videos de él practicando deportes cuando era adolescente.

Por último vas al callejón. Los registros de mantenimiento del edificio enumeran la cámara a 12 pies de altura. Se mide su altura y su ángulo descendente, utilizando trigonometría básica para calcular la altura del tirador: tres pulgadas más alto que el hijo de la mujer.

El video ahora tiene sentido: se hizo clonando el rostro del hijo, usando un generador de inteligencia artificial para superponerlo al tirador y grabando la pantalla con un teléfono para eliminar la marca de agua del generador. Inteligentemente, quien hizo esto eligió un teléfono que generaría credenciales de contenido, de modo que los espectadores vieran una afirmación firmada criptográficamente de que el clip fue grabado en ese teléfono y que no se declararon ediciones después de la captura. Al hacer esto, el creador del video esencialmente falsificó un certificado de autenticidad para una mentira.

El documento notariado que enviará al defensor público no se leerá como una novela de suspense sino como un informe de laboratorio. En 2030, un “notario de la realidad” ya no es ciencia ficción; es la persona cuyos servicios utilizamos para garantizar que las personas y las instituciones sean lo que parecen ser.