AI puede decodificar datos digitales almacenados en ADN en minutos en lugar de días

El ADN puede almacenar datos digitales, como archivos visuales y de audio

Science Picture Co / Alamy

La inteligencia artificial puede leer datos almacenados en hilos de ADN en 10 minutos en lugar de los días requeridos para métodos anteriores, acercando el almacenamiento de ADN al uso práctico en la informática.

“El ADN puede almacenar grandes cantidades de datos en una forma extremadamente compacta y permanecer intacta durante miles de años”, dice Daniella Bar-Lev en la Universidad de California, San Diego. “Además, el ADN es naturalmente replicable, ofreciendo una ventaja única para la preservación de datos a largo plazo”.

Pero recuperar la información codificada dentro del ADN es un desafío monumental porque los hilos se mezclan y se juntan cuando se almacenan. Durante el proceso de codificación de datos, los hilos individuales a veces se replican de manera imperfecta, y algunos fragmentos pueden perderse por completo. Como resultado, la lectura de los datos almacenados en el ADN puede parecerse a la reconstrucción de un libro de una caja llena de páginas ralladas y hipotrías.

“Los métodos tradicionales luchan con este caos, que requieren días de procesamiento”, dice Bar-Lev. El nuevo enfoque “agiliza esto con IA entrenada para detectar patrones en el ruido”, dice ella.

Bar-Lev y sus colegas desarrollaron un método con AI llamado ADNformer que puede decodificar de manera rápida y precisa las secuencias de ADN confundidas. El sistema incluye un modelo de IA de aprendizaje profundo capacitado para reconstruir secuencias de ADN, un algoritmo informático separado que identifica y corrige errores y un tercer algoritmo de decodificación que convierte todo en datos digitales al tiempo que repara cualquier error restante.

En experimentos, el ADNformer podría leer 100 megabytes de datos almacenados en ADN casi 90 veces más rápido que el siguiente método más rápido, que se desarrolló con algoritmos de computación basados ​​en reglas tradicionales, al tiempo que logró una precisión mejor o comparable. Los datos decodificados incluyeron una imagen coloreada de tubos de ensayo, un clip de audio de 24 segundos del famoso discurso de aterrizaje de luna de astronauta Neil Armstrong y texto escrito sobre por qué el ADN es un medio prometedor de almacenamiento de datos.

El equipo planea desarrollar versiones de DNAformer adaptadas a técnicas más nuevas para codificar datos en ADN, dice Omer Sabary en Technion – Instituto de Tecnología de Israel.

“Crucialmente, porque nuestro enfoque no depende de [DNA] Métodos de síntesis o secuenciación, se puede adaptar a tecnologías futuras, aún no desarrolladas, que pueden ser más comercialmente viables ”, dice.

Temas: