En genética, un proceso crucial llamado escisión y poliadenilación (poliA) asegura la maduración adecuada del ARNm. Este proceso implica cortar una transcripción recién formada y agregar una cola de nucleótidos de adenina. Sin embargo, si este proceso no se optimiza con la estructura genética circundante, puede provocar una terminación prematura de la transcripción y la creación de proteínas anormales. Investigadores de la Universidad Northwestern han desarrollado modelos de aprendizaje profundo para comprender mejor esto en todo el genoma humano. Estos modelos ayudan a identificar posibles sitios poliA con una precisión increíblemente detallada, midiendo su fuerza y uso en el contexto genómico.
Los métodos existentes para predecir sitios poliA tienen limitaciones. Algunos modelos calculan la probabilidad de que una secuencia sea un sitio poliA pero no predicen la ubicación exacta del sitio de escisión. Otros están restringidos a sitios poliA conocidos, lo que los hace menos versátiles. El nuevo modelo de aprendizaje profundo supera estos desafíos. Identifica sitios potenciales de poliA en todo el genoma humano y calcula su fuerza, proporcionando una comprensión más completa del proceso.
La fortaleza de estos modelos es su capacidad para cuantificar la importancia de motivos particulares y sus interacciones durante la formación de sitios poliA. La señal de poliadenilación (PAS) y otros motivos cruciales se encuentran entre los elementos reguladores cis distintivos que identifican y tienen en cuenta la compleja danza de diferentes proteínas de unión a ARN. Esto significa que los investigadores ahora pueden examinar con mayor detalle las interacciones de estos componentes y cómo interactúan para formar sitios poliA.
Para demostrar las capacidades de estos modelos, los científicos utilizaron la regresión logística para estudiar los parámetros genómicos que influyen en la expresión del sitio poliA en diferentes regiones genéticas. Descubrieron que el paisaje de empalme circundante influye en la expresión intrónica del sitio. Por el contrario, el uso de sitios poliA alternativos en exones terminales se ve afectado por sus ubicaciones relativas y distancias a los genes posteriores. Esto significa que los modelos identifican sitios potenciales y brindan información sobre cómo se regulan estos sitios en función de su contexto genómico.
Significativamente, utilizando estos modelos se encontraron miles de variantes genéticas relacionadas con enfermedades y características que afectan la actividad de poliadenilación. Esto demuestra cómo los modelos se pueden utilizar en la práctica para comprender los mecanismos moleculares subyacentes a una variedad de afecciones médicas.
En resumen, la creación de estos modelos de aprendizaje profundo es un gran paso hacia la comprensión del intrincado mundo de la poliadenilación. Al proporcionar una perspectiva más refinada sobre los supuestos sitios poliA y sus componentes reguladores, los investigadores pueden adquirir una comprensión significativa de los procesos moleculares que regulan la expresión genética y sus funciones en los trastornos humanos.
Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 34k+ ML, 41k+ comunidad de Facebook, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.
Si te gusta nuestro trabajo, te encantará nuestra newsletter.
Niharika es pasante de consultoría técnica en Marktechpost. Es estudiante de tercer año y actualmente cursa su licenciatura en tecnología en el Instituto Indio de Tecnología (IIT), Kharagpur. Es una persona muy entusiasta con un gran interés en el aprendizaje automático, la ciencia de datos y la inteligencia artificial y una ávida lectora de los últimos avances en estos campos.