Integración de efectos estereoelectrónicos en gráficos moleculares: un nuevo enfoque para mejorar las representaciones de aprendizaje automático y las predicciones de propiedades moleculares

Las representaciones moleculares tradicionales, centradas principalmente en los enlaces covalentes, han descuidado aspectos cruciales como la deslocalización y las interacciones no covalentes. Los modelos de aprendizaje automático existentes han utilizado representaciones con poca información, lo que limita su capacidad para captar la complejidad molecular. Si bien la química computacional ha desarrollado métodos mecánico-cuánticos robustos, su aplicación en el aprendizaje automático se ha visto limitada por los desafíos de cálculo para sistemas complejos. Las representaciones basadas en gráficos han proporcionado cierta información topológica, pero carecen de antecedentes químicos-cuánticos.

La creciente complejidad de las tareas de predicción ha puesto de relieve la necesidad de representaciones de mayor fidelidad. Este trabajo aborda estas deficiencias mediante la introducción de gráficos moleculares con infusión de electrónica estereoscópica (SIMG), que incorporan interacciones cuántico-químicas. Los SIMG tienen como objetivo mejorar la interpretabilidad y el rendimiento de los modelos de aprendizaje automático en las predicciones de propiedades moleculares, superando las limitaciones de los enfoques anteriores y proporcionando una comprensión más completa del comportamiento molecular.

La representación molecular es crucial para comprender las reacciones químicas y diseñar nuevos materiales. Los modelos tradicionales utilizan representaciones con poca información, que son inadecuadas para tareas complejas. Este artículo presenta los gráficos moleculares con infusión de estereoelectrónica (SIMG), que incorporan información química cuántica en los gráficos moleculares. Los SIMG mejoran las representaciones tradicionales al agregar nodos para orbitales de enlace y pares solitarios, lo que aborda el descuido de interacciones esenciales como la deslocalización y las fuerzas no covalentes. Este enfoque tiene como objetivo proporcionar una comprensión más integral de las interacciones moleculares, mejorando el rendimiento de los algoritmos de aprendizaje automático en la predicción de propiedades moleculares y permitiendo la evaluación de sistemas previamente intratables, como las proteínas enteras.

Los investigadores emplearon Q-Chem 6.0.1 y NBO 7.0 para los cálculos utilizando una infraestructura de flujo de trabajo de alto rendimiento. Realizaron un análisis de orbitales de enlace natural para cuantificar la información localizada de los electrones, excluyendo los orbitales de Rydberg. El equipo introdujo gráficos moleculares infundidos con electrónica estereoscópica (SIMG), que incorporan efectos estereoelectrónicos y representan interacciones donante-aceptor. Su arquitectura de modelo apiló múltiples bloques de red neuronal de grafos con capas de atención de grafos y activación de ReLU, abordando problemas de suavizado excesivo en redes multicapa. La evaluación del rendimiento se centró en la clasificación de pares solitarios y las predicciones de tareas relacionadas con los enlaces, demostrando una alta precisión y una tasa de reconstrucción del 98 % de los grafos extendidos de verdad fundamental.

El modelo demostró un rendimiento excepcional en varias tareas de predicción, logrando una alta precisión en la clasificación de cantidades y tipos de pares solitarios. Reconstruyó con éxito el gráfico extendido de verdad fundamental en el 98 % de los casos. Las tareas a nivel de nodo mostraron un rendimiento notable, con predicciones relacionadas con átomos que lograron excelentes puntajes R² y MAE y RMSE bajos. Las predicciones de pares solitarios, especialmente para caracteres s y p, lograron puntajes excelentes, mientras que las tareas de predicción d mostraron un rendimiento ligeramente inferior debido a los datos limitados.

Las predicciones de tareas relacionadas con los enlaces fueron favorables, en particular para los caracteres de hibridación y polarizaciones. El rendimiento se correlacionó positivamente con la abundancia de muestras de interacción. La puntuación F1 aseguró mediciones imparciales para clasificaciones desequilibradas, lo que destaca la eficacia del modelo para capturar interacciones de largo alcance. Estos resultados subrayan la integración exitosa de los efectos estereoelectrónicos en los gráficos moleculares, lo que mejora significativamente las capacidades predictivas del modelo en varias propiedades moleculares y, al mismo tiempo, aborda los desafíos asociados con las predicciones de caracteres d.

El estudio concluye que la incorporación de interacciones estereoelectrónicas en gráficos moleculares mejora significativamente el rendimiento del modelo de aprendizaje automático, lo que permite una comprensión detallada de las propiedades y los comportamientos moleculares. Este enfoque permite realizar predicciones para moléculas que antes eran inaccesibles, incluidas estructuras biológicas complejas. La nueva representación facilita el análisis de orbitales de enlace natural de alto rendimiento, lo que potencialmente acelera la investigación en química teórica. El flujo de trabajo de red neuronal de doble gráfico personalizado permite la amplia aplicación de representaciones aprendidas. Estos hallazgos sugieren que una mayor exploración de los efectos estereoelectrónicos podría conducir a modelos más sofisticados, ampliando las aplicaciones en el descubrimiento de fármacos y la ciencia de los materiales. El estudio demuestra el potencial de las representaciones moleculares avanzadas para revolucionar las capacidades predictivas en química y campos relacionados.


Echa un vistazo a la Papel y GitHubTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit de más de 48 000 millones de usuarios

Encuentra lo próximo Seminarios web sobre IA aquí



Shoaib Nazir es pasante de consultoría en MarktechPost y ha completado su doble titulación de máster en tecnología en el Instituto Indio de Tecnología (IIT) de Kharagpur. Siendo un gran apasionado de la ciencia de datos, le interesan especialmente las diversas aplicaciones de la inteligencia artificial en diversos ámbitos. Shoaib está impulsado por el deseo de explorar los últimos avances tecnológicos y sus implicaciones prácticas en la vida cotidiana. Su entusiasmo por la innovación y la resolución de problemas del mundo real alimenta su continuo aprendizaje y contribución al campo de la IA.