Investigadores de Harvard presentan un enfoque de aprendizaje automático basado en procesos gaussianos que se ajusta a los niveles de energía de partículas individuales

Uno de los principales desafíos de la teoría funcional de la densidad (DFT) semilocal es la subestimación constante de los intervalos de banda, debido principalmente a errores de autointeracción y deslocalización. Este problema complica la predicción de las propiedades electrónicas y los mecanismos de transferencia de carga. La DFT híbrida, que incorpora una fracción de la energía de intercambio exacta, ofrece predicciones mejoradas de intervalos de banda, pero a menudo requiere un ajuste específico del sistema. Han surgido enfoques de aprendizaje automático para mejorar la precisión de la DFT, en particular para energías de reacción molecular y sistemas fuertemente correlacionados. El ajuste explícito de los intervalos de energía, como lo demuestra el funcional DM21, podría mejorar las predicciones de la DFT al abordar los errores de autointeracción.

Los investigadores de Harvard SEAS han desarrollado un método de aprendizaje automático que utiliza procesos gaussianos para mejorar la precisión de los funcionales de densidad para predecir brechas de energía y energías de reacción. Su modelo integra características no locales de la matriz de densidad para pronosticar brechas de energía molecular con precisión y estimar energías de formación de polarones en sólidos, a pesar de que se entrenó exclusivamente con datos moleculares. Este avance se basa en el marco CIDER, que es conocido por su eficiencia y escalabilidad en el manejo de sistemas grandes. Aunque el modelo actualmente apunta a la energía de intercambio, es prometedor para aplicaciones más amplias, incluida la predicción de propiedades electrónicas como brechas de banda.

El estudio presenta conceptos y métodos clave para ajustar funcionales de correlación de intercambio (XC) en DFT, centrándose en la predicción de brechas de banda y energías de partículas individuales. Abarca la aplicación de la regresión de proceso gaussiano para modelar funcionales XC, incorporando características de entrenamiento que mejoran la precisión. La base teórica se basa en el teorema de Janak y el concepto de discontinuidad derivada, que son cruciales para predecir propiedades como potenciales de ionización, afinidades electrónicas y brechas de banda dentro de la DFT generalizada de Kohn-Sham. El enfoque tiene como objetivo mejorar el entrenamiento funcional abordando los desafíos de la ocupación orbital y las discontinuidades derivadas.

El modelo de intercambio de energía CIDER24X se desarrolló utilizando un proceso gaussiano, lo que mejora la flexibilidad. Se eligieron características clave para lograr una covarianza mínima, se ajustaron a un rango específico y se emplearon para entrenar una red neuronal densa que se aproxima al proceso gaussiano. Los datos de entrenamiento comprendían energía de intercambio de gases de electrones uniforme, diferencias de energía molecular y niveles de energía obtenidos de bases de datos como W4-11, G21IP y 3d-SSIP30. Se crearon dos variantes del modelo CIDER24X: una que incorpora datos de niveles de energía (CIDER24X-e) y otra que los excluye (CIDER24X-ne) para evaluar el efecto de incluir niveles de energía en el proceso de ajuste.

El estudio presenta el modelo CIDER24X con características SDMX, que muestra una precisión predictiva mejorada para energías moleculares y brechas HOMO-LUMO en comparación con modelos anteriores y funcionales semilocales. CIDER24X-ne, entrenado sin niveles de energía, se alinea estrechamente con PBE0, mientras que CIDER24X-e, que incluye datos de niveles de energía, ofrece un mejor equilibrio entre las predicciones de energía y brecha de banda. Aunque existen compensaciones, particularmente con el entrenamiento de valores propios, CIDER24X-e supera a los funcionales semilocales y se acerca a la precisión de DFT híbrida, lo que lo convierte en una alternativa prometedora que reduce los costos computacionales.

En conclusión, el estudio presenta un marco para ajustar los funcionales de densidad a los niveles de energía total y de partícula individual mediante aprendizaje automático, aprovechando el teorema de Janak. Se introduce un nuevo conjunto de características, SDMX, para aprender la función de intercambio sin requerir el operador de intercambio completo. El modelo, CIDER24X-e, mantiene la precisión en energías moleculares al tiempo que mejora significativamente las predicciones de brecha de energía, coincidiendo con los resultados de DFT híbridos. El marco es extensible a funcionales XC completos y otros modelos de aprendizaje automático, lo que ofrece el potencial de predicciones de propiedades electrónicas eficientes y precisas en diversos sistemas.


Echa un vistazo a la PapelTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit con más de 50 000 millones de usuarios

A continuación se muestra un seminario web muy recomendado por nuestro patrocinador: ‘Desarrollo de aplicaciones de IA de alto rendimiento con NVIDIA NIM y Haystack’


Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en el IIT Madrás, es un apasionado de la aplicación de la tecnología y la IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una perspectiva nueva a la intersección de la IA y las soluciones de la vida real.