Joshua Sortino Lqkhndzsf 8 Unsplash.jpg

En campos como la física y la ingeniería, las ecuaciones diferenciales parciales (PDE) se utilizan para modelar procesos físicos complejos y generar información sobre cómo funcionan algunos de los sistemas físicos y naturales más complicados del mundo.

Para resolver estas difíciles ecuaciones, los investigadores utilizan solucionadores numéricos de alta fidelidad, cuya ejecución puede consumir mucho tiempo y ser costosa desde el punto de vista computacional. Los modelos alternativos simplificados actuales, basados ​​en datos, calculan la propiedad objetivo de una solución para las PDE en lugar de la solución completa. Estos están entrenados en un conjunto de datos generados por el solucionador de alta fidelidad, para predecir la salida de las PDE para nuevas entradas. Esto requiere un uso intensivo de datos y es costoso porque los sistemas físicos complejos requieren una gran cantidad de simulaciones para generar suficientes datos.

En un nuevo artículo, “Sustitutos profundos mejorados por la física para ecuaciones diferenciales parciales”, publicado en diciembre en Inteligencia de la máquina de la naturalezase propone un nuevo método para desarrollar modelos sustitutos basados ​​en datos para sistemas físicos complejos en campos como la mecánica, la óptica, el transporte térmico, la dinámica de fluidos, la química física y los modelos climáticos.

El artículo fue escrito por el profesor de matemáticas aplicadas del MIT. Steven G. Johnson junto con Payel Das y Youssef Mroueh del MIT-IBM Watson AI Lab e IBM Research; Chris Rackauckas de Laboratorio Julia; y Rafael Pestourie, un ex postdoctorado del MIT que ahora está en Georgia Tech. Los autores llaman a su método «sustituto profundo mejorado por la física» (PEDS), que combina un simulador de física explicable de baja fidelidad con un generador de red neuronal. El generador de redes neuronales está entrenado de un extremo a otro para que coincida con la salida del solucionador numérico de alta fidelidad.

«Mi aspiración es reemplazar el proceso ineficiente de prueba y error con simulación y optimización sistemáticas asistidas por computadora», dice Pestourie. “Los avances recientes en IA, como el modelo de lenguaje grande de ChatGPT, se basan en cientos de miles de millones de parámetros y requieren grandes cantidades de recursos para capacitarlos y evaluarlos. Por el contrario, PEDS es asequible para todos porque es increíblemente eficiente en recursos informáticos y tiene una barrera muy baja en términos de infraestructura necesaria para usarlo”.

En el artículo, muestran que los sustitutos de PEDS pueden ser hasta tres veces más precisos que un conjunto de redes neuronales de avance con datos limitados (aproximadamente 1000 puntos de entrenamiento) y reducir los datos de entrenamiento necesarios en al menos un factor de 100 para lograr un error objetivo del 5 por ciento. Desarrollado utilizando el diseño del MIT lenguaje de programación juliaeste método científico de aprendizaje automático es eficiente tanto en informática como en datos.

Los autores también informan que PEDS proporciona una estrategia general basada en datos para cerrar la brecha entre una amplia gama de modelos físicos simplificados con los correspondientes solucionadores numéricos de fuerza bruta que modelan sistemas complejos. Esta técnica ofrece precisión, velocidad, eficiencia de datos e información física sobre el proceso.

Dice Pestourie: “Desde la década de 2000, a medida que mejoraron las capacidades informáticas, la tendencia de los modelos científicos ha sido aumentar el número de parámetros para ajustarse mejor a los datos, a veces a costa de una menor precisión predictiva. PEDS hace lo contrario, eligiendo inteligentemente sus parámetros. Aprovecha la tecnología de diferenciación automática para entrenar una red neuronal que hace que un modelo con pocos parámetros sea preciso”.

«El principal desafío que impide que los modelos sustitutos se utilicen más ampliamente en ingeniería es la maldición de la dimensionalidad: el hecho de que los datos necesarios para entrenar un modelo aumentan exponencialmente con el número de variables del modelo», dice Pestourie. «PEDS reduce esta maldición incorporando información de los datos y del conocimiento de campo en forma de un solucionador de modelos de baja fidelidad».

Los investigadores dicen que PEDS tiene el potencial de revivir todo un cuerpo de literatura anterior al 2000 dedicada a modelos mínimos: modelos intuitivos que PEDS podrían hacer más precisos y al mismo tiempo ser predictivos para aplicaciones de modelos sustitutos.

«La aplicación del marco PEDS va más allá de lo que mostramos en este estudio», dice Das. «Los sistemas físicos complejos gobernados por PDE son ubicuos, desde el modelado climático hasta el modelado sísmico y más. Nuestros modelos sustitutos, rápidos y explicables, inspirados en la física, serán de gran utilidad en esas aplicaciones y desempeña un papel complementario a otras técnicas emergentes, como los modelos de cimentación».

La investigación contó con el apoyo del Laboratorio de IA Watson del MIT-IBM y la Oficina de Investigación del Ejército de EE. UU. a través del Instituto de Nanotecnologías para Soldados.

Por automata