Redes neuronales basadas en la física (PINN) son un tipo especial de redes neuronales. Estiman soluciones a ecuaciones diferenciales parciales incorporando las leyes físicas que rigen un conjunto de datos determinado en el proceso de aprendizaje.
Un ejemplo de tal ecuación es la ecuación invisible de Burgers, un prototipo de leyes de conservación que pueden desarrollar ondas de choque.
La literatura actual lucha por abordar eficazmente este problema. Como las ondas de choque no son soluciones continuas, sólo satisfacen las ecuaciones en un sentido débil. Modelos de tiempo continuo que dependen únicamente de muestras de entrenamiento, como el método de diferenciación algorítmica, no pueden capturar ondas de choque. Estos métodos sólo son aplicables a casos de regularidad funcional.
Se podría intentar utilizar Modelos de tiempo discreto donde las redes neuronales y la discretización del tiempo trabajan juntas para ayudar al modelo a formular shocks. Sin embargo, este método disminuye un poco las ventajas de las redes neuronales basadas en la física (PINN) y vuelve a los métodos numéricos tradicionales. Esto puede resultar un desafío para alguien que comprende las ecuaciones pero no está familiarizado con las soluciones numéricas.
En este artículo, abordaré las limitaciones de los modelos de tiempo continuo existentes de los métodos PINN para la ecuación de Burgers. Introduciré cálculos para discontinuidades y soluciones débiles basados en diferenciación algorítmica, lo que permitirá que la ecuación capture los shocks. Este artículo podría inspirar a quienes estén interesados en la intersección de las redes neuronales y el modelado basado en la física, especialmente en dominios relacionados con las leyes de conservación.
Sin embargo, cabe señalar que este método sólo ha mostrado resultados prometedores para una de las ecuaciones hiperbólicas unidimensionales más simples. Si se puede extender a dimensiones superiores o ecuaciones más complejas es un aspecto que el autor no ha explorado, e invito a los lectores a contribuir con sus propias ideas y recursos sobre este tema.
Según el original papel: “Las redes neuronales informadas por la física (PINN) están entrenadas para resolver tareas de aprendizaje supervisado respetando las leyes de la física dadas, descritas por ecuaciones diferenciales parciales (PDE) no lineales generales. “
Estas PDE toman la siguiente forma en general [1]:
tu + norte [u] = 0, x ∈ Ω, t ∈ [0, T],
donde u(t, x) representa la solución, N [·] es un operador diferencial no lineal y Ω es un subconjunto del espacio d-dimensional.
Denotemos por
L(u) = ut + N [u].
Se puede ver inmediatamente que f=0 si u es la solución de la ecuación. Construiremos la solución u como una red neuronal.
u = neural_net(t,x;pesos)
donde las entradas son las variables de tiempo y espacio. Determinamos los pesos minimizando el error cuadrático medio de f (como se dijo antes, L(u) debe estar cerca de 0 si u es la solución de la ecuación) y ciertas condiciones iniciales y de contorno. Para obtener más detalles, consulte el artículo original.
Ahora, consideremos la ecuación de Burgers invisible unidimensional:
La solución de la ecuación, cumpliendo la condición inicial, se puede construir implícitamente utilizando la método de características, es decir, u=f(x-ut) con la curva característica x