Los investigadores de la Universidad de Bath desarrollaron un método de entrenamiento de aprendizaje automático eficiente y estable para ODES neuronales con O (1) Fuella de la memoria

Las ecuaciones diferenciales ordinarias neuronales son significativas en el modelado científico y el análisis de series de tiempo donde los datos cambian en cualquier otro momento. Este marco inspirado en la red neuronal modela la dinámica de tiempo continuo con una capa de transformación continua gobernada por ecuaciones diferenciales, que los distingue de las redes neuronales de vainilla. Si bien las ODES neurales han tomado medidas enérgicas en el manejo de series dinámicas de manera eficiente, el cálculo de gradiente rentable para la backpropagation es un gran desafío que limita su utilidad.

Hasta ahora, el método estándar para N-ODES ha sido el punto de control recursivo que encuentra un terreno medio entre el uso de la memoria y el cálculo. Sin embargo, este método a menudo presenta ineficiencias, lo que lleva a un aumento tanto en la memoria como en el tiempo de procesamiento. Este artículo analiza la última investigación que aborda este problema a través de una clase de solucionadores ODE algebraicamente reversibles.

Investigadores de la Universidad de Bath introducen una novela aprendizaje automático Marco para abordar el problema de la propagación de retroceso en los métodos de punto de control recursivos de última generación en solucionadores de oda neuronal. Los autores introducen una clase de solucionadores algebraicamente reversibles que permite la reconstrucción exacta del estado del solucionador en cualquier momento sin almacenar operaciones numéricas intermedias. Estas innovaciones conducen a una mejora significativa en la eficiencia general del proceso con un consumo de memoria reducido y gastos generales computacionales. La característica contrastante de esta investigación que eclipsa este enfoque es su complejidad espacial. Mientras que los solucionadores convencionales operan O (n log n), el solucionador propuesto tiene o (n) complejidad para la operación y el consumo de memoria o (1).

El marco de solucionador propuesto permite que cualquier solucionador numérico de un solo paso sea reversible al permitir la recomputación dinámica del resolución hacia adelante durante la propagación de retroceso. Este enfoque, por lo tanto, garantiza un cálculo exacto en el gradiente al tiempo que logra una convergencia de alto orden y una mejor estabilidad numérica. El trabajo del método se detalla aún más: en lugar de almacenar cada estado intermedio durante el pase hacia adelante, el algoritmo se reconstruye matemáticamente en orden inverso durante el pase hacia atrás. Además, al introducir un parámetro de acoplamiento, λ, el solucionador mantiene la estabilidad numérica mientras rastrea con precisión la ruta computacional hacia atrás. Este acoplamiento garantiza que la información de los estados actuales y anteriores se retenga en forma compacta, lo que permite el cálculo exacto de gradiente sin la sobrecarga de los requisitos de almacenamiento tradicionales.

El equipo de investigación realizó una serie de experimentos para validar las afirmaciones de estos solucionadores. Realizaron tres experimentos centrados en el modelado científico y el descubrimiento de dinámica latente de los datos para comparar la precisión, el tiempo de ejecución y el costo de memoria de los solucionadores reversibles con el punto de control recursivo. Los solucionadores fueron probados contra las siguientes tres configuraciones experimentales:

Descubrimiento de los datos generados de la ecuación enana blanca de Chandrasekhar
Aproximación de la dinámica de datos fundamental de un sistema de oscilador acoplado a través de una oda neural.
Identificación de la dinámica no lineal caótica utilizando un conjunto de datos de péndulo doble caótico

Los resultados de los experimentos anteriores testificaron la eficiencia de los solucionadores propuestos. En todas las pruebas, estos demostraron un rendimiento superior, logrando velocidades de entrenamiento hasta 2.9 veces más rápidas y utilizando hasta 22 veces menos memoria que los métodos tradicionales.

Además, la precisión del modelo final se mantuvo consistente en comparación con el estado del arte. Los solucionadores reversibles redujeron drásticamente el uso de la memoria y redujeron el tiempo de ejecución, lo que demuestra su utilidad en aplicaciones a gran escala e intensiva en datos. Los autores también encontraron que agregar descomposición de peso a los parámetros de campo vectorial de red neuronal mejoró la estabilidad numérica tanto para el método reversible como para el punto de control recursivo.

Conclusión: El documento introdujo una nueva clase de solucionadores algebraicos que resuelve los problemas de eficiencia computacional y precisión del gradiente. El marco propuesto tiene una operación complejidad de O (n) y el uso de la memoria de O (1). Este avance en los solucionadores ODE allana el camino para series de tiempo más escalables y robustas y modelos de datos dinámicos.

Verificar el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos Gorjeo y únete a nuestro Canal de telegrama y LinkedIn GRsalpicar. No olvides unirte a nuestro 75k+ ml de subreddit.

🚨 MarktechPost está invitando a las compañías/empresas/grupos de inteligencia artificial a asociarse para sus próximas revistas de IA en ‘Open Source AI en producción’ y ‘AI de agente’.

Adeeba Alam Ansari está buscando su doble título en el Instituto Indio de Tecnología (IIT) Kharagpur, ganando una B.Tech en Ingeniería Industrial y una M.Tech en Ingeniería Financiera. Con un gran interés en el aprendizaje automático y la inteligencia artificial, es una ávida lectora y una persona inquisitiva. Adeeba cree firmemente en el poder de la tecnología para empoderar a la sociedad y promover el bienestar a través de soluciones innovadoras impulsadas por la empatía y una profunda comprensión de los desafíos del mundo real.

Los investigadores de la Universidad de Bath desarrollaron un método de entrenamiento de aprendizaje automático eficiente y estable para ODES neuronales con O (1) Fuella de la memoria

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Intenté programar mi canalización ETL. Esto es lo que no esperaba.

Liquid AI presenta LFM2.5-Embedding-350M y LFM2.5-ColBERT-350M: modelos densos bicodificadores y de interacción tardía para búsquedas multilingües rápidas en 11 idiomas

El poder y los peligros de la búsqueda de imágenes basada en vectores

You missed

Los fabricantes de automóviles chinos compiten contra las nuevas normas de inversión de la UE

El tiempo en Mallorca para el sábado 20 de junio

Exclusivo: La actriz de Bombay Stories, Sushmita Siingh, sobre su debut en Cannes, su trabajo con Mouni Roy y más

Intenté programar mi canalización ETL. Esto es lo que no esperaba.