Redes neuronales para funciones periódicas | de Dr. Robert Kübler

Cuando las capacidades de extrapolación de ReLU no son suficientes

Foto por Willian Justén de Vasconcellos en desempaquetar

Se sabe que las redes neuronales son excelentes aproximaciones para cualquier función, al menos siempre que No te alejes demasiado de nuestro conjunto de datos.. Veamos qué significa eso. Aquí hay algunos datos:

No sólo parece una onda sinusoidal, sino que en realidad lo es, con algo de ruido añadido. Ahora podemos entrenar una red neuronal de retroalimentación normal que tenga 1 capa oculta con 1000 neuronas y activación ReLU. Obtenemos el siguiente ajuste:

Se ve bastante decente, aparte de los bordes. Nosotros podría solucione este problema agregando más neuronas a la capa oculta según Cybenko teorema de aproximación universal. Pero quiero señalarte algo más:

Nosotros podría argumentar ahora que este comportamiento de extrapolación es malo si asumimos que el patrón de onda continúa fuera del rango observado. Pero si no hay conocimiento del dominio o más datos a los que podamos recurrir, sería simplemente esto: una suposición.

Sin embargo, en el resto de este artículo, voluntad Supongamos que cualquier patrón periódico que podamos detectar dentro de los datos continúa también afuera. Esta es una suposición común al hacer series de tiempo. modelado, algo que naturalmente queremos extrapolar al futuro. Suponemos que cualquier estacionalidad observada en los datos de entrenamiento continuará así, porque ¿qué más podemos decir sin ninguna información adicional? En este artículo, quiero mostrarte cómo usar funciones de activación basadas en seno ayuda a incorporar esta suposición en el modelo.

Pero antes de continuar, profundicemos brevemente en cómo las redes neuronales basadas en ReLU se extrapolan en general y por qué no deberíamos usarlas para el pronóstico de series temporales tal como están.

Redes neuronales para funciones periódicas | de Dr. Robert Kübler | enero de 2024

ByEquipo de 7 minutos

Cuando las capacidades de extrapolación de ReLU no son suficientes

By Equipo de 7 minutos

Related Post

Meta AI lanza NeuralBench: un marco unificado de código abierto para comparar modelos de NeuroAI en 36 tareas de EEG y 94 conjuntos de datos

Deconstruya cualquier métrica con unas cuantas preguntas simples sobre el “qué”

Zyphra lanza ZAYA1-8B: un MoE de razonamiento capacitado en hardware AMD que supera con creces su categoría de peso

You missed

Los mejores libros nuevos de divulgación científica de mayo de 2026

Detenidas dos personas por agredir a personal sanitario en Mallorca: agreden a un policía de Palma

Día de la Madre 2026: 7 películas malayalam en OTT que celebran la maternidad – CO Saira Banu a Ente Ummante Perú

Meta AI lanza NeuralBench: un marco unificado de código abierto para comparar modelos de NeuroAI en 36 tareas de EEG y 94 conjuntos de datos