1w0159bno5zijjp P 70aia.png

Una guía ilustrada e intuitiva sobre cómo aprenden las redes neuronales.

Bienvenido a la Parte 2 de la serie Deep Learning Illustrated. En el Artículo anterior (¡definitivamente lea eso primero!), cubrimos cómo funciona una red neuronal y cómo entrenado La red neuronal hace predicciones.

En este artículo profundizaremos en el capacitación procesar y explorar cómo aprende una red neuronal.

📣 Si no ha leído mis artículos anteriores, le recomiendo que comience con mi serie de artículos que cubren conceptos básicos del aprendizaje automáticoespecíficamente el de Descenso de gradiente porque encontrará que gran parte del material cubierto allí es relevante aquí.

Shreya Rao

Paquete de inicio de aprendizaje automático

Digamos que queremos crear una red neuronal que prediga los ingresos diarios de las ventas de helado utilizando las características de temperatura y día de la semana.

Este es el conjunto de datos de entrenamiento (sintético) que estamos usando:

Para construir una red neuronal, como aprendimos en el artículo anterior, primero debemos decidir su arquitectura. Esto incluye determinar la cantidad de capas ocultas, la cantidad de neuronas en cada capa y la función de activación de cada neurona.

Digamos que decidimos que nuestra arquitectura es: 1 capa oculta con 2 neuronas y 1 neurona de salida, todas usando la función de activación del rectificador.

Segue terminología: en el artículo anterior, aprendimos sobre el uso de subíndices para diferenciar entre diferentes pesos. Nos apegamos a la misma convención aquí y, además, usaremos superíndices a…