Funciones de activación y no linealidad: redes neuronales 101 | de Egor Howell

Funciones de activación y no linealidad: redes neuronales 101 | de Egor Howell | octubre de 2023

Explicando por qué las redes neuronales pueden aprender (casi) cualquier cosa

Foto de Google DeepMind: https://www.pexels.com/photo/un-artista-s-ilustracion-de-inteligencia-artificial-ai-esta-imagen-fue-inspirada-por-neural-networks-used-in-deep-learning- fue-creado-por-novoto-studio-como-parte-de-visualización-ai-pr-17483874/

En mi artículo anterior, presentamos el perceptrón multicapa (MLP), que es sólo un conjunto de apilados interconectados perceptrones. Le recomiendo encarecidamente que consulte mi publicación anterior si no está familiarizado con el perceptrón y MLP, ya que lo discutiremos bastante en este artículo:

A continuación se muestra un ejemplo de MLP con dos capas ocultas:

Un perceptrón multicapa básico de dos capas ocultas. Diagrama por autor.

Sin embargo, el problema con el MLP es que sólo puede ajustarse a un clasificador lineal. Esto se debe a que los perceptrones individuales tienen una función de paso como su función de activaciónque es lineal:

El Perceptrón, que es la red neuronal más simple. Diagrama por autor.

Entonces, a pesar de que el apilamiento de nuestros perceptrones puede parecer una red neuronal moderna, sigue siendo un clasificador lineal y no muy diferente de la regresión lineal normal.

Otro problema es que no es completamente diferenciable en todo el rango de dominio.

¿Entonces qué hacemos al respecto?

¡Funciones de activación no lineales!

¿Qué es la linealidad?

Expliquemos rápidamente qué significa linealidad para construir algo de contexto. Matemáticamente una función se considera lineal si cumple la siguiente condición:

También hay otra condición:

Pero trabajaremos con la ecuación anterior para esta demostración.

Tomemos este caso muy simple:

Funciones de activación y no linealidad: redes neuronales 101 | de Egor Howell | octubre de 2023

ByEquipo de 7 minutos

Explicando por qué las redes neuronales pueden aprender (casi) cualquier cosa

¿Qué es la linealidad?

By Equipo de 7 minutos

Related Post

Meta Astryx de código abierto: un sistema de diseño React listo para agentes con más de 150 componentes accesibles, siete temas y una CLI

Cómo Couchbase construyó una arquitectura de IA multimodelo para Capella iQ con Amazon Bedrock

Tongyi Lab de Alibaba lanza Qwen-Audio-3.0-TTS, un modelo alojado de conversión de texto a voz en Flash y niveles Plus en 16 idiomas

You missed

Protesta de trabajadores médicos de Dúrcal – Gaceta Costa Tropical Noticias

Meta Astryx de código abierto: un sistema de diseño React listo para agentes con más de 150 componentes accesibles, siete temas y una CLI

Abdul El-Sayed es un epidemiólogo que se postula para el Senado. Su estado es un desastre de salud pública

Nigeria: Los islamistas fulani afirman ser víctimas de los continuos ataques a aldeas cristianas