Capa convolucional: componente básico de las CNN | de Egor Howell

Qué son las capas convolucionales y cómo permiten el aprendizaje profundo para la visión por computadora

“https://www.flaticon.com/free-icons/neural-network” title=”iconos de redes neuronales”>Iconos de redes neuronales creados por jugoso_fish — Flaticon..

A diferencia de ti y de mí, las computadoras solo funcionan con números binarios. Por lo tanto, no pueden ver ni comprender una imagen. Sin embargo, podemos representar imágenes usando píxeles. Para una imagen en escala de grises, cuanto más pequeño es el píxel, más oscuro es. Un píxel toma valores entre 0 (negro) y 255 (blanco), los números en el medio son un espectro de grises. Este rango de números es igual a byte en binario, que es ²⁸, esta es la unidad de trabajo más pequeña de la mayoría de las computadoras.

A continuación se muestra una imagen de ejemplo que creé en Python y sus valores de píxeles correspondientes:

Ejemplo de una imagen parecida a una flor dividida en píxeles. Trama generada por el autor en LaTeX.

Usando este concepto, podemos desarrollar algoritmos que puedan ver patrones en estos píxeles para clasificar imágenes. Esto es exactamente lo que un Red neuronal convolucional (CNN) hace.

La mayoría de las imágenes no están en escala de grises y tienen algo de color. Por lo general, se representan mediante RGB, donde tenemos tres canales que son rojo, verde y azul. Cada color es una cuadrícula de píxeles bidimensional, que luego se apila uno encima del otro. Entonces, la imagen de entrada es tridimensional.

El código utilizado para generar el gráfico está disponible en mi GitHub:

Descripción general

La parte clave de las CNN es la circunvolución operación. Tengo un artículo completo que detalla cómo funciona la convolución, pero aquí haré un resumen rápido para que esté completo. Si desea una comprensión profunda, le recomiendo que consulte la publicación anterior:

Capa convolucional: componente básico de las CNN | de Egor Howell | enero de 2024

ByEquipo de 7 minutos

Qué son las capas convolucionales y cómo permiten el aprendizaje profundo para la visión por computadora

Descripción general

By Equipo de 7 minutos

Related Post

Conozca Talkie-1930: un LLM de peso abierto 13B capacitado en textos en inglés anteriores a 1931 para el razonamiento histórico y la investigación de generalización

¡Correlación no significa causalidad! ¿Pero qué significa?

Los 10 principales modelos físicos de IA que impulsarán a los robots del mundo real en 2026

You missed

Bernie Sanders critica a Trump por no proteger a los niños de la violencia y la discriminación en las escuelas

El acuerdo de deuda de 830 millones de dólares de Mistral es el que cambia la historia de la IA en Europa

Se han perdido tres millones de asientos: los recortes de Ryanair afectan las rutas españolas para los turistas irlandeses – The Leader

¿Qué es la belleza del cisne? El espejo de IA detrás de la despedida de soltera de Adquired Style