Artículo revisado por Gracia LindsayDoctorado por la Universidad de Nueva York.
Las redes neuronales simulan neuronas conectadas en el cerebro para completar complicadas tareas de predicción.
Manténgase actualizado sobre las últimas novedades científicas con los resúmenes de repaso.
¿Qué es una red neuronal artificial?
Un Red neuronal artificial (ANN) es un tipo de modelo de aprendizaje automático inspirado en las neuronas del cerebro.1,2 Los componentes individuales de la ANN reciben información en forma numérica, la procesan y la envían a través de la red, de forma análoga a la señalización neuronal en el sistema nervioso central. Este proceso se repite hasta que la información llega al final de la red, y la red produce una salida numérica que normalmente corresponde a una predicción de probabilidad sobre la información que recibió. Los investigadores combinan esta estructura de red con un algoritmo especializado que permite a la ANN evaluar su precisión y mejorarse a sí misma. Los científicos utilizan RNA para identificar patrones en conjuntos de datos y aprende cómo el cerebro mismo funciona.3-5
Arquitectura de red neuronal artificial
Los científicos diseñan RNA para funcionan como neuronas.6 Escriben líneas de código en un algoritmo de modo que haya nodos y cada uno de ellos contenga una función matemática, similar a las neuronas que tienen cada una funciones biológicas específicas en el cerebro. Varios nodos forman una capa en la red y una sola red puede contener varias capas. A menudo, cada nodo de una capa está conectado a cada nodo de la capa siguiente para enviar información a la red. “Cuando escribes código para construir una red neuronal artificial, básicamente estás definiendo esta arquitectura”, explicó Grace Lindsay, neurocientífica computacional de la Universidad de Nueva York. Utiliza RNA para estudiar la visión y el cambio climático.
Capas de redes neuronales artificiales
La primera capa de ANN se llama capa de entrada porque aquí es donde los datos iniciales ingresan a la red. La última capa de la red neuronal se llama capa de salida y produce valores que corresponden a la probabilidad de una respuesta u otro resultado numérico. Por ejemplo, en un proyecto, Lindsay construyó una red neuronal para detectar represas de castores a partir de imágenes aéreas. Las imágenes son la entrada y la salida del modelo proporciona la probabilidad de que una imagen contenga o no una presa de castores.
Todas las capas entre las capas de entrada y salida se denominan capas ocultas. El número de capas ocultas da lugar al concepto de aprendizaje profundodonde la profundidad hace referencia a las capas apiladas en la red.7
¿Cómo funcionan las redes neuronales artificiales?
“A través del código, le das los datos al modelo, y luego este se ejecuta y entrena”, explicó Lindsay. En el caso de las RNA supervisadas, los investigadores entrenan la red neuronal introduciendo datos con valores o características conocidas. Los científicos le informan al modelo sobre los valores de entrada y salida reales a través de un código de computadora. En la red neuronal de Lindsay, su equipo le dio a su modelo miles de imágenes de represas de castores y la red aprendió a identificar patrones que representan el aspecto de estas estructuras, con el objetivo de poder seleccionar una en una imagen no especificada más adelante. Una vez que la red neuronal entrenada prediga de manera confiable las represas de castores a partir de conjuntos de datos de imágenes conocidos, los científicos la usarán para investigar cómo funcionan estas instalaciones. afectan el clima al identificar automáticamente los cambios en nuevas imágenes.
Ponderación y umbralización de los datos.
La ponderación y el umbral indican qué tan valioso es un determinado dato en una ANN. Cuando los nodos reciben valores de entrada, ingresan los datos en su funciones matemáticas.8 Estas funciones pueden incluir pesos numéricos que se multiplican por los valores de datos entrantes y valores de umbral o sesgo que se suman o restan de la salida de cada nodo. El umbral determina si el valor calculado se envía hacia adelante en la red neuronal; si el valor de salida de un nodo está por encima del umbral, se envía a la siguiente capa de nodos.
A veces, estas funciones matemáticas son sumas de todos los puntos de datos entrantes, mientras que otras veces, la ecuación incluye una función sigmoidea aplicada a la suma completa de modo que el número resultante esté entre 0 y 1. “Debido a que muchas de ellas son tan simples, Por lo general, el poder proviene de tener muchas, muchas, muchas neuronas artificiales y redes profundas”, dijo Lindsay.
Ejemplo de arquitectura de red neuronal artificial
Para fines de análisis de imágenes, los píxeles de una imagen se convierten en valores de escala de grises y cada píxel se convierte en una entrada numérica que ingresa a la red neuronal. La ANN envía estas entradas a nodos en capas ocultas, que consisten en ecuaciones matemáticas, como funciones sigmoideas que producen valores entre 0 y 1 según los valores de entrada, peso y sesgo. Si la respuesta a la ecuación de un nodo supera un umbral establecido, avanza en la red. Al final, la red contiene una capa de salida, donde los valores numéricos indican la probabilidad de una respuesta particular relacionada con el conjunto de datos de entrada, como si una imagen contiene una celda.
El científico
De esta manera, los datos numéricos se pasan a lo largo de estos nodos, cada uno de los cuales realiza el mismo tipo de ecuación matemática. Las respuestas a estas ecuaciones se convierten en datos de entrada para la siguiente capa de nodos, que luego realizan la misma función de resumen. Al final de la red, los valores finales son la salida y pueden interpretarse como probabilidades para una respuesta particular, como si hay o no una presa de castores en una imagen.
Aprendiendo los datos
En la fase de entrenamiento, después de que la red ha analizado una gran cantidad de datos de prueba, compara sus resultados calculados con las respuestas verdaderas para cada ejemplo que ejecutó. El algoritmo calcula qué tan lejos estaba de la respuesta objetivo para cada salida y promedia los errores en su conjunto de entrenamiento, lo que informa las correcciones a los pesos o umbrales en la red. Los errores en una red se denominan pérdida o costo, y los investigadores intentan minimizar este valor para que las respuestas resultantes sean lo más cercanas posible a las respuestas correctas o verdaderas. Después de que el algoritmo ajusta los pesos y los umbrales, la red vuelve a ejecutar sus datos de entrenamiento y compara sus resultados finales con los valores reales. Esto se repite hasta que las predicciones estén dentro de un valor predeterminado de precisión.
De esta forma, la red aprende cómo mejorar su capacidad para interpretar los datos proporcionados. Una vez que la red se ha optimizado, los investigadores le proporcionan un nuevo conjunto de datos similares pero novedosos y evalúan qué tan bien la red predice o identifica las características deseadas en un conjunto de datos invisible.
Ejemplo de Capacitación de la Red
Después de que un conjunto de datos completo pasa por la red, el algoritmo de la red neuronal utiliza los valores proporcionados para determinar cuáles deberían haber sido los resultados y los compara con sus valores de salida calculados. Hace esto para todas las entradas en cada nodo, las resume y luego las promedia. El valor resultante es el coste de la red. El valor del costo se aplica en todos los pesos y umbrales de la red, que se ejecuta nuevamente en su conjunto de datos de entrenamiento y reevalúa su precisión. Esto se repite hasta que se alcanza un umbral predeterminado de precisión.
El científico
¿Cuáles son las limitaciones de las redes neuronales artificiales?
Debido a que estas redes aprenden de los datos con los que están entrenadas, aprenden los patrones representados únicamente en ese conjunto de datos. Si el conjunto de datos de prueba sobrerrepresenta o excluye posibles ejemplos, como ver solo represas de castores construidas en ríos, esto sesgará la red para que sea menos probable que reconozca otros posibles puntos de datos en un grupo, como una represa de castores construida en un lago. Además, el uso de datos que un investigador agrupa e identifica introduce un sesgo basado en la personalidad de ese individuo. interpretación subjetiva de una imagen.9 En todos estos ejemplos, la red puede no ser aplicable o no tan precisa en un entorno de uso más general debido a estos sesgos aprendidos. Esto está relacionado con una segunda limitación de las ANN y los modelos de aprendizaje automático, que es que los investigadores no saben qué patrones identifica el algoritmo en los datos para tomar sus decisiones. “No puedes preguntarle sobre su propio proceso y no le dijiste cómo realizar su proceso, por lo que estás en una situación en la que él realiza un proceso, pero no sabes cómo”, dijo Lindsay. . Los investigadores abordan estos problemas formando grandes colaboraciones para incluir grupos de capacitación representativos, y desarrollando nuevos análisis y metodos de aprendizaje para mejorar la confiabilidad de estos modelos, lo que también puede ayudarlos a comprender la toma de decisiones de las ANN.10,11
¿Cómo se utilizan las redes neuronales artificiales?
Las ANN están detrás de modelos de lenguaje como ChatGPT. La gente también los usa para identificar patrones que los humanos tal vez no reconozcan por sí solos y modelar cómo el cerebro mismo funciona estudiando cómo aprenden las RNA.12-14 Además, los científicos utilizan RNA en una variedad de tareas relacionadas con imágenes. “Eso tiene aplicaciones en la vida cotidiana, como en Internet se puede resumir automáticamente una imagen, o una computadora puede reconocer personas en imágenes”, explicó Lindsay. “También tiene aplicaciones en la ciencia; Estas cosas se aplican a las imágenes médicas, ya sea en el sentido de atención médica o [for labeling] imágenes microscópicas de células y ayudar a los científicos a acelerar su trabajo realizando algunas de esas tareas algo menores”.
Referencias
- Han SH, et al. Red neuronal artificial: comprensión de los conceptos básicos sin matemáticas. Trastorno neurocognológico del demencia. 2018;17(3):83-89
- Jordan MI, Mitchell TM. Aprendizaje automático: tendencias, perspectivas y perspectivas. Ciencia. 2015;349(6245):255-260
- Tarca AL, et al. El aprendizaje automático y sus aplicaciones a la biología. PLoS Comput Biol. 2007;3(6):e116
- Kimeswenger S, et al.. Las redes neuronales artificiales y los patólogos reconocen los carcinomas de células basales basándose en diferentes patrones histológicos. Mod Pathol. 2021;34(5):895-903
- Hannagan T, et al. Aparición de un código neuronal compositivo para palabras escritas: Reciclaje de una red neuronal convolucional para lectura. Proc Natl Acad Sci. 2021;118(46):e2104779118
- Cohen Y, et al. Avances recientes en la interfaz de la neurociencia y las redes neuronales artificiales. J Neurosci. 2022;42(45):8514-8523
- LeCun Y, et al. Aprendizaje profundo. Naturaleza. 2015;521:436-444
- Yang GR, Wang XJ. Redes neuronales artificiales para neurocientíficos: una introducción. Neurona. 2020;107(6):1048-1070
- Cronin Nueva Jersey. Uso de redes neuronales profundas para análisis cinemático: desafíos y oportunidades. J Biomecánica. 2021;123(23):110460
- Nensa F, et al. Inteligencia artificial en medicina nuclear. J Nucl Med. 2019;60(2):29S-37S
- Lee H, et al. Sistema de aprendizaje profundo totalmente automatizado para la evaluación de la edad ósea. Imágenes del dígito J. 2017;30:427-441
- Marabini R, Carazo JM. Reconocimiento de patrones y clasificación de imágenes de macromoléculas biológicas mediante redes neuronales artificiales.. Biofís J. 1994;66:1804-1814
- Angermueller C, et al. Aprendizaje profundo para la biología computacional. Mol Syst Biol. 2016;12(7):878
- Beniaguev D, et al. Neuronas corticales individuales como redes neuronales artificiales profundas. Neurona. 2021; 109:2727-2739