Conozca TorchExplorer: un nuevo visualizador interactivo de redes neuronales

Se presenta una nueva investigación de IA explorador de antorchas, una novedosa herramienta de inteligencia artificial diseñada para investigadores que trabajan con arquitecturas de redes neuronales no convencionales, que proporciona una exploración interactiva y profunda de las capas de la red. Desarrollada para ayudar a comprender modelos complejos de redes neuronales, la herramienta genera automáticamente un gráfico personalizado Vega en wandb, una clase que muestra una visualización a nivel de módulo de la arquitectura de la red. Los usuarios también pueden implementar TorchExplorer en un servidor web local para uso independiente.

https://github.com/spfrommer/torchexplorer

Mientras explora la interfaz de usuario, el panel izquierdo de TorchExplorer presenta un gráfico a nivel de módulo extraído del gráfico de autogrado, lo que permite a los investigadores navegar a través de la estructura de la red. Al hacer clic en un módulo, se revelan sus submódulos internos y una lista desplegable conveniente ayuda a los usuarios a regresar a los módulos principales sin esfuerzo. Los nodos en el gráfico del explorador representan marcadores de posición de entrada/salida o invocaciones específicas de submódulos. Cada invocación de submódulo es distinta, lo que enfatiza la individualidad incluso si un submódulo se llama varias veces en un pase directo.

Los bordes entre nodos significan rastros de autograduación, lo que indica el flujo de información de los módulos principales a los secundarios. El número de flancos no está relacionado con el número de entradas/salidas en la función directa, lo que proporciona claridad sobre el flujo de información en la red. Los paneles de columnas de TorchExplorer a la derecha permiten a los usuarios inspeccionar los módulos en detalle arrastrándolos y soltándolos. Los histogramas que acompañan a cada módulo visualizan la distribución de valores en el tiempo correspondiente del eje x. Estos histogramas, que representan tensores de entrada/salida, se submuestrean por motivos de rendimiento y rechazan los valores atípicos para mantener la precisión.

Los histogramas de entrada/salida muestran los valores que entran y salen del método de avance de un módulo, lo que proporciona una vista detallada de la distribución de datos. Además, los histogramas de norma de gradiente de entrada/salida capturan gradientes tensoriales de pases hacia atrás, lo que ofrece información sobre la norma ℓ2 de gradientes promediados sobre la dimensión del lote. Los histogramas de parámetros registran los parámetros inmediatos de los submódulos, mientras que los histogramas de gradiente de parámetros representan gradientes de pérdida relacionados con cada parámetro.

Una característica notable de TorchExplorer es su capacidad para manejar arquitecturas no estándar de manera efectiva. Los investigadores que a menudo trabajan con modelos no convencionales pueden beneficiarse de la capacidad de la herramienta para adaptarse y proporcionar información significativa, incluso frente a diseños de redes extravagantes.

En esencia, TorchExplorer es un valioso compañero para los investigadores que participan en experimentos de aprendizaje profundo, ya que ofrece una forma interactiva y visualmente intuitiva de comprender el comportamiento de la red en varias capas. Su flexibilidad de implementación, tanto en wandb como localmente, mejora su accesibilidad, convirtiéndola en una herramienta versátil para la comunidad de investigación.


Pragati Jhunjhunwala es pasante de consultoría en MarktechPost. Actualmente está cursando su B.Tech en el Instituto Indio de Tecnología (IIT), Kharagpur. Es una entusiasta de la tecnología y tiene un gran interés en el alcance del software y las aplicaciones de ciencia de datos. Siempre está leyendo sobre los avances en diferentes campos de la IA y el ML.