GRAF: un marco de aprendizaje automático que convierte redes heterogéneas multiplex en redes homogéneas para hacerlas más adecuadas para el aprendizaje de representación de gráficos

Las redes del mundo real, como las de los conjuntos de datos biomédicos y multiómicos, a menudo presentan estructuras complejas caracterizadas por múltiples tipos de nodos y bordes, lo que las hace heterogéneas o múltiples. La mayoría de las técnicas de aprendizaje basadas en gráficos no logran manejar redes tan intrincadas debido a su complejidad intrínseca, a pesar de que las redes neuronales de gráficos han estado bastante de moda y han atraído una atención significativa. Los principales desafíos son la agregación de información a través de varias capas de diferentes redes, el control del costo computacional involucrado y la interpretabilidad en las tareas de clasificación de nodos y representación de gráficos. La solución a este problema puede conducir a mayores avances en aplicaciones como la predicción de reacciones adversas a medicamentos y el análisis de datos multimodal.

Los enfoques ya existentes han intentado manejar tales complejidades en redes heterogéneas y múltiples mediante diferentes formas de estrategias. Las transformaciones de metarutas facilitan la conversión de redes heterogéneas complejas en estructuras homogéneas para analizarlas. Las soluciones basadas en GNN como MOGONET y SUPREME funcionan en capas separadas de redes, cuyos resultados se suman para obtener la predicción final. Los mecanismos en arquitecturas impulsadas por la atención como HAN y HGT inducen mecanismos concentrados en nodos importantes de la red. Sin embargo, estas novedades también introducen deficiencias imperiosas. La cantidad de cálculos es altamente redundante con capas multicelulares y, por lo tanto, aún no se ha abordado la escalabilidad y la importancia de los nodos y bordes entre capas no se trata de manera eficiente. Estas técnicas a menudo no logran comprender la interpretación de los elementos de la red hacia otra tarea posterior; por lo tanto, parece necesaria una solución integrada y eficiente para las necesidades generales.

Para superar estas limitaciones, los investigadores desarrollaron Graph Attention-aware Fusion Networks (GRAF), un marco diseñado para transformar múltiples redes heterogéneas en representaciones unificadas e interpretables. Incorpora mecanismos novedosos, como atención a nivel de nodo para evaluar la importancia de los vecinos y atención a nivel de capa para evaluar la relevancia de las capas de la red. Integra múltiples capas de red en un único gráfico ponderado, lo que permite una representación holística de datos complejos. Para reducir la redundancia, se eliminan los bordes de baja importancia en función de puntuaciones ponderadas por atención, lo que simplifica la red sin comprometer la información crítica. La adaptabilidad del marco permite que se aplique de manera efectiva en diversos conjuntos de datos, ofreciendo una estrategia sólida y eficiente para el aprendizaje de la representación gráfica.

GRAF opera a través de una serie de pasos bien definidos para procesar redes heterogéneas múltiples de manera efectiva. Las transformaciones basadas en metarutas, como película-director-película para el conjunto de datos IMDB o artículo-autor-artículo para el conjunto de datos ACM, convierten redes heterogéneas en redes multiplex. La atención a nivel de nodo elige vecinos influyentes alfa (i, j). La atención a nivel de capa evalúa la importancia de las diferentes capas de red beta (phi). Estos pesos de atención se combinan mediante una función de puntuación de borde para priorizar las relaciones en la red:

El gráfico acoplado se adopta además en una red convolucional de gráficos (GCN) de 2 capas, que integra información sobre la topología del gráfico y las características de las características de los nodos para completar tareas como la clasificación de nodos. Se realizaron experimentos en conjuntos de datos IMDB, ACM, DBLP y DrugADR que habían sufrido ciertas transformaciones de metaruta basadas en las propiedades de esos conjuntos de datos y sus respectivas tareas.

GRAF logró un rendimiento superior en una variedad de tareas, superando a los modelos de la competencia en la mayoría de los puntos de referencia. Logró una puntuación macro F1 del 62,1 % en la predicción del género cinematográfico, mientras que hizo un excelente trabajo en el caso de la predicción de reacciones adversas a medicamentos con una puntuación macro F1 del 34,7 %. Logró 92,6% y 91,7% para clasificación de tipo de artículo y área de investigación del autor, respectivamente. Dicho diseño del marco ofrece un manejo óptimo de las atenciones a nivel de nodo y capa, como lo verifican los estudios de ablación en los que dichos componentes se eliminaron para producir rendimientos reducidos. El método fue probado con aplicabilidad experta y superó a los métodos más modernos; GRAF se establece como una solución eficiente en el análisis de redes multiplex.

El marco GRAF introducido abordó los desafíos fundamentales de las redes heterogéneas múltiples mediante la adopción de un novedoso enfoque de fusión basado en la atención. Su capacidad para integrar diversas capas de una red con interpretabilidad la convierte en una herramienta transformadora en el aprendizaje de la representación gráfica; Los resultados consistentes y superiores en una variedad de conjuntos de datos tienen gran importancia para muchas aplicaciones en biomedicina, redes sociales y análisis de datos multimodales. Su estructura escalable y eficiente es el siguiente paso revolucionario para las GNN en aplicaciones del mundo real de estructuras complejas.


Verificar el papel y GitHub. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.

🎙️ 🚨’Evaluación de vulnerabilidades de modelos de lenguaje grandes: un análisis comparativo de las técnicas de Red Teaming Lea el informe completo (Promovido)


Aswin AK es pasante de consultoría en MarkTechPost. Está cursando su doble titulación en el Instituto Indio de Tecnología de Kharagpur. Le apasiona la ciencia de datos y el aprendizaje automático, y aporta una sólida formación académica y experiencia práctica en la resolución de desafíos interdisciplinarios de la vida real.