Screenshot 2024 05 15 At 12.36.09 Am.png

En la gestión del tráfico y la planificación urbana, la capacidad de aprender rutas óptimas a partir de demostraciones condicionadas a las características contextuales es muy prometedora. Como lo subrayan investigaciones anteriores, esta metodología se basa en el supuesto de que los agentes buscan optimizar un costo latente al navegar de un punto a otro.

Factores como la duración del viaje, la comodidad, los precios de los peajes y la distancia a menudo contribuyen a estos costos latentes y moldean los procesos de toma de decisiones de los individuos. En consecuencia, comprender y recuperar estos costos latentes ofrece información sobre los mecanismos de toma de decisiones y allana el camino para mejorar la gestión del flujo de tráfico anticipando la congestión y ofreciendo orientación de navegación en tiempo real.

El aprendizaje por refuerzo inverso ha surgido como una técnica popular para aprender los costos asociados con diferentes rutas o transiciones de las trayectorias observadas. Sin embargo, los métodos tradicionales a menudo simplifican el proceso de aprendizaje al asumir un costo latente lineal, que podría no captar las complejidades de los escenarios del mundo real. Los avances recientes han visto la integración de redes neuronales con solucionadores combinatorios para aprender de características contextuales y soluciones combinatorias de un extremo a otro. A pesar de su innovación, estos métodos enfrentan desafíos de escalabilidad, particularmente cuando se enfrentan a muchas trayectorias.

En respuesta a estos desafíos, en un estudio reciente se propone un método novedoso. Su método tiene como objetivo aprender los costos latentes de las trayectorias observadas codificándolos en frecuencias de atajos observados. Su enfoque aprovecha el algoritmo Floyd-Warshall, conocido por su capacidad para resolver problemas de ruta más corta en una sola ejecución basada en atajos. Al diferenciar a través del algoritmo Floyd-Warshall, el método propuesto permite que el proceso de aprendizaje capture información sustancial sobre los costos latentes dentro de la estructura del gráfico en un solo paso.

Sin embargo, diferenciarse mediante el algoritmo Floyd-Warshall plantea sus propios desafíos. En primer lugar, los gradientes calculados a partir de soluciones de trayectoria a menudo no son informativos debido a su naturaleza combinatoria. En segundo lugar, es posible que las soluciones exactas proporcionadas por el algoritmo Floyd-Warshall deban alinearse con el supuesto de demostraciones óptimas, como se observa en el comportamiento humano.

Para abordar estos problemas, los investigadores presentan DataSP, un algoritmo diferenciable de ruta más corta de todos a todos que sirve como una adaptación probabilística y diferenciable del algoritmo Floyd-Warshall. Al incorporar aproximaciones fluidas para los operadores esenciales, DataSP permite la retropropagación informativa a través del cálculo de la ruta más corta.

En general, la metodología propuesta facilita el aprendizaje de los costos latentes y resulta eficaz para predecir trayectorias probables e inferir destinos probables o nodos futuros. Al unir las arquitecturas de redes neuronales con DataSP, los investigadores pueden profundizar en representaciones no lineales de los costos de los bordes latentes basadas en características contextuales, ofreciendo así una comprensión más completa de los procesos de toma de decisiones en la gestión del tráfico y la planificación urbana.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Únete a nuestro Canal de telegramas, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro SubReddit de 42k+ ML


Arshad es pasante en MarktechPost. Actualmente cursa su carrera internacional. Maestría en Física del Instituto Indio de Tecnología Kharagpur. Comprender las cosas hasta el nivel fundamental conduce a nuevos descubrimientos que conducen al avance de la tecnología. Le apasiona comprender la naturaleza fundamentalmente con la ayuda de herramientas como modelos matemáticos, modelos de aprendizaje automático e inteligencia artificial.