El enfoque probabilístico para la autolocalización en condiciones de incertidumbre
Tabla de contenido:
- ¿Qué es la localización y por qué la necesita un robot?
- ¿Por qué se utilizan herramientas probabilísticas para calcular la localización?
- Ejemplo de un extremo a otro: ¿cómo utilizar algoritmos bayesianos para determinar la posición de un robot en condiciones de incertidumbre?
¿Cómo pueden los coches autónomos permanecer en un solo carril a 100 km/h? ¿Cómo puede un i-robot evitar caerse por las escaleras? ¿Cómo pueden los robots de reparto saber si se dirigen al cliente hambriento adecuado? Estas son sólo algunas de las preguntas que los vehículos autónomos deben responder sin intervención humana.
1. ¿Qué es la localización? ¿Y por qué lo necesita un robot?
Como se puede imaginar, la ubicación precisa del vehículo es fundamental para que el vehículo autónomo complete sus tareas de forma eficaz y segura. El proceso para estimar la posición del vehículo a partir de los datos del sensor se llama localización.. La precisión de la localización aumenta con sensores que agregan información y disminuye con el movimiento del vehículo que agrega ruido.
2. ¿Por qué se utilizan herramientas probabilísticas para calcular la localización?
Se pueden aprovechar las herramientas probabilísticas para mejorar la precisión de la ubicación cuando ni los sensores ni el movimiento son 100% precisos.
¿Qué es la probabilidad?
Según la definición del diccionario, probabilidad es una “descripción numérica de la probabilidad de que ocurra un evento” (wikipedia). Sin embargo, cuando se trata del significado de probabilidad, la respuesta no es tan sencilla. Hay interpretaciones rivales de la probabilidad por parte de dos bandos principales: los frecuentistas y los bayesianos.
El frecuentista El enfoque interpreta la probabilidad como la frecuencia relativa a lo largo del tiempo; ¿Cuántas veces obtendré el resultado deseado si repito un experimento muchas veces?
Este enfoque es objetivo porque cualquiera que realice los experimentos (por ejemplo, lanzar una moneda al aire) obtendrá el mismo resultado a largo plazo.
El bayesiano Este enfoque interpreta la probabilidad como el grado de certeza de que un evento sucederá. ¿Qué tan seguro estoy de obtener el resultado deseado teniendo en cuenta el conocimiento experto y los datos disponibles? Este enfoque es subjetivo, ya que representa el estado actual de creencias combinando conocimientos previos (subjetivos) y datos experimentales conocidos hasta la fecha. Permite estimar la probabilidad de un evento singular que no podemos ejecutar muchas veces, donde no se aplica el significado frecuentista.
Por ejemplo, si la probabilidad de que una cita te responda el mensaje de texto después de tu primera reunión es de 0,8, entonces estamos 80% seguros de que la pasaste muy bien y la persona te responderá el mensaje de texto; nosotros no Significa que te enviarán mensajes de texto el 80% del tiempo si repites la primera cita una y otra vez.
¿Cuáles son los beneficios de la probabilidad bayesiana?
La probabilidad bayesiana nos permite cuantificar nuestro grado de creencia y actualizarlo a la luz de nueva evidencia.
En nuestro contexto, P(H) es nuestra suposición inicial de la posición del robot, y P(H|E) es nuestra suposición actualizada después de medir la evidencia E de los sensores.
La distribución de probabilidad de hipótesis cuantifica nuestra certeza en la posición del robot.
La hipótesis puede cambiar según la evidencia.
Cuanto más informativos y precisos sean los datos de los sensores, mayor será el efecto que tendrán. Si el sensor es perfecto, la posición del robot se alineará con la lectura del sensor; de lo contrario, si los datos del sensor son muy ruidosos o no informativos, la posición del robot permanecerá igual.
Las actualizaciones pueden combinar múltiples fuentes de evidencia
Podemos formular la ley de Bayes para combinar múltiples fuentes de datos utilizando la regla de la cadena, también conocida como regla general del producto. Permite simplificar una distribución conjunta de evidencia múltiple a un producto de probabilidades condicionales.
Por ejemplo, solemos utilizar el GPS para navegar desde nuestra ubicación actual, pero el GPS funciona mejor en cielos despejados y su precisión se limita a unos pocos metros. Los coches autónomos no pueden depender únicamente del GPS para permanecer en un carril de unos pocos metros de ancho y circular en túneles o aparcamientos subterráneos. Los vehículos autónomos pueden compensar las deficiencias del GPS añadiendo más fuentes de información, como cámaras.
3. Ejemplo de un extremo a otro: ¿cómo utilizar algoritmos bayesianos para determinar la posición del robot en condiciones de incertidumbre?
Profundicemos en un filtro bayesiano que mejora recursivamente las estimaciones de probabilidad de localización mediante la inferencia bayesiana. La naturaleza recursiva significa que la salida del filtro en el momento t_0, P(H|E), sirve como entrada de hipótesis para la siguiente marca de tiempo t_1, P(H).
Supongamos que un robot de reparto recorre una trayectoria circular dentro de una estación espacial para transportar suministros. El robot dispone de un mapa que detalla la configuración del terreno y la ubicación de los sensores.
– Definición del problema:
Nos referimos a la ubicación estimada del robot como la espacio de estados del robot. Por ejemplo, un vector bidimensional (es decir, un par ordenado de números) que rastrea la posición del eje x y la velocidad del eje x puede rastrear la ubicación de un robot y cambiar la velocidad en una dimensión. Es posible ampliar el espacio de estados del robot a dimensiones adicionales para rastrear múltiples dimensiones de posición (y, z), orientación, etc.
Para simplificar, podemos suponer que nuestro robot se mueve con velocidad constante. El movimiento añade incertidumbre al cálculo, ya que no es 100% fiable. Es posible que el motor no funcione a una velocidad específica o que el robot encuentre obstáculos, lo que hará que el robot sobrepase o no alcance su movimiento esperado.
Nuestro robot detectará su ubicación midiendo la presencia de una baliza. Las lecturas del sensor, también llamadas espacio de medida, no son 100% exactos. Los sensores pueden confundir el ruido con la señal de una baliza, lo que puede provocar falsas alarmas o no detectar ninguna señal.
– El algoritmo: filtro de histograma
Con este filtro bayesiano, el espacio de estados del robot se representa mediante un histograma a través de un número finito de contenedores o regiones. Es un filtro discreto, lo que significa que el robot sólo puede estar en una de estas regiones, y calculamos la probabilidad de que el robot esté en cada una. Además, dentro de cada contenedor, como por ejemplo un área de 5 metros cuadrados, la probabilidad de estar en cualquier punto específico es la misma. Si queremos aumentar la granularidad, debemos agregar más contenedores.
Este filtro no es paramétrico, lo que significa que no hace suposiciones sólidas sobre la representación del estado del robot y no está restringido a un tipo de distribución como la gaussiana. Es capaz de representar estimaciones de ubicación complejas, como una hipótesis multimodal que mantiene múltiples conjeturas, pero conlleva un costo computacional: una complejidad exponencial. Para agregar una dimensión adicional, de 1D a 2D manteniendo la misma granularidad, necesitaremos contenedores de 10×10, para pasar a 3D necesitaremos contenedores de 10x10x10, y así sucesivamente. Esta es una limitación importante para los robots que rastrean múltiples dimensiones y tienen limitaciones de memoria y potencia de cálculo.
– Cálculo:
- Estimación inicial: Partimos de un lugar desconocido equipado con un mapa. Al principio, todas las regiones son igualmente probables, como lo representa una distribución uniforme en todos los contenedores.
2. Función de movimiento: Simula el movimiento del robot. El movimiento del robot es estocástico, lo que significa que no se garantiza que se mueva al contenedor deseado en cada paso de tiempo. Para actualizar la ubicación del robot después de cada movimiento, calculamos la probabilidad de que el robot esté en cada región en el siguiente paso. Este cálculo considera tanto la probabilidad de que el robot permanezca en la misma región como la probabilidad de que se mueva a una región diferente.
For each movement:
For each region:
Region probability at time t+1 =
Region probability at time t x stay probability +
Probability of robot coming from the neighboring region x move probability
Como se muestra en la siguiente ecuación, el movimiento de un solo paso del robot no cambiará la estimación de ubicación debido a la distribución uniforme, donde cada región tiene la misma probabilidad de permanecer y moverse.
Incluso si inicialmente comenzamos en un contenedor con total certeza (100%), la aleatoriedad inherente al movimiento agregará ruido gradualmente, llevándonos hacia una distribución uniforme a lo largo del tiempo. ¡Necesitamos agregar información!
3. Función de sentido: Incorpora medidas que añaden información utilizando el teorema de Bayes.
After each movement:
For each region:
Region probability at time t+1 given measurement at time t+1 =
Likelihood of the measurement given the robot is in that region
x Region probability at time t+1 after movement
x normlization to ensure that all the probabilities sum to 1.
La confiabilidad de los sensores se representa con probabilidades, ya que no son 100% precisos. Las ecuaciones siguientes demuestran que cuando el sensor detecta el color naranja, hay un 90% de probabilidad de que el robot esté ubicado en un contenedor naranja y un 10% de probabilidad de que el sensor esté equivocado y el robot esté realmente en un contenedor azul.
El cálculo que se presenta a continuación ilustra que, a diferencia del movimiento, los sensores aportan información y mejoran nuestra comprensión de la ubicación del robot. Por ejemplo, como el contenedor 2 no es naranja, la probabilidad de que el robot esté en él disminuye de 0,1 a 0,02.
La siguiente imagen muestra la hipótesis de ubicación actualizada después de incorporar datos de movimiento y sensores a nuestra suposición inicial.
Pensamientos finales
¿Dónde está el robot? Podemos refinar continuamente nuestra respuesta a esta pregunta mediante el uso de filtros bayesianos recursivos, comenzando desde una distribución uniforme que mantiene todas las conjeturas igualmente probables hasta decidirnos por la más probable.
Los filtros bayesianos nos ayudan a medir nuestra confianza en el paradero del robot, actualizando esta creencia integrando datos (ruidosos) de sensores con información previa (la posición estimada del robot después del movimiento).
Fuentes:
- Estas son mis notas resumidas de las primeras conferencias del altamente recomendado curso edX “Algoritmos bayesianos para vehículos autónomos” por Dr. Roi Yozevitch.
- Robótica probabilística GitBook: filtro no paramétrico
- Wikipedia probabilidad, teoría de probabilidad y Teorema de Bayes
- Personal de Daniel Sabinasz blog sobre filtros de histograma
- Convertidor en línea de látex a png.
- Imágenes: el avatar del robot fue creado con Dall-E. Todas las demás imágenes utilizadas en este artículo fueron creadas por el autor.
¿Cómo encontrarse en un mundo digital? fue publicado originalmente en Hacia la ciencia de datos en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.