¿Cómo encontrarse en un mundo digital?

El enfoque probabilístico para la autolocalización en condiciones de incertidumbre

Tabla de contenido:

¿Qué es la localización y por qué la necesita un robot?
¿Por qué se utilizan herramientas probabilísticas para calcular la localización?
Ejemplo de un extremo a otro: ¿cómo utilizar algoritmos bayesianos para determinar la posición de un robot en condiciones de incertidumbre?

¿Cómo pueden los coches autónomos permanecer en un solo carril a 100 km/h? ¿Cómo puede un i-robot evitar caerse por las escaleras? ¿Cómo pueden los robots de reparto saber si se dirigen al cliente hambriento adecuado? Estas son sólo algunas de las preguntas que los vehículos autónomos deben responder sin intervención humana.

1. ¿Qué es la localización? ¿Y por qué lo necesita un robot?

Como se puede imaginar, la ubicación precisa del vehículo es fundamental para que el vehículo autónomo complete sus tareas de forma eficaz y segura. El proceso para estimar la posición del vehículo a partir de los datos del sensor se llama localización.. La precisión de la localización aumenta con sensores que agregan información y disminuye con el movimiento del vehículo que agrega ruido.

2. ¿Por qué se utilizan herramientas probabilísticas para calcular la localización?

Se pueden aprovechar las herramientas probabilísticas para mejorar la precisión de la ubicación cuando ni los sensores ni el movimiento son 100% precisos.

¿Qué es la probabilidad?

Según la definición del diccionario, probabilidad es una “descripción numérica de la probabilidad de que ocurra un evento” (wikipedia). Sin embargo, cuando se trata del significado de probabilidad, la respuesta no es tan sencilla. Hay interpretaciones rivales de la probabilidad por parte de dos bandos principales: los frecuentistas y los bayesianos.

El frecuentista El enfoque interpreta la probabilidad como la frecuencia relativa a lo largo del tiempo; ¿Cuántas veces obtendré el resultado deseado si repito un experimento muchas veces?

Este enfoque es objetivo porque cualquiera que realice los experimentos (por ejemplo, lanzar una moneda al aire) obtendrá el mismo resultado a largo plazo.

El bayesiano Este enfoque interpreta la probabilidad como el grado de certeza de que un evento sucederá. ¿Qué tan seguro estoy de obtener el resultado deseado teniendo en cuenta el conocimiento experto y los datos disponibles? Este enfoque es subjetivo, ya que representa el estado actual de creencias combinando conocimientos previos (subjetivos) y datos experimentales conocidos hasta la fecha. Permite estimar la probabilidad de un evento singular que no podemos ejecutar muchas veces, donde no se aplica el significado frecuentista.

Por ejemplo, si la probabilidad de que una cita te responda el mensaje de texto después de tu primera reunión es de 0,8, entonces estamos 80% seguros de que la pasaste muy bien y la persona te responderá el mensaje de texto; nosotros no Significa que te enviarán mensajes de texto el 80% del tiempo si repites la primera cita una y otra vez.

¿Cuáles son los beneficios de la probabilidad bayesiana?

La probabilidad bayesiana nos permite cuantificar nuestro grado de creencia y actualizarlo a la luz de nueva evidencia.

Teorema de Bayes: actualice la hipótesis de posición del robot P(H), también conocida como anterior, según la evidencia E de los sensores, para devolver P(H|E), también conocida como posterior

En nuestro contexto, P(H) es nuestra suposición inicial de la posición del robot, y P(H|E) es nuestra suposición actualizada después de medir la evidencia E de los sensores.

La distribución de probabilidad de hipótesis cuantifica nuestra certeza en la posición del robot.

(1) distribución uniforme: si no tenemos idea de dónde está el robot, todas las ubicaciones son igualmente probables (2) distribución normal con media = mejor estimación y dispersión = incertidumbre

La hipótesis puede cambiar según la evidencia.

Cuanto más informativos y precisos sean los datos de los sensores, mayor será el efecto que tendrán. Si el sensor es perfecto, la posición del robot se alineará con la lectura del sensor; de lo contrario, si los datos del sensor son muy ruidosos o no informativos, la posición del robot permanecerá igual.

Actualización de nuestra hipótesis: ¿Qué tan diferente es la hipótesis después de la evidencia P(H|E) de nuestra creencia inicial P(H)?

Las actualizaciones pueden combinar múltiples fuentes de evidencia

Podemos formular la ley de Bayes para combinar múltiples fuentes de datos utilizando la regla de la cadena, también conocida como regla general del producto. Permite simplificar una distribución conjunta de evidencia múltiple a un producto de probabilidades condicionales.

El teorema de Bayes se generaliza a casos con evidencia múltiple, E1 y E2, aplicando la regla de la cadena.

Por ejemplo, solemos utilizar el GPS para navegar desde nuestra ubicación actual, pero el GPS funciona mejor en cielos despejados y su precisión se limita a unos pocos metros. Los coches autónomos no pueden depender únicamente del GPS para permanecer en un carril de unos pocos metros de ancho y circular en túneles o aparcamientos subterráneos. Los vehículos autónomos pueden compensar las deficiencias del GPS añadiendo más fuentes de información, como cámaras.

3. Ejemplo de un extremo a otro: ¿cómo utilizar algoritmos bayesianos para determinar la posición del robot en condiciones de incertidumbre?

Profundicemos en un filtro bayesiano que mejora recursivamente las estimaciones de probabilidad de localización mediante la inferencia bayesiana. La naturaleza recursiva significa que la salida del filtro en el momento t_0, P(H|E), sirve como entrada de hipótesis para la siguiente marca de tiempo t_1, P(H).

Supongamos que un robot de reparto recorre una trayectoria circular dentro de una estación espacial para transportar suministros. El robot dispone de un mapa que detalla la configuración del terreno y la ubicación de los sensores.

El mapa del robot muestra la ruta y la presencia de sensores, la baliza 1 en naranja y la baliza 2 en azul. La naturaleza circular de la ruta lleva al robot de regreso al principio cuando llega al último contenedor. (Imagen del robot generada con Dall-E)

– Definición del problema:

Nos referimos a la ubicación estimada del robot como la espacio de estados del robot. Por ejemplo, un vector bidimensional (es decir, un par ordenado de números) que rastrea la posición del eje x y la velocidad del eje x puede rastrear la ubicación de un robot y cambiar la velocidad en una dimensión. Es posible ampliar el espacio de estados del robot a dimensiones adicionales para rastrear múltiples dimensiones de posición (y, z), orientación, etc.

Para simplificar, podemos suponer que nuestro robot se mueve con velocidad constante. El movimiento añade incertidumbre al cálculo, ya que no es 100% fiable. Es posible que el motor no funcione a una velocidad específica o que el robot encuentre obstáculos, lo que hará que el robot sobrepase o no alcance su movimiento esperado.

Nuestro robot detectará su ubicación midiendo la presencia de una baliza. Las lecturas del sensor, también llamadas espacio de medida, no son 100% exactos. Los sensores pueden confundir el ruido con la señal de una baliza, lo que puede provocar falsas alarmas o no detectar ninguna señal.

Los vectores del robot: (1) vector espacial de estados que muestra la posición x en el momento t (2) vector espacial de medición que denota la presencia de las balizas en el momento t

– El algoritmo: filtro de histograma

Con este filtro bayesiano, el espacio de estados del robot se representa mediante un histograma a través de un número finito de contenedores o regiones. Es un filtro discreto, lo que significa que el robot sólo puede estar en una de estas regiones, y calculamos la probabilidad de que el robot esté en cada una. Además, dentro de cada contenedor, como por ejemplo un área de 5 metros cuadrados, la probabilidad de estar en cualquier punto específico es la misma. Si queremos aumentar la granularidad, debemos agregar más contenedores.

Este filtro no es paramétrico, lo que significa que no hace suposiciones sólidas sobre la representación del estado del robot y no está restringido a un tipo de distribución como la gaussiana. Es capaz de representar estimaciones de ubicación complejas, como una hipótesis multimodal que mantiene múltiples conjeturas, pero conlleva un costo computacional: una complejidad exponencial. Para agregar una dimensión adicional, de 1D a 2D manteniendo la misma granularidad, necesitaremos contenedores de 10×10, para pasar a 3D necesitaremos contenedores de 10x10x10, y así sucesivamente. Esta es una limitación importante para los robots que rastrean múltiples dimensiones y tienen limitaciones de memoria y potencia de cálculo.

– Cálculo:

Estimación inicial: Partimos de un lugar desconocido equipado con un mapa. Al principio, todas las regiones son igualmente probables, como lo representa una distribución uniforme en todos los contenedores.

La posición x se divide en 10 regiones discretas que representan el estado del robot. Inicialmente, no tenemos información sobre dónde está el robot, por lo que cada región tiene la misma probabilidad con una probabilidad de 1/10.

2. Función de movimiento: Simula el movimiento del robot. El movimiento del robot es estocástico, lo que significa que no se garantiza que se mueva al contenedor deseado en cada paso de tiempo. Para actualizar la ubicación del robot después de cada movimiento, calculamos la probabilidad de que el robot esté en cada región en el siguiente paso. Este cálculo considera tanto la probabilidad de que el robot permanezca en la misma región como la probabilidad de que se mueva a una región diferente.

For each movement:
  For each region:
    Region probability at time t+1 = 
    Region probability at time t x stay probability + 
    Probability of robot coming from the neighboring region x move probability

Función de movimiento: suponiendo que el robot se mueve paso a paso, ¿cuál es la probabilidad de realizar un movimiento exitoso en un solo paso? Hay un 95 % de posibilidades de que el robot se haya movido al siguiente contenedor y un 5 % de posibilidades de que permanezca estacionario.

Como se muestra en la siguiente ecuación, el movimiento de un solo paso del robot no cambiará la estimación de ubicación debido a la distribución uniforme, donde cada región tiene la misma probabilidad de permanecer y moverse.

¿Cuál es la probabilidad de que el robot esté en el contenedor n.° 2 después de que dio un paso?

Incluso si inicialmente comenzamos en un contenedor con total certeza (100%), la aleatoriedad inherente al movimiento agregará ruido gradualmente, llevándonos hacia una distribución uniforme a lo largo del tiempo. ¡Necesitamos agregar información!

3. Función de sentido: Incorpora medidas que añaden información utilizando el teorema de Bayes.

After each movement:
    For each region:
      Region probability at time t+1 given measurement at time t+1 = 
      Likelihood of the measurement given the robot is in that region 
      x Region probability at time t+1 after movement
      x normlization to ensure that all the probabilities sum to 1.

La confiabilidad de los sensores se representa con probabilidades, ya que no son 100% precisos. Las ecuaciones siguientes demuestran que cuando el sensor detecta el color naranja, hay un 90% de probabilidad de que el robot esté ubicado en un contenedor naranja y un 10% de probabilidad de que el sensor esté equivocado y el robot esté realmente en un contenedor azul.

Función de detección: ¿cuál es la probabilidad de que el robot detecte “naranja” dado que está en un contenedor naranja?

El cálculo que se presenta a continuación ilustra que, a diferencia del movimiento, los sensores aportan información y mejoran nuestra comprensión de la ubicación del robot. Por ejemplo, como el contenedor 2 no es naranja, la probabilidad de que el robot esté en él disminuye de 0,1 a 0,02.

¿Cuál es la probabilidad de que el robot esté en el segundo contenedor, dado que el robot detectó “naranja”?

La siguiente imagen muestra la hipótesis de ubicación actualizada después de incorporar datos de movimiento y sensores a nuestra suposición inicial.

Gracias a la función de detección después de un paso tenemos un poco más de certeza de dónde está el robot. Necesitamos más medidas para aumentar la certeza entre los contenedores naranjas.

Pensamientos finales

¿Dónde está el robot? Podemos refinar continuamente nuestra respuesta a esta pregunta mediante el uso de filtros bayesianos recursivos, comenzando desde una distribución uniforme que mantiene todas las conjeturas igualmente probables hasta decidirnos por la más probable.

Los filtros bayesianos nos ayudan a medir nuestra confianza en el paradero del robot, actualizando esta creencia integrando datos (ruidosos) de sensores con información previa (la posición estimada del robot después del movimiento).

Fuentes:

Estas son mis notas resumidas de las primeras conferencias del altamente recomendado curso edX “Algoritmos bayesianos para vehículos autónomos” por Dr. Roi Yozevitch.
Robótica probabilística GitBook: filtro no paramétrico
Wikipedia probabilidad, teoría de probabilidad y Teorema de Bayes
Personal de Daniel Sabinasz blog sobre filtros de histograma
Convertidor en línea de látex a png.
Imágenes: el avatar del robot fue creado con Dall-E. Todas las demás imágenes utilizadas en este artículo fueron creadas por el autor.

¿Cómo encontrarse en un mundo digital? fue publicado originalmente en Hacia la ciencia de datos en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.

¿Cómo encontrarse en un mundo digital?

ByEquipo de 7 minutos

El enfoque probabilístico para la autolocalización en condiciones de incertidumbre

Tabla de contenido:

1. ¿Qué es la localización? ¿Y por qué lo necesita un robot?

2. ¿Por qué se utilizan herramientas probabilísticas para calcular la localización?

3. Ejemplo de un extremo a otro: ¿cómo utilizar algoritmos bayesianos para determinar la posición del robot en condiciones de incertidumbre?

– Definición del problema:

– El algoritmo: filtro de histograma

– Cálculo:

Pensamientos finales

By Equipo de 7 minutos

Related Post

WorkOS lanza auth.md: un protocolo de registro de agente abierto basado en estándares OAuth

StepFun lanza StepAudio 2.5 Realtime: un modelo de voz de extremo a extremo con RLHF específico para juegos de rol y comprensión paralingüística

Cree un canal completo de evaluación y observabilidad de Langfuse para seguimiento, gestión rápida, puntuación y experimentos

You missed

El aumento global del nivel del mar está aumentando más rápido de lo esperado debido al calentamiento de los océanos y al derretimiento de las capas de hielo

Hombre armado muere tras tiroteo frente a la Casa Blanca

Una sonda tomó fotografías increíbles de Marte en su camino hacia un asteroide lejano

Los republicanos están furiosos en secreto por la intromisión de Trump en las elecciones intermedias