Explicación de la indexación geoespacial: una comparación de Geohash, S2 y H3 |  de Ben Feifke |  enero de 2024

La indexación geoespacial, o geocodificación, es el proceso de indexar pares de latitud y longitud en pequeñas subdivisiones del espacio geográfico, y es una técnica que los científicos de datos a menudo utilizamos cuando nos enfrentamos a datos geoespaciales.

Aunque la primera técnica popular de indexación geoespacial, “Geohash”, se inventó en 2008, indexar pares de latitud y longitud en subdivisiones manejables del espacio no es un concepto nuevo. Los gobiernos han estado dividiendo sus territorios en estados, provincias, condados y códigos postales durante siglos para todo tipo de aplicaciones, como realizar censos y agregar votos para las elecciones.

En lugar de utilizar las técnicas manuales utilizadas por los gobiernos, los científicos de datos utilizamos técnicas computacionales modernas para ejecutar dicha subdivisión espacial, y lo hacemos para nuestros propios fines: análisis, ingeniería de características, pruebas AB granulares por subdivisión geográfica, indexación de bases de datos geoespaciales y más.

La indexación geoespacial es un área completamente desarrollada de la informática, y las herramientas de indexación geoespacial pueden aportar mucho poder y riqueza a nuestros modelos y análisis. Lo que hace que las técnicas de indexación geoespacial sean aún más interesantes es que una mirada bajo sus proverbiales capuchas revela amalgamas eclécticas de otras herramientas matemáticas, como curvas que llenan el espacio, proyecciones de mapas, teselaciones y más.

Esta publicación explorará tres de las herramientas de indexación geoespacial más populares de la actualidad: de dónde provienen, cómo funcionan, qué las diferencia entre sí y cómo puede comenzar a usarlas. En orden cronológico, y de menor a mayor complejidad, veremos:

  1. geohash
  2. Google S2
  3. Uber H3

Concluirá comparando estas herramientas y recomendando cuándo es posible que desee utilizar una u otra.

Antes de comenzar, tenga en cuenta que estas herramientas incluyen muchas funciones más allá de la indexación geoespacial básica: intersección de polígonos, comprobaciones de contención de polígonos, comprobaciones de contención de líneas, generación de coberturas de celdas de espacios geográficos, recuperación de celdas vecinas indexadas geoespacialmente y más. Esta publicación, sin embargo, se centra estrictamente en la funcionalidad de indexación geoespacial.

Geohash, inventado en 2008 por Gustavo Niemeyeres la primera herramienta de indexación geoespacial creada [1]. Permite a sus usuarios mapear…