Depth Anything: un modelo básico para la estimación de profundidad monocular |  de Sascha Kirch |  marzo de 2024

Papel: Profundidad de todo: liberar el poder de los datos sin etiquetar a gran escala por Lihe Yang, Bing Yi Kang, Zilong Huang, Xiaogang Xu, Jiashi Feng, Hengshuang Zhaoonathan ho, Ajay Jain, Pieter Abbeel19 de enero de 2024

Código: https://github.com/LiheYoung/Depth-Anything

Página del proyecto: https://profundidad-cualquier cosa.github.io/

Conferencia: CVPR2024

Categoría: modelos de cimentación, estimación de profundidad monocular

Otros tutoriales: [BYOL], [CLIP], [GLIP], [SAM], [DINO]

  1. Contexto y antecedentes
  2. Método
  3. Resultados cualitativos
  4. Experimentos y ablaciones
  5. Más lecturas y recursos

¿Por qué la profundidad es una modalidad tan importante y por qué utilizar el aprendizaje profundo para ello?

Ilustración conjunta de imagen y mapa de profundidad que muestra una bicicleta naranja de Sascha Kirch
Fig.1: Imagen y mapa de profundidad correspondiente. Imagen por Sascha Kirch y mapa de profundidad creado con Demostración de profundidad, cualquier cosa que abrace la cara.

En pocas palabras: para navegar a través del espacio 3D, uno debe saber dónde están todas las cosas y a qué distancia. Las aplicaciones clásicas incluyen prevención de colisiones, detección de espacios transitables, colocación de objetos en una realidad virtual o aumentada, creación de objetos 3D, navegación de un robot para agarrar un objeto y muchas…