Este documento de inteligencia artificial de NVIDIA propone NGP (primitivas de gráficos neuronales) compacto: un marco de aprendizaje automático que corresponde a tablas hash con sondas aprendidas para una velocidad y compresión óptimas

Las primitivas de gráficos neuronales (NGP) son prometedoras a la hora de permitir la integración fluida de activos nuevos y antiguos en diversas aplicaciones. Representan imágenes, formas, datos volumétricos y direccionales espaciales, lo que ayuda en la síntesis de vistas novedosas (NeRF), el modelado generativo, el almacenamiento en caché de luz y varias otras aplicaciones. Particularmente exitosas son las primitivas que representan datos a través de una cuadrícula de características que contiene incrustaciones latentes entrenadas, posteriormente decodificadas por un perceptrón multicapa (MLP).

Investigadores de NVIDIA y la Universidad de Toronto proponen PNG compacto, un marco de aprendizaje automático que combina la velocidad asociada con las tablas hash y la eficiencia del aprendizaje de índices mediante la utilización de este último para la detección de colisiones mediante métodos de sondeo aprendidos. Esta combinación se logra unificando todas las cuadrículas de características en un marco compartido donde funcionan como funciones de indexación que se asignan a una tabla de vectores de características.

Compact NGP ha sido diseñado específicamente teniendo en cuenta la distribución de contenido, con el objetivo de amortizar los gastos generales de compresión. Su diseño garantiza que la decodificación en el equipo del usuario siga siendo de bajo costo, bajo consumo y multiescala, lo que permite una degradación elegante en entornos con ancho de banda limitado.

Estas estructuras de datos se pueden fusionar de maneras innovadoras mediante combinaciones aritméticas básicas de sus índices, lo que da como resultado una compresión de vanguardia frente a compensaciones de calidad. En términos matemáticos, estas combinaciones aritméticas implican asignar las diferentes estructuras de datos a subconjuntos de bits dentro de la función de indexación, lo que reduce significativamente el costo de la indexación aprendida, que de otro modo aumenta exponencialmente con el número de bits.

Su enfoque hereda las ventajas de velocidad de las tablas hash al tiempo que logra una compresión significativamente mejorada, acercándose a niveles comparables a JPEG en la representación de imágenes. Conserva la diferenciabilidad y no depende de un esquema de descompresión dedicado como un código de entropía. Compact NGP demuestra versatilidad en varias tasas de compresión controlables por el usuario y ofrece capacidades de transmisión, lo que permite cargar resultados parciales, especialmente en entornos con ancho de banda limitado.

Realizaron una evaluación de la compresión NeRF en escenas sintéticas y del mundo real, comparándola con varias técnicas de compresión NeRF contemporáneas basadas principalmente en TensoRF. Específicamente, emplearon ondas enmascaradas como una base sólida y reciente para la escena del mundo real. En ambos escenarios, Compact NGP demuestra un rendimiento superior en comparación con Instant NGP en cuanto al equilibrio entre calidad y tamaño.

El diseño de Compact NGP se ha adaptado a aplicaciones del mundo real donde la descompresión de acceso aleatorio, el nivel de detalle de la transmisión y el alto rendimiento desempeñan papeles fundamentales, tanto en las etapas de entrenamiento como de inferencia. En consecuencia, existe un entusiasmo por explorar sus aplicaciones potenciales en diversos dominios, como aplicaciones de transmisión por secuencias, compresión de texturas de videojuegos, capacitación en vivo y muchas otras áreas.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de más de 35.000 ml, 41k+ comunidad de Facebook, Canal de discordia, LinkedIn Grarribay Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.


Arshad es pasante en MarktechPost. Actualmente cursa su carrera internacional. Maestría en Física del Instituto Indio de Tecnología Kharagpur. Comprender las cosas hasta el nivel fundamental conduce a nuevos descubrimientos que conducen al avance de la tecnología. Le apasiona comprender la naturaleza fundamentalmente con la ayuda de herramientas como modelos matemáticos, modelos de aprendizaje automático e inteligencia artificial.