
LiftNav : planification de trajectoire par élévation sémantique dans un Gaussian Splatting guidé par TSDF
Une équipe de chercheurs a publié LiftNav sur arXiv (référence 2605.31376), un système de planification de trajectoires pour robots autonomes en environnements intérieurs inconnus. Le système repose sur une carte duale combinant TSDF (Truncated Signed Distance Function, représentation géométrique précise pour l'évitement d'obstacles) et Gaussian Splatting (GS, méthode de rendu à base de primitives gaussiennes 3D), en s'appuyant sur l'architecture GSFusion comme fondation. À cette base hybride s'ajoutent, en temps réel, une détection d'objets par YOLO, un mécanisme de "lifting" 3D ancré dans le TSDF pour projeter les détections sémantiques dans l'espace volumique, et une optimisation de trajectoire par splines B. Pour améliorer fluidité et sécurité, les auteurs introduisent une pénalité de collision basée sur la hinge loss. Évalué en simulation sur le dataset Replica (environnements intérieurs synthétiques de haute fidélité de Meta), LiftNav atteint un taux de faisabilité de 100% et génère des trajectoires plus courtes qu'un système de référence basé sur les champs de radiance neuraux.
Ce résultat s'attaque à un compromis fondamental de la navigation robotique : les représentations classiques comme le TSDF garantissent la sécurité géométrique mais sont aveugles sémantiquement, tandis que les méthodes photorréalistes de type Gaussian Splatting offrent une compréhension visuelle riche mais présentent des géométries floues peu fiables pour l'évitement de collision. LiftNav propose de réconcilier les deux sans recourir à des embeddings 3D denses, souvent coûteux en mémoire et en calcul, ce qui constitue l'argument différenciant central. Pour les intégrateurs robotique, c'est une architecture susceptible de réduire la complexité de déploiement de robots de service dans des espaces non structurés. Il convient toutefois de souligner que ces performances sont mesurées exclusivement en simulation, sans aucune validation sur robot physique rapportée dans cette publication.
LiftNav s'inscrit dans une dynamique de recherche active autour de la navigation sémantique : des travaux comme ConceptFusion ou LERF intègrent des embeddings de type CLIP dans des NeRF ou des GS, mais au prix d'une empreinte computationnelle élevée. L'approche par lifting TSDF retenue ici est plus légère, au potentiel détriment d'une richesse sémantique fine. Les concurrents directs incluent les pipelines combinant SLAM 3D avec des couches de détection dense comme Mask3D, ainsi que les systèmes NeRF-Nav. La prochaine étape naturelle serait une validation sur plateforme physique pour quantifier le gap sim-to-real, point clé que les auteurs ne mentionnent pas dans cet abstract.
Dans nos dossiers




