Représentation hiérarchique des objets pour la perception spatiale des robots : points, maillages et superquadriques
Une équipe de chercheurs a publié sur arXiv (arXiv:2606.01545) un pipeline de représentation hiérarchique des objets pour la perception spatiale des robots, baptisé Hickory et disponible en open source. Le système organise la scène en quatre couches progressives : données brutes de capteurs RGB-D, nuages de points partiels, maillages 3D denses, puis primitives analytiques appelées superquadriques, des formes géométriques paramétriques capables de modéliser objets convexes et concaves avec un nombre réduit de paramètres. Cette architecture s'intègre dans le cadre des 3D Scene Graphs (3DSG), représentations hiérarchiques combinant informations métriques, sémantiques et topologiques utilisées pour l'autonomie longue durée des robots. Les expériences ont été conduites sur quatre jeux de données de référence (HOPE, ReplicaCAD, Kimera-Multi, NUS Campus Dataset), le dernier étant collecté avec un robot quadrupède Unitree B2 en environnement extérieur réel.
L'apport concret réside dans deux lacunes comblées simultanément. Premièrement, les méthodes existantes de 3DSG utilisent des représentations géométriques simplistes, boîtes englobantes ou nuages de points partiels, insuffisantes pour la planification de trajectoire en environnement dense et encombré. Les superquadriques permettent ici une vérification analytique des collisions, plus rapide et plus précise que les méthodes volumétriques classiques. Deuxièmement, sur la tâche d'alignement de cartes (map alignment), critique pour la re-localisation multi-robot, le pipeline surpasse ROMAN, l'état de l'art actuel basé sur les objets. Pour un intégrateur déployant une flotte d'AMR en entrepôt, ou un équipementier embarquant de la navigation autonome, c'est un signal que la couche de représentation peut devenir un point de différenciation concret.
Le travail s'inscrit dans une tendance de fond : enrichir les cartes métriques-sémantiques au-delà du simple voxel ou du bounding box. Des projets comme Khronos (MIT SPARK Lab) ou les travaux de Kimera ont posé les fondations des 3DSG ; Hickory pousse la granularité au niveau objet avec une couche analytique exploitable directement par un planificateur de mouvement. Les concurrents directs sur le créneau de la représentation objet compacte incluent les approches par ellipsoïdes (EllipsoidSLAM) et les Neural Radiance Fields objets (NeRF-based SLAM), mais ces derniers restent coûteux en inférence. Le code est public sur GitHub (perceptica-robotics/Hickory), ce qui facilite l'évaluation par des équipes tiers, à vérifier en conditions réelles de déploiement sur des scènes non contrôlées.
Dans nos dossiers



