Aller au contenu principal
Amélioration du SLAM par graphes en environnement sans GNSS grâce à l'odométrie des jambes
RecherchearXiv cs.RO7h

Amélioration du SLAM par graphes en environnement sans GNSS grâce à l'odométrie des jambes

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (2605.20484) une architecture de graphe de facteurs qui améliore significativement la précision verticale du SLAM LiDAR-inertiel pour robots à pattes en environnement sans GNSS. Le système augmente le framework LIO-SAM avec une voie cinématique parallèle, alimentée par l'odométrie proprioceptive des jambes, couplée à la voie LiDAR-inertielle principale via une contrainte de pose relative avec modèle de bruit sélectif. Testé sur un quadrupède Linxai D50 lors de deux boucles extérieures totalisant plus d'un kilomètre, l'approche réduit la dérive en élévation de plus de 30 mètres à moins de 30 centimètres, soit une réduction de deux ordres de grandeur. Sur un scénario où le pipeline de référence échoue complètement à converger, la méthode proposée maintient la localisation.

Ce résultat est significatif parce qu'il exploite une source de données déjà disponible à bord, calculée pour le contrôle de la locomotion, sans capteur supplémentaire. Le problème de la dérive verticale du LiDAR est bien documenté dans les environnements géométriquement pauvres ou répétitifs (couloirs, forêts, parkings), où les points de correspondance sont insuffisants pour contraindre l'axe Z. Utiliser l'odométrie des pattes comme ancre verticale légère est une approche pragmatique : elle s'insère dans les pipelines existants sans reconfiguration hardware, ce qui en facilite le déploiement sur des plateformes commerciales comme Unitree, Boston Dynamics Spot, ou ANYmal. Pour les intégrateurs et les équipes déployant des robots en inspection industrielle ou en environnements souterrains, c'est une piste concrète pour améliorer la robustesse SLAM sans surcoût matériel.

LIO-SAM est un framework SLAM LiDAR-inertiel développé par Ji Zhang et Sanjiv Singh (Carnegie Mellon), largement adopté dans la communauté robotique depuis 2020, notamment pour les robots terrestres et aériens. Le couplage proprioception-SLAM n'est pas nouveau en théorie, mais son intégration efficace dans un graphe de facteurs en conditions réelles reste un sujet actif. Côté concurrence, les approches actuelles s'appuient généralement sur la fusion IMU renforcée (LOAM, LEGO-LOAM) ou l'ajout de capteurs barométriques pour corriger la dérive verticale. La prochaine étape naturelle serait de tester l'approche sur des terrains avec dénivelé marqué, et d'évaluer la robustesse face aux glissements de pattes, cas limite non abordé dans cette version préliminaire.

À lire aussi

Greedy Kalman-Swarm : amélioration de l'estimation d'état dans les essaims de robots en environnements difficiles
1arXiv cs.RO 

Greedy Kalman-Swarm : amélioration de l'estimation d'état dans les essaims de robots en environnements difficiles

Des chercheurs ont publié sur arXiv (référence 2604.16868) une méthode de filtrage de Kalman distribué baptisée "Greedy Kalman-Swarm", conçue pour améliorer l'estimation d'état dans les essaims de robots opérant en environnements dégradés. Le principe : chaque robot intègre, à chaque itération, l'ensemble des données de voisinage disponibles au moment précis du calcul, sans attendre une synchronisation globale. Contrairement aux approches classiques qui requièrent soit un nœud centralisateur, soit des protocoles de communication lourds pour atteindre un consensus collectif, cette méthode fonctionne de façon purement locale. Les simulations menées dans des environnements à connectivité contrainte montrent que le système reste fonctionnel même en cas de perte partielle de données entre agents, tout en maintenant une précision supérieure à celle d'un filtre de Kalman purement individuel. L'enjeu industriel est réel pour les déploiements multi-robots en milieu non structuré. La plupart des architectures d'essaim actuelles butent sur un compromis difficile : la précision collective nécessite soit une infrastructure de communication fiable et à large bande passante, soit une unité centrale de fusion de données, deux hypothèses rarement tenables sur le terrain. Le Greedy Kalman-Swarm démontre qu'une cohésion globale peut émerger de comportements locaux greedy, sans consensus explicitement imposé. C'est un résultat qui contredit l'intuition dominante selon laquelle la précision collective exige de la coordination synchrone, et qui ouvre la voie à des essaims véritablement autonomes dans des conditions adverses, sans dépendance à une infrastructure fixe. Le filtrage de Kalman est une brique fondamentale de l'estimation d'état en robotique depuis les années 1960, et son extension aux systèmes multi-agents fait l'objet de travaux actifs depuis au moins deux décennies. Les approches distribuées existantes, comme le Kalman consensus filter ou les variantes à diffusion de données, supposent généralement une topologie de communication stable ou des échanges périodiques complets. Greedy Kalman-Swarm se positionne comme une alternative légère, scalable et tolérante aux pannes. Les auteurs ciblent explicitement deux applications : la recherche et le sauvetage (search-and-rescue) en milieu sinistré, et l'exploration spatiale, deux domaines où la fiabilité des liaisons radio ne peut être garantie. Le code n'est pas encore publié et les résultats restent pour l'instant au stade de la simulation, ce qui appelle une validation sur matériel réel avant tout déploiement opérationnel.

RecherchePaper
1 source
SuReNav : navigation par graphe de superpixels avec relaxation de contraintes en environnements sur-contraints
2arXiv cs.RO 

SuReNav : navigation par graphe de superpixels avec relaxation de contraintes en environnements sur-contraints

Des chercheurs ont publié sur arXiv (identifiant 2602.06807) SuReNav, une méthode de navigation robotique conçue pour les environnements dits "sur-contraints", où aucun chemin ne permet d'éviter l'intégralité des obstacles. Le problème visé est concret : dans des espaces semi-statiques (couloirs partiellement encombrés, zones urbaines, campus), les planificateurs classiques échouent ou bloquent faute de solution "parfaite". SuReNav repose sur trois composantes : une carte en graphe de superpixels encodant des contraintes régionales hiérarchisées, un réseau de neurones sur graphe (GNN) entraîné sur des démonstrations humaines pour relâcher sélectivement ces contraintes, et un mécanisme d'entrelacement entre relaxation, planification et exécution en temps réel. La méthode a été évaluée sur des cartes sémantiques 2D et des environnements 3D issus d'OpenStreetMap, obtenant le meilleur score de "ressemblance humaine" parmi les baselines testées. Une démonstration en navigation urbaine réelle a été réalisée avec un quadrupède Spot de Boston Dynamics. L'apport principal est de dépasser les limites des planificateurs à coûts prédéfinis, peu transférables à des environnements inédits. En s'appuyant sur des démonstrations humaines, le GNN apprend à distinguer les zones passables "en dernier recours" des zones strictement interdites, une nuance que les heuristiques fixes peinent à capturer sans sur-estimation systématique. Pour les intégrateurs déployant des robots mobiles en milieux semi-statiques, l'enjeu est direct : le robot cesse de bloquer face à une impasse et produit une solution "best-effort" minimisant le risque traversé. La généralisation sans reconfiguration manuelle des coûts est particulièrement pertinente pour des déploiements à grande échelle. Il convient toutefois de noter que les métriques de "human-likeness" restent auto-définies par les auteurs, et que les vidéos disponibles ne couvrent qu'un sous-ensemble de scénarios. SuReNav s'inscrit dans la tendance à l'apprentissage par imitation pour la navigation mobile, un axe activement exploré par des équipes comme ETH Zurich, CMU Robotics Institute ou dans le cadre de projets EU sur la robotique en espace public. La méthode se distingue des approches VLA (Vision-Language-Action) pures par son ancrage dans une représentation spatiale structurée plutôt que dans un modèle de langage génératif, ce qui la rend plus interprétable et plus légère computationnellement. Les principaux concurrents sur ce créneau incluent des planificateurs à champ de potentiel augmentés et des méthodes de navigation par apprentissage par renforcement. Aucun déploiement commercial n'est annoncé : il s'agit d'un résultat de recherche avec validation expérimentale sur Spot, dont le code est publié sur sure-nav.github.io, ouvrant la voie à des reproductions et pilotes industriels.

UELa méthode est directement pertinente pour les projets européens déployant des robots mobiles en espaces publics semi-statiques (couloirs, campus, zones urbaines), un axe exploré par ETH Zurich et plusieurs consortiums EU, et le code ouvert facilite des pilotes industriels sur le Vieux Continent.

RecherchePaper
1 source
Localisation SLAM multi-session par texture au sol en environnements peu dynamiques
3arXiv cs.RO 

Localisation SLAM multi-session par texture au sol en environnements peu dynamiques

Des chercheurs ont publié sur arXiv (identifiant 2605.19701) une étude portant sur le SLAM multi-session par texture de sol dans des environnements à faible dynamique de changement. Le SLAM (Simultaneous Localization and Mapping) basé sur la texture du sol utilise uniquement les patterns visuels du plancher comme repère cartographique, sans marqueurs physiques ni infrastructure dédiée. L'article évalue trois techniques pour améliorer la précision d'estimation de trajectoire dans des environnements où le sol évolue lentement entre sessions : usure de surface, phénomènes météorologiques, variations saisonnières. Parmi ces approches, l'utilisation de la divergence de Kullback-Leibler (KLD), une mesure de dissimilarité entre distributions de probabilité, comme score de similarité et comme biais influençant la confiance dans la détection de bouclage de trajectoire (loop closure), s'est révélée la plus performante. L'équipe met également à disposition un dataset public contenant des images multi-sessions de sol avec variations entre sessions et des données de pose haute précision pour évaluation comparative. La gestion multi-session est un prérequis opérationnel souvent sous-estimé dans les déploiements longue durée de robots mobiles autonomes (AMR) en environnements peu texturés : entrepôts à sols lisses, couloirs hospitaliers, zones de production industrielle. Un robot contraint de reconstruire intégralement sa carte après chaque redémarrage, maintenance ou changement saisonnier génère des interruptions de service et des coûts opérationnels qui compromettent la viabilité à l'échelle. La capacité à détecter des correspondances fiables entre sessions malgré une évolution lente du terrain constitue un pas concret vers des systèmes SLAM "lifelong" exploitables en production, et la KLD semble offrir ici un avantage mesurable sur les métriques de similarité classiques. Le SLAM par texture de sol s'est développé comme alternative aux systèmes LiDAR et aux réseaux de marqueurs au sol dans des contextes où l'infrastructure est coûteuse ou non autorisée, mais les travaux antérieurs restaient limités aux opérations mono-session. Les systèmes AMR commerciaux de référence, notamment ceux d'Exotec pour la logistique française ou les plateformes de navigation d'entrepôt fondées sur LiDAR 2D, s'appuient encore sur des capteurs actifs ou des repères fixes. Cette publication s'inscrit dans l'effort croissant de la communauté SLAM pour traiter les environnements "low-dynamic", zone intermédiaire entre statique et hautement dynamique qui représente pourtant la majorité des déploiements industriels réels. Le dataset public est la contribution la plus directement réutilisable, ouvrant la voie à un benchmark standardisé entre méthodes concurrentes.

UELe dataset public et la méthode KLD offrent une piste concrète pour les équipes R&D travaillant sur des AMR longue durée en environnements industriels européens (entrepôts logistiques, couloirs hospitaliers), en réduisant les interruptions de service liées aux reconfigurations cartographiques multi-sessions.

RecherchePaper
1 source
Au-delà de la géométrie : navigation topologique efficace dans des environnements 3D complexes
4arXiv cs.RO 

Au-delà de la géométrie : navigation topologique efficace dans des environnements 3D complexes

Des chercheurs ont publié sur arXiv (réf. 2605.17302) un framework de planification de trajectoire pour robots mobiles terrestres opérant dans des environnements intérieurs 3D complexes. Le système extrait automatiquement depuis un nuage de points 3D un espace d'états réduit composé uniquement des positions physiquement atteignables par le robot, en appliquant trois contraintes successives : support au sol vérifié, dégagement vertical suffisant pour la hauteur du robot, et connectivité sémantique via propagation par graine (seed-based). Évalué sur cinq scènes issues du dataset Matterport3D et trois scènes du benchmark PCT, le framework atteint une réduction de l'espace d'états supérieure à 80 % par rapport au voxel space brut, avec des temps de recherche A* inférieurs à la milliseconde sur les scènes Matterport3D. Le taux de succès de planification est de 100 % sur 300 requêtes testées. L'enjeu technique central que ce travail adresse est l'ambiguïté géométrique : dans un environnement intérieur dense, les surfaces de meubles (tables, étagères) partagent localement les mêmes propriétés géométriques que le sol navigable. Les approches purement géométriques confondent fréquemment ces surfaces, générant des trajectoires invalides ou des blocages de planification. En imposant une contrainte topologique explicite plutôt que de s'appuyer uniquement sur la courbure ou la normale de surface, le framework sépare structurellement le sol du reste. Pour les intégrateurs de flottes AMR ou AGV en entrepôt ou milieu hospitalier, cette distinction fiable entre navigable et non-navigable sans calibrage manuel représente un gain opérationnel direct, en particulier dans des espaces reconfigurés fréquemment. Ce type d'approche s'inscrit dans un mouvement plus large visant à dépasser les représentations voxel denses, trop coûteuses pour la planification temps-réel embarquée. Des travaux concurrents explorent les champs de distance neuronaux (NeRF-based planning), les graphes de visibilité sur maillages 3D, ou les approches d'apprentissage par renforcement simulé (sim-to-real). Le recours à des datasets standardisés comme Matterport3D et PCT facilite la comparaison reproductible, même si les scènes testées restent des environnements statiques sans agents dynamiques. Les auteurs n'annoncent pas de déploiement matériel, ce qui positionne ce travail comme une contribution algorithmique amont, dont l'intégration dans des stacks robotiques industriels (ROS 2, Nav2) reste à démontrer sur robot physique.

RecherchePaper
1 source