Aller au contenu principal
Localisation SLAM multi-session par texture au sol en environnements peu dynamiques
RecherchearXiv cs.RO6sem

Localisation SLAM multi-session par texture au sol en environnements peu dynamiques

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (identifiant 2605.19701) une étude portant sur le SLAM multi-session par texture de sol dans des environnements à faible dynamique de changement. Le SLAM (Simultaneous Localization and Mapping) basé sur la texture du sol utilise uniquement les patterns visuels du plancher comme repère cartographique, sans marqueurs physiques ni infrastructure dédiée. L'article évalue trois techniques pour améliorer la précision d'estimation de trajectoire dans des environnements où le sol évolue lentement entre sessions : usure de surface, phénomènes météorologiques, variations saisonnières. Parmi ces approches, l'utilisation de la divergence de Kullback-Leibler (KLD), une mesure de dissimilarité entre distributions de probabilité, comme score de similarité et comme biais influençant la confiance dans la détection de bouclage de trajectoire (loop closure), s'est révélée la plus performante. L'équipe met également à disposition un dataset public contenant des images multi-sessions de sol avec variations entre sessions et des données de pose haute précision pour évaluation comparative.

La gestion multi-session est un prérequis opérationnel souvent sous-estimé dans les déploiements longue durée de robots mobiles autonomes (AMR) en environnements peu texturés : entrepôts à sols lisses, couloirs hospitaliers, zones de production industrielle. Un robot contraint de reconstruire intégralement sa carte après chaque redémarrage, maintenance ou changement saisonnier génère des interruptions de service et des coûts opérationnels qui compromettent la viabilité à l'échelle. La capacité à détecter des correspondances fiables entre sessions malgré une évolution lente du terrain constitue un pas concret vers des systèmes SLAM "lifelong" exploitables en production, et la KLD semble offrir ici un avantage mesurable sur les métriques de similarité classiques.

Le SLAM par texture de sol s'est développé comme alternative aux systèmes LiDAR et aux réseaux de marqueurs au sol dans des contextes où l'infrastructure est coûteuse ou non autorisée, mais les travaux antérieurs restaient limités aux opérations mono-session. Les systèmes AMR commerciaux de référence, notamment ceux d'Exotec pour la logistique française ou les plateformes de navigation d'entrepôt fondées sur LiDAR 2D, s'appuient encore sur des capteurs actifs ou des repères fixes. Cette publication s'inscrit dans l'effort croissant de la communauté SLAM pour traiter les environnements "low-dynamic", zone intermédiaire entre statique et hautement dynamique qui représente pourtant la majorité des déploiements industriels réels. Le dataset public est la contribution la plus directement réutilisable, ouvrant la voie à un benchmark standardisé entre méthodes concurrentes.

Impact France/UE

Le dataset public et la méthode KLD offrent une piste concrète pour les équipes R&D travaillant sur des AMR longue durée en environnements industriels européens (entrepôts logistiques, couloirs hospitaliers), en réduisant les interruptions de service liées aux reconfigurations cartographiques multi-sessions.

Dans nos dossiers

À lire aussi

Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques
1arXiv cs.RO 

Prise de décision enrichie par la causalité pour robots mobiles autonomes en environnements dynamiques

Des chercheurs ont publié sur arXiv (ref. 2504.11901, cinquième version) un framework de prise de décision basé sur l'inférence causale pour les robots mobiles autonomes (AMR) évoluant dans des environnements partagés avec des humains. Plutôt que de s'appuyer uniquement sur des corrélations statistiques, leur système apprend un modèle causal explicite des dynamiques d'environnement, notamment l'estimation de la consommation batterie et les risques d'obstruction par des passants, pour décider quand et comment exécuter une tâche. Pour valider leur approche, l'équipe a développé PeopleFlow, un simulateur basé sur Gazebo capable de générer des trajectoires réalistes de multiples agents (humains et robots) en tenant compte de facteurs contextuels comme l'heure, la configuration spatiale et l'état du robot. Le cas d'usage principal est un entrepôt en activité partagée, benchmark face à une baseline non-causale classique. L'apport principal est de déplacer la logique de décision de la corrélation vers la causalité, une distinction non triviale en robotique opérationnelle. Là où un système standard détecte qu'il y a "souvent du monde à 14h dans l'allée B" et l'évite, un modèle causal comprend pourquoi, ce qui lui permet d'anticiper des situations nouvelles et de planifier la minuterie d'une tâche logistique en conséquence. Pour un COO gérant une flotte d'AMR dans un entrepôt mutualisé avec des préparateurs de commandes, cela se traduit potentiellement par moins d'arrêts non planifiés, une meilleure gestion de la charge batterie, et une cohabitation plus fluide. Il convient toutefois de noter que les résultats présentés sont exclusivement issus de simulation, sans validation terrain, ce qui constitue une limite importante à ce stade. Ce travail s'inscrit dans un contexte de déploiement croissant d'AMR dans des espaces mixtes, des entrepôts e-commerce aux hôpitaux, où des acteurs comme MiR (Teradyne), Locus Robotics ou le français Exotec font face à des défis de navigation sociale de plus en plus complexes. La recherche en planification causale reste largement académique, mais elle trace une voie complémentaire aux approches par apprentissage par renforcement ou par règles explicites. La prochaine étape logique serait une validation sur robot physique en environnement réel, un passage sim-to-real que l'article n'adresse pas encore.

UELes opérateurs français d'AMR comme Exotec, confrontés à la navigation en entrepôts partagés avec des préparateurs humains, sont le public cible naturel de ce framework, mais l'absence de validation terrain limite l'applicabilité immédiate.

RecherchePaper
1 source
Robots évitant les collisions en temps réel dans des environnements dynamiques
2arXiv cs.RO 

Robots évitant les collisions en temps réel dans des environnements dynamiques

Des chercheurs publient une méthode qui convertit n'importe quel chemin géométrique, c'est-à-dire une simple séquence d'états produite par un planificateur de mouvement quelconque (échantillonné comme RRT ou PRM, ou basé sur la recherche comme ARA*), en une trajectoire réellement exécutable par un robot : cinématiquement faisable et à jerk limité. L'algorithme génère une suite de splines quintiques ou quartiques, discrétisées à une fréquence de contrôle choisie par l'utilisateur, puis diffusées directement vers le contrôleur bas niveau. Il peut être réinvoqué à tout instant pour recalculer une nouvelle trajectoire depuis l'état courant du robot vers une cible ou une séquence de cibles, avec adaptation en temps réel aux changements de l'environnement. Sous l'hypothèse que la vitesse des obstacles reste bornée, la méthode offre des garanties conditionnelles d'arrêt sécurisé sur un intervalle de temps fini, tout en tolérant une déviation géométrique limitée par rapport au chemin d'origine. Les contraintes cinématiques, jerk compris, sont traitées explicitement. En simulation comparative face à une méthode concurrente, les auteurs rapportent un meilleur lissage, un temps de calcul plus faible et de meilleures performances temps réel, en particulier lors de changements fréquents de cible, jusqu'à 1 kHz. Des expériences sur robot réel valident l'approche, y compris dans des scénarios où un humain fait office d'obstacle. Pour les intégrateurs, ce travail cible un problème très concret : la plupart des planificateurs de mouvement produisent des chemins géométriques, pas des trajectoires exécutables respectant les limites physiques du robot en vitesse, accélération et jerk. Combler ce fossé en temps réel, avec des garanties de sécurité formelles même quand des obstacles se déplacent, fait défaut à de nombreuses piles de navigation actuelles destinées aux environnements partagés avec des humains, entrepôts, usines ou bras collaboratifs. La capacité à replanifier jusqu'à 1 kHz sans dégrader la fluidité du mouvement représente un vrai gain pour les systèmes confrontés à des changements rapides de l'environnement, sans imposer le compromis habituel entre réactivité et stabilité. Le domaine de la planification de mouvement reste tiraillé entre planificateurs globaux, qui trouvent un chemin, et méthodes locales, chargées de le rendre exécutable en douceur : les chemins issus d'échantillonnage sont typiquement irréguliers et nécessitent un post-traitement. Les approches existantes de lissage gèrent souvent mal les obstacles dynamiques ou la replanification à haute fréquence, ce qui constitue la référence à laquelle ce travail se compare. La méthode s'appuie sur la génération de trajectoires par splines, technique classique en robotique pour le mouvement à jerk limité, en y ajoutant une gestion explicite des obstacles dynamiques et des garanties formelles d'arrêt sécurisé. Publiée en version révisée sur arXiv, elle ouvre la voie à des validations plus larges sur d'autres plateformes robotiques.

RecherchePaper
1 source
Visualisation des phases latentes dans les politiques de locomotion : étude multi-environnement et extension temporelle
3arXiv cs.RO 

Visualisation des phases latentes dans les politiques de locomotion : étude multi-environnement et extension temporelle

Des chercheurs présentent dans un preprint arXiv (2605.18286, mai 2026) un cadre méthodologique pour visualiser les structures de phases motrices latentes apprises par des politiques de locomotion entraînées en apprentissage par renforcement profond (DRL). L'étude cible trois environnements de simulation MuJoCo, devenus benchmarks de référence pour la locomotion : Ant-v5 (quadrupède à 8 degrés de liberté actifs), HalfCheetah-v5 (bipède planaire) et Walker2D-v5 (bipède 3D). La méthode proposée étend les features de clustering habituellement limitées aux observations d'état en y ajoutant les actions courantes, les états suivants et les actions suivantes, formant ainsi un vecteur augmenté temporellement. Un critère de sélection du nombre de clusters est également introduit, qui pénalise les auto-transitions, forçant la segmentation à capturer des transitions motrices réelles plutôt que des régions stationnaires artificielles. L'enjeu est celui de l'interprétabilité des politiques DRL, un point aveugle connu du domaine : les réseaux de neurones qui pilotent ces agents produisent des comportements performants mais dont la structure interne reste opaque. Or la biomécanique établit depuis longtemps que la locomotion est organisée en phases distinctes et cycliques (phase d'appui, phase oscillante), une structure que les politiques apprenantes semblent reproduire sans que cela soit explicitement supervisé. Pouvoir extraire automatiquement ces phases depuis les trajectoires générées offre un outil de diagnostic et de validation : un contrôleur dont les phases motrices latentes sont floues ou irrégulières signale probablement une politique fragile ou sur-ajustée. Pour les équipes qui cherchent à transférer des politiques de simulation vers le réel (sim-to-real), détecter ces structures pourrait devenir un critère de qualité avant déploiement. Ce travail s'inscrit dans un courant actif d'explicabilité appliquée au DRL locomoteur, parallèle aux efforts de labs comme DeepMind (travaux sur l'analyse des politiques de locomotion MuJoCo) ou des groupes académiques travaillant sur l'analyse spectrale des espaces latents de politiques. La méthode proposée s'appuie sur des algorithmes de clustering non supervisés appliqués post-hoc sur des trajectoires, sans modifier l'entraînement, ce qui la rend applicable à n'importe quelle politique existante. Les résultats montrent des règles de transition plus nettes et plus régulières que la méthode de référence utilisée en comparaison, bien que l'étude reste confinée à la simulation et n'aborde pas encore l'extension à des politiques déployées sur robots physiques.

RecherchePaper
1 source
ShelfAware : localisation sémantique en temps réel dans des environnements quasi-statiques avec des capteurs bas coût
4arXiv cs.RO 

ShelfAware : localisation sémantique en temps réel dans des environnements quasi-statiques avec des capteurs bas coût

Des chercheurs ont publié sur arXiv (2512.09065v2) ShelfAware, un filtre particulaire sémantique conçu pour la localisation globale de robots mobiles dans des environnements dits quasi-statiques : des espaces dont la géométrie générale est stable mais dont les contenus changent continuellement, comme les rayons d'un supermarché ou les allées d'un entrepôt logistique. Le système fusionne une vraisemblance de profondeur avec une similarité sémantique centrée sur les catégories d'objets, et génère des hypothèses de pose via des propositions inverses précalculées intégrées dans un cadre Monte Carlo Localization (MCL). Évalué dans un environnement de vente fictif rigoureusement contrôlé, ShelfAware atteint un taux de succès de localisation globale de 97 % et maintient un taux de suivi de 66 % dans des conditions d'occultation variées (chariot, dispositif portable, obstruction dynamique). Dans un second test mené dans un supermarché opérationnel de 325 m², le système s'appuie sur un pipeline de vision à vocabulaire ouvert et surpasse significativement les approches géométriques seules ainsi que les méthodes sémantiques à points de repère fixes. L'ensemble tourne sur du matériel vision bas coût, sans capteur LiDAR. Ce qui est notable ici, c'est moins la performance brute que l'approche architecturale. La grande majorité des systèmes de localisation sémantique traitent les objets comme des landmarks discrets et fixes : un objet identifié = une position dans la carte. ShelfAware modélise à la place la sémantique de manière distributionnelle, comme une évidence statistique sur des catégories, ce qui le rend résilient aux changements de stock, aux réorganisations et au désordre dynamique. Pour un intégrateur déployant des AMR (autonomous mobile robots) en grande distribution ou en logistique de dernier kilomètre, cela signifie une localisation sans infrastructure additionnelle (pas de QR codes, pas de balises UWB), avec un hardware limité au seul RGB-D ou monoculaire. L'article s'inscrit dans un effort de recherche plus large visant à combler le fossé entre les environnements de laboratoire et les déploiements réels dans des espaces peuplés et changeants. Les approches concurrentes incluent les méthodes SLAM visuelles (ORB-SLAM3, OpenVINS) et les systèmes sémantiques basés sur des réseaux de neurones comme Nice-SLAM ou Semantic-NeRF, qui offrent de meilleures représentations mais exigent des ressources computationnelles bien supérieures. ShelfAware opte pour un compromis pragmatique : représentation légère, généralisation par le vocabulaire ouvert (CLIP ou équivalent), et intégration native dans MCL. Il s'agit d'une contribution académique préprint, pas d'un produit commercialisé : aucun déploiement industriel ni partenariat industriel n'est annoncé à ce stade. Des acteurs comme Simbe Robotics ou Badger Technologies, positionnés sur la robotique de retail avec infrastructure propriétaire, constituent le référentiel concurrentiel naturel face auquel une telle approche sans infrastructure prendrait de la valeur.

RecherchePaper
1 source