Aller au contenu principal
SuReNav : navigation par graphe de superpixels avec relaxation de contraintes en environnements sur-contraints
RecherchearXiv cs.RO6sem

SuReNav : navigation par graphe de superpixels avec relaxation de contraintes en environnements sur-contraints

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (identifiant 2602.06807) SuReNav, une méthode de navigation robotique conçue pour les environnements dits "sur-contraints", où aucun chemin ne permet d'éviter l'intégralité des obstacles. Le problème visé est concret : dans des espaces semi-statiques (couloirs partiellement encombrés, zones urbaines, campus), les planificateurs classiques échouent ou bloquent faute de solution "parfaite". SuReNav repose sur trois composantes : une carte en graphe de superpixels encodant des contraintes régionales hiérarchisées, un réseau de neurones sur graphe (GNN) entraîné sur des démonstrations humaines pour relâcher sélectivement ces contraintes, et un mécanisme d'entrelacement entre relaxation, planification et exécution en temps réel. La méthode a été évaluée sur des cartes sémantiques 2D et des environnements 3D issus d'OpenStreetMap, obtenant le meilleur score de "ressemblance humaine" parmi les baselines testées. Une démonstration en navigation urbaine réelle a été réalisée avec un quadrupède Spot de Boston Dynamics.

L'apport principal est de dépasser les limites des planificateurs à coûts prédéfinis, peu transférables à des environnements inédits. En s'appuyant sur des démonstrations humaines, le GNN apprend à distinguer les zones passables "en dernier recours" des zones strictement interdites, une nuance que les heuristiques fixes peinent à capturer sans sur-estimation systématique. Pour les intégrateurs déployant des robots mobiles en milieux semi-statiques, l'enjeu est direct : le robot cesse de bloquer face à une impasse et produit une solution "best-effort" minimisant le risque traversé. La généralisation sans reconfiguration manuelle des coûts est particulièrement pertinente pour des déploiements à grande échelle. Il convient toutefois de noter que les métriques de "human-likeness" restent auto-définies par les auteurs, et que les vidéos disponibles ne couvrent qu'un sous-ensemble de scénarios.

SuReNav s'inscrit dans la tendance à l'apprentissage par imitation pour la navigation mobile, un axe activement exploré par des équipes comme ETH Zurich, CMU Robotics Institute ou dans le cadre de projets EU sur la robotique en espace public. La méthode se distingue des approches VLA (Vision-Language-Action) pures par son ancrage dans une représentation spatiale structurée plutôt que dans un modèle de langage génératif, ce qui la rend plus interprétable et plus légère computationnellement. Les principaux concurrents sur ce créneau incluent des planificateurs à champ de potentiel augmentés et des méthodes de navigation par apprentissage par renforcement. Aucun déploiement commercial n'est annoncé : il s'agit d'un résultat de recherche avec validation expérimentale sur Spot, dont le code est publié sur sure-nav.github.io, ouvrant la voie à des reproductions et pilotes industriels.

Impact France/UE

La méthode est directement pertinente pour les projets européens déployant des robots mobiles en espaces publics semi-statiques (couloirs, campus, zones urbaines), un axe exploré par ETH Zurich et plusieurs consortiums EU, et le code ouvert facilite des pilotes industriels sur le Vieux Continent.

À lire aussi

CORE Planner : navigation robotique en environnements inconnus par apprentissage par renforcement à mémoire contextuelle
1arXiv cs.RO 

CORE Planner : navigation robotique en environnements inconnus par apprentissage par renforcement à mémoire contextuelle

Une équipe de chercheurs a publié sur arXiv (réf. 2606.29222) un planificateur de navigation autonome baptisé CORE (Contextual-memory Oriented Reinforcement-learning), conçu pour guider un robot dans des environnements inconnus sans carte préalable. L'architecture combine un graphe de visibilité sparse pour la représentation structurée de l'espace, un réseau Transformer pour la compréhension globale de l'environnement, et un mécanisme de mémoire contextuelle pour éviter les optima locaux dans les grandes scènes. Testé face au planificateur traditionnel FAR Planner et à plusieurs baselines d'apprentissage par renforcement, CORE réduit la distance de déplacement de 13 % par rapport à FAR Planner et jusqu'à 48 % face aux meilleures méthodes d'apprentissage, avec des gains qui s'accentuent dans les environnements complexes. Fait notable : le modèle réalise un transfert sim-to-real en zéro-shot, sans fine-tuning sur données réelles, après entraînement exclusif sur des environnements simulés basés sur l'image. Le code est disponible en accès libre sur GitHub. Ce résultat s'attaque à un verrou persistant de la navigation mobile : la dégradation des performances lors du passage du simulateur au monde réel. La plupart des méthodes d'apprentissage par renforcement nécessitent soit une domain randomization poussée, soit un fine-tuning coûteux sur données terrain. Ici, le zéro-shot sim-to-real est démontré en environnement physique sans intervention humaine, résultat significatif si les conditions expérimentales sont généralisables. Pour les intégrateurs et équipes R&D, l'enjeu concret est double : réduction de la distance parcourue (efficacité énergétique, temps de cycle) et capacité à opérer dans des espaces non cartographiés, scénario courant en logistique, BTP ou exploration. La navigation en environnements inconnus s'appuie historiquement sur le SLAM, avec des contributions majeures d'ETH Zurich, Carnegie Mellon ou l'INRIA côté européen. FAR Planner (CMU), utilisé ici comme référence de comparaison, reste une baseline solide mais à règles fixes. Sur le plan industriel, Boston Dynamics, ANYbotics ou Exotec intègrent des planificateurs propriétaires dans leurs flottes de robots mobiles. CORE se positionne comme une alternative légère, entraînable sur image seule, mais reste à ce stade une contribution académique sans déploiement industriel annoncé. La robustesse face aux obstacles dynamiques, non testée dans cette version, constituera l'étape critique pour une éventuelle industrialisation.

UELe code open-source pourrait être évalué par des équipes R&D françaises (Exotec, intégrateurs logistiques) pour la navigation en espaces non cartographiés, mais il n'y a pas de lien institutionnel direct avec la France ou l'UE.

RecherchePaper
1 source
PECMAN : navigation collaborative multi-agents par perception en environnements inconnus
2arXiv cs.RO 

PECMAN : navigation collaborative multi-agents par perception en environnements inconnus

Des chercheurs ont publié sur arXiv (réf. 2605.09344) PECMAN, un système de navigation collaborative multi-agents conçu pour des environnements inconnus et dynamiques. L'algorithme s'appuie sur SMART-3D, un planificateur de trajectoires fondé sur la structure RRT* (Rapidly-exploring Random Tree) capable de reconfigurer en temps réel son arbre de planification dès qu'un obstacle ou une nouvelle structure est détecté : plutôt que de reconstruire l'arbre depuis zéro, SMART-3D élague les noeuds et arêtes invalidés, puis répare les sous-arbres déconnectés à des points critiques appelés "hot-nodes". PECMAN étend ce mécanisme à la coopération multi-agents via deux stratégies combinées : une morphologie d'arbre distribuée, où chaque robot replanifie localement, et une perception partagée, par laquelle chaque agent diffuse les structures nouvellement découvertes à ses coéquipiers, leur permettant de replanifier proactivement même dans des zones encore inexplorées. Évalué sur 28 000 simulations couvrant sept scénarios 2D distincts, le système atteint jusqu'à 52 % de réduction du temps de complétion collective avec un taux de succès proche de 100 %. Les expériences ont également été validées sur deux robots autonomes réels dans un environnement de bâtiment. La contribution architecturale centrale est la perception partagée sans coordinateur central : chaque agent enrichit la carte collective en temps réel, ce qui réduit les replanifications redondantes et la latence de réaction de la flotte entière. Pour les intégrateurs de systèmes AMR (Autonomous Mobile Robots) en logistique ou en inspection industrielle, c'est précisément le verrou qui bloque le passage à l'échelle des flottes dans des environnements semi-structurés. La validation physique, même limitée à deux robots, apporte un début de réponse au problème classique du sim-to-real gap, l'un des obstacles majeurs au déploiement de planificateurs collaboratifs en conditions réelles. La réduction de 52 % du temps de complétion est prometteuse, mais mérite d'être interprétée avec prudence : les simulations 2D ne capturent pas la complexité des environnements 3D, et les scénarios de test ne sont pas détaillés dans l'abstract. Les approches multi-agents existantes comme CBS (Conflict-Based Search) ou ORCA supposent généralement des cartes connues à l'avance, ce qui les rend difficilement applicables à une exploration progressive. SMART-3D avait résolu ce problème pour un agent unique ; PECMAN en est l'extension coopérative naturelle. Aucun partenaire industriel ni déploiement commercial n'est mentionné dans la publication, qui reste une contribution académique. Les prochaines étapes logiques seraient des tests sur des flottes plus larges et en environnements 3D réels, conditions nécessaires pour envisager un transfert vers des entrepôts multi-niveaux ou des bâtiments industriels complexes, où les systèmes AMR actuels peinent encore à coordonner leur navigation de façon autonome.

RecherchePaper
1 source
HumanFlow : navigation de drone MAV parmi les humains par diffusion, avec suivi, prévision et contrôle du mouvement
3arXiv cs.RO 

HumanFlow : navigation de drone MAV parmi les humains par diffusion, avec suivi, prévision et contrôle du mouvement

Des chercheurs ont publié en mai 2026 un préprint arXiv (arXiv:2605.25685) présentant HumanFlow, un modèle de diffusion latente conçu pour la navigation de drones autonomes (MAVs, Micro Aerial Vehicles) dans des espaces peuplés. L'architecture unifie deux tâches habituellement traitées séparément : le suivi de la position 3D des personnes en temps réel (tracking) et la prédiction de leurs trajectoires futures (forecasting), le tout conditionné sur le contexte 3D de la scène environnante. La politique de contrôle associée repose sur un MPC (Model Predictive Control) approché par correspondance de flux (flow-matching), couplé directement à l'espace latent du modèle de perception. Les validations ont été conduites en simulation, en rejouant des trajectoires humaines réelles. Les auteurs annoncent de meilleures performances de tracking que les méthodes de référence, avec une efficacité computationnelle supérieure, et une navigation sans collision maintenue même en cas de visibilité partielle ou d'occultations sévères. L'apport central de HumanFlow est ce couplage serré (tight coupling) entre la perception humaine et la commande du robot, une intégration rarement réalisée dans la littérature de navigation sociale. Les systèmes existants échouent fréquemment lorsque des personnes sont partiellement masquées, produisant des estimations incohérentes avec la scène qui dégradent la sécurité et l'efficacité opérationnelle. En générant des prédictions de mouvement lisses et physiquement plausibles y compris sous occultation forte, le modèle réduit ce point de défaillance critique. Pour les intégrateurs de drones en environnement industriel, logistique ou public, c'est l'une des principales barrières à la certification : garantir la détection fiable des humains dans les angles morts. La démonstration que l'espace latent d'un modèle de diffusion peut directement piloter un contrôleur MPC ouvre une voie architecturale potentiellement transposable à des robots au sol ou des bras manipulateurs évoluant aux côtés d'opérateurs. HumanFlow s'inscrit dans un courant de recherche actif sur la navigation sociale robotique, dominé jusque-là par des approches basées sur des estimateurs déterministes ou des réseaux de prédiction de trajectoires tels que les architectures LSTM et Transformer. L'utilisation de modèles de diffusion pour la prédiction de mouvements humains est récente, apparue au milieu des années 2020, et HumanFlow en est l'une des premières applications directement couplées au contrôle. Ses concurrents directs incluent des pipelines séparant explicitement perception, prédiction et planification. Il faut noter que les validations restent entièrement en simulation : aucun déploiement physique sur drone réel n'est rapporté dans ce préprint, ce qui laisse ouverte la question du sim-to-real gap pour cette classe de modèles génératifs. Les prochaines étapes logiques seraient des essais sur MAV réel en environnement semi-contrôlé.

RecherchePaper
1 source
Navigation en foule par LiDAR avec représentation des groupes en bordure de champ de vision
4arXiv cs.RO 

Navigation en foule par LiDAR avec représentation des groupes en bordure de champ de vision

Des chercheurs ont publié sur arXiv (référence 2604.16741) une étude portant sur la navigation autonome de robots mobiles dans des environnements piétonniers à forte densité, en s'appuyant sur une représentation simplifiée des groupes de piétons détectés par LiDAR. Le problème central qu'ils adressent est bien identifié dans le secteur : naviguer socialement en foule dense reste un verrou applicatif majeur pour les AMR déployés en gare, aéroport ou centre commercial. Les approches existantes souffrent de deux limites structurelles : soit elles n'ont été testées qu'en faible densité, soit elles reposent sur des modules de détection externe d'individus, particulièrement sensibles aux occlusions et au bruit de capteur propres aux foules compactes. Les auteurs proposent en réponse une représentation dite "visible edge-based" des groupes, qui exploite uniquement les arêtes visibles entre piétons détectés, sans reconstruction complète des trajectoires individuelles. Le résultat le plus significatif de ce travail est contre-intuitif : la précision de la prédiction des groupes n'influence que marginalement les performances de navigation en environnement dense. Cela suggère qu'une représentation simplifiée, computationnellement moins coûteuse, peut atteindre des niveaux de sécurité et de "socialness" comparables à des approches plus complexes. Pour les intégrateurs et les équipes R&D déployant des robots de service en milieu public, cette observation est directement actionnables : elle légitime une réduction significative de la complexité du pipeline de perception sans dégradation mesurable du comportement social du robot. Les expériences en simulation confirment cette parité de performance, et la vitesse de calcul accrue ouvre la voie à des déploiements sur hardware embarqué plus contraint. Le contexte académique de ce travail s'inscrit dans une littérature active sur la navigation socialmente conforme (socially-aware navigation), dont les jalons incluent les travaux sur ORCA, SARL ou encore CADRL. La prise en compte des groupes comme unité comportementale plutôt que des individus isolés remonte à des études empiriques en sciences sociales (théorie des F-formations), et plusieurs équipes travaillent sur ce sujet, notamment à travers les benchmarks de navigation piétonnière en robotique de service. L'étape suivante naturelle serait une validation à plus grande échelle en conditions réelles, les auteurs ayant pour l'instant limité les expériences terrain à un seul robot dans un environnement contrôlé.

RecherchePaper
1 source