Combler les lacunes : couverture ergodique multi-robot …

Couverture ergodique dans les systèmes multi-robots via la diffusion anisotrope

33

1arXiv cs.RO

Couverture ergodique dans les systèmes multi-robots via la diffusion anisotrope

Une équipe de chercheurs a soumis sur arXiv (référence 2605.24125, mai 2026) un nouveau cadre mathématique pour la couverture ergodique dans les systèmes multi-robots, basé sur la diffusion anisotrope de Perona-Malik. La couverture ergodique désigne la capacité d'une flotte de robots à explorer un espace de manière proportionnelle à une distribution de probabilité cible : plus une zone est jugée prioritaire, plus les robots y concentrent leur trajectoire. L'innovation proposée combine champ de potentiel et recherche ergodique en utilisant le gradient de la solution de l'équation de Perona-Malik pour diriger le mouvement des agents. Les résultats sont validés uniquement par simulation, dans plusieurs scénarios distincts, sans déploiement réel rapporté. La méthode de référence jusqu'ici reposait sur la diffusion isotrope via l'équation de la chaleur, qui propage l'erreur entre trajectoire réelle et distribution cible de façon uniforme dans toutes les directions, sans tenir compte des variations locales de la carte de densité. Cette uniformité devient sous-optimale lorsque la distribution présente des gradients forts ou des zones très contrastées, situation fréquente en inspection industrielle, surveillance périmétrique ou recherche et sauvetage en milieu hétérogène. La diffusion anisotrope proposée adapte la propagation selon la structure locale de la distribution, permettant aux robots de réagir plus finement aux discontinuités de la carte de priorité. Le cadre présenté englobe l'équation de la chaleur comme cas particulier, garantissant la rétrocompatibilité avec les algorithmes existants et facilitant une migration incrémentale. La couverture ergodique multi-robots fait l'objet de recherches actives depuis une quinzaine d'années, avec des travaux fondateurs portés notamment par le laboratoire de Todd Murphey à Northwestern University. L'approche par équation de la chaleur avait été proposée récemment comme alternative aux métriques spectrales classiques basées sur la décomposition de Fourier, elles-mêmes coûteuses en calcul pour de grands espaces. La diffusion de Perona-Malik, empruntée au traitement d'image où elle est utilisée depuis 1990 pour préserver les contours tout en lissant le bruit, est ici réinterprétée pour générer des champs de potentiel directionnels en robotique. Ce travail reste purement théorique et simulé : aucun test sur plateforme physique, aucun partenaire industriel et aucun financement institutionnel ne sont mentionnés, ce qui laisse entière la question du passage sim-to-real, particulièrement délicate pour les flottes multi-robots en environnement dynamique réel.

RecherchePaper

1 source

PECMAN : navigation collaborative multi-agents par perception en environnements inconnus

42

2arXiv cs.RO

PECMAN : navigation collaborative multi-agents par perception en environnements inconnus

Des chercheurs ont publié sur arXiv (réf. 2605.09344) PECMAN, un système de navigation collaborative multi-agents conçu pour des environnements inconnus et dynamiques. L'algorithme s'appuie sur SMART-3D, un planificateur de trajectoires fondé sur la structure RRT* (Rapidly-exploring Random Tree) capable de reconfigurer en temps réel son arbre de planification dès qu'un obstacle ou une nouvelle structure est détecté : plutôt que de reconstruire l'arbre depuis zéro, SMART-3D élague les noeuds et arêtes invalidés, puis répare les sous-arbres déconnectés à des points critiques appelés "hot-nodes". PECMAN étend ce mécanisme à la coopération multi-agents via deux stratégies combinées : une morphologie d'arbre distribuée, où chaque robot replanifie localement, et une perception partagée, par laquelle chaque agent diffuse les structures nouvellement découvertes à ses coéquipiers, leur permettant de replanifier proactivement même dans des zones encore inexplorées. Évalué sur 28 000 simulations couvrant sept scénarios 2D distincts, le système atteint jusqu'à 52 % de réduction du temps de complétion collective avec un taux de succès proche de 100 %. Les expériences ont également été validées sur deux robots autonomes réels dans un environnement de bâtiment. La contribution architecturale centrale est la perception partagée sans coordinateur central : chaque agent enrichit la carte collective en temps réel, ce qui réduit les replanifications redondantes et la latence de réaction de la flotte entière. Pour les intégrateurs de systèmes AMR (Autonomous Mobile Robots) en logistique ou en inspection industrielle, c'est précisément le verrou qui bloque le passage à l'échelle des flottes dans des environnements semi-structurés. La validation physique, même limitée à deux robots, apporte un début de réponse au problème classique du sim-to-real gap, l'un des obstacles majeurs au déploiement de planificateurs collaboratifs en conditions réelles. La réduction de 52 % du temps de complétion est prometteuse, mais mérite d'être interprétée avec prudence : les simulations 2D ne capturent pas la complexité des environnements 3D, et les scénarios de test ne sont pas détaillés dans l'abstract. Les approches multi-agents existantes comme CBS (Conflict-Based Search) ou ORCA supposent généralement des cartes connues à l'avance, ce qui les rend difficilement applicables à une exploration progressive. SMART-3D avait résolu ce problème pour un agent unique ; PECMAN en est l'extension coopérative naturelle. Aucun partenaire industriel ni déploiement commercial n'est mentionné dans la publication, qui reste une contribution académique. Les prochaines étapes logiques seraient des tests sur des flottes plus larges et en environnements 3D réels, conditions nécessaires pour envisager un transfert vers des entrepôts multi-niveaux ou des bâtiments industriels complexes, où les systèmes AMR actuels peinent encore à coordonner leur navigation de façon autonome.

RecherchePaper

1 source

CORE Planner : navigation robotique en environnements inconnus par apprentissage par renforcement à mémoire contextuelle

49

3arXiv cs.RO

CORE Planner : navigation robotique en environnements inconnus par apprentissage par renforcement à mémoire contextuelle

Une équipe de chercheurs a publié sur arXiv (réf. 2606.29222) un planificateur de navigation autonome baptisé CORE (Contextual-memory Oriented Reinforcement-learning), conçu pour guider un robot dans des environnements inconnus sans carte préalable. L'architecture combine un graphe de visibilité sparse pour la représentation structurée de l'espace, un réseau Transformer pour la compréhension globale de l'environnement, et un mécanisme de mémoire contextuelle pour éviter les optima locaux dans les grandes scènes. Testé face au planificateur traditionnel FAR Planner et à plusieurs baselines d'apprentissage par renforcement, CORE réduit la distance de déplacement de 13 % par rapport à FAR Planner et jusqu'à 48 % face aux meilleures méthodes d'apprentissage, avec des gains qui s'accentuent dans les environnements complexes. Fait notable : le modèle réalise un transfert sim-to-real en zéro-shot, sans fine-tuning sur données réelles, après entraînement exclusif sur des environnements simulés basés sur l'image. Le code est disponible en accès libre sur GitHub. Ce résultat s'attaque à un verrou persistant de la navigation mobile : la dégradation des performances lors du passage du simulateur au monde réel. La plupart des méthodes d'apprentissage par renforcement nécessitent soit une domain randomization poussée, soit un fine-tuning coûteux sur données terrain. Ici, le zéro-shot sim-to-real est démontré en environnement physique sans intervention humaine, résultat significatif si les conditions expérimentales sont généralisables. Pour les intégrateurs et équipes R&D, l'enjeu concret est double : réduction de la distance parcourue (efficacité énergétique, temps de cycle) et capacité à opérer dans des espaces non cartographiés, scénario courant en logistique, BTP ou exploration. La navigation en environnements inconnus s'appuie historiquement sur le SLAM, avec des contributions majeures d'ETH Zurich, Carnegie Mellon ou l'INRIA côté européen. FAR Planner (CMU), utilisé ici comme référence de comparaison, reste une baseline solide mais à règles fixes. Sur le plan industriel, Boston Dynamics, ANYbotics ou Exotec intègrent des planificateurs propriétaires dans leurs flottes de robots mobiles. CORE se positionne comme une alternative légère, entraînable sur image seule, mais reste à ce stade une contribution académique sans déploiement industriel annoncé. La robustesse face aux obstacles dynamiques, non testée dans cette version, constituera l'étape critique pour une éventuelle industrialisation.

UELe code open-source pourrait être évalué par des équipes R&D françaises (Exotec, intégrateurs logistiques) pour la navigation en espaces non cartographiés, mais il n'y a pas de lien institutionnel direct avec la France ou l'UE.

RecherchePaper

1 source

Contrôle par planification réactive pour robots mobiles en environnements encombrés d'obstacles

28

4arXiv cs.RO

Contrôle par planification réactive pour robots mobiles en environnements encombrés d'obstacles

Une équipe de chercheurs a publié en mai 2026 sur arXiv (arXiv:2605.14232v1) une méthode de contrôle de mouvement pour robots mobiles évoluant dans des environnements encombrés d'obstacles. L'approche, baptisée RPCS (Reactive Planning based Control Strategy), s'attaque à un problème classique de la robotique mobile : déplacer un robot d'un point de départ à une cible sans collision, en ne disposant que d'une information partielle sur l'environnement, c'est-à-dire sans carte globale préalable. Le système fonctionne en deux couches combinées : une trajectoire de référence est d'abord tracée en ligne droite entre les deux points, puis un module de planification réactive (RPS) la modifie localement à la volée lorsque des obstacles sont détectés. Un contrôleur de suivi adaptatif (ATCS), basé sur des techniques de discrétisation, assure ensuite l'exécution effective de cette trajectoire potentiellement modifiée. Les résultats présentés s'appuient uniquement sur des simulations numériques, sans validation hardware reportée. L'intérêt de cette architecture réside dans la séparation claire entre planification réactive et contrôle de suivi, ce qui permet théoriquement d'adapter chaque couche indépendamment selon le robot cible. Pour les intégrateurs travaillant sur des AGV ou AMR dans des entrepôts à géométrie variable, la capacité à opérer sans carte globale complète reste un enjeu réel, les approches purement réactives souffrent souvent de blocages locaux, et les approches globales peinent face aux environnements dynamiques. L'ATCS adaptatif suggère une robustesse potentielle aux perturbations de modèle, mais l'absence d'expérimentation physique limite la portée des conclusions à ce stade. Ce travail s'inscrit dans une longue tradition de recherche sur la navigation réactive, depuis les champs de potentiel de Khatib (1986) jusqu'aux approches VFH et DWA largement déployées dans ROS. Les chercheurs ne positionnent pas explicitement leur méthode face aux planificateurs modernes appris (RL, imitation learning) qui commencent à équiper des plateformes commerciales comme Spot de Boston Dynamics ou les AMR de MiR. La prochaine étape naturelle serait une validation sur robot réel en environnement semi-structuré, condition sine qua non pour que la méthode pèse dans le débat industriel.

RecherchePaper

1 source

Combler les lacunes : couverture ergodique multi-robot guidée par rétroaction en environnements inconnus

À lire aussi

Couverture ergodique dans les systèmes multi-robots via la diffusion anisotrope

PECMAN : navigation collaborative multi-agents par perception en environnements inconnus

CORE Planner : navigation robotique en environnements inconnus par apprentissage par renforcement à mémoire contextuelle

Contrôle par planification réactive pour robots mobiles en environnements encombrés d'obstacles