Aller au contenu principal
RecherchearXiv cs.RO2h

AO-ARC : planification de mouvement multi-robots presque sûrement asymptotiquement optimale avec ARC

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de recherche a publié sur arXiv (référence 2606.27495) AO-ARC, un algorithme de planification de mouvement multi-robots (MRMP) dit "anytime", c'est-à-dire capable de fournir une première solution valide immédiatement, puis de l'améliorer de façon continue sans délai fixé. L'algorithme combine le meta-algorithme AO-x, qui convertit des solveurs de faisabilité en algorithmes anytime, avec la méthode ARC (Adaptive Robot Coordination) appliquée itérativement sur des instances MRMP bornées, sous une métrique de makespan, le temps nécessaire à l'ensemble des robots pour atteindre leurs cibles. Les auteurs affirment que AO-ARC atteint des temps de première solution comparables aux solveurs de faisabilité de l'état de l'art, tout en convergeant plus rapidement et plus régulièrement que les méthodes anytime existantes à mesure que le nombre de robots augmente, avec une preuve formelle d'optimalité asymptotique. L'évaluation porte sur des scénarios 2D à différents niveaux de complexité de coordination et sur un scénario 3D avec bras manipulateurs, représentatif d'applications industrielles réelles.

L'enjeu pratique est significatif : la planification multi-robots est NP-difficile en général, et le passage à l'échelle (10, 50, 100 robots) reste le talon d'Achille des méthodes existantes, notamment dans les entrepôts automatisés ou les cellules robotiques denses. La propriété anytime est particulièrement critique en déploiement réel, où un système ne peut pas attendre une solution optimale avant d'agir. La métrique makespan, en optimisant le temps de fin de la tâche collective plutôt que la somme des distances individuelles, est directement corrélée au débit industriel. Le mécanisme de couplage adaptatif d'ARC, choisir dynamiquement quand planifier des robots conjointement ou indépendamment, est préservé tout en maintenant une borne de coût cohérente sur les décompositions, ce qui est la difficulté théorique centrale que ce travail prétend résoudre.

ARC, le solveur sous-jacent, avait déjà démontré des performances compétitives sur des benchmarks MRMP en exploitant ce couplage sélectif. AO-ARC s'inscrit dans une lignée de recherches visant à combiner garanties théoriques et efficacité pratique, face à des méthodes concurrentes comme CBS (Conflict-Based Search), ECBS ou les variantes de dRRT*, qui peinent à combiner rapidité de première solution et qualité asymptotique à grande échelle. Ce travail reste un preprint arXiv non encore évalué par les pairs, sans déploiement annoncé ni partenaire industriel mentionné, les benchmarks utilisés, bien que représentatifs, ne constituent pas une validation terrain.

Dans nos dossiers

À lire aussi

Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots
1arXiv cs.RO 

Arbres de fibration : une approche unifiée pour la planification de mouvement multi-robots

Une équipe de chercheurs a publié le 11 juin 2026 sur arXiv (2606.12070) un framework mathématique baptisé "fibration trees" visant à unifier les méthodes de planification de mouvement pour des équipes de robots multiples. Le système repose sur une structure en arbre où chaque noeud représente un espace d'états et chaque arête une fibration, c'est-à-dire une projection d'un espace de haute dimension vers un espace simplifié de dimension inférieure. Sur cette base formelle, les chercheurs ont développé un planificateur d'échantillonnage appelé Fibration-RRT (Rapidly-Exploring Random Fibration Trees), validé sur 32 scénarios impliquant des équipes de robots atteignant jusqu'à 96 degrés de liberté (DOF). L'implémentation est publiée en open source, et le planificateur est prouvé probabilistiquement complet. L'enjeu est la fameuse "malédiction de la dimensionnalité" : dès que l'on coordonne plusieurs robots, l'espace de configuration combiné explose exponentiellement, rendant la planification classique intractable. Les approches existantes répondaient à ce problème soit par la priorisation séquentielle (planifier les robots un par un), soit par la décomposition parallèle (sous-espaces indépendants), soit par des projections dans l'espace des tâches, mais sans framework commun capable de combiner ces stratégies. Fibration-RRT généralise à la fois le quotient-space RRT et le discrete RRT sous un formalisme unique, ce qui permet en théorie à un intégrateur de définir sa propre structure d'arbre selon la topologie du problème plutôt que de choisir entre des outils incompatibles. La robustesse sur 96 DOF est un signal technique solide, même si l'article ne fournit pas de comparaison de temps de cycle sur des benchmarks standardisés industrie. La planification de mouvement multi-robot est un domaine mature sur le plan académique, porté depuis la fin des années 1990 par les algorithmes RRT de Steven LaValle et leurs variantes (RRT*, BiRRT, quotient-space RRT de Orthey et al.). Le besoin d'unification se fait sentir à mesure que les déploiements AMR (autonomous mobile robots) et les cellules robotisées industrielles complexifient les interdépendances entre agents. Aucun acteur industriel n'est mentionné dans ce préprint, qui reste pour l'instant une contribution théorique. Les prochaines étapes naturelles seraient une validation sur des plateformes physiques et une intégration dans des middlewares standards comme ROS 2 MoveIt, qui constitue aujourd'hui la référence dans les projets d'intégration multi-bras.

RecherchePaper
1 source
2arXiv cs.RO 

P-ARC : planification parallèle de mouvement multi-robot par exploitation de l'indépendance des sous-problèmes

Une équipe de chercheurs propose sur arXiv (2606.27625) P-ARC, variante parallélisée de l'algorithme ARC (Adaptive Robot Coordination) pour la planification de mouvement multi-robots (MRMP). ARC décompose le problème en trois étapes séquentielles: calcul des solutions individuelles initiales, détection des conflits entre trajectoires, puis résolution de ces conflits. P-ARC parallélise chacune de ces étapes en exploitant l'indépendance structurelle que la décomposition crée entre sous-problèmes, et les auteurs introduisent OR-P-ARC, une variante hybride ajoutant une stratégie multi-départ OR-parallèle. Les benchmarks couvrent des scénarios 2D avec jusqu'à 128 robots mobiles et manipulateurs planaires, ainsi que des équipes de manipulateurs Panda en configurations inspirées de l'industrie. Sur 16 cœurs CPU, le gain de temps de planification approche un facteur 4x par rapport à la version séquentielle d'ARC. Ce résultat intéresse directement les intégrateurs de cellules multi-bras et les opérateurs d'entrepôts automatisés, où la re-planification en temps réel reste un goulot d'étranglement opérationnel. Recalculer des trajectoires sans collision pour une dizaine de manipulateurs en réponse à une perturbation, qu'il s'agisse d'une pièce mal positionnée ou d'un ajout de robot, prend plusieurs secondes avec les approches séquentielles, ce qui bride la cadence de production. Un facteur 4x rendrait la re-planification à la volée plus viable dans des environnements dynamiques. Il convient néanmoins de nuancer: les expériences sont menées dans des scénarios qualifiés d'"inspirés du monde réel" et non sur des déploiements opérationnels réels, et l'écart simulation-terrain reste non quantifié à ce stade. Le MRMP est un problème réputé PSPACE-complet dans sa forme générale, ce qui explique l'intérêt persistant pour les approches de décomposition depuis deux décennies. ARC s'inscrit dans un paysage d'algorithmes incluant CBS (Conflict-Based Search) et ses variantes ECBS et EECBS, utilisées dans des systèmes logistiques commerciaux, ainsi que des solveurs MAPF tels que PBS ou ICTS. La parallélisation de ces algorithmes constitue un axe de recherche actif, avec des travaux récents sur PBS parallèle et des implémentations GPU pour les méthodes de champs de potentiel. P-ARC se distingue en exploitant la structure interne propre à ARC pour paralléliser chaque étape individuellement, plutôt que d'appliquer un parallélisme global à la recherche. Aucun partenariat industriel ni dépôt de code open-source n'est mentionné dans la publication: il s'agit d'une prépublication académique sans calendrier de déploiement annoncé.

RecherchePaper
1 source
HOLO-MPPI : planification de mouvement multi-scénarios par optimisation de politique hiérarchique
3arXiv cs.RO 

HOLO-MPPI : planification de mouvement multi-scénarios par optimisation de politique hiérarchique

Des chercheurs ont publié en juin 2026 sur arXiv (référence 2606.16480) HOLO-MPPI (High-level Offline, Low-level Online MPPI), un framework de planification de mouvement conçu pour que des robots opèrent dans des scénarios variés sans recalibrage par scénario. L'architecture repose sur deux niveaux : hors ligne, une politique haut niveau apprend à proposer des plans robustes dans un espace d'actions abstrait, avec un modèle du monde appris pour la simulation interne ; en ligne, cette politique sert de prior adaptatif pour paramétrer l'algorithme MPPI (Model Predictive Path Integral), qui optimise en temps réel les séquences de contrôle bas niveau face aux perturbations locales. Le système a été instancié et évalué sur des tâches de conduite autonome, avec des architectures de modèles et un espace d'actions haut niveau conçus spécifiquement pour ce domaine. Ce travail attaque une limite concrète du déploiement robotique : un système ne doit pas nécessiter de retuning manuel dès qu'il change d'environnement. L'apprentissage par renforcement de bout en bout peut généraliser, mais se révèle fragile face aux décalages de distribution, aux récompenses mal spécifiées et aux interactions stochastiques. MPPI seul offre un raffinement temps réel efficace sans gradients, mais sa performance dépend d'un prior d'échantillonnage bien construit, ce qui ne passe pas à l'échelle multi-scénarios. HOLO-MPPI résout cette tension : les expériences montrent qu'il surpasse les baselines MPPI pur et RL de bout en bout sur l'ensemble des scénarios de conduite testés, en maintenant des contraintes de contrôle temps réel. MPPI est une méthode de contrôle optimal stochastique établie depuis les travaux de Williams et al. à Georgia Tech (2016-2018), répandue en robotique mobile et conduite autonome. L'hybridation avec des politiques apprises s'inscrit dans une tendance concurrente des approches VLA (Vision-Language-Action) comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA, qui visent une généralisation entièrement apprise. HOLO-MPPI choisit une voie intermédiaire, structurellement plus vérifiable et potentiellement plus attractive pour des intégrateurs industriels soucieux d'explicabilité. Le papier étant un preprint arXiv non encore relu par les pairs, les performances annoncées restent à confirmer sur des benchmarks standardisés ou en conditions réelles.

RecherchePaper
1 source
Planification efficace du mouvement multi-robots avec des faisceaux d'arêtes invariants par translation précalculés
4arXiv cs.RO 

Planification efficace du mouvement multi-robots avec des faisceaux d'arêtes invariants par translation précalculés

Une équipe de chercheurs présente KiTE-Extend (Kinodynamic Translation-Invariant Edge Bundles), un mécanisme de sélection d'actions conçu pour améliorer la planification de mouvement multi-robot (MRMP). Publié sur arXiv (2605.09801) en mai 2026, le système repose sur une bibliothèque de segments de trajectoire calculés hors ligne, qui guident ensuite la sélection d'actions lors de la planification en ligne. L'approche est dite "planner-agnostic" : elle s'intègre aux planificateurs existants sans modifier leur propagation d'état, leur vérification de collision, ni leur évaluation de coût, et sans altérer leurs garanties théoriques. Les expériences couvrent plusieurs systèmes kinodynamiques et environnements variés, et montrent des réductions significatives du temps de planification ainsi qu'une meilleure scalabilité sur les trois paradigmes MRMP les plus utilisés : centralisé, priorisé, et basé sur la résolution de conflits (conflict-based search). L'enjeu est concret pour les intégrateurs de cellules robotisées et les opérateurs de flottes autonomes : coordonner plusieurs robots dans des espaces contraints reste l'un des principaux goulets d'étranglement des déploiements en entrepôt, en usine ou en logistique hospitalière. Les approches d'échantillonnage cinodynamique souffrent classiquement d'une exploration inefficace dans des espaces de configuration denses, où les interactions robot-robot multiplient les contraintes spatio-temporelles. KiTE-Extend attaque ce problème en amont en précalculant des segments réutilisables invariants par translation, ce qui permet à l'algorithme de trouver plus rapidement des segments de mouvement faisables sans surcharge computationnelle en ligne. Le gain est modeste pour un agent seul, mais significatif en configuration multi-agents, là précisément où les planificateurs standards peinent le plus. La planification cinodynamique multi-robot est un problème réputé PSPACE-difficile, et les méthodes par échantillonnage comme RRT ou SST ont longtemps dominé l'état de l'art sans résoudre complètement le passage à l'échelle au-delà de quelques agents. Des travaux comme CBS (Conflict-Based Search) ou ECBS avaient amélioré la gestion des conflits, mais laissaient entière la question de la qualité des primitives d'action sous-jacentes. KiTE-Extend s'insère en amont du planificateur plutôt qu'en remplacement, ce qui le rend compatible avec l'ensemble de l'écosystème existant. Aucun partenaire industriel ni calendrier de déploiement terrain n'est mentionné : il s'agit à ce stade d'une contribution de recherche, sans validation industrielle annoncée.

RecherchePaper
1 source