RecherchearXiv cs.RO 12 juin 2026

Recherche à horizon adaptatif basée sur les conflits pour la planification de chemins multi-agents en boucle fermée

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (arXiv:2602.12024v2) un algorithme nommé ACCBS (Adaptive-Horizon Conflict-Based Search), conçu pour résoudre en temps réel le problème de coordination de flottes de robots dans des entrepôts automatisés. Le Multi-Agent Path Finding (MAPF) consiste à calculer des trajectoires sans collision pour des dizaines à des centaines d'AGV ou AMR opérant simultanément dans un même espace. ACCBS est un planificateur en boucle fermée qui adapte dynamiquement son horizon de planification en fonction du budget computationnel disponible, et réutilise un arbre de contraintes unique pour passer fluidement d'un horizon à l'autre. L'algorithme exhibe un comportement "anytime" : il retourne une solution faisable de bonne qualité très rapidement, puis l'améliore jusqu'à l'optimalité asymptotique si le temps de calcul le permet.

L'enjeu industriel est direct. Les approches actuelles se divisent en deux familles peu satisfaisantes : les planificateurs en boucle ouverte, qui génèrent des trajectoires fixes et s'effondrent dès qu'un robot tombe en panne ou qu'un opérateur traverse une allée, et les heuristiques en boucle fermée, qui réagissent aux perturbations mais sans garantie de performance formelle, ce qui les exclut des déploiements à contraintes de sécurité. ACCBS propose un compromis crédible : la robustesse aux perturbations d'un système réactif combinée aux garanties théoriques d'un solveur optimal. Pour un intégrateur ou un COO logistique, cela signifie potentiellement pouvoir dimensionner une flotte plus serrée sans sacrifier la fiabilité SLA, et certifier le comportement du système face aux auditeurs.

ACCBS s'appuie sur CBS (Conflict-Based Search), un algorithme de référence académique pour le MAPF optimal, et y greffe un mécanisme d'horizon variable inspiré du Model Predictive Control (MPC) et de l'iterative deepening. Ce domaine est activement disputé : Amazon Robotics, Geek+ et Exotec (acteur français, qui déploie des flottes Skypod dans plusieurs dizaines d'entrepôts en Europe et Amérique du Nord) investissent massivement dans la coordination de flottes à grande échelle. La contribution reste à ce stade un résultat de recherche avec études de cas simulées, aucun déploiement réel n'est annoncé, et les auteurs ne précisent pas le nombre d'agents testé ni les temps de cycle obtenus, ce qui limite l'évaluation de la maturité industrielle.

Impact France/UE

Exotec, acteur français leader des flottes Skypod déployées dans des dizaines d'entrepôts en Europe, opère précisément dans le domaine adressé par ACCBS ; si l'algorithme atteint la maturité industrielle, il pourrait renforcer la compétitivité des solutions européennes de coordination de flottes AMR face aux acteurs américains et asiatiques.

Dans nos dossiers

Exotec arXiv cs.RO

À lire aussi

1arXiv cs.RO

Recherche paresseuse basée sur les conflits pour une planification rapide multi-manipulateurs

Une équipe de chercheurs propose un nouvel algorithme baptisé Conflict-Based Lazy Search (CBLS), conçu pour planifier en temps réel les mouvements simultanés de plusieurs bras manipulateurs robotiques dans un espace de travail encombré. L'algorithme s'appuie sur Conflict-Based Search (CBS), une méthode de pathfinding multiagent qui a déjà démontré des gains de vitesse d'un ordre de grandeur par rapport aux approches précédentes. CBS fonctionne en résolvant une série de problèmes de recherche de chemin pour un seul agent à la fois, ce qui signifie que sa performance globale dépend directement de l'efficacité de cet algorithme de base. Les auteurs y ajoutent deux innovations: un graphe précalculé à évaluation paresseuse et sparsité contrôlée pour un manipulateur unique, et un nouvel algorithme de recherche appelé Lazy Edge-based A (LEA), qui réduit le nombre d'évaluations d'arêtes, considéré comme le principal goulot d'étranglement computationnel dans la planification de bras robotiques. Cette avancée cible un problème très concret pour l'industrie: dans une cellule robotique où plusieurs bras manipulateurs opèrent côte à côte, chaque calcul de trajectoire doit vérifier les collisions potentielles entre pièces mobiles, ce qui devient rapidement coûteux en temps de calcul à mesure que le nombre de bras augmente. En réduisant drastiquement ces évaluations grâce à la recherche paresseuse, CBLS ouvre la voie à une planification plus rapide et davantage exploitable en temps réel, un enjeu direct pour les intégrateurs qui déploient des cellules multi-bras dans des usines ou des entrepôts, où la vitesse de replanification conditionne le débit de production. Le travail s'inscrit dans la lignée du MAPF (multiagent pathfinding), un champ de recherche né notamment des besoins de coordination en entrepôt et en logistique autonome, que les auteurs transposent ici aux manipulateurs industriels. Les chercheurs comparent directement CBLS à l'algorithme CBS original ainsi qu'à RRT-Connect, une méthode de planification par échantillonnage largement utilisée en robotique, et affirment obtenir des performances supérieures sur des problèmes de planification multi-manipulateurs. L'article, encore au stade de prépublication arXiv, ne précise pas de tests sur du matériel réel ni de partenariat industriel, ce qui en fait pour l'instant une contribution algorithmique plutôt qu'une solution déployée en production.

RecherchePaper

1 source

2arXiv cs.RO

LAMP : planification adaptative de manipulation à long horizon pour la collaboration multi-robots en espace encombré

Une équipe de chercheurs a publié sur arXiv (référence 2606.29358v1) un nouveau cadre de planification intitulé LAMP, pour Long-horizon Adaptive Manipulation Planning, conçu pour coordonner plusieurs robots manipulateurs dans des environnements très encombrés. Le système repose sur deux planificateurs complémentaires : LAMPA*, qui effectue une recherche systématique dans l'espace couplé objets-robots, et LAMP-Lazy, un planificateur dit "paresseux" qui diffère certaines évaluations pour permettre une replanification en temps réel. Les expériences ont été menées dans des environnements simulés à haute densité d'obstacles, où les méthodes existantes échouent à trouver des solutions. Aucun déploiement physique ni timeline de commercialisation n'est annoncé. Le verrou technique que LAMP cherche à lever est fondamental pour l'industrie : coordonner plusieurs bras robotiques sur des tâches longues dans des espaces confinés implique de raisonner simultanément sur les contacts physiques, les dynamiques couplées entre robots, et l'évitement de collision. Les deux approches dominantes aujourd'hui se heurtent à des murs de scalabilité distincts. L'apprentissage par renforcement end-to-end peine à généraliser dès que l'horizon de tâche s'allonge ou que le nombre de robots augmente. Les méthodes hybrides, qui planifient les trajectoires d'objets et apprennent des primitives de contact à courte portée, ne tiennent pas dans des scènes très denses. LAMP propose de rendre ce problème tractable via un modèle génératif appris, combiné à une stratégie de recherche adaptative, ce qui constitue une approche architecturalement différente des VLA (Vision-Language-Action models) qui dominent l'espace humanoïde. La planification multi-robot en environnement encombré est un problème central pour l'automatisation logistique et industrielle, où des acteurs comme Exotec (France) déploient des flottes de robots AMR dans des entrepôts à haute densité. La recherche en robotique académique a longtemps traité la manipulation et la coordination de flotte séparément ; des travaux comme LAMP signalent une convergence vers des systèmes unifiés capables de gérer les deux dimensions. Cependant, l'absence totale de validation sur hardware réel est une limite importante : le sim-to-real gap reste le principal obstacle entre des résultats de simulation convaincants et une industrialisation effective. Les prochaines étapes naturelles seraient des tests sur bancs physiques multi-bras, dans des configurations représentatives de cellules de picking ou d'assemblage.

RecherchePaper

1 source

3arXiv cs.RO

Robots mobiles et planification de mouvement multi-robots dans le temps et l'espace basée sur la recherche sur des graphes d'ensembles convexes espace-temps

Des chercheurs publient sur arXiv (2607.00444, prétirage non encore relu par les pairs) un nouveau cadre algorithmique pour la planification de trajectoires spatio-temporelles, baptisé ST-GCS pour "graphs of space-time convex sets". L'idée centrale est de représenter les régions sans collision, qui évoluent dans le temps, comme des ensembles convexes dans un espace incluant le temps, et de transformer la recherche de trajectoire optimale en un problème de recherche de graphe. Les auteurs développent un solveur best-first qui évalue des chemins partiels via optimisation continue de trajectoire, guidé par des heuristiques admissibles et des tests de dominance. Ils ajoutent un schéma de décomposition convexe exacte (ECD) pour réserver les occupations de trajectoire dans l'espace-temps, ce qui permet de traiter de façon unifiée les obstacles dynamiques et les interactions entre robots. Pour le multi-robot, la méthode s'appuie sur une planification priorisée combinée à un mécanisme de coordination par fenêtres glissantes. Les expériences annoncées montrent des accélérations substantielles par rapport à divers planificateurs existants, avec une qualité de solution maintenue, notamment dans des environnements aux passages étroits et transitoires. Une démonstration à grande échelle affiche des instances jusqu'à 100 robots résolues en quelques minutes. Pour l'industrie de la logistique et des flottes de robots mobiles autonomes (AMR), ce type d'approche cible un problème très concret: coordonner un grand nombre de robots dans des entrepôts ou usines où l'espace libre change constamment au passage d'autres machines, de portes ou de zones de chargement. Les méthodes actuelles de planification multi-robot peinent souvent à passer à l'échelle sans sacrifier soit le temps de calcul, soit l'optimalité des trajectoires. Un gain de vitesse démontré sur 100 robots en quelques minutes, si confirmé en conditions réelles au-delà du banc d'essai académique, intéresserait directement les intégrateurs de flottes AMR type Exotec ou les opérateurs d'entrepôts automatisés, où la densité de robots et les couloirs étroits sont justement le goulot d'étranglement actuel. Ce travail s'inscrit dans la lignée des "graphs of convex sets" (GCS), une famille de méthodes de planification de mouvement en robotique qui gagne en popularité pour unifier optimisation continue et recherche discrète, en concurrence avec les approches classiques par échantillonnage (RRT, PRM) ou par programmation en nombres entiers mixtes pour la coordination multi-robot. L'étendre à la dimension spatio-temporelle, avec obstacles mobiles et fenêtres de coordination, est présenté comme la contribution principale. Le code et les détails sont disponibles sur la page du projet; à ce stade, il s'agit d'un résultat de recherche, sans annonce de déploiement industriel ni de partenaire commercial identifié.

UELes intégrateurs de flottes AMR européens comme Exotec pourraient s'intéresser à cette méthode pour la coordination de robots en entrepôt, mais aucun déploiement ou partenariat n'est confirmé à ce stade.

RecherchePaper

1 source

4arXiv cs.RO

Placement adaptatif des tâches selon la QoS en périphérie : un contrôle en boucle fermée pour les systèmes multi-robots

Des chercheurs ont publié le 2 juin 2026 un preprint arXiv (identifiant 2606.00552) décrivant un contrôleur de placement adaptatif de tâches, baptisé ATP (Adaptive Task Placement), conçu pour les systèmes multi-robots (MRS). Le banc d'essai repose sur des nœuds Raspberry Pi interconnectés et évalue un pipeline caméra-vers-manipulateur dans trois configurations : exécution locale sur le robot, délestage statique vers un nœud edge partagé, et placement adaptatif piloté par ATP. Le contrôleur ATP calcule, sur des fenêtres de contrôle de deux secondes, un score de coût multi-métriques combinant latence normalisée, utilisation CPU et coût de commutation, puis sélectionne le nœud d'exécution optimal en boucle fermée. Le banc est instrumenté avec une synchronisation d'horloge sub-milliseconde et une émulation réseau afin de reproduire fidèlement la gigue et les contentions de ressources réelles. Les résultats expérimentaux sous contraintes de stress computationnel et de fautes réseau montrent que le délestage statique vers le edge réduit bien la charge CPU embarquée, mais amplifie la latence de queue et le nombre de dépassements d'échéance, un point critique pour les applications de commande en temps réel comme l'asservissement visuel. En revanche, ATP réduit de manière consistante ces deux indicateurs en arbitrant dynamiquement le placement selon des seuils mesurés. Pour un intégrateur ou un architecte de système cyber-physique industriel, ce résultat valide un principe qui était souvent posé en hypothèse : l'orchestration statique des charges de travail edge est insuffisante dès que le réseau ou la ressource partagée connaissent une variabilité, et une boucle de rétroaction fermée est nécessaire pour tenir des SLA temps-réel. Ce travail s'inscrit dans le domaine émergent du Cloud-Edge Robotics, où AWS RoboMaker, Azure IoT Edge et des initiatives open-source comme ROS 2 with DDS cherchent à standardiser la décomposition des pipelines de perception. L'architecture proposée reste à l'état de preprint académique sur matériel Raspberry Pi, pas encore un produit industriel validé à l'échelle, mais pose des lignes directrices de conception concrètes pour des déploiements fog/edge en robotique collaborative et en systèmes multi-robots industriels. Les prochaines étapes logiques incluraient une validation sur hardware embarqué plus représentatif (NVIDIA Jetson, x86 edge servers) et une intégration avec des frameworks d'orchestration comme Kubernetes ou ROS 2 Managed Nodes.

RecherchePaper

1 source