RecherchearXiv cs.RO6sem

Planification de mouvement multi-robots décentralisée par diffusion informée par simulation

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs présentent SID (Simulation-Informed Diffusion), un cadre décentralisé de planification de mouvement pour flottes multi-robots, publié sur arXiv (2605.27697) en mai 2026. Le problème ciblé est fondamental en robotique mobile collaborative : chaque robot doit générer des trajectoires sans collision à partir de ses seules observations locales, sans capteur global ni communication fiable. L'approche repose sur des modèles de diffusion sensibles aux contraintes (CADM, Constraint-Aware Diffusion Models) : dans une première passe, CADM simule les trajectoires futures des robots voisins à partir de leurs états observés ; dans une seconde passe, le même modèle planifie la trajectoire propre de chaque robot sous contraintes de sécurité issues de ces simulations. Un mécanisme de communication minimaliste complète le dispositif, ne déclenchant la coordination qu'en zones de forte congestion. Les expériences montrent que SID surpasse les méthodes de référence en termes d'efficacité de planification et de respect des contraintes, et passe à l'échelle jusqu'à 108 robots simultanés évoluant parmi 160 obstacles.

La limite adressée est bien documentée dans les systèmes AMR industriels : planificateurs classiques (RVO, ORCA) et approches d'apprentissage raisonnent tous sur un instantané statique de l'environnement, ce qui devient un goulot d'étranglement au-delà d'une vingtaine d'agents en densité élevée. L'apport de SID est de traiter prédiction des voisins et planification propre comme un problème unifié, résolu par le même modèle de diffusion, évitant ainsi la propagation d'erreurs entre modules séparés. La communication conditionnelle représente également un avantage pratique pour les déploiements sur réseaux contraints, un point d'intérêt direct pour les intégrateurs logistiques opérant des flottes AMR à grande échelle.

Les modèles de diffusion appliqués à la robotique connaissent un essor marqué depuis 2024, avec des travaux comme Pi-0 (Physical Intelligence) ou GR00T N2 (NVIDIA) ayant démontré leur efficacité pour la manipulation. SID s'inscrit dans cette tendance mais cible la coordination décentralisée, angle moins couvert que la manipulation. La compétition directe inclut les approches MARL (multi-agent reinforcement learning) et les planificateurs hybrides comme PRIMAL ou DHC. À ce stade, SID reste une preuve de concept en simulation ; aucun déploiement sur hardware physique n'est annoncé. La prochaine étape naturelle serait une validation sur AMR réels en conditions d'entrepôt, qui constituerait le vrai test du sim-to-real gap encore ouvert pour ce type d'approche générative.

Dans nos dossiers

NVIDIA GR00T Physical Intelligence — π0 arXiv cs.RO

À lire aussi

1arXiv cs.RO

Planification du mouvement multi-robots par modèle de diffusion guidé par apprentissage par renforcement multi-agents

Une équipe de chercheurs propose, dans un préprint arXiv (2606.00933) publié début juin 2026, un cadre de planification de trajectoires pour flottes de robots mobiles combinant modèles de diffusion génératifs et apprentissage par renforcement multi-agents (MARL). Concrètement, chaque robot génère indépendamment des trajectoires candidates via un modèle de diffusion entraîné sur des données mono-agent, puis une fonction de valeur centralisée, apprise par MARL, oriente le processus de débruitage par gradient pour réduire les conflits entre agents. Ce mécanisme dit d'"exponential tilting" pousse la distribution de débruitage vers les trajectoires associées au meilleur retour collectif attendu. Évalué en simulation sur un labyrinthe avec quatre robots mobiles, le système réduit le taux d'interférence inter-agents de 55,4 % à 41,8 %, sans nécessiter de ré-entraînement du modèle génératif ni de planification jointe centralisée. Ce résultat attaque directement le compromis historique entre planification centralisée (précise mais peu scalable à mesure que la flotte grossit) et planification décentralisée (scalable mais aveugle aux autres agents). Le fait que la coordination soit injectée via un signal de guidage externe sans modifier le planificateur diffusion de base ouvre la voie à des architectures modulaires : on entraîne une fois le modèle de trajectoire mono-agent, puis on greffe la coordination selon l'environnement de déploiement. Pour les intégrateurs de systèmes multi-robots en entrepôt ou en manufacture, cela suggère qu'un découplage entre planification locale et coordination globale est techniquement praticable, ce qui simplifierait la mise à l'échelle des flottes hétérogènes sans refonte complète du pipeline. Le domaine est depuis longtemps dominé par des méthodes à base de graphes comme CBS (Conflict-Based Search) ou des approches réactives décentralisées comme ORCA, avec des tentatives d'apprentissage profond restées limitées en conditions réelles. L'application des modèles de diffusion à la génération de trajectoires robotiques constitue un courant émergent, illustré notamment par Diffusion Policy (Chi et al., 2023) en manipulation, mais rarement couplé au MARL pour la coordination de flotte. Ce travail reste pour l'instant une preuve de concept en simulation sur quatre robots dans un environnement simple, et la généralisation à des scènes dynamiques, à des flottes plus larges ou à des robots hétérogènes demeure un défi non adressé. Les prochaines étapes naturelles incluent la validation sur hardware réel et la confrontation aux benchmarks de référence du MAPF (Multi-Agent Path Finding).

RecherchePaper

1 source

2arXiv cs.RO

Planification du mouvement multi-robots à partir de la vision et du langage par diffusion inspirée de la chaleur

Des chercheurs ont présenté LHD (Language-conditioned Heat-inspired Diffusion), un framework de planification de mouvement multi-robots publié sur arXiv (réf. 2512.13090v2). Le système génère, en réponse à des commandes en langage naturel, des trajectoires sans collision pour plusieurs robots opérant simultanément dans un espace partagé, sans nécessiter de représentation explicite de l'environnement à l'inférence. LHD combine les priors sémantiques de CLIP, le modèle vision-langage d'OpenAI, avec un noyau de diffusion inspiré de l'équation de la chaleur. Ce noyau agit comme un biais inductif physique : en simulant la propagation thermique depuis les positions cibles, il délimite naturellement l'espace atteignable par chaque robot, guidant la planification à l'intérieur de la zone effectivement accessible. Les évaluations menées sur des environnements simulés inspirés du monde réel et des expériences en conditions physiques réelles montrent des gains en taux de succès et une réduction de la latence de planification par rapport aux planificateurs par diffusion antérieurs. L'enjeu industriel est direct : des systèmes multi-robots capables d'interpréter des instructions verbales sans reconfiguration manuelle représentent un levier clé pour les entrepôts et les lignes de production flexible. Les approches par diffusion existantes souffraient de deux limites bloquantes pour le déploiement réel : un coût computationnel élevé à l'inférence et une dépendance à une cartographie explicite des obstacles. LHD adresse les deux simultanément. Le système gère également les scénarios hors distribution en termes d'accessibilité physique : si une cible est hors de portée, il redirige le robot vers l'alternative accessible la plus proche sémantiquement, exactement le type de robustesse attendu en conditions industrielles. Ces résultats renforcent l'hypothèse que des VLA (Vision-Language-Action) peuvent opérer sans représentation géométrique explicite, sans constituer pour autant une preuve de déploiement à l'échelle commerciale. Ce travail s'inscrit dans une vague de planificateurs neuronaux multi-robots apparue depuis 2023, en concurrence directe avec les approches MAPF (Multi-Agent Path Finding) classiques et les méthodes d'apprentissage par renforcement multi-agent comme QMIX ou MAPPO. L'intégration de CLIP distingue LHD par son conditionnement sémantique flexible, là où la plupart des approches concurrentes raisonnent en coordonnées ou en graphes discrets. Aucun acteur industriel ou institutionnel européen n'est associé à cette publication, dont les affiliations d'équipe ne sont pas précisées dans l'abstract arXiv. Une page projet accompagnée de démos vidéo et de code est accessible à jebeom.github.io/lhdprojectpage/, mais des intégrations avec des flottes AMR commerciales restent à démontrer.

RechercheOpinion

1 source

3arXiv cs.RO

P-ARC : planification parallèle de mouvement multi-robot par exploitation de l'indépendance des sous-problèmes

Une équipe de chercheurs propose sur arXiv (2606.27625) P-ARC, variante parallélisée de l'algorithme ARC (Adaptive Robot Coordination) pour la planification de mouvement multi-robots (MRMP). ARC décompose le problème en trois étapes séquentielles: calcul des solutions individuelles initiales, détection des conflits entre trajectoires, puis résolution de ces conflits. P-ARC parallélise chacune de ces étapes en exploitant l'indépendance structurelle que la décomposition crée entre sous-problèmes, et les auteurs introduisent OR-P-ARC, une variante hybride ajoutant une stratégie multi-départ OR-parallèle. Les benchmarks couvrent des scénarios 2D avec jusqu'à 128 robots mobiles et manipulateurs planaires, ainsi que des équipes de manipulateurs Panda en configurations inspirées de l'industrie. Sur 16 cœurs CPU, le gain de temps de planification approche un facteur 4x par rapport à la version séquentielle d'ARC. Ce résultat intéresse directement les intégrateurs de cellules multi-bras et les opérateurs d'entrepôts automatisés, où la re-planification en temps réel reste un goulot d'étranglement opérationnel. Recalculer des trajectoires sans collision pour une dizaine de manipulateurs en réponse à une perturbation, qu'il s'agisse d'une pièce mal positionnée ou d'un ajout de robot, prend plusieurs secondes avec les approches séquentielles, ce qui bride la cadence de production. Un facteur 4x rendrait la re-planification à la volée plus viable dans des environnements dynamiques. Il convient néanmoins de nuancer: les expériences sont menées dans des scénarios qualifiés d'"inspirés du monde réel" et non sur des déploiements opérationnels réels, et l'écart simulation-terrain reste non quantifié à ce stade. Le MRMP est un problème réputé PSPACE-complet dans sa forme générale, ce qui explique l'intérêt persistant pour les approches de décomposition depuis deux décennies. ARC s'inscrit dans un paysage d'algorithmes incluant CBS (Conflict-Based Search) et ses variantes ECBS et EECBS, utilisées dans des systèmes logistiques commerciaux, ainsi que des solveurs MAPF tels que PBS ou ICTS. La parallélisation de ces algorithmes constitue un axe de recherche actif, avec des travaux récents sur PBS parallèle et des implémentations GPU pour les méthodes de champs de potentiel. P-ARC se distingue en exploitant la structure interne propre à ARC pour paralléliser chaque étape individuellement, plutôt que d'appliquer un parallélisme global à la recherche. Aucun partenariat industriel ni dépôt de code open-source n'est mentionné dans la publication: il s'agit d'une prépublication académique sans calendrier de déploiement annoncé.

RecherchePaper

1 source

4arXiv cs.RO

Accessibilité de Hamilton-Jacobi contrainte par variété pour planification de mouvement multi-agents décentralisée

Des chercheurs en robotique publient une nouvelle version (v2) d'un article arXiv intitulé "Manifold-constrained Hamilton-Jacobi Reachability Learning for Decentralized Multi-Agent Motion Planning" (arXiv:2511.03591), qui propose une méthode pour planifier les mouvements de plusieurs robots de façon sûre et décentralisée tout en respectant des contraintes géométriques imposées par la tâche elle-même. L'exemple donné par les auteurs est celui d'un robot de service qui doit porter une tasse bien droite, sans la renverser, tout en évitant des collisions avec des humains ou d'autres robots présents dans la même zone. Pour résoudre ce problème, l'équipe combine l'apprentissage par accessibilité de Hamilton-Jacobi, une technique mathématique servant à calculer les zones qu'un système peut atteindre en toute sécurité, avec des contraintes dites de variété (manifold), qui formalisent les gestes ou postures que la tâche impose. Ce calcul de sécurité contrainte est ensuite intégré dans un planificateur de trajectoires décentralisé, c'est-à-dire que chaque robot planifie ses propres mouvements sans connaître à l'avance la stratégie des autres agents. Pour l'industrie robotique, l'enjeu dépasse la simple prouesse académique: la plupart des planificateurs multi-agents actuels garantissent soit la sécurité, soit le respect d'une contrainte de tâche, rarement les deux simultanément à haute vitesse et en environnement dynamique. Une méthode capable de tenir les deux à la fois, tout en restant assez rapide pour un usage temps réel, intéresse directement les concepteurs de flottes de robots mobiles autonomes (AMR) en entrepôt, les fabricants de robots de service et les équipes qui développent des bras manipulateurs coopératifs, où un geste manqué ou une collision a un coût opérationnel direct. L'article s'inscrit dans la lignée des travaux récents sur la planification de mouvement multi-agents décentralisée pour systèmes à haute dimension, un domaine qui peine historiquement à intégrer des contraintes de tâche complexes sans hypothèses fortes sur le comportement des autres agents. Les auteurs affirment que leur approche généralise à des tâches variées et passe à l'échelle sur des problèmes de manipulation multi-agents en haute dimension, en dépassant les planificateurs contraints existants sur des bancs d'essai internes, une performance à nuancer puisqu'elle repose sur des comparaisons choisies par l'équipe elle-même. Une démonstration vidéo accompagne la publication.

RecherchePaper

1 source