RecherchearXiv cs.RO 5 juin 2026

Livraison et collecte dynamiques multi-agents dans les systèmes d'entrepôt robotisé cellulaire

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de chercheurs publie sur arXiv (réf. 2606.05669, juin 2026) la première formalisation du problème de collecte et livraison multi-agents (MAPD) intégrant l'évolution dynamique des commandes dans les entrepôts robotisés à cellules (RCWS). Le constat de départ est un angle mort opérationnel connu: les algorithmes MAPD classiques supposent des tâches figées, alors que dans la réalité industrielle, de nouvelles références (SKU) s'ajoutent à une commande pendant son exécution. Pour y répondre, les auteurs proposent deux algorithmes de replanification en ligne déclenchés par événements, construits sur le paradigme du token passing. Le premier, Dynamic Token Passing (DTP), effectue une replanification localisée à chaque mise à jour via une décomposition add-order et un ordonnancement prioritaire des accès, tout en garantissant l'absence de collisions entre robots. Le second, Cooperative Token Passing (CTP), mobilise en plus les robots inactifs pour absorber opportunément les nouveaux pickups ajoutés en cours d'exécution. Des simulations en environnement RCWS montrent une réduction significative du flowtime de commandes par rapport aux baselines statiques et non coopératives, sans que les auteurs ne publient de chiffres précis à ce stade.

L'enjeu pour les intégrateurs d'entrepôts automatisés est direct: toute modification de commande en cours force aujourd'hui soit une replanification globale coûteuse en temps de calcul, soit une dégradation de la qualité de service. Ce travail comble pour la première fois l'écart entre la littérature académique sur le MAPD et les contraintes opérationnelles réelles des ERP industriels. Le mécanisme coopératif du CTP est particulièrement notable: il exploite la capacité oisive des flottes denses plutôt que de relancer un planning complet, remettant en question l'hypothèse selon laquelle la planification statique par vagues suffit aux RCWS commerciaux actuels.

Le token passing est un paradigme bien établi dans la recherche en planification multi-agents (MAPF), notamment autour des travaux de Sven Koenig. Son application aux RCWS cible des architectures déployées par AutoStore (Norvège), Ocado Technology et Hai Robotics, ainsi que par l'acteur français Exotec (Villeneuve-d'Ascq) avec son système Skypod, dont les configurations à grille dense concentrent des centaines de robots sur un volume compact. Ces environnements sont précisément ceux où la coordination dynamique devient critique à mesure que les densités de flotte augmentent. Ce travail reste à ce stade une contribution académique sans déploiement ni partenariat industriel annoncé; la prochaine étape logique serait une validation sur environnement physique et une intégration avec des WMS industriels existants.

Impact France/UE

Exotec (Villeneuve-d'Ascq), dont le système Skypod est explicitement cité comme architecture cible, pourrait bénéficier de ces algorithmes si intégrés dans un WMS industriel, renforçant sa compétitivité face à AutoStore et Ocado dans les entrepôts à haute densité de flotte.

Dans nos dossiers

Exotec arXiv cs.RO

À lire aussi

1arXiv cs.RO

Couverture ergodique dans les systèmes multi-robots via la diffusion anisotrope

Une équipe de chercheurs a soumis sur arXiv (référence 2605.24125, mai 2026) un nouveau cadre mathématique pour la couverture ergodique dans les systèmes multi-robots, basé sur la diffusion anisotrope de Perona-Malik. La couverture ergodique désigne la capacité d'une flotte de robots à explorer un espace de manière proportionnelle à une distribution de probabilité cible : plus une zone est jugée prioritaire, plus les robots y concentrent leur trajectoire. L'innovation proposée combine champ de potentiel et recherche ergodique en utilisant le gradient de la solution de l'équation de Perona-Malik pour diriger le mouvement des agents. Les résultats sont validés uniquement par simulation, dans plusieurs scénarios distincts, sans déploiement réel rapporté. La méthode de référence jusqu'ici reposait sur la diffusion isotrope via l'équation de la chaleur, qui propage l'erreur entre trajectoire réelle et distribution cible de façon uniforme dans toutes les directions, sans tenir compte des variations locales de la carte de densité. Cette uniformité devient sous-optimale lorsque la distribution présente des gradients forts ou des zones très contrastées, situation fréquente en inspection industrielle, surveillance périmétrique ou recherche et sauvetage en milieu hétérogène. La diffusion anisotrope proposée adapte la propagation selon la structure locale de la distribution, permettant aux robots de réagir plus finement aux discontinuités de la carte de priorité. Le cadre présenté englobe l'équation de la chaleur comme cas particulier, garantissant la rétrocompatibilité avec les algorithmes existants et facilitant une migration incrémentale. La couverture ergodique multi-robots fait l'objet de recherches actives depuis une quinzaine d'années, avec des travaux fondateurs portés notamment par le laboratoire de Todd Murphey à Northwestern University. L'approche par équation de la chaleur avait été proposée récemment comme alternative aux métriques spectrales classiques basées sur la décomposition de Fourier, elles-mêmes coûteuses en calcul pour de grands espaces. La diffusion de Perona-Malik, empruntée au traitement d'image où elle est utilisée depuis 1990 pour préserver les contours tout en lissant le bruit, est ici réinterprétée pour générer des champs de potentiel directionnels en robotique. Ce travail reste purement théorique et simulé : aucun test sur plateforme physique, aucun partenaire industriel et aucun financement institutionnel ne sont mentionnés, ce qui laisse entière la question du passage sim-to-real, particulièrement délicate pour les flottes multi-robots en environnement dynamique réel.

RecherchePaper

1 source

2arXiv cs.RO

Coordination par relais pour la collecte et livraison multi-robots économe en énergie

Une équipe de chercheurs a publié sur arXiv (identifiant 2509.14127, version 2, septembre 2025) un cadre de planification baptisé VCST-RCP (Voronoi-Constrained Steiner Tree Relay Coordination Planning), conçu pour coordonner des flottes homogènes de robots mobiles dans des missions de livraison multi-colis depuis un dépôt unique vers des destinations dispersées. L'algorithme opère en deux phases: la construction d'un réseau de relais sparse combinant des interfaces d'échange dérivées de diagrammes de Voronoï à une optimisation par arbre de Steiner, puis la génération des plannings de collecte, relais et livraison sous contraintes de capacité de charge et de temps de service. Sur des expériences menées à plusieurs échelles, VCST-RCP réduit la distance totale parcourue par la flotte de 31% en moyenne, avec des pics proches de 50%, par rapport à l'algorithme d'affectation Hungarian assignment, et surpasse significativement OR-Tools CVRP, le solveur de référence de Google. La significativité statistique est établie à p inférieur à 10^-3, et le gain d'efficacité de livraison, mesuré en colis par kilomètre parcouru, dépasse 50%. Ces résultats intéressent directement les opérateurs de flottes AMR (robots mobiles autonomes) en intralogistique et en livraison de dernier kilomètre, où la distance parcourue est directement corrélée au coût énergétique et à l'usure matérielle. L'étude d'ablation incluse dans les travaux est particulièrement instructive: elle démontre que l'optimisation du placement des points de relais génère des gains substantiellement supérieurs à ceux obtenus par simple repartitionnement spatial, établissant le design des relais comme levier dominant de la performance système. Cela remet en question l'hypothèse implicite répandue chez les intégrateurs, selon laquelle le transport direct source-destination constitue la référence optimale par défaut. La scalabilité démontrée à différentes tailles de flotte est un argument supplémentaire pour une adoption industrielle. Le problème MRPD (Multi-Robot Pickup and Delivery) est un classique de l'optimisation combinatoire en robotique, mais les architectures relay-based à grande échelle restent peu explorées. Hungarian assignment et OR-Tools CVRP, les deux références battues dans cette étude, sont précisément les solveurs utilisés par les éditeurs de WMS et les intégrateurs de flottes dans des environnements comme ceux d'Exotec (Roubaix), 6 River Systems ou Locus Robotics. Ce travail reste cependant un preprint arXiv, sans validation sur plateforme réelle annoncée: les gains en simulation sont solides, mais la transition sim-to-real, notamment face à la congestion dynamique et aux pannes robot en cours de mission, reste à prouver. Les extensions naturelles incluent des flottes hétérogènes et des dépôts multiples.

UEL'algorithme VCST-RCP, s'il est validé en environnement réel, pourrait réduire de ~30% les coûts énergétiques des flottes AMR d'acteurs européens comme Exotec (Roubaix) qui utilisent actuellement Hungarian assignment ou OR-Tools CVRP comme solveurs de référence.

RecherchePaper

1 source

3arXiv cs.RO

Distiller les dynamiques collaboratives dans un espace latent pour une coordination implicite en manipulation multi-agents décentralisée

Un article mis à jour sur arXiv (version 2, référence 2606.22982) présente CLS-DP, un cadre décentralisé pour la manipulation multi-bras par des agents robotiques. Le système répond à un problème concret : les approches centralisées de coordination multi-agents passent mal à l'échelle quand le nombre de bras augmente, car elles exigent une vue globale partagée et des échanges d'état constants. CLS-DP suit le paradigme CTDE (entraînement centralisé, exécution décentralisée) : pendant l'entraînement, il distille dans un espace latent les dynamiques privilégiées de coordination multi-agents ; au déploiement, chaque bras infère ce "latent collaboratif" à partir de sa seule observation RGB locale et d'une instruction de tâche partagée, puis conditionne dessus son processus de débruitage par diffusion, sans communication inter-agents ni état global explicite. Sur six tâches du benchmark RoboFactory impliquant de deux à quatre agents, CLS-DP atteint un taux de réussite moyen de 38%, contre 20% pour la meilleure référence centralisée testée et seulement 9% pour une version décentralisée privée du latent collaboratif. Ce résultat contredit une hypothèse répandue en robotique multi-bras : qu'une coordination fine nécessite forcément une communication explicite ou une vue centralisée de la scène. En montrant qu'un latent appris peut encoder implicitement les dynamiques collaboratives à partir d'une simple image locale, CLS-DP ouvre la voie à des cellules multi-robots qui passent à l'échelle sans coût de communication croissant, un enjeu direct pour les intégrateurs qui déploient des postes de manipulation coopérative en usine. Les cartes d'attribution des auteurs montrent que chaque agent, conditionné sur ce latent, porte une attention élevée non seulement sur ses propres articulations et sa pince, mais aussi sur celles de ses coéquipiers pendant toute l'exécution, preuve que l'information de coordination circule réellement dans la représentation apprise. Pour qui évalue des architectures VLA (vision-language-action) en environnement multi-agent, le travail suggère qu'on peut réduire le coût de calcul par agent tout en égalant, voire en dépassant, des références centralisées plus lourdes. Ce travail s'inscrit dans la lignée des politiques de manipulation par diffusion, devenues une alternative courante au clonage comportemental classique, et s'appuie sur RoboFactory comme benchmark commun pour l'évaluation multi-agents. Le choix du paradigme CTDE rapproche aussi cette recherche des méthodes d'apprentissage par renforcement multi-agents, où entraînement centralisé et exécution décentralisée sont devenus un standard pour équilibrer performance et scalabilité. L'article ne mentionne aucun déploiement industriel ni partenariat avec un fabricant de bras robotiques : il s'agit pour l'instant d'un résultat validé en simulation, sans calendrier annoncé de transfert vers du matériel réel. L'étape logique suivante serait une validation sim-to-réel sur des cellules physiques à deux ou trois bras, véritable épreuve pour une méthode qui promet de faire tenir la coordination fine dans une seule caméra RGB par agent.

RecherchePaper

1 source

4arXiv cs.RO

Quand les systèmes multi-robots rencontrent l'IA à base d'agents : vers une intelligence collective incarnée

Un article de recherche publié fin juin 2026 sur arXiv (réf. 2606.27929) propose un cadre conceptuel baptisé "Intelligence Collective Incarnée" (ECI, Embodied Collective Intelligence), qui fusionne deux trajectoires parallèles de la robotique : l'essor des agents IA en boucle fermée et la coordination de flottes multi-robots. Les auteurs décrivent comment les robots migrent de pipelines perception-contrôle rigides vers des systèmes agentiques capables de récupérer du contexte, délibérer pendant l'exécution et affiner leur comportement futur. L'ECI structure cette convergence en trois piliers : Co-Perception (partage du modèle du monde), Co-Action (coordination distribuée des tâches) et Co-Évolution (transmission de compétences entre agents). Pour ancrer le concept, une étude de navigation illustre qu'un robot nouvellement intégré à une équipe bénéficie de la mémoire fusionnée de ses coéquipiers avec des gains mesurables, bien que les auteurs précisent eux-mêmes que cette étude ne constitue pas une évaluation complète du framework. L'enjeu central est de dépasser le modèle actuel de coopération multi-robots, limité au partage de cartes, d'affectations de tâches et de datasets d'entraînement. L'ECI propose de partager l'état produit par la boucle agentique elle-même : contexte mondial, progression des tâches, compétences accumulées en opération. Pour un intégrateur ou un décideur B2B, cela ouvre la voie à des flottes où les robots apprennent collectivement en temps réel, un saut qualitatif par rapport aux AMR actuels qui n'échangent que des données structurées. La thèse sous-jacente est qu'une mémoire partagée réduit le temps d'intégration d'un nouvel agent et améliore la robustesse de la flotte face aux pannes, s'attaquant directement au "demo-to-reality gap" qui pénalise les VLA déployés à l'échelle industrielle. Ce travail s'inscrit dans une période d'accélération marquée : les modèles VLA comme pi0 de Physical Intelligence ou GR00T N2 de NVIDIA ont démontré en 2024-2025 que l'IA agentique peut généraliser sur du hardware physique réel, tandis que les systèmes multi-robots butent encore sur la coopération hétérogène à grande échelle. Les travaux proches incluent les frameworks multi-agents LLM comme AutoGen ou CrewAI, ainsi que les recherches en robotique collaborative conduites à ETH Zurich et au MIT CSAIL. L'article demeure à ce stade un cadre théorique avec validation partielle et sans déploiement industriel annoncé, mais il pose les fondations conceptuelles d'une génération de flottes capables de capitaliser collectivement sur l'expérience terrain accumulée.

RecherchePaper

1 source