Aller au contenu principal
Livraison multi-agents avec correspondances multiples
IndustrielarXiv cs.RO6sem

Livraison multi-agents avec correspondances multiples

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2605.07835) un algorithme baptisé M2M (Many-to-Many Multi-Agent Pickup and Delivery) pour optimiser la coordination de flottes de robots dans des entrepôts automatisés. La majorité des travaux antérieurs sur le problème MAPD (Multi-Agent Pickup and Delivery) supposent qu'une tâche a un unique point de collecte et un unique point de dépôt, le paradigme dit "one-to-one". M2M s'attaque à la variante "many-to-many" : dans un entrepôt réel, un article identifié par son SKU (Stock Keeping Unit) peut être prélevé ou stocké à plusieurs emplacements, ce qui génère un problème d'affectation à quatre dimensions classé NP-difficile. L'équipe propose deux variantes : M2M, qui minimise la durée estimée de chaque tâche, et M2M-wSKU, qui intègre en plus la distribution physique des SKUs dans la fonction objectif. En simulation sur des opérations de 8 heures, M2M complète jusqu'à 22 000 tâches supplémentaires en moyenne par rapport aux meilleures méthodes existantes, selon les configurations d'environnement et la densité d'inventaire.

Le gain de 22 000 tâches sur une journée simulée de 8 heures représente un saut de throughput significatif pour un entrepôt à forte rotation. Pour un intégrateur ou un COO industriel, cela se traduit directement en capacité de traitement d'ordres supplémentaires sans augmenter le parc de robots. L'enjeu théorique est tout aussi notable : la transition du paradigme one-to-one vers many-to-many reflète fidèlement la réalité des entrepôts modernes, où la redondance d'emplacements est un mécanisme délibéré de résilience logistique. Une limite mérite d'être soulignée : les simulations sur 8 heures ne capturent pas les pannes matérielles, la variabilité des temps de manipulation, ni les interactions humaines en zones mixtes. Sur le plan académique toutefois, M2M établit une nouvelle référence sur ce sous-problème MAPD jusqu'ici peu traité.

Le MAPD est un champ de recherche actif depuis une quinzaine d'années, porté par l'essor des entrepôts automatisés et des systèmes AMR (Autonomous Mobile Robots). Les algorithmes classiques ciblaient des scénarios one-to-one correspondant aux premières architectures d'entrepôts, mais les systèmes industriels modernes opèrent quasi universellement en many-to-many. L'entreprise française Exotec, avec son système Skypod déployé chez plus de 400 clients dans 15 pays, incarne précisément cette réalité multi-emplacements, aux côtés d'acteurs comme Amazon Robotics, Geek+ ou AutoStore. La publication de M2M sur arXiv ouvre la voie à son intégration dans des frameworks open-source de planification multi-robots. Les prochaines étapes attendues incluent une validation sur environnements physiques et la prise en compte de contraintes temporelles réelles, telles que les fenêtres de livraison ou les priorités dynamiques de commande.

Impact France/UE

L'algorithme M2M pourrait être directement intégré dans des systèmes comme le Skypod d'Exotec, permettant d'augmenter le débit des entrepôts automatisés européens sans extension du parc de robots.

À lire aussi

Des quadrillages aux entrepôts : adapter la planification multi-agents légère en un coup pour les robots à guidage automatique
1arXiv cs.RO 

Des quadrillages aux entrepôts : adapter la planification multi-agents légère en un coup pour les robots à guidage automatique

Une équipe de chercheurs a publié le 21 mai 2026 (arXiv:2605.15799) un nouveau cadre algorithmique baptisé MAWPF (Multi-Agent Warehouse Pathfinding), conçu pour adapter les méthodes classiques de planification multi-agents (MAPF) aux véhicules guidés automatisés (AGV) à transmission différentielle réellement déployés en entrepôt. Contrairement aux formulations MAPF standards qui supposent une grille 2D à quatre connexions avec des déplacements unitaires, MAWPF intègre quatre contraintes physiques réalistes : les agents ne peuvent effectuer que des mouvements rectilignes ou des rotations sur place, les rotations ont un coût multi-étapes (non unitaire), les phases d'accélération et de décélération sont modélisées explicitement, et les collisions par l'arrière entre robots suiveurs sont interdites. Les auteurs ont adapté et comparé quatre algorithmes sous-optimaux représentatifs issus de la littérature MAPF : PP (Prioritized Planning), LNS2 (Large Neighborhood Search 2), PIBT (Priority Inheritance with Backtracking) et LaCAM. Les benchmarks montrent que PP et LNS2 peinent à résoudre des instances à grand nombre d'agents, tandis que les approches basées sur PIBT offrent une meilleure scalabilité, au prix d'un coût de solution plus élevé. Ce travail comble un écart concret entre la recherche en planification combinatoire et les contraintes opérationnelles des entrepôts automatisés, où les AGV à transmission différentielle dominent le marché (flottes Locus Robotics, 6 River Systems, Exotec Skypod). Le fait que les rotations et la cinématique soient désormais intégrées dans le modèle de collision élimine une source fréquente d'échec au déploiement, le "sim-to-real gap" cinématique, sans abandonner la tractabilité de la recherche combinatoire discrète. Pour un intégrateur ou un COO, cela signifie que les algorithmes de planification peuvent être qualifiés sur des métriques proches du comportement réel des véhicules, réduisant les ajustements coûteux en production. Le MAPF classique, formalisé depuis les années 2010 avec des algorithmes comme CBS (Conflict-Based Search) et ses variantes, a longtemps été critiqué pour son manque de réalisme physique. Des travaux récents comme MAPF avec agents de taille variable ou avec contraintes temporelles ont ouvert cette direction, mais la cinématique différentielle restait peu traitée. Sur le plan concurrentiel, Amazon Robotics et Waymo Via investissent dans des approches d'optimisation de flotte propriétaires, tandis que des startups comme Exotec (France) ou Autostore misent sur des architectures matérielles contraintes qui simplifient le problème de planification. La prochaine étape naturelle serait l'extension à la planification lifecycle (avec objectifs de livraison dynamiques) et des tests sur des entrepôts physiques instrumentés, non encore annoncés par les auteurs.

UELes intégrateurs de flottes AGV en Europe, et notamment Exotec (France, Skypod), peuvent s'appuyer sur ce cadre MAWPF pour qualifier leurs planificateurs sur des métriques cinématiques réalistes, réduisant les coûteux ajustements de production liés au sim-to-real gap différentiel.

IndustrielPaper
1 source
Robot Talk épisode 158 : livraisons autonomes par robot, avec Ahti Heinla
2Robohub 

Robot Talk épisode 158 : livraisons autonomes par robot, avec Ahti Heinla

Starship Technologies a franchi le cap des 10 millions de livraisons autonomes réalisées par une flotte de plus de 2 700 robots terrestres déployés sur voies publiques et trottoirs. Ces engins à six roues, pilotés par des algorithmes d'IA embarquée, opèrent sans intervention humaine dans des environnements urbains réels, par toutes conditions météorologiques et en présence de piétons. La société, cofondée par Ahti Heinla, l'un des ingénieurs originaux derrière Skype, s'est imposée comme le principal acteur mondial du segment livraison autonome de dernier kilomètre. Ce volume de 10 millions de livraisons constitue un signal concret de résolution partielle du fossé démo-réalité qui plombe depuis des années les promesses de la robotique de service. Pour un décideur B2B ou un intégrateur logistique, c'est la preuve qu'un déploiement à l'échelle est techniquement viable sans superviseur dédié par robot, ce qui change fondamentalement l'économie unitaire du service. Le modèle Starship challenge directement les hypothèses des acteurs de la livraison par drone ou par véhicule autonome de taille véhicule, en privilégiant un format compact, peu coûteux et opérant exclusivement en zone piétonne. Heinla, après avoir construit Skype en tant qu'ingénieur fondateur jusqu'à son rachat par Microsoft pour 8,5 milliards de dollars en 2011, a pivoté vers la robotique grand public il y a une décennie. Starship affronte une concurrence structurée : Nuro aux États-Unis sur le segment véhicule, Kiwibot sur les campus universitaires, et Amazon Scout aujourd'hui suspendu. Le podcast Robot Talk Episode 158 diffuse l'échange complet avec Heinla, mais l'épisode ne dévoile pas de nouvelle annonce produit ou de timeline d'expansion géographique précise.

UEStarship Technologies, co-fondée par des Estoniens et déjà déployée sur des trottoirs européens, franchit un seuil de 10 millions de livraisons qui valide l'économie unitaire du robot livreur autonome, un signal concret pour les intégrateurs logistiques et collectivités EU en phase d'évaluation de pilotes.

IndustrielActu
1 source
Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention
3arXiv cs.RO 

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention

Des chercheurs ont publié en mai 2026 sur arXiv (référence 2605.08758) un framework de décision séquentielle baptisé OLSF-TRS, pour Omni-scale Learning-based Sequential Decision Framework for Tote-handling Robotic Systems. Ce système combine optimisation combinatoire structurée et apprentissage par renforcement multi-agent (MARL) pour coordonner simultanément les décisions liées aux commandes, aux bacs de manutention (totes) et aux robots dans les centres de préparation automatisés. En configuration petite échelle, OLSF-TRS affiche un écart d'optimalité moyen inférieur à 3,5% sur deux architectures système distinctes. En configuration grande échelle, il réduit les mouvements de bacs de 8 à 12% par rapport aux baselines heuristiques classiques, et de plus de 30% par rapport aux approches règle-based de l'état de l'art, tout en maintenant une réactivité en temps réel. L'enjeu concret pour les intégrateurs intralogistiques est significatif : la quasi-totalité des frameworks existants sont conçus sur mesure pour un type de système spécifique, tri-sorter, mini-load AS/RS ou AMR grid-based, ce qui rend tout transfert à un autre contexte laborieux. OLSF-TRS propose une couche de pilotage unifiée et scalable, potentiellement applicable à des architectures hétérogènes. La réduction de plus de 30% des mouvements de bacs se traduit directement en gains énergétiques, réduction de l'usure mécanique et meilleure stabilité du throughput, des KPIs centraux pour les COOs industriels. À noter cependant que les résultats reposent sur des simulations et benchmarks comparatifs sans déploiement terrain documenté, ce qui laisse entière la question du sim-to-real gap en production réelle. Ce travail s'inscrit dans une tendance structurelle de fond : la substitution des palettes par les bacs comme unité logistique primaire, portée par l'explosion du e-commerce et la fragmentation des commandes en petites séries. Des acteurs comme Exotec (France, système Skypod), AutoStore (Norvège) ou Geek+ (Chine) opèrent des déploiements massifs en grid-based robotics confrontés exactement à ces problèmes de coordination ordres-bacs-robots à grande échelle. La convergence entre optimisation combinatoire de type VRP et MARL est un champ de recherche en pleine effervescence, porté par des laboratoires industriels en Europe et en Asie. L'article ne mentionne ni partenariat industriel ni timeline de commercialisation, le positionnant comme une contribution académique précompétitive.

UEExotec (France, Skypod) et AutoStore (Norvège) opèrent des déploiements massifs confrontés exactement aux problèmes de coordination ordres-bacs-robots adressés par ce framework, en faisant une piste de R&D directement pertinente pour l'intralogistique européenne.

IndustrielPaper
1 source
Serve Robotics s'étend au-delà de la livraison alimentaire avec un service de blanchisserie autonome
4Robotics & Automation News 

Serve Robotics s'étend au-delà de la livraison alimentaire avec un service de blanchisserie autonome

Serve Robotics, la startup californienne spécialisée dans la livraison autonome par robot-trottoir, annonce un partenariat commercial avec NoScrubs, service de laverie à la demande en croissance rapide. Le pilote, lancé cette semaine dans plusieurs quartiers de Los Angeles, mobilise la flotte existante de robots autonomes de Serve pour livrer les commandes de linge directement à la porte des clients. Il s'agit du premier contrat de livraison urbaine de l'entreprise en dehors de la restauration préparée. L'article source, issu d'un communiqué de presse, ne fournit pas de métriques opérationnelles (taille de la flotte dédiée, temps de cycle, volumes de commandes cibles), ce qui limite l'évaluation des ambitions réelles du pilote. L'intérêt stratégique réside dans la diversification du cas d'usage : les robots-trottoirs de Serve, jusqu'ici cantonnés à la livraison Uber Eats, démontrent leur capacité à s'intégrer dans des verticales à haute fréquence au-delà du food. Pour les opérateurs de flotte et les intégrateurs logistiques, c'est un signal que le modèle économique de la livraison autonome de dernier kilomètre peut être mutualisé entre secteurs, laundry, pharmacie, épicerie, améliorant le taux d'utilisation des robots et réduisant le coût par livraison. Cela reste toutefois un pilote annoncé, pas un déploiement à l'échelle prouvé. Serve Robotics est issu de Postmates (racheté par Uber), devenu entité indépendante en 2021 avec le soutien de Nvidia au capital. L'entreprise opère principalement à Los Angeles, son seul marché commercial actif à ce jour. Elle fait face à la concurrence de Starship Technologies (déployé sur campus et en banlieue résidentielle aux États-Unis et en Europe), Coco (Los Angeles, modèle téléopéré), et Kiwibot. La prochaine étape décisive sera l'extension géographique du pilote NoScrubs et la publication de données opérationnelles permettant de juger la viabilité du modèle hors restauration.

IndustrielActu
1 source