Aller au contenu principal
Livraison multi-agents avec correspondances multiples
IndustrielarXiv cs.RO1j

Livraison multi-agents avec correspondances multiples

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2605.07835) un algorithme baptisé M2M (Many-to-Many Multi-Agent Pickup and Delivery) pour optimiser la coordination de flottes de robots dans des entrepôts automatisés. La majorité des travaux antérieurs sur le problème MAPD (Multi-Agent Pickup and Delivery) supposent qu'une tâche a un unique point de collecte et un unique point de dépôt, le paradigme dit "one-to-one". M2M s'attaque à la variante "many-to-many" : dans un entrepôt réel, un article identifié par son SKU (Stock Keeping Unit) peut être prélevé ou stocké à plusieurs emplacements, ce qui génère un problème d'affectation à quatre dimensions classé NP-difficile. L'équipe propose deux variantes : M2M, qui minimise la durée estimée de chaque tâche, et M2M-wSKU, qui intègre en plus la distribution physique des SKUs dans la fonction objectif. En simulation sur des opérations de 8 heures, M2M complète jusqu'à 22 000 tâches supplémentaires en moyenne par rapport aux meilleures méthodes existantes, selon les configurations d'environnement et la densité d'inventaire.

Le gain de 22 000 tâches sur une journée simulée de 8 heures représente un saut de throughput significatif pour un entrepôt à forte rotation. Pour un intégrateur ou un COO industriel, cela se traduit directement en capacité de traitement d'ordres supplémentaires sans augmenter le parc de robots. L'enjeu théorique est tout aussi notable : la transition du paradigme one-to-one vers many-to-many reflète fidèlement la réalité des entrepôts modernes, où la redondance d'emplacements est un mécanisme délibéré de résilience logistique. Une limite mérite d'être soulignée : les simulations sur 8 heures ne capturent pas les pannes matérielles, la variabilité des temps de manipulation, ni les interactions humaines en zones mixtes. Sur le plan académique toutefois, M2M établit une nouvelle référence sur ce sous-problème MAPD jusqu'ici peu traité.

Le MAPD est un champ de recherche actif depuis une quinzaine d'années, porté par l'essor des entrepôts automatisés et des systèmes AMR (Autonomous Mobile Robots). Les algorithmes classiques ciblaient des scénarios one-to-one correspondant aux premières architectures d'entrepôts, mais les systèmes industriels modernes opèrent quasi universellement en many-to-many. L'entreprise française Exotec, avec son système Skypod déployé chez plus de 400 clients dans 15 pays, incarne précisément cette réalité multi-emplacements, aux côtés d'acteurs comme Amazon Robotics, Geek+ ou AutoStore. La publication de M2M sur arXiv ouvre la voie à son intégration dans des frameworks open-source de planification multi-robots. Les prochaines étapes attendues incluent une validation sur environnements physiques et la prise en compte de contraintes temporelles réelles, telles que les fenêtres de livraison ou les priorités dynamiques de commande.

Impact France/UE

L'algorithme M2M pourrait être directement intégré dans des systèmes comme le Skypod d'Exotec, permettant d'augmenter le débit des entrepôts automatisés européens sans extension du parc de robots.

À lire aussi

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention
1arXiv cs.RO 

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention

Des chercheurs ont publié en mai 2026 sur arXiv (référence 2605.08758) un framework de décision séquentielle baptisé OLSF-TRS, pour Omni-scale Learning-based Sequential Decision Framework for Tote-handling Robotic Systems. Ce système combine optimisation combinatoire structurée et apprentissage par renforcement multi-agent (MARL) pour coordonner simultanément les décisions liées aux commandes, aux bacs de manutention (totes) et aux robots dans les centres de préparation automatisés. En configuration petite échelle, OLSF-TRS affiche un écart d'optimalité moyen inférieur à 3,5% sur deux architectures système distinctes. En configuration grande échelle, il réduit les mouvements de bacs de 8 à 12% par rapport aux baselines heuristiques classiques, et de plus de 30% par rapport aux approches règle-based de l'état de l'art, tout en maintenant une réactivité en temps réel. L'enjeu concret pour les intégrateurs intralogistiques est significatif : la quasi-totalité des frameworks existants sont conçus sur mesure pour un type de système spécifique, tri-sorter, mini-load AS/RS ou AMR grid-based, ce qui rend tout transfert à un autre contexte laborieux. OLSF-TRS propose une couche de pilotage unifiée et scalable, potentiellement applicable à des architectures hétérogènes. La réduction de plus de 30% des mouvements de bacs se traduit directement en gains énergétiques, réduction de l'usure mécanique et meilleure stabilité du throughput, des KPIs centraux pour les COOs industriels. À noter cependant que les résultats reposent sur des simulations et benchmarks comparatifs sans déploiement terrain documenté, ce qui laisse entière la question du sim-to-real gap en production réelle. Ce travail s'inscrit dans une tendance structurelle de fond : la substitution des palettes par les bacs comme unité logistique primaire, portée par l'explosion du e-commerce et la fragmentation des commandes en petites séries. Des acteurs comme Exotec (France, système Skypod), AutoStore (Norvège) ou Geek+ (Chine) opèrent des déploiements massifs en grid-based robotics confrontés exactement à ces problèmes de coordination ordres-bacs-robots à grande échelle. La convergence entre optimisation combinatoire de type VRP et MARL est un champ de recherche en pleine effervescence, porté par des laboratoires industriels en Europe et en Asie. L'article ne mentionne ni partenariat industriel ni timeline de commercialisation, le positionnant comme une contribution académique précompétitive.

UEExotec (France, Skypod) et AutoStore (Norvège) opèrent des déploiements massifs confrontés exactement aux problèmes de coordination ordres-bacs-robots adressés par ce framework, en faisant une piste de R&D directement pertinente pour l'intralogistique européenne.

IndustrielPaper
1 source
SOAR : optimisation conjointe en temps réel pour l'allocation des commandes et l'ordonnancement des robots mobiles
2arXiv cs.RO 

SOAR : optimisation conjointe en temps réel pour l'allocation des commandes et l'ordonnancement des robots mobiles

Des chercheurs, en collaboration avec Geekplus, ont publié SOAR (Simultaneous Order Allocation and Robot Scheduling), un framework d'apprentissage par renforcement profond conçu pour optimiser en temps réel la coordination des robots dans les systèmes de préparation de commandes automatisés (RMFS, Robotic Mobile Fulfillment Systems). Déposé sur arXiv en mai 2026 (arXiv:2605.03842), le système unifie deux sous-problèmes classiquement découplés, l'allocation des commandes et la planification des robots mobiles, en un seul agent décisionnel. Sur des données industrielles réelles fournies par Geekplus, SOAR réduit le makespan global de 7,5 % et le temps moyen de complétion des commandes de 15,4 %, avec une latence de décision inférieure à 100 ms. La viabilité du système a été confirmée par un déploiement en environnement de production via une procédure sim-to-real. Techniquement, le problème est formulé comme un processus de décision de Markov piloté par événements (Event-Driven MDP), où l'agent réagit à des événements asynchrones (fin de tâche, arrivée de commande) grâce à un Heterogeneous Graph Transformer encodant l'état de l'entrepôt, complété par une stratégie de reward shaping pour gérer la rareté du signal de récompense sur les longues séquences. Les RMFS équipent aujourd'hui les grands centres logistiques : des flottes de robots mobiles (AMR) transportent des étagères entières vers des postes de picking humains ou automatisés. Le goulot d'étranglement traditionnel vient du couplage fort entre allocation et ordonnancement : les approches décomposées sacrifient l'optimalité globale pour garantir la réactivité, tandis que les modèles d'optimisation classiques comme les MILP ou CP-SAT sont trop lents pour des environnements à haute cadence. SOAR casse ce compromis en prouvant qu'un agent de deep RL peut raisonner globalement tout en répondant en moins de 100 ms, ce qui constituait un verrou industriel reconnu. Plus significatif encore, la validation sim-to-real en conditions de production distingue ce travail de la majorité des publications académiques qui restent cantonnées à la simulation. Geekplus, fondé en 2015 à Pékin, est l'un des leaders mondiaux des AMR pour la logistique d'entrepôt, avec des déploiements dans plus de 40 pays chez des clients comme Decathlon et JD.com. Sa participation directe à cette recherche signale une intégration croissante entre laboratoires académiques et industriels pour raccourcir le cycle lab-to-production. Sur le marché, Geekplus concurrence Hai Robotics et AutoStore, mais aussi en Europe des acteurs comme Exotec (France), dont le système Skypod adresse des problèmes similaires de coordination multi-robots à grande échelle. SOAR s'inscrit dans un corpus actif de travaux sur le RL multi-agent pour la planification en entrepôt, mais se distingue par son approche unifiée et son ancrage en production confirmé. Le code est disponible en open source sur GitHub, ce qui devrait faciliter son adaptation à d'autres architectures RMFS.

UELe code open-source SOAR, validé en production chez des clients de Geekplus dont Decathlon, constitue une référence technique directe pour Exotec et les intégrateurs AMR européens confrontés aux mêmes problèmes de coordination multi-robots à grande échelle.

IndustrielPaper
1 source
Planification hybride tâche-mouvement et gestion réactive des collisions pour le démontage multi-robots de batteries VE
3arXiv cs.RO 

Planification hybride tâche-mouvement et gestion réactive des collisions pour le démontage multi-robots de batteries VE

Des chercheurs ont publié, dans un article arXiv (2509.21020v2), un cadre de planification tâche-et-mouvement (TAMP) appliqué au démontage de batteries de véhicules électriques par deux bras robotiques travaillant en parallèle. Le système intègre une décomposition et une allocation dynamique des tâches, un planificateur de trajectoire basé sur RRT enrichi par un modèle de mélanges gaussiens (GMM), et une couche de sécurité hybride combinant un jumeau numérique MoveIt/FCL pour la détection prédictive de collisions avec un module d'évitement réactif par vision. Contrairement à une planification en boucle ouverte, le système opère en boucle fermée : il rescanne la scène en continu et met à jour la séquence de tâches restante selon l'état d'achèvement réel. Sur des expériences physiques de démontage de batteries EV, comparé à l'algorithme de référence RRTConnect, le framework réduit la longueur cumulée des trajectoires d'effecteur de 48,8 m à 17,9 m (soit -63,3 %), améliore le temps global de cycle (makespan) de 467,9 s à 429,8 s (-8,1 %), et diminue les volumes balayés par chaque robot (R1 : de 0,583 à 0,139 m³ ; R2 : de 0,696 à 0,252 m³), ainsi que leur chevauchement (de 0,064 à 0,034 m³). Ces résultats sont significatifs pour les intégrateurs industriels qui travaillent sur des lignes de démantèlement de batteries en fin de vie, un marché en forte croissance avec la montée en volume des VE. La combinaison planification prédictive et évitement réactif -- sans recours à une trajectoire figée -- est ce qui distingue l'approche : le système peut gérer des obstacles dynamiques et des imprévus de perception sans replanification globale coûteuse. La réduction de 63 % des distances parcourues réduit mécaniquement l'usure, le temps d'exposition aux risques de collision et l'énergie consommée, trois facteurs critiques pour un passage à l'échelle industrielle. Il faut noter que les expériences sont réelles (pas uniquement en simulation), ce qui renforce la crédibilité des métriques, même si les conditions exactes de test (variété des modules de batteries, taux d'échec de perception) ne sont pas détaillées dans le résumé. Le problème de démontage de batteries VE est devenu un axe de recherche prioritaire avec les objectifs européens de recyclage fixés par le règlement batteries 2023. Des équipes académiques et industrielles comme celles gravitant autour de MoveIt (OSRF), ainsi que des acteurs français tels que Pollen Robotics ou des intégrateurs proches du CEA-List, explorent des pistes similaires. Ce travail s'inscrit dans une tendance plus large : dépasser le sim-to-real gap en déployant des planificateurs hybrides sur du matériel réel, et adresser des tâches séquentielles complexes à contraintes d'ordre strict (précédence de dévissage, fragilité des cellules). La prochaine étape logique serait de tester la robustesse sur une gamme élargie de modèles de batteries et d'intégrer un retour haptique pour les phases de contact délicat.

UECe cadre TAMP répond directement aux objectifs de recyclage fixés par le règlement batteries UE 2023, en rendant le démantèlement automatisé de batteries VE en fin de vie plus efficace et scalable pour les intégrateurs industriels européens.

💬 63 % de réduction de trajectoires sur de vrais robots, pas en simulation, c'est rare dans les papiers arXiv et ça change vraiment la crédibilité du truc. La boucle fermée (rescan continu, réallocation dynamique) c'est exactement ce qu'il faut pour tenir en conditions industrielles, où une batterie mal positionnée ou un module abîmé peuvent faire dérailler toute la séquence. Reste à voir si ça tient sur une gamme large de modèles de batteries, parce que les conditions exactes de test ne sont pas détaillées, mais le règlement UE 2023 va créer la demande, et là il commence à y avoir des outils à la hauteur.

IndustrielPaper
1 source
Comment concevoir des rails de robot et des systèmes à 7ème axe pour les environnements réels
4Robotics Business Review 

Comment concevoir des rails de robot et des systèmes à 7ème axe pour les environnements réels

Güdel Inc., filiale américaine du groupe suisse Güdel Group AG, organise un webinaire technique le 12 mai 2026 à 14h heure de l'Est, intitulé "Harsh and Dirty by Design: Engineering Robot Tracks and 7th Axis Systems for Real-World Environments". Deux expertes prendront la parole : Molly Lynch, account manager pour la région Midwest chez Güdel avec 15 ans d'expérience en automatisation industrielle, et Brenda Courim, directrice des ventes et du marketing de Güdel, forte de plus de 30 ans dans le secteur manufacturier dont environ 20 ans en ingénierie de conception principalement dans l'industrie automobile, diplômée en génie mécanique de l'Université du Michigan. La session s'adresse aux ingénieurs robotique, intégrateurs système, concepteurs d'automatisation et responsables de maintenance confrontés à des environnements industriels sévères. Les rails de translation et systèmes de 7e axe sont parmi les composants les plus exposés d'une cellule d'automatisation, et c'est précisément là que réside le problème structurel que le webinaire cherche à adresser. Conçus pour des environnements propres et contrôlés, ces systèmes sont soumis en conditions réelles à des projections de soudure, des poussières abrasives, de l'humidité, des produits chimiques, des overspray de cabines de peinture et des écarts de température extrêmes. Les modes de défaillance typiques identifiés incluent le contournement des joints d'étanchéité (seal bypass), l'endommagement des roulements, la corrosion et la perte d'alignement. Les intervenantes défendront des approches de conception spécifiques, notamment les guidages à rouleaux (roller guideways), les galets suiveurs (cam followers), les racleurs mécaniques, les capots de protection de rail et les traitements de surface protecteurs. La thèse centrale est que la maintenance préventive ne peut pas rester une réaction aux pannes : elle doit être intégrée dès la phase de conception du système, ce qui implique des choix d'architecture de rail et de configuration influençant directement l'exposition à la contamination et l'accessibilité pour l'entretien. Güdel Group AG, fondé en Suisse en 1954, est l'un des acteurs historiques des systèmes de mouvement linéaire et des rails de déplacement pour robots industriels, avec une présence significative dans les secteurs automobile, logistique et métallurgie. Le marché des 7e axes pour robots articultés comprend également des solutions de Rollon (désormais intégré dans Nadella Group), de constructeurs comme KUKA ou Fanuc via leurs divisions d'accessoires, et diverses offres d'intégrateurs régionaux. Cet événement est à classer comme un webinaire promotionnel d'un fournisseur, non comme la publication d'une étude indépendante ou d'un benchmark sectoriel, et aucune donnée comparative externe n'est annoncée au programme.

IndustrielActu
1 source