IndustrielarXiv cs.RO6j

SOAR : optimisation conjointe en temps réel pour l'allocation des commandes et l'ordonnancement des robots mobiles

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs, en collaboration avec Geekplus, ont publié SOAR (Simultaneous Order Allocation and Robot Scheduling), un framework d'apprentissage par renforcement profond conçu pour optimiser en temps réel la coordination des robots dans les systèmes de préparation de commandes automatisés (RMFS, Robotic Mobile Fulfillment Systems). Déposé sur arXiv en mai 2026 (arXiv:2605.03842), le système unifie deux sous-problèmes classiquement découplés, l'allocation des commandes et la planification des robots mobiles, en un seul agent décisionnel. Sur des données industrielles réelles fournies par Geekplus, SOAR réduit le makespan global de 7,5 % et le temps moyen de complétion des commandes de 15,4 %, avec une latence de décision inférieure à 100 ms. La viabilité du système a été confirmée par un déploiement en environnement de production via une procédure sim-to-real. Techniquement, le problème est formulé comme un processus de décision de Markov piloté par événements (Event-Driven MDP), où l'agent réagit à des événements asynchrones (fin de tâche, arrivée de commande) grâce à un Heterogeneous Graph Transformer encodant l'état de l'entrepôt, complété par une stratégie de reward shaping pour gérer la rareté du signal de récompense sur les longues séquences.

Les RMFS équipent aujourd'hui les grands centres logistiques : des flottes de robots mobiles (AMR) transportent des étagères entières vers des postes de picking humains ou automatisés. Le goulot d'étranglement traditionnel vient du couplage fort entre allocation et ordonnancement : les approches décomposées sacrifient l'optimalité globale pour garantir la réactivité, tandis que les modèles d'optimisation classiques comme les MILP ou CP-SAT sont trop lents pour des environnements à haute cadence. SOAR casse ce compromis en prouvant qu'un agent de deep RL peut raisonner globalement tout en répondant en moins de 100 ms, ce qui constituait un verrou industriel reconnu. Plus significatif encore, la validation sim-to-real en conditions de production distingue ce travail de la majorité des publications académiques qui restent cantonnées à la simulation.

Geekplus, fondé en 2015 à Pékin, est l'un des leaders mondiaux des AMR pour la logistique d'entrepôt, avec des déploiements dans plus de 40 pays chez des clients comme Decathlon et JD.com. Sa participation directe à cette recherche signale une intégration croissante entre laboratoires académiques et industriels pour raccourcir le cycle lab-to-production. Sur le marché, Geekplus concurrence Hai Robotics et AutoStore, mais aussi en Europe des acteurs comme Exotec (France), dont le système Skypod adresse des problèmes similaires de coordination multi-robots à grande échelle. SOAR s'inscrit dans un corpus actif de travaux sur le RL multi-agent pour la planification en entrepôt, mais se distingue par son approche unifiée et son ancrage en production confirmé. Le code est disponible en open source sur GitHub, ce qui devrait faciliter son adaptation à d'autres architectures RMFS.

Impact France/UE

Le code open-source SOAR, validé en production chez des clients de Geekplus dont Decathlon, constitue une référence technique directe pour Exotec et les intégrateurs AMR européens confrontés aux mêmes problèmes de coordination multi-robots à grande échelle.

Dans nos dossiers

Exotec arXiv cs.RO

À lire aussi

1Robotics Business Review

Comment concevoir des rails de robot et des systèmes à 7ème axe pour les environnements réels

Güdel Inc., filiale américaine du groupe suisse Güdel Group AG, organise un webinaire technique le 12 mai 2026 à 14h heure de l'Est, intitulé "Harsh and Dirty by Design: Engineering Robot Tracks and 7th Axis Systems for Real-World Environments". Deux expertes prendront la parole : Molly Lynch, account manager pour la région Midwest chez Güdel avec 15 ans d'expérience en automatisation industrielle, et Brenda Courim, directrice des ventes et du marketing de Güdel, forte de plus de 30 ans dans le secteur manufacturier dont environ 20 ans en ingénierie de conception principalement dans l'industrie automobile, diplômée en génie mécanique de l'Université du Michigan. La session s'adresse aux ingénieurs robotique, intégrateurs système, concepteurs d'automatisation et responsables de maintenance confrontés à des environnements industriels sévères. Les rails de translation et systèmes de 7e axe sont parmi les composants les plus exposés d'une cellule d'automatisation, et c'est précisément là que réside le problème structurel que le webinaire cherche à adresser. Conçus pour des environnements propres et contrôlés, ces systèmes sont soumis en conditions réelles à des projections de soudure, des poussières abrasives, de l'humidité, des produits chimiques, des overspray de cabines de peinture et des écarts de température extrêmes. Les modes de défaillance typiques identifiés incluent le contournement des joints d'étanchéité (seal bypass), l'endommagement des roulements, la corrosion et la perte d'alignement. Les intervenantes défendront des approches de conception spécifiques, notamment les guidages à rouleaux (roller guideways), les galets suiveurs (cam followers), les racleurs mécaniques, les capots de protection de rail et les traitements de surface protecteurs. La thèse centrale est que la maintenance préventive ne peut pas rester une réaction aux pannes : elle doit être intégrée dès la phase de conception du système, ce qui implique des choix d'architecture de rail et de configuration influençant directement l'exposition à la contamination et l'accessibilité pour l'entretien. Güdel Group AG, fondé en Suisse en 1954, est l'un des acteurs historiques des systèmes de mouvement linéaire et des rails de déplacement pour robots industriels, avec une présence significative dans les secteurs automobile, logistique et métallurgie. Le marché des 7e axes pour robots articultés comprend également des solutions de Rollon (désormais intégré dans Nadella Group), de constructeurs comme KUKA ou Fanuc via leurs divisions d'accessoires, et diverses offres d'intégrateurs régionaux. Cet événement est à classer comme un webinaire promotionnel d'un fournisseur, non comme la publication d'une étude indépendante ou d'un benchmark sectoriel, et aucune donnée comparative externe n'est annoncée au programme.

IndustrielActu

1 source

2arXiv cs.RO

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention

Des chercheurs ont publié en mai 2026 sur arXiv (référence 2605.08758) un framework de décision séquentielle baptisé OLSF-TRS, pour Omni-scale Learning-based Sequential Decision Framework for Tote-handling Robotic Systems. Ce système combine optimisation combinatoire structurée et apprentissage par renforcement multi-agent (MARL) pour coordonner simultanément les décisions liées aux commandes, aux bacs de manutention (totes) et aux robots dans les centres de préparation automatisés. En configuration petite échelle, OLSF-TRS affiche un écart d'optimalité moyen inférieur à 3,5% sur deux architectures système distinctes. En configuration grande échelle, il réduit les mouvements de bacs de 8 à 12% par rapport aux baselines heuristiques classiques, et de plus de 30% par rapport aux approches règle-based de l'état de l'art, tout en maintenant une réactivité en temps réel. L'enjeu concret pour les intégrateurs intralogistiques est significatif : la quasi-totalité des frameworks existants sont conçus sur mesure pour un type de système spécifique, tri-sorter, mini-load AS/RS ou AMR grid-based, ce qui rend tout transfert à un autre contexte laborieux. OLSF-TRS propose une couche de pilotage unifiée et scalable, potentiellement applicable à des architectures hétérogènes. La réduction de plus de 30% des mouvements de bacs se traduit directement en gains énergétiques, réduction de l'usure mécanique et meilleure stabilité du throughput, des KPIs centraux pour les COOs industriels. À noter cependant que les résultats reposent sur des simulations et benchmarks comparatifs sans déploiement terrain documenté, ce qui laisse entière la question du sim-to-real gap en production réelle. Ce travail s'inscrit dans une tendance structurelle de fond : la substitution des palettes par les bacs comme unité logistique primaire, portée par l'explosion du e-commerce et la fragmentation des commandes en petites séries. Des acteurs comme Exotec (France, système Skypod), AutoStore (Norvège) ou Geek+ (Chine) opèrent des déploiements massifs en grid-based robotics confrontés exactement à ces problèmes de coordination ordres-bacs-robots à grande échelle. La convergence entre optimisation combinatoire de type VRP et MARL est un champ de recherche en pleine effervescence, porté par des laboratoires industriels en Europe et en Asie. L'article ne mentionne ni partenariat industriel ni timeline de commercialisation, le positionnant comme une contribution académique précompétitive.

UEExotec (France, Skypod) et AutoStore (Norvège) opèrent des déploiements massifs confrontés exactement aux problèmes de coordination ordres-bacs-robots adressés par ce framework, en faisant une piste de R&D directement pertinente pour l'intralogistique européenne.

IndustrielPaper

1 source

3Robotics & Automation News

Locus Robotics déploie Locus Array pour l'automatisation complète des entrepôts

Locus Robotics, spécialiste américain des systèmes d'automatisation d'entrepôts, a officialisé le lancement de Locus Array, une solution qu'elle qualifie de système de préparation de commandes entièrement autonome. La plateforme intègre des robots mobiles autonomes (AMR), un bras de préhension robotisé et un module de perception piloté par IA, avec l'objectif de couvrir l'ensemble du flux de traitement des commandes sans intervention humaine. Des déploiements en accès anticipé sont déjà engagés chez des clients en Amérique du Nord, bien que les détails opérationnels (payload, cadence de cycle, taux de précision) n'aient pas encore été communiqués publiquement. L'enjeu industriel est réel : les AMR de première génération automatisaient le transport inter-zones, mais laissaient le picking, tâche la plus coûteuse en main-d'oeuvre -- à des opérateurs humains. Intégrer un bras de préhension directement sur la plateforme mobile représente un saut architectural vers l'autonomie bout-en-bout. Pour les intégrateurs et les décideurs logistiques, cela change le calcul du ROI : si les métriques tiennent à l'échelle, l'argument pour réduire les effectifs de picking devient structurel. Reste à valider la robustesse hors conditions contrôlées, un point que l'annonce ne documente pas encore. Locus Robotics a levé plus de 400 millions de dollars depuis sa fondation en 2015, mais a traversé une période difficile en 2023, avec des réductions d'effectifs significatives liées à un ralentissement du marché e-commerce. Locus Array s'inscrit donc dans une stratégie de repositionnement vers la valeur ajoutée. Sur ce segment, la concurrence est dense : Exotec (Roubaix, France) avec son système Skypod, Symbotic, Geek+ et Boston Dynamics avec Stretch visent tous le même créneau de préparation autonome. La phase d'accès anticipé devra produire des données opérationnelles convaincantes pour crédibiliser la proposition face à ces acteurs déjà déployés à grande échelle.

UEExotec (Roubaix, France) est directement en compétition sur ce créneau de préparation autonome et devra défendre sa position si Locus Array produit des métriques opérationnelles convaincantes à l'échelle.

IndustrielOpinion

1 source

4arXiv cs.RO

Planification hybride tâche-mouvement et gestion réactive des collisions pour le démontage multi-robots de batteries VE

Des chercheurs ont publié, dans un article arXiv (2509.21020v2), un cadre de planification tâche-et-mouvement (TAMP) appliqué au démontage de batteries de véhicules électriques par deux bras robotiques travaillant en parallèle. Le système intègre une décomposition et une allocation dynamique des tâches, un planificateur de trajectoire basé sur RRT enrichi par un modèle de mélanges gaussiens (GMM), et une couche de sécurité hybride combinant un jumeau numérique MoveIt/FCL pour la détection prédictive de collisions avec un module d'évitement réactif par vision. Contrairement à une planification en boucle ouverte, le système opère en boucle fermée : il rescanne la scène en continu et met à jour la séquence de tâches restante selon l'état d'achèvement réel. Sur des expériences physiques de démontage de batteries EV, comparé à l'algorithme de référence RRTConnect, le framework réduit la longueur cumulée des trajectoires d'effecteur de 48,8 m à 17,9 m (soit -63,3 %), améliore le temps global de cycle (makespan) de 467,9 s à 429,8 s (-8,1 %), et diminue les volumes balayés par chaque robot (R1 : de 0,583 à 0,139 m³ ; R2 : de 0,696 à 0,252 m³), ainsi que leur chevauchement (de 0,064 à 0,034 m³). Ces résultats sont significatifs pour les intégrateurs industriels qui travaillent sur des lignes de démantèlement de batteries en fin de vie, un marché en forte croissance avec la montée en volume des VE. La combinaison planification prédictive et évitement réactif -- sans recours à une trajectoire figée -- est ce qui distingue l'approche : le système peut gérer des obstacles dynamiques et des imprévus de perception sans replanification globale coûteuse. La réduction de 63 % des distances parcourues réduit mécaniquement l'usure, le temps d'exposition aux risques de collision et l'énergie consommée, trois facteurs critiques pour un passage à l'échelle industrielle. Il faut noter que les expériences sont réelles (pas uniquement en simulation), ce qui renforce la crédibilité des métriques, même si les conditions exactes de test (variété des modules de batteries, taux d'échec de perception) ne sont pas détaillées dans le résumé. Le problème de démontage de batteries VE est devenu un axe de recherche prioritaire avec les objectifs européens de recyclage fixés par le règlement batteries 2023. Des équipes académiques et industrielles comme celles gravitant autour de MoveIt (OSRF), ainsi que des acteurs français tels que Pollen Robotics ou des intégrateurs proches du CEA-List, explorent des pistes similaires. Ce travail s'inscrit dans une tendance plus large : dépasser le sim-to-real gap en déployant des planificateurs hybrides sur du matériel réel, et adresser des tâches séquentielles complexes à contraintes d'ordre strict (précédence de dévissage, fragilité des cellules). La prochaine étape logique serait de tester la robustesse sur une gamme élargie de modèles de batteries et d'intégrer un retour haptique pour les phases de contact délicat.

UECe cadre TAMP répond directement aux objectifs de recyclage fixés par le règlement batteries UE 2023, en rendant le démantèlement automatisé de batteries VE en fin de vie plus efficace et scalable pour les intégrateurs industriels européens.

💬 63 % de réduction de trajectoires sur de vrais robots, pas en simulation, c'est rare dans les papiers arXiv et ça change vraiment la crédibilité du truc. La boucle fermée (rescan continu, réallocation dynamique) c'est exactement ce qu'il faut pour tenir en conditions industrielles, où une batterie mal positionnée ou un module abîmé peuvent faire dérailler toute la séquence. Reste à voir si ça tient sur une gamme large de modèles de batteries, parce que les conditions exactes de test ne sont pas détaillées, mais le règlement UE 2023 va créer la demande, et là il commence à y avoir des outils à la hauteur.

IndustrielPaper

1 source