Aller au contenu principal
Planification hybride tâche-mouvement et gestion réactive des collisions pour le démontage multi-robots de batteries VE
IndustrielarXiv cs.RO6sem

Planification hybride tâche-mouvement et gestion réactive des collisions pour le démontage multi-robots de batteries VE

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UETake éditorial

Des chercheurs ont publié, dans un article arXiv (2509.21020v2), un cadre de planification tâche-et-mouvement (TAMP) appliqué au démontage de batteries de véhicules électriques par deux bras robotiques travaillant en parallèle. Le système intègre une décomposition et une allocation dynamique des tâches, un planificateur de trajectoire basé sur RRT enrichi par un modèle de mélanges gaussiens (GMM), et une couche de sécurité hybride combinant un jumeau numérique MoveIt/FCL pour la détection prédictive de collisions avec un module d'évitement réactif par vision. Contrairement à une planification en boucle ouverte, le système opère en boucle fermée : il rescanne la scène en continu et met à jour la séquence de tâches restante selon l'état d'achèvement réel. Sur des expériences physiques de démontage de batteries EV, comparé à l'algorithme de référence RRTConnect, le framework réduit la longueur cumulée des trajectoires d'effecteur de 48,8 m à 17,9 m (soit -63,3 %), améliore le temps global de cycle (makespan) de 467,9 s à 429,8 s (-8,1 %), et diminue les volumes balayés par chaque robot (R1 : de 0,583 à 0,139 m³ ; R2 : de 0,696 à 0,252 m³), ainsi que leur chevauchement (de 0,064 à 0,034 m³).

Ces résultats sont significatifs pour les intégrateurs industriels qui travaillent sur des lignes de démantèlement de batteries en fin de vie, un marché en forte croissance avec la montée en volume des VE. La combinaison planification prédictive et évitement réactif -- sans recours à une trajectoire figée -- est ce qui distingue l'approche : le système peut gérer des obstacles dynamiques et des imprévus de perception sans replanification globale coûteuse. La réduction de 63 % des distances parcourues réduit mécaniquement l'usure, le temps d'exposition aux risques de collision et l'énergie consommée, trois facteurs critiques pour un passage à l'échelle industrielle. Il faut noter que les expériences sont réelles (pas uniquement en simulation), ce qui renforce la crédibilité des métriques, même si les conditions exactes de test (variété des modules de batteries, taux d'échec de perception) ne sont pas détaillées dans le résumé.

Le problème de démontage de batteries VE est devenu un axe de recherche prioritaire avec les objectifs européens de recyclage fixés par le règlement batteries 2023. Des équipes académiques et industrielles comme celles gravitant autour de MoveIt (OSRF), ainsi que des acteurs français tels que Pollen Robotics ou des intégrateurs proches du CEA-List, explorent des pistes similaires. Ce travail s'inscrit dans une tendance plus large : dépasser le sim-to-real gap en déployant des planificateurs hybrides sur du matériel réel, et adresser des tâches séquentielles complexes à contraintes d'ordre strict (précédence de dévissage, fragilité des cellules). La prochaine étape logique serait de tester la robustesse sur une gamme élargie de modèles de batteries et d'intégrer un retour haptique pour les phases de contact délicat.

Impact France/UE

Ce cadre TAMP répond directement aux objectifs de recyclage fixés par le règlement batteries UE 2023, en rendant le démantèlement automatisé de batteries VE en fin de vie plus efficace et scalable pour les intégrateurs industriels européens.

💬 Le point de vue du dev

63 % de réduction de trajectoires sur de vrais robots, pas en simulation, c'est rare dans les papiers arXiv et ça change vraiment la crédibilité du truc. La boucle fermée (rescan continu, réallocation dynamique) c'est exactement ce qu'il faut pour tenir en conditions industrielles, où une batterie mal positionnée ou un module abîmé peuvent faire dérailler toute la séquence. Reste à voir si ça tient sur une gamme large de modèles de batteries, parce que les conditions exactes de test ne sont pas détaillées, mais le règlement UE 2023 va créer la demande, et là il commence à y avoir des outils à la hauteur.

À lire aussi

Des quadrillages aux entrepôts : adapter la planification multi-agents légère en un coup pour les robots à guidage automatique
1arXiv cs.RO 

Des quadrillages aux entrepôts : adapter la planification multi-agents légère en un coup pour les robots à guidage automatique

Une équipe de chercheurs a publié le 21 mai 2026 (arXiv:2605.15799) un nouveau cadre algorithmique baptisé MAWPF (Multi-Agent Warehouse Pathfinding), conçu pour adapter les méthodes classiques de planification multi-agents (MAPF) aux véhicules guidés automatisés (AGV) à transmission différentielle réellement déployés en entrepôt. Contrairement aux formulations MAPF standards qui supposent une grille 2D à quatre connexions avec des déplacements unitaires, MAWPF intègre quatre contraintes physiques réalistes : les agents ne peuvent effectuer que des mouvements rectilignes ou des rotations sur place, les rotations ont un coût multi-étapes (non unitaire), les phases d'accélération et de décélération sont modélisées explicitement, et les collisions par l'arrière entre robots suiveurs sont interdites. Les auteurs ont adapté et comparé quatre algorithmes sous-optimaux représentatifs issus de la littérature MAPF : PP (Prioritized Planning), LNS2 (Large Neighborhood Search 2), PIBT (Priority Inheritance with Backtracking) et LaCAM. Les benchmarks montrent que PP et LNS2 peinent à résoudre des instances à grand nombre d'agents, tandis que les approches basées sur PIBT offrent une meilleure scalabilité, au prix d'un coût de solution plus élevé. Ce travail comble un écart concret entre la recherche en planification combinatoire et les contraintes opérationnelles des entrepôts automatisés, où les AGV à transmission différentielle dominent le marché (flottes Locus Robotics, 6 River Systems, Exotec Skypod). Le fait que les rotations et la cinématique soient désormais intégrées dans le modèle de collision élimine une source fréquente d'échec au déploiement, le "sim-to-real gap" cinématique, sans abandonner la tractabilité de la recherche combinatoire discrète. Pour un intégrateur ou un COO, cela signifie que les algorithmes de planification peuvent être qualifiés sur des métriques proches du comportement réel des véhicules, réduisant les ajustements coûteux en production. Le MAPF classique, formalisé depuis les années 2010 avec des algorithmes comme CBS (Conflict-Based Search) et ses variantes, a longtemps été critiqué pour son manque de réalisme physique. Des travaux récents comme MAPF avec agents de taille variable ou avec contraintes temporelles ont ouvert cette direction, mais la cinématique différentielle restait peu traitée. Sur le plan concurrentiel, Amazon Robotics et Waymo Via investissent dans des approches d'optimisation de flotte propriétaires, tandis que des startups comme Exotec (France) ou Autostore misent sur des architectures matérielles contraintes qui simplifient le problème de planification. La prochaine étape naturelle serait l'extension à la planification lifecycle (avec objectifs de livraison dynamiques) et des tests sur des entrepôts physiques instrumentés, non encore annoncés par les auteurs.

UELes intégrateurs de flottes AGV en Europe, et notamment Exotec (France, Skypod), peuvent s'appuyer sur ce cadre MAWPF pour qualifier leurs planificateurs sur des métriques cinématiques réalistes, réduisant les coûteux ajustements de production liés au sim-to-real gap différentiel.

IndustrielPaper
1 source
Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention
2arXiv cs.RO 

Décision séquentielle par apprentissage multi-échelle pour la préparation de commandes en robotique de manutention

Des chercheurs ont publié en mai 2026 sur arXiv (référence 2605.08758) un framework de décision séquentielle baptisé OLSF-TRS, pour Omni-scale Learning-based Sequential Decision Framework for Tote-handling Robotic Systems. Ce système combine optimisation combinatoire structurée et apprentissage par renforcement multi-agent (MARL) pour coordonner simultanément les décisions liées aux commandes, aux bacs de manutention (totes) et aux robots dans les centres de préparation automatisés. En configuration petite échelle, OLSF-TRS affiche un écart d'optimalité moyen inférieur à 3,5% sur deux architectures système distinctes. En configuration grande échelle, il réduit les mouvements de bacs de 8 à 12% par rapport aux baselines heuristiques classiques, et de plus de 30% par rapport aux approches règle-based de l'état de l'art, tout en maintenant une réactivité en temps réel. L'enjeu concret pour les intégrateurs intralogistiques est significatif : la quasi-totalité des frameworks existants sont conçus sur mesure pour un type de système spécifique, tri-sorter, mini-load AS/RS ou AMR grid-based, ce qui rend tout transfert à un autre contexte laborieux. OLSF-TRS propose une couche de pilotage unifiée et scalable, potentiellement applicable à des architectures hétérogènes. La réduction de plus de 30% des mouvements de bacs se traduit directement en gains énergétiques, réduction de l'usure mécanique et meilleure stabilité du throughput, des KPIs centraux pour les COOs industriels. À noter cependant que les résultats reposent sur des simulations et benchmarks comparatifs sans déploiement terrain documenté, ce qui laisse entière la question du sim-to-real gap en production réelle. Ce travail s'inscrit dans une tendance structurelle de fond : la substitution des palettes par les bacs comme unité logistique primaire, portée par l'explosion du e-commerce et la fragmentation des commandes en petites séries. Des acteurs comme Exotec (France, système Skypod), AutoStore (Norvège) ou Geek+ (Chine) opèrent des déploiements massifs en grid-based robotics confrontés exactement à ces problèmes de coordination ordres-bacs-robots à grande échelle. La convergence entre optimisation combinatoire de type VRP et MARL est un champ de recherche en pleine effervescence, porté par des laboratoires industriels en Europe et en Asie. L'article ne mentionne ni partenariat industriel ni timeline de commercialisation, le positionnant comme une contribution académique précompétitive.

UEExotec (France, Skypod) et AutoStore (Norvège) opèrent des déploiements massifs confrontés exactement aux problèmes de coordination ordres-bacs-robots adressés par ce framework, en faisant une piste de R&D directement pertinente pour l'intralogistique européenne.

IndustrielPaper
1 source
Deep Robotics lance un robot hybride roues-pattes pour l'inspection industrielle et les interventions d'urgence
3Robotics & Automation News 

Deep Robotics lance un robot hybride roues-pattes pour l'inspection industrielle et les interventions d'urgence

Deep Robotics, entreprise chinoise spécialisée en robotique mobile fondée en 2018 à Hangzhou, a annoncé le Lynx M20S, robot hybride à roues et pattes de nouvelle génération. Successeur direct du Lynx M20, ce modèle cible l'inspection industrielle en milieux contraints et les interventions d'urgence sur terrain accidenté. Selon le communiqué de lancement, les améliorations portent sur trois axes : capacité de charge utile (payload), niveau de protection mécanique et environnementale (indice IP non précisé dans l'annonce), et vitesse de déplacement. Les chiffres exacts de ces paramètres n'ont pas été publiés au moment du lancement, ce qui limite l'évaluation indépendante des performances annoncées. L'architecture roues-pattes répond à une contrainte réelle des déploiements industriels : naviguer efficacement sur sol plat (où les pattes seules sont lentes et énergivores) tout en franchissant obstacles et escaliers inaccessibles aux AMR classiques. Pour un intégrateur ou un COO industriel, ce type de plateforme réduit le besoin de préparer l'environnement (ramps, marquages au sol), ce qui abaisse les coûts d'intégration. Le positionnement sur l'urgence (emergency response) suggère également une résistance renforcée aux conditions extrêmes, bien que les certifications correspondantes ne soient pas encore confirmées publiquement. Deep Robotics a commercialisé le Lynx M20 dans plusieurs applications d'inspection pétrolière, minière et de centrales électriques, notamment en Chine et au Moyen-Orient. Sur ce segment hybride, les concurrents directs incluent ANYbotics (ANYmal D, basé en Suisse) et Boston Dynamics (Spot), ainsi que Unitree avec le B2-W. Les prochaines étapes attendues sont la publication de fiches techniques complètes et l'annonce de pilotes industriels, probablement à l'occasion de foires sectorielles comme CIROS ou IROS 2026.

UEConcurrence directe avec ANYbotics (Suisse) sur le segment inspection industrielle hybride roues-pattes, pouvant affecter le positionnement commercial des acteurs européens sur ce marché.

IndustrielActu
1 source
Génération de mouvements extrêmes par contrôle hybride en espace nul pour le suivi de trajectoire en ligne droite
4arXiv cs.RO 

Génération de mouvements extrêmes par contrôle hybride en espace nul pour le suivi de trajectoire en ligne droite

Des chercheurs présentent dans un preprint arXiv (2606.03390) une méthode baptisée "extreme motion generation" qui vise à maximiser la longueur du chemin cartésien parcouru par un manipulateur à base fixe sur une trajectoire rectiligne prédéfinie. L'objectif concret : pousser un bras robotique jusqu'aux limites de son espace de travail sans déclencher les butées articulaires, ce qui est critique pour des applications continues comme le revêtement de surface ou le soudage. Le système a été évalué sur 10 000 tâches de suivi de chemin en ligne droite avec un Franka FR3 à 7 degrés de liberté. Résultat : une augmentation de 27 % de la longueur moyenne de trajectoire par rapport à une baseline entièrement basée sur un contrôleur modèle, avec des gains bien supérieurs sur les cas extrêmes. L'intérêt technique réside dans l'architecture hybride proposée. Un contrôleur par apprentissage par renforcement (RL) gère les décisions à long horizon, là où il excelle, tandis qu'un contrôleur modèle classique prend la relève lorsque le manipulateur s'approche des limites articulaires, une zone où la politique RL se dégrade en raison d'une couverture de données insuffisante. La bascule entre les deux modes se fait selon une distance normalisée aux limites articulaires. L'initialisation des configurations articulaires est résolue par un modèle de diffusion conditionnel, qui exploite un prior de mouvement appris pour choisir des configurations de départ favorables. Ce découplage explicite entre prise de décision à long terme (RL) et stabilisation locale (contrôle modèle) est une réponse directe au problème dit du "safety boundary avoidance" dans les trajectoires longues, un problème qui reste mal résolu par les approches purement data-driven. Ce travail s'inscrit dans un corpus croissant autour des contrôleurs hybrides RL+modèle pour la manipulation industrielle, à côté d'approches comme celles de Lux et al. ou des travaux sur le null-space control dans les bras redondants. Il ne s'agit pas ici d'un robot humanoïde ni d'une VLA généraliste, mais d'une contribution ciblée sur les manipulateurs fixes à tâche contrainte, directement pertinente pour les intégrateurs en soudage robotisé ou en peinture automatisée. Le Franka FR3 est un bras de recherche standard à 7 degrés de liberté, ce qui rend les résultats reproductibles mais limite leur généralisation directe à d'autres cinématiques. Les vidéos et le site projet sont accessibles publiquement ; aucun déploiement industriel ni partenariat commercial n'est mentionné dans ce preprint.

UEMéthode directement exploitable sur le Franka FR3 (bras allemand, Franka Robotics GmbH), ce qui la rend pertinente pour les intégrateurs européens en soudage robotisé et revêtement automatisé.

IndustrielPaper
1 source