Transport multi-robots de boîtes sur différentes surfac…

Adaptation mutuelle dans le co-transport humain-robot avec incertitude sur les préférences humaines

38

1arXiv cs.RO

Adaptation mutuelle dans le co-transport humain-robot avec incertitude sur les préférences humaines

Une équipe de chercheurs a publié en mars 2025 sur arXiv (référence 2503.08895) un cadre unifié de co-transport humain-robot fondé sur l'adaptation mutuelle, visant à résoudre un problème central de la robotique collaborative physique : comment un robot peut-il s'adapter en temps réel à un partenaire humain dont les préférences de trajectoire sont incertaines, et réciproquement ? L'article propose trois contributions distinctes. Plutôt que de fixer a priori les paramètres comportementaux du partenaire, les auteurs modélisent une distribution de probabilité sur l'ensemble des préférences possibles. Ils introduisent ensuite une mesure d'obstination (stubbornness) variant dans le temps, qui détermine dynamiquement si le robot doit mener la trajectoire ou céder la direction à l'humain lorsque celui-ci manifeste une préférence forte et persistante au-delà d'un seuil défini. Enfin, une stratégie d'optimisation de posture s'applique au niveau du contrôle bas-niveau pour compenser les comportements imprévisibles quand l'humain prend les commandes. Le cadre a été validé auprès de vingt participants, complété par des simulations comparatives. Ce travail adresse un verrou technique majeur pour les robots collaboratifs physiques en logistique, industrie et assistance à la personne : l'écart entre les modèles humains supposés et la variabilité réelle des opérateurs. En introduisant une modélisation probabiliste plutôt que déterministe des préférences, le framework évite le blocage classique des systèmes à paramètres fixes qui échouent dès que l'humain dévie du comportement anticipé. Pour un intégrateur ou un COO industriel, le signal concret est que des robots de co-manutention pourraient s'adapter à différents opérateurs sans reprogrammation, réduisant les coûts de déploiement multi-site. La bascule dynamique entre modes "robot meneur" et "humain meneur" offre par ailleurs une flexibilité opérationnelle utile dans des contextes où l'ergonomie ou la sécurité prime sur l'optimisation de trajectoire. Le co-transport physique humain-robot reste peu industrialisé comparé aux AMR ou aux cobots de type Universal Robots et FANUC CRX. Les approches antérieures à impédance variable ou fondées sur des modèles de jeu de Stackelberg avaient posé des bases théoriques, mais butaient sur la rigidité des hypothèses comportementales. Ce papier s'inscrit dans une tendance plus large à intégrer l'incertitude humaine dans la boucle de contrôle, direction explorée notamment par le MIT CSAIL et, en France, par l'INRIA au travers de travaux sur la planification collaborative. Les prochaines étapes probables incluent des validations en environnement industriel réel et l'extension à des tâches multi-étapes, où la gestion de l'obstination sur des horizons temporels plus longs constituera un défi supplémentaire.

UEL'INRIA mène des travaux sur la planification collaborative dans la même direction, positionnant la recherche française pour contribuer à des solutions de co-manutention adaptatives qui pourraient bénéficier aux intégrateurs industriels européens à moyen terme.

RecherchePaper

1 source

Optimisation riemannienne décentralisée sur graphe de poses pour le SLAM multi-robots basé objets

35

2arXiv cs.RO

Optimisation riemannienne décentralisée sur graphe de poses pour le SLAM multi-robots basé objets

Des chercheurs publient sur arXiv (réf. 2606.24489) un cadre d'optimisation entièrement décentralisé pour le SLAM multi-robots basé sur des objets. Le PGO (Pose Graph Optimization) est le composant d'estimation d'état central des flottes robotiques en réseau : chaque agent doit estimer simultanément sa propre trajectoire et les poses d'objets persistants observés par plusieurs robots. L'algorithme proposé travaille sur la variété SE(d) via l'optimisation riemannienne, couplé à un mécanisme de consensus pour découpler les estimations conjointes. Il intègre également un schéma Newton approché distribué exploitant des informations de second ordre locales afin d'améliorer la convergence sous budgets de communication limités. Les évaluations couvrent des benchmarks publics, des simulations à grande échelle et des expériences multi-robots réelles, avec des gains annoncés en précision, temps d'exécution et passage à l'échelle. Le verrou adressé est directement pertinent en déploiement industriel : les solutions décentralisées existantes supposent que le graphe de communication coïncide avec la topologie physique d'interaction des robots, une hypothèse irréaliste lorsque la communication est intermittente, éparse ou variable dans le temps. En découplant ces deux topologies, le framework devient applicable aux entrepôts avec AMR, aux flottes de drones ou aux convois de véhicules autonomes. L'apport théorique -- convergence prouvée vers des points stationnaires riemanniens de premier ordre et analyse du nombre de conditionnement local justifiant l'avantage du second ordre sur la descente de gradient pure -- distingue ce travail des approches heuristiques. La réduction du nombre d'itérations et de la charge de communication sans perte de précision est le bénéfice opérationnel central, même si la distance entre preuves formelles et performances terrain reste un écart classique dans le domaine. Le SLAM multi-robots décentralisé est un champ actif depuis une décennie, avec des contributions majeures comme SE-Sync (Rosen et al., Brown University), KIMERA-Multi (MIT SPARK Lab) ou DOOR-SLAM. Cette méthode s'inscrit dans leur continuité en ajoutant la gestion explicite des objets partagés entre agents et la robustesse aux pannes de communication. Ce préprint arXiv n'a pas encore été évalué par les pairs et ne correspond à aucun produit ni déploiement commercial annoncé : c'est une contribution algorithmique pure. Les suites naturelles seraient une soumission à ICRA 2027 ou IROS, et des tests de validation sur des flottes denses en environnement réel non contrôlé. Aucun acteur français ou européen n'est mentionné dans les travaux.

RecherchePaper

1 source

Contrôle géométrique décentralisé pour le transport de charge suspendue par câbles, avec estimation adaptative de la masse

41

3arXiv cs.RO

Contrôle géométrique décentralisé pour le transport de charge suspendue par câbles, avec estimation adaptative de la masse

Des chercheurs proposent GPAC (Geometric Payload-Adaptive Control), une architecture de contrôle à quatre couches permettant à N quadricoptères de transporter en coopération une charge suspendue par câbles, sans coordinateur central ni échange de données entre appareils sur l'état des câbles ou les paramètres adaptatifs. L'idée centrale est une coordination implicite : chaque drone estime localement, à partir de ses seules mesures de câble, la part de charge qu'il doit supporter, si bien que la somme des forces converge vers la valeur correcte même sans connaître le nombre total d'agents ni la masse de la charge. Chaque appareil reconstruit également la position du colis à partir de la seule géométrie de son propre câble. La seule communication inter-drones qui subsiste est une diffusion à faible fréquence des positions des voisins, utilisée pour l'évitement de collisions. Le système combine un contrôle géométrique de position et d'attitude opérant directement sur la variété non linéaire SO(3), une régulation anti-oscillation, un observateur à état étendu pour compenser le vent, une estimation de masse par apprentissage concurrent ne nécessitant pas d'excitation persistante, et un filtre de sécurité inspiré des fonctions de barrière de contrôle (CBF), avec des marges de sécurité qui tiennent exactement lorsqu'une seule contrainte est active. Les auteurs démontrent aussi que les corrections de force appliquées par ce filtre préservent la stabilité quasi globale du contrôleur d'attitude. Cette approche s'attaque à un verrou classique du transport aérien coopératif : les architectures existantes exigent généralement une coordination centralisée ou un partage intensif d'informations entre drones (état des câbles, masse estimée), ce qui limite le passage à l'échelle et fragilise le système en cas de perte de communication. En rendant chaque agent autonome dans son estimation de charge et sa perception du colis, GPAC ouvre la voie à des flottes de taille variable, reconfigurables à la volée, pour la logistique aérienne, l'intervention en zone difficile d'accès ou le transport industriel de charges lourdes réparties sur plusieurs porteurs. Les résultats reposent pour l'instant uniquement sur une simulation à haute fidélité intégrant câbles flexibles, fusion de capteurs embarqués et turbulences de vent, avec toutes les boucles de contrôle et d'estimation fermées via l'observateur. L'erreur quadratique moyenne de suivi de trajectoire de la charge atteint 33,8 cm, avec une variabilité de seulement 2,8 % sur 13 graines aléatoires, et un coût de calcul par agent jugé faible. La validation sur drones physiques reste la prochaine étape logique pour confirmer la robustesse de cette coordination purement locale en conditions réelles.

RecherchePaper

1 source

Flow-Opt : optimisation centralisée et scalable de trajectoires multi-robots par flow matching et optimisation différentiable

45

4arXiv cs.RO

Flow-Opt : optimisation centralisée et scalable de trajectoires multi-robots par flow matching et optimisation différentiable

Flow-Opt est une méthode de planification de trajectoires multi-robots publiée sur arXiv (référence 2510.09204v2) qui s'attaque à un verrou connu de la robotique en essaim : l'optimisation centralisée dans l'espace joint de plusieurs robots est théoriquement supérieure (accès à un espace de solutions plus large, trajectoires plus fluides dans les espaces contraints), mais devient informatiquement intractable dès que la flotte dépasse quelques unités. L'approche proposée décompose le problème en deux étapes : un modèle génératif basé sur le flow matching, implémenté via un diffusion transformer (DiT) augmenté d'encodeurs invariants aux permutations pour les positions des robots et la carte, produit des trajectoires candidates ; un Safety-Filter (SF) différentiable, doté d'un réseau de neurones qui prédit une initialisation spécifique au contexte de façon auto-supervisée, garantit ensuite la satisfaction des contraintes à l'inférence. Résultat annoncé : génération de trajectoires pour des dizaines de robots en environnement encombré en quelques dizaines de millisecondes, avec la capacité de résoudre plusieurs dizaines d'instances en parallèle en une fraction de seconde. Ces performances, si elles se confirment hors benchmark contrôlé, changeraient concrètement le dimensionnement des systèmes de gestion de flotte (FMS) pour les AMR en entrepôt ou en environnement industriel. Aujourd'hui, les planificateurs centralisés sont réservés à de petites flottes ou nécessitent des horizons de planification longs ; les approches décentralisées sacrifient l'optimalité globale. Flow-Opt revendique de combler cet écart en rendant le calcul centralisé compatible avec les contraintes temps-réel. La capacité de batching est particulièrement notable : elle permet de traiter des dizaines d'instances simultanément, ce qui ouvre la voie à une planification à re-planification fréquente ou à des architectures de simulation-dans-la-boucle. Il faut cependant noter que les résultats sont présentés sur des benchmarks simulés et que le gap sim-to-real n'est pas adressé dans ce papier. La planification de trajectoires multi-robots centralisée est un problème ouvert depuis les années 2010, avec des travaux fondateurs comme CBS (Conflict-Based Search) et ses dérivés. Les approches par apprentissage profond, notamment les modèles de diffusion appliqués à la planification (DDPM, Score Matching), ont montré des gains de vitesse mais peinaient à garantir la faisabilité des trajectoires produites. Flow-Opt se positionne comme une alternative plus rapide et plus fiable face à ces baselines diffusion, tout en restant dans le registre académique : aucun déploiement industriel n'est annoncé. Les acteurs comme Exotec (Hauts-de-France), qui opère des flottes denses de robots Skypod, ou MiR et Locus Robotics, pourraient être des débouchés naturels si les auteurs industrialisent leur approche. La prochaine étape logique serait une validation sur hardware réel avec des perturbations dynamiques.

UEExotec (Hauts-de-France), opérateur de flottes denses de robots Skypod, est explicitement cité comme débouché naturel si la méthode est industrialisée, ce qui représente un impact potentiel direct sur l'écosystème robotique français.

RecherchePaper

1 source

Transport multi-robots de boîtes sur différentes surfaces avec contrôle proportionnel décentralisé basé sur les rôles

À lire aussi

Adaptation mutuelle dans le co-transport humain-robot avec incertitude sur les préférences humaines

Optimisation riemannienne décentralisée sur graphe de poses pour le SLAM multi-robots basé objets

Contrôle géométrique décentralisé pour le transport de charge suspendue par câbles, avec estimation adaptative de la masse

Flow-Opt : optimisation centralisée et scalable de trajectoires multi-robots par flow matching et optimisation différentiable