Planification de mouvement vérifiée dans l'espace des t…

Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements

37

1arXiv cs.RO

Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements

Des chercheurs proposent, dans un preprint arXiv soumis début mai 2026 (arXiv:2605.01860), de planifier des trajectoires arborescentes (trajectory-trees) dans l'espace des croyances (belief space) plutôt que les trajectoires séquentielles classiques. Quand un robot évolue en environnement partiellement observable, la trajectoire optimale dépend d'observations futures encore inconnues: les trajectory-trees branchent à chaque point où l'état de croyance est susceptible de diverger en scénarios distincts. Le papier présente deux contributions: un contrôleur prédictif partiellement observable (PO-MPC) à branchement unique, optimisé par un algorithme parallélisé baptisé D-AuLa (Distributed Augmented Lagrangian) conçu pour satisfaire les contraintes temps-réel du MPC; et un planificateur tâche-et-mouvement (PO-LGP) combinant arbres de décision symboliques et trajectory-trees cinématiques, en étendant le cadre Logic-Geometric-Programming (LGP) aux problèmes partiellement observables. Les validations expérimentales portent sur la conduite autonome pour le MPC et des scénarios de manipulation robotique pour le TAMP. L'enjeu industriel est direct: les environnements réels sont rarement entièrement observables. Un bras triant des pièces dont l'orientation n'est connue qu'après préhension, ou un AGV naviguant en zone d'incertitude sensorielle, nécessitent précisément ce type de planification contingente. Les trajectoires séquentielles obligent le robot à choisir un plan unique à l'avance, ce qui se traduit par des comportements sous-optimaux ou des replanifications coûteuses. L'approche PO-MPC réduit les coûts de contrôle en anticipant les branches d'observation possibles; PO-LGP génère des politiques d'exploration utilisables comme macro-actions dans un plan global. D-AuLa répond à l'objection classique contre la planification en espace de croyance: sa complexité computationnelle prohibitive pour le temps-réel, en exploitant la décomposabilité du problème pour paralléliser l'optimisation. Le cadre LGP étendu par ces travaux a été développé par le groupe de Marc Toussaint (TU Berlin), et constitue l'une des approches TAMP les plus rigoureuses pour la manipulation multi-étapes. La planification en POMDP (Partially Observable Markov Decision Processes) est un domaine actif depuis les années 1990, mais son couplage avec le contrôle continu et la planification symbolique reste un défi ouvert. Des approches concurrentes basées sur l'apprentissage par renforcement (notamment les méthodes VLA et politiques diffusion) ou sur des planificateurs sampling-based adressent des problèmes voisins avec des compromis différents en matière de généralisation et de garanties formelles. Les auteurs reconnaissent eux-mêmes que la méthode est validée sur des belief states de taille restreinte et exclusivement en simulation; la prochaine étape naturelle est une validation hardware sur robots réels avec perception embarquée et latences de capteurs.

UELes travaux étendent le cadre LGP développé par le groupe de Marc Toussaint à TU Berlin, consolidant le leadership académique européen en planification tâche-et-mouvement rigoureuse pour la manipulation robotique multi-étapes.

RecherchePaper

1 source

VRA : ancrage de l'accélération articulaire en temps discret dans l'actionnement sous contrainte de tension

38

2arXiv cs.RO

VRA : ancrage de l'accélération articulaire en temps discret dans l'actionnement sous contrainte de tension

Des chercheurs présentent dans un preprint arXiv (2605.10696, mai 2026) une abstraction de contrôle baptisée Voltage-Realizable Acceleration (VRA), destinée à combler un écart entre planification cinématique et exécution matérielle dans les robots à actionneurs électriques. Le problème identifié : les contraintes d'accélération articulaire en temps discret, couramment utilisées pour imposer des limites de position et de vitesse, peuvent générer des commandes cinématiquement valides mais physiquement irréalisables lorsque les actionneurs opèrent sous contrainte de tension. VRA introduit une interface d'accélération au niveau de l'articulation qui restreint les commandes commandées aux seules valeurs réalisables compte tenu des limites de tension effectives. Des expériences sur actionneurs électriques réels et sur un quadrupède roue-patte ont validé l'approche : suppression des accélérations irréalisables, exécution plus cohérente en régime de contrainte proche des limites, et réduction des oscillations induites. L'impact potentiel concerne tout intégrateur travaillant avec des robots à moteurs électriques, humanoïdes, quadrupèdes, bras industriels. Les oscillations liées aux contraintes sont un problème fréquent en déploiement réel, souvent invisible en simulation, ce qui contribue au sim-to-real gap. En formalisant une couche d'abstraction entre le planificateur cinématique et l'actionneur, VRA pourrait améliorer la robustesse des piles de contrôle existantes sans nécessiter de refonte architecturale. La contribution est conceptuelle : elle nomme et corrige un angle mort longtemps ignoré dans les pipelines de contrôle standard. Les contraintes d'accélération en temps discret sont un outil classique depuis les années 2000, mais leur interaction avec les limites physiques des actionneurs électriques modernes, opérés dans des régimes de plus en plus extrêmes, n'avait pas été formalisée à ce niveau d'abstraction. Ce preprint n'est pas encore évalué par les pairs, et les expériences restent limitées à une seule plateforme roue-patte, type ANYbotics ou Unitree. Les suites logiques incluent une intégration dans des piles open source telles que ros2_control et des validations sur des plateformes humanoïdes à haute dynamique.

UEImpact indirect : tout intégrateur européen s'appuyant sur ros2_control ou des piles de contrôle standard pour robots électriques (bras industriels, quadrupèdes, humanoïdes) pourrait bénéficier d'une future intégration de VRA pour réduire les oscillations en régime limite et améliorer la robustesse sim-to-real.

RecherchePaper

1 source

TCBiRRT : planification rapide de mouvement pour manipulateur spatial à deux bras couplés par expansion aléatoire dans l'espace des tâches

41

3arXiv cs.RO

TCBiRRT : planification rapide de mouvement pour manipulateur spatial à deux bras couplés par expansion aléatoire dans l'espace des tâches

Des chercheurs ont publié le 27 mai 2026 sur arXiv (identifiant 2605.27167) un algorithme de planification de mouvement baptisé TCBiRRT (Task-space Constrained Bidirectional Rapidly-exploring Random Tree), conçu pour les manipulateurs spatiaux bi-bras à chaîne cinématique fermée. Le problème visé est concret : lors de l'assemblage orbital de grandes structures spatiales, un bras double qui tient rigidement un objet forme une boucle fermée entre ses deux effecteurs, ce qui réduit drastiquement l'espace de configurations valides. TCBiRRT contourne cette difficulté en effectuant l'échantillonnage aléatoire directement dans l'espace tâche, défini par la pose de l'objet manipulé, plutôt que dans l'espace articulaire de haute dimension. Un algorithme de cinématique inverse sur chemin mappe ensuite chaque noeud tâche vers une trajectoire articulaire continue, intégré dans un cadre RRT bidirectionnel avec mécanisme de re-saisie. Les simulations portent sur plusieurs scénarios d'assemblage orbital à complexité environnementale variable. Les résultats annoncés sont significatifs sur le plan algorithmique : taux de succès nettement supérieurs et temps de planification améliorés de plusieurs ordres de grandeur par rapport aux planificateurs de référence. Pour un intégrateur travaillant sur des systèmes robotiques orbitaux, cela se traduit par des fenêtres d'action plus courtes et une meilleure fiabilité dans des environnements encombrés, pièces de structure, équipements déjà déployés. Il faut cependant souligner que tous les résultats reposent exclusivement sur simulation ; aucun test en microgravité réelle ni sur prototype physique n'est rapporté à ce stade. Le gap sim-to-real reste donc entier, question centrale pour toute qualification de vol. La planification de mouvement sous contraintes de chaîne fermée est un problème ancien en robotique, mais son application aux manipulateurs orbitaux bi-bras, type Canadarm2 ou les projets plus récents de bras d'assemblage pour les stations lunaires Gateway et les futures plateformes LEO commerciales, redevient stratégique. Côté concurrence algorithmique, les approches existantes (CBiRRT, planificateurs config-space classiques) peinent à passer à l'échelle dans des environnements complexes : c'est précisément ce verrou que TCBiRRT prétend lever. Aucun lien industriel ni partenariat agence spatiale n'est mentionné dans le préprint ; les prochaines étapes naturelles seraient une validation matérielle et une intégration dans des simulateurs de référence comme NASA's RSVP ou ESA's VREP.

UEAucun partenariat institutionnel européen confirmé, mais l'ESA VREP est cité comme cible d'intégration naturelle pour une validation future, ce qui représente un intérêt indirect pour les projets orbitaux européens (Gateway, stations LEO commerciales).

RecherchePaper

1 source

Robots mobiles et planification de mouvement multi-robots dans le temps et l'espace basée sur la recherche sur des graphes d'ensembles convexes espace-temps

44

4arXiv cs.RO

Robots mobiles et planification de mouvement multi-robots dans le temps et l'espace basée sur la recherche sur des graphes d'ensembles convexes espace-temps

Des chercheurs publient sur arXiv (2607.00444, prétirage non encore relu par les pairs) un nouveau cadre algorithmique pour la planification de trajectoires spatio-temporelles, baptisé ST-GCS pour "graphs of space-time convex sets". L'idée centrale est de représenter les régions sans collision, qui évoluent dans le temps, comme des ensembles convexes dans un espace incluant le temps, et de transformer la recherche de trajectoire optimale en un problème de recherche de graphe. Les auteurs développent un solveur best-first qui évalue des chemins partiels via optimisation continue de trajectoire, guidé par des heuristiques admissibles et des tests de dominance. Ils ajoutent un schéma de décomposition convexe exacte (ECD) pour réserver les occupations de trajectoire dans l'espace-temps, ce qui permet de traiter de façon unifiée les obstacles dynamiques et les interactions entre robots. Pour le multi-robot, la méthode s'appuie sur une planification priorisée combinée à un mécanisme de coordination par fenêtres glissantes. Les expériences annoncées montrent des accélérations substantielles par rapport à divers planificateurs existants, avec une qualité de solution maintenue, notamment dans des environnements aux passages étroits et transitoires. Une démonstration à grande échelle affiche des instances jusqu'à 100 robots résolues en quelques minutes. Pour l'industrie de la logistique et des flottes de robots mobiles autonomes (AMR), ce type d'approche cible un problème très concret: coordonner un grand nombre de robots dans des entrepôts ou usines où l'espace libre change constamment au passage d'autres machines, de portes ou de zones de chargement. Les méthodes actuelles de planification multi-robot peinent souvent à passer à l'échelle sans sacrifier soit le temps de calcul, soit l'optimalité des trajectoires. Un gain de vitesse démontré sur 100 robots en quelques minutes, si confirmé en conditions réelles au-delà du banc d'essai académique, intéresserait directement les intégrateurs de flottes AMR type Exotec ou les opérateurs d'entrepôts automatisés, où la densité de robots et les couloirs étroits sont justement le goulot d'étranglement actuel. Ce travail s'inscrit dans la lignée des "graphs of convex sets" (GCS), une famille de méthodes de planification de mouvement en robotique qui gagne en popularité pour unifier optimisation continue et recherche discrète, en concurrence avec les approches classiques par échantillonnage (RRT, PRM) ou par programmation en nombres entiers mixtes pour la coordination multi-robot. L'étendre à la dimension spatio-temporelle, avec obstacles mobiles et fenêtres de coordination, est présenté comme la contribution principale. Le code et les détails sont disponibles sur la page du projet; à ce stade, il s'agit d'un résultat de recherche, sans annonce de déploiement industriel ni de partenaire commercial identifié.

UELes intégrateurs de flottes AMR européens comme Exotec pourraient s'intéresser à cette méthode pour la coordination de robots en entrepôt, mais aucun déploiement ou partenariat n'est confirmé à ce stade.

RecherchePaper

1 source

Planification de mouvement vérifiée dans l'espace des tâches sous contraintes articulaires

À lire aussi

Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements

VRA : ancrage de l'accélération articulaire en temps discret dans l'actionnement sous contrainte de tension

TCBiRRT : planification rapide de mouvement pour manipulateur spatial à deux bras couplés par expansion aléatoire dans l'espace des tâches

Robots mobiles et planification de mouvement multi-robots dans le temps et l'espace basée sur la recherche sur des graphes d'ensembles convexes espace-temps