Aller au contenu principal
Planification de mouvement de bras robotique par intégrale de chemin prédictive en une étape via les champs de distance dans l'espace de configuration
RecherchearXiv cs.RO4h

Planification de mouvement de bras robotique par intégrale de chemin prédictive en une étape via les champs de distance dans l'espace de configuration

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs propose, dans une prépublication arXiv (2509.00836, troisième révision), un cadre de planification de trajectoire baptisé CDF-MPPI, qui fusionne deux familles d'approches jusqu'ici séparées : les champs de distance en espace de configuration (Configuration Space Distance Fields, CDFs) et la commande par intégrale de chemin à modèle prédictif (Model Predictive Path Integral, MPPI). Appliqué à un bras Franka Emika à 7 degrés de liberté (DOF), le système atteint des fréquences de commande supérieures à 750 Hz tout en maintenant des taux de succès proches de 100 % en environnement 2D et des taux élevés sur des scènes de simulation avec obstacles complexes. L'innovation centrale est la réduction de l'horizon de planification MPPI à un seul pas de temps, rendue possible par l'utilisation des gradients CDF pour exprimer l'ensemble de la fonction de coût directement dans l'espace articulaire du robot.

L'impact pratique de ce résultat touche un verrou bien connu des intégrateurs de cellules robotisées : les méthodes d'optimisation classiques basées sur les champs de distance signée (Signed Distance Fields, SDFs) tombent dans des minima locaux dès que les gradients SDF s'annulent, notamment dans les espaces à haute dimensionnalité ou autour d'obstacles convexes. De leur côté, les approches MPPI échantillonnent massivement des trajectoires candidates, ce qui les rend coûteuses en calcul et difficiles à calibrer (unités physiques hétérogènes dans la fonction de coût). En unifiant le coût en espace articulaire via les gradients CDF et en réduisant l'horizon à un pas, CDF-MPPI supprime à la fois le problème de minima locaux et le surcoût d'échantillonnage, permettant une planification temps-réel à 750 Hz, seuil compatible avec des boucles de contrôle industrielles exigeantes. C'est une démonstration que les CDFs, introduits récemment dans la littérature, offrent un signal de gradient suffisamment robuste pour remplacer les SDFs workspace dans des pipelines de commande réactifs.

Les CDFs ont émergé comme alternative aux SDFs workspace précisément parce qu'ils modélisent les distances directement dans l'espace de configuration du robot, là où la planification a lieu, évitant la projection coûteuse entre espace cartésien et espace articulaire. L'MPPI, popularisé notamment par les travaux de Williams et al. (Georgia Tech) et adopté dans plusieurs pipelines de navigation mobile, était jusqu'ici rarement appliqué à la manipulation à haute fréquence en raison de son coût d'échantillonnage. Le bras Franka Emika (désormais sous l'écosystème Agile Robots après le rachat de Franka Robotics en 2023) est le benchmark de facto de la communauté manipulation. Les concurrents directs de CDF-MPPI incluent les planificateurs à base de TrajOpt (optimisation SDF), les variantes iCEM et STORM côté MPPI, ainsi que les approches par champs de potentiels neuronaux. Les auteurs valident uniquement en simulation pour l'instant ; la prochaine étape attendue est le transfert sim-to-real sur hardware réel, avec les défis habituels de calibration des modèles de contact et de latence réseau.

Impact France/UE

Les laboratoires européens utilisant le bras Franka Emika (désormais sous l'écosystème Agile Robots) pourraient bénéficier de cette méthode de planification temps-réel, mais l'impact reste indirect faute de validation hardware publiée et de code disponible.

Dans nos dossiers

À lire aussi

Commande prédictive par intégrale de chemin informée par objets pour la manipulation robotique sans préhension
1arXiv cs.RO 

Commande prédictive par intégrale de chemin informée par objets pour la manipulation robotique sans préhension

Des chercheurs ont présenté une formulation hiérarchique du contrôle MPPI (Model Predictive Path Integral) appliquée à la manipulation non-préhensile, c'est-à-dire au déplacement d'objets par poussée sans saisie physique. Publiée sur arXiv (référence 2605.30778), la méthode décompose le problème en deux niveaux : un premier plan est calculé en supposant que l'objet peut être actionné directement, puis cette trajectoire sert de référence pour résoudre le problème couplé robot-objet. Les expériences ont été conduites sur un bras xArm6 à 6 degrés de liberté de UFactory, avec pour tâche de pousser un objet vers une cible tout en contournant des obstacles statiques. En simulation, la méthode augmente le taux de succès de 40 % et accélère la fréquence de contrôle de 26 % par rapport à un MPPI standard. Sur matériel réel, le gain de succès atteint 20 % pour un coût de calcul comparable. Cette décomposition hiérarchique répond à un problème fondamental de la planification à long horizon : l'espace de recherche conjoint robot-objet est trop vaste pour être exploré efficacement dans des délais temps-réel. En résolvant d'abord un sous-problème centré sur l'objet, l'algorithme oriente l'échantillonnage stochastique vers des régions prometteuses, réduisant le gaspillage computationnel sans nécessiter de hardware spécialisé. Pour un intégrateur industriel, cela signifie que des tâches impliquant poussées ou réorientations sans préhension deviennent planifiables en temps réel sur des cellules robotiques standard, un verrou qui limitait jusqu'ici l'automatisation de nombreuses opérations de manutention. Le MPPI est une méthode de contrôle prédictif par échantillonnage stochastique introduite par Theodorou et Williams à Georgia Tech, et popularisée en robotique par NVIDIA via ses environnements de simulation. La manipulation non-préhensile reste un domaine actif, avec des contributions récentes de MIT CSAIL, ETH Zurich et Stanford sur la gestion des contacts discontinus. Ce travail reste à ce stade un preprint non évalué par les pairs, et les benchmarks se limitent à des scénarios de poussée en espace plan avec obstacles statiques : des configurations plus complexes, obstacles dynamiques ou objets déformables, n'ont pas été testés.

RecherchePaper
1 source
Fonction de distance signée neurale en espace de configuration pour la planification de trajectoire de bras de préhension
2arXiv cs.RO 

Fonction de distance signée neurale en espace de configuration pour la planification de trajectoire de bras de préhension

Des chercheurs présentent dans un preprint arXiv (2502.16205, version 3) une représentation implicite neurale des obstacles pour la planification de trajectoire des manipulateurs de picking industriels : la nSCDF (neural signed configuration distance function). Ces robots spécialisés, dotés de moins de degrés de liberté que les bras polyvalents, sont massivement déployés en logistique et manufacturing. Le verrou adressé est précis : les planificateurs multi-requêtes à base d'échantillonnage (type PRM, RRT), méthodes de référence industrielle, s'appuient lourdement sur la détection de collision et deviennent inadaptés à la replanification en temps réel. La nSCDF est une fonction neurale calculant la distance signée d'une configuration à l'espace de collision, permettant de construire des "boules" sans collision dans l'espace de configuration. Ces boules remplacent les points dans le graphe du planificateur, qui retourne alors un couloir sans collision exploitable par un solveur de programmation convexe. Les expériences numériques rapportent des trajectoires proches de celles d'un planificateur asymptotiquement optimal (RRT*), obtenues en temps significativement inférieur, sans que l'abstract ne précise de chiffres concrets de speedup. L'enjeu est direct pour les intégrateurs : le rendement des robots de picking dépend critiquement de la vitesse de planification, en particulier dans les environnements semi-structurés où obstacles et pièces varient à chaque cycle. Un planificateur online capable de replanifier à la volée réduit les temps de cycle et supprime le besoin de précomputer des roadmaps statiques. La nSCDF vise à court-circuiter les appels répétés aux moteurs de collision classiques (FCL, Bullet), goulot d'étranglement connu des stacks motion planning. Le résultat clé est d'atteindre une qualité quasi-optimale de trajectoire sans payer le coût computationnel des méthodes asymptotiquement optimales, compromis précisément recherché pour l'intégration en production. Ce travail s'inscrit dans la tendance des représentations implicites neuronales appliquées à la robotique, dans la lignée des champs de distance euclidiens appris (ESDF) et des Neural Distance Fields. Les planificateurs sampling-based classiques restent la référence industrielle mais peinent en contexte online ; des groupes concurrents explorent des approches similaires via politiques d'évitement apprises ou représentations occupancy neuronales. Il s'agit d'un preprint en version 3, ce qui indique plusieurs cycles de révision mais pas encore une publication dans une conférence de référence (ICRA, IROS, RA-L) : les résultats restent à valider par les pairs sur du matériel réel. Aucun partenaire industriel ni déploiement physique n'est mentionné.

UEAvancée en planification de trajectoire en ligne potentiellement utile pour les intégrateurs européens de robots de picking, mais aucun partenariat ni déploiement EU mentionné.

RecherchePaper
1 source
Planification par réseau de neurones en graphe et contrôle prédictif pour la planification de mouvement multi-robots sans étiquettes sous contraintes de communication
3arXiv cs.RO 

Planification par réseau de neurones en graphe et contrôle prédictif pour la planification de mouvement multi-robots sans étiquettes sous contraintes de communication

Une équipe de chercheurs propose, dans un preprint déposé sur arXiv le 25 mai 2026 (arXiv:2605.19209), un framework hiérarchique pour résoudre le problème de planification de mouvement multi-robots sans étiquetage, c'est-à-dire l'assignation simultanée de robots à des objectifs et la génération de trajectoires sûres dans des environnements partagés. Le système combine deux composants : un Graph ATtention Planner (GATP), fondé sur des réseaux de neurones à graphes avec mécanisme d'attention, qui génère des sous-objectifs intermédiaires par coopération entre agents, et un contrôleur NMPC (Nonlinear Model Predictive Controller) décentralisé, exécuté en embarqué sur chaque robot, qui garantit la faisabilité des trajectoires sous dynamiques non-linéaires et contraintes d'actuation réelles. Le framework a été évalué à la fois en simulation et sur des quadrotors physiques. Les auteurs rapportent une tolérance aux délais de communication allant jusqu'à 200 ms, une inférence entièrement décentralisée à bord, et une meilleure généralisation à des équipes de taille croissante. Ce travail s'attaque directement au gouffre sim-to-real qui mine la plupart des approches GNN appliquées à la robotique multi-agents : les méthodes existantes supposent des dynamiques simplifiées et un environnement de simulation idéalisé, ce qui les rend fragiles en conditions réelles. En couplant un planificateur neuronal décentralisé à un contrôleur à modèle prédictif, le framework maintient les propriétés de scalabilité des GNN tout en imposant des garanties de sécurité physiques que les approches purement apprises ne fournissent pas. La robustesse aux délais de communication est particulièrement significative pour les déploiements en entrepôts ou en milieu industriel, où les réseaux sans fil ne sont jamais idéaux. Cette contribution s'inscrit dans un corpus actif de recherche sur les GNN pour la coordination multi-robots, aux côtés de travaux comme MAGAT ou DAN, qui visent à remplacer les solveurs centralisés classiques (MILP, CBS) par des approches distribuées passant à l'échelle. Le preprint n'est pas encore soumis à une revue avec comité de lecture, et aucun déploiement industriel ni partenariat n'est annoncé : il s'agit d'une validation expérimentale académique sur quadrotors, prometteuse mais à consolider. Les prochaines étapes naturelles seraient des expériences sur flottes plus larges et des robots à dynamiques plus complexes, comme des manipulateurs mobiles ou des AMR en environnement entrepôt.

RecherchePaper
1 source
Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements
4arXiv cs.RO 

Optimisation des arbres de trajectoires dans l'espace des croyances : de la commande prédictive à la planification de tâches et de mouvements

Des chercheurs proposent, dans un preprint arXiv soumis début mai 2026 (arXiv:2605.01860), de planifier des trajectoires arborescentes (trajectory-trees) dans l'espace des croyances (belief space) plutôt que les trajectoires séquentielles classiques. Quand un robot évolue en environnement partiellement observable, la trajectoire optimale dépend d'observations futures encore inconnues: les trajectory-trees branchent à chaque point où l'état de croyance est susceptible de diverger en scénarios distincts. Le papier présente deux contributions: un contrôleur prédictif partiellement observable (PO-MPC) à branchement unique, optimisé par un algorithme parallélisé baptisé D-AuLa (Distributed Augmented Lagrangian) conçu pour satisfaire les contraintes temps-réel du MPC; et un planificateur tâche-et-mouvement (PO-LGP) combinant arbres de décision symboliques et trajectory-trees cinématiques, en étendant le cadre Logic-Geometric-Programming (LGP) aux problèmes partiellement observables. Les validations expérimentales portent sur la conduite autonome pour le MPC et des scénarios de manipulation robotique pour le TAMP. L'enjeu industriel est direct: les environnements réels sont rarement entièrement observables. Un bras triant des pièces dont l'orientation n'est connue qu'après préhension, ou un AGV naviguant en zone d'incertitude sensorielle, nécessitent précisément ce type de planification contingente. Les trajectoires séquentielles obligent le robot à choisir un plan unique à l'avance, ce qui se traduit par des comportements sous-optimaux ou des replanifications coûteuses. L'approche PO-MPC réduit les coûts de contrôle en anticipant les branches d'observation possibles; PO-LGP génère des politiques d'exploration utilisables comme macro-actions dans un plan global. D-AuLa répond à l'objection classique contre la planification en espace de croyance: sa complexité computationnelle prohibitive pour le temps-réel, en exploitant la décomposabilité du problème pour paralléliser l'optimisation. Le cadre LGP étendu par ces travaux a été développé par le groupe de Marc Toussaint (TU Berlin), et constitue l'une des approches TAMP les plus rigoureuses pour la manipulation multi-étapes. La planification en POMDP (Partially Observable Markov Decision Processes) est un domaine actif depuis les années 1990, mais son couplage avec le contrôle continu et la planification symbolique reste un défi ouvert. Des approches concurrentes basées sur l'apprentissage par renforcement (notamment les méthodes VLA et politiques diffusion) ou sur des planificateurs sampling-based adressent des problèmes voisins avec des compromis différents en matière de généralisation et de garanties formelles. Les auteurs reconnaissent eux-mêmes que la méthode est validée sur des belief states de taille restreinte et exclusivement en simulation; la prochaine étape naturelle est une validation hardware sur robots réels avec perception embarquée et latences de capteurs.

UELes travaux étendent le cadre LGP développé par le groupe de Marc Toussaint à TU Berlin, consolidant le leadership académique européen en planification tâche-et-mouvement rigoureuse pour la manipulation robotique multi-étapes.

RecherchePaper
1 source