RecherchearXiv cs.RO 16 juin 2026

Planification de mouvement de bras robotique par intégrale de chemin prédictive en une étape via les champs de distance dans l'espace de configuration

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Une équipe de chercheurs propose, dans une prépublication arXiv (2509.00836, troisième révision), un cadre de planification de trajectoire baptisé CDF-MPPI, qui fusionne deux familles d'approches jusqu'ici séparées : les champs de distance en espace de configuration (Configuration Space Distance Fields, CDFs) et la commande par intégrale de chemin à modèle prédictif (Model Predictive Path Integral, MPPI). Appliqué à un bras Franka Emika à 7 degrés de liberté (DOF), le système atteint des fréquences de commande supérieures à 750 Hz tout en maintenant des taux de succès proches de 100 % en environnement 2D et des taux élevés sur des scènes de simulation avec obstacles complexes. L'innovation centrale est la réduction de l'horizon de planification MPPI à un seul pas de temps, rendue possible par l'utilisation des gradients CDF pour exprimer l'ensemble de la fonction de coût directement dans l'espace articulaire du robot.

L'impact pratique de ce résultat touche un verrou bien connu des intégrateurs de cellules robotisées : les méthodes d'optimisation classiques basées sur les champs de distance signée (Signed Distance Fields, SDFs) tombent dans des minima locaux dès que les gradients SDF s'annulent, notamment dans les espaces à haute dimensionnalité ou autour d'obstacles convexes. De leur côté, les approches MPPI échantillonnent massivement des trajectoires candidates, ce qui les rend coûteuses en calcul et difficiles à calibrer (unités physiques hétérogènes dans la fonction de coût). En unifiant le coût en espace articulaire via les gradients CDF et en réduisant l'horizon à un pas, CDF-MPPI supprime à la fois le problème de minima locaux et le surcoût d'échantillonnage, permettant une planification temps-réel à 750 Hz, seuil compatible avec des boucles de contrôle industrielles exigeantes. C'est une démonstration que les CDFs, introduits récemment dans la littérature, offrent un signal de gradient suffisamment robuste pour remplacer les SDFs workspace dans des pipelines de commande réactifs.

Les CDFs ont émergé comme alternative aux SDFs workspace précisément parce qu'ils modélisent les distances directement dans l'espace de configuration du robot, là où la planification a lieu, évitant la projection coûteuse entre espace cartésien et espace articulaire. L'MPPI, popularisé notamment par les travaux de Williams et al. (Georgia Tech) et adopté dans plusieurs pipelines de navigation mobile, était jusqu'ici rarement appliqué à la manipulation à haute fréquence en raison de son coût d'échantillonnage. Le bras Franka Emika (désormais sous l'écosystème Agile Robots après le rachat de Franka Robotics en 2023) est le benchmark de facto de la communauté manipulation. Les concurrents directs de CDF-MPPI incluent les planificateurs à base de TrajOpt (optimisation SDF), les variantes iCEM et STORM côté MPPI, ainsi que les approches par champs de potentiels neuronaux. Les auteurs valident uniquement en simulation pour l'instant ; la prochaine étape attendue est le transfert sim-to-real sur hardware réel, avec les défis habituels de calibration des modèles de contact et de latence réseau.

Impact France/UE

Les laboratoires européens utilisant le bras Franka Emika (désormais sous l'écosystème Agile Robots) pourraient bénéficier de cette méthode de planification temps-réel, mais l'impact reste indirect faute de validation hardware publiée et de code disponible.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

Commande prédictive par intégrale de chemin informée par objets pour la manipulation robotique sans préhension

Des chercheurs ont présenté une formulation hiérarchique du contrôle MPPI (Model Predictive Path Integral) appliquée à la manipulation non-préhensile, c'est-à-dire au déplacement d'objets par poussée sans saisie physique. Publiée sur arXiv (référence 2605.30778), la méthode décompose le problème en deux niveaux : un premier plan est calculé en supposant que l'objet peut être actionné directement, puis cette trajectoire sert de référence pour résoudre le problème couplé robot-objet. Les expériences ont été conduites sur un bras xArm6 à 6 degrés de liberté de UFactory, avec pour tâche de pousser un objet vers une cible tout en contournant des obstacles statiques. En simulation, la méthode augmente le taux de succès de 40 % et accélère la fréquence de contrôle de 26 % par rapport à un MPPI standard. Sur matériel réel, le gain de succès atteint 20 % pour un coût de calcul comparable. Cette décomposition hiérarchique répond à un problème fondamental de la planification à long horizon : l'espace de recherche conjoint robot-objet est trop vaste pour être exploré efficacement dans des délais temps-réel. En résolvant d'abord un sous-problème centré sur l'objet, l'algorithme oriente l'échantillonnage stochastique vers des régions prometteuses, réduisant le gaspillage computationnel sans nécessiter de hardware spécialisé. Pour un intégrateur industriel, cela signifie que des tâches impliquant poussées ou réorientations sans préhension deviennent planifiables en temps réel sur des cellules robotiques standard, un verrou qui limitait jusqu'ici l'automatisation de nombreuses opérations de manutention. Le MPPI est une méthode de contrôle prédictif par échantillonnage stochastique introduite par Theodorou et Williams à Georgia Tech, et popularisée en robotique par NVIDIA via ses environnements de simulation. La manipulation non-préhensile reste un domaine actif, avec des contributions récentes de MIT CSAIL, ETH Zurich et Stanford sur la gestion des contacts discontinus. Ce travail reste à ce stade un preprint non évalué par les pairs, et les benchmarks se limitent à des scénarios de poussée en espace plan avec obstacles statiques : des configurations plus complexes, obstacles dynamiques ou objets déformables, n'ont pas été testés.

RecherchePaper

1 source

2arXiv cs.RO

Fonction de distance signée neurale en espace de configuration pour la planification de trajectoire de bras de préhension

Des chercheurs présentent dans un preprint arXiv (2502.16205, version 3) une représentation implicite neurale des obstacles pour la planification de trajectoire des manipulateurs de picking industriels : la nSCDF (neural signed configuration distance function). Ces robots spécialisés, dotés de moins de degrés de liberté que les bras polyvalents, sont massivement déployés en logistique et manufacturing. Le verrou adressé est précis : les planificateurs multi-requêtes à base d'échantillonnage (type PRM, RRT), méthodes de référence industrielle, s'appuient lourdement sur la détection de collision et deviennent inadaptés à la replanification en temps réel. La nSCDF est une fonction neurale calculant la distance signée d'une configuration à l'espace de collision, permettant de construire des "boules" sans collision dans l'espace de configuration. Ces boules remplacent les points dans le graphe du planificateur, qui retourne alors un couloir sans collision exploitable par un solveur de programmation convexe. Les expériences numériques rapportent des trajectoires proches de celles d'un planificateur asymptotiquement optimal (RRT*), obtenues en temps significativement inférieur, sans que l'abstract ne précise de chiffres concrets de speedup. L'enjeu est direct pour les intégrateurs : le rendement des robots de picking dépend critiquement de la vitesse de planification, en particulier dans les environnements semi-structurés où obstacles et pièces varient à chaque cycle. Un planificateur online capable de replanifier à la volée réduit les temps de cycle et supprime le besoin de précomputer des roadmaps statiques. La nSCDF vise à court-circuiter les appels répétés aux moteurs de collision classiques (FCL, Bullet), goulot d'étranglement connu des stacks motion planning. Le résultat clé est d'atteindre une qualité quasi-optimale de trajectoire sans payer le coût computationnel des méthodes asymptotiquement optimales, compromis précisément recherché pour l'intégration en production. Ce travail s'inscrit dans la tendance des représentations implicites neuronales appliquées à la robotique, dans la lignée des champs de distance euclidiens appris (ESDF) et des Neural Distance Fields. Les planificateurs sampling-based classiques restent la référence industrielle mais peinent en contexte online ; des groupes concurrents explorent des approches similaires via politiques d'évitement apprises ou représentations occupancy neuronales. Il s'agit d'un preprint en version 3, ce qui indique plusieurs cycles de révision mais pas encore une publication dans une conférence de référence (ICRA, IROS, RA-L) : les résultats restent à valider par les pairs sur du matériel réel. Aucun partenaire industriel ni déploiement physique n'est mentionné.

UEAvancée en planification de trajectoire en ligne potentiellement utile pour les intégrateurs européens de robots de picking, mais aucun partenariat ni déploiement EU mentionné.

RecherchePaper

1 source

3arXiv cs.RO

Planification réactive de mouvement 3D pour un bras Franka via remodelage de l'espace de travail en étoile

Des chercheurs proposent une méthode de retraitement géométrique de l'espace de travail, baptisée "Star-World reshaping", pour la planification de mouvement réactive d'un bras Franka Emika Panda en trois dimensions. Le problème visé : quand la marge de sécurité autour des obstacles est gonflée pour éviter les collisions, les zones inflées finissent par se chevaucher, ce qui casse l'hypothèse d'obstacles disjoints sur laquelle reposent de nombreux planificateurs réactifs par modulation. La méthode regroupe à chaque mise à jour les obstacles inflés qui se chevauchent et les remplace par des formes en étoile ("star-shaped proxies"), avant qu'un contrôleur d'effecteur basé sur un système dynamique n'évalue la trajectoire ; un terme de champ de potentiel artificiel dans l'espace nul gère en complément l'évitement du bras lui-même. Testée sur six scénarios PyBullet et 12 essais, l'approche atteint l'objectif dans cinq cas sur six, contre quatre sur six pour la méthode sans retraitement, avec un temps de calcul de 0,68 à 8,70 millisecondes par mise à jour pour des scènes comportant un à sept obstacles. L'intérêt pour la robotique industrielle est ciblé : la planification réactive en temps réel reste un point dur pour les bras manipulateurs évoluant en environnement encombré, notamment en cellule collaborative où les marges de sécurité imposées par les normes créent justement ce type de chevauchements. Mais les auteurs eux-mêmes tempèrent la portée du résultat : l'évaluation reste préliminaire, avec seulement 12 essais, une augmentation de la longueur des trajectoires générées, l'apparition de quasi-équilibres bloquants dans deux scénarios, et un cas où le regroupement trop agressif des obstacles ferme un couloir de passage pourtant navigable. Autrement dit, la méthode gagne en robustesse sur le cas canonique du "mur qui se chevauche" mais introduit de nouveaux modes d'échec. Ce travail s'inscrit dans la lignée des planificateurs réactifs par modulation dérivés de la théorie des champs de vitesse ("dynamical systems"), historiquement validés en 2D et dont le passage à la 3D sur manipulateur redondant reste un défi ouvert. Aucun acteur industriel n'est cité : il s'agit d'une publication de recherche amont, sans annonce de produit ni de déploiement. Les auteurs présentent leurs résultats comme une preuve de concept montrant à la fois le potentiel et les limites pratiques du transfert des garanties théoriques du Star-World, initialement pensées pour la géométrie de l'espace de travail, à un bras contrôlé par cinématique inverse.

RecherchePaper

1 source

4arXiv cs.RO

Planification par réseau de neurones en graphe et contrôle prédictif pour la planification de mouvement multi-robots sans étiquettes sous contraintes de communication

Une équipe de chercheurs propose, dans un preprint déposé sur arXiv le 25 mai 2026 (arXiv:2605.19209), un framework hiérarchique pour résoudre le problème de planification de mouvement multi-robots sans étiquetage, c'est-à-dire l'assignation simultanée de robots à des objectifs et la génération de trajectoires sûres dans des environnements partagés. Le système combine deux composants : un Graph ATtention Planner (GATP), fondé sur des réseaux de neurones à graphes avec mécanisme d'attention, qui génère des sous-objectifs intermédiaires par coopération entre agents, et un contrôleur NMPC (Nonlinear Model Predictive Controller) décentralisé, exécuté en embarqué sur chaque robot, qui garantit la faisabilité des trajectoires sous dynamiques non-linéaires et contraintes d'actuation réelles. Le framework a été évalué à la fois en simulation et sur des quadrotors physiques. Les auteurs rapportent une tolérance aux délais de communication allant jusqu'à 200 ms, une inférence entièrement décentralisée à bord, et une meilleure généralisation à des équipes de taille croissante. Ce travail s'attaque directement au gouffre sim-to-real qui mine la plupart des approches GNN appliquées à la robotique multi-agents : les méthodes existantes supposent des dynamiques simplifiées et un environnement de simulation idéalisé, ce qui les rend fragiles en conditions réelles. En couplant un planificateur neuronal décentralisé à un contrôleur à modèle prédictif, le framework maintient les propriétés de scalabilité des GNN tout en imposant des garanties de sécurité physiques que les approches purement apprises ne fournissent pas. La robustesse aux délais de communication est particulièrement significative pour les déploiements en entrepôts ou en milieu industriel, où les réseaux sans fil ne sont jamais idéaux. Cette contribution s'inscrit dans un corpus actif de recherche sur les GNN pour la coordination multi-robots, aux côtés de travaux comme MAGAT ou DAN, qui visent à remplacer les solveurs centralisés classiques (MILP, CBS) par des approches distribuées passant à l'échelle. Le preprint n'est pas encore soumis à une revue avec comité de lecture, et aucun déploiement industriel ni partenariat n'est annoncé : il s'agit d'une validation expérimentale académique sur quadrotors, prometteuse mais à consolider. Les prochaines étapes naturelles seraient des expériences sur flottes plus larges et des robots à dynamiques plus complexes, comme des manipulateurs mobiles ou des AMR en environnement entrepôt.

RecherchePaper

1 source