Aller au contenu principal
Planification de mouvements par échantillonnage sur variétés riemanniennes avec conscience géométrique
RecherchearXiv cs.RO3h

Planification de mouvements par échantillonnage sur variétés riemanniennes avec conscience géométrique

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (arXiv:2602.00992) un cadre de planification de mouvement par échantillonnage opérant directement sur des variétés riemanniennes, adressant une limitation fondamentale des planificateurs classiques : l'usage de distances euclidiennes dans des espaces de configuration à géométrie non euclidienne. La contribution centrale est une approximation par point médian de la distance géodésique riemannienne, dont les auteurs prouvent la convergence au troisième ordre vers la distance réelle. Un planificateur local complète le système en traçant la variété via des rétractions du premier ordre guidées par des gradients naturels riemanniens. Les validations portent sur un bras plan à deux degrés de liberté, un manipulateur Franka à 7-DoF sous métrique d'énergie cinétique, et la planification de corps rigides dans SE(2) avec contraintes non holonomes. Dans chaque cas, l'approche produit des trajectoires de coût inférieur aux planificateurs euclidiens et aux solveurs géodésiques numériques de référence.

L'enjeu industriel est direct : pour les bras manipulateurs redondants (6-DoF et plus), les métriques d'énergie cinétique ou de manipulabilité définissent une géométrie non euclidienne que les RRT et RRT* standards ignorent, produisant des trajectoires sous-optimales en énergie et en usure des actionneurs. Ce travail comble le fossé entre deux familles de méthodes : les solveurs géodésiques numériques, fidèles géométriquement mais peu scalables en haute dimension, et les planificateurs par échantillonnage, efficaces mais géométriquement naïfs. La preuve de convergence au troisième ordre est un apport théorique solide ; les expériences restent cependant limitées à 2 et 7-DoF, et la tenue à l'échelle sur des systèmes corps entier (20-DoF et plus) n'est pas encore démontrée.

La planification géodésique n'est pas une idée nouvelle : CHOMP et les méthodes de Gaussian Process Motion Planning avaient déjà exploité des métriques tâche-espace, mais dans des cadres d'optimisation sans garanties de complétude probabiliste. Ce travail se distingue en intégrant la géométrie riemannienne dans le paradigme par échantillonnage (famille RRT/PRM), ce qui offre des garanties de complétude asymptotique. Les concurrents directs incluent les variantes RRT* à métriques personnalisées et les planificateurs sur graphes de visibilité riemanniens. La suite logique serait une validation sur des manipulateurs industriels courants (Universal Robots, KUKA iiwa) et une intégration dans MoveIt 2 ou NVIDIA Isaac/Lula, deux prérequis pour une adoption réelle en production.

Dans nos dossiers

À lire aussi

Planification de mouvement "suivre le chef" par échantillonnage pour robots continus montés sur manipulateur
1arXiv cs.RO 

Planification de mouvement "suivre le chef" par échantillonnage pour robots continus montés sur manipulateur

Des chercheurs du Continuum Robotics Lab (Université de Toronto) ont publié en mai 2025 sur arXiv (arXiv:2605.11618) un planificateur de mouvement par échantillonnage pour robots continuums (CR) montés sur bras manipulateurs. Le principe exploité, dit "follow-the-leader" (FTL), consiste à faire retracer au corps du robot la trajectoire exacte de son extrémité distale, permettant de naviguer dans des espaces confinés sans collision. L'innovation clé est de découpler la recherche de forme globale du calcul de pose de base via une construction géométrique analytique fermée, éliminant toute optimisation itérative en ligne. Validé sur 120 chemins simulés répartis en trois classes de test, le système atteint 0 % d'erreur d'extrémité distale, 1,9 % d'écart de forme moyen (normalisé par la longueur du robot) et 100 % de taux de succès. Une validation matérielle sur un CR à tendons de 6 DOF monté sur manipulateur série confirme la faisabilité pratique. L'apport principal est de lever un verrou structurel : toutes les méthodes FTL antérieures supposaient une base fixe ou un mécanisme d'insertion à un seul DOF. En autorisant une pose de base pleinement actionnée dans SE(3), le problème devient couplé et combinatoirement difficile. En déportant la majorité du calcul hors ligne, l'approche permet une planification en quasi-temps réel sur des plateformes industrielles réelles. Les garanties théoriques formelles (complétude de la recherche de forme, convergence du suivi de waypoints) facilitent la certification de sécurité, ce qui intéresse directement les intégrateurs en robotique chirurgicale ou en inspection d'infrastructures. Bémol notable : les temps de planification effectifs ne sont pas rapportés dans l'abstract, et la généralisation au-delà des trois classes de chemins testés reste à démontrer. Les robots continuums, structures flexibles sans articulations rigides discrètes, sont étudiés depuis les années 2000 pour la chirurgie minimalement invasive, l'inspection de turbines et l'exploration de conduits étroits. Le Continuum Robotics Lab compte parmi les équipes de référence mondiales, aux côtés du groupe Webster III (Vanderbilt) et de l'Université de Leeds. En Europe, des acteurs comme Surgivisio et des projets ANR autour des cathéters robotisés contribuent également au domaine. Ce travail s'inscrit dans la tendance d'intégration des CR sur bras polyarticulés pour dépasser les limitations des plateformes à base fixe. Le code source et les visualisations sont publiés en open source sur la page du laboratoire, facilitant la réplication indépendante.

UELes intégrateurs européens en robotique chirurgicale, dont la startup française Surgivisio et les projets ANR sur cathéters robotisés, pourraient exploiter ce planificateur open source pour franchir le verrou de la base mobile sur leurs plateformes de développement.

RecherchePaper
1 source
SBAMP : planification de mouvement adaptative par échantillonnage
2arXiv cs.RO 

SBAMP : planification de mouvement adaptative par échantillonnage

Des chercheurs ont publié sur arXiv (référence 2511.12022, version 3) un cadre hybride de planification de mouvement baptisé SBAMP (Sampling-Based Adaptive Motion Planning), conçu pour les robots autonomes évoluant dans des environnements dynamiques. L'approche fusionne un planificateur global basé sur RRT (Rapidly-exploring Random Tree star), qui génère des trajectoires quasi-optimales, avec un contrôleur local de type SEDS (Stable Estimator of Dynamical Systems) intégrant une optimisation sous contraintes en temps réel. Ce qui distingue SBAMP des implémentations SEDS classiques : aucune donnée d'entraînement préalable n'est requise, le contrôleur s'ajuste à la volée via une optimisation contrainte légère directement embarquée dans la boucle de contrôle. Les expériences ont été menées à la fois en simulation et sur une plateforme matérielle RoboRacer, avec des tests de récupération après perturbations, de contournement d'obstacles et de tenue de performance en conditions dynamiques. L'enjeu technique adressé est fondamental en robotique mobile : les planificateurs globaux comme RRT produisent de bonnes trajectoires hors ligne mais peinent à réagir aux perturbations en temps réel, tandis que les approches à systèmes dynamiques comme SEDS offrent une réactivité fluide mais nécessitent une optimisation offline sur données. SBAMP propose un compromis opérationnel : la structure de chemin global est préservée, mais le robot peut s'en écarter localement de manière stable au sens de Lyapunov, ce qui garantit la convergence vers l'objectif sans oscillations incontrôlées. Pour un intégrateur industriel ou un développeur de systèmes de navigation, l'absence de phase de pré-entraînement réduit significativement le coût de déploiement sur de nouveaux environnements. Il convient de noter que les résultats présentés restent au stade académique, sur une plateforme de recherche compacte, sans validation à l'échelle industrielle ni benchmark comparatif public. SBAMP s'inscrit dans un champ de recherche dense sur la planification hybride, aux côtés de travaux récents comme MPPI (Model Predictive Path Integral) ou TEB (Timed Elastic Band), qui visent tous à réconcilier optimalité globale et réactivité locale. RRT* est un algorithme établi depuis les travaux de Karaman et Frakcas (2011), et SEDS est utilisé en robotique depuis une décennie pour la reproduction de gestes appris. La contribution de SBAMP réside dans leur couplage sans supervision, un point non trivial. Les auteurs n'annoncent pas de transfert industriel immédiat ni de partenariat commercial, et la prochaine étape naturelle serait une validation sur robots à plus haute dynamique (manipulateurs, AMR en entrepôt) et dans des environnements avec obstacles mobiles denses.

RecherchePaper
1 source
E²DT : Decision Transformer efficace avec échantillonnage guidé par l'expérience pour la manipulation robotique
3arXiv cs.RO 

E²DT : Decision Transformer efficace avec échantillonnage guidé par l'expérience pour la manipulation robotique

Une équipe de chercheurs a publié en mai 2026 sur arXiv (référence 2605.00159) un nouveau cadre d'apprentissage par renforcement pour la manipulation robotique, baptisé E²DT (Efficient and Effective Decision Transformer). Le système s'appuie sur l'architecture Decision Transformer (DT), qui traite l'apprentissage par renforcement comme un problème de modélisation de séquences, et y intègre un mécanisme de sélection d'expériences fondé sur un k-Processus Ponctuel Déterminantal (k-DPP). Concrètement, E²DT remplace le replay uniforme standard par un échantillonnage guidé combinant trois critères : le retour cumulatif attendu (return-to-go, RTG), l'incertitude prédictive du modèle, et la représentativité des phases de la tâche via une fréquence inverse. La méthode est évaluée sur des benchmarks de manipulation robotique en simulation et sur robot réel, et surpasse systématiquement les approches antérieures, selon les auteurs. Le problème adressé est concret et bien connu des équipes de R&D : le Decision Transformer standard tire ses trajectoires d'entraînement de façon uniforme depuis le replay buffer, ce qui aboutit à une mauvaise efficacité d'échantillonnage, une exploration limitée et une convergence sous-optimale, particulièrement pénalisant sur des tâches à long horizon où les transitions rares sont décisives. E²DT propose un noyau joint qualité-diversité qui force le modèle à sélectionner activement les expériences les plus informatives, en mesurant la diversité via les embeddings latents internes du DT lui-même. Pour les intégrateurs industriels travaillant sur des bras manipulateurs ou des cellules robotisées, cela ouvre un chemin vers des politiques robustes avec moins de données de démonstration, réduisant potentiellement les cycles de mise en production. Le Decision Transformer, introduit par Chen et al. en 2021, a rapidement été adopté comme référence dans de nombreux travaux de manipulation. Ses faiblesses liées au replay passif ont déjà motivé des variantes comme l'Online Decision Transformer ou des approches à experience replay prioritaire (PER). E²DT s'inscrit dans cette lignée en combinant diversité et qualité composite dans un unique cadre d'échantillonnage. Aucune affiliation industrielle ni timeline de déploiement n'est mentionnée dans le preprint : il s'agit d'une contribution académique, sans produit ni partenariat annoncé à ce stade.

RecherchePaper
1 source
Planification de trajectoires multi-objectifs pour flottes de robots hétérogènes par échantillonnage
4arXiv cs.RO 

Planification de trajectoires multi-objectifs pour flottes de robots hétérogènes par échantillonnage

Une équipe de chercheurs en robotique vient de publier sur arXiv (référence 2503.03509, troisième révision) un ensemble de planificateurs de trajectoires conçus pour coordonner plusieurs robots évoluant simultanément dans un espace de travail partagé, chacun devant atteindre plusieurs objectifs successifs dans des configurations physiques variées. Le problème ciblé, dit "multi-modal multi-robot multi-goal", couvre des scénarios concrets tels que le passage de pièces entre bras robotiques (handover), la navigation avec changements de mode de préhension, ou la coordination de flottes sur des horizons de planification longs. Les planificateurs proposés sont des extensions de méthodes classiques à base d'échantillonnage (de type RRT/PRM) adaptées à l'espace composite de l'ensemble des robots, et sont prouvés probabilistically complete et asymptotically optimal, deux propriétés formelles rarement réunies dans ce contexte. Le code source et le benchmark de validation sont disponibles publiquement. L'apport principal est théorique et algorithmique : les approches existantes pour ce type de problème reposent soit sur la priorisation entre robots (un robot cède le passage à un autre selon un rang fixé), soit sur une hypothèse de complétion synchrone des tâches. Ces simplifications sacrifient à la fois l'optimalité (la solution trouvée n'est pas la meilleure possible) et la complétude (l'algorithme peut rater des solutions valides). En reformulant le problème comme un seul problème centralisé de planification, les auteurs montrent qu'on peut lever ces limitations sans explosion combinatoire, au prix d'une planification dans un espace de dimension élevée. Pour les intégrateurs de cellules robotisées multi-bras ou les concepteurs de systèmes pick-and-place collaboratifs, cela ouvre la voie à des planificateurs de référence plus rigoureux que les heuristiques actuellement déployées en production. Ce travail s'inscrit dans un courant de recherche actif sur la planification multi-robot, aux côtés de travaux comme CBS (Conflict-Based Search) pour les AMR en entrepôt ou les approches de task-and-motion planning (TAMP) développées notamment chez MIT CSAIL, TU Berlin ou dans des labos liés à Boston Dynamics et Intrinsic (Alphabet). La distinction entre planification centralisée et décentralisée reste un axe structurant du domaine : cette contribution penche résolument du côté centralisé, ce qui la rend plus adaptée aux cellules industrielles fixes qu'aux flottes mobiles à grande échelle. La prochaine étape naturelle serait une validation sur hardware réel et une confrontation aux contraintes temps-réel des contrôleurs industriels.

RecherchePaper
1 source