Aller au contenu principal
RecherchearXiv cs.RO47min

Planification de mouvements sûre sous perturbations inconnues, avec garanties formelles

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (arXiv:2605.26625) un algorithme de planification de mouvement par échantillonnage qui garantit formellement la sûreté de systèmes robotiques soumis à des perturbations aléatoires dont la distribution est inconnue. L'approche s'applique aux robots à dynamique linéaire ou linéarisable évoluant dans des environnements encombrés avec des obstacles de forme arbitraire, sous contraintes d'état et de commande. La sûreté est formulée comme des chance-constraints (contraintes probabilistes), et l'algorithme apprend depuis des trajectoires observées un "tube d'ambiguïté de Wasserstein", une séquence d'ensembles d'ambiguïté qui contient, avec haute confiance, la distribution d'état réelle du système. Ce tube est ensuite intégré dans un arbre de planification probabilistiquement complet. Les auteurs introduisent également un vérificateur de validité basé sur les bandits multi-bras qui accélère significativement les performances empiriques sans compromettre la complétude. Les cas d'étude montrent que l'algorithme trouve des trajectoires valides dans des environnements denses sous des seuils de sécurité stricts, surpassant les méthodes de référence actuelles.

L'enjeu pratique est considérable pour les intégrateurs de robots industriels et les équipes d'autonomie : la plupart des planificateurs de mouvement existants supposent soit une distribution de bruit connue (hypothèse souvent irréaliste), soit ignorent les perturbations stochastiques au profit de marges de sécurité conservatives et figées. Cette méthode data-driven contourne les deux écueils en apprenant directement l'incertitude depuis des données de trajectoires, sans hypothèse paramétrique forte. La réduction du conservatisme via des tubes d'ambiguïté de faible dimension, plusieurs tubes en basse dimension plutôt qu'un seul en haute dimension, améliore la scalabilité, un obstacle classique des approches distributionally robust appliquées à la robotique. C'est un pas concret vers des robots opérant en production dans des environnements non contrôlés, sans recalibration systématique du modèle de bruit.

La planification de mouvement sûre sous incertitude est un champ actif depuis deux décennies, structuré autour de méthodes comme RRT/RRT*, les MPC robustes et les approches de tube invariant. L'utilisation de la distance de Wasserstein pour construire des ensembles d'ambiguïté s'inscrit dans le courant des méthodes distributionally robust optimization (DRO), popularisées en contrôle ces cinq dernières années notamment par les groupes de ETH Zurich, Caltech et MIT. Ce preprint n'est pas encore évalué par les pairs. Les prochaines étapes attendues incluent une validation sur hardware réel (les cas d'étude présentés restent en simulation) et une extension aux dynamiques non linéaires, deux conditions nécessaires avant toute intégration dans des pipelines d'autonomie industrielle.

Dans nos dossiers

À lire aussi

COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques
1arXiv cs.RO 

COVER : planification de mouvement en temps fixe avec cartes à couverture vérifiée en environnements semi-statiques

Des chercheurs ont publié sur arXiv (référence 2510.03875v2) un framework baptisé COVER (Coverage-VErified Roadmaps), conçu pour résoudre des requêtes de planification de mouvement dans un budget temps fixe, sur un manipulateur 7-DOF effectuant des tâches de pick-and-place dans des environnements de type table rase et étagères. Le principe repose sur des environnements dits semi-statiques : la majorité de l'espace de travail reste identique entre les tâches, tandis qu'un sous-ensemble d'obstacles change de position. COVER décompose l'espace des configurations possibles de chaque obstacle mobile de façon indépendante, construit des roadmaps (graphes de chemins) de façon incrémentale, et vérifie formellement la faisabilité de ces graphes dans chaque partition. Pour les régions vérifiées, la résolution d'une requête est garantie dans un temps borné. Les benchmarks montrent une couverture de l'espace-problème plus large et un taux de succès par requête supérieur aux approches antérieures, notamment face à des obstacles de tailles hétérogènes. L'enjeu industriel est direct : les planificateurs généralistes comme RRT ou ses variantes ne garantissent pas de temps de réponse borné, ce qui bloque leur usage dans les applications temps-réel (lignes d'assemblage, cellules de palettisation, cobots en cadence synchronisée). COVER apporte une garantie formelle de couverture, absente des travaux précédents, sans discrétiser les configurations d'obstacles en un ensemble fini prédéfini. C'est ce dernier point qui étend l'applicabilité aux scénarios industriels réels, où les positions d'obstacles varient continûment et ne tombent pas dans des cases prédéterminées. Pour un intégrateur, la différence est concrète : un planificateur qui "essaie" n'a pas la même valeur contractuelle qu'un planificateur qui "garantit" dans X millisecondes. La planification de mouvement certifiée dans des environnements changeants est un problème ouvert depuis des années, à la frontière entre la robotique manipulation et la vérification formelle. Les approches par probabilistic roadmaps (PRM) offrent performance mais pas de garanties ; les méthodes exactes sont trop coûteuses en temps de calcul pour être embarquées. COVER se positionne entre ces deux extrêmes en exploitant la structure semi-statique propre à la majorité des environnements industriels. Les concurrents implicites sont les planificateurs adaptatifs comme STOMP, TrajOpt, ou les approches d'apprentissage par imitation (pi-zero de Physical Intelligence, GR00T N2 de NVIDIA), qui résolvent la planification par inférence neuronale mais sans garantie formelle de complétude. La prochaine étape naturelle serait d'étendre COVER à des environnements avec obstacles dynamiques ou à des manipulateurs montés sur bases mobiles, ce que l'article ne couvre pas encore.

RecherchePaper
1 source
Diffusion à somme de coûts avec guidage dynamique pour la planification de mouvement
2arXiv cs.RO 

Diffusion à somme de coûts avec guidage dynamique pour la planification de mouvement

Une équipe de recherche publie en mai 2026 (arXiv:2605.24690) une nouvelle méthode de planification de trajectoires pour la manipulation robotique, basée sur les modèles de diffusion. L'approche, baptisée "Sum of Costs Diffusion with Dynamic Guidance", guide le processus de débruitage du modèle de diffusion par le gradient du coût total de collision, c'est-à-dire la somme des coûts de collision sur l'ensemble de la trajectoire candidate. Autre contribution clé : une heuristique dynamique pour sélectionner l'étape de départ à partir de laquelle ce guidage par gradient est activé. Sur le benchmark Mπnets, un jeu de données de référence pour la planification en environnements encombrés, la méthode obtient les meilleures performances parmi l'ensemble des approches comparées. La généralisation reste le verrou principal de la planification de mouvement en manipulation robotique. Les planificateurs classiques (familles RRT, OMPL) peinent à s'adapter à de nouveaux environnements sans replanification coûteuse, tandis que les approches deep learning souffrent d'une généralisation limitée hors distribution. Le guidage par gradient de coût de collision, appliqué dynamiquement au cours du débruitage, offre une alternative : le modèle ajuste la trajectoire en continu selon la géométrie réelle de la scène, sans retraining. La sélection dynamique du step de départ du guidage adresse un problème connu des modèles de diffusion guidés, le compromis entre force du guidage et diversité des échantillons. Les résultats sur la diversité des configurations de test de Mπnets soutiennent l'hypothèse que cette formulation est plus robuste que les stratégies de guidage par coût ponctuel utilisées dans les travaux antérieurs. Cela dit, l'article est une prépublication non encore révisée par les pairs, et les métriques gagneraient à être validées sur des benchmarks physiques réels. L'intérêt pour les modèles de diffusion en planification robotique s'est accéléré depuis 2023 avec des travaux comme Diffusion Policy (Chi et al.) ou SE(3)-DiffusionFields. Les approches concurrentes directement comparées incluent MPinets et CuRobo (NVIDIA), deux méthodes learning-based de référence sur Mπnets. La méthode proposée s'inscrit dans un courant qui cherche à marier la flexibilité générative des modèles de diffusion avec des contraintes de sécurité physique (évitement de collision) sans passer par un planificateur externe. La prochaine étape logique sera une validation sur hardware réel et des environnements dynamiques, conditions nécessaires pour que ce type d'approche intéresse les intégrateurs industriels.

RecherchePaper
1 source
Contrôle hybride intégrant la faisabilité pour la planification de mouvement sous logiques temporelles à signaux
3arXiv cs.RO 

Contrôle hybride intégrant la faisabilité pour la planification de mouvement sous logiques temporelles à signaux

Une équipe de chercheurs publie sur arXiv (2605.03662v1) une méthode de planification hybride pour robots planaires opérant sous contraintes de Signal Temporal Logic (STL). L'approche introduit une variable discrète qui modélise la satisfaction locale des contraintes et permet une analyse de faisabilité à l'échelle locale, unifiant planification de tâches et synthèse de commande en une architecture unique. Des fonctions de barrière de contrôle (Control Barrier Functions, CBF) sont définies sur une version transformée en disque de l'espace de travail robotique, initialement non-convexe et géométriquement complexe, pour lever le problème des blocages (deadlocks) classiques dans ces formulations. Des simulations démontrent la gestion simultanée de plusieurs tâches spatio-temporelles superposées, y compris en présence de saturation des actionneurs. L'intérêt de cette contribution réside dans le couplage direct entre faisabilité locale et boucle de contrôle, plutôt qu'en post-traitement. Dans les architectures de Task and Motion Planning (TAMP) conventionnelles, le planificateur propose fréquemment des trajectoires irréalisables par le contrôleur bas niveau : intégrer l'analyse de faisabilité en amont réduit structurellement cet écart. La gestion de la saturation des actionneurs, contrainte réaliste rarement traitée dans les formulations STL existantes, renforce la crédibilité industrielle de l'approche pour des robots à ressources limitées. Les STL constituent depuis une dizaine d'années un cadre de spécification formelle prisé pour exprimer des contraintes temporisées du type "atteindre la zone A entre t=2s et t=5s", mais leur intégration avec des garanties de sûreté temps-réel reste un problème ouvert. Les CBF, popularisées notamment par les travaux d'Aaron Ames (Caltech), offrent de telles garanties mais peinent sur les espaces non-convexes ; la transformation géométrique en disque proposée ici adresse directement ce couplage. Les résultats restent pour l'instant limités à des simulations planaires 2D ; une validation sur plateforme physique constitue la prochaine étape naturelle.

RecherchePaper
1 source
SBAMP : planification de mouvement adaptative par échantillonnage
4arXiv cs.RO 

SBAMP : planification de mouvement adaptative par échantillonnage

Des chercheurs ont publié sur arXiv (référence 2511.12022, version 3) un cadre hybride de planification de mouvement baptisé SBAMP (Sampling-Based Adaptive Motion Planning), conçu pour les robots autonomes évoluant dans des environnements dynamiques. L'approche fusionne un planificateur global basé sur RRT (Rapidly-exploring Random Tree star), qui génère des trajectoires quasi-optimales, avec un contrôleur local de type SEDS (Stable Estimator of Dynamical Systems) intégrant une optimisation sous contraintes en temps réel. Ce qui distingue SBAMP des implémentations SEDS classiques : aucune donnée d'entraînement préalable n'est requise, le contrôleur s'ajuste à la volée via une optimisation contrainte légère directement embarquée dans la boucle de contrôle. Les expériences ont été menées à la fois en simulation et sur une plateforme matérielle RoboRacer, avec des tests de récupération après perturbations, de contournement d'obstacles et de tenue de performance en conditions dynamiques. L'enjeu technique adressé est fondamental en robotique mobile : les planificateurs globaux comme RRT produisent de bonnes trajectoires hors ligne mais peinent à réagir aux perturbations en temps réel, tandis que les approches à systèmes dynamiques comme SEDS offrent une réactivité fluide mais nécessitent une optimisation offline sur données. SBAMP propose un compromis opérationnel : la structure de chemin global est préservée, mais le robot peut s'en écarter localement de manière stable au sens de Lyapunov, ce qui garantit la convergence vers l'objectif sans oscillations incontrôlées. Pour un intégrateur industriel ou un développeur de systèmes de navigation, l'absence de phase de pré-entraînement réduit significativement le coût de déploiement sur de nouveaux environnements. Il convient de noter que les résultats présentés restent au stade académique, sur une plateforme de recherche compacte, sans validation à l'échelle industrielle ni benchmark comparatif public. SBAMP s'inscrit dans un champ de recherche dense sur la planification hybride, aux côtés de travaux récents comme MPPI (Model Predictive Path Integral) ou TEB (Timed Elastic Band), qui visent tous à réconcilier optimalité globale et réactivité locale. RRT* est un algorithme établi depuis les travaux de Karaman et Frakcas (2011), et SEDS est utilisé en robotique depuis une décennie pour la reproduction de gestes appris. La contribution de SBAMP réside dans leur couplage sans supervision, un point non trivial. Les auteurs n'annoncent pas de transfert industriel immédiat ni de partenariat commercial, et la prochaine étape naturelle serait une validation sur robots à plus haute dynamique (manipulateurs, AMR en entrepôt) et dans des environnements avec obstacles mobiles denses.

RecherchePaper
1 source