Aller au contenu principal
Régions circulaires sûres à expansion rapide pour une planification locale de trajectoires efficace
RecherchearXiv cs.RO2j

Régions circulaires sûres à expansion rapide pour une planification locale de trajectoires efficace

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (2605.16009, mai 2026) une méthode géométrique de navigation locale pour robots mobiles, baptisée FESCR (Fast Expanding Safe Circular Regions). Le principe repose sur le calcul d'une séquence de régions circulaires dérivées d'un scan LiDAR local : ces cercles s'étendent progressivement dans la direction du but tout en restant confinés à l'espace libre détecté. L'algorithme génère ainsi un couloir navigable en temps quasi-réel, sans recourir à un solveur d'optimisation. La méthode a été intégrée dans le framework ROS2 et évaluée dans un environnement simulé. Aucun déploiement sur hardware réel ni chiffres de benchmark précis (temps de calcul en ms, fréquence de replanning) ne sont fournis dans la prépublication.

L'intérêt principal de cette approche est sa complexité algorithmique réduite par rapport aux méthodes concurrentes. Le Dynamic Window Approach (DWA) et le Model Predictive Control (MPC) reposent sur des boucles d'optimisation coûteuses, difficiles à tenir en temps réel dans des environnements denses ou changeants. Les Control Barrier Functions (CBF) et les techniques d'apprentissage apportent de la robustesse théorique mais introduisent soit une charge computationnelle élevée soit une dépendance aux données d'entraînement. FESCR contourne ces contraintes par une construction géométrique directe, ce qui, selon les auteurs, permet des horizons de planification plus longs à charge CPU égale. C'est un argument pertinent pour les intégrateurs AMR opérant sur des plateformes embarquées à ressources limitées, même si l'affirmation reste à valider sur des benchmarks standardisés (ex. nav2_benchmark, BARN dataset).

La navigation locale est un problème ouvert depuis les travaux fondateurs de Fox et al. sur le DWA (1997). Les approches récentes comme TEB (Timed Elastic Band) ou MPPI (Model Predictive Path Integral) ont progressivement repoussé les limites de performance, mais au prix d'une complexité d'intégration croissante. FESCR s'inscrit dans un mouvement de retour aux méthodes géométriques légères, observable aussi dans des travaux comme les corridor-based planners de Carnegie Mellon ou les méthodes à champ de potentiel revisitées. Les prochaines étapes naturelles sont la validation sur robot réel (terrain irrégulier, obstacles dynamiques) et la comparaison quantitative avec nav2 DWB sur le benchmark BARN, ce que la prépublication ne fournit pas encore.

Dans nos dossiers

À lire aussi

Planification de trajectoire par retour d'état pour systèmes non linéaires stochastiques avec spécifications en logique temporelle de signal
1arXiv cs.RO 

Planification de trajectoire par retour d'état pour systèmes non linéaires stochastiques avec spécifications en logique temporelle de signal

Une équipe de chercheurs a déposé en mai 2026 sur arXiv (réf. 2605.02361) un cadre de planification de mouvement par retour d'état pour systèmes non linéaires stochastiques en temps continu, soumis à des spécifications formelles en Signal Temporal Logic (STL). La STL est un formalisme mathématique qui exprime des exigences comportementales temporelles précises - du type "éviter une zone pendant 3 secondes, puis atteindre la cible dans un rayon donné". L'objectif affiché est de garantir le respect de ces spécifications avec une probabilité de 99,99 % en boucle fermée. La méthode repose sur une stratégie dite d'"érosion de prédicats" : le problème stochastique, mathématiquement intractable, est transformé en optimisation déterministe avec des contraintes STL resserrées, dont l'amplitude est calibrée par un tube atteignable probabiliste (PRT, Probabilistic Reachable Tube) borné via la théorie de la contraction. Le pipeline complet a été validé en simulation sur plusieurs architectures robotiques, puis expérimentalement sur un robot quadrupède réel - dont la marque n'est pas précisée dans la prépublication, limite courante des dépôts arXiv. Les auteurs rapportent des résultats supérieurs aux approches de référence en termes de conservatisme réduit et de taux de satisfaction des spécifications. Ce travail s'attaque à un verrou bien identifié en robotique formelle : la plupart des méthodes STL existantes supposent soit un système déterministe, soit un modèle linéaire, rendant les garanties probabilistes sur systèmes non linéaires bruités difficiles à obtenir sans explosion combinatoire. En reformulant le problème stochastique en optimisation déterministe compatible avec des solveurs numériques standards, l'approche ouvre une voie d'intégration industrielle sans exiger de matériel de calcul spécialisé. La validation sur quadrupède physique est un signal positif dans un domaine où le sim-to-real gap reste la principale objection aux méthodes formelles. Pour les intégrateurs et décideurs, une garantie probabiliste quantifiée et potentiellement auditable représente un argument concret dans des contextes de certification robotique - à condition que les résultats expérimentaux détaillés confirment la tenue des 99,99 % sur des scénarios variés, ce que le seul résumé ne permet pas de vérifier. Ces travaux s'inscrivent dans un courant actif combinant planification temporelle et contrôle robuste, aux côtés des Control Barrier Functions (CBF) et des approches MPC-STL (Model Predictive Control avec spécifications temporelles). La théorie de la contraction mobilisée ici, développée notamment par Jean-Jacques Slotine au MIT et remise en avant ces dernières années dans la vérification formelle robotique, constitue l'un des apports méthodologiques distincts de l'article. Aucun acteur européen n'est impliqué dans ces travaux. Les extensions naturelles incluent des spécifications STL imbriquées ou multi-agents, des environnements dynamiques, et une comparaison étendue avec des architectures d'apprentissage par renforcement - domaine concurrent qui adresse des problèmes similaires avec des garanties formelles généralement plus faibles.

RecherchePaper
1 source
DAG-STL : un cadre hiérarchique pour la planification de trajectoires zéro-shot sous contraintes de logique temporelle signalée
2arXiv cs.RO 

DAG-STL : un cadre hiérarchique pour la planification de trajectoires zéro-shot sous contraintes de logique temporelle signalée

Des chercheurs ont publié DAG-STL, un cadre hiérarchique de planification de trajectoires pour robots opérant sous contraintes de Signal Temporal Logic (STL), une logique formelle permettant de spécifier des tâches robotiques structurées dans le temps. Le pipeline decompose-allocate-generate fonctionne en trois étapes : il décompose d'abord une formule STL en conditions de progression d'accessibilité et d'invariance, liées par des contraintes de synchronisation partagées ; il alloue ensuite des waypoints temporels via des estimations d'accessibilité apprises ; enfin, il synthétise les trajectoires entre ces waypoints à l'aide d'un générateur basé sur la diffusion. Les expériences ont été conduites sur trois benchmarks standards : Maze2D, OGBench AntMaze, et le domaine Cube, avec un environnement personnalisé incluant une référence par optimisation. DAG-STL surpasse significativement l'approche concurrente de diffusion guidée par robustesse directe sur des tâches STL à long horizon, et récupère la majorité des tâches solubles par optimisation classique tout en conservant un avantage computationnel notable. L'apport principal de ce travail est de résoudre la planification STL en contexte zero-shot, c'est-à-dire sans avoir jamais vu la tâche cible lors de l'entraînement, et sans modèle analytique de la dynamique du système. Pour les intégrateurs et décideurs en robotique, cela signifie qu'un robot équipé de DAG-STL pourrait recevoir une spécification temporelle formelle inédite et en dériver un plan exécutable uniquement depuis des données de trajectoires génériques préenregistrées. La séparation explicite entre raisonnement logique et réalisation physique de la trajectoire est une décision architecturale structurante : elle réduit les problèmes de planification globale long-horizon à une série de sous-problèmes plus courts et mieux couverts par les données. Le cadre introduit également une métrique de cohérence dynamique sans rollout et un mécanisme de replanification hiérarchique en ligne, deux mécanismes qui adressent directement le gap simulation-réel, sujet central des débats sur le sim-to-real dans les VLA (Vision-Language-Action models). DAG-STL s'inscrit dans un courant de recherche actif qui cherche à doter les robots d'une capacité de généralisation formellement vérifiable, à la croisée de la planification sous contraintes logiques temporelles et des modèles génératifs de trajectoires. La STL est un langage étudié depuis les années 2000 en vérification formelle, mais son application à la planification robotique offline reste difficile faute de modèles dynamiques disponibles dans des environnements réels. Les approches concurrentes incluent les méthodes d'imitation learning task-spécifiques et les planificateurs à base de modèle explicite, que DAG-STL vise à dépasser sur le critère de généralisation. Le preprint est disponible sur arXiv (2604.18343) et les prochaines étapes naturelles seraient une validation sur des plateformes physiques, notamment en manipulation et navigation réelle, pour confirmer les gains observés en simulation.

RecherchePaper
1 source
IMPACT : Lagrangien augmenté à ensemble actif implicite pour l'optimisation rapide de trajectoires à contact implicite
3arXiv cs.RO 

IMPACT : Lagrangien augmenté à ensemble actif implicite pour l'optimisation rapide de trajectoires à contact implicite

Des chercheurs ont déposé mi-mai 2026 sur arXiv (arXiv:2605.09127) un préprint décrivant IMPACT, un nouvel algorithme d'optimisation de trajectoires en contact implicite (CITO). La méthode repose sur une formulation augmented-Lagrangian pour résoudre les programmes mathématiques à contraintes de complémentarité (MPCC) qui gouvernent la planification de mouvements impliquant des contacts physiques, sans qu'il soit nécessaire de spécifier à l'avance la séquence des modes de contact. L'implémentation en C++ a été évaluée sur deux benchmarks open-source de référence, CITO et CI-MPC (model predictive control implicite en contact) : sur le premier, IMPACT affiche des accélérations comprises entre 2,9x et 70x par rapport aux solveurs existants les plus compétitifs, avec une moyenne géométrique de 13,8x. Sur les tâches de manipulation dextère en simulation (CI-MPC), la qualité du contrôle progresse également. Une validation sur robot physique a été conduite sur une tâche de poussée d'un objet en T, tâche simple mais représentative du problème de contact. La CITO est une approche unifiée pour planifier et contrôler des robots dans des environnements à contacts multiples, qu'il s'agisse de manipulation d'objets complexes ou de locomotion. Son atout principal est de ne pas imposer de séquence de modes de contact en entrée, éliminant une étape d'ingénierie manuelle coûteuse et peu robuste aux situations imprévues. Le verrou historique était le mauvais conditionnement numérique des MPCC sous-jacents, qui rendait les solveurs génériques instables et prohibitivement lents pour des applications embarquées. Un gain de 13,8x en moyenne géométrique sur des benchmarks standardisés est un signal fort : IMPACT rapproche le CI-MPC d'une viabilité en boucle fermée rapide. Pour les intégrateurs et les équipes de robotique dextère, c'est une avancée concrète vers des manipulateurs capables de gérer des contacts variés sans reprogrammation manuelle à chaque changement de tâche. La CITO mobilise des équipes académiques depuis une décennie, notamment au MIT, à Carnegie Mellon et à ETH Zurich. Les solveurs polyvalents comme IPOPT ou SNOPT montraient des limites sévères sur les MPCC liés au contact ; des travaux récents comme CALIPSO avaient amorcé des améliorations, mais sans garanties de stationnarité systématiques ni gains de vitesse aussi prononcés. IMPACT introduit une identification implicite des branches de modes de contact à la volée pendant les itérations d'optimisation, ce qui constitue sa différence algorithmique principale. Le code est soumis aux benchmarks publics, ce qui permettra à la communauté de reproduire et d'auditer les chiffres annoncés. La suite logique serait l'intégration dans des contrôleurs embarqués sur robots manipulateurs industriels ou humanoïdes, où la planification en contact temps réel reste un problème largement ouvert.

RecherchePaper
1 source
Suppression rapide des vibrations et suivi de trajectoire d'un manipulateur sériel à liaisons flexibles multiples
4arXiv cs.RO 

Suppression rapide des vibrations et suivi de trajectoire d'un manipulateur sériel à liaisons flexibles multiples

Des chercheurs ont publié le 22 mai 2026 sur arXiv (référence 2605.17477) un article présentant une nouvelle approche de contrôle pour les manipulateurs robotiques à liaisons flexibles multiples, une classe de bras articulés légers aux avantages structurels réels mais difficiles à stabiliser. Le framework proposé combine une commande par backstepping en sortie (output-feedback) avec un opérateur neuronal DeepONet pour supprimer rapidement les vibrations et maintenir le suivi de trajectoire de l'effecteur terminal. Chaque segment du bras est modélisé comme une poutre de Timoshenko couplée à une équation différentielle ordinaire, transformée en un système PDE hyperbolique canonique avec dynamique aux frontières. Un contrôleur de frontière basé sur le backstepping injecte de l'amortissement distribué le long de la poutre, en n'utilisant que des mesures disponibles aux extrémités. Les expériences ont été conduites sur un manipulateur à deux liaisons flexibles, démontrant une suppression des vibrations et une convergence de l'effecteur significativement plus rapides qu'un régulateur quadratique linéaire (LQR) avec compensation feedforward. L'enjeu industriel derrière ce type de recherche est concret : les manipulateurs flexibles permettent de réduire la masse embarquée et d'augmenter l'espace de travail, deux paramètres critiques pour la robotique collaborative, les bras montés sur mobile, ou les applications spatiales. Leur principal défaut, les oscillations résiduelles en fin de mouvement, pénalise directement les temps de cycle et la précision de placement. L'introduction de DeepONet pour approximer les noyaux de backstepping est la contribution pratique clé : elle réduit drastiquement le coût de calcul en ligne, rendant ce type de commande avancée compatible avec des contrôleurs embarqués à ressources limitées et capable de s'adapter en temps réel aux changements de configuration. Le backstepping pour systèmes distribués (PDEs) est un domaine de contrôle théorique actif depuis une quinzaine d'années, porté notamment par les travaux de Miroslav Krstic (UC San Diego). L'usage des opérateurs neuronaux de type DeepONet pour accélérer ce type de calculs constitue une tendance émergente à l'intersection du machine learning et du contrôle optimal. Sur le plan concurrentiel, les grandes maisons de robotique industrielle (FANUC, KUKA, ABB) gèrent la flexibilité structurelle par du surdimensionnement mécanique ou des vitesses d'opération conservatrices ; des startups comme Machina Labs ou des acteurs de la manipulation légère pourraient bénéficier directement de ce type d'avancée. La prochaine étape logique serait une validation sur un bras à n > 2 liaisons en conditions industrielles réelles, condition nécessaire avant toute intégration produit.

RecherchePaper
1 source