Aller au contenu principal
Traversée prudente de graphes à coûts d'arêtes stochastiques et corrélés pour une mobilité planétaire globale sûre
RecherchearXiv cs.RO7sem

Traversée prudente de graphes à coûts d'arêtes stochastiques et corrélés pour une mobilité planétaire globale sûre

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs en robotique planétaire ont publié sur arXiv (réf. 2505.13674v2) un nouvel algorithme de planification de trajectoire pour l'exploration de surface martienne longue distance. Le travail formalise ce problème sous la forme d'une variante du Problème du Voyageur Canadien (Canadian Traveller Problem, CTP) intégrant explicitement l'aversion au risque. L'objectif est de produire une politique de traversée minimisant le CVaR (Conditional Value-at-Risk), une mesure de risque héritée de la finance quantitative et reconnue pour son interprétabilité intuitive. L'algorithme proposé trouve des politiques CVaR-optimales exactes en s'appuyant sur des techniques de recherche AND-OR établies, initialement conçues pour la minimisation d'espérance, étendues ici au domaine de l'aversion au risque. La validation s'effectue sur des simulations de traversées longue distance construites à partir de vraies cartes orbitales de la surface martienne, avec des probabilités de franchissement issues de cartes de terrain réelles.

Ce travail répond à un goulet d'étranglement opérationnel concret dans les missions planétaires actuelles : les opérateurs humains doivent identifier manuellement les segments à traversabilité incertaine et adapter les plans en temps réel selon les difficultés rencontrées. En formalisant ce processus décisionnel adaptatif, les auteurs ouvrent la voie à une planification stratégique plus autonome, réduisant la charge sur les équipes sol tout en maintenant un contrôle explicite du niveau de risque. L'aspect le plus notable est la prise en compte des corrélations de traversabilité entre zones de terrain similaire : lorsqu'une région ressemble à une autre déjà évaluée, l'incertitude n'est pas traitée comme indépendante. Les résultats montrent empiriquement que des détours exploratoires ("information-seeking detours") permettent de réduire significativement le risque dans ces configurations corrélées, ce qui n'est pas possible avec les approches classiques insensibles au risque.

Le contexte immédiat est celui des rovers martiens comme Curiosity (actif depuis 2012) et Perseverance (2021), dont la planification de trajectoire reste aujourd'hui très humano-dépendante et limitée en portée quotidienne. Le CTP est un problème classique de la littérature en planification sous incertitude, mais son adaptation risk-averse pour la mobilité planétaire globale n'avait pas encore été traitée de façon formelle. Ce travail reste pour l'instant une contribution académique sans implémentation annoncée sur matériel réel ni collaboration institutionnelle (NASA, ESA) mentionnée explicitement. Les prochaines étapes naturelles seraient une intégration dans les outils de planification de mission existants et une validation sur des données de terrain analogues terrestres, étape habituelle avant tout déploiement sur véhicule spatial.

Dans nos dossiers

À lire aussi

Un cadre pratique d'indicateurs de performance clés pour les tests sur le terrain avec plusieurs robots lunaires et planétaires
1arXiv cs.RO 

Un cadre pratique d'indicateurs de performance clés pour les tests sur le terrain avec plusieurs robots lunaires et planétaires

Une équipe de chercheurs a publié sur arXiv (référence 2601.20529, version 3) un cadre structuré d'indicateurs clés de performance (KPI) destiné à évaluer les missions multi-robots lors d'essais analogiques lunaires et planétaires. Le constat de départ : les nombreux tests de terrain simulant la prospection lunaire (ilménite, terres rares, glace d'eau) utilisent des métriques hétérogènes propres à chaque scénario, rendant toute comparaison inter-missions quasi impossible. Le cadre est dérivé de trois scénarios multi-robots représentatifs et organise les KPI autour de trois axes : efficacité (couverture de terrain, débit d'exploration), robustesse (taux de pannes, reprise après défaillance) et précision (qualité des données scientifiques collectées). Validé lors d'un test de terrain réel, il se révèle directement applicable pour les métriques d'efficacité et de robustesse ; les KPI de précision se heurtent en revanche à l'impossibilité pratique d'obtenir des données de vérité terrain fiables dans des environnements extérieurs non instrumentés. L'absence de standard commun est l'un des freins principaux au développement de la robotique planétaire : sans référentiel partagé, comparer deux systèmes multi-robots issus de plateformes et de configurations expérimentales différentes reste impossible, même lorsqu'ils visent le même objectif scientifique. Ce framework comble ce manque en reliant les métriques d'ingénierie aux objectifs de mission (ressources extractibles, couverture cartographique), ce qui est directement utile pour arbitrer entre architectures de flotte ou stratégies de coordination distribuée. La limite identifiée sur les KPI de précision est significative et honnête : mesurer la localisation absolue d'un essaim de robots en extérieur sans infrastructure de référence reste un problème ouvert, ce qui conditionne directement la fiabilité des futurs démonstrateurs ISRU (In-Situ Resource Utilization). La prospection robotique lunaire connaît une structuration accélérée sous l'impulsion du programme Artemis (NASA), des ambitions lunaires de l'ESA et d'acteurs privés comme ispace (Japon/Luxembourg) ou Astrobotic (États-Unis). Les missions analogiques terrestres sur substrats simulant le régolite sont l'outil standard avant vol, mais leur prolifération sans méthode commune a produit une littérature difficile à synthétiser et à comparer. Ce papier s'inscrit dans un mouvement de standardisation comparable à ce que l'IEEE a accompli pour les robots AMR industriels ; l'étape logique serait son adoption par des consortiums comme l'ESA-ESRIC lors de compétitions analogiques de référence, telles que l'ESRIC Space Resources Challenge, pour confirmer sa portée au-delà d'un seul contexte expérimental.

UEPotentiellement utile pour l'ESA et les consortiums européens (ESA-ESRIC) travaillant sur la robotique planétaire, notamment dans le cadre de compétitions analogiques comme l'ESRIC Space Resources Challenge.

RecherchePaper
1 source
pdSTL : logique temporelle de signal probabiliste et différentiable pour les systèmes stochastiques
2arXiv cs.RO 

pdSTL : logique temporelle de signal probabiliste et différentiable pour les systèmes stochastiques

Des chercheurs ont déposé en juin 2026 sur arXiv pdSTL (probabilistic differentiable Signal Temporal Logic), un cadre formel pour robots autonomes opérant dans des environnements stochastiques. Le système étend la Signal Temporal Logic (STL), formalisme standard pour spécifier des propriétés de sécurité et temporelles dans les systèmes dynamiques, en combinant deux capacités jusqu'ici dissociées : la différentiabilité permettant l'optimisation de trajectoires par gradient, et la sémantique probabiliste appliquée aux trajectoires de croyances (belief trajectories), c'est-à-dire la distribution d'états estimée à partir de capteurs bruités. pdSTL calcule des bornes de satisfaction conservatrices via des sémantiques à intervalles propagées compositionnellement, et formule l'évaluation de la robustesse temporelle comme un dépliage récurrent de style LSTM pour une surveillance en temps linéaire. Les expériences couvrent des scénarios simulés d'évitement d'obstacles et de changement de voie, ainsi que des vols réels avec le nano-drone Crazyflie de Bitcraze soumis à des perturbations aérodynamiques. L'apport central est de résoudre simultanément deux lacunes concurrentes des approches existantes. La STL différentiable déterministe (dSTL) permettait l'optimisation par gradient mais supposait des états connus avec certitude, ignorant le bruit de capteur et la dynamique stochastique. Les extensions probabilistes de la STL existantes offraient des garanties formelles mais sacrifiaient la différentiabilité, les rendant incompatibles avec les pipelines d'apprentissage modernes. pdSTL unifie les deux, et les auteurs rapportent qu'il surpasse significativement dSTL pour le maintien des marges de sécurité sous incertitude réelle. Pour un ingénieur robotique ou un intégrateur travaillant sur la navigation autonome, cette combinaison de garanties probabilistes formelles et d'optimisabilité par gradient constitue une brique potentielle pour des spécifications de sécurité certifiables en conditions opérationnelles. La STL est un outil standard de la vérification formelle de systèmes cyber-physiques depuis les années 2010, et ses extensions différentiables avaient déjà intéressé la communauté robotique pour l'optimisation de trajectoires. Le Crazyflie, drone open-source de la société suédoise Bitcraze, est une plateforme académique de référence appréciée pour sa dynamique instable, qui en fait un test exigeant pour toute approche de contrôle robuste. Ce travail est pour l'instant un preprint non relu par les pairs, sans code public annoncé et sans métriques quantitatives précises dans le résumé, ce qui invite à la prudence face aux affirmations de surperformance. Les équipes de motion planning sous incertitude dans les secteurs drones, véhicule autonome et manipulation industrielle sont les premières concernées par une éventuelle implémentation.

UEBitcraze (Suède, UE) fournit la plateforme drone de validation matérielle, ce qui ancre marginalement ce travail académique dans l'écosystème européen, mais sans impact opérationnel direct à ce stade de preprint non relu.

RecherchePaper
1 source
Estimation de traversabilité auto-supervisée et agnostique au robot pour des environnements ouverts
3arXiv cs.RO 

Estimation de traversabilité auto-supervisée et agnostique au robot pour des environnements ouverts

Une équipe de chercheurs présente COTRATE (Continuous Online TRAversability EsTimation), un framework d'apprentissage en ligne pour l'estimation de traversabilité des terrains par des robots mobiles, publié sur arXiv en mai 2026 (arXiv:2605.28442). Le système apprend de façon auto-supervisée à partir de données non étiquetées collectées par le robot en temps réel. COTRATE fonctionne en deux étapes : un module d'évaluation du terrain exploitant les signaux proprioceptifs et inertiels génère des scores de traversabilité robustes, qui supervisent ensuite un réseau de traversabilité visuelle via une fonction de perte par alignement (alignment loss). Pour limiter l'oubli catastrophique propre à l'apprentissage continu, les auteurs proposent une stratégie de sélection de features basée sur la diversité, s'appuyant sur une mémoire de relecture compacte. Le système a été évalué sur un dataset d'environ 50 000 images collectées avec deux plateformes robotiques sur 11 types de terrains extérieurs, et benchmarké sur des tâches de navigation dans trois environnements extérieurs représentatifs. Le code, le dataset et les modèles pré-entraînés sont disponibles publiquement. La traversabilité est un problème central pour les robots mobiles opérant en environnement non structuré : savoir si un sol est praticable, à quelle vitesse et avec quel risque de chute ou de blocage conditionne directement la sécurité et l'efficacité des missions. Les approches existantes butaient sur un double écueil : soit elles reposaient sur des scores proprioceptifs artisanaux, spécifiques à une plateforme et donc non transférables, soit elles pré-calculaient des clusters sur des données antérieures sans possibilité d'adaptation en ligne. COTRATE lève les deux limitations simultanément : il est robot-agnostic, avec un transfert de connaissances démontré entre plateformes à cinématiques différentes, et il apprend en continu sans coût mémoire ou calcul prohibitif, rendant le déploiement embarqué crédible. C'est un signal pertinent pour les intégrateurs de robots extérieurs dans l'agriculture, l'inspection d'infrastructure ou la défense, secteurs où les conditions terrain varient et où annoter des données à la main reste hors de portée à l'échelle. L'estimation de traversabilité auto-supervisée est un champ actif depuis plusieurs années, porté notamment par des laboratoires travaillant sur les robots quadrupèdes comme ANYmal (ANYbotics) ou Spot (Boston Dynamics) ainsi que sur les UGV de type Clearpath Robotics. Les méthodes antérieures les plus citées dans ce domaine, dont certaines issues d'ETH Zurich ou de CMU, reposaient généralement sur des données pré-collectées ou des heuristiques proprioceptives figées. COTRATE se positionne comme une solution plus générale, bien que la publication soit à ce stade un preprint arXiv sans validation en peer review et qu'aucun partenaire industriel ni déploiement terrain en production ne soit mentionné. Les étapes naturelles seraient une validation sur des plateformes commerciales en conditions réelles prolongées et une intégration dans des stacks de navigation open-source comme Nav2 ou le framework Elevation Mapping de la communauté ETH.

UEImpact indirect via la communauté de recherche européenne (ETH Zurich cité comme référence clé) et pertinence pour les intégrateurs EU en agriculture et inspection d'infrastructure, mais aucun acteur français ni déploiement européen mentionné.

RecherchePaper
1 source
Planification de trajectoire par retour d'état pour systèmes non linéaires stochastiques avec spécifications en logique temporelle de signal
4arXiv cs.RO 

Planification de trajectoire par retour d'état pour systèmes non linéaires stochastiques avec spécifications en logique temporelle de signal

Une équipe de chercheurs a déposé en mai 2026 sur arXiv (réf. 2605.02361) un cadre de planification de mouvement par retour d'état pour systèmes non linéaires stochastiques en temps continu, soumis à des spécifications formelles en Signal Temporal Logic (STL). La STL est un formalisme mathématique qui exprime des exigences comportementales temporelles précises - du type "éviter une zone pendant 3 secondes, puis atteindre la cible dans un rayon donné". L'objectif affiché est de garantir le respect de ces spécifications avec une probabilité de 99,99 % en boucle fermée. La méthode repose sur une stratégie dite d'"érosion de prédicats" : le problème stochastique, mathématiquement intractable, est transformé en optimisation déterministe avec des contraintes STL resserrées, dont l'amplitude est calibrée par un tube atteignable probabiliste (PRT, Probabilistic Reachable Tube) borné via la théorie de la contraction. Le pipeline complet a été validé en simulation sur plusieurs architectures robotiques, puis expérimentalement sur un robot quadrupède réel - dont la marque n'est pas précisée dans la prépublication, limite courante des dépôts arXiv. Les auteurs rapportent des résultats supérieurs aux approches de référence en termes de conservatisme réduit et de taux de satisfaction des spécifications. Ce travail s'attaque à un verrou bien identifié en robotique formelle : la plupart des méthodes STL existantes supposent soit un système déterministe, soit un modèle linéaire, rendant les garanties probabilistes sur systèmes non linéaires bruités difficiles à obtenir sans explosion combinatoire. En reformulant le problème stochastique en optimisation déterministe compatible avec des solveurs numériques standards, l'approche ouvre une voie d'intégration industrielle sans exiger de matériel de calcul spécialisé. La validation sur quadrupède physique est un signal positif dans un domaine où le sim-to-real gap reste la principale objection aux méthodes formelles. Pour les intégrateurs et décideurs, une garantie probabiliste quantifiée et potentiellement auditable représente un argument concret dans des contextes de certification robotique - à condition que les résultats expérimentaux détaillés confirment la tenue des 99,99 % sur des scénarios variés, ce que le seul résumé ne permet pas de vérifier. Ces travaux s'inscrivent dans un courant actif combinant planification temporelle et contrôle robuste, aux côtés des Control Barrier Functions (CBF) et des approches MPC-STL (Model Predictive Control avec spécifications temporelles). La théorie de la contraction mobilisée ici, développée notamment par Jean-Jacques Slotine au MIT et remise en avant ces dernières années dans la vérification formelle robotique, constitue l'un des apports méthodologiques distincts de l'article. Aucun acteur européen n'est impliqué dans ces travaux. Les extensions naturelles incluent des spécifications STL imbriquées ou multi-agents, des environnements dynamiques, et une comparaison étendue avec des architectures d'apprentissage par renforcement - domaine concurrent qui adresse des problèmes similaires avec des garanties formelles généralement plus faibles.

RecherchePaper
1 source