Aller au contenu principal
Remarques sur le clonage stochastique et le filtrage à états différés
RecherchearXiv cs.RO6sem

Remarques sur le clonage stochastique et le filtrage à états différés

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Un article de recherche publié sur arXiv (identifiant 2508.21260, version 2) remet en question une pratique établie dans les systèmes de navigation et de robotique : le clonage stochastique (SC, stochastic cloning). Cette technique, utilisée pour traiter les mesures dépendant d'états antérieurs comme l'odométrie, qui quantifie le déplacement relatif d'un robot entre deux instants, repose sur l'augmentation du vecteur d'état afin de capturer les corrélations avec les estimations passées. Les auteurs démontrent qu'une alternative plus ancienne, le filtre de Kalman à états différés (DSKF, delayed-state Kalman filter), correctement dérivée, produit exactement les mêmes mises à jour d'état et de covariance que le SC, sans nécessiter d'augmentation du vecteur d'état. Deux formulations équivalentes du DSKF sont présentées, offrant des perspectives complémentaires sur le traitement de ces corrélations dans le cadre du filtre de Kalman généralisé.

Ce résultat est significatif pour les ingénieurs qui conçoivent des systèmes de navigation embarqués, de SLAM (Simultaneous Localization and Mapping) ou d'intégration IMU/odométrie. Le clonage stochastique, bien qu'efficace, alourdit le vecteur d'état à chaque mesure différée, ce qui représente un coût mémoire et computationnel non négligeable sur des plateformes contraintes comme les drones, rovers ou robots mobiles AMR. Les auteurs montrent que les deux approches sont équivalentes en complexité asymptotique, et qu'une des formulations DSKF offre une réduction des coûts arithmétiques et de stockage pour certaines configurations dimensionnelles. Le papier corrige également un préjugé persistant dans la communauté : l'idée que les variantes du filtre de Kalman sont intrinsèquement incapables de traiter des mesures corrélées à des états passés.

Le filtre de Kalman reste un pilier de la théorie de l'estimation depuis les années 1960, et ses extensions (EKF, UKF) sont omniprésentes en robotique et aérospatiale. Le clonage stochastique a été popularisé dans les années 2000, notamment via les travaux de Roumeliotis sur la navigation vision-inertielle, précurseurs du filtre MSCKF aujourd'hui au coeur de systèmes comme OpenVINS. En réhabilitant le DSKF comme alternative algorithmiquement compétitive, ce travail invite les équipes de recherche et de développement à reconsidérer leur outillage, en particulier pour les applications embarquées à ressources limitées. Il s'agit pour l'instant d'un preprint sans implémentation publique ni validation industrielle annoncée.

Dans nos dossiers

À lire aussi

pdSTL : logique temporelle de signal probabiliste et différentiable pour les systèmes stochastiques
1arXiv cs.RO 

pdSTL : logique temporelle de signal probabiliste et différentiable pour les systèmes stochastiques

Des chercheurs ont déposé en juin 2026 sur arXiv pdSTL (probabilistic differentiable Signal Temporal Logic), un cadre formel pour robots autonomes opérant dans des environnements stochastiques. Le système étend la Signal Temporal Logic (STL), formalisme standard pour spécifier des propriétés de sécurité et temporelles dans les systèmes dynamiques, en combinant deux capacités jusqu'ici dissociées : la différentiabilité permettant l'optimisation de trajectoires par gradient, et la sémantique probabiliste appliquée aux trajectoires de croyances (belief trajectories), c'est-à-dire la distribution d'états estimée à partir de capteurs bruités. pdSTL calcule des bornes de satisfaction conservatrices via des sémantiques à intervalles propagées compositionnellement, et formule l'évaluation de la robustesse temporelle comme un dépliage récurrent de style LSTM pour une surveillance en temps linéaire. Les expériences couvrent des scénarios simulés d'évitement d'obstacles et de changement de voie, ainsi que des vols réels avec le nano-drone Crazyflie de Bitcraze soumis à des perturbations aérodynamiques. L'apport central est de résoudre simultanément deux lacunes concurrentes des approches existantes. La STL différentiable déterministe (dSTL) permettait l'optimisation par gradient mais supposait des états connus avec certitude, ignorant le bruit de capteur et la dynamique stochastique. Les extensions probabilistes de la STL existantes offraient des garanties formelles mais sacrifiaient la différentiabilité, les rendant incompatibles avec les pipelines d'apprentissage modernes. pdSTL unifie les deux, et les auteurs rapportent qu'il surpasse significativement dSTL pour le maintien des marges de sécurité sous incertitude réelle. Pour un ingénieur robotique ou un intégrateur travaillant sur la navigation autonome, cette combinaison de garanties probabilistes formelles et d'optimisabilité par gradient constitue une brique potentielle pour des spécifications de sécurité certifiables en conditions opérationnelles. La STL est un outil standard de la vérification formelle de systèmes cyber-physiques depuis les années 2010, et ses extensions différentiables avaient déjà intéressé la communauté robotique pour l'optimisation de trajectoires. Le Crazyflie, drone open-source de la société suédoise Bitcraze, est une plateforme académique de référence appréciée pour sa dynamique instable, qui en fait un test exigeant pour toute approche de contrôle robuste. Ce travail est pour l'instant un preprint non relu par les pairs, sans code public annoncé et sans métriques quantitatives précises dans le résumé, ce qui invite à la prudence face aux affirmations de surperformance. Les équipes de motion planning sous incertitude dans les secteurs drones, véhicule autonome et manipulation industrielle sont les premières concernées par une éventuelle implémentation.

UEBitcraze (Suède, UE) fournit la plateforme drone de validation matérielle, ce qui ancre marginalement ce travail académique dans l'écosystème européen, mais sans impact opérationnel direct à ce stade de preprint non relu.

RecherchePaper
1 source
Mémoire épisodique pour robots à filtrage par surprise
2arXiv cs.RO 

Mémoire épisodique pour robots à filtrage par surprise

Des chercheurs ont publié sur arXiv (référence 2606.03787) une architecture de mémoire épisodique sélective pour robots généralistes, baptisée "Surprise-Gated Episodic Memory". Le principe central : utiliser la surprise bayésienne comme filtre pour décider quels événements méritent d'être mémorisés à long terme. Plutôt que de stocker l'intégralité du flux sensoriel, un mécanisme de calcul de surprise opère dans l'espace latent de V-JEPA-2, le modèle vidéo de Meta, jugé sémantiquement riche et indépendant du contexte de déploiement. Cette mémoire épisodique filtrée vient augmenter une mémoire spatiale fondée sur des graphes de scène 4D. Sur les benchmarks de question-answering robot, l'approche surpasse les méthodes de référence d'au moins 12 % sur les questions temporelles, spatiales et binaires, et bat également des méthodes supervisées ainsi que des approches non-causales, avec une méthode non supervisée et causale pour la segmentation d'événements. L'enjeu derrière ce résultat est directement opérationnel : un robot généraliste déployé en entrepôt, en hôpital ou sur un chantier reçoit des instructions ancrées dans des événements passés ("Retourne là où le colis a été mal placé hier soir"). Sans mémoire épisodique sélective, soit le robot stocke tout et sature sa mémoire, soit il oublie et échoue à répondre. La surprise bayésienne comme critère de filtrage est élégante parce qu'elle ne nécessite aucun superviseur humain ni liste de tâches futures a priori, elle capte l'inhabituel de façon autonome. Que cette méthode non supervisée et causale batte des méthodes supervisées est un signal fort : le sim-to-real gap pour la mémoire sémantique pourrait se réduire sans annotation coûteuse. Ce travail s'inscrit dans un courant de recherche en pleine accélération autour de la mémoire à long terme pour les robots mobiles, face aux limites des approches purement réactives popularisées par les VLA (Vision-Language-Action models). V-JEPA-2, publié par Meta en 2025, s'impose progressivement comme fondation visuelle pour plusieurs équipes de recherche extérieures à Meta. Sur le plan concurrentiel, des approches comparables sont développées par des groupes travaillant sur les représentations spatiales pour l'embodied AI (CMU, Stanford, ETH Zurich). L'étape suivante naturelle serait de valider la méthode sur du matériel réel en conditions non contrôlées, les résultats actuels restant des benchmarks, la question du passage à l'échelle sur des robots comme Figure 03 ou Unitree G1 en déploiement continu reste entière.

RecherchePaper
1 source
Traversée prudente de graphes à coûts d'arêtes stochastiques et corrélés pour une mobilité planétaire globale sûre
3arXiv cs.RO 

Traversée prudente de graphes à coûts d'arêtes stochastiques et corrélés pour une mobilité planétaire globale sûre

Des chercheurs en robotique planétaire ont publié sur arXiv (réf. 2505.13674v2) un nouvel algorithme de planification de trajectoire pour l'exploration de surface martienne longue distance. Le travail formalise ce problème sous la forme d'une variante du Problème du Voyageur Canadien (Canadian Traveller Problem, CTP) intégrant explicitement l'aversion au risque. L'objectif est de produire une politique de traversée minimisant le CVaR (Conditional Value-at-Risk), une mesure de risque héritée de la finance quantitative et reconnue pour son interprétabilité intuitive. L'algorithme proposé trouve des politiques CVaR-optimales exactes en s'appuyant sur des techniques de recherche AND-OR établies, initialement conçues pour la minimisation d'espérance, étendues ici au domaine de l'aversion au risque. La validation s'effectue sur des simulations de traversées longue distance construites à partir de vraies cartes orbitales de la surface martienne, avec des probabilités de franchissement issues de cartes de terrain réelles. Ce travail répond à un goulet d'étranglement opérationnel concret dans les missions planétaires actuelles : les opérateurs humains doivent identifier manuellement les segments à traversabilité incertaine et adapter les plans en temps réel selon les difficultés rencontrées. En formalisant ce processus décisionnel adaptatif, les auteurs ouvrent la voie à une planification stratégique plus autonome, réduisant la charge sur les équipes sol tout en maintenant un contrôle explicite du niveau de risque. L'aspect le plus notable est la prise en compte des corrélations de traversabilité entre zones de terrain similaire : lorsqu'une région ressemble à une autre déjà évaluée, l'incertitude n'est pas traitée comme indépendante. Les résultats montrent empiriquement que des détours exploratoires ("information-seeking detours") permettent de réduire significativement le risque dans ces configurations corrélées, ce qui n'est pas possible avec les approches classiques insensibles au risque. Le contexte immédiat est celui des rovers martiens comme Curiosity (actif depuis 2012) et Perseverance (2021), dont la planification de trajectoire reste aujourd'hui très humano-dépendante et limitée en portée quotidienne. Le CTP est un problème classique de la littérature en planification sous incertitude, mais son adaptation risk-averse pour la mobilité planétaire globale n'avait pas encore été traitée de façon formelle. Ce travail reste pour l'instant une contribution académique sans implémentation annoncée sur matériel réel ni collaboration institutionnelle (NASA, ESA) mentionnée explicitement. Les prochaines étapes naturelles seraient une intégration dans les outils de planification de mission existants et une validation sur des données de terrain analogues terrestres, étape habituelle avant tout déploiement sur véhicule spatial.

RecherchePaper
1 source
Filtrage de Kalman invariant pour l'estimation de pose étendue dans les systèmes articulés à corps rigides multi-IMU
4arXiv cs.RO 

Filtrage de Kalman invariant pour l'estimation de pose étendue dans les systèmes articulés à corps rigides multi-IMU

Une équipe de chercheurs a publié en juin 2026 sur arXiv (réf. 2606.25083) une nouvelle méthode d'estimation de pose étendue pour les systèmes articulés multi-IMU. Leur contribution centrale est l'"IterIEKF" (iterated Invariant Extended Kalman Filter), construit autour d'une nouvelle représentation mathématique baptisée "relative L-extended pose", définie sur un groupe de Lie adapté aux arbres cinématiques. Chaque corps rigide est équipé d'une IMU indépendante, et les contraintes articulaires sont intégrées comme pseudo-mesures sans bruit dans le filtre. Validé sur un bras robotique UR5e (Universal Robots) et un modèle de jambe humaine instrumentée, l'IterIEKF réduit l'erreur quadratique moyenne (RMSE) d'au moins 50 % par rapport au second meilleur filtre testé, toutes configurations confondues, avec une convergence plus rapide et une variabilité run-to-run sensiblement moindre. L'importance de ce résultat tient à un verrou longtemps ouvert : l'IEKF standard, développé pour garantir convergence et cohérence sous inobservabilité, était limité à un seul corps rigide. Le couplage de pose entre segments articulés rendait son extension non triviale, et exprimer des contraintes cinématiques dans le cadre invariant restait un problème sans solution propre. En levant ce verrou, les auteurs ouvrent la voie à des estimateurs embarqués fiables pour les bras industriels, les jambes d'humanoïdes, et les exosquelettes médicaux, sans recourir à des caméras extérieures ni à un référentiel absolu. Pour les intégrateurs B2B, cela signifie potentiellement une localisation proprioceptive robuste sur des robots déployés en environnement non structuré. L'IEKF invariant a été formalisé au milieu des années 2010 par Axel Barrau et Silvère Bonnabel (MINES ParisTech / INRIA), et constitue depuis un axe actif de la communauté française de robotique et de traitement du signal. Cette extension aux systèmes articulés s'inscrit directement dans cet héritage. Du côté applicatif, des acteurs comme Wandercraft (exosquelettes de marche, Paris) ou les équipes du LAAS-CNRS travaillant sur la locomotion humanoïde sont des utilisateurs naturels de tels estimateurs. La prochaine étape logique est une implémentation temps réel embarquée sur processeur contraint, ainsi qu'une validation sur des humanoïdes complets, où le nombre de corps et la dynamique de contact posent des défis supplémentaires non couverts par ce travail.

UECette extension de l'IEKF, cadre mathématique formalisé à MINES ParisTech/INRIA, ouvre une voie directe vers des estimateurs proprioceptifs embarqués pour des acteurs français comme Wandercraft (exosquelettes) et les équipes locomotion du LAAS-CNRS.

RecherchePaper
1 source