Aller au contenu principal
RecherchearXiv cs.RO4h

Filtres de Kalman neuronaux pondérés par fréquence

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Une équipe de chercheurs a publié le 2 juin 2026 sur arXiv (arXiv:2606.02251) les travaux décrivant le FW-NKF, pour Frequency-Weighted Neural Kalman Filter, un filtre hybride qui combine estimation d'état classique et apprentissage profond pour supprimer les bruits périodiques et les interférences électromagnétiques qui dégradent les capteurs en conditions réelles. L'architecture intègre un opérateur de mise en forme spectrale causal directement dans le résidu de mesure du filtre de Kalman, tout en entraînant conjointement des réseaux de transition et d'observation sur l'espace latent. Testé sur quatre benchmarks hétérogènes, dont des systèmes chaotiques multi-dimensionnels de type Lorenz et de l'estimation de pose corporelle complète par unités inertielles (IMU), le FW-NKF affiche une réduction de l'erreur de localisation allant jusqu'à 10 % ainsi que des gains mesurables en précision d'orientation. Les études d'ablation confirment que la pondération fréquentielle et la modélisation latente profonde contribuent chacune de façon indépendante aux gains observés.

Pour les intégrateurs de systèmes robotiques et les équipes d'autonomie, ce résultat est pertinent car les filtres de Kalman classiques, y compris leurs variantes étendues (EKF), ne disposent d'aucun mécanisme explicite pour atténuer les composantes de bruit bande-limitée, vibrations de capteurs ou interférences RF, qui sont pourtant omniprésentes sur les plateformes industrielles, les drones et les robots humanoïdes. Une réduction de 10 % de l'erreur de localisation reste modeste mais significative dans des contextes où la dérive d'odométrie est cumulative, notamment pour la navigation longue durée ou la manipulation précise. Cela suggère qu'une intégration légère d'un filtre spectral appris peut se substituer à des chaînes de prétraitement signal ad hoc souvent coûteuses à calibrer.

Le filtre de Kalman, introduit en 1960, reste la colonne vertébrale de l'estimation d'état en robotique et en aérospatiale. Les variantes Deep Kalman Filter (DKF) ont tenté depuis 2015-2016 d'y greffer des représentations apprises pour gérer la non-linéarité des dynamiques, mais sans traiter explicitement le domaine fréquentiel. Le FW-NKF s'inscrit dans cette lignée en comblant ce manque précis. La publication est un preprint non encore soumis à peer-review, et les benchmarks choisis, bien que diversifiés, ne couvrent pas de plateformes hardware réelles comme les IMU de Boston Dynamics ou les capteurs embarqués sur Figure ou Unitree, ce qui laisse ouverte la question du sim-to-real gap. Les prochaines étapes naturelles seraient une validation sur robot physique et une comparaison directe avec des filtres adaptatifs classiques comme le Sage-Husa.

À lire aussi

Filtre de Kalman neuronal à mécanisme d'attention pour l'estimation d'état des robots à pattes
1arXiv cs.RO 

Filtre de Kalman neuronal à mécanisme d'attention pour l'estimation d'état des robots à pattes

Une équipe de chercheurs a publié sur arXiv (2601.18569v2) un filtre hybride baptisé AttenNKF (Attention-Based Neural-Augmented Kalman Filter), conçu pour améliorer l'estimation d'état sur les robots à pattes. Le glissement de pied constitue la principale source d'erreur dans ces systèmes : lorsqu'un pied glisse sur une surface, la mesure cinématique viole l'hypothèse de non-glissement et injecte un biais dans l'étape de mise à jour du filtre, dégradant l'estimation de position, vitesse et orientation. La solution augmente un InEKF (Invariant Extended Kalman Filter) avec un compensateur neuronal à mécanisme d'attention, qui infère l'erreur induite par le glissement en fonction de sa sévérité et l'applique en correction post-mise-à-jour sur l'état du filtre. Ce compensateur est entraîné dans un espace latent pour réduire la sensibilité aux échelles brutes des entrées et encourager des corrections structurées, tout en préservant la récursion mathématique de l'InEKF. L'enjeu est concret pour les équipes de locomotion et les intégrateurs industriels : l'estimation d'état est la brique fondamentale du contrôle d'un robot à pattes, et une erreur non corrigée se propage dans la boucle de contrôle jusqu'à provoquer des chutes ou des trajectoires aberrantes, notamment sur sols glissants, rampes ou surfaces variables en environnement d'usine. L'approche hybride filtres classiques plus réseau de neurones léger préserve les garanties mathématiques de l'InEKF tout en ajoutant une adaptabilité aux conditions non modélisées, sans reformuler entièrement le pipeline d'estimation. Les expériences montrent des performances supérieures aux estimateurs existants sous conditions de glissement, bien que les plateformes hardware testées ne soient pas précisées dans la version publiée, ce qui limite l'évaluation comparative. L'InEKF s'est imposé comme référence pour les robots à pattes grâce à des travaux de l'Université du Michigan vers 2019-2020 sur le bipède Cassie d'Agility Robotics, exploitant son invariance aux symétries de groupe de Lie. L'augmentation par réseaux neuronaux pour corriger les non-linéarités résiduelles est une direction active chez plusieurs groupes de recherche, dont ETH Zurich sur ANYmal, MIT et Carnegie Mellon. Les déploiements réels de Spot (Boston Dynamics), Digit (Agility Robotics) et Figure 02 font tous face au problème d'estimation sous glissement en conditions industrielles, ce qui donne à cette approche une pertinence directe pour le transfert sim-to-real vers des systèmes commerciaux. La prochaine étape naturelle sera une validation embarquée sous contraintes temps-réel sur des plateformes standardisées avec benchmarks publics.

RecherchePaper
1 source
2arXiv cs.RO 

Sécurité permissive par inférence vérifiable : filtres neuronaux en espace de croyance pour la robotique interactive

Des chercheurs ont déposé sur arXiv (arXiv:2606.02562v1) une méthode algorithmique visant à certifier formellement la sécurité des robots autonomes en interaction avec des humains. Le coeur du travail porte sur le "belief-space safety filter" (BeliefSF), un filtre de sécurité modulaire qui, contrairement aux approches classiques cantonnées à l'espace physique, raisonne simultanément sur la position du robot et sur ses croyances en temps réel concernant l'humain : ses préférences, ses objectifs, sa compétence et sa disposition à coopérer. Pour certifier cette architecture, les auteurs appliquent la prédiction conforme (conformal prediction), une technique statistique qui produit des garanties de sécurité à haute probabilité tout en tenant explicitement compte des erreurs d'inférence et d'approximation neuronale. La validation est réalisée sur un benchmark simulé d'interaction humain-véhicule, où le filtre certifié s'avère significativement moins conservatif qu'une baseline conformal prediction standard. L'enjeu industriel est direct : dans les scénarios de cobotique, de robots de livraison ou de véhicules autonomes partageant l'espace avec des piétons, les filtres de sécurité trop conservatifs dégradent l'efficacité opérationnelle et rendent le déploiement économiquement non viable. La difficulté jusqu'ici résidait dans le "curse of dimensionality" des espaces de croyance : plus le robot modélise finement l'incertitude humaine, plus l'espace d'état explose, rendant les garanties formelles quasi impossibles sans approximation neuronale coûteuse en fiabilité. En focalisant la vérification sur les régions où l'inférence est statistiquement fiable, les auteurs contournent cette contrainte sans alourdir la complexité d'échantillonnage, ce qui constitue une avancée méthodologique notable pour les intégrateurs cherchant des certifications de sécurité fonctionnelle (ISO 13849, IEC 62061). Le BeliefSF a été introduit comme concept dans des travaux antérieurs, mais sans garanties formelles exploitables, ce qui en limitait la portée au stade de la démonstration académique. Ce preprint comble ce manque en s'appuyant sur la prédiction conforme, une technique qui gagne rapidement du terrain dans la vérification de systèmes apprenants, notamment après des travaux récents de groupes comme MIT CSAIL et Stanford sur les Control Barrier Functions (CBF) à base de données. La prochaine étape critique reste la validation sur hardware réel, en dehors de la simulation, pour évaluer si les garanties tiennent face aux bruits capteurs et aux latences d'inférence propres au déploiement physique. Aucun partenaire industriel ni calendrier de transfert n'est mentionné dans ce preprint.

UECette méthode de certification formelle pourrait faciliter la conformité aux normes européennes de sécurité fonctionnelle (ISO 13849, IEC 62061) pour les intégrateurs de cobots et robots autonomes en Europe, sous réserve de validation hardware réelle.

RechercheOpinion
1 source
Filtre de Kalman étendu itératif invariant pour l'odométrie des robots quadrupèdes
3arXiv cs.RO 

Filtre de Kalman étendu itératif invariant pour l'odométrie des robots quadrupèdes

Une équipe de chercheurs a publié sur arXiv (référence 2604.15449, avril 2026) un algorithme open-source d'estimation d'état pour robots à pattes, fondé sur le filtre de Kalman étendu invariant itéré, ou IterIEKF. L'algorithme s'applique aux robots quadrupèdes et repose exclusivement sur des mesures proprioceptives : il exploite les contraintes cinématiques sur la vitesse des pieds en phase de contact et la vitesse exprimée dans le référentiel du châssis, sans capteurs extéroceptifs (caméras, lidar). Les évaluations ont été conduites via simulations numériques approfondies et sur des jeux de données réels. Les résultats montrent que l'IterIEKF surpasse l'IEKF classique, le filtre de Kalman basé SO(3) et sa variante itérée, aussi bien en précision qu'en cohérence statistique. L'intérêt de cette contribution réside dans la rigueur mathématique apportée à l'odométrie des robots à pattes, un problème notoirement difficile à cause des contacts intermittents, des glissements et des dynamiques non linéaires. Les filtres de Kalman étendus standard souffrent de deux hypothèses rarement vérifiées en pratique : linéarité des dynamiques et linéarité du modèle de mesure, toutes deux avec bruit gaussien. L'IEKF avait partiellement résolu le premier problème en opérant sur des groupes de Lie à dynamiques group-affines. Le travail présenté ici généralise cette approche à l'étape de mise à jour, en montrant que l'itération de cette étape préserve des propriétés de compatibilité analogues à celles du filtre linéaire classique. Pour un intégrateur ou un ingénieur robotique, cela se traduit par une localisation plus robuste aux conditions terrain, sans dépendance à la perception visuelle ni à l'infrastructure externe. Le filtre de Kalman étendu invariant (IEKF) a été formalisé théoriquement dans les années 2010, notamment par Barrau et Bonnabel, et appliqué depuis à des plateformes variées allant des drones aux robots humanoïdes. Sa variante itérée (IterIEKF) avait été proposée récemment dans [1], mais son application à la locomotion quadrupède et la mise à disposition en open-source constituent des étapes concrètes vers l'adoption industrielle. Les concurrents directs sur ce segment incluent des approches basées sur des facteurs graphiques (GTSAM, iSAM2) et des estimateurs hybrides vision-inertie comme VILENS ou Pronto. La disponibilité open-source de ce filtre ouvre la voie à une intégration directe dans des stacks de navigation pour plateformes comme ANYmal, Spot ou Go2.

UELes chercheurs français Barrau et Bonnabel, à l'origine de la théorie IEKF, sont cités comme fondateurs de cette approche ; la disponibilité open-source de l'IterIEKF renforce la boîte à outils accessible aux équipes de recherche et startups européennes travaillant sur la locomotion de robots à pattes.

RecherchePaper
1 source
Filtres de Koopman robustes pour un apprentissage par renforcement acteur-critique sûr
4arXiv cs.RO 

Filtres de Koopman robustes pour un apprentissage par renforcement acteur-critique sûr

Une équipe a déposé sur arXiv (2605.26452) Robust Koopman-CBF SAC, un framework de RL sûr pour la robotique qui s'affranchit du modèle dynamique pré-établi. La méthode apprend un prédicteur de Koopman à dimension finie depuis des trajectoires d'expérience, construit des Control Barrier Functions (CBF) dans l'espace "levé" où la dynamique non linéaire devient affine, puis les applique via une couche de programme quadratique (QP) qui corrige minimalement les actions de la politique Soft Actor-Critic (SAC). Une marge résiduelle projetée, estimée sur des rollouts de validation distincts de l'entraînement, compense les erreurs d'approximation inhérentes au modèle Koopman fini. Sur le benchmark CartPole (stabilisation et suivi de trajectoire), le système atteint zéro violation de contrainte tout en égalant ou dépassant les performances d'un SAC non contraint. Sur les tâches de locomotion haute dimension de Safety Gymnasium, les violations diminuent dans certains scénarios, mais les barrières de vitesse du premier ordre et les modèles EDMD linéaires révèlent des limites structurelles non résolues. L'enjeu est concret pour les intégrateurs: déployer des robots autonomes en environnement industriel exige que les contraintes dures (zones interdites, limites articulaires, forces maximales) ne soient jamais violées, y compris pendant la phase d'entraînement et pas seulement en déploiement. Les approches existantes imposent soit un modèle dynamique précis, difficile à obtenir pour des robots complexes, soit des certificats de sécurité conçus à la main par des experts contrôle. Ici, la dynamique est inférée depuis les données, et la linéarité de l'espace Koopman rend les CBF algébriquement tractables sans expertise manuelle. Le zéro violation sur CartPole est reproductible (code disponible sur GitHub), pas une démonstration sélectionnée. Les limitations exposées sur Safety Gymnasium délimitent honnêtement le périmètre de validité: systèmes à dynamique quasi-linéaire et contraintes de vitesse simples, ce qui est plus informatif que beaucoup de publications dans ce domaine. L'opérateur de Koopman a été réintroduit en robotique et en contrôle vers 2017-2020 notamment via les travaux de Brunton, Kaiser et Kutz sur l'EDMD (Extended Dynamic Mode Decomposition). Les CBF ont été formalisées par Aaron Ames et ses collaborateurs à Caltech puis au Georgia Tech, avec une influence croissante dans le contrôle certifié depuis 2017. Dans le RL sûr, les méthodes de référence comme CPO (Constrained Policy Optimization) et TRPO-Lagrangien peinent à garantir des contraintes dures pendant l'entraînement. Ce travail se positionne explicitement comme pont entre ces deux communautés. Les extensions annoncées incluent des CBF d'ordre supérieur pour mieux traiter les contraintes de vitesse, et des modèles Koopman non linéaires ou multi-pas pour les locomotions haute dimension.

RecherchePaper
1 source