Filtres de Kalman neuronaux pondérés par fréquence

Filtre de Kalman neuronal à mécanisme d'attention pour l'estimation d'état des robots à pattes

39

1arXiv cs.RO

Filtre de Kalman neuronal à mécanisme d'attention pour l'estimation d'état des robots à pattes

Une équipe de chercheurs a publié sur arXiv (2601.18569v2) un filtre hybride baptisé AttenNKF (Attention-Based Neural-Augmented Kalman Filter), conçu pour améliorer l'estimation d'état sur les robots à pattes. Le glissement de pied constitue la principale source d'erreur dans ces systèmes : lorsqu'un pied glisse sur une surface, la mesure cinématique viole l'hypothèse de non-glissement et injecte un biais dans l'étape de mise à jour du filtre, dégradant l'estimation de position, vitesse et orientation. La solution augmente un InEKF (Invariant Extended Kalman Filter) avec un compensateur neuronal à mécanisme d'attention, qui infère l'erreur induite par le glissement en fonction de sa sévérité et l'applique en correction post-mise-à-jour sur l'état du filtre. Ce compensateur est entraîné dans un espace latent pour réduire la sensibilité aux échelles brutes des entrées et encourager des corrections structurées, tout en préservant la récursion mathématique de l'InEKF. L'enjeu est concret pour les équipes de locomotion et les intégrateurs industriels : l'estimation d'état est la brique fondamentale du contrôle d'un robot à pattes, et une erreur non corrigée se propage dans la boucle de contrôle jusqu'à provoquer des chutes ou des trajectoires aberrantes, notamment sur sols glissants, rampes ou surfaces variables en environnement d'usine. L'approche hybride filtres classiques plus réseau de neurones léger préserve les garanties mathématiques de l'InEKF tout en ajoutant une adaptabilité aux conditions non modélisées, sans reformuler entièrement le pipeline d'estimation. Les expériences montrent des performances supérieures aux estimateurs existants sous conditions de glissement, bien que les plateformes hardware testées ne soient pas précisées dans la version publiée, ce qui limite l'évaluation comparative. L'InEKF s'est imposé comme référence pour les robots à pattes grâce à des travaux de l'Université du Michigan vers 2019-2020 sur le bipède Cassie d'Agility Robotics, exploitant son invariance aux symétries de groupe de Lie. L'augmentation par réseaux neuronaux pour corriger les non-linéarités résiduelles est une direction active chez plusieurs groupes de recherche, dont ETH Zurich sur ANYmal, MIT et Carnegie Mellon. Les déploiements réels de Spot (Boston Dynamics), Digit (Agility Robotics) et Figure 02 font tous face au problème d'estimation sous glissement en conditions industrielles, ce qui donne à cette approche une pertinence directe pour le transfert sim-to-real vers des systèmes commerciaux. La prochaine étape naturelle sera une validation embarquée sous contraintes temps-réel sur des plateformes standardisées avec benchmarks publics.

RecherchePaper

1 source

Sécurité permissive par inférence vérifiable : filtres neuronaux en espace de croyance pour la robotique interactive

44

2arXiv cs.RO

Sécurité permissive par inférence vérifiable : filtres neuronaux en espace de croyance pour la robotique interactive

Des chercheurs ont déposé sur arXiv (arXiv:2606.02562v1) une méthode algorithmique visant à certifier formellement la sécurité des robots autonomes en interaction avec des humains. Le coeur du travail porte sur le "belief-space safety filter" (BeliefSF), un filtre de sécurité modulaire qui, contrairement aux approches classiques cantonnées à l'espace physique, raisonne simultanément sur la position du robot et sur ses croyances en temps réel concernant l'humain : ses préférences, ses objectifs, sa compétence et sa disposition à coopérer. Pour certifier cette architecture, les auteurs appliquent la prédiction conforme (conformal prediction), une technique statistique qui produit des garanties de sécurité à haute probabilité tout en tenant explicitement compte des erreurs d'inférence et d'approximation neuronale. La validation est réalisée sur un benchmark simulé d'interaction humain-véhicule, où le filtre certifié s'avère significativement moins conservatif qu'une baseline conformal prediction standard. L'enjeu industriel est direct : dans les scénarios de cobotique, de robots de livraison ou de véhicules autonomes partageant l'espace avec des piétons, les filtres de sécurité trop conservatifs dégradent l'efficacité opérationnelle et rendent le déploiement économiquement non viable. La difficulté jusqu'ici résidait dans le "curse of dimensionality" des espaces de croyance : plus le robot modélise finement l'incertitude humaine, plus l'espace d'état explose, rendant les garanties formelles quasi impossibles sans approximation neuronale coûteuse en fiabilité. En focalisant la vérification sur les régions où l'inférence est statistiquement fiable, les auteurs contournent cette contrainte sans alourdir la complexité d'échantillonnage, ce qui constitue une avancée méthodologique notable pour les intégrateurs cherchant des certifications de sécurité fonctionnelle (ISO 13849, IEC 62061). Le BeliefSF a été introduit comme concept dans des travaux antérieurs, mais sans garanties formelles exploitables, ce qui en limitait la portée au stade de la démonstration académique. Ce preprint comble ce manque en s'appuyant sur la prédiction conforme, une technique qui gagne rapidement du terrain dans la vérification de systèmes apprenants, notamment après des travaux récents de groupes comme MIT CSAIL et Stanford sur les Control Barrier Functions (CBF) à base de données. La prochaine étape critique reste la validation sur hardware réel, en dehors de la simulation, pour évaluer si les garanties tiennent face aux bruits capteurs et aux latences d'inférence propres au déploiement physique. Aucun partenaire industriel ni calendrier de transfert n'est mentionné dans ce preprint.

UECette méthode de certification formelle pourrait faciliter la conformité aux normes européennes de sécurité fonctionnelle (ISO 13849, IEC 62061) pour les intégrateurs de cobots et robots autonomes en Europe, sous réserve de validation hardware réelle.

RechercheOpinion

1 source

K-VARK : filtre de Kalman résiduel à variance et noyaux pour l'estimation sans capteur des forces dans les cobots

44

3arXiv cs.RO

K-VARK : filtre de Kalman résiduel à variance et noyaux pour l'estimation sans capteur des forces dans les cobots

Des chercheurs ont publié sur arXiv (référence 2512.13009v2) K-VARK, un filtre de Kalman adaptatif qui permet d'estimer les forces de contact dans les robots collaboratifs sans capteur de force dédié. L'algorithme combine des Primitives de Mouvement Noyau (Kernelized Movement Primitives, KMP) entraînées sur des trajectoires d'excitation optimisées avec un filtre de Kalman à bruit de mesure adaptatif. Validé sur un manipulateur collaboratif à 6 degrés de liberté (DoF), K-VARK atteint une réduction de plus de 20 % de l'erreur quadratique moyenne (RMSE) par rapport aux meilleures méthodes sensorless actuelles. Les tâches de validation incluent le polissage et l'assemblage, deux opérations industrielles qui exigent un contrôle précis des efforts appliqués sur la pièce. La difficulté centrale de l'estimation sensorless réside dans la modélisation des couples résiduels aux articulations : erreurs de frottement, dynamiques non linéaires, et variabilité selon la position en espace de travail. K-VARK répond à ce problème en capturant à la fois la moyenne prédictive et la variance hétéroscédastique dépendante de l'entrée, ce qui permet au filtre d'augmenter automatiquement le bruit de mesure dans les zones sous-représentées dans les données d'entraînement. Cette conscience de l'incertitude est un atout concret pour les intégrateurs : le robot sait quand il ne sait pas, et adapte sa confiance en conséquence. Le bruit de processus, lui, est réajusté en ligne par optimisation bayésienne variationnelle pour absorber les perturbations dynamiques. Combinés, ces deux mécanismes offrent une robustesse aux transitions brutales sans compromettre la précision en régime établi. L'estimation de force sans capteur est un enjeu majeur dans la conception des cobots (robots collaboratifs), car les capteurs force/couple six axes coûtent plusieurs milliers d'euros par bras et compliquent l'intégration mécanique. Les approches existantes s'appuient généralement sur des observateurs de type momentum ou des modèles dynamiques rigides, qui peinent à compenser la friction articulaire variable. K-VARK s'inscrit dans un courant de recherche qui cherche à substituer le hardware par de l'estimation probabiliste apprise, une tendance également visible chez Universal Robots (PolyScope X), Franka Robotics ou FANUC avec leur couche d'estimation d'effort. La méthode étant publiée en accès ouvert sans code associé annoncé, son adoption dépendra de la disponibilité d'implémentations de référence et de benchmarks sur des bras commerciaux standardisés.

UELes intégrateurs européens de cobots, dont Franka Robotics (Allemagne), pourraient réduire leurs coûts matériels en adoptant cette estimation probabiliste à la place des capteurs force/couple six axes, mais aucune implémentation de référence ni adoption industrielle n'est annoncée.

RecherchePaper

1 source

Génération d'actions robotiques continues et cohérentes par correspondance de flux sensible aux fréquences

42

4arXiv cs.RO

Génération d'actions robotiques continues et cohérentes par correspondance de flux sensible aux fréquences

Une équipe de recherche propose FAFM (Frequency-Aware Flow Matching), une méthode de génération d'actions robotiques présentée en préprint arXiv (2606.20135, juin 2026), qui reformule le problème du flow matching pour la manipulation robotique dans le domaine fréquentiel. Le principe : plutôt que de prédire directement des séquences d'actions discrètes (des "chunks"), FAFM applique une transformée en cosinus discrète (DCT) sur ces séquences pour les convertir en coefficients fréquentiels, effectue le flow matching sur ces coefficients, puis reconstruit des actions continues via expansion en base cosinus. Pour garantir la cohérence temporelle, la méthode ajoute une contrainte de type Sobolev sur la dérivée temporelle du premier ordre, ce qui pénalise les changements brusques et atténue les erreurs hautes fréquences. L'approche s'applique sans paramètres réseau supplémentaires, aussi bien aux politiques de flow matching autonomes qu'aux modèles vision-langage-action (VLA). Les résultats sont validés sur les benchmarks LapGym, LIBERO et évitement d'obstacles, ainsi qu'en déploiement réel sur un bras Franka. L'intérêt industriel est direct : la fragmentation des fréquences de contrôle est un problème concret lors de l'agrégation de données de démonstration provenant de robots différents (certains à 10 Hz, d'autres à 50 Hz), et les méthodes actuelles de diffusion policy ou de flow matching standard y sont explicitement vulnérables. Les actions temporellement incohérentes qui en résultent dégradent la stabilité du contrôle en boucle fermée, un facteur bloquant pour le déploiement en production. Le fait que FAFM améliore simultanément le taux de succès, la fluidité du mouvement, la robustesse aux biais mécaniques et la vitesse de convergence sans modifier l'architecture existante est une proposition de valeur claire pour les intégrateurs : pas de refonte du pipeline, pas de surcoût computationnel. La compatibilité avec les VLA est également notable, car ces modèles dominent les annonces récentes (pi-0 de Physical Intelligence, GR00T N2 de NVIDIA) et souffrent précisément de ce type d'artefacts temporels à l'inférence. Le flow matching s'est imposé ces dix-huit derniers mois comme alternative crédible à la diffusion policy (Chi et al., 2023, Columbia), avec des temps d'inférence plus courts et une meilleure expressivité multimodale. Les travaux récents de Physical Intelligence (pi-0, pi-0.5) et de Figure AI ont largement adopté ce paradigme pour leurs politiques générales. FAFM s'inscrit dans une tendance de raffinement de ces fondations plutôt que de rupture : on optimise la stabilité et la généralisation inter-fréquences, deux verrous identifiés lors des premiers déploiements industriels à grande échelle. La validation sur Franka reste modeste en termes de diversité de tâches, et le code est disponible sous revue anonyme, ce qui signifie que la méthode n'est pas encore auditée par la communauté. Les prochaines étapes naturelles seraient une validation sur des plateformes humanoïdes multi-articulées et sur des datasets hétérogènes à grande échelle, là où la question des fréquences mixtes est la plus aiguë.

RecherchePaper

1 source

Filtres de Kalman neuronaux pondérés par fréquence

À lire aussi

Filtre de Kalman neuronal à mécanisme d'attention pour l'estimation d'état des robots à pattes

Sécurité permissive par inférence vérifiable : filtres neuronaux en espace de croyance pour la robotique interactive

K-VARK : filtre de Kalman résiduel à variance et noyaux pour l'estimation sans capteur des forces dans les cobots

Génération d'actions robotiques continues et cohérentes par correspondance de flux sensible aux fréquences