Aller au contenu principal
Pied électro-permanent magnétique à haute densité de charge pour robots quadrupèdes grimpeurs
RecherchearXiv cs.RO1h

Pied électro-permanent magnétique à haute densité de charge pour robots quadrupèdes grimpeurs

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont présenté un pied magnétique électro-permanent à haute densité de charge pour robots quadrupèdes, capable de grimper sur des surfaces ferromagnétiques verticales, inclinées ou au plafond. Le dispositif, appelé CHN-EPM (Circular Halbach-Net Electro-Permanent Magnet), génère une force d'adhérence maximale supérieure à 1 000 N avec un rapport charge/poids dépassant 200:1. Sa structure exploite un circuit magnétique tridimensionnel avec effet de concentration de flux, ce qui crée des chemins de flux parallèles distribués : concrètement, le système maintient une adhérence efficace même en contact partiel avec la surface, et reste relativement insensible aux variations d'entrefer. Un pilote de magnétisation associé à une stratégie de contrôle du courant impulsionnel en deux étapes régule précisément l'amplitude et la durée d'excitation, tandis qu'un capteur de pression flexible intégré assure un retour d'effort en temps réel pour surveiller les états d'attachement et de détachement. L'ensemble a été intégré sur le robot quadrupède commercial Unitree GO2, démontrant une locomotion stable sur des surfaces peintes, perforées et courbes.

Ce résultat est significatif pour plusieurs raisons industrielles. Le rapport 200:1 entre charge utile et poids propre du pied positionne cette technologie bien au-dessus des solutions à ventouses pneumatiques, qui restent dépendantes d'une source d'air comprimé et peinent sur les surfaces irrégulières ou perforées. La boucle de retour de force permet une commutation d'adhérence fiable dans des conditions de contact incertaines, ce qui est directement pertinent pour l'inspection de coques navales, de réservoirs industriels ou de structures métalliques en hauteur. Contrairement aux aimants permanents passifs, le caractère contrôlable de l'EPM permet de switcher entre adhérence et détachement sans consommation d'énergie continue, un avantage opérationnel notable pour les missions longue durée.

Les robots quadrupèdes capables de grimper sur des surfaces ferromagnétiques font l'objet d'un intérêt croissant depuis que Boston Dynamics a montré Spot dans des environnements industriels complexes, et que des équipes académiques ont exploré les configurations à ventouses ou à micro-crochets inspirés des geckos. Unitree, constructeur du GO2 utilisé ici, est devenu une plateforme de référence pour la recherche en locomotion avancée grâce à son accessibilité tarifaire. Les approches concurrentes incluent les systèmes à ventouses développés par des équipes coréennes et japonaises, ainsi que les pieds magnétiques passifs, moins agiles en détachement. Les auteurs n'annoncent pas de calendrier de commercialisation ou de déploiement industriel dans cet article de préprint arXiv ; les prochaines étapes logiques seraient une validation sur des géométries complexes réelles et l'intégration dans une boucle de contrôle autonome complète.

À lire aussi

Apprentissage par renforcement neuromorphique pour la locomotion de robots quadrupèdes sur terrain accidenté
1arXiv cs.RO 

Apprentissage par renforcement neuromorphique pour la locomotion de robots quadrupèdes sur terrain accidenté

Une équipe de chercheurs a publié mi-mai 2026 sur arXiv (réf. 2605.09595) un framework d'apprentissage par renforcement basé sur l'équilibrium propagation (EP) pour contrôler la locomotion d'un quadrupède Unitree A1 à 12 degrés de liberté sur terrain accidenté. Plutôt que la rétropropagation classique, ils substituent les gradients globaux par des règles d'apprentissage locales pilotées par les états neuronaux, compatibles avec les substrats neuromorphiques et de calcul en mémoire. Le contrôleur combine un générateur de motif central (CPG) bio-inspiré avec une politique d'ajustement postural résiduel, entraîné via une variante PPO (Proximal Policy Optimization) adaptée à l'EP avec un mécanisme de clipping bilatéral du ratio pour stabiliser les mises à jour lors de la relaxation. Les résultats montrent des performances comparables à une baseline PPO classique en taux de succès, suivi de vitesse, consommation des actionneurs et stabilité corporelle, tout en réduisant la mémoire GPU de 4,3× par rapport à la rétropropagation à travers le temps (BPTT). L'ensemble des expériences reste en simulation, aucun déploiement terrain n'est documenté dans la publication. L'enjeu structurel est clair : les politiques de locomotion RL actuelles sont entraînées hors-ligne en simulation massivement parallèle, puis figées au déploiement. Elles ne s'adaptent pas à l'usure des actionneurs, aux variations de charge utile, ou au drift mécanique sur robot réel, limites critiques pour une industrialisation. En remplaçant la rétropropagation par un apprentissage local compatible avec des puces neuromorphiques (type Intel Loihi), cette approche ouvre la voie à une adaptation continue on-robot à faible consommation, sans dépendance à un GPU externe. Le gain de 4,3× en mémoire est déjà tangible pour les équipes embarquées, même si la validation reste entièrement simulée. Ces travaux s'inscrivent dans l'intense activité autour de la locomotion quadrupède par RL, dominée par l'ETH Zurich sur ANYmal et les robots Unitree. L'équilibrium propagation, formalisé par Scellier et Bengio en 2017, reste peu exploré pour le contrôle continu haute dimension, c'est l'une des premières démonstrations sur un robot à 12 DOF. Les approches concurrentes pour l'adaptation en ligne incluent RMA (Rapid Motor Adaptation, UC Berkeley) et les politiques méta-adaptatives de type MAML. L'étape suivante critique serait de valider sur hardware réel avec une puce neuromorphique embarquée et de mesurer la consommation effective en watts, deux points absents de la publication actuelle.

RecherchePaper
1 source
Apprentissage de politique par phases pour la conduite de skateboard par des robots quadrupèdes via modulation linéaire par caractéristiques
2arXiv cs.RO 

Apprentissage de politique par phases pour la conduite de skateboard par des robots quadrupèdes via modulation linéaire par caractéristiques

Des chercheurs ont publié sur arXiv (2602.09370v2) un cadre d'apprentissage par renforcement baptisé PAPL (Phase-Aware Policy Learning), conçu pour permettre à des robots quadrupèdes de se déplacer sur une planche de skateboard. Le défi central est la nature cyclique et multi-phasée de l'activité : pousser, glisser et freiner mobilisent des objectifs de contrôle distincts et des interactions fortement dépendantes de la perception. Pour y répondre, PAPL intègre des couches FiLM (Feature-wise Linear Modulation) conditionnées par phase dans les réseaux acteur et critique de l'agent, permettant à une politique unifiée de capturer les comportements propres à chaque phase tout en partageant la connaissance générale du robot entre elles. Les évaluations en simulation valident la précision du suivi de commande, des études d'ablation quantifient la contribution de chaque composant, et les auteurs comparent l'efficacité locomotrice à des baselines pattes seules et pattes-roues. Un transfert sim-to-real est également démontré sur plateforme physique, bien que l'abstract ne précise pas le modèle de robot utilisé ni les métriques de performance obtenues. L'intérêt principal de cette approche tient à sa capacité à gérer des comportements multi-modaux au sein d'une politique unique, sans multiplier les modules spécialisés par phase. Utiliser un skateboard comme vecteur de locomotion est économique en énergie et compact, ce qui ouvre des perspectives concrètes dans des environnements industriels ou logistiques où les robots doivent couvrir de longues distances sans recharger. La démonstration du transfert simulation-réel est l'élément le plus scruté par la communauté robotique : le sim-to-real gap reste l'obstacle central à la généralisation des politiques apprises par renforcement, et chaque validation hardware crédibilise un cadre. À noter toutefois que l'abstract ne fournit aucune métrique chiffrée précise (vitesse, taux de succès, distance), ce qui limite l'évaluation indépendante des performances avant lecture du papier complet. PAPL s'inscrit dans un courant de recherche plus large visant à doter les robots à pattes de modes de mobilité hybrides ou étendus. Les couches FiLM, initialement développées pour le raisonnement visuel conditionné en apprentissage automatique, trouvent ici une application originale dans le contrôle moteur cyclique. Sur le plan concurrentiel, les plateformes pattes-roues comme l'ANYmal WE d'ANYbotics ou les variantes hybrides de Unitree explorent une voie différente : l'intégration des roues y est mécanique, non comportementale. L'approche PAPL est donc structurellement distincte et potentiellement complémentaire à ces architectures. Ce travail reste à ce stade un preprint arXiv sans déploiement commercial annoncé ; les suites logiques seraient une validation sur plateforme standardisée et une soumission en conférence majeure comme ICRA ou IROS 2026.

RecherchePaper
1 source
Filtre de Kalman étendu itératif invariant pour l'odométrie des robots quadrupèdes
3arXiv cs.RO 

Filtre de Kalman étendu itératif invariant pour l'odométrie des robots quadrupèdes

Une équipe de chercheurs a publié sur arXiv (référence 2604.15449, avril 2026) un algorithme open-source d'estimation d'état pour robots à pattes, fondé sur le filtre de Kalman étendu invariant itéré, ou IterIEKF. L'algorithme s'applique aux robots quadrupèdes et repose exclusivement sur des mesures proprioceptives : il exploite les contraintes cinématiques sur la vitesse des pieds en phase de contact et la vitesse exprimée dans le référentiel du châssis, sans capteurs extéroceptifs (caméras, lidar). Les évaluations ont été conduites via simulations numériques approfondies et sur des jeux de données réels. Les résultats montrent que l'IterIEKF surpasse l'IEKF classique, le filtre de Kalman basé SO(3) et sa variante itérée, aussi bien en précision qu'en cohérence statistique. L'intérêt de cette contribution réside dans la rigueur mathématique apportée à l'odométrie des robots à pattes, un problème notoirement difficile à cause des contacts intermittents, des glissements et des dynamiques non linéaires. Les filtres de Kalman étendus standard souffrent de deux hypothèses rarement vérifiées en pratique : linéarité des dynamiques et linéarité du modèle de mesure, toutes deux avec bruit gaussien. L'IEKF avait partiellement résolu le premier problème en opérant sur des groupes de Lie à dynamiques group-affines. Le travail présenté ici généralise cette approche à l'étape de mise à jour, en montrant que l'itération de cette étape préserve des propriétés de compatibilité analogues à celles du filtre linéaire classique. Pour un intégrateur ou un ingénieur robotique, cela se traduit par une localisation plus robuste aux conditions terrain, sans dépendance à la perception visuelle ni à l'infrastructure externe. Le filtre de Kalman étendu invariant (IEKF) a été formalisé théoriquement dans les années 2010, notamment par Barrau et Bonnabel, et appliqué depuis à des plateformes variées allant des drones aux robots humanoïdes. Sa variante itérée (IterIEKF) avait été proposée récemment dans [1], mais son application à la locomotion quadrupède et la mise à disposition en open-source constituent des étapes concrètes vers l'adoption industrielle. Les concurrents directs sur ce segment incluent des approches basées sur des facteurs graphiques (GTSAM, iSAM2) et des estimateurs hybrides vision-inertie comme VILENS ou Pronto. La disponibilité open-source de ce filtre ouvre la voie à une intégration directe dans des stacks de navigation pour plateformes comme ANYmal, Spot ou Go2.

UELes chercheurs français Barrau et Bonnabel, à l'origine de la théorie IEKF, sont cités comme fondateurs de cette approche ; la disponibilité open-source de l'IterIEKF renforce la boîte à outils accessible aux équipes de recherche et startups européennes travaillant sur la locomotion de robots à pattes.

RecherchePaper
1 source
Apprentissage de l'équilibre entre sécurité thermique des moteurs et performance locomotrice quadrupède par politique résiduelle
4arXiv cs.RO 

Apprentissage de l'équilibre entre sécurité thermique des moteurs et performance locomotrice quadrupède par politique résiduelle

Des chercheurs ont publié sur arXiv (référence 2605.27046) une méthode par apprentissage par renforcement pour intégrer la gestion thermique des moteurs dans la politique de locomotion d'un robot quadrupède. Le cadre d'entraînement proposé est structuré en deux étapes : une politique nominale est d'abord entraînée comme baseline capable de traverser des terrains variés, puis une politique résiduelle vient se superposer pour fournir des corrections d'actions en fonction de l'état thermique instantané de chaque actionneur. Le système repose sur un modèle thermique global (whole-body thermal model) intégré directement dans la boucle RL, qui met à jour les températures moteurs à chaque cycle. Les expériences physiques sur un Unitree A1 avec une charge utile de 3 kg montrent que le robot maintient une locomotion stable sur plusieurs types de terrain pendant plus de 13 minutes, contre environ 5 minutes avant surchauffe avec la politique nominale seule, soit un gain d'un facteur 2,6 sur la durée d'opération continue. La surchauffe des actionneurs est un facteur limitant concret pour les robots à pattes en déploiement prolongé, particulièrement sous charge utile, scénario typique en inspection industrielle, logistique ou search-and-rescue. La quasi-totalité des travaux académiques en RL pour la locomotion quadrupède optimisent vitesse, robustesse au terrain et stabilité, traitant les moteurs comme des systèmes sans contraintes thermiques. Ce papier démontre qu'une politique résiduelle thermiquement informée peut être ajoutée au-dessus d'une politique existante sans dégrader ses performances nominales à basse température : l'architecture ne remplace pas le comportement appris, elle lui superpose des corrections minimales, ce qui simplifie l'intégration et ouvre la voie à une modularité thermique applicable à d'autres plateformes. Le Unitree A1 est un quadrupède compact de recherche très répandu dans la communauté RL (actionneurs brushless, environ 12 kg, 12 DOF au total). Sur les plateformes commerciales comme Spot (Boston Dynamics) ou ANYmal (ANYbotics), la gestion thermique est généralement traitée au niveau firmware ou matériel, ce qui masque le problème aux chercheurs mais ne le résout pas pour les intégrateurs déployant des appareils sur des missions longues. Ce preprint n'a pas encore été évalué par les pairs. Les prolongements logiques incluent une validation sur des plateformes plus lourdes (Unitree B2, Go2) sous charges supérieures, ainsi que des politiques thermiques adaptatives pour des environnements à forte dissipation comme les pentes soutenues ou les obstacles répétitifs.

RecherchePaper
1 source