Aller au contenu principal
RecherchearXiv cs.RO2h

Robustesse des interactions robot-environnement grâce à des degrés de liberté passifs compliants : une approche hybride position-force avec linéarisation par retour d'état

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Traduction/synthèse de l'article :

Une équipe de recherche propose une nouvelle architecture de contrôle hybride position-force pour bras robotiques, décrite dans un article publié sur arXiv (2607.00571v1). Contrairement aux approches classiques qui reposent uniquement sur la rétroaction active, les capteurs de force et le réglage de gains, cette méthode combine une linéarisation par retour d'état avec un degré de liberté passif compliant intégré à l'effecteur terminal, sous forme d'une interface physique ressort-amortisseur. Cette interface stocke et dissipe l'énergie d'impact directement au point de contact, avant que les chocs haute fréquence ne se propagent vers les articulations actionnées et la boucle de contrôle en force. L'approche a été évaluée sous MATLAB/Simulink sur un manipulateur planaire à 2 degrés de liberté, avec trois configurations d'effecteur comparées : rigide, ressort seul, et ressort-amortisseur. En environnement fixe, la configuration ressort-amortisseur réduit l'écart-type de l'erreur de force tangentielle de 36,5%. En environnement variable, elle réduit l'écart-type de l'erreur de force normale de 25,4% et celui de l'erreur de vitesse normale de 41,1%, avec une réponse de couple articulaire plus lisse.

L'enjeu dépasse le simple exercice académique : les interactions robot-environnement en milieu dynamique ou non structuré, chocs, vibrations, incertitudes de géométrie de contact, restent un point faible des architectures de contrôle en force purement actives, qui peinent à absorber les transitoires avant qu'ils ne perturbent la boucle de commande. En ramenant une part de l'amortissement au niveau mécanique plutôt que purement logiciel, cette approche s'inscrit dans une tendance de fond de la robotique de manipulation : compenser les limites de la rétroaction pure par de la compliance physique, moins coûteuse en calcul et plus robuste aux incertitudes de modèle. Pour les intégrateurs travaillant sur des tâches de contact (assemblage, ébavurage, manipulation en environnement incertain), cela ouvre une piste de conception hybride matériel-logiciel plutôt qu'un simple ajustement des gains de commande.

Ce travail s'inscrit dans la lignée des recherches en contrôle d'impédance et en compliance passive, qui cherchent depuis plusieurs décennies à concilier précision de positionnement et sécurité des interactions physiques. Ici, la validation reste limitée à la simulation, sur un bras plan à seulement deux degrés de liberté, ce qui est loin des manipulateurs industriels à six axes ou des bras humanoïdes multi-DOF utilisés en conditions réelles. Les auteurs ne précisent pas de calendrier de validation expérimentale sur banc physique, étape généralement nécessaire avant tout transfert vers l'industrie, ni de comparaison directe avec les architectures de contrôle d'impédance déjà déployées commercialement.

Dans nos dossiers

À lire aussi

Géwu : un environnement interactif en ligne pour l'apprentissage par renforcement en robotique
1arXiv cs.RO 

Géwu : un environnement interactif en ligne pour l'apprentissage par renforcement en robotique

Une équipe de chercheurs a publié le 23 avril 2026 Web-Gewu (arXiv:2604.17050), une plateforme pédagogique de robotique conçue pour permettre l'entraînement par renforcement (RL) directement depuis un navigateur web, sans installation locale. L'architecture repose sur un modèle cloud-edge-client s'appuyant sur WebRTC : toute la simulation physique et l'entraînement RL sont déportés sur un nœud edge, tandis que le serveur cloud ne joue qu'un rôle de relais de signalisation léger. La communication entre l'apprenant et le nœud de calcul s'effectue en pair-à-pair (P2P), avec une latence bout-en-bout annoncée comme faible, sans que des chiffres précis soient fournis dans le préprint. Les apprenants visualisent en temps réel les courbes de récompense RL et interagissent avec plusieurs formes de robots simulés, le tout via un protocole de communication de commandes prédéfini. L'intérêt de cette approche est structurel : elle attaque directement les deux verrous qui freinent l'enseignement de la robotique incarnée à grande échelle. D'un côté, les solutions cloud centralisées existantes entraînent des coûts GPU et de bande passante prohibitifs pour un déploiement massif en contexte éducatif. De l'autre, le calcul purement local bute sur les limitations matérielles des apprenants, souvent sans GPU dédié. En déplaçant la charge vers un nœud edge mutualisé et en réduisant le cloud à un simple relais, Web-Gewu réduit significativement le coût marginal par apprenant. Pour les institutions qui cherchent à former des ingénieurs au RL appliqué à la robotique, c'est un argument concret, même si la robustesse à l'échelle reste à démontrer hors environnement de laboratoire. Ce travail s'inscrit dans une tendance plus large de démocratisation des outils de simulation robotique, portée notamment par des environnements comme Isaac Sim (NVIDIA), MuJoCo (DeepMind/Google) ou encore Genesis, tous nécessitant des ressources locales ou des accès cloud coûteux. Web-Gewu se positionne dans un créneau différent, celui de la formation et de l'expérimentation accessible, plutôt que de la recherche haute performance. Le code source n'est pas encore public au moment de la soumission, et la plateforme reste au stade de prototype académique avec une instance de démonstration exposée à l'adresse IP indiquée dans le papier. Les prochaines étapes naturelles seraient une évaluation quantitative de la latence, une montée en charge sur plusieurs dizaines d'apprenants simultanés, et une ouverture du code pour permettre un déploiement institutionnel autonome.

RecherchePaper
1 source
Impression 3D de robots auto-pliants à actionnement passif avec modules fonctionnels intégrés
2arXiv cs.RO 

Impression 3D de robots auto-pliants à actionnement passif avec modules fonctionnels intégrés

Des chercheurs ont soumis sur arXiv (référence 2605.04757, mai 2025) une méthode de fabrication de robots auto-pliants à partir de développés plats imprimés en 3D dans un PLA conducteur. Le principe repose sur des élastiques acheminés à travers des crochets intégrés: en libérant leur énergie mécanique, ils replient la feuille en géométries tridimensionnelles préprogrammées, sans aucun stimulus externe (ni chaleur, ni lumière, ni humidité). L'état plat avant déploiement autorise le positionnement précis de l'électronique et des aimants. Le même substrat sert d'électrode pour la détection tactile capacitive et supporte une palette I/O réutilisable équipée de capteurs Hall et de moteurs ERM (masses excentriques rotatives), assurant la détection d'ancrage et l'actionnement par vibration. L'équipe publie également un modèle analytique fermé qui équilibre rigidité des charnières et moment des élastiques pour prédire les angles de pliage à l'équilibre; validé expérimentalement, ce modèle produit une carte de conception reliant épaisseur de charnière, taille des élastiques et espacement des crochets aux angles cibles. Trois démonstrateurs ont été réalisés: un cube polyédrique illustrant le potentiel pour des collectifs modulaires, un préhenseur déployable, et un doigt à tendons. La fabrication par origami robotique dépendait jusqu'ici de stimuli exogènes: polymères à mémoire de forme activés thermiquement, hydrogels hygroscopiques, ou bilames sous UV. L'approche élastique s'affranchit de ces contraintes en utilisant uniquement du PLA conducteur standard, simplifiant l'industrialisation et réduisant les coûts. Le modèle analytique constitue un apport concret: il transforme la conception de structures pliables d'un processus empirique en démarche prédictive, limitant les itérations de prototypage. La convergence "substrat = électrode = structure mécanique" réduit par ailleurs le nombre de composants discrets, un avantage direct pour les intégrateurs de systèmes modulaires ou de robots à bas coût. Ce travail s'inscrit dans le courant actif de la robotique origami, porté notamment par le Wyss Institute de Harvard et le CSAIL du MIT. La singularité de l'approche tient à l'énergie élastique passive sur PLA conducteur, distincte des voies pneumatiques ou magnétiques couramment explorées. Il s'agit d'un preprint académique sans produit commercialisé ni déploiement annoncé: les trois démonstrateurs restent des preuves de concept. Les prochaines étapes naturelles porteraient sur la durabilité mécanique sur cycles répétés et la mise à l'échelle des collectifs modulaires. En Europe, des acteurs comme Enchanted Tools ou des laboratoires tels que le LIRMM pourraient trouver dans cette méthode de fabrication un levier pertinent pour réduire les coûts de prototypage.

UEDes laboratoires européens comme le LIRMM et des startups comme Enchanted Tools pourraient exploiter cette méthode de fabrication origami passive pour réduire les coûts de prototypage de robots modulaires.

RecherchePaper
1 source
Apprentissage par renforcement avec estimateur de dynamique interne pour la manipulation aérienne en environnement incertain
3arXiv cs.RO 

Apprentissage par renforcement avec estimateur de dynamique interne pour la manipulation aérienne en environnement incertain

Des chercheurs ont publié sur arXiv (preprint 2606.16621) une architecture de contrôle hiérarchique pour manipulateurs aériens, visant à résoudre l'un des problèmes les plus épineux de la robotique de terrain : faire travailler un bras articulé monté sur drone sans que les mouvements du bras ne déstabilisent l'engin, même quand la charge utile varie de façon imprévue. Le système combine un apprentissage par renforcement (RL) en boucle externe avec un estimateur de dynamique en boucle interne. La couche RL traduit des cibles en 6 degrés de liberté (DOF) pour l'effecteur terminal en commandes coordonnées pour l'ensemble du corps de l'engin, sans nécessiter un modèle dynamique couplé précis. La boucle interne prend le relais pour compenser en temps réel les perturbations inertielles transitoires, notamment lors de changements brusques de payload ou de mouvements rapides du bras à 3-DOF. Les expériences matérielles ont été conduites sur un quadrotor instrumenté à cet effet, dans des conditions de charge variable. Comparée à deux baselines de référence (RL+PID et RL+INDI+PID), l'approche réduit l'erreur de suivi de l'effecteur terminal et améliore le taux de succès des tâches. Ce résultat est pertinent parce que le couplage dynamique bras-drone reste le principal frein à la manipulation aérienne fiable en conditions réelles : chaque mouvement du bras modifie le centre de masse et génère des couples parasites que les contrôleurs classiques peinent à absorber. En séparant la couche d'apprentissage (qui gère la coordination tâche-corps) de la couche d'estimation (qui absorbe les incertitudes à basse latence), les auteurs proposent une architecture modulaire qui ne dépend pas d'un modèle système précis, ce qui simplifie le passage du simulateur au matériel réel. Pour les intégrateurs industriels qui ciblent l'inspection de structures, la maintenance d'infrastructures ou la construction en hauteur, c'est un verrou technique concret qui se desserre. Le domaine de la manipulation aérienne est encore largement académique, avec des contributions dispersées entre laboratoires européens, américains et asiatiques, sans acteur dominant identifié à ce stade. Côté français, Alerion et quelques spin-offs de l'ISAE-SUPAERO ou de l'ENAC travaillent sur des drones à haute précision, mais sans manipulateur embarqué à ce niveau de sophistication. Ce travail reste un preprint non encore soumis à revue par les pairs, et les expériences rapportées portent sur un prototype unique dans un environnement contrôlé. Les métriques de succès ne sont pas détaillées quantitativement dans le résumé disponible, ce qui rend difficile toute comparaison directe avec l'état de l'art publié. La prochaine étape logique serait une validation sur des tâches réelles en extérieur avec des charges plus lourdes.

UELes laboratoires français actifs sur les drones de précision (Alerion, ISAE-SUPAERO, ENAC) pourraient s'appuyer sur cette architecture modulaire pour progresser vers la manipulation aérienne embarquée, mais aucun impact direct n'est établi à ce stade.

RecherchePaper
1 source
S-Cheetah : un robot quadrupède innovant avec une colonne vertébrale active à 3 degrés de liberté pour une locomotion agile
4arXiv cs.RO 

S-Cheetah : un robot quadrupède innovant avec une colonne vertébrale active à 3 degrés de liberté pour une locomotion agile

Des chercheurs du laboratoire Himmy Robotics ont présenté S-Cheetah, un robot quadrupède doté d'une colonne vertébrale active à 3 degrés de liberté (DOF) reproduisant la flexion sagittale, la flexion latérale et la rotation axiale des félins. Publié le 28 mai 2026 sur arXiv (preprint 2605.27909), le système atteint 6,9 m/s en galop rotatif G2 et un taux de rotation sur place de 7,2 rad/s. Pour exploiter pleinement cette architecture mécanique, l'équipe a développé un framework d'apprentissage par renforcement (RL) combinant un curriculum d'accélération progressive et des fonctions de récompense spécifiques : récompense de galop, d'ondulation spinale et de direction spinale. Le robot exhibe également une capacité émergente de redressement aérien inspirée des félins, atterrissant sur ses quatre pattes depuis n'importe quelle orientation en chute libre. La majorité des robots quadrupèdes intègrent aujourd'hui des colonnes actives à 1 ou 2 DOF pour limiter la complexité de contrôle, sacrifiant ainsi la richesse de mouvement observée chez les animaux biologiques. S-Cheetah tente de combler cet écart : un spine tri-axial complet avait jusqu'ici été évité car il complique radicalement la planification du mouvement. Le principal apport technique réside dans le fait que le framework RL force l'engagement actif de la colonne plutôt que de la laisser passive. La capacité de redressement aérien, non programmée explicitement mais émergente, renforce la thèse que des curricula de récompense bien construits peuvent capturer des dynamiques corporelles complexes et réduire le sim-to-real gap pour des architectures mécaniques atypiques. S-Cheetah s'inscrit dans la lignée du MIT Cheetah, d'ANYmal (ETH Zurich / ANYbotics) et des plateformes Unitree (B2, Go2), dont la plupart utilisent un tronc rigide ou une articulation spinale à 1 DOF. Ce travail reste un preprint non encore évalué par les pairs, sans pilote industriel ni commercialisation annoncés. Les performances proviennent de tests en laboratoire et les vidéos sélectionnées ne permettent pas encore d'évaluer la robustesse en conditions réelles non structurées. Les prochaines étapes, selon la page projet himmy-robotics.github.io/scheetah, devraient porter sur des tâches locomotrices plus complexes et des évaluations en environnement extérieur.

RecherchePaper
1 source