RecherchearXiv cs.RO2h

Commande en boucle fermée de bras continus en spirale logarithmique par compensation du Jacobien, adaptée à la morphologie

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié en juin 2026 sur arXiv (arXiv:2606.26188) le premier cadre de contrôle en boucle fermée spécifique à la morphologie pour bras continus à spirale logarithmique. Ces manipulateurs souples, à actionnement tendineux segmenté, s'appuient sur un squelette central avec routage équilatéral des tendons et ont été modélisés dans le simulateur MuJoCo pour capturer la compliance conique et les dynamiques de contact. La contribution centrale est la dérivation d'un Jacobien analytique en espace des tâches, directement extrait de la cinématique spirale, couplé à une compensation d'erreur Jacobienne en ligne combinant une mise à jour sécante de Broyden et un filtre de Kalman. Le contrôleur est validé en simulation planaire et spatiale sur des tâches de suivi de trajectoire, de régulation d'attitude, de rejet de perturbations, de suivi de position 3D et de contrôle simultané position-orientation. Par rapport à la baseline piecewise-constant-curvature (PCC), la méthode réduit systématiquement les erreurs de suivi, supprime la dérive d'attitude et maintient une erreur d'estimation Jacobienne bornée.

L'apport principal est de combler un vide critique : les robots à spirale logarithmique précédemment décrits disposaient d'une fabrication scalable et d'une préhension polyvalente, mais n'avaient ni cinématique inverse ni contrôle en boucle fermée, ce qui les cantonnait à des démonstrations en boucle ouverte. La combinaison Broyden-Kalman permet de corriger en continu les erreurs de modélisation dues aux déformations non linéaires, aux contacts et aux désaccords géométriques, problèmes structurels des robots souples sous-actionnés. Il faut cependant noter que la validation reste entièrement simulée : aucun prototype physique n'est rapporté, ce qui laisse entier le défi du sim-to-real, particulièrement sensible sur des structures souples à compliance variable.

La spirale logarithmique est une morphologie omniprésente dans le vivant (vrilles, tentacules, coquilles) et explorée depuis plusieurs années en robotique des continuum comme alternative aux bras rigides pour opérer en espaces confinés ou autour d'objets fragiles. Les travaux antérieurs avaient démontré la fabricabilité de ces structures mais butaient sur le contrôle précis. Dans le paysage des robots continus, les concurrents directs incluent les approches à modèle PCC classique (largement étudié depuis les années 2000) et les bras pneumatiques de type Festo ou les structures hydrogel. En Europe, Pollen Robotics (France) travaille sur des architectures souples bien qu'avec une philosophie différente. La suite logique annoncée par les auteurs est l'implémentation sur hardware réel et l'intégration de méthodes d'apprentissage pour augmenter le contrôle analytique.

Dans nos dossiers

Pollen Robotics — Reachy arXiv cs.RO

À lire aussi

1arXiv cs.RO

Apprentissage par renforcement sur graphe adapté à la morphologie pour la locomotion de robots tenségrité

Des chercheurs ont publié sur arXiv (référence 2510.26067, version 2, octobre 2025) un framework d'apprentissage par renforcement intégrant un réseau de neurones à graphes (GNN) dans l'algorithme Soft Actor-Critic (SAC) pour contrôler la locomotion de robots tenségrité. Le système représente la topologie physique du robot sous forme de graphe, où chaque nœud correspond à un composant structurel (tige rigide ou câble élastique) et chaque arête encode les couplages mécaniques. Validé sur un robot tenségrité à 3 barres, le framework maîtrise trois primitives de déplacement : suivi de trajectoire en ligne droite et virage bidirectionnel. Aucun réglage supplémentaire n'a été nécessaire pour le passage simulation-vers-matériel, et les politiques apprises s'exécutent directement sur le robot physique avec une locomotion stable. Le résultat le plus significatif pour les intégrateurs et concepteurs de robots est le transfert sim-to-real sans fine-tuning : c'est précisément le point d'échec habituel des méthodes RL appliquées aux structures à dynamique fortement couplée. Les robots tenségrité combinent tiges rigides et câbles élastiques en tension permanente, ce qui rend leur dynamique sous-actionnée et difficile à modéliser fidèlement, un écart classique entre simulation et réalité. Le fait que le GNN encode explicitement les contraintes topologiques du robot explique en partie cette robustesse : la politique apprend la physique structurelle, pas seulement une carte entrée-sortie. Les résultats montrent également une meilleure efficacité d'échantillonnage et une tolérance accrue aux variations de bruit et de raideur des câbles, deux paramètres qui fluctuent inévitablement sur matériel réel. Les robots tenségrité ont émergé comme plateforme de recherche sérieuse notamment via les travaux de la NASA (robot SUPERball) et des universités comme UC Berkeley, en raison de leur légèreté et de leur résilience aux chocs, des atouts pour l'exploration spatiale ou la recherche et le sauvetage. Jusqu'ici, leur contrôle reposait essentiellement sur des politiques MLP standard ou des méthodes de contrôle classique, peu adaptées à la complexité des couplages internes. Ce travail s'inscrit dans une tendance plus large d'architectures GNN pour robots morphologiquement complexes, en compétition avec des approches comme les transformers de morphologie ou le contrôle basé modèle avec apprentissage des paramètres. Les prochaines étapes naturelles incluent l'extension à des structures plus complexes (6 barres, tenségrités sphériques) et des environnements non structurés, domaines où aucun déploiement industriel n'est encore annoncé à ce stade.

RecherchePaper

1 source

2arXiv cs.RO

PiL-World : un modèle du monde par segments pour l'évaluation VLA en boucle fermée

Des chercheurs ont publié PiL-World (arXiv:2606.05773), un modèle de monde (world model) en boucle fermée conçu pour évaluer les politiques VLA (Vision-Language-Action) sans exécution physique continue. Le système fonctionne par blocs d'actions (action chunks) : à chaque itération, la politique VLA génère une séquence d'actions, PiL-World simule les observations multi-vues résultantes, et ces observations alimentent le cycle d'inférence suivant. Évalué sur trois tâches de manipulation bimanuelle réelles, PiL-World réduit l'écart entre le taux de succès mesuré sur robot physique et celui estimé en simulation boucle fermée de 63,2 % à 12,0 % par rapport à la baseline, soit plus de cinq fois moins d'erreur d'évaluation. Le modèle conditionne la génération vidéo sur le mouvement du robot en vue de tête et sur un historique latent encodant le contexte d'exécution de la tâche, et apprend à la fois sur des démonstrations téléopérées réussies et sur des trajectoires d'échec. L'évaluation des politiques VLA en boucle fermée est un goulot d'étranglement critique dans le développement robotique : chaque cycle de test sur hardware coûte du temps, de l'usure mécanique et une supervision humaine. Un écart de 63,2 % entre simulation et réalité rend une baseline en boucle ouverte essentiellement inexploitable pour prédire les performances terrain. Ramené à 12,0 %, ce delta commence à être utilisable pour screener des politiques avant validation physique. Le fait que PiL-World apprenne aussi sur des rollouts d'échec est notable : cela corrige un biais classique des world models entraînés uniquement sur démonstrations positives, et rapproche la distribution simulée de celle des exécutions politiques réelles, qui incluent naturellement des tentatives ratées. La demande pour des boucles d'évaluation sans robot s'intensifie depuis que les VLA, notamment Pi-0 de Physical Intelligence, OpenVLA, ou GR00T N2 de NVIDIA, sont devenues les architectures de référence pour la manipulation généraliste. Les simulateurs physiques classiques comme Isaac Lab ou MuJoCo souffrent du sim-to-real gap pour les tâches de contact fin, d'où l'intérêt croissant pour les world models appris directement sur données réelles. PiL-World rejoint une tendance émergente aux côtés de travaux comme UniSim ou IRASim, qui visent à remplacer partiellement l'exécution physique par des modèles génératifs vidéo conditionnés sur les actions. Les résultats sur trois tâches bimanuelles restent limités en diversité de scènes et de morphologies robotiques, et aucun déploiement industriel ni partenariat n'est annoncé à ce stade, ce qui positionne PiL-World comme une contribution de recherche prometteuse plutôt qu'un outil prêt pour l'intégration.

RechercheOpinion

1 source

3arXiv cs.RO

MorphIt : approximation sphérique flexible de la morphologie robotique pour l'adaptation guidée par représentation

Une équipe de chercheurs présente MorphIt (arXiv:2507.14061), un cadre d'approximation sphérique conçu pour rendre adaptable la représentation morphologique d'un robot, plutôt que de la traiter comme une contrainte fixe. Le système décompose la géométrie d'un bras ou d'un corps robotique en ensembles de sphères dont la résolution est pilotée par descente de gradient, avec des paramètres ajustables permettant de naviguer entre précision géométrique et coût computationnel. Les auteurs rapportent des temps de génération jusqu'à 100 fois inférieurs aux méthodes existantes, tout en maintenant une fidélité géométrique supérieure avec un nombre de sphères réduit, face aux deux baselines testées : VSSA (Variational Sphere Set Approximation) et AMAA (Adaptive Medial-Axis Approximation). Les gains sont validés sur des tâches de détection de collisions, de simulation d'interactions en contact et de navigation en espace contraint. L'enjeu dépasse la seule accélération de calcul. Actuellement, la quasi-totalité des pipelines robotiques impose une représentation géométrique unique pour toutes les tâches, qu'il s'agisse de planification à haute cadence ou de manipulation fine en contact. Ce compromis dégrade soit la précision, soit le temps de cycle. MorphIt traite cette représentation comme une ressource modulable en temps réel : un même robot pourrait opérer en mode grossier pour l'évitement d'obstacles et en mode haute résolution pour l'assemblage de précision, sans reconfiguration matérielle. Le framework s'intègre avec l'infrastructure robotique existante, ce qui limite les frictions d'adoption pour les intégrateurs. Les méthodes d'approximation sphérique comme VSSA et AMAA existent depuis plusieurs années, mais ont été conçues principalement pour la visualisation, pas pour le calcul embarqué temps réel. MorphIt s'inscrit dans un mouvement plus large vers des représentations géométriques différentiables et optimisables, un principe déjà exploré dans le sim-to-real pour les modèles VLA (Vision-Language-Action). Les résultats présentés restent expérimentaux : le paper est un preprint sans validation en déploiement réel à grande échelle. Les suites naturelles incluent l'intégration avec des planificateurs de mouvement différentiables et des tests sur des plateformes hardware comme des bras collaboratifs ou des humanoïdes.

RecherchePaper

1 source

4arXiv cs.RO

Apprentissage topologique en ligne pour la commande de formation par déplacement

Une équipe de recherche a publié sur arXiv (arXiv:2606.23901, juin 2026) un nouveau cadre de contrôle de formation multi-robots baptisé TOLD, pour Topological Online Learning for Displacement-based. La contribution centrale est une adaptation en temps réel des poids d'interaction entre agents, c'est-à-dire la topologie du graphe de communication, plutôt que de réguler uniquement les commandes individuelles de chaque robot. Deux variantes sont proposées : OGF (Online Gradient Flow), à poids non contraints, et OExpGF (Online Exponential Gradient Flow), à poids convexes non négatifs. Les simulations portent sur douze robots soumis à des perturbations intermittentes et montrent une réduction médiane de l'erreur cumulée de distorsion de formation (Root Mean Distortion Error) comprise entre 1,2 % et 33,14 % lorsque TOLD est combiné à des contrôleurs nodaux existants. Les expériences matérielles ont été conduites sur des nano-quadrotors Crazyflie 2.0 (Bitcraze), avec des réductions de distorsion médiane de 62 % pour OGF et 31,4 % pour OExpGF par rapport à un consensus à poids fixes. L'intérêt de TOLD réside dans le déplacement du point d'intervention : là où les approches robustes classiques agissent sur les entrées individuelles de chaque agent sans toucher à la structure du réseau, TOLD modifie dynamiquement les liaisons d'interaction pour minimiser directement la distorsion de formation. Pour un ingénieur systèmes ou un intégrateur de flottes AMR ou de drones, cela signifie potentiellement une meilleure résilience face aux pannes de communication ou aux perturbations environnementales sans nécessiter de reconfigurer l'architecture de contrôle. Sur le plan théorique, OExpGF garantit la convergence asymptotique pour des agents à intégrateur simple sur graphes orientés, propriété formellement établie dans l'article, ce qui lui confère une solidité analytique supérieure à OGF, lequel n'assure que la bornitude de l'erreur. Il convient de contextualiser les résultats : les expériences matérielles s'appuient sur les Crazyflie 2.0, des plateformes open-source de 27 grammes conçues pour la recherche académique, loin des conditions industrielles. L'article est une prépublication arXiv, non encore évaluée par les pairs. Le domaine du contrôle de formation par consensus est très actif, avec des contributions récentes sur les contrôleurs robustes nodaux, les approches par apprentissage distribué et les méthodes basées sur la théorie spectrale des graphes. TOLD se positionne dans un espace encore peu exploré, l'adaptation topologique en ligne, dont la transférabilité vers des flottes de robots terrestres ou des drones industriels (UAV inspection, logistique entrepôt) reste à démontrer dans des environnements moins contrôlés.

UELes résultats pourraient intéresser les laboratoires européens de robotique en essaim (LAAS-CNRS, ETH Zurich), mais aucun acteur français ou européen n'est directement impliqué ; la plateforme Crazyflie de Bitcraze (Suède) est le seul lien indirect avec l'UE.

RecherchePaper

1 source