RecherchearXiv cs.RO7sem

Commande quasi-statique d'une tige de Cosserat discrète

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (arXiv:2605.01395) une étude proposant des lois de commande par rétroaction pour robots souples modélisés selon le formalisme de la tige de Cosserat. L'approche repose sur une discrétisation spatiale dite PCS (Piecewise Constant Strain), qui transforme les équations aux dérivées partielles non linéaires décrivant la déformation continue du robot en un système d'équations différentielles ordinaires non linéaires. Ce passage PDE vers ODE est central : il ramène la dynamique quasi-statique d'un corps déformable continu à une structure formellement proche des manipulateurs rigides sériels à chaîne articulée. Les lois de commande sont conçues avec le torseur d'effort externe appliqué à l'effecteur comme entrée de commande, et deux stratégies de linéarisation par retour d'état sont développées : l'une dans l'espace des déformations (strain space), l'autre dans l'espace tâche. Les résultats sont validés par simulation numérique sur des scénarios de suivi de trajectoire d'effecteur et de contrôle de forme globale du robot.

L'intérêt principal de ce travail pour la communauté robotique est de fournir un pont formel entre le contrôle des robots souples et les outils analytiques bien établis pour les manipulateurs rigides. En reformulant le modèle continu en système ODE via PCS, les auteurs rendent accessibles des méthodes de commande à base de modèle développées pour les bras industriels classiques, sans recourir à des approches d'apprentissage ou à des régulateurs heuristiques. Cela représente une contribution théorique solide pour les laboratoires et intégrateurs qui cherchent des garanties formelles de stabilité et de performance pour les robots à corps déformables. La restriction au régime quasi-statique constitue toutefois une limite applicative notable : elle exclut les tâches à dynamique rapide et réduit la portée immédiate aux manipulations lentes ou à faible fréquence.

La modélisation de robots souples par tige de Cosserat est une approche développée depuis une vingtaine d'années, notamment par les groupes de recherche de Webster, Jones, et Rucker aux États-Unis, ainsi que par plusieurs équipes européennes. La discrétisation PCS a été introduite pour contourner la complexité de résolution numérique des PDEs de Cosserat et est aujourd'hui un standard dans plusieurs simulateurs open source comme Sofa. Sur le plan concurrentiel, ce travail se distingue des approches par réseaux de neurones physiques (Neural ODEs, physics-informed control) et des méthodes éléments finis en privilégiant une formulation analytique close. La prochaine étape naturelle serait une validation expérimentale sur des plateformes matérielles réelles ainsi qu'une extension au régime dynamique pour élargir le domaine d'application.

Dans nos dossiers

arXiv cs.RO

À lire aussi

1arXiv cs.RO

Commande prédictive adaptative d'un robot continu souple par réseau neuronal informé par la physique (tiges de Cosserat)

Des chercheurs ont publié sur arXiv (2508.12681) un framework de contrôle prédictif par modèle (MPC) non linéaire pour robots continus souples, capables de se déformer en flexion continue plutôt que par articulations rigides. Le coeur du système est un réseau de neurones physiquement informé à découplage de domaine (DD-PINN), entraîné comme substitut du modèle dynamique de tige de Cosserat, la référence mathématique pour la mécanique des structures élancées déformables. Ce substitut atteint un facteur d'accélération de 44 000 par rapport au modèle complet, ce qui permet de faire tourner le MPC en temps réel à 70 Hz sur GPU. En parallèle, un filtre de Kalman non parfumé (UKF) exploite le DD-PINN pour estimer en ligne les états internes du robot et la compliance en flexion, à partir des seules mesures de position de l'effecteur terminal. En simulation, les erreurs de position restent inférieures à 3 mm, soit 2,3 % de la longueur de l'actionneur. Sur le robot physique, le contrôleur atteint des accélérations jusqu'à 3,55 m/s², avec une précision comparable. Ce résultat est notable parce qu'il démontre un contrôle dynamique (et non quasi-statique) d'un robot souple en conditions réelles, à une fréquence compatible avec les exigences industrielles. La majorité des approches antérieures, dont les méthodes basées sur l'opérateur de Koopman, sacrifient soit la précision de forme globale, soit l'adaptabilité aux variations de rigidité. Ici, le DD-PINN reconstruit la forme complète du robot et adapte en ligne la compliance, ce qui ouvre la voie à des manipulateurs souples capables de compenser vieillissement matériau ou déformations sous charge variable. Pour un intégrateur ou un décideur industriel, c'est la convergence entre modèle physique et inférence rapide qui est structurante : on cesse de choisir entre fidélité du modèle et temps réel. Les robots continus souples sont étudiés depuis une quinzaine d'années, principalement pour des applications médicales (endoscopes actifs, outils chirurgicaux), l'inspection en espace confiné, et la manipulation de pièces fragiles. Le modèle de Cosserat est le standard théorique du domaine, mais son coût computationnel avait jusqu'ici limité son usage au contrôle quasi-statique ou offline. Les PINN, réseaux intégrant des équations différentielles comme contraintes de loss, constituent depuis 2019 une piste active pour contourner ce verrou. Ce preprint ne mentionne pas de partenaires industriels ni de calendrier de déploiement ; il s'agit à ce stade d'un résultat de recherche académique, sans produit ni pilote terrain annoncé. Les prochaines étapes naturelles concernent la robustesse aux perturbations externes, l'extension à des structures à plusieurs segments, et une validation sur des cas d'usage médicaux ou d'assemblage délicat.

RecherchePaper

1 source

2arXiv cs.RO

DSSP : une politique d'état de diffusion avec encodage de l'historique complet

Une équipe de recherche a publié en mai 2026 un préprint sur arXiv (2605.14598) présentant DSSP, Diffusion State Space Policy, une nouvelle architecture de politique robotique pour la manipulation. Le principe central : conditionner la génération d'actions non plus sur une fenêtre courte d'observations récentes, comme le font la majorité des politiques diffusion existantes, mais sur l'intégralité de l'historique d'observations depuis le début de la tâche. L'encodeur d'historique repose sur des State Space Models (SSMs), qui compriment le flux complet d'observations en une représentation contextuelle compacte. Un objectif d'entraînement auxiliaire dit "dynamics-aware" optimise cet encodeur pour préserver les informations pertinentes à l'évolution future de l'état. Ce contexte de haut niveau est ensuite fusionné avec les observations récentes dans un mécanisme de conditionnement hiérarchique, et le backbone diffusion lui-même est également instancié via un SSM pour limiter la mémoire GPU. Les expériences couvrent des benchmarks en simulation et des tâches de manipulation réelles. Le problème que DSSP cherche à résoudre est structurel dans les approches actuelles : les tâches longue durée génèrent des ambiguïtés que seule la mémoire étendue permet de lever. Une pince qui répète la même séquence de sous-tâches ou qui doit adapter son comportement en fonction d'un état vu dix secondes plus tôt ne peut pas le faire si le modèle n'a accès qu'à la dernière frame ou à une fenêtre de deux secondes. Les auteurs rapportent des performances état-de-l'art avec une taille de modèle significativement inférieure aux concurrents, ce qui est un argument industriel non trivial : des modèles plus légers facilitent le déploiement sur du compute embarqué et réduisent les coûts d'inférence. L'utilisation des SSMs plutôt que des Transformers pour l'encodage de séquences longues est cohérente avec des travaux récents (Mamba, Mamba-2) montrant que cette famille d'architectures offre une complexité linéaire en longueur de séquence, là où l'attention quadratique pénalise fortement les historiques longs. Ce travail s'inscrit dans un courant actif depuis la publication de Diffusion Policy (Chi et al., Columbia/MIT, 2023), qui a établi la diffusion comme paradigme dominant pour l'imitation learning en manipulation. Des acteurs comme Physical Intelligence avec pi-0, NVIDIA avec GR00T N2, ou Figure AI avec ses architectures propriétaires ont chacun proposé leurs variantes de politiques diffusion ou VLA (Vision-Language-Action). La question de la mémoire temporelle longue reste ouverte dans l'ensemble de ces systèmes. DSSP est à ce stade un résultat de recherche académique, pas un produit déployé : les expériences réelles décrites sont des validations en laboratoire, non des pilotes industriels. La prochaine étape naturelle serait une intégration dans des frameworks open-source comme Lerobot (HuggingFace) ou une collaboration avec des fabricants pour valider le passage à l'échelle sur des tâches d'assemblage à horizons multiples.

UEImpact indirect potentiel si DSSP est intégré dans Lerobot (HuggingFace, entreprise française basée à Paris), ce qui faciliterait l'adoption par les équipes européennes de recherche en manipulation robotique longue durée.

RechercheOpinion

1 source

3arXiv cs.RO

CloSE : une représentation d'état du tissu indépendante de la forme géométrique

Des chercheurs ont publié sur arXiv (arXiv:2504.05033, version 3) une nouvelle représentation de l'état de déformation des textiles pour la manipulation robotique, baptisée CloSE (Cloth StatE). La méthode repose d'abord sur un intermédiaire appelé dGLI disk : une grille circulaire sur laquelle sont calculés des indices topologiques pour chaque segment de bord du tissu. La carte de chaleur (heatmap) ainsi générée fait apparaître des motifs stables qui caractérisent l'état du tissu indépendamment de sa forme, de sa taille ou de son orientation. Ces motifs sont ensuite condensés en une représentation circulaire compacte et continue : CloSE. Les auteurs démontrent que cette représentation prédit correctement l'emplacement des plis sur plusieurs jeux de données de simulation de vêtements, et qu'elle s'applique à deux tâches concrètes : l'étiquetage sémantique des parties du vêtement et la planification de tâches à haut et bas niveau. Le code et les données sont disponibles publiquement. La manipulation de textiles reste l'un des problèmes non résolus de la robotique industrielle : contrairement aux objets rigides, un tissu peut prendre un nombre quasi infini de configurations déformées, ce qui rend la prise de décision et la planification de trajectoire extrêmement difficiles. L'apport principal de CloSE est d'être agnostique à la géométrie du vêtement, ce qui signifie qu'un même pipeline de perception et de planification peut théoriquement s'appliquer à un T-shirt, une chemise ou un pantalon sans réentraînement. Pour un intégrateur ou un équipementier du secteur textile, c'est une propriété clé : elle réduit le coût de généralisation entre références produits. La représentation compacte facilite également son intégration dans des boucles de contrôle temps réel. Ce travail s'inscrit dans un effort académique soutenu autour de la manipulation de tissus, aux côtés d'approches comme les réseaux de points déformables (DenseFusion, FlingBot) ou les méthodes basées sur les graphes de tissu. La plupart des résultats présentés ici restent en simulation, ce que les auteurs n'occultent pas, mais la nature topologique des indices dGLI est conçue pour faciliter le transfert sim-to-real. Aucun déploiement industriel ou partenariat n'est annoncé à ce stade. Les prochaines étapes naturelles seraient une validation sur robot physique et une extension aux tissus opaques ou fortement déformés.

RecherchePaper

1 source

4arXiv cs.RO

Course d'un quadrupède à roues : atténuation active du transfert de charge par commande prédictive

Des chercheurs de l'UC Berkeley ont publié fin juin 2026 (arXiv:2606.26313) un cadre de contrôle hiérarchique combinant commande prédictive par modèle (MPC) et apprentissage par renforcement (RL) pour piloter en autonome le Unitree Go2-W, un quadrupède à roues équipé de 16 actionneurs. L'objectif : gérer activement le transfert de charge latéral pendant une course sur circuit physique, un régime d'accélération où les robots à pattes perdent typiquement de la stabilité. Le système repose sur trois couches : une génération hors ligne de trajectoire temps-optimal, un planificateur MPC en ligne qui minimise le Lateral Load Transfer Ratio (LTR) en temps réel, et une politique RL bas niveau déployée directement sur les 16 actionneurs du robot. Résultats mesurés sur piste réelle : réduction du LTR moyen de 44 %, amélioration du meilleur tour de 8,7 %, et accélération latérale maximale portée à 1,98 m/s², soit +21,3 % par rapport au contrôleur de référence sans inclinaison active. Ce qui est techniquement notable, c'est l'utilisation des genoux du robot comme suspension active : les actionneurs de jambes génèrent un couple anti-roulis pour que le châssis s'incline dans les virages, à la manière d'une moto. C'est un usage détourné de la morphologie quadrupède qui n'est pas possible sur un AMR classique à roues fixes. La politique RL, entraînée en simulation et déployée directement sur le matériel sans couche intermédiaire, tient le transfert réel, ce qui constitue un exemple concret de sim-to-real fonctionnel sur un système dynamique rapide. Pour les intégrateurs ou chercheurs qui travaillent sur la navigation haute vitesse en environnement non structuré, cette architecture montre qu'on peut extraire des performances supplémentaires d'un châssis existant par du contrôle, sans modifier le hardware. Le Unitree Go2-W est la variante à roues du Go2, le quadrupède à 2 700 USD lancé par Unitree Robotics (Hangzhou) en 2023, devenu plateforme de recherche très répandue dans les labos nord-américains et européens grâce à son prix. Sur le segment wheeled quadruped, il fait face au Spot de Boston Dynamics et au Jueying X20 de Deep Robotics, mais reste la référence académique en termes de volume de publications. L'équipe de Berkeley publie le code et la vidéo sur GitHub ; il n'y a pas d'annonce de commercialisation ni de partenariat industriel associé à ce travail, qui reste pour l'instant de la recherche fondamentale orientée course autonome. Les prochaines étapes naturelles seraient l'extension à des surfaces variables et des vitesses plus élevées, ou l'adaptation du framework MPC+RL à des plateformes à charge utile plus importante.

UELes laboratoires européens équipés du Unitree Go2-W (plateforme académique très répandue en Europe) pourront directement tester et adapter ce framework MPC+RL open-source pour leurs propres recherches en navigation haute vitesse.

RecherchePaper

1 source