Aller au contenu principal
Relations en forme fermée et approximations d'ordre supérieur des dérivées premières et secondes de l'opérateur tangent sur SE(3)
RecherchearXiv cs.RO6sem

Relations en forme fermée et approximations d'ordre supérieur des dérivées premières et secondes de l'opérateur tangent sur SE(3)

1 source couvre ce sujet·Source originale ↗·
Résumé IASource uniqueImpact UE

Des chercheurs ont publié sur arXiv (référence 2604.22287) des expressions en forme close pour le différentiel trijeunialisé à droite de l'application exponentielle sur le groupe de Lie SE(3), communément appelé opérateur tangent ou dexp, ainsi que ses dérivées premières et secondes. La matrice 6×6 représentant ce différentiel, dexpX : se(3) → se(3), était déjà partiellement documentée via une représentation en blocs 3×3, mais ce travail abandonne ce partitionnement pour proposer des relations directement compactes. Les auteurs dérivent également le jacobien et le hessien des applications d'évaluation dexpX(Z) et dexp_X^T(Z), accompagnés d'approximations polynomiales d'ordre élevé conçues pour rester numériquement stables au voisinage des singularités. La méthode est illustrée sur le calcul du champ de déformation et des taux de déformation d'une poutre élastique de type Cosserat-Simo-Reissner.

Pour les ingénieurs en robotique et en simulation multiphysique, ces formules sont directement exploitables dans les solveurs de dynamique inverse, les optimiseurs de trajectoires basés sur le gradient, et les intégrateurs temps-réel pour bras manipulateurs ou robots souples. L'accès au hessien de l'opérateur tangent en forme close ouvre la voie à des méthodes d'optimisation du second ordre (Newton, Gauss-Newton) sur SE(3), jusqu'ici freinées par l'absence de ces expressions ou par leur coût numérique élevé via différentiation automatique. La robustesse numérique des approximations d'ordre élevé est particulièrement précieuse dans les schémas implicites où les configurations proches d'une rotation nulle dégradent les méthodes tronquées classiques.

SE(3), groupe de Lie des transformations rigides orientées dans l'espace tridimensionnel (rotations et translations couplées), est la structure algébrique centrale de la cinématique des corps rigides, de la dynamique des robots articulés, et de la mécanique des tiges flexibles. Les modèles de Cosserat-Simo-Reissner, qui généralisent la théorie des poutres d'Euler-Bernoulli aux grandes déformations, sont notamment utilisés pour simuler des robots continus, des cathéters, des câbles ou des aiguilles chirurgicales. Ce type de travail fondationnel rejoint un effort de standardisation des outils différentiels sur les groupes de Lie, porté en parallèle par des équipes comme le laboratoire Gepetto (LAAS-CNRS, Toulouse) avec la bibliothèque Pinocchio, ou par les travaux de Müller et Terze sur la formulation intrinsèque des équations du mouvement. La disponibilité de ces expressions dans un format compact et numériquement stable devrait faciliter leur intégration dans des frameworks open-source de simulation robotique.

Impact France/UE

Ces expressions pourraient être intégrées dans Pinocchio (laboratoire Gepetto, LAAS-CNRS Toulouse), renforçant les capacités de dynamique différentiable du second ordre dans les frameworks robotiques open-source européens.

Dans nos dossiers

À lire aussi

Formulation sur les groupes de Lie pour les algorithmes de dynamique récursive d'ordre supérieur des robots à base flottante
1arXiv cs.RO 

Formulation sur les groupes de Lie pour les algorithmes de dynamique récursive d'ordre supérieur des robots à base flottante

Des chercheurs ont publié en mai 2026 sur arXiv (réf. 2605.06498) une formulation unifiée basée sur les groupes de Lie permettant de calculer les dérivées temporelles d'ordre supérieur des principaux algorithmes de dynamique pour robots à base flottante. Les méthodes couvertes incluent l'algorithme de Newton-Euler récursif, l'inertie du corps articulé (ABI) et la dynamique hybride, dans un cadre où la base évolue sur SE(3) et le mécanisme attaché est une arborescence cinématique ouverte de configuration sur T^n1 x R^n2. Appliqués à un manipulateur aérien à 12 degrés de liberté (DoF), les algorithmes produisent des expressions analytiques closes pour la dynamique directe et inverse géométrique ainsi que leurs premières dérivées temporelles, avec des simulations numériques validant la méthode jusqu'au 5e ordre de dérivation. L'apport central de ce travail est d'ordre computationnel : les auteurs montrent que le coût de calcul de leurs récursions scale quadratiquement avec l'ordre de dérivation, là où la différentiation automatique (AD) mise en oeuvre via des frameworks courants comme JAX, PyTorch ou CasADi exhibe un scaling exponentiel. Pour les équipes travaillant en commande prédictive (MPC) ou en optimisation de trajectoire pour robots articulés à base libre (drones manipulateurs, humanoïdes sans appui fixe), cette différence de scaling devient critique dès le 3e ou 4e ordre. Les auteurs identifient également une matrice de Coriolis admissible satisfaisant la propriété de passivité, garantie importante pour la synthèse de lois de commande stables, et établissent que le tenseur d'inertie articulé reste invariant à travers toutes les dérivées temporelles, résultat géométriquement non trivial. Ce papier s'inscrit dans une tradition de dynamique spatiale initiée par Featherstone et prolongée notamment par la librairie Pinocchio, développée au LAAS-CNRS (équipe Gepetto, Toulouse), qui implémente déjà des dérivées du premier et second ordre via représentation de Lie. Cette contribution étend explicitement ce cadre aux ordres arbitraires, ouvrant des perspectives pour les méthodes de shooting multiple d'ordre élevé et les approches de sensibilité paramétrique en co-optimisation robot/contrôleur. Les applications directes visées concernent la planification de mouvement pour drones à bras articulés, un segment en croissance rapide dans la logistique et l'inspection industrielle, ainsi que potentiellement les humanoïdes à base flottante dont la dynamique est formellement identique.

UECette contribution étend directement le cadre de la bibliothèque Pinocchio, développée par l'équipe Gepetto du LAAS-CNRS (Toulouse), renforçant le leadership de la recherche française en dynamique robotique différentiable et ouvrant des perspectives concrètes pour les équipes R&D européennes travaillant sur le MPC et l'optimisation de trajectoire pour humanoïdes et drones manipulateurs.

RecherchePaper
1 source
Raisonnement d'ordre supérieur pour des opérations collaboratives de robots mobiles sans communication
2arXiv cs.RO 

Raisonnement d'ordre supérieur pour des opérations collaboratives de robots mobiles sans communication

Des chercheurs présentent un cadre de planification épistémique dynamique permettant à des robots mobiles de se coordonner sans aucun échange de messages entre agents (arXiv:2605.21901). L'architecture repose sur des particules de croyances d'ordre supérieur : chaque robot modélise non seulement l'état du monde, mais aussi ce que ses coéquipiers croient de cet état, et ainsi de suite en cascade. Ces croyances sont mises à jour par inférence bayésienne, et un arbre de comportements sélectionne les actions en anticipant les décisions probables des voisins. Un contrôleur MPPI (Model Predictive Path Integral) temporellement conscient traduit ensuite ce raisonnement en trajectoires basse fréquence adaptées à l'observabilité partielle. Testée en simulation et sur robots physiques, l'approche réduit le temps de complétion des tâches par rapport à une baseline de raisonnement du premier ordre, sans que l'abstract précise la taille des flottes ni les conditions exactes des essais. L'enjeu est direct pour les intégrateurs de flottes d'AMR (Autonomous Mobile Robots) en logistique ou en industrie : les architectures actuelles supposent un orchestrateur central ou un réseau Wi-Fi stable, et toute dégradation du signal dégrade la coordination collective. Un mécanisme de coordination implicite fondé sur la logique épistémique ouvre la voie à des déploiements plus résilients dans des environnements RF-dégradés, souterrains ou à bande passante contrainte. L'approche valide également l'opérationnalisation de la logique épistémique, longtemps cantonnée à l'IA symbolique, dans une boucle de contrôle temps réel sur hardware physique, ce qui n'était pas acquis à cette échelle. La coordination décentralisée sans communication est un problème ouvert depuis les systèmes multi-agents des années 1990, mais son implémentation sur robots réels est restée marginale au profit des solutions centralisées. Les approches concurrentes incluent les champs de potentiel artificiel, l'optimisation distribuée (ADMM, consensus) et l'apprentissage par renforcement multi-agents (MARL). Ce travail se distingue par le couplage inhabituel entre raisonnement épistémique symbolique et contrôle continu par MPPI. Les suites naturelles attendues : une évaluation à plus grande échelle (cinq robots ou plus), des comparaisons directes avec des méthodes MARL de référence, et une analyse de la complexité computationnelle du raisonnement d'ordre supérieur en temps réel, point critique pour un déploiement industriel viable.

UEBénéfice indirect pour les intégrateurs européens de flottes AMR (logistique, industrie) opérant dans des environnements RF-dégradés, mais aucun acteur français ou européen n'est impliqué dans cette recherche.

RecherchePaper
1 source
Apprentissage par renforcement en boucle fermée pour le contrôle de forme de microfibres déformables par transfert simulation-réel
3arXiv cs.RO 

Apprentissage par renforcement en boucle fermée pour le contrôle de forme de microfibres déformables par transfert simulation-réel

Des chercheurs ont publié sur arXiv (référence 2605.21688) une approche d'apprentissage par renforcement sim-to-real en boucle fermée pour le contrôle de forme de microfibres déformables. Le système cible la micromanipulation de contact, en l'occurrence des microfibres de soie de 50, 80 et 120 µm de diamètre, sur des longueurs manipulées de 10, 15 et 20 mm. La politique de contrôle est entraînée exclusivement dans un simulateur sans frottement, puis transférée directement vers un système physique à double préhenseur tournant à 40 Hz, sans réentraînement ni adaptation de domaine. Sur 24 configurations initiales variées et 9 spécimens couvrant toutes les combinaisons de diamètres et de longueurs, le système atteint une erreur moyenne de forme de 270 ± 80 µm, soit systématiquement sous le millimètre. Ce résultat est significatif parce qu'il démontre que le problème du sim-to-real gap n'exige pas forcément une modélisation fine des interactions de surface à l'échelle microscopique. Le tour de force consiste à ne pas chercher à éliminer le mismatch entre simulation et réalité, mais à le rendre observable et corrigeable via le retour visuel en temps réel. Pour les intégrateurs travaillant sur la microassemblage, le placement de composants biologiques, ou la manipulation de fibres dans des procédés textiles ou médicaux, cela ouvre la voie à des systèmes qui généraliseraient à de nouveaux matériaux sans recalibration systématique. La robustesse démontrée sur des spécimens de géométries variées, sans réglage par spécimen, constitue un signal concret que le pipeline est viable au-delà du cadre lab. La micromanipulation robotique basée sur la vision souffre depuis longtemps d'un manque de méthodes capables de gérer les forces capillaires, adhésives et de frottement à l'échelle sub-millimétrique, que les simulateurs classiques ignorent. Les approches dominantes s'appuyaient sur des modèles physiques analytiques ou du domain randomization intensif, deux stratégies coûteuses à paramétrer. Ce travail positionne l'apprentissage par renforcement avec retour visuel comme une alternative compétitive, potentiellement transférable à d'autres objets déformables (cathéters, fils chirurgicaux, câbles fins). Les prochaines étapes probables incluent la validation sur des matériaux non-soyeux, l'extension à des fibres plus courtes ou plus rigides, et l'intégration dans des pipelines de microassemblage multi-étapes.

RecherchePaper
1 source
Suppression rapide des vibrations et suivi de trajectoire d'un manipulateur sériel à liaisons flexibles multiples
4arXiv cs.RO 

Suppression rapide des vibrations et suivi de trajectoire d'un manipulateur sériel à liaisons flexibles multiples

Des chercheurs ont publié le 22 mai 2026 sur arXiv (référence 2605.17477) un article présentant une nouvelle approche de contrôle pour les manipulateurs robotiques à liaisons flexibles multiples, une classe de bras articulés légers aux avantages structurels réels mais difficiles à stabiliser. Le framework proposé combine une commande par backstepping en sortie (output-feedback) avec un opérateur neuronal DeepONet pour supprimer rapidement les vibrations et maintenir le suivi de trajectoire de l'effecteur terminal. Chaque segment du bras est modélisé comme une poutre de Timoshenko couplée à une équation différentielle ordinaire, transformée en un système PDE hyperbolique canonique avec dynamique aux frontières. Un contrôleur de frontière basé sur le backstepping injecte de l'amortissement distribué le long de la poutre, en n'utilisant que des mesures disponibles aux extrémités. Les expériences ont été conduites sur un manipulateur à deux liaisons flexibles, démontrant une suppression des vibrations et une convergence de l'effecteur significativement plus rapides qu'un régulateur quadratique linéaire (LQR) avec compensation feedforward. L'enjeu industriel derrière ce type de recherche est concret : les manipulateurs flexibles permettent de réduire la masse embarquée et d'augmenter l'espace de travail, deux paramètres critiques pour la robotique collaborative, les bras montés sur mobile, ou les applications spatiales. Leur principal défaut, les oscillations résiduelles en fin de mouvement, pénalise directement les temps de cycle et la précision de placement. L'introduction de DeepONet pour approximer les noyaux de backstepping est la contribution pratique clé : elle réduit drastiquement le coût de calcul en ligne, rendant ce type de commande avancée compatible avec des contrôleurs embarqués à ressources limitées et capable de s'adapter en temps réel aux changements de configuration. Le backstepping pour systèmes distribués (PDEs) est un domaine de contrôle théorique actif depuis une quinzaine d'années, porté notamment par les travaux de Miroslav Krstic (UC San Diego). L'usage des opérateurs neuronaux de type DeepONet pour accélérer ce type de calculs constitue une tendance émergente à l'intersection du machine learning et du contrôle optimal. Sur le plan concurrentiel, les grandes maisons de robotique industrielle (FANUC, KUKA, ABB) gèrent la flexibilité structurelle par du surdimensionnement mécanique ou des vitesses d'opération conservatrices ; des startups comme Machina Labs ou des acteurs de la manipulation légère pourraient bénéficier directement de ce type d'avancée. La prochaine étape logique serait une validation sur un bras à n > 2 liaisons en conditions industrielles réelles, condition nécessaire avant toute intégration produit.

RecherchePaper
1 source