RigPI : identification des paramètres dynamiques d'un c…

Simulateur différentiable neuronal adaptatif : modélisation des contacts rigides par transfert réel-vers-simulation

41

1arXiv cs.RO

Simulateur différentiable neuronal adaptatif : modélisation des contacts rigides par transfert réel-vers-simulation

Des chercheurs ont publié sur arXiv (référence 2603.06218v2) un framework baptisé "Few-Shot Neural Differentiable Simulator", conçu pour calibrer des simulateurs analytiques rigides à partir d'un volume réduit de données réelles, puis générer des jeux de données synthétiques à grande échelle. L'approche combine un simulateur analytique traditionnel, utilisé comme générateur de données après calibration, avec un réseau de neurones sur graphe (GNN) basé sur des maillages 3D, chargé de modéliser la dynamique avant des corps rigides. La contribution technique centrale réside dans la dérivation de gradients de substitution pour la détection de collision, rendant l'ensemble du pipeline entièrement différentiable. Les expériences portent sur des scénarios d'interaction multi-objets, où le système apprend des politiques de manipulation directement par optimisation basée sur les gradients dans le simulateur. Ce travail s'attaque à l'un des verrous majeurs du apprentissage robotique : le coût prohibitif de la collecte de données réelles et l'écart persistant entre simulation et réalité (sim-to-real gap). En n'exigeant qu'un petit nombre d'épisodes réels pour recaler le simulateur analytique, plutôt que des milliers de trajectoires pour entraîner un modèle purement appris, le framework réduit significativement la barrière d'accès à la simulation haute-fidélité. La différentiabilité complète est un avantage concret pour les concepteurs de politiques robotiques : elle permet de propager des gradients à travers la dynamique de contact, évitant le recours à des méthodes d'optimisation sans gradient (evolutionary strategies, RL model-free) typiquement moins efficaces en échantillons. Les résultats présentés indiquent que le GNN ainsi entraîné surpasse des baselines différentiables analytiques pour répliquer des trajectoires réelles, bien que ces résultats restent à ce stade expérimentaux et non validés en conditions industrielles réelles. Le problème de la simulation de contact rigide mobilise depuis plusieurs années des équipes académiques et industrielles majeures. Les simulateurs dominants comme MuJoCo (DeepMind), Isaac Sim (NVIDIA) et PyBullet offrent une différentiabilité partielle, mais peinent à modéliser fidèlement les contacts complexes sans paramétrage expert lourd. Des approches concurrentes comme DiffTaichi ou Brax (Google) ont exploré la différentiabilité à l'échelle, tandis que des laboratoires comme MIT CSAIL et Stanford travaillent sur des simulateurs neuronaux pour la manipulation. Ce preprint, non encore soumis à révision par pairs, ouvre une direction crédible vers des simulateurs "grounded" en peu de données réelles, pertinente pour les déploiements en manipulation industrielle et en robotique de service où les données réelles sont coûteuses à acquérir.

RecherchePaper

1 source

Cadre d'identification reproductible et physiquement réalisable des paramètres dynamiques pour bras robot à faible coût

38

2arXiv cs.RO

Cadre d'identification reproductible et physiquement réalisable des paramètres dynamiques pour bras robot à faible coût

Des chercheurs ont soumis sur arXiv en mai 2025 (arXiv:2605.15949) un pipeline d'identification des paramètres dynamiques pour le CRANE-X7, bras à 7 degrés de liberté de RT Corporation destiné aux laboratoires à faible budget. Le modèle corps-rigide est réduit de 65 à 39 paramètres de base en supprimant les produits d'inertie là où la symétrie des segments le permet. Quarante trajectoires d'excitation, construites à la main à partir de primitives mono et bi-articulation dans les limites mécaniques de chaque axe, alimentent une chaîne enchaînant moindres carrés ordinaires (OLS), projection par programmation semi-définie positive (SDP) pour rétablir la faisabilité physique, puis raffinement par erreur d'entrée en boucle fermée (CLIE). Un espace d'analyse en composantes principales (PCA) permet de sélectionner le candidat statistiquement central parmi les 40 modèles résultants. Un audit final de définie-positivité de la matrice d'inertie sur toutes les poses articulaires valide le résultat; un step SDP de secours corrige les violations résiduelles si nécessaire. L'enjeu est pratique: les méthodes par moindres carrés standard produisent régulièrement des paramètres physiquement incohérents (matrices d'inertie non définies positives), ce qui rend instables les contrôleurs en couple et les simulations physiques. Pour les intégrateurs et équipes de recherche, un modèle dynamique certifié est un prérequis pour la commande d'impédance, la compensation de gravité, ou l'apprentissage par démonstration. Les résultats expérimentaux montrent une concentration progressive du nuage de paramètres d'OLS vers SDP puis CLIE, avec une bonne précision prédictive conservée sur des trajectoires de validation hors-échantillon. La réduction 65-à-39 paramètres mérite toutefois d'être testée sur d'autres morphologies avant d'être généralisée. Le CRANE-X7 est une plateforme académique japonaise répandue dans les labos universitaires, mais elle manque de données dynamiques calibrées fournies par le constructeur, problème typique des bras à actionneurs modulaires de type Dynamixel. L'identification par SDP pour garantir la faisabilité physique remonte aux travaux d'Atkeson et al. dans les années 1990; son intégration dans un pipeline ouvert et reproductible avec sélection statistique et audit final reste peu documentée. Des approches concurrentes comme l'optimisation non-linéaire directe ou l'identification neuronale offrent moins de garanties de cohérence physique. Des plateformes de segment supérieur telles que le Kinova Gen3 ou le Franka Research 3 bénéficient de spécifications constructeur plus complètes. Une validation croisée sur d'autres robots à faible coût, voire une intégration dans des frameworks open-source comme Drake ou ros2_control, constituerait la suite logique de ces travaux.

UELes laboratoires européens équipés de bras modulaires à actionneurs Dynamixel (CRANE-X7 ou similaires) peuvent appliquer ce pipeline open pour obtenir des modèles dynamiques certifiés physiquement cohérents, prérequis pour la commande d'impédance et l'apprentissage par démonstration.

RecherchePaper

1 source

Dynamique différentiable de corps rigides en batch sur GPU avec PyTorch pour l'apprentissage robotique

47

3arXiv cs.RO

Dynamique différentiable de corps rigides en batch sur GPU avec PyTorch pour l'apprentissage robotique

Une équipe de chercheurs publie BARD (Batched Articulated Rigid-body Dynamics), une implémentation PyTorch des algorithmes de dynamique corps rigides de Featherstone, conçue pour l'évaluation GPU en batch et la différentiation automatique. Sur cinq modèles de robots allant de 7 à 23 degrés de liberté, BARD atteint un débit jusqu'à 64 fois supérieur à Pinocchio pour la cinématique directe et 63 fois supérieur pour les jacobiens, à une taille de batch de 4096 sur un NVIDIA H200. La bibliothèque repose sur trois choix d'architecture : un cache à évaluation paresseuse par niveaux qui évite les traversées redondantes de l'arbre cinématique, des transformées de joints sans multiplication matricielle grâce à des constantes de Rodrigues précalculées, et une propagation parallèle par niveaux qui ramène les opérations séquentielles à des étapes batchées proportionnelles à la profondeur de l'arbre. La précision numérique est validée par identification de système sur un manipulateur 7-DOF, avec une erreur moyenne de 1,24 % sur les masses des segments sous 5 % de bruit sur les couples. Intégré dans le pipeline d'entraînement Isaac Lab AMP pour un quadrupède à colonne vertébrale de 11 DOF avec 4096 environnements parallèles, BARD est 8,5 fois plus rapide que Pinocchio et 2 fois plus rapide qu'ADAM pour le calcul de dynamique en boucle d'entraînement. Le code est disponible en open source sur GitHub. L'enjeu est structurel : à mesure que le contrôle robotique migre vers le reinforcement learning à grande échelle avec calcul de dynamique en boucle (in-loop), les librairies CPU comme Pinocchio deviennent un goulot d'étranglement dans les pipelines GPU. BARD élimine ce découplage CPU/GPU sans sacrifier la précision ni la différentiabilité, deux propriétés critiques pour l'optimisation par gradient. Pour les équipes qui entraînent des politiques de locomotion ou de manipulation sur des milliers d'environnements parallèles, ce gain de débit se traduit directement en temps de calcul réduit et en capacité à itérer plus vite sur l'architecture des récompenses et des politiques. Pinocchio reste la référence académique et industrielle pour la dynamique articulée depuis plus de dix ans, mais son architecture CPU-first n'a pas été pensée pour les pipelines d'apprentissage modernes sur GPU. ADAM, autre alternative GPU, est ici surpassé d'un facteur 2 en contexte in-loop. BARD se positionne donc entre les simulateurs physiques complets comme Isaac Sim ou MuJoCo MJX et les librairies de dynamique symbolique, en ciblant explicitement l'usage comme composant différentiable dans une boucle d'entraînement. L'article est une prépublication arXiv (2605.31481), non encore soumise à révision par les pairs, et les benchmarks présentés portent sur des scénarios contrôlés : des tests en conditions de déploiement réel, notamment sur des robots industriels ou des plateformes commerciales, restent à venir.

UEBARD surpasse directement Pinocchio, bibliothèque de dynamique articulée développée et maintenue par LAAS-CNRS et INRIA, ce qui constitue un signal fort pour les équipes de recherche robotique françaises qui l'utilisent comme référence dans leurs pipelines d'apprentissage par renforcement.

RecherchePaper

1 source

Visual-RRT : planification de chemins vers des objectifs visuels par rendu différentiable

39

4arXiv cs.RO

Visual-RRT : planification de chemins vers des objectifs visuels par rendu différentiable

Des chercheurs du laboratoire SGVR de l'université KAIST (Corée du Sud) ont publié en avril 2026 Visual-RRT (vRRT), un planificateur de mouvement pour bras manipulateurs capables de naviguer vers un objectif défini par une image ou une vidéo, sans configuration articulaire numérique explicite. La méthode combine les arbres à exploration rapide aléatoire (RRT), algorithme classique de planification de trajectoire, avec le rendu différentiable du robot pour guider la recherche par gradient visuel. Deux mécanismes complémentaires ont été introduits : une stratégie d'exploration-exploitation à frontières adaptatives, qui priorise les régions de l'espace de configuration visuellement prometteuses, et une expansion inertielle par gradient, qui propage les états d'optimisation entre les branches de l'arbre pour garantir une cohérence dynamique du gradient. Les expériences couvrent trois manipulateurs standard de l'industrie et de la recherche : Franka Emika Panda, Universal Robots UR5e, et Fetch Robotics, en simulation et en environnement réel. L'apport technique fondamental réside dans la suppression d'un prérequis contraignant des planificateurs RRT classiques : la nécessité de spécifier la configuration-but sous forme d'angles articulaires précis. Dans les applications réelles d'automatisation ou d'apprentissage par démonstration, l'opérateur dispose le plus souvent d'une vidéo ou d'une photo de l'état-cible, pas d'un vecteur de joints. vRRT comble ce fossé en projetant l'espace visuel dans l'espace de configuration via rendu différentiable, ce qui permet d'utiliser un signal d'erreur visuel directement comme fonction de coût pour l'exploration. C'est un pas vers des systèmes robotiques plus faciles à programmer par l'exemple, sans calibration manuelle de la configuration finale. Les RRT sont un acquis algorithmique des années 1990-2000 (Steven LaValle, 1998), massivement utilisés dans la robotique industrielle et les véhicules autonomes. L'intégration du rendu différentiable, popularisée par des frameworks comme PyTorch3D ou Mitsuba 3, dans la planification de trajectoire est une tendance émergente depuis 2022-2023. Sur ce créneau, des travaux concurrents explorent les Visual Language Action models (VLA) comme pi-0 de Physical Intelligence ou les approches basées sur la diffusion pour la planification. vRRT se distingue par sa modularité sur des RRT existants et sa compatibilité avec des architectures standard. Le code source est disponible publiquement. Aucune collaboration industrielle ni calendrier de déploiement n'est mentionné dans la publication ; il s'agit à ce stade d'un résultat de recherche académique, pas d'un produit commercialisé.

RecherchePaper

1 source

RigPI : identification des paramètres dynamiques d'un corps rigide par simulation différentiable guidée par VLM

À lire aussi

Simulateur différentiable neuronal adaptatif : modélisation des contacts rigides par transfert réel-vers-simulation

Cadre d'identification reproductible et physiquement réalisable des paramètres dynamiques pour bras robot à faible coût

Dynamique différentiable de corps rigides en batch sur GPU avec PyTorch pour l'apprentissage robotique

Visual-RRT : planification de chemins vers des objectifs visuels par rendu différentiable