Cinématique inverse corps entier par diffusion sur graphe
Une équipe de chercheurs publie sur arXiv (identifiant 2606.00086, daté du 2 juin 2026) GraphDiff-IK, un framework de diffusion sur graphe pour résoudre la cinématique inverse (IK) sur des robots à morphologies variées. L'IK est un problème fondamental : il s'agit de calculer les configurations articulaires permettant à l'effecteur d'atteindre une pose cible dans l'espace. GraphDiff-IK représente le robot comme un graphe cinématique construit directement depuis son fichier URDF, où chaque noeud correspond à une articulation actionnée et chaque arête encode une dépendance cinématique. Sur cette structure, le framework formule l'IK comme un processus de diffusion conditionnelle qui génère directement des configurations articulaires. Il intègre un raisonnement hiérarchique par passage de messages par étapes successives, un conditionnement explicite du torse pour les robots multi-branches, ainsi qu'un retour de cinématique directe bruitée et une supervision dans l'espace des tâches pour renforcer la cohérence géométrique pendant le débruitage. L'approche couvre les bras simples, les systèmes bimanuel et les robots articulés avec torse ou taille.
L'intérêt technique est réel : les solveurs IK classiques, qu'ils soient analytiques ou numériques (KDL, trac-IK, OpenRAVE), sont performants mais spécialisés par morphologie et peinent à représenter la nature multi-modale du problème, c'est-à-dire l'existence de plusieurs configurations articulaires valides pour une même pose cible. Cette multi-modalité est précisément ce que la diffusion capture de manière naturelle, ce qui ouvre la voie à des solveurs IK généralisables à une large gamme de plateformes sans ré-entraînement par robot. Pour les systèmes redondants comme les humanoïdes complets, dont le nombre de degrés de liberté dépasse les contraintes de la tâche, cette capacité à explorer l'espace des solutions est particulièrement précieuse.
Ce travail s'inscrit dans une vague plus large d'application des modèles de diffusion à la robotique : Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA ou les politiques de diffusion pour le contrôle en sont les exemples les plus visibles. Appliquer ce paradigme à l'IK, plutôt qu'aux politiques de haut niveau, est une extension logique mais non triviale. Il convient cependant de noter qu'il s'agit d'un preprint non encore évalué par les pairs, sans validation sur hardware industriel ni déploiement annoncé. Les prochaines étapes naturelles seraient une intégration dans des pipelines de planification de mouvement et des tests sur des plateformes physiques, notamment des humanoïdes commerciaux dont la cinématique whole-body reste un goulot d'étranglement opérationnel.
Dans nos dossiers




