RigPI : identification des paramètres dynamiques d'un corps rigide par simulation différentiable guidée par VLM
Des chercheurs présentent RigPI (arXiv:2606.25212, juin 2026), un framework d'identification des paramètres dynamiques d'objets rigides manipulés par un bras robotique, sans connaissance préalable de leurs propriétés physiques. Le système fusionne trois sources : un modèle vision-langage (VLM) qui initialise sémantiquement les estimations à partir de l'apparence de l'objet, des capteurs force-couple pour capturer les interactions réelles, et un simulateur physique différentiable qui affine les paramètres par descente de gradient. RigPI couvre les objets libres non contraints et les corps multi-articulés à joints rotoïdes ou prismatiques. Une optimisation en deux étapes atténue la sensibilité au bruit et évite les solutions physiquement aberrantes. Des expériences en conditions réelles valident que le robot reproduit fidèlement les trajectoires de manipulation en utilisant les paramètres identifiés.
L'enjeu pour l'industrie est direct : construire des jumeaux numériques fiables exige de connaître les propriétés inertielles et frictionnelles d'un objet inconnu, pas seulement sa géométrie. Les pipelines classiques d'identification de système déraillent face au bruit capteur, aux erreurs de modèle et à l'absence de prior. RigPI innove sur deux fronts : l'usage d'un VLM comme oracle physique pour contraindre l'espace de recherche avant optimisation numérique, réduisant le risque de minima locaux incohérents ; et l'exploitation de la simulation différentiable pour propager des gradients analytiques plutôt que de procéder par essais-erreurs. Pour un intégrateur ou un responsable de production, cela signifie qu'une cellule de manipulation peut s'auto-calibrer sur un nouvel objet sans intervention humaine, comprimant les délais de mise en service.
Ce travail prend place dans un effort de recherche dense autour de la simulation différentiable en robotique, où des groupes de MIT, Stanford et de laboratoires comme DeepMind publient des approches parallèles. Le sim-to-real sur les paramètres physiques reste un problème ouvert : la majorité des pipelines actuels supposent des masses et frictions connues, ou les approximent grossièrement. RigPI est à ce stade un prototype académique, preprint non encore peer-reviewé, sans partenaire industriel annoncé. Les prolongements logiques incluent l'intégration avec des politiques VLA (vision-language-action) pour fermer la boucle perception-identification-contrôle, et l'extension aux matériaux déformables ou aux contacts multi-points.
Dans nos dossiers




