WARP : rétargétage corps entier pour l'apprentissage par démonstrations humaines préenregistrées
Un pipeline de transformation de poses humaines en actions robotiques, baptisé WARP (Whole-body-Aware Retargeting from human Pose), vient d'être publié en préprint sur arXiv (2606.29940). L'objectif est de permettre la manipulation mobile corps-entier à partir de séquences de démonstrations humaines capturées hors-ligne, sans recourir à la télé-opération. La méthode centrale repose sur un solveur géométrique à forme fermée dit SEW (Shoulder-Elbow-Wrist), qui calcule de façon exacte la position et l'orientation des effecteurs terminaux du robot tout en conservant la cohérence globale de la posture. À cela s'ajoute une stratégie de contrôle "lazy" de la base mobile, qui minimise les déplacements inutiles de la plateforme pour produire des trajectoires cohérentes et déterministes. Les auteurs rapportent qu'en rejeu boucle ouverte sur robot réel, les données générées sont suffisamment fiables pour une exécution directe sans correction humaine, ce qui constitue leur principale validation expérimentale.
L'enjeu central est la suppression de la télé-opération comme source de données d'entraînement. Collecter des données de téléopération à grande échelle reste coûteux, lent et difficile à généraliser entre plateformes. Les méthodes de retargeting existantes produisent des solutions ambiguës, engendrant une "multi-modalité d'action" qui empêche la convergence des politiques supervisées. WARP prétend résoudre ce problème via un solveur déterministe, ce qui aligne données humaines et action robot de façon univoque. Si la revendication "zero-shot" des auteurs se confirme en dehors de conditions contrôlées, cela réduirait significativement le coût d'acquisition de données pour les systèmes de manipulation mobile, en ouvrant l'accès à des corpus vidéo humains existants comme source d'entraînement à grande échelle.
Ce travail s'inscrit dans une tendance forte de la recherche en robotique apprenante : exploiter la donnée humaine plutôt que la donnée robot. Des systèmes comme pi-0 (Physical Intelligence), OpenVLA ou ACT ont montré que les politiques visuomotrices peuvent apprendre depuis des démonstrations téléopérées ou humaines, mais le passage à la manipulation corps-entier sur base mobile restait un verrou technique non résolu. WARP ne mentionne ni déploiement industriel ni plateforme robot spécifique dans son résumé, ce qui cantonne pour l'instant la contribution au cadre académique. La prochaine étape logique serait de tester la robustesse hors distribution et de comparer les politiques issues de WARP à celles entraînées sur données téléopérées, sur des benchmarks communs comme ceux d'OXE ou LIBERO.
Dans nos dossiers




