
ConTrack : suivi du mouvement des mains sous contraintes avec contrôle adaptatif des compromis
ConTrack, un cadre d'apprentissage par renforcement (RL) publié sur arXiv en juin 2026 (arXiv:2606.03177), s'attaque à l'un des verrous les plus persistants de la manipulation dextère robotique : transférer fidèlement des démonstrations humaines vers un robot réel, en particulier dans des séquences longues impliquant de nombreux contacts. Le problème central, dit "kinematic gap", tient au fait qu'une politique de suivi doit simultanément maintenir les objets sur leurs trajectoires cibles, respecter la cinématique articulaire démontrée et reproduire les timings de contact, le tout sans pouvoir ajuster ses paramètres séquence par séquence. ConTrack résout cela en reformulant le suivi d'objet comme une contrainte plutôt que comme un terme de récompense : l'autorité de contrôle résiduelle est allouée à la fidélité du mouvement, et un mécanisme de mise à jour de variable duale permet d'ajuster dynamiquement le compromis tâche/style en ligne. Le système intègre également une bibliothèque de réinitialisations adaptatives en milieu de trajectoire, qui réutilise les états du simulateur atteignables par la politique courante pour stabiliser l'apprentissage sur des horizons longs. Les auteurs rapportent des améliorations significatives du taux de succès et de la précision de pose des objets par rapport aux approches existantes, validées à la fois en simulation et sur robot réel.
L'intérêt de ConTrack pour les équipes de recherche et les intégrateurs robotiques tient à son passage à l'échelle : là où les méthodes précédentes nécessitaient un tuning manuel de la fonction de récompense pour chaque nouvelle séquence, l'approche par contraintes s'affranchit de ce goulot d'étranglement. C'est précisément ce type de réglage par séquence qui rendait les pipelines de manipulation dextère difficilement industrialisables. En séparant l'objectif de suivi d'objet de la préservation du style moteur, ConTrack offre une architecture plus modulaire, potentiellement applicable à des datasets de démonstrations humaines à grande échelle, un axe central dans les travaux récents sur les Visual Language Action (VLA) policies.
Ce travail s'inscrit dans un courant très actif du sim-to-real pour la manipulation fine, aux côtés de travaux comme DexMimic, AnyTeleop ou les pipelines de l'équipe Stanford IRIS. L'absence d'affiliation institutionnelle explicite dans le résumé arXiv rend difficile le positionnement compétitif précis, mais la problématique rejoint directement les défis que rencontrent des acteurs comme Physical Intelligence (pi0), Dexterous AI ou les équipes manipulation de Boston Dynamics et Figure. La prochaine étape naturelle serait une évaluation sur des benchmarks standards comme DexArt ou TACO, et une validation sur une plus grande diversité de morphologies de mains robotiques. Il s'agit pour l'instant d'un preprint académique, sans déploiement industriel annoncé.
Dans nos dossiers




