RecherchearXiv cs.RO 3 juin 2026

ConTrack : suivi du mouvement des mains sous contraintes avec contrôle adaptatif des compromis

1 source couvre ce sujet·Source originale ↗·

Résumé IASource uniqueImpact UE

ConTrack, un cadre d'apprentissage par renforcement (RL) publié sur arXiv en juin 2026 (arXiv:2606.03177), s'attaque à l'un des verrous les plus persistants de la manipulation dextère robotique : transférer fidèlement des démonstrations humaines vers un robot réel, en particulier dans des séquences longues impliquant de nombreux contacts. Le problème central, dit "kinematic gap", tient au fait qu'une politique de suivi doit simultanément maintenir les objets sur leurs trajectoires cibles, respecter la cinématique articulaire démontrée et reproduire les timings de contact, le tout sans pouvoir ajuster ses paramètres séquence par séquence. ConTrack résout cela en reformulant le suivi d'objet comme une contrainte plutôt que comme un terme de récompense : l'autorité de contrôle résiduelle est allouée à la fidélité du mouvement, et un mécanisme de mise à jour de variable duale permet d'ajuster dynamiquement le compromis tâche/style en ligne. Le système intègre également une bibliothèque de réinitialisations adaptatives en milieu de trajectoire, qui réutilise les états du simulateur atteignables par la politique courante pour stabiliser l'apprentissage sur des horizons longs. Les auteurs rapportent des améliorations significatives du taux de succès et de la précision de pose des objets par rapport aux approches existantes, validées à la fois en simulation et sur robot réel.

L'intérêt de ConTrack pour les équipes de recherche et les intégrateurs robotiques tient à son passage à l'échelle : là où les méthodes précédentes nécessitaient un tuning manuel de la fonction de récompense pour chaque nouvelle séquence, l'approche par contraintes s'affranchit de ce goulot d'étranglement. C'est précisément ce type de réglage par séquence qui rendait les pipelines de manipulation dextère difficilement industrialisables. En séparant l'objectif de suivi d'objet de la préservation du style moteur, ConTrack offre une architecture plus modulaire, potentiellement applicable à des datasets de démonstrations humaines à grande échelle, un axe central dans les travaux récents sur les Visual Language Action (VLA) policies.

Ce travail s'inscrit dans un courant très actif du sim-to-real pour la manipulation fine, aux côtés de travaux comme DexMimic, AnyTeleop ou les pipelines de l'équipe Stanford IRIS. L'absence d'affiliation institutionnelle explicite dans le résumé arXiv rend difficile le positionnement compétitif précis, mais la problématique rejoint directement les défis que rencontrent des acteurs comme Physical Intelligence (pi0), Dexterous AI ou les équipes manipulation de Boston Dynamics et Figure. La prochaine étape naturelle serait une évaluation sur des benchmarks standards comme DexArt ou TACO, et une validation sur une plus grande diversité de morphologies de mains robotiques. Il s'agit pour l'instant d'un preprint académique, sans déploiement industriel annoncé.

Dans nos dossiers

Boston Dynamics Physical Intelligence — π0 arXiv cs.RO

À lire aussi

1arXiv cs.RO

HumanFlow : navigation de drone MAV parmi les humains par diffusion, avec suivi, prévision et contrôle du mouvement

Des chercheurs ont publié en mai 2026 un préprint arXiv (arXiv:2605.25685) présentant HumanFlow, un modèle de diffusion latente conçu pour la navigation de drones autonomes (MAVs, Micro Aerial Vehicles) dans des espaces peuplés. L'architecture unifie deux tâches habituellement traitées séparément : le suivi de la position 3D des personnes en temps réel (tracking) et la prédiction de leurs trajectoires futures (forecasting), le tout conditionné sur le contexte 3D de la scène environnante. La politique de contrôle associée repose sur un MPC (Model Predictive Control) approché par correspondance de flux (flow-matching), couplé directement à l'espace latent du modèle de perception. Les validations ont été conduites en simulation, en rejouant des trajectoires humaines réelles. Les auteurs annoncent de meilleures performances de tracking que les méthodes de référence, avec une efficacité computationnelle supérieure, et une navigation sans collision maintenue même en cas de visibilité partielle ou d'occultations sévères. L'apport central de HumanFlow est ce couplage serré (tight coupling) entre la perception humaine et la commande du robot, une intégration rarement réalisée dans la littérature de navigation sociale. Les systèmes existants échouent fréquemment lorsque des personnes sont partiellement masquées, produisant des estimations incohérentes avec la scène qui dégradent la sécurité et l'efficacité opérationnelle. En générant des prédictions de mouvement lisses et physiquement plausibles y compris sous occultation forte, le modèle réduit ce point de défaillance critique. Pour les intégrateurs de drones en environnement industriel, logistique ou public, c'est l'une des principales barrières à la certification : garantir la détection fiable des humains dans les angles morts. La démonstration que l'espace latent d'un modèle de diffusion peut directement piloter un contrôleur MPC ouvre une voie architecturale potentiellement transposable à des robots au sol ou des bras manipulateurs évoluant aux côtés d'opérateurs. HumanFlow s'inscrit dans un courant de recherche actif sur la navigation sociale robotique, dominé jusque-là par des approches basées sur des estimateurs déterministes ou des réseaux de prédiction de trajectoires tels que les architectures LSTM et Transformer. L'utilisation de modèles de diffusion pour la prédiction de mouvements humains est récente, apparue au milieu des années 2020, et HumanFlow en est l'une des premières applications directement couplées au contrôle. Ses concurrents directs incluent des pipelines séparant explicitement perception, prédiction et planification. Il faut noter que les validations restent entièrement en simulation : aucun déploiement physique sur drone réel n'est rapporté dans ce préprint, ce qui laisse ouverte la question du sim-to-real gap pour cette classe de modèles génératifs. Les prochaines étapes logiques seraient des essais sur MAV réel en environnement semi-contrôlé.

RecherchePaper

1 source

2arXiv cs.RO

Mouvement basé sur la diffusion, guidé par un modèle : optimisation sous contraintes et planification adaptative

Le laboratoire de recherche à l'origine du papier arXiv:2607.14455 (publié le 17 juillet 2026, catégorie "new") présente MD-COAS, une méthode de planification de trajectoire pour robot unique dans des environnements fortement non convexes et contraints. Le système s'appuie sur le Model-Based Diffusion (MBD), une approche récente qui traite la planification comme un tirage d'échantillons dans une distribution a posteriori sur des trajectoires, en utilisant la dynamique connue du robot pour estimer analytiquement la fonction de score à partir de rollouts, sans apprentissage par démonstration. MD-COAS combine deux mécanismes jusqu'ici traités séparément dans la littérature : une méthode de Lagrangien augmenté inexact (iALM), qui agit comme un prior de diffusion "souple" pour la sécurité, et un opérateur de projection "dur" basé sur un ensemble convexe faisable (CFS). L'algorithme ordonnance et co-optimise ces deux mécanismes de façon adaptative, en les couplant à la planification du bruit de diffusion lui-même. Les auteurs le valident sur des benchmarks 2D générés aléatoirement à forte non-convexité et sur une tâche d'évitement d'obstacles pour un bras robotique à 7 degrés de liberté. Pour l'industrie robotique, ce travail s'attaque à un problème concret : garantir des trajectoires sans collision, dynamiquement faisables et respectant des contraintes de tâche, tout en restant calculable en temps raisonnable. Les approches purement "souples" (contraintes ajoutées au coût) échouent parfois à garantir la sécurité, tandis que les projections "dures" peuvent bloquer la convergence ou dégrader la qualité de trajectoire. Unifier les deux, avec un ordonnancement qui s'adapte au fil du débruitage, vise justement ce compromis, pertinent pour les intégrateurs de bras industriels ou de robots mobiles évoluant en environnement encombré. Les auteurs rapportent des taux de sécurité et de succès supérieurs, une convergence plus rapide et des coûts finaux plus bas que les planificateurs de référence, mais ces gains restent mesurés sur des benchmarks contrôlés, pas en conditions industrielles réelles. Le papier s'inscrit dans la lignée des travaux sur le Model-Based Diffusion appliqué à la planification de mouvement sous contraintes, un axe de recherche encore jeune qui rivalise avec les méthodes classiques d'optimisation de trajectoire (MPC, RRT*, CHOMP) et les planificateurs par diffusion appris par démonstration. Les auteurs positionnent MD-COAS comme une réponse aux limites des variantes MBD contraintes précédentes, sans toutefois annoncer de déploiement matériel ni de calendrier de transfert vers un robot physique au-delà du bras 7-DDL testé en simulation ou banc d'essai.

RecherchePaper

1 source

3arXiv cs.RO

Combler l'écart d'exécution : des contraintes sémantiques de mouvement au contrôle cinématique

Une équipe de chercheurs publie sur arXiv (réf. 2605.12053, mai 2026) un framework open source baptisé Giskard, conçu pour combler ce que les auteurs nomment le "Motion Execution Gap" : l'écart entre les descriptions symboliques de tâches robotiques, exprimées sous forme de contraintes sémantiques de haut niveau, et les commandes cinématiques réellement exécutables par un robot. La pièce centrale est le concept de Motion Statecharts, une représentation symbolique exécutable permettant d'organiser des contraintes de mouvement, des moniteurs d'état et des statecharts imbriqués en parallèle ou en séquence. L'exécution repose sur une implémentation par MPC linéaire (lMPC) de l'approche task-function, avec des bornes sur le jerk pour assurer des transitions fluides lors des changements de tâche. La généralisation entre morphologies est rendue possible par un modèle cinématique du monde différentiable et unifié, couvrant simultanément le robot et son environnement. La méthode a été déployée et validée sur huit plateformes robotiques distinctes opérant dans des environnements variés. Ce travail s'attaque à un goulot d'étranglement structurel bien identifié dans la communauté : les planificateurs symboliques issus de l'IA cognitive ou de la planification classique décrivent ce qu'il faut faire, mais la translation vers des trajectoires cinématiques sûres et fluides reste un défi persistant. La démonstration sur huit plateformes différentes constitue un signal fort de transferabilité inter-plateformes, là où la majorité des solutions de génération de mouvement restent étroitement liées à une architecture matérielle spécifique. Pour un intégrateur ou un COO industriel, la spécification "world-centric" proposée promet de réduire concrètement le coût de réadaptation lors d'un changement de cellule robotique ou de morphologie. Giskard est issu du groupe CRAM (Cognitive Robot Abstract Machine) de l'Université de Brême, acteur européen de référence en robotique cognitive. L'approche task-function sur laquelle s'appuie le framework est une méthode de contrôle éprouvée, mais son intégration avec une représentation symbolique exécutable et multi-niveaux via statecharts est moins courante. Les solutions concurrentes dans l'écosystème production incluent MoveIt (ROS, très répandu mais limité sur les transitions de tâches complexes) et les planificateurs réactifs à base d'arbres de comportement. Ce document est un preprint arXiv, non encore évalué par les pairs : les résultats sur les huit plateformes restent à confirmer par une reproduction indépendante. La publication du code source sur GitHub (github.com/cram2/cognitive\robot\abstract\_machine) offre toutefois une base tangible pour que la communauté robotique puisse en évaluer la portée réelle.

UEGiskard est développé par le groupe CRAM de l'Université de Brême, acteur européen de référence en robotique cognitive ; sa publication open source bénéficie directement aux intégrateurs et laboratoires européens cherchant à réduire les coûts de portage lors de changements de plateformes robotiques.

RecherchePaper

1 source

4arXiv cs.RO

Planification de mouvement vérifiée dans l'espace des tâches sous contraintes articulaires

Une équipe de chercheurs présente dans un preprint arXiv (2605.22991, mai 2026) une méthode pour certifier formellement la planification de mouvement des bras manipulateurs face aux limites articulaires. Les planificateurs réactifs dans l'espace cartésien comme Bug2 opèrent avec des pas fixes sans tenir compte des butées angulaires ; lorsque la jacobienne est mal conditionnée, même un petit déplacement cartésien peut forcer un mouvement articulaire hors limites, provoquant une dérive de suivi et l'échec d'atteinte de l'objectif. La solution calcule, à chaque pas, le plus grand hyperrectangle cartésien certifiablement atteignable via une approximation polynomiale du second ordre de la cinématique inverse et la procédure S, qui forment un programme semi-défini positif (SDP) résolu par bisection en moins d'une milliseconde ; ce certificat est intégré à Bug2 pour adapter dynamiquement le pas au conditionnement cinématique local. Sur 94 scénarios adversariaux couvrant six configurations de limites articulaires, le planificateur SOS-vérifié atteint zéro violation articulaire et 100 % de taux de succès, contre 6 à 11 % de violations et jusqu'à 18 % d'échecs pour le Bug2 standard. Ce résultat comble une lacune bien connue : la planification dans l'espace de travail et la gestion des contraintes articulaires sont traitées séparément dans la plupart des architectures, ce qui génère des comportements indésirables près des singularités cinématiques. La résolution sous-milliseconde rend le module intégrable dans des boucles de contrôle temps réel, le positionnant comme couche de sécurité potentielle au-dessus des planificateurs existants sur des bras industriels comme le KUKA iiwa, l'Universal Robots UR10 ou le Franka Emika Panda. Bug2 est un algorithme réactif classique des années 1980-90, robuste mais agnostique aux propriétés cinématiques du robot, dont l'adaptation aux manipulateurs modernes multi-DDL a toujours souffert de ce manque de cohérence entre espaces cartésien et articulaire. L'usage de la procédure S et des programmes semi-définis pour certifier des atteignabilités locales s'inscrit dans une tendance plus large d'intégration de la vérification formelle (barrières de contrôle, Lyapunov, SOS) dans la planification de mouvement. Ce travail reste un preprint de recherche sans implémentation open-source ni déploiement industriel annoncé ; la validation sur robots physiques multi-DDL en conditions dynamiques réelles demeure l'étape manquante avant toute adoption industrielle.

UEKUKA (Allemagne) et Universal Robots (Danemark) sont cités comme cibles d'intégration directe, ce qui positionne les constructeurs de bras industriels européens comme premiers bénéficiaires potentiels si une implémentation open-source est publiée.

RecherchePaper

1 source