Compositional : apprentissage de la manipulation fonctionnelle dextérique sans démonstrations
CoDex est un nouveau framework de manipulation dextre presente par un article arXiv (2606.31909v1) issu du Robin Lab de l'universite du Texas a Austin. Il s'attaque a la manipulation fonctionnelle compositionnelle d'objets, c'est a dire des taches ou il faut a la fois orienter un objet vers une cible et actionner son mecanisme interne, comme viser une plante avec un pulverisateur ou appliquer de la colle chaude sur du bois. Le systeme a ete teste sur un bras robotique a 7 degres de liberte equipe d'une main multi-doigts a 16 degres de liberte, sur six taches impliquant des objets jamais vus a l'entrainement: pulverisateurs, pistolets a colle, soufflettes a air, lampes de poche et moulins a poivre. Sans aucune demonstration humaine, CoDex utilise des modeles vision-langage pour deduire les contraintes semantiques de la tache et de la scene, genere ensuite une courte liste de prises fonctionnelles candidates par optimisation analytique sous contrainte, puis affine ces prises via apprentissage par renforcement pour produire des politiques completes de saisie, deplacement et actionnement, transferables de la simulation au monde reel.
L'interet principal tient a l'approche zero-demonstration. La plupart des systemes de manipulation dextre recents, des modeles VLA comme Pi-0, GR00T N2 ou Helix, dependent d'immenses jeux de demonstrations teleoperees, un goulot d'etranglement couteux quand il faut couvrir la longue traine d'outils du quotidien. En montrant qu'un pipeline combinant VLM et RL peut generaliser a des objets et mecanismes inedits sans collecte de donnees humaines, CoDex propose une alternative credible pour les integrateurs confrontes a des catalogues d'objets trop vastes pour etre demontres un par un.
Le travail s'inscrit dans la lignee des recherches sur le grasping fonctionnel et la manipulation dextre, en rupture avec le paradigme dominant de l'imitation learning massive. Il reste a ce stade une demonstration academique limitee a six taches et un seul bras robotique, sans annonce de deploiement industriel; les prochaines etapes attendues concernent l'extension a un plus grand nombre de categories d'objets et de mecanismes d'actionnement plus complexes.
Dans nos dossiers




